文本糾錯方法、裝置、存儲介質(zhì)及電子設(shè)備

基本信息

申請?zhí)?/td> CN202110470228.7 申請日 -
公開(公告)號 CN113515934A 公開(公告)日 2021-10-19
申請公布號 CN113515934A 申請公布日 2021-10-19
分類號 G06F40/253(2020.01)I;G06F40/232(2020.01)I;G06F40/289(2020.01)I;G06K9/62(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陶俊杰;張曉雷;楊翕雯;時靜一;邱偉偉 申請(專利權(quán))人 新東方教育科技集團(tuán)有限公司
代理機(jī)構(gòu) 北京英創(chuàng)嘉友知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 李柯瑩
地址 100080北京市海淀區(qū)海淀中街6號9層
法律狀態(tài) -

摘要

摘要 本公開涉及一種文本糾錯方法、裝置、存儲介質(zhì)及電子設(shè)備,無需豐富的先驗(yàn)知識和大量的人力來構(gòu)建規(guī)則,實(shí)現(xiàn)對文本的自動糾錯。該方法包括:獲取原始文本;所述原始文本輸入糾錯模型中,得到所述糾錯模型輸出所述原始文本的糾錯標(biāo)簽序列,其中,所述糾錯模型通過訓(xùn)練樣本進(jìn)行訓(xùn)練得到的,所述訓(xùn)練樣本包括待糾錯文本和作為所述待糾錯文本的標(biāo)簽的文本糾錯標(biāo)簽序列,所述糾錯標(biāo)簽序列為所述原始文本轉(zhuǎn)換為目標(biāo)文本的轉(zhuǎn)換條件;根據(jù)所述糾錯標(biāo)簽序列對所述原始文本進(jìn)行糾錯處理,得到目標(biāo)文本。