一種中文糾錯方法、裝置、設(shè)備以及可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN201911392614.8 申請日 -
公開(公告)號 CN113128224A 公開(公告)日 2021-07-16
申請公布號 CN113128224A 申請公布日 2021-07-16
分類號 G06F40/295(2020.01)I;G06F16/36(2019.01)I;G06N5/04(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 余宙;楊永智;王旭 申請(專利權(quán))人 北京阿博茨科技有限公司
代理機(jī)構(gòu) 國浩律師(南京)事務(wù)所 代理人 孟睿;孔劍凡
地址 100194北京市海淀區(qū)蘇家坨鎮(zhèn)西小營南環(huán)10號院1幢1115號郵編
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種中文糾錯方法、裝置、設(shè)備以及可讀存儲介質(zhì)。對原始語句進(jìn)行分詞;使用詞嵌入方法,將分詞后的詞語轉(zhuǎn)換成詞向量;Bi?LSTM_CRF錯誤檢測模塊和GNN錯誤檢測模塊分別根據(jù)輸入的詞向量給出輸出的詞向量;輸出的詞向量包括各分詞后詞語對應(yīng)的修正性推薦詞語,以及每個修正性推薦詞語的評分;使用最優(yōu)修正性推薦詞語對原始語句進(jìn)行修正,獲得修正后語句,將修正后語句送入知識圖譜校驗(yàn)?zāi)K進(jìn)行校驗(yàn),如果校驗(yàn)通過,則使用修正后語句替代原始語句,如果校驗(yàn)未能通過,則放棄修正后語句。本發(fā)明擴(kuò)大了糾錯覆蓋率,提高了糾錯準(zhǔn)確率。