語(yǔ)音識(shí)別文本的糾錯(cuò)方法

基本信息

申請(qǐng)?zhí)?/td> CN202110357882.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113205813A 公開(kāi)(公告)日 2021-08-03
申請(qǐng)公布號(hào) CN113205813A 申請(qǐng)公布日 2021-08-03
分類號(hào) G10L15/26(2006.01)I;G10L15/06(2013.01)I 分類 樂(lè)器;聲學(xué);
發(fā)明人 沈來(lái)信;穆瑞斌;賈師惠;孫明東;董軍華 申請(qǐng)(專利權(quán))人 北京華宇信息技術(shù)有限公司
代理機(jī)構(gòu) 北京中索知識(shí)產(chǎn)權(quán)代理有限公司 代理人 胡大成
地址 100084北京市海淀區(qū)中關(guān)村東路1號(hào)院8號(hào)樓21層C2301、C2302
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開(kāi)了一種語(yǔ)音識(shí)別文本的糾錯(cuò)方法。所述方法,包括:獲取語(yǔ)音解碼輸出的待處理文本;調(diào)用檢錯(cuò)模型處理所述待處理文本,得到出錯(cuò)目標(biāo)字和出錯(cuò)目標(biāo)字對(duì)應(yīng)的置信度TopK候選字集;根據(jù)所述出錯(cuò)目標(biāo)字和所述置信度TopK候選字集,對(duì)所述待處理文本進(jìn)行糾錯(cuò),得到第一糾錯(cuò)結(jié)果;根據(jù)名詞處理模型和所述第一糾錯(cuò)結(jié)果,得到出錯(cuò)目標(biāo)詞、目標(biāo)詞類別和名詞集合數(shù)據(jù);根據(jù)所述出錯(cuò)目標(biāo)詞、所述目標(biāo)詞類別和所述名詞集合數(shù)據(jù),處理所述第一糾錯(cuò)結(jié)果,得到第二糾錯(cuò)結(jié)果;輸出所述第二糾錯(cuò)結(jié)果,得到糾錯(cuò)后的最終文本;其中,K為正整數(shù)。通過(guò)用語(yǔ)言模型對(duì)語(yǔ)音解碼輸出的待處理文本進(jìn)行處理,能夠更好實(shí)現(xiàn)對(duì)語(yǔ)音識(shí)別文本的糾錯(cuò)。