基于垂直領(lǐng)域的語音文本糾錯(cuò)方法、系統(tǒng)、設(shè)備及介質(zhì)

基本信息

申請?zhí)?/td> CN201910466328.5 申請日 -
公開(公告)號 CN110210029B 公開(公告)日 2019-09-06
申請公布號 CN110210029B 申請公布日 2019-09-06
分類號 G06F40/242(2020.01)I;G06F40/289(2020.01)I 分類 -
發(fā)明人 嵇望;汪斌;林達(dá);李斌 申請(專利權(quán))人 浙江遠(yuǎn)傳信息技術(shù)股份有限公司
代理機(jī)構(gòu) 杭州創(chuàng)智卓英知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 浙江遠(yuǎn)傳信息技術(shù)股份有限公司
地址 310051浙江省杭州市濱江區(qū)信誠路857號世貿(mào)中心23樓
法律狀態(tài) -

摘要

摘要 本發(fā)明申請涉及自然語言處理領(lǐng)域,公開了一種基于垂直領(lǐng)域的語音文本糾錯(cuò)方法,包括將語音轉(zhuǎn)譯為語音文本后基于領(lǐng)域詞典進(jìn)行分詞,得到分詞結(jié)果;根據(jù)所述分詞結(jié)果生成混淆集;從所述混淆集中獲取糾錯(cuò)候選句,使用語言模型對糾錯(cuò)候選句進(jìn)行評分,如果糾錯(cuò)候選句評分不高于原句或不高于預(yù)定的閾值,則判定為沒有錯(cuò)誤,否則得分最高的糾錯(cuò)候選句即為糾錯(cuò)結(jié)果。本專利還公開了一種基于垂直領(lǐng)域的語音文本糾錯(cuò)系統(tǒng)、電子設(shè)備和計(jì)算機(jī)存儲介質(zhì)。本專利根據(jù)專業(yè)領(lǐng)域建立分詞詞典,提升專業(yè)領(lǐng)域下的分詞結(jié)果,從而提升語音文本識別正確率,再結(jié)合語言模型對糾錯(cuò)候選句做評分排序,以確定表達(dá)用戶真實(shí)的語音文本,能進(jìn)一步提高語音交互的準(zhǔn)確率。??