一種語(yǔ)音標(biāo)注數(shù)據(jù)生成方法及裝置、語(yǔ)音識(shí)別系統(tǒng)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110607045.5 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN113395544A | 公開(kāi)(公告)日 | 2021-09-14 |
| 申請(qǐng)公布號(hào) | CN113395544A | 申請(qǐng)公布日 | 2021-09-14 |
| 分類(lèi)號(hào) | H04N21/234(2011.01)I;H04N21/2343(2011.01)I;H04N21/44(2011.01)I;H04N21/4402(2011.01)I;G06K9/32(2006.01)I | 分類(lèi) | 電通信技術(shù); |
| 發(fā)明人 | 賈瑤 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京人人網(wǎng)互動(dòng)科技有限公司 |
| 代理機(jī)構(gòu) | 北京城烽知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 王新月 |
| 地址 | 100192北京市海淀區(qū)寶盛東路興華綠色產(chǎn)業(yè)樓二層205室(東升地區(qū)) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供了一種語(yǔ)音標(biāo)注數(shù)據(jù)生成方法及裝置、語(yǔ)音識(shí)別系統(tǒng),其中,所述語(yǔ)音標(biāo)注數(shù)據(jù)生成方法包括:按預(yù)設(shè)間隔對(duì)目標(biāo)視頻進(jìn)行抽幀,得到多個(gè)目標(biāo)幀;識(shí)別每個(gè)目標(biāo)幀的文本信息、開(kāi)始時(shí)間以及結(jié)束時(shí)間;順次計(jì)算當(dāng)前目標(biāo)幀的文本信息與相鄰上一目標(biāo)幀的文本信息的文本相似度;根據(jù)文本相似度確定每個(gè)文本信息的開(kāi)始時(shí)間以及結(jié)束時(shí)間;按照每個(gè)文本信息的開(kāi)始時(shí)間及結(jié)束時(shí)間,分別在目標(biāo)視頻中截取相應(yīng)的音頻片段,并將音頻片段與對(duì)應(yīng)文本信息相匹配,生成語(yǔ)音標(biāo)注數(shù)據(jù)。減少了人工標(biāo)注的工作量,提高了語(yǔ)音標(biāo)注數(shù)據(jù)生成效率。 |





