識(shí)別喚醒詞的方法和裝置、介質(zhì)以及設(shè)備
基本信息

| 申請(qǐng)?zhí)?/td> | CN201910409621.8 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN110047485B | 公開(kāi)(公告)日 | 2021-09-28 |
| 申請(qǐng)公布號(hào) | CN110047485B | 申請(qǐng)公布日 | 2021-09-28 |
| 分類(lèi)號(hào) | G10L15/22;G10L15/28;G10L15/18;G10L15/20 | 分類(lèi) | 樂(lè)器;聲學(xué); |
| 發(fā)明人 | 劉鼎 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京地平線機(jī)器人技術(shù)研發(fā)有限公司 |
| 代理機(jī)構(gòu) | 北京思源智匯知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 毛麗琴 |
| 地址 | 100080 北京市海淀區(qū)中關(guān)村大街1號(hào)3層318 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 公開(kāi)了一種識(shí)別喚醒詞的方法和裝置、介質(zhì)以及設(shè)備。其中的方法包括:獲取語(yǔ)音幀的環(huán)境信息以及獲取所述語(yǔ)音幀的歷史喚醒信息;其中,所述語(yǔ)音幀屬于當(dāng)前語(yǔ)音活動(dòng)段;根據(jù)所述語(yǔ)音幀的環(huán)境信息以及所述語(yǔ)音幀的歷史喚醒信息,從預(yù)先設(shè)置的多個(gè)聲學(xué)識(shí)別模型中選擇至少一個(gè)聲學(xué)識(shí)別模型;將所述語(yǔ)音幀提供給所述至少一個(gè)聲學(xué)識(shí)別模型,經(jīng)由所述至少一個(gè)聲學(xué)識(shí)別模型,獲得所述語(yǔ)音幀的聲學(xué)概率分布;根據(jù)所述當(dāng)前語(yǔ)音活動(dòng)段中的各語(yǔ)音幀的聲學(xué)概率分布,確定所述當(dāng)前語(yǔ)音活動(dòng)段是否為喚醒詞。本公開(kāi)提供的技術(shù)方案有利于兼顧喚醒率、誤喚醒率以及喚醒資源消耗等指標(biāo)。 |





