唇語(yǔ)預(yù)處理方法、裝置及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202010693507.5 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114022948A 公開(kāi)(公告)日 2022-02-08
申請(qǐng)公布號(hào) CN114022948A 申請(qǐng)公布日 2022-02-08
分類號(hào) G06V40/20(2022.01)I;G06V40/16(2022.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 趙幸福;孔志飛;趙立軍 申請(qǐng)(專利權(quán))人 北京中關(guān)村科金技術(shù)有限公司
代理機(jī)構(gòu) 北京萬(wàn)思博知識(shí)產(chǎn)權(quán)代理有限公司 代理人 劉冀
地址 100000北京市海淀區(qū)后屯南路26號(hào)4層5-03-2
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開(kāi)了一種唇語(yǔ)預(yù)處理方法、裝置及存儲(chǔ)介質(zhì)。其中,該方法,包括:獲取與待識(shí)別對(duì)象相關(guān)的視頻,其中所述視頻中包含所述待識(shí)別對(duì)象的嘴部區(qū)域圖像,其中所述視頻是通過(guò)在所述待識(shí)別對(duì)象讀取第一文本信息的過(guò)程中對(duì)所述待識(shí)別對(duì)象進(jìn)行拍攝而獲得的視頻;利用基于深度學(xué)習(xí)訓(xùn)練的識(shí)別模型,生成與所述嘴部區(qū)域圖像對(duì)應(yīng)的唇語(yǔ)信息;以及根據(jù)所述唇語(yǔ)信息以及所述第一文本信息,判定所述待識(shí)別對(duì)象是否為活體。達(dá)到了整個(gè)基于深度學(xué)習(xí)的唇語(yǔ)活體檢測(cè)方法的具有較強(qiáng)的泛化能力、流程簡(jiǎn)單可靠以及識(shí)別準(zhǔn)確率高的技術(shù)效果。