一種文本類別識(shí)別方法、裝置、電子設(shè)備及介質(zhì)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202010383414.2 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN113626587A | 公開(公告)日 | 2021-11-09 |
| 申請(qǐng)公布號(hào) | CN113626587A | 申請(qǐng)公布日 | 2021-11-09 |
| 分類號(hào) | G06F16/35(2019.01)I;G06F40/126(2020.01)I;G06F40/151(2020.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N20/00(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 鄭輝 | 申請(qǐng)(專利權(quán))人 | 安徽金山辦公軟件有限公司 |
| 代理機(jī)構(gòu) | 北京柏杉松知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 馬敬;項(xiàng)京 |
| 地址 | 430200湖北省武漢市東湖新技術(shù)開發(fā)區(qū)光谷大道77號(hào)光谷金融港B24棟2層204室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明實(shí)施例提供了一種文本類別識(shí)別方法、裝置、電子設(shè)備及介質(zhì),涉及文本識(shí)別技術(shù)領(lǐng)域,可以提高確定文本類別的準(zhǔn)確度。本發(fā)明的技術(shù)方案包括:按照詞語(yǔ)和數(shù)碼之間的預(yù)設(shè)對(duì)應(yīng)關(guān)系,對(duì)待識(shí)別文本包括的詞語(yǔ)進(jìn)行文本編碼,得到待識(shí)別文本的編碼數(shù)組。然后將編碼數(shù)組的維度轉(zhuǎn)換為預(yù)設(shè)維度,其中,預(yù)設(shè)維度包括數(shù)組長(zhǎng)度維度,編碼數(shù)組的數(shù)組長(zhǎng)度為編碼數(shù)組包括的數(shù)碼總數(shù)。再將預(yù)設(shè)維度的編碼數(shù)組輸入文本類別識(shí)別模型,確定文本類別識(shí)別模型識(shí)別的所述待識(shí)別文本的類別,其中,文本類別識(shí)別模型為基于樣本文本預(yù)設(shè)維度的編碼數(shù)組以及樣本文本對(duì)應(yīng)的標(biāo)準(zhǔn)類別,訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型。 |





