一種基于深度學(xué)習(xí)技術(shù)的敏感信息識(shí)別方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN202111637526.7 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN114218391A | 公開(公告)日 | 2022-03-22 |
| 申請(qǐng)公布號(hào) | CN114218391A | 申請(qǐng)公布日 | 2022-03-22 |
| 分類號(hào) | G06F16/35(2019.01)I;G06F16/55(2019.01)I;G06F21/62(2013.01)I;G06K9/62(2022.01)I;G06V10/774(2022.01)I;G06V10/764(2022.01)I;G06N3/02(2006.01)I;G06N20/00(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 張黎;程樹華;陳廣輝;劉維煒;楊大志 | 申請(qǐng)(專利權(quán))人 | 閃捷信息科技有限公司 |
| 代理機(jī)構(gòu) | 浙江千克知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 裴金華 |
| 地址 | 311100浙江省杭州市余杭區(qū)五常街道文一西路998號(hào)5幢608室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供一種基于深度學(xué)習(xí)技術(shù)的敏感信息識(shí)別方法,涉及數(shù)據(jù)識(shí)別技術(shù)領(lǐng)域,包括以下步驟:獲取訓(xùn)練數(shù)據(jù)集;分別對(duì)圖像數(shù)據(jù)、全中文數(shù)據(jù)集和非全中文數(shù)據(jù)集訓(xùn)練得到第一、第二和第三分類模型;接受待預(yù)測(cè)的數(shù)據(jù);分別根據(jù)待預(yù)測(cè)的數(shù)據(jù)的類型輸入至第一、第二和第三分類模型,得到標(biāo)簽;獲取所有標(biāo)簽,對(duì)結(jié)構(gòu)化數(shù)據(jù),則統(tǒng)計(jì)每個(gè)字段下實(shí)例標(biāo)簽最多的類別作為該字段的類別;對(duì)非結(jié)構(gòu)化數(shù)據(jù),則將中文分詞字符的類別進(jìn)行敏感信息統(tǒng)計(jì)。本發(fā)明合理有效,可以通過對(duì)原始數(shù)據(jù)進(jìn)行特征工程,將數(shù)據(jù)集輸入到對(duì)應(yīng)的分類模型進(jìn)行訓(xùn)練,得到不同的分類模型,根據(jù)待識(shí)別的敏感數(shù)據(jù)類型得到分類標(biāo)簽,對(duì)不同類型的數(shù)據(jù)進(jìn)行識(shí)別,識(shí)別準(zhǔn)確率高,保護(hù)性好。 |





