結(jié)合分類算法與非監(jiān)督算法的文本質(zhì)量控制方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202011578227.6 申請日 -
公開(公告)號 CN112650837A 公開(公告)日 2021-04-13
申請公布號 CN112650837A 申請公布日 2021-04-13
分類號 G06F16/33;G06F16/35;G06F40/284 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 吳明平 申請(專利權(quán))人 上海風(fēng)秩科技有限公司
代理機(jī)構(gòu) 青島清泰聯(lián)信知識(shí)產(chǎn)權(quán)代理有限公司 代理人 趙燕
地址 200232 上海市徐匯區(qū)龍?zhí)m路277號2號樓5樓5B04單元
法律狀態(tài) -

摘要

摘要 本申請公開了一種結(jié)合分類算法與非監(jiān)督算法的文本質(zhì)量控制方法及系統(tǒng),所述方法包括:收集文本數(shù)據(jù);過濾所述文本數(shù)據(jù)中的無關(guān)數(shù)據(jù),獲取過濾文本;刪除所述過濾文本中的通用噪聲數(shù)據(jù),獲取去噪文本;刪除所述去噪文本中的標(biāo)題黨數(shù)據(jù),并輸出文本質(zhì)量分。通過本申請,可控制文本質(zhì)量,同時(shí)輸出文本質(zhì)量分。