一種多段落文本的特征抽取系統(tǒng)的方法

基本信息

申請?zhí)?/td> CN201710287337.9 申請日 -
公開(公告)號(hào) CN107122350B 公開(公告)日 2017-09-01
申請公布號(hào) CN107122350B 申請公布日 2017-09-01
分類號(hào) G06F40/216(2020.01)I; 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 許延祥;王飛劍;劉宗福;周東紅;黃世祥 申請(專利權(quán))人 北京和利時(shí)數(shù)字技術(shù)有限公司
代理機(jī)構(gòu) 北京細(xì)軟智谷知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 代理人 付登云
地址 100089北京市海淀區(qū)西三環(huán)北路27號(hào)1區(qū)15號(hào)樓第11層西區(qū)1101室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種多段落文本的特征抽取系統(tǒng)及方法,包括第一計(jì)算模塊、主控模塊、權(quán)重設(shè)置模塊、文本處理模塊、分詞器和第二計(jì)算模塊;所述第一計(jì)算模塊、權(quán)重設(shè)置模塊、文本處理模塊、分詞器和第二計(jì)算模塊均與主控模塊進(jìn)行數(shù)據(jù)交互。本發(fā)明提供的技術(shù)方案通用、可行的來實(shí)現(xiàn)文本特征提取,并在文本特征提取過程中,能夠體現(xiàn)文本中不同段落的權(quán)重差異。??