一種文本摘要生成方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN201711281994.9 申請(qǐng)日 -
公開(公告)號(hào) CN108304445B 公開(公告)日 2021-08-03
申請(qǐng)公布號(hào) CN108304445B 申請(qǐng)公布日 2021-08-03
分類號(hào) G06F16/34(2019.01)I;G06F40/211(2020.01)I;G06K9/62(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李想 申請(qǐng)(專利權(quán))人 新華網(wǎng)股份有限公司
代理機(jī)構(gòu) 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 王寶筠
地址 100031北京市西城區(qū)宣武門西大街129號(hào)金隅大廈708
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┮环N文本摘要生成方法和裝置。方法包括:將待提取摘要的文本文檔中的各個(gè)段落進(jìn)行合并,得到目標(biāo)文本文檔;按照預(yù)設(shè)的第一切分方法,對(duì)目標(biāo)文本文檔進(jìn)行切分,得到句子集合,所述句子集合包括多個(gè)句子;計(jì)算句子集合中兩兩句子之間的相似度;基于句子集合中兩兩句子之間的相似度,得到所述句子集合中每個(gè)句子相對(duì)于所述句子集合中的其他句子的相似度權(quán)重;按照相似度權(quán)重由大到小的順序?qū)λ鼍渥蛹现械木渥舆M(jìn)行排序;基于排序的前N個(gè)句子,生成所述文本文檔的文本摘要。本申請(qǐng)?jiān)诩骖櫸谋咎幚硭俣刃阅艿耐瑫r(shí),提高了文本摘要生成的準(zhǔn)確性。