一種文本摘要生成方法和裝置
基本信息

| 申請(qǐng)?zhí)?/td> | CN201711281994.9 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN108304445B | 公開(公告)日 | 2021-08-03 |
| 申請(qǐng)公布號(hào) | CN108304445B | 申請(qǐng)公布日 | 2021-08-03 |
| 分類號(hào) | G06F16/34(2019.01)I;G06F40/211(2020.01)I;G06K9/62(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 李想 | 申請(qǐng)(專利權(quán))人 | 新華網(wǎng)股份有限公司 |
| 代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 王寶筠 |
| 地址 | 100031北京市西城區(qū)宣武門西大街129號(hào)金隅大廈708 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請(qǐng)?zhí)峁┮环N文本摘要生成方法和裝置。方法包括:將待提取摘要的文本文檔中的各個(gè)段落進(jìn)行合并,得到目標(biāo)文本文檔;按照預(yù)設(shè)的第一切分方法,對(duì)目標(biāo)文本文檔進(jìn)行切分,得到句子集合,所述句子集合包括多個(gè)句子;計(jì)算句子集合中兩兩句子之間的相似度;基于句子集合中兩兩句子之間的相似度,得到所述句子集合中每個(gè)句子相對(duì)于所述句子集合中的其他句子的相似度權(quán)重;按照相似度權(quán)重由大到小的順序?qū)λ鼍渥蛹现械木渥舆M(jìn)行排序;基于排序的前N個(gè)句子,生成所述文本文檔的文本摘要。本申請(qǐng)?jiān)诩骖櫸谋咎幚硭俣刃阅艿耐瑫r(shí),提高了文本摘要生成的準(zhǔn)確性。 |





