文本摘要的抽取方法、裝置、可讀存儲介質及電子設備

基本信息

申請?zhí)?/td> CN202011112242.1 申請日 -
公開(公告)號 CN112347240A 公開(公告)日 2021-02-09
申請公布號 CN112347240A 申請公布日 2021-02-09
分類號 G06F16/34(2019.01)I; 分類 計算;推算;計數;
發(fā)明人 姜濤;王會珍;張新新 申請(專利權)人 小牛思拓(北京)科技有限公司
代理機構 北京超凡宏宇專利代理事務所(特殊普通合伙) 代理人 畢翔宇
地址 100000北京市北京經濟技術開發(fā)區(qū)科創(chuàng)十三街18號院6號樓1層104
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┝宋谋菊某槿》椒?、裝置、可讀存儲介質及電子設備,將待抽取文本分割成多個語句;針對于每一個語句,比較該語句與其他語句之間的多個相似度,確定該語句的第一系數;將該語句輸入至實體識別模型中,確定該語句的第二系數;基于第一系數、第二系數以及該語句的位置,確定該語句的綜合系數;將綜合系數排序位于預設位置之前的至少一個目標語句,組合成待抽取文本的摘要。這樣,通過計算語句相似度、語句中實體數量以及語句在文本中的位置,確定出每個語句的綜合系數,進而依據每個語句的綜合系數的排序,確定出文本的摘要,可以提高語句抽取的全面性以及準確率,有助于提高摘要的抽取質量以及可讀性。??