文摘自動(dòng)生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請?zhí)?/td> CN202010898531.2 申請日 -
公開(公告)號 CN112183083A 公開(公告)日 2021-01-05
申請公布號 CN112183083A 申請公布日 2021-01-05
分類號 G06F40/284;G06F40/295;G06F40/216;G06F40/242;G06F16/35;G06F40/126 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 嵇望;王偉凱;郭心南;董悅;李舟揚(yáng);錢艷;安毫億;朱鵬飛;梁青 申請(專利權(quán))人 杭州遠(yuǎn)傳新業(yè)科技股份有限公司
代理機(jī)構(gòu) 杭州創(chuàng)智卓英知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 杭州遠(yuǎn)傳新業(yè)科技有限公司
地址 310051 浙江省杭州市濱江區(qū)信誠路857號世貿(mào)中心23樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文摘自動(dòng)生成方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),該方法將原始文本和原始文本中的命名實(shí)體分別基于兩個(gè)訓(xùn)練好的嵌入向量模型計(jì)算得到各單字的第一字符向量和第二字符向量并通過拼接得到各單字的詞向量;通過訓(xùn)練好的Transformer編解碼模型對各單字的詞向量編解碼處理得到多個(gè)生成詞的詞向量,可以增強(qiáng)多個(gè)生成詞的詞向量的特征表示能力,將每個(gè)生成詞分為第一類生成詞或第二類生成詞,對第一類生成詞和第二類生成詞分別采用訓(xùn)練好的指針網(wǎng)絡(luò)和記憶網(wǎng)絡(luò)計(jì)算分別得到第一類輸出詞和第二類輸出詞,由多個(gè)第一類輸出詞和/或多個(gè)第二類輸出詞組成目標(biāo)文摘,可以有效解決生僻的命名實(shí)體無法生成的問題。