一種基于序列到序列的文本量化分析與生成方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202011284523.5 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112395832A 公開(kāi)(公告)日 2021-02-23
申請(qǐng)公布號(hào) CN112395832A 申請(qǐng)公布日 2021-02-23
分類(lèi)號(hào) G06F40/126(2020.01)I; 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 汪昕;周興暉;呂建文;金鑫;陳力;薛柔月;蔣尚秀 申請(qǐng)(專利權(quán))人 上海金橋信息股份有限公司
代理機(jī)構(gòu) 北京科迪生專利代理有限責(zé)任公司 代理人 鄧治平
地址 200234上海市徐匯區(qū)田林路487號(hào)25號(hào)樓
法律狀態(tài) -

摘要

摘要 一種基于序列到序列的文本量化分析與生成方法及系統(tǒng),可根據(jù)已知的文本自動(dòng)生成與所需要進(jìn)行量化分析的文本所對(duì)應(yīng)的文本。該系統(tǒng)包括:預(yù)處理模塊、文本內(nèi)容編碼器模塊、量化分析編碼器模塊,解碼器模塊。本發(fā)明使得用戶不需要手動(dòng)將文本信息轉(zhuǎn)化為特征向量,提高了轉(zhuǎn)換的效率;同時(shí),采用基于序列到序列的神經(jīng)網(wǎng)絡(luò)算法作為生成文本和對(duì)文本進(jìn)行量化分析的主要方法,在生成文本的過(guò)程中可使用GPU進(jìn)行加速,進(jìn)一步提高了轉(zhuǎn)換速率;基于序列到序列的神經(jīng)網(wǎng)絡(luò)算法也通過(guò)多次迭代提高了生成文本和所進(jìn)行量化分析的文本的質(zhì)量,避免了單一的模板化的文本生成。??