一種面向新聞優(yōu)化閱讀類移動(dòng)應(yīng)用的自動(dòng)摘要方法

基本信息

申請?zhí)?/td> CN201510063837.5 申請日 -
公開(公告)號(hào) CN104657347A 公開(公告)日 2015-05-27
申請公布號(hào) CN104657347A 申請公布日 2015-05-27
分類號(hào) G06F17/27(2006.01)I;G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 尹柳;許歡慶;郭永福;陳沛 申請(專利權(quán))人 北京中搜搜悅網(wǎng)絡(luò)技術(shù)有限公司
代理機(jī)構(gòu) 北京安博達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 北京中搜網(wǎng)絡(luò)技術(shù)股份有限公司;北京中搜搜悅網(wǎng)絡(luò)技術(shù)有限公司
地址 100191 北京市海淀區(qū)學(xué)院路51號(hào)首亨科技大廈0902室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種面向新聞優(yōu)化閱讀類移動(dòng)應(yīng)用的自動(dòng)摘要方法,其特征在于,所述方法包括(1)預(yù)處理新聞網(wǎng)頁內(nèi)容;(2)提取文本摘要;(3)生成結(jié)果。本發(fā)明增加html格式,保留圖片和表格,優(yōu)化了文摘的展現(xiàn)形式,增強(qiáng)了用戶視覺體驗(yàn)。傳統(tǒng)自動(dòng)摘要有語義缺失,本發(fā)明對句子進(jìn)行上下文擴(kuò)展,并合并空句以省略號(hào)連接,彌補(bǔ)了傳統(tǒng)摘要語義缺失,提高了語義的完整性和連貫性。本發(fā)明設(shè)置了摘要占原文的百分比和摘要長度兩個(gè)可選項(xiàng),供用戶選擇設(shè)置,提高了靈活性。隨機(jī)抽取100篇文章,經(jīng)過人工校驗(yàn),通過率達(dá)99.8%。