智能文檔處理方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及介質(zhì)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202111048195.3 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN113761840A | 公開(kāi)(公告)日 | 2021-12-07 |
| 申請(qǐng)公布號(hào) | CN113761840A | 申請(qǐng)公布日 | 2021-12-07 |
| 分類(lèi)號(hào) | G06F40/143(2020.01)I;G06F16/35(2019.01)I;G06F16/81(2019.01)I;G06F40/166(2020.01)I;G06F40/258(2020.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 郭春磊;馬麗霞;夏義鵬;王驍;李濤 | 申請(qǐng)(專(zhuān)利權(quán))人 | 中信建投證券股份有限公司 |
| 代理機(jī)構(gòu) | 北京品源專(zhuān)利代理有限公司 | 代理人 | 李禮 |
| 地址 | 100010北京市東城區(qū)朝內(nèi)大街188號(hào)鴻安國(guó)際大廈 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開(kāi)了一種智能文檔處理方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及介質(zhì),該方法包括:獲取數(shù)據(jù)源文檔的xml文件,xml文件包括至少一個(gè)段落節(jié)點(diǎn),段落節(jié)點(diǎn)中包括至少一個(gè)目標(biāo)文本節(jié)點(diǎn);對(duì)xml文件進(jìn)行標(biāo)準(zhǔn)化處理,得到目標(biāo)xml文件,標(biāo)準(zhǔn)化處理包括依次執(zhí)行的目標(biāo)文本節(jié)點(diǎn)合并、目標(biāo)文本節(jié)點(diǎn)拆分和添加節(jié)點(diǎn)標(biāo)識(shí)符;對(duì)目標(biāo)xml文件進(jìn)行壓縮處理,得到標(biāo)準(zhǔn)化數(shù)據(jù)源文檔;對(duì)標(biāo)準(zhǔn)化數(shù)據(jù)源文檔進(jìn)行數(shù)據(jù)提取,并根據(jù)數(shù)據(jù)提取結(jié)果建立文檔數(shù)據(jù)庫(kù)。本發(fā)明通過(guò)對(duì)數(shù)據(jù)源文檔進(jìn)行標(biāo)準(zhǔn)化處理及數(shù)據(jù)提取建立數(shù)據(jù)源文檔數(shù)據(jù)庫(kù),為智能化文檔編輯操作提供數(shù)據(jù)基礎(chǔ),有利于節(jié)省人工成本和時(shí)間成本,提高文檔編輯效率和準(zhǔn)確性。 |





