一種藥物實驗文檔的內(nèi)容分析提取方法、系統(tǒng)和存儲介質(zhì)
基本信息

| 申請?zhí)?/td> | CN202111481771.3 | 申請日 | - |
| 公開(公告)號 | CN114186543A | 公開(公告)日 | 2022-03-15 |
| 申請公布號 | CN114186543A | 申請公布日 | 2022-03-15 |
| 分類號 | G06F40/18(2020.01)I;G06F40/242(2020.01)I;G06F40/174(2020.01)I;G06V30/413(2022.01)I;G06F16/33(2019.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 魏巍;包卿;蔡世銘 | 申請(專利權(quán))人 | 明度智云(浙江)科技有限公司 |
| 代理機構(gòu) | 杭州合譜慧知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 張剛 |
| 地址 | 310000浙江省杭州市濱江區(qū)長河街道江虹南路316號3號樓17層1701室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種藥物實驗文檔的內(nèi)容分析提取方法、系統(tǒng)和存儲介質(zhì),該方法包括獲取對應(yīng)藥物實驗文檔的第一文本,通過關(guān)鍵詞各單元格內(nèi)容進行檢索匹配,若匹配到關(guān)鍵詞則查詢該關(guān)鍵詞所屬的數(shù)據(jù)格式;否則調(diào)取近似字典表進行匹配,對匹配到的近似詞獲取對應(yīng)關(guān)鍵詞所屬的數(shù)據(jù)格式;根據(jù)數(shù)據(jù)格式以該關(guān)鍵詞或近似詞所在單元格為起點,查詢位于同一列或行的各單元格中數(shù)據(jù)格式,獲取具有與關(guān)鍵詞所屬的數(shù)據(jù)格式相同的單元格的分布區(qū)域;最后根據(jù)分布區(qū)域獲取表格類型和各關(guān)鍵詞對應(yīng)的所屬數(shù)據(jù)值。實現(xiàn)可對藥物實驗文檔中各種類型表格的指定類目或關(guān)鍵詞下的數(shù)據(jù)進行分析提取,用于后續(xù)重新整理歸納成新的記錄表格。 |





