地址標準化方法、系統(tǒng)及電子設(shè)備
基本信息

| 申請?zhí)?/td> | CN202011349668.9 | 申請日 | - |
| 公開(公告)號 | CN112417812A | 公開(公告)日 | 2021-02-26 |
| 申請公布號 | CN112417812A | 申請公布日 | 2021-02-26 |
| 分類號 | G06F40/103(2020.01)I;G06F16/33(2019.01)I;G06F16/31(2019.01)I;G06F40/151(2020.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 元方;張凡超 | 申請(專利權(quán))人 | 新智認知數(shù)據(jù)服務(wù)有限公司 |
| 代理機構(gòu) | 上海遠同律師事務(wù)所 | 代理人 | 許力;張堅 |
| 地址 | 201209上海市浦東新區(qū)川沙路955號11幢221室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 一種地址標準化方法、系統(tǒng)及電子設(shè)備,本發(fā)明將待標準化地址字符串轉(zhuǎn)為拼音字符組,與糾錯詞集合匹配,得到相應(yīng)的中文詞集合,在關(guān)鍵詞集合中查詢中文詞集合中的各中文詞,形成關(guān)鍵中文詞集合,中文詞數(shù)量記為size_cn_keys,對關(guān)鍵中文詞集合中的每個中文詞進行召回操作,形成第一集合,統(tǒng)計第一集合中的每個標準地址字符串包含中文詞集合中不重復(fù)中文詞的數(shù)量size_in,將滿足size_in/size_cn_keys≧閾值的相應(yīng)標準地址字符串加入第二集合,若第二集合中size_in/size_cn_keys的最大值的標準地址字符串只有一條且該最大值為1時,則該標準地址字符串即為待標準化的地址字符串的標準地址,否則,通過相似度匹配,得到待標準化的地址字符串的標準地址。本發(fā)明可以準確并且快速地實現(xiàn)地址標準化。?? |





