地址標準化方法、系統(tǒng)及電子設(shè)備

基本信息

申請?zhí)?/td> CN202011349668.9 申請日 -
公開(公告)號 CN112417812A 公開(公告)日 2021-02-26
申請公布號 CN112417812A 申請公布日 2021-02-26
分類號 G06F40/103(2020.01)I;G06F16/33(2019.01)I;G06F16/31(2019.01)I;G06F40/151(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 元方;張凡超 申請(專利權(quán))人 新智認知數(shù)據(jù)服務(wù)有限公司
代理機構(gòu) 上海遠同律師事務(wù)所 代理人 許力;張堅
地址 201209上海市浦東新區(qū)川沙路955號11幢221室
法律狀態(tài) -

摘要

摘要 一種地址標準化方法、系統(tǒng)及電子設(shè)備,本發(fā)明將待標準化地址字符串轉(zhuǎn)為拼音字符組,與糾錯詞集合匹配,得到相應(yīng)的中文詞集合,在關(guān)鍵詞集合中查詢中文詞集合中的各中文詞,形成關(guān)鍵中文詞集合,中文詞數(shù)量記為size_cn_keys,對關(guān)鍵中文詞集合中的每個中文詞進行召回操作,形成第一集合,統(tǒng)計第一集合中的每個標準地址字符串包含中文詞集合中不重復(fù)中文詞的數(shù)量size_in,將滿足size_in/size_cn_keys≧閾值的相應(yīng)標準地址字符串加入第二集合,若第二集合中size_in/size_cn_keys的最大值的標準地址字符串只有一條且該最大值為1時,則該標準地址字符串即為待標準化的地址字符串的標準地址,否則,通過相似度匹配,得到待標準化的地址字符串的標準地址。本發(fā)明可以準確并且快速地實現(xiàn)地址標準化。??