一種表數(shù)據(jù)泛化方法及裝置
基本信息

| 申請?zhí)?/td> | CN202210184206.9 | 申請日 | - |
| 公開(公告)號 | CN114548303A | 公開(公告)日 | 2022-05-27 |
| 申請公布號 | CN114548303A | 申請公布日 | 2022-05-27 |
| 分類號 | G06K9/62(2022.01)I;G06F40/30(2020.01)I;G06F40/177(2020.01)I;G06F21/62(2013.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 張正欣;牟黎明;王豪;肖春亮;張宏;何坤 | 申請(專利權(quán))人 | 神州綠盟成都科技有限公司 |
| 代理機(jī)構(gòu) | 北京同達(dá)信恒知識產(chǎn)權(quán)代理有限公司 | 代理人 | - |
| 地址 | 610015四川省成都市中國(四川)自由貿(mào)易試驗(yàn)區(qū)成都高新區(qū)和樂二街150號C區(qū)5棟1層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請公開了一種表數(shù)據(jù)泛化方法及裝置,用以提升表數(shù)據(jù)泛化的效率。該方法包括:確定待泛化的表中多個(gè)表數(shù)據(jù)分別包括的各類型的子數(shù)據(jù),其中子數(shù)據(jù)的類型包括數(shù)值型、包含語義的第一文本型以及不包含語義的第二文本型;根據(jù)任一表數(shù)據(jù)包括的各類型的子數(shù)據(jù)的距離參數(shù),確定其與各中心點(diǎn)的距離;其中數(shù)值型子數(shù)據(jù)與各中心點(diǎn)的數(shù)值型變量的相似程度為其距離參數(shù);第一文本型子數(shù)據(jù)與各中心點(diǎn)的第一文本型變量的相似程度為其距離參數(shù);第二文本型子數(shù)據(jù)的距離參數(shù)指示其與各中心點(diǎn)的第二文本型變量是否相同;根據(jù)各表數(shù)據(jù)與各中心點(diǎn)的距離,將多個(gè)表數(shù)據(jù)劃分為至少一個(gè)類別簇;采用設(shè)定的數(shù)據(jù)泛化算法對至少一個(gè)類別簇分別進(jìn)行泛化處理。 |





