基于知識(shí)圖譜的字段級(jí)的數(shù)據(jù)血緣確定方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202011626496.5 申請(qǐng)日 -
公開(公告)號(hào) CN112711591B 公開(公告)日 2021-10-08
申請(qǐng)公布號(hào) CN112711591B 申請(qǐng)公布日 2021-10-08
分類號(hào) G06F16/22;G06F16/36;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 雷濤;喬旺龍;趙琳;曹曉磊 申請(qǐng)(專利權(quán))人 天云融創(chuàng)數(shù)據(jù)科技(北京)有限公司
代理機(jī)構(gòu) 北京開陽(yáng)星知識(shí)產(chǎn)權(quán)代理有限公司 代理人 安偉
地址 100025 北京市朝陽(yáng)區(qū)東四環(huán)中路78號(hào)大成國(guó)際中心A1座9A08-9A09
法律狀態(tài) -

摘要

摘要 本公開涉及基于知識(shí)圖譜的字段級(jí)的數(shù)據(jù)血緣確定方法及裝置,包括:獲取第一數(shù)據(jù)表對(duì)中兩個(gè)數(shù)據(jù)表各自的表名和表結(jié)構(gòu)信息;第一數(shù)據(jù)表對(duì)包括數(shù)據(jù)庫(kù)中的任意兩個(gè)數(shù)據(jù)表;計(jì)算第一數(shù)據(jù)表對(duì)中兩個(gè)數(shù)據(jù)表的表名之間的第一表名相似度,以及計(jì)算表結(jié)構(gòu)信息中字段之間的相似度,得到第一字段相似度矩陣;根據(jù)第一表名相似度、第一字段相似度矩陣和預(yù)先獲取的目標(biāo)權(quán)值,確定第一數(shù)據(jù)表對(duì)中兩個(gè)數(shù)據(jù)表之間是否具有血緣關(guān)系;獲取多個(gè)具有血緣關(guān)系的第一數(shù)據(jù)表對(duì)作為目標(biāo)數(shù)據(jù)表對(duì);根據(jù)知識(shí)圖譜和目標(biāo)數(shù)據(jù)表對(duì)中數(shù)據(jù)表之間的血緣關(guān)系,生成字段級(jí)的數(shù)據(jù)關(guān)系圖譜。本公開能夠降低確定數(shù)據(jù)表的血緣關(guān)系的難度,提升血緣關(guān)系的確定準(zhǔn)確性。