數(shù)據(jù)檢索方法、裝置以及計算機可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202011302942.7 申請日 -
公開(公告)號 CN112418298B 公開(公告)日 2021-12-03
申請公布號 CN112418298B 申請公布日 2021-12-03
分類號 G06K9/62;G06F16/903 分類 計算;推算;計數(shù);
發(fā)明人 程子翰;田國棟 申請(專利權(quán))人 北京云從科技有限公司
代理機構(gòu) 北京瀚仁知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 屠曉旭;宋寶庫
地址 102300 北京市門頭溝區(qū)石龍經(jīng)濟開發(fā)區(qū)永安路20號3號樓一層102室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及數(shù)據(jù)檢索技術(shù)領(lǐng)域,具體提供了一種數(shù)據(jù)檢索方法、裝置以及計算機可讀存儲介質(zhì),旨在解決快速且準確地對大批量數(shù)據(jù)進行數(shù)據(jù)檢索的技術(shù)問題。為此目的,根據(jù)本發(fā)明實施例的方法,利用PQ算法對向量樣本進行相似數(shù)據(jù)檢索,相較于暴力搜索的方法,能夠顯著提高數(shù)據(jù)的檢索效率。同時,在獲取到利用PQ算法生成的向量距離查詢表之后,可以將向量距離查詢表中的浮點型向量距離轉(zhuǎn)換為整型向量距離,以降低向量距離查詢表的數(shù)據(jù)大小,滿足處理器的一級緩存的緩存存儲要求,使得處理器只需在一級緩存中加載一次向量距離查詢表,就可以完成對一個向量樣本的相似性檢索,克服了現(xiàn)有技術(shù)中由于反復(fù)加載向量距離查詢表導(dǎo)致的檢索效率下降的缺陷。