一種基于Lucene的大索引快速分裂方法

基本信息

申請(qǐng)?zhí)?/td> CN201911026343.4 申請(qǐng)日 -
公開(公告)號(hào) CN110716942A 公開(公告)日 2020-01-21
申請(qǐng)公布號(hào) CN110716942A 申請(qǐng)公布日 2020-01-21
分類號(hào) G06F16/22 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王帥 申請(qǐng)(專利權(quán))人 南京錄信軟件技術(shù)有限公司
代理機(jī)構(gòu) - 代理人 -
地址 210000 江蘇省南京市江寧區(qū)濱江經(jīng)濟(jì)開發(fā)區(qū)盛安大道739號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于Lucene的大索引快速分裂方法,包括以下步驟:利用Linux下文件的軟連接原理,在當(dāng)前新建索引分片目錄上進(jìn)行標(biāo)記,標(biāo)記出當(dāng)前文件所指向的原索引文件存儲(chǔ)位置;借助于Lucene的delete from特性,在當(dāng)前新建索引分片上刪除一半指定的索引數(shù)據(jù),在另一塊索引分片上刪除相反的另一半數(shù)據(jù),完成索引文件由一分裂為二的過程;完成索引分裂后,根據(jù)刪除操作時(shí)所使用的刪除條件決定當(dāng)前索引數(shù)據(jù)定位的存儲(chǔ)目錄,將后續(xù)數(shù)據(jù)進(jìn)行重新入庫(kù);本發(fā)明提供的方法分裂過程無需額外copy開銷,刪除指定索引數(shù)據(jù)時(shí)效率高,加快了索引分裂的過程;索引分裂過程完成后,后續(xù)數(shù)據(jù)入庫(kù)索引數(shù)據(jù)定位規(guī)則與上述刪除操作的刪除條件有關(guān),無需額外算法,簡(jiǎn)便快捷。