存有數(shù)據(jù)信息的DNA序列的處理方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202011137220.0 申請(qǐng)日 -
公開(公告)號(hào) CN112288090A 公開(公告)日 2021-01-29
申請(qǐng)公布號(hào) CN112288090A 申請(qǐng)公布日 2021-01-29
分類號(hào) G06N3/12;G16B50/50;G16B50/40 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 黃小羅;戴俊彪 申請(qǐng)(專利權(quán))人 中科碳元(深圳)生物科技有限公司
代理機(jī)構(gòu) 深圳中一聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 代理人 黃志云
地址 518000 廣東省深圳市南山區(qū)深圳大學(xué)城學(xué)苑大道1068號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)涉及生物信息技術(shù)領(lǐng)域,尤其涉及一種存有數(shù)據(jù)信息的DNA序列的處理方法及裝置。所述方法包括:獲取待壓縮的DNA序列,DNA序列是根據(jù)待存儲(chǔ)的數(shù)據(jù)信息轉(zhuǎn)換所得,DNA序列包括M個(gè)堿基重復(fù)片段;根據(jù)預(yù)設(shè)的重復(fù)次數(shù)與基準(zhǔn)堿基組之間的對(duì)應(yīng)關(guān)系,對(duì)DNA序列進(jìn)行編碼,得到壓縮序列,壓縮序列包括M個(gè)編碼片段,M個(gè)堿基重復(fù)片段與M個(gè)編碼片段一一對(duì)應(yīng);對(duì)壓縮序列進(jìn)行拆分,得到解碼序列和信息序列,解碼序列包括M個(gè)編碼片段中的基準(zhǔn)堿基組,信息序列包括壓縮序列除基準(zhǔn)堿基組以外的其他堿基單元和標(biāo)記物。本申請(qǐng)?zhí)峁┑姆椒ǎ軌蛱嵘鼶NA數(shù)據(jù)存儲(chǔ)信息的信息編碼密度及數(shù)據(jù)安全性。