一種基于深度學(xué)習(xí)的基因型預(yù)測(cè)方法

基本信息

申請(qǐng)?zhí)?/td> CN201810364531.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110400597A 公開(kāi)(公告)日 2019-11-01
申請(qǐng)公布號(hào) CN110400597A 申請(qǐng)公布日 2019-11-01
分類(lèi)號(hào) G16B5/00(2019.01)I; G16B25/00(2019.01)I 分類(lèi) 物理
發(fā)明人 葉偉健; 楊武兵; 王勉 申請(qǐng)(專(zhuān)利權(quán))人 成都二十三魔方生物科技有限公司
代理機(jī)構(gòu) 深圳市萬(wàn)商天勤知識(shí)產(chǎn)權(quán)事務(wù)所(普通合伙) 代理人 王志明;羅建平
地址 610000 四川省成都市高新區(qū)天府大道中段1366號(hào)E區(qū)2號(hào)樓10層16、17、18號(hào)房
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于深度學(xué)習(xí)的基因型預(yù)測(cè)方法,包括以下步驟:A:根據(jù)收集到的基因片段,構(gòu)建初步訓(xùn)練集合;B:為初步訓(xùn)練集合進(jìn)行基因定相,并對(duì)基因定相之后的兩條單倍型進(jìn)行0,1,0.5編碼;將編碼后的數(shù)據(jù)分割成一次訓(xùn)練集合和測(cè)試集合;C:按取得的相鄰SNP位點(diǎn)構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,并使用一次訓(xùn)練集合訓(xùn)練模型;D:將測(cè)試集合經(jīng)過(guò)步驟A、B處理后代入通過(guò)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型,求出測(cè)試集的預(yù)測(cè)值和模型可信度;E:將實(shí)際需要預(yù)測(cè)的基因序列做處理后代入模型,截取可信度達(dá)到一定程度的位點(diǎn)作為有效預(yù)測(cè),輸出結(jié)果。通過(guò)本發(fā)明可解決現(xiàn)有的基因預(yù)測(cè)技術(shù)需要消耗大量計(jì)算資源,耗時(shí)過(guò)長(zhǎng)的問(wèn)題。