基于大數(shù)據(jù)人工智能算法的祖源多態(tài)性預(yù)測(cè)方法

基本信息

申請(qǐng)?zhí)?/td> CN201810004076.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109993305A 公開(kāi)(公告)日 2019-07-09
申請(qǐng)公布號(hào) CN109993305A 申請(qǐng)公布日 2019-07-09
分類號(hào) G06N3/12 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 葉偉健;楊武兵;王勉 申請(qǐng)(專利權(quán))人 成都二十三魔方生物科技有限公司
代理機(jī)構(gòu) 深圳市萬(wàn)商天勤知識(shí)產(chǎn)權(quán)事務(wù)所(普通合伙) 代理人 王志明
地址 610000 四川省成都市高新區(qū)天府軟件園E區(qū)6棟10樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了基于大數(shù)據(jù)人工智能算法的祖源多態(tài)性預(yù)測(cè)方法,包括以下步驟:A:根據(jù)人群基因組數(shù)據(jù),構(gòu)建訓(xùn)練集合;B:對(duì)訓(xùn)練集合的群體樣品進(jìn)行基因定向,把定向后的兩條單倍型進(jìn)行1和?1編碼,同時(shí)對(duì)基因組進(jìn)行窗口劃分;C:通過(guò)投票策略選取最佳分類器,組成窗口觀察序列,以分類器的結(jié)果作為下一步輸入;D:構(gòu)建窗口的轉(zhuǎn)移矩陣和發(fā)射矩陣,建立隱馬可夫模型;E:通過(guò)隱馬可夫模型預(yù)測(cè)隱藏狀態(tài)的概率分布,求出最優(yōu)的祖源結(jié)果標(biāo)簽,作為最終結(jié)果輸出。通過(guò)本發(fā)明可克服現(xiàn)有群體多態(tài)性方法對(duì)于遺傳非常相近的群體,同時(shí)能夠精細(xì)化預(yù)測(cè)染色體基因組片段的多態(tài)性,該方法對(duì)基因群體研究和某些群體關(guān)聯(lián)疾病基因組片段定位起到重要作用。