一種HLA測序峰圖識別方法

基本信息

申請?zhí)?/td> CN201910026426.7 申請日 -
公開(公告)號 CN109753939B 公開(公告)日 2021-04-20
申請公布號 CN109753939B 申請公布日 2021-04-20
分類號 G06K9/00(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 叢華劍;王連水;洪軻;徐明;張倩;李慶林;張琛;齊效乾 申請(專利權(quán))人 銀豐基因科技有限公司
代理機(jī)構(gòu) 濟(jì)南泉城專利商標(biāo)事務(wù)所 代理人 劉德
地址 250101山東省濟(jì)南市高新區(qū)港興三路1109號二期產(chǎn)業(yè)樓905室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種HLA測序峰圖識別方法:(1)構(gòu)建峰圖識別模型:①收集已有的HLA下機(jī)峰圖數(shù)據(jù),②進(jìn)行預(yù)處理,完成二進(jìn)制ab1文件的信息提取,原始序列比對,序列分割以及錯位修復(fù)工作;③特征提??;④收集大量人工已識別數(shù)據(jù),利用隨機(jī)森林算法訓(xùn)練數(shù)據(jù),構(gòu)建峰圖識別模型;(2)利用峰圖識別模型,對待測的HLA一代測序原始下機(jī)數(shù)據(jù)進(jìn)行堿基識別;(3)整理識別好的堿基序列,將單鏈與雙鏈部分序列重新組裝;(4)輸出識別結(jié)果。本發(fā)明的識別方法可準(zhǔn)確獲得峰圖序列信息,整體準(zhǔn)確率在99.5%以上,大大提高了HLA數(shù)據(jù)判讀人員的工作效率。??