使用機(jī)器學(xué)習(xí)對核酸序列進(jìn)行分類的方法
基本信息

| 申請?zhí)?/td> | CN202110378157.8 | 申請日 | - |
| 公開(公告)號 | CN113096740A | 公開(公告)日 | 2021-07-09 |
| 申請公布號 | CN113096740A | 申請公布日 | 2021-07-09 |
| 分類號 | G16B40/20(2019.01)I;G16B30/00(2019.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06K9/62(2006.01)I | 分類 | 物理 |
| 發(fā)明人 | 趙增祥;張延明;杜楠;朱政英;王麗娜;侯全民 | 申請(專利權(quán))人 | 北京諾賽基因組研究中心有限公司 |
| 代理機(jī)構(gòu) | 北京漢鼎理利專利代理事務(wù)所(特殊普通合伙) | 代理人 | 潘滿根 |
| 地址 | 100176北京市大興區(qū)北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)永昌北路3號1號樓1層01 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供一種使用機(jī)器學(xué)習(xí)對核酸序列進(jìn)行分類的方法,所述方法包括收集帶有準(zhǔn)確分類標(biāo)簽的核酸序列構(gòu)建核酸序列數(shù)據(jù)庫,將核酸序列數(shù)據(jù)庫中所有核酸序列分割成等長度的短序列,從而形成短核酸序列均衡樣本;提取核酸Kmer,形成核酸序列的Kmer字典;使用Kmer字典將短核酸序列均衡樣本轉(zhuǎn)化成數(shù)字信號;使用數(shù)字信號訓(xùn)練一個能對帶有分類標(biāo)簽的核酸序列進(jìn)行多分類的神經(jīng)網(wǎng)絡(luò)分類器;使用Kmer字典將待檢測核酸序列轉(zhuǎn)化成數(shù)字信號;然后將數(shù)字信號輸入到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)分類器中,對待檢測核酸序列進(jìn)行分類。通過本發(fā)明的方法,能夠準(zhǔn)確快速地將待檢測核酸序列與構(gòu)建數(shù)據(jù)庫中核酸序列的標(biāo)簽進(jìn)行對應(yīng)分類,并展示每個標(biāo)簽的可靠性分值,為后續(xù)研究提供參考,增加了模型的使用價(jià)值。 |





