一種基于多連體特征的T細(xì)胞受體對(duì)應(yīng)表位預(yù)測(cè)方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN202010198109.6 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN111429965A | 公開(公告)日 | 2020-07-17 |
| 申請(qǐng)公布號(hào) | CN111429965A | 申請(qǐng)公布日 | 2020-07-17 |
| 分類號(hào) | G16B15/30;G16B30/10;G16B40/00 | 分類 | - |
| 發(fā)明人 | 王嘉寅;童瑤;楊玲;鄭田;劉濤;李敏;張選平 | 申請(qǐng)(專利權(quán))人 | 北京吉因加科技有限公司 |
| 代理機(jī)構(gòu) | 西安通大專利代理有限責(zé)任公司 | 代理人 | 北京吉因加科技有限公司;西安交通大學(xué) |
| 地址 | 710049 陜西省西安市咸寧西路28號(hào) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種基于多連體特征的T細(xì)胞受體對(duì)應(yīng)表位預(yù)測(cè)方法,將CDR3β鏈以及對(duì)應(yīng)的表位解析為長(zhǎng)度3的堿基,統(tǒng)計(jì)每種三聯(lián)體的頻次作為初始特征;根據(jù)得到的初始特征建立初始特征矩陣,使用主成分分析法對(duì)初始特征矩陣進(jìn)行降維,進(jìn)行特征提?。辉O(shè)有n個(gè)訓(xùn)練樣本,輸入預(yù)測(cè)數(shù)據(jù)x后,訓(xùn)練得到梯度提升決策樹模型,通過梯度提升決策樹模型將各個(gè)決策樹的決策結(jié)果線性組合起來做出預(yù)測(cè);將特征數(shù)據(jù)輸入訓(xùn)練好的模型中進(jìn)行預(yù)測(cè),根據(jù)不同的預(yù)測(cè)目的選擇不同的預(yù)測(cè)指標(biāo)。本發(fā)明僅使用三聯(lián)體的統(tǒng)計(jì)值作為初始特征,結(jié)合梯度提升決策樹模型能夠在極短的時(shí)間內(nèi)完成模型的訓(xùn)練,且預(yù)測(cè)的準(zhǔn)確度更高。 |





