一種用于蛋白質(zhì)功能預(yù)測(cè)的層級(jí)多標(biāo)簽分類(lèi)方法

基本信息

申請(qǐng)?zhí)?/td> CN201610452113.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN106126972B 公開(kāi)(公告)日 2018-10-02
申請(qǐng)公布號(hào) CN106126972B 申請(qǐng)公布日 2018-10-02
分類(lèi)號(hào) G06F19/18;G06F19/24 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 馮收;付平;石金龍;鄭文斌;徐明珠;魯健捷;賈現(xiàn)召;周穎 申請(qǐng)(專(zhuān)利權(quán))人 哈爾濱工業(yè)大學(xué)國(guó)家大學(xué)科技園發(fā)展有限公司
代理機(jī)構(gòu) 哈爾濱市松花江專(zhuān)利商標(biāo)事務(wù)所 代理人 哈爾濱工業(yè)大學(xué);哈爾濱工業(yè)大學(xué)國(guó)家大學(xué)科技園發(fā)展有限公司
地址 150001 黑龍江省哈爾濱市南崗區(qū)西大直街92號(hào)
法律狀態(tài) -

摘要

摘要 一種用于蛋白質(zhì)功能預(yù)測(cè)的層級(jí)多標(biāo)簽分類(lèi)方法,涉及生物信息學(xué)及數(shù)據(jù)挖掘領(lǐng)域,尤其涉及一種用于蛋白質(zhì)功能預(yù)測(cè)的層級(jí)多標(biāo)簽分類(lèi)方法。本發(fā)明要為解決現(xiàn)有分類(lèi)方法用于預(yù)測(cè)蛋白質(zhì)功能時(shí),存在數(shù)據(jù)集不平衡問(wèn)題、多標(biāo)簽問(wèn)題和層級(jí)約束問(wèn)題。本發(fā)明所述方法按以下步驟進(jìn)行:一、訓(xùn)練階段:在訓(xùn)練階段針對(duì)類(lèi)標(biāo)簽層級(jí)結(jié)構(gòu)中的每個(gè)節(jié)點(diǎn)的數(shù)據(jù)集采用一個(gè)SVM分類(lèi)器進(jìn)行訓(xùn)練,得到一組基礎(chǔ)分類(lèi)器;二、預(yù)測(cè)階段:在預(yù)測(cè)階段首先使用訓(xùn)練階段獲得的這組基礎(chǔ)分類(lèi)器得出未知樣本的初步結(jié)果,而后采用帶權(quán)重的TPR算法對(duì)結(jié)果進(jìn)行處理,得到滿足層級(jí)約束條件的最終結(jié)果,實(shí)現(xiàn)對(duì)蛋白質(zhì)功能的預(yù)測(cè)。本發(fā)明應(yīng)用于生物信息學(xué)及數(shù)據(jù)挖掘領(lǐng)域。