代碼文本處理方法及相關(guān)產(chǎn)品

基本信息

申請(qǐng)?zhí)?/td> CN201911290957.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111126031A 公開(kāi)(公告)日 2020-05-08
申請(qǐng)公布號(hào) CN111126031A 申請(qǐng)公布日 2020-05-08
分類(lèi)號(hào) G06F40/194;G06F8/75 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 于俊;連順;李雅潔;譚昶;謝榭;丁輝 申請(qǐng)(專(zhuān)利權(quán))人 南京謙萃智能科技服務(wù)有限公司
代理機(jī)構(gòu) 廣州三環(huán)專(zhuān)利商標(biāo)代理有限公司 代理人 南京謙萃智能科技服務(wù)有限公司
地址 210000 江蘇省南京市建鄴區(qū)江心州賢坤路1號(hào)科創(chuàng)中心2樓220-50號(hào)辦公用房
法律狀態(tài) -

摘要

摘要 本申請(qǐng)實(shí)施例公開(kāi)了一種代碼文本處理方法及相關(guān)產(chǎn)品,方法包括:首先獲取兩個(gè)第一代碼文本,之后,確定兩個(gè)第一代碼文本中每個(gè)第一代碼文本的第一文本特征,第一文本特征用于表征文本的結(jié)構(gòu)特征,結(jié)構(gòu)特征用于反映文本的組成成分,然后,將兩個(gè)第一代碼文本導(dǎo)入預(yù)先訓(xùn)練好的文本特征提取模型,得到兩個(gè)第一代碼文本中每個(gè)第一代碼文本的第二文本特征,第二文本特征用于表征文本的語(yǔ)義特征,最后,根據(jù)兩個(gè)第一代碼文本的第一文本特征和第二文本特征,得到兩個(gè)第一代碼文本對(duì)應(yīng)的目標(biāo)相似度。本申請(qǐng)實(shí)施例有利于提升代碼文本相似性計(jì)算的精準(zhǔn)度。