一種實體詞表示學習方法、裝置、計算機設備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202010890302.6 申請日 -
公開(公告)號 CN111967252A 公開(公告)日 2020-11-20
申請公布號 CN111967252A 申請公布日 2020-11-20
分類號 G06F40/279;G06F40/35;G06F16/951 分類 計算;推算;計數(shù);
發(fā)明人 李夏昕;孫璨;張永平 申請(專利權(quán))人 深圳唄佬智能有限公司
代理機構(gòu) 深圳市中融創(chuàng)智專利代理事務所(普通合伙) 代理人 葉垚平;李立
地址 518000 廣東省深圳市南山區(qū)粵海街道海珠社區(qū)科苑南路2666號中國華潤大廈L201
法律狀態(tài) -

摘要

摘要 本申請具體公開了一種實體詞表示學習方法、裝置、計算機設備及存儲介質(zhì),該方法包括爬取互聯(lián)網(wǎng)上公開的jd數(shù)據(jù),以獲取目標實體詞t;將目標實體詞t表示成和目標實體詞t共現(xiàn)的實體詞所組成的文檔;用構(gòu)建的文檔訓練tf?idf模型;將文檔在tf?idf模型下的向量表示做L1歸一,并做維度排序和維度截斷;基于生成向量的維度值做采樣,以構(gòu)建embedding訓練語料;用傳統(tǒng)embedding模型在構(gòu)建的語料上做訓練,得到表示模型。