一種基于深度神經(jīng)網(wǎng)絡(luò)的公司網(wǎng)站關(guān)鍵詞提取方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN201811480597.9 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN109710838A | 公開(kāi)(公告)日 | 2019-05-03 |
| 申請(qǐng)公布號(hào) | CN109710838A | 申請(qǐng)公布日 | 2019-05-03 |
| 分類號(hào) | G06F16/9535(2019.01)I; G06F17/27(2006.01)I; G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 王凱鋒; 吳承霖; 王海清 | 申請(qǐng)(專利權(quán))人 | 廈門笨鳥(niǎo)電子商務(wù)有限公司 |
| 代理機(jī)構(gòu) | 廈門市新華專利商標(biāo)代理有限公司 | 代理人 | 廈門笨鳥(niǎo)電子商務(wù)有限公司 |
| 地址 | 361000 福建省廈門市思明區(qū)前埔路506、508號(hào)國(guó)金廣場(chǎng)B座6層01、02單元 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及一種基于深度神經(jīng)網(wǎng)絡(luò)的公司網(wǎng)站關(guān)鍵詞提取方法,其通過(guò)從公司的一級(jí)頁(yè)面和二級(jí)頁(yè)面中獲取基礎(chǔ)語(yǔ)料,然后從基礎(chǔ)語(yǔ)料中提取名詞短語(yǔ);利用循環(huán)神經(jīng)網(wǎng)絡(luò)模型對(duì)名詞短語(yǔ)進(jìn)行向量化,得到名詞短語(yǔ)向量;將公司的所有名詞短語(yǔ)向量進(jìn)行加權(quán)求和,得到代表一個(gè)公司整體的向量,即公司主向量;采用余弦相似度計(jì)算公司的各個(gè)名詞短語(yǔ)向量與該公司主向量之間的相似度,并按照相似程度由高至低對(duì)公司的名詞短語(yǔ)向量進(jìn)行排序,得到名詞短語(yǔ)排行榜;在名詞短語(yǔ)排行榜中選擇排名為前K名的名詞短語(yǔ)向量作為公司的主要關(guān)鍵詞。與現(xiàn)有技術(shù)相比,通過(guò)本發(fā)明方法獲取到的公司網(wǎng)站關(guān)鍵詞比較準(zhǔn)確,使用戶能準(zhǔn)確搜索或了解該公司的情況。 |





