一種文本屬性特征的識別、分類及結(jié)構(gòu)分析方法及裝置

基本信息

申請?zhí)?/td> CN202010992100.2 申請日 -
公開(公告)號 CN111930953B 公開(公告)日 2020-11-13
申請公布號 CN111930953B 申請公布日 2020-11-13
分類號 G06F16/35(2019.01)I; 分類 計算;推算;計數(shù);
發(fā)明人 姜庭欣;陳偉然;李靜毅;郭永紅 申請(專利權(quán))人 北京合享智慧科技有限公司
代理機(jī)構(gòu) 北京三聚陽光知識產(chǎn)權(quán)代理有限公司 代理人 李博洋
地址 100085北京市海淀區(qū)上地信息產(chǎn)業(yè)基地開拓路1號B座3層3008
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文本屬性特征的識別、分類及結(jié)構(gòu)分析方法及裝置,該文本屬性特征的識別方法包括:根據(jù)目標(biāo)文本中的語句生成語法結(jié)構(gòu);根據(jù)語法結(jié)構(gòu)中的節(jié)點(diǎn)關(guān)系生成數(shù)據(jù)結(jié)構(gòu);根據(jù)數(shù)據(jù)結(jié)構(gòu)生成第一輸入向量;根據(jù)第一輸入向量及預(yù)設(shè)的文本屬性特征分類模型確定各語句包含屬性特征文本的概率;根據(jù)概率識別目標(biāo)文本中的文本屬性特征。通過實(shí)施本發(fā)明,能夠準(zhǔn)確識別目標(biāo)文本中的文本屬性特征,實(shí)現(xiàn)對文本內(nèi)容的含義的識別,能夠挖掘文本更深層次的含義,不僅能夠豐富文本識別的內(nèi)容,而且對于后續(xù)的基于文本識別內(nèi)容的分析處理等過程,能夠提供更加全面的數(shù)據(jù)及內(nèi)容的支持。??