一種文章觀點(diǎn)剽竊行為的檢測方法

基本信息

申請?zhí)?/td> CN201910937578.2 申請日 -
公開(公告)號 CN110674299A 公開(公告)日 2020-01-10
申請公布號 CN110674299A 申請公布日 2020-01-10
分類號 G06F16/35(2019.01); G06F40/30(2020.01); G06K9/62(2006.01) 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孟濤; 李佳靜 申請(專利權(quán))人 南京網(wǎng)感至察信息科技有限公司
代理機(jī)構(gòu) 蘇州言思嘉信專利代理事務(wù)所(普通合伙) 代理人 南京網(wǎng)感至察信息科技有限公司
地址 210001 江蘇省南京市秦淮區(qū)光華路129-3號南京白下高新技術(shù)產(chǎn)業(yè)園區(qū)A1區(qū)5層511室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種文章觀點(diǎn)剽竊行為的檢測方法,涉及文本抄襲檢測技術(shù)領(lǐng)域。該文章觀點(diǎn)剽竊行為的檢測方法,包括以下步驟:S1.根據(jù)不同領(lǐng)域的文章特點(diǎn)定義文章的關(guān)鍵要素;S2.針對關(guān)鍵要素定義抽取規(guī)則;S3.從比對庫中獲取比對文本;S4.在待檢測和比對文本中進(jìn)行關(guān)鍵要素抽??;S5.基于抽取得到的關(guān)鍵要素,可以基于規(guī)則的方式計(jì)算文章整體相似度;也可以作為基于統(tǒng)計(jì)的方法的特征數(shù)據(jù),輸入到訓(xùn)練好的分類器中進(jìn)行分類;S6.報(bào)告檢測結(jié)果。通過對現(xiàn)有系統(tǒng)無法有效檢測觀點(diǎn)剽竊行為的現(xiàn)狀進(jìn)行改進(jìn),提高抄襲檢測的有效性,可以作為現(xiàn)有系統(tǒng)的有利補(bǔ)充。