語(yǔ)義分析算法識(shí)別偽原創(chuàng)方法
【專利摘要】本發(fā)明公開了一種語(yǔ)義分析算法識(shí)別偽原創(chuàng)方法,流程如下:建立自己的近義詞庫(kù)與文庫(kù),提取文章中關(guān)鍵詞結(jié)點(diǎn),將提取的文章的關(guān)鍵詞結(jié)點(diǎn)進(jìn)行近義詞匹配,找出另一篇文章,根據(jù)文章中關(guān)鍵詞結(jié)點(diǎn)與另外一篇文章中的結(jié)點(diǎn)是否超過(guò)某個(gè)點(diǎn),給予偽原創(chuàng)定義。本發(fā)明為出版社和修改論文的老師提供了一種有效的工具,他們可以通過(guò)這個(gè)軟件對(duì)來(lái)稿和學(xué)生論文進(jìn)行偽原創(chuàng)的定義,從而確保出版質(zhì)量和論文質(zhì)量,該軟件操作簡(jiǎn)單,可以供對(duì)計(jì)算機(jī)不太了解的人使用,為我們使用該軟件提供的方便,解決了以往通過(guò)大量的人力和財(cái)力來(lái)識(shí)別偽原創(chuàng)的問(wèn)題。
【專利說(shuō)明】 語(yǔ)義分析算法識(shí)別偽原創(chuàng)方法
發(fā)明領(lǐng)域
[0001]本發(fā)明涉及一種語(yǔ)義分析算法,屬于知識(shí)產(chǎn)權(quán)保護(hù)【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]由于原創(chuàng)文章是有一定難度的,對(duì)一篇文章進(jìn)行修改加工,使軟件認(rèn)為這篇是原創(chuàng)的,這就是偽原創(chuàng),就是對(duì)一篇原創(chuàng)文章進(jìn)行一定程度的修改得到被軟件認(rèn)為是原創(chuàng)的文章,所以在文章創(chuàng)作的過(guò)程中,進(jìn)行文章識(shí)別偽原創(chuàng)是非常關(guān)鍵的步驟,我們采用的方法往往是提取關(guān)鍵詞節(jié)點(diǎn),然后對(duì)命中的文章進(jìn)行逐一的排查,很是浪費(fèi)人力,而且準(zhǔn)確率也不是很高,每年都有很多作者因?yàn)槲恼碌膫卧瓌?chuàng)問(wèn)題,造成了不必要的人力財(cái)力的浪費(fèi)。
【發(fā)明內(nèi)容】
[0003]本發(fā)明為解決目前使用的文章識(shí)別偽原創(chuàng)軟件無(wú)法快速識(shí)別文本是否原創(chuàng)的問(wèn)題,提供一種語(yǔ)義分析算法識(shí)別偽原創(chuàng)的方法。本發(fā)明包括以下步驟:
[0004]步驟一:建立自己的近義詞庫(kù)與文庫(kù);
[0005]步驟二:提取文章中關(guān)鍵詞結(jié)點(diǎn);
[0006]步驟三:將提取的文章的關(guān)鍵詞結(jié)點(diǎn)進(jìn)行近義詞匹配,找出另外一篇文章;
[0007]步驟四:根據(jù)文章中關(guān)鍵詞結(jié)點(diǎn)與另外一篇文章中的結(jié)點(diǎn)是否超過(guò)某個(gè)點(diǎn);
[0008]步驟五:給予偽原創(chuàng)定義。
[0009]發(fā)明效果:本發(fā)明為出版社和修改論文的老師提供了一種有效的工具,他們可以通過(guò)這個(gè)軟件對(duì)來(lái)稿和學(xué)生論文進(jìn)行偽原創(chuàng)的定義,從而確保出版質(zhì)量和論文質(zhì)量,該軟件操作簡(jiǎn)單,可以供對(duì)計(jì)算機(jī)不太了解的人使用,為我們使用該軟件提供的方便,解決了以往通過(guò)大量的人力和財(cái)力來(lái)識(shí)別偽原創(chuàng)的問(wèn)題。
【專利附圖】
【附圖說(shuō)明】
[0010]圖1為語(yǔ)義分析算法識(shí)別偽原創(chuàng)方法流程圖。
【具體實(shí)施方式】
[0011]【具體實(shí)施方式】:參見語(yǔ)義分析算法識(shí)別偽原創(chuàng)方法流程圖1,本實(shí)施方式由以下步驟組成:
[0012]步驟一:建立自己的近義詞庫(kù)與文庫(kù);
[0013]步驟二:提取文章中關(guān)鍵詞結(jié)點(diǎn);
[0014]步驟三:將提取的文章的關(guān)鍵詞結(jié)點(diǎn)進(jìn)行近義詞匹配,找出另外一篇文章;
[0015]步驟四:根據(jù)文章中關(guān)鍵詞結(jié)點(diǎn)與另外一篇文章中的結(jié)點(diǎn)是否超過(guò)某個(gè)點(diǎn);
[0016]步驟五:給予偽原創(chuàng)定義。
[0017]近義詞庫(kù)與文庫(kù)可以根據(jù)以后的需求,自動(dòng)進(jìn)行更新,以保證數(shù)據(jù)庫(kù)的完整性。在使用該語(yǔ)義分析算法識(shí)別偽原創(chuàng)方法前應(yīng)打開軟件確定近義詞庫(kù)是否已自動(dòng)更新,軟件會(huì)掃描文章并提取文章中關(guān)鍵詞結(jié)點(diǎn),然后將提取的關(guān)鍵詞結(jié)點(diǎn)進(jìn)行近義詞匹配,找出另外一篇文章,接下來(lái)軟件會(huì)根據(jù)文章中關(guān)鍵詞結(jié)點(diǎn)與另外一篇中的結(jié)點(diǎn)是否超過(guò)某個(gè)點(diǎn),從而給予偽原創(chuàng)定義。
[0018]對(duì)于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無(wú)論從哪一點(diǎn)來(lái)看,均應(yīng)將發(fā)明例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說(shuō)明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。
【權(quán)利要求】
1.一種語(yǔ)義分析算法識(shí)別偽原創(chuàng)的方法,其特征在于它由以下步驟實(shí)現(xiàn):步驟一:建立自己的近義詞庫(kù)與文庫(kù); 步驟二:提取文章中關(guān)鍵詞結(jié)點(diǎn); 步驟三:將提取的文章的關(guān)鍵詞結(jié)點(diǎn)進(jìn)行近義詞匹配,找出另外一篇文章; 步驟四:根據(jù)文章中關(guān)鍵詞結(jié)點(diǎn)與另外一篇文章中的結(jié)點(diǎn)是否超過(guò)某個(gè)點(diǎn); 步驟五:給予偽原創(chuàng)定義。
2.根據(jù)權(quán)利要求書I所述的一種語(yǔ)義分析算法識(shí)別偽原創(chuàng)方法,其特征在于:步驟一中所述近義詞庫(kù)與文庫(kù)可以根據(jù)以后的需求,自動(dòng)進(jìn)行更新。
3.根據(jù)權(quán)利要求書I所述的一種語(yǔ)義分析算法識(shí)別偽原創(chuàng)方法,其特征在于;步驟四中所述根據(jù)文章中關(guān)鍵詞結(jié)點(diǎn)與另外一篇文章中的結(jié)點(diǎn)是否超過(guò)某個(gè)點(diǎn)需要提前提取文章中關(guān)鍵詞結(jié)點(diǎn)并將提取的文章的關(guān)鍵詞結(jié)點(diǎn)進(jìn)行近義詞匹配,找出另外一篇文章。
【文檔編號(hào)】G06F17/27GK103761222SQ201310754614
【公開日】2014年4月30日 申請(qǐng)日期:2013年12月31日 優(yōu)先權(quán)日:2013年12月31日
【發(fā)明者】姚小兵 申請(qǐng)人:上海兵飛軟件有限公司