文字情感辨識系統及方法
【專利摘要】本發明提供一種文字情感辨識系統及方法,其中,系統包括:文字接收裝置,用于接收被測文字,并將被測文字轉換為文字向量;神經網絡層,用于對文字向量進行處理,以獲得文字抽象表征數據;線性層,用于對文字抽象表征數據進行線性化,以獲得線性數據;情感分析裝置,用于根據線性數據計算被測文字所對應的情感標簽數據,并通過情感標簽數據對被測文字進行情感辨識。本發明提供的文字情感辨識系統及方法,能夠使得當被測文字中不包含有情感關鍵詞時,依舊可以對被測文字進行情感辨識。
【專利說明】
文字情感辨識系統及方法
技術領域
[0001]本發明涉及機器學習領域,尤其涉及一種文字情感辨識系統及方法。
【背景技術】
[0002]隨著計算機技術的不斷發展,情感辨識已然成為人機交互領域的重要研究內容。目前,文字情感辨識系統通常是通過先提取被測的某段文字中的情感關鍵詞,然后再對所提取的情感關鍵詞進行情感匹配,進而對該段文字的情感進行辨識。但是,現有的文字情感辨識系統的缺點在于,當被測的某段文字中不包含有情感關鍵詞時,則無法判斷出該段文字所呈現的情感。
【發明內容】
[0003]本發明要解決的技術問題是提供一種文字情感辨識系統及方法,使得當被測文字中不包含有情感關鍵詞時,依舊可以對被測文字進行情感辨識。
[0004]為解決上述技術問題,本發明的技術方案是,
[0005]一方面,本發明提供一種文字情感辨識系統,包括:文字接收裝置,用于接收被測文字,并將被測文字轉換為文字向量;神經網絡層,用于對文字向量進行處理,以獲得文字抽象表征數據;線性層,用于對文字抽象表征數據進行線性化,以獲得線性數據;情感分析裝置,用于根據線性數據計算被測文字所對應的情感標簽數據,并通過情感標簽數據對被測文字進行情感辨識。
[0006]進一步地,神經網絡層包括依次連接的第一層神經網絡和第二層神經網絡;第一層神經網絡,接收文字向量,并對文字向量進行抽象表征,以獲得第一文字抽象表征數據;第二層神經網絡,接收第一文字抽象表征數據,并對第一文字抽象表征數據進行進一步抽象表征,以獲得文字抽象表征數據。
[0007]進一步地,第一層神經網絡為長短期記憶人工神經網絡;第二層神經網絡為細胞式類神經網絡。
[0008]進一步地,系統采用文字抽象表征數據進行自學習。
[0009]進一步地,線性層至少有一層。
[0010]進一步地,線性層有三層,分別為第一線性層,第二線性層和第三線性層;第一線性層,接收文字抽象表征數據,并對文字抽象表征數據進行線性化處理,以獲得第一線性數據;第二線性層,接收第一線性數據,并對第一線性數據進行線性化處理,以獲得第二線性數據;第三線性層,接收第二線性數據,并對第二線性數據進行線性化處理,以獲得線性數據。
[0011 ]另一方面,本發明提供一種文字情感辨識方法,包括:文字接收裝置接收被測文字,并將被測文字轉換為文字向量;神經網絡層對文字向量進行處理,以獲得文字抽象表征數據;線性層對文字抽象表征數據進行線性化,以獲得線性數據;情感分析裝置根據線性數據計算被測文字所對應的情感標簽數據,并通過情感標簽數據對被測文字進行情感辨識。
[0012]進一步地,神經網絡層包括依次連接的第一層神經網絡和第二層神經網絡;第一層神經網絡,接收文字向量,并對文字向量進行抽象表征,以獲得第一文字抽象表征數據;第二層神經網絡,接收第一文字抽象表征數據,并對第一文字抽象表征數據進行進一步抽象表征,以獲得文字抽象表征數據。
[0013]進一步地,第一層神經網絡為長短期記憶人工神經網絡;第二層神經網絡為細胞式類神經網絡。
[0014]本發明提供的文字情感辨識系統及方法,在接收到被測文字之后,先將該被測文字轉換成文字向量,再將該文字向量輸入到神經網絡層中進行處理以獲得對應于被測文字的文字抽象表征數據,之后再將文字抽象表征數據輸入到線性層中,通過線性層對文字抽象表征數據進行線性化以降低文字抽象表征數據的維度,從而獲得線性數據;最后再根據線性數據計算出對應于被測文字的情感標簽數據,并通過該情感標簽數據與預設的情感數據進行匹配,從而實現對被測文字進行情感辨識。
[0015]本發明的文字情感辨識系統及方法,采用神經網絡層和線性層對被測文字進行情感辨識,其中,神經網絡層使用神經網絡算法對文字向量進行處理,獲得可有助于進行機器自學習的文字抽象表征數據;線性層則是對文字抽象表征數據進行線性化處理,以降低數據維度,從而降低計算復雜度。在神經網絡層和線性層的共同作用下,本發明的文字情感辨識系統及方法,利用神經網絡的自學習功能,無論被測文字中是否包含有情感關鍵詞,都可以對被測文字進行情感辨識。
【附圖說明】
[0016]圖1是本發明實施例提供的一種文字情感辨識系統的框圖;
[0017]圖2是本發明實施例提供的一種文字情感辨識方法的流程圖。
【具體實施方式】
[0018]下面通過具體的實施例進一步說明本發明,但是,應當理解為,這些實施例僅僅是用于更詳細具體地說明之用,而不應理解為用于以任何形式限制本發明。
[0019]實施例一
[0020]結合圖1,本實施例提供的文字情感辨識系統,包括:
[0021]文字接收裝置1:用于接收被測文字,并將被測文字轉換為文字向量;
[0022]神經網絡層2:用于對文字向量進行處理,以獲得文字抽象表征數據;
[0023]線性層3:用于對文字抽象表征數據進行線性化,以獲得線性數據;
[0024]情感分析裝置4:用于根據線性數據計算被測文字所對應的情感標簽數據,并通過情感標簽數據對被測文字進行情感辨識。
[0025]本發明實施例提供的文字情感辨識系統,在接收到被測文字之后,先將該被測文字轉換成文字向量,再將該文字向量輸入到神經網絡層2中進行處理以獲得對應于被測文字的文字抽象表征數據,之后再將文字抽象表征數據輸入到線性層3中,通過線性層3對文字抽象表征數據進行線性化以降低文字抽象表征數據的維度,從而獲得線性數據;最后再根據線性數據計算出對應于被測文字的情感標簽數據,并通過該情感標簽數據與預設的情感數據進行匹配,從而實現對被測文字進行情感辨識。
[0026]本發明實施例的文字情感辨識系統,采用神經網絡層2和線性層3對被測文字進行情感辨識,其中,神經網絡層2使用神經網絡算法對文字向量進行處理,獲得可有助于進行機器自學習的文字抽象表征數據;線性層3則是對文字抽象表征數據進行線性化處理,以降低數據維度,從而降低計算復雜度。在神經網絡層2和線性層3的共同作用下,本發明實施例的文字情感辨識系統,利用神經網絡算法的自學習功能,無論被測文字中是否包含有情感關鍵詞,都可以對被測文字進行情感辨識。
[0027]優選地,神經網絡層2包括依次連接的第一層神經網絡和第二層神經網絡;第一層神經網絡,接收文字向量,并對文字向量進行抽象表征,以獲得第一文字抽象表征數據;第二層神經網絡,接收第一文字抽象表征數據,并對第一文字抽象表征數據進行進一步抽象表征,以獲得文字抽象表征數據。
[0028]進一步優選地,第一層神經網絡為長短期記憶人工神經網絡(Long-Short TermMemory ,LSTM);第二層神經網絡為細胞式類神經網絡(Cellular neural network,CNN)。長短期記憶人工神經網絡是機器學習架構的一種,其作用在于,將文字向量轉換成抽象的表征;細胞式類神經網絡也是屬于機器學習架構的一種,其作用在于,將通過長短期記憶人工神經網絡所獲得的抽象的表征再更進一步地轉換成更抽象的表征。本實施采用第一層神經網絡和第二層神經網絡共同作用,能夠更加準確地對被測文字的情感進行辨識。
[0029]優選地,系統采用文字抽象表征數據進行自學習。本實施例的系統,在對被測文字的情感進行辨識的同時,也是在進行自學習,本實施例采用長短期記憶人工神經網絡獲得的第一文字抽象表征數據進行自學習,同時再采用細胞式類神經網絡獲得的更抽象的文字抽象表征數據進行進一步的自學習,通過雙重的自學習之后,能夠提高整個網絡層的機器自學習能力,也就是說,通過不斷地對系統進行測試之后,整個系統能夠準確地對被測文字的情感進行辨識。
[0030]進一步地,線性層3至少有一層。線性層3的作用在于對獲得的龐大數據進行線性化,從而降低數據維度,從而降低計算復雜度。本實施例中,線性層3至少有一層,線性層3的數量越多可以將數據的維度降得更低,但是越多的線性層3則意味著在對數據進行線性化的過程具有比較大的計算量。
[0031 ]優選地,線性層3有三層,分別為第一線性層,第二線性層和第三線性層;第一線性層,接收文字抽象表征數據,并對文字抽象表征數據進行線性化處理,以獲得第一線性數據;第二線性層,接收第一線性數據,并對第一線性數據進行線性化處理,以獲得第二線性數據;第三線性層,接收第二線性數據,并對第二線性數據進行線性化處理,以獲得線性數據。三個線性層既能夠將數據維度降低到系統需要的維度上,又能夠不因為線性化而增加過多的計算量。
[0032]實施例二
[0033]結合圖1,本實施例提供的文字情感辨識方法,包括:
[0034]步驟S1:文字接收裝置I接收被測文字,并將被測文字轉換為文字向量;
[0035]步驟S2:神經網絡層2對文字向量進行處理,以獲得文字抽象表征數據;
[0036]步驟S3:線性層3對文字抽象表征數據進行線性化,以獲得線性數據;
[0037]步驟S4:情感分析裝置4根據線性數據計算被測文字所對應的情感標簽數據,并通過情感標簽數據對被測文字進行情感辨識。
[0038]本發明實施例提供的文字情感辨識方法,在接收到被測文字之后,先將該被測文字轉換成文字向量,再將該文字向量輸入到神經網絡層2中進行處理以獲得對應于被測文字的文字抽象表征數據,之后再將文字抽象表征數據輸入到線性層3中,通過線性層3對文字抽象表征數據進行線性化以降低文字抽象表征數據的維度,從而獲得線性數據;最后再根據線性數據計算出對應于被測文字的情感標簽數據,并通過該情感標簽數據與預設的情感數據進行匹配,從而實現對被測文字進行情感辨識。
[0039]本發明實施例的文字情感辨識方法,采用神經網絡層2和線性層3對被測文字進行情感辨識,其中,神經網絡層2使用神經網絡算法對文字向量進行處理,獲得可有助于進行機器自學習的文字抽象表征數據;線性層3則是對文字抽象表征數據進行線性化處理,以降低數據維度,從而降低計算復雜度。在神經網絡層2和線性層3的共同作用下,本發明實施例的文字情感辨識方法,利用神經網絡算法的自學習功能,無論被測文字中是否包含有情感關鍵詞,都可以對被測文字進行情感辨識。
[0040]優選地,神經網絡層2包括依次連接的第一層神經網絡和第二層神經網絡;第一層神經網絡,接收文字向量,并對文字向量進行抽象表征,以獲得第一文字抽象表征數據;第二層神經網絡,接收第一文字抽象表征數據,并對第一文字抽象表征數據進行進一步抽象表征,以獲得文字抽象表征數據。
[0041 ] 進一步優選地,第一層神經網絡為長短期記憶人工神經網絡(Long-Short TermMemory ,LSTM);第二層神經網絡為細胞式類神經網絡(Cellular neural network,CNN)。長短期記憶人工神經網絡是機器學習架構的一種,其作用在于,將文字向量轉換成抽象的表征;細胞式類神經網絡也是屬于機器學習架構的一種,其作用在于,將通過長短期記憶人工神經網絡所獲得的抽象的表征再更進一步地轉換成更抽象的表征。本實施采用第一層神經網絡和第二層神經網絡共同作用,能夠更加準確地對被測文字的情感進行辨識。
[0042]優選地,采用文字抽象表征數據進行自學習。本實施例在對被測文字的情感進行辨識的同時,也是在進行自學習,本實施例采用長短期記憶人工神經網絡獲得的第一文字抽象表征數據進行自學習,同時再采用細胞式類神經網絡獲得的更抽象的文字抽象表征數據進行進一步的自學習,通過雙重的自學習之后,能夠提高整個網絡層的機器自學習能力,也就是說,通過不斷地進行測試之后,本實施例的方法能夠準確地對被測文字的情感進行辨識。
[0043]進一步地,線性層3至少有一層。線性層3的作用在于對獲得的龐大數據進行線性化,從而降低數據維度,從而降低計算復雜度。本實施例中,線性層3至少有一層,線性層3的數量越多可以將數據的維度降得更低,但是越多的線性層3則意味著在對數據進行線性化的過程具有比較大的計算量。
[0044]優選地,線性層3有三層,分別為第一線性層,第二線性層和第三線性層;第一線性層,接收文字抽象表征數據,并對文字抽象表征數據進行線性化處理,以獲得第一線性數據;第二線性層,接收第一線性數據,并對第一線性數據進行線性化處理,以獲得第二線性數據;第三線性層,接收第二線性數據,并對第二線性數據進行線性化處理,以獲得線性數據。三個線性層既能夠將數據維度降低到需要的維度上,又能夠不因為線性化而增加過多的計算量。
[0045]盡管本發明已進行了一定程度的描述,明顯地,在不脫離本發明的精神和范圍的條件下,可進行各個條件的適當變化。可以理解,本發明不限于所述實施方案,而歸于權利要求的范圍,其包括所述每個因素的等同替換。
【主權項】
1.一種文字情感辨識系統,其特征在于,包括: 文字接收裝置:用于接收被測文字,并將所述被測文字轉換為文字向量; 神經網絡層:用于對所述文字向量進行處理,以獲得文字抽象表征數據; 線性層:用于對所述文字抽象表征數據進行線性化,以獲得線性數據; 情感分析裝置:用于根據所述線性數據計算所述被測文字所對應的情感標簽數據,并通過所述情感標簽數據對所述被測文字進行情感辨識。2.根據權利要求1所述的文字情感辨識系統,其特征在于,所述神經網絡層包括依次連接的第一層神經網絡和第二層神經網絡; 所述第一層神經網絡,接收所述文字向量,并對所述文字向量進行抽象表征,以獲得第一文字抽象表征數據; 所述第二層神經網絡,接收所述第一文字抽象表征數據,并對所述第一文字抽象表征數據進行進一步抽象表征,以獲得所述文字抽象表征數據。3.根據權利要求2所述的文字情感辨識系統,其特征在于, 所述第一層神經網絡為長短期記憶人工神經網絡; 所述第二層神經網絡為細胞式類神經網絡。4.根據權利要求1所述的文字情感辨識系統,其特征在于,所述系統采用所述文字抽象表征數據進行自學習。5.根據權利要求1所述的文字情感辨識系統,其特征在于,所述線性層至少有一層。6.根據權利要求5所述的文字情感辨識系統,其特征在于,所述線性層有三層,分別為第一線性層,第二線性層和第三線性層; 所述第一線性層,接收所述文字抽象表征數據,并對所述文字抽象表征數據進行線性化處理,以獲得第一線性數據; 所述第二線性層,接收所述第一線性數據,并對所述第一線性數據進行線性化處理,以獲得第二線性數據; 所述第三線性層,接收所述第二線性數據,并對所述第二線性數據進行線性化處理,以獲得所述線性數據。7.一種文字情感辨識方法,其特征在于,包括: 步驟S1:文字接收裝置接收被測文字,并將所述被測文字轉換為文字向量; 步驟S2:神經網絡層對所述文字向量進行處理,以獲得文字抽象表征數據; 步驟S3:線性層對所述文字抽象表征數據進行線性化,以獲得線性數據; 步驟S4:情感分析裝置根據所述線性數據計算所述被測文字所對應的情感標簽數據,并通過所述情感標簽數據對所述被測文字進行情感辨識。8.根據權利要求7所述的文字情感辨識方法,其特征在于,所述神經網絡層包括依次連接的第一層神經網絡和第二層神經網絡; 所述第一層神經網絡,接收所述文字向量,并對所述文字向量進行抽象表征,以獲得第一文字抽象表征數據; 所述第二層神經網絡,接收所述第一文字抽象表征數據,并對所述第一文字抽象表征數據進行進一步抽象表征,以獲得所述文字抽象表征數據。9.根據權利要求8所述的文字情感辨識系統,其特征在于,所述第一層神經網絡為長短期記憶人工神經網絡;所述第二層神經網絡為細胞式類神經網絡。
【文檔編號】G06F17/27GK106095746SQ201610382003
【公開日】2016年11月9日
【申請日】2016年6月1日 公開號201610382003.5, CN 106095746 A, CN 106095746A, CN 201610382003, CN-A-106095746, CN106095746 A, CN106095746A, CN201610382003, CN201610382003.5
【發明人】謝維容
【申請人】竹間智能科技(上海)有限公司