技術(shù)特征:1.一種基于檢測和拼音聯(lián)合增強的中文語法糾錯方法,其特征在于:所述方法的具體步驟包括如下:
2.根據(jù)權(quán)利要求1基于檢測和拼音聯(lián)合增強的中文語法糾錯方法,其特征在于:所述step1的具體步驟包括如下:
3.根據(jù)權(quán)利要求1基于檢測和拼音聯(lián)合增強的中文語法糾錯方法,其特征在于:所述step2的具體步驟包括如下:
4.根據(jù)權(quán)利要求1基于檢測和拼音聯(lián)合增強的中文語法糾錯方法,其特征在于:所述step3的具體步驟如下:
5.根據(jù)權(quán)利要求1基于檢測和拼音聯(lián)合增強的中文語法糾錯方法,其特征在于:所述step4的具體步驟如下:
6.根據(jù)權(quán)利要求4基于檢測和拼音聯(lián)合增強的中文語法糾錯方法,其特征在于:所述step5的具體步驟包括如下:
技術(shù)總結(jié)本發(fā)明涉及一種基于檢測和拼音聯(lián)合增強的中文語法糾錯方法,屬于自然語言處理技術(shù)領(lǐng)域。本發(fā)明首先利用原始一種預(yù)訓(xùn)練語言模型BART模型構(gòu)建了一個端到端的語法糾錯基礎(chǔ)模型,該模型能夠利用BART模型強大的語言表征能力來提升糾錯性能。接著在BART模型的編碼階段結(jié)束后,增加了一個錯誤檢測層,此檢測層旨在通過精確地識別錯誤來減輕模型過度校正的問題。同時本發(fā)明使用私有拼音編碼器來學(xué)習(xí)字符的拼音信息表示,并將這一表示與文本信息表示通過交叉注意力機制相結(jié)合,進(jìn)而獲得融合了拼音信息的文本表示。最后,采用自適應(yīng)性門控機制來過濾掉拼音信息中的有害成分,確保最終得到的文本信息表示的準(zhǔn)確性和可靠性。
技術(shù)研發(fā)人員:李英,朱世昌,余正濤,高盛祥
受保護(hù)的技術(shù)使用者:昆明理工大學(xué)
技術(shù)研發(fā)日:技術(shù)公布日:2024/12/30