本發明屬于文字圖像處理,具體涉及一種書家風格的書法漢字生成方法及系統。
背景技術:
1、書法藝術是獨屬于中國漢字的藝術形式,源遠流長,但對于一些書法漢字,由于年代太過久遠,在歲月的侵蝕下都出現了或多或少的破損,為了使承載了民族和國家的文化傳統的書法文字得以傳承,同時讓學習者能夠臨摹歷代優秀作品來提高書法技藝,大量研究者都嘗試生成具有書家風格的書法漢字。
2、書法漢字生成也是圖像生成的一種,因此可以著重參考圖像生成領域的相關方法。目前,關于圖像生成的方法,可分為傳統方法和基于深度學習的方法。傳統的方法主要包括借鑒圖像修復融合的方法、基于手工設計特征的方法等。由于深度學習技術能夠更有效地捕獲和表達復雜的數據,基于深度學習的圖像生成模型逐漸興起。基于深度學習的方法主要有自回歸模型(autoregressive?model,ar)、變分自編碼器模型(variationalautoencoder,vae)、基于生成對抗網絡(generative?adversarial?network,gan)的生成模型等。
3、和傳統方法相比,使用基于深度學習的方法來生成具有書家風格的書法漢字,能生成更復雜多變的書法漢字圖像,但仍然存在生成圖像質量不高、細節處模糊、丟失細筆畫特征或者牽絲連帶特征、小樣本數據集很難學習到對應的書家風格而導致具有書家風格書法漢字圖像的生成質量不佳的問題。
技術實現思路
1、基于此,本技術提出一種書家風格的書法漢字生成方法及系統,旨在能夠解決由于存在生成圖像質量不高、細節處模糊、丟失細筆畫特征或者牽絲連帶特征、小樣本數據集很難學習到對應的書家風格而導致具有書家風格書法漢字圖像的生成質量不佳的問題。
2、本技術的第一方面提供了一種書家風格的書法漢字生成方法,所述書法漢字生成方法包括:
3、收集初始書法漢字圖像,對所述初始書法漢字圖像進行預處理,生成書法漢字圖像,獲取與所述書法漢字圖像對應的標準漢字圖像,將所述書法漢字圖像和所述標準漢字圖像組成多組配對數據,根據所述多組配對數據形成配對數據集;
4、構建基于生成對抗網絡的書家風格書法漢字生成模型,其中包括:在生成器中設置全局生成網絡g1,所述全局生成網絡g1包括編碼器和解碼器,在所述編碼器前添加特征提取網絡,在所述解碼器中引入條件注意力機制,通過所述生成器將輸入的標準漢字圖像生成偽書家風格書法漢字圖像;設計多尺度判別器用于接收所述標準漢字圖像、所述書家風格書法漢字圖像和所述偽書家風格書法漢字圖像,以區分所述書家風格書法漢字圖像和所述偽書家風格書法漢字圖像;
5、構建所述書家風格書法漢字生成模型訓練的總體損失函數,所述總體損失函數包括對抗損失函數、多尺度損失函數、類別損失函數和特征損失函數;
6、根據所述總體損失函數,使用所述配對數據集對所述書家風格書法漢字生成模型進行迭代優化,得到優化后的書家風格書法漢字生成模型;
7、確定需要生成的書法漢字和特定的書家風格,獲得與所述需要生成的書法漢字對應的特定的標準漢字圖像,將所述特定的標準漢字圖像輸入所述優化后的書家風格書法漢字生成模型中,得到特定的書法風格書法漢字。
8、與現有技術相比,本技術提供的一種書家風格的書法漢字生成方法,該書法漢字生成方法通過收集初始書法漢字圖像、預處理和組成多組配對數據,形成了一個包含書法漢字圖像和標準漢字圖像的配對數據集,這為后續的模型訓練提供了豐富的樣本數據,有助于模型學習書法漢字的特征和風格;構建了基于生成對抗網絡的書家風格書法漢字生成模型,包括全局生成網絡g1、多尺度判別器等,全局生成網絡g1中的特征提取網絡和條件注意力機制有助于生成更具書家風格的偽書家風格書法漢字圖像,多尺度判別器能夠在不同尺度上更好地判斷區分真實的書家風格書法漢字圖像和由生成器生成的偽書家風格書法漢字圖像,提高了模型的判別能力;構建了書家風格書法漢字生成模型訓練的總體損失函數,包括對抗損失函數、多尺度損失函數、類別損失函數和特征損失函數,這些損失函數的綜合應用,促使模型在生成書法漢字時,不僅要在外觀上接近書家風格,還要在語義上與標準漢字相符合,同時保證生成的圖像具有多尺度的特征和多樣性;使用配對數據集對書家風格書法漢字生成模型進行迭代優化,得到優化后的模型,通過不斷調整模型的參數,使其在生成書法漢字時更加逼近書家風格,提高了生成的準確性和質量;根據需要生成的書法漢字和特定的書家風格,獲得特定的標準漢字圖像,并輸入優化后的模型中,得到特定的書法風格書法漢字,這一過程實現了根據用戶需求生成具有特定書家風格的書法漢字的功能,滿足了用戶對個性化書法作品的需求。
9、主要地,基于生成對抗網絡的書家風格書法漢字生成方法,是通過改進圖像生成領域中的生成對抗網絡模型來進行書法漢字生成的一種方法。本方法通過在生成器中的編碼器前添加一個預訓練好的特征提取網絡來解決小樣本數據集很難學習的問題;通過使用生成器和判別器的多尺度架構來解決生成圖像質量不高、細節丟失等問題;通過提出的一種多尺度判別器損失函數來增強訓練的穩定性;通過引入條件注意力模塊使得模型更好地捕捉和復制字體的細節特征、增強模型的泛化能力。該方法在書家風格書法漢字的生成上表現優秀。
10、作為第一方面的一種可選實施方式,所述收集初始書法漢字圖像,對所述初始書法漢字圖像進行預處理,生成書法漢字圖像的步驟包括:
11、采用圖像處理技術對收集到的初始書法漢字圖像進行圖片裁剪和單字分割,以提取出單字圖像;
12、對所述單字圖像進行背景去除處理以保留字跡,對所述背景去除處理后的單字圖像通過二值化處理以轉換為黑白色的單字圖像;
13、利用字體制作軟件將所述黑白色的單字圖像轉換為對應的ttf字體格式,生成書法漢字圖像。
14、作為第一方面的一種可選實施方式,將所述書法漢字圖像和所述標準漢字圖像組成多組配對數據,根據所述多組配對數據形成配對數據集的步驟包括:
15、用代表標準漢字圖像,用代表書法漢字圖像,用代表每組配對數據,其中,,且和表示為同一個漢字。
16、作為第一方面的一種可選實施方式,通過所述生成器將輸入的標準漢字圖像生成偽書家風格書法漢字圖像的步驟包括:
17、所述生成器包括全局生成網絡g1和局部增強網絡g2,通過所述全局生成網絡g1生成所述標準漢字圖像的字體框架,通過所述局部增強網絡g2提取所述標準漢字圖像的字體特征;
18、將所述字體框架和所述字體特征進行特征融合,生成字體融合,將所述字體融合輸入所述局部增強網絡g2,生成偽書家風格書法漢字圖像。
19、作為第一方面的一種可選實施方式,所述全局生成網絡g1包括特征提取網絡vgg-19、編碼器、引入條件注意力機制的解碼器和判別器,
20、通過所述特征提取網絡vgg-19提取輸入的標準漢字圖像的特征,通過所述編碼器將提取輸入的標準漢字圖像的特征轉換為特征圖,通過所述引入條件注意力機制的解碼器從所述特征圖中提取圖像的細節特征,通過所述判別器判別所述細節特征對應的字體框架。
21、作為第一方面的一種可選實施方式,所述設計多尺度判別器的步驟包括:
22、設計多尺度判別器d1、d2和d3,將所述d1、所述d2和所述d3設置為相同的結構,以及將所述d1、所述d2和所述d3分別設置為處理大、中、小尺寸的圖像,判別器d1用于關注圖像的細節特征,判別器d3用于關注圖像的整體特征。
23、作為第一方面的一種可選實施方式,所述總體損失函數為:
24、,
25、其中l表示總體損失函數,代表生成器,代表判別器,表示對抗損失函數,表示多尺度損失函數,表示類別損失函數,表示特征損失函數,λ1、λ2和?λ3分別為多尺度損失函數、類別損失函數和特征損失函數的相對權重。
26、本技術實施例的第二方面提供了一種書家風格的書法漢字生成系統,所述書法漢字生成系統包括:
27、獲取數據模塊,用于收集初始書法漢字圖像,對所述初始書法漢字圖像進行預處理,生成書法漢字圖像,獲取與所述書法漢字圖像對應的標準漢字圖像,將所述書法漢字圖像和所述標準漢字圖像組成多組配對數據,根據所述多組配對數據形成配對數據集;
28、構建模型模塊,用于構建基于生成對抗網絡的書家風格書法漢字生成模型,其中包括:在生成器中設置全局生成網絡g1,所述全局生成網絡g1包括編碼器和解碼器,在所述編碼器前添加特征提取網絡,在所述解碼器中引入條件注意力機制,通過所述生成器將輸入的標準漢字圖像生成偽書家風格書法漢字圖像;設計多尺度判別器用于接收所述標準漢字圖像、所述書家風格書法漢字圖像和所述偽書家風格書法漢字圖像,以區分所述書家風格書法漢字圖像和所述偽書家風格書法漢字圖像;
29、構建損失函數模塊,用于構建所述書家風格書法漢字生成模型訓練的總體損失函數,所述總體損失函數包括對抗損失函數、多尺度損失函數、類別損失函數和特征損失函數;
30、模型訓練模塊,用于根據所述總體損失函數,使用所述配對數據集對所述書家風格書法漢字生成模型進行迭代優化,得到優化后的書家風格書法漢字生成模型;
31、數據生成模塊,用于確定需要生成的書法漢字和特定的書家風格,獲得與所述需要生成的書法漢字對應的特定的標準漢字圖像,將所述特定的標準漢字圖像輸入所述優化后的書家風格書法漢字生成模型中,得到特定的書法風格書法漢字。
32、本技術實施例的第三方面提供了一種計算機設備,所述計算機設備包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的處理程序,所述處理程序被所述處理器執行時實現上述一種書家風格的書法漢字生成方法。
33、本技術實施例的第四方面提供了一種存儲介質,所述存儲介質上存儲有處理程序,所述處理程序被處理器運行時執行上述一種書家風格的書法漢字生成方法。
34、本技術的附加方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本技術的實施例了解到。