基于模板自動生成新聞的系統和方法
【專利摘要】基于模板自動生成新聞的系統和方法,新聞事件日志庫、新聞文章模板庫、規則庫組成該系統的數據庫,新聞事件日志庫通過選定事件日志與統計數據生成器連接,統計數據生成器分別與模板選擇器、自然語言生成進行交互,自然語言生成與年報生成模塊進行交互,統計數據生成器與模板選擇器相交互,新聞文章模板庫、模板選擇器與年報生成模塊相連接,年報生成模塊與數據庫進行連接。其實現方法的具體步驟闡述如下,建立年報日志庫:建立模板庫:建立規則庫、選擇模板、建立統計數據庫、自然語言生成、年報生成;與現有技術相比,在新聞寫作行業減輕了雙手的勞動量,同時也提高了新聞報道的效率,為新聞發展提供了里程碑性的改革。
【專利說明】
基于模板自動生成新聞的系統和方法
技術領域
[0001]本發明涉及數據挖掘、數據分析、機器學習和自然語言生成領域,設計并實現了一種基于模板自動生成新聞的系統和方法。
【背景技術】
[0002]近年來,人們對財金年報的關注日益增漲,但是隨著公司業務的不同,關注者者數目也有很大的不同。例如:一個世界級的公司,如google,有百萬的關注者(通過電視,廣播,報紙和網絡等關注運營情況),但一個地區性的企業,關注者可能就只有成百人。
[0003]隨著經濟的發展,生活的進步,人類對企業的關注越來越多,對企業的了解需求也也來越大,所以市場也愿意投入更大的財力去收集、組織傳播年報的數據和報道年報。由于觀眾群龐大,喜好不同,若基于觀眾群傳播信息,收集和傳播年報信息是一個巨大的工程。
[0004]許多公司嘗試依賴本公司的某個部門人員去縮減收集和報道年報信息的開支。在通常情況下,公司相關員工會根據相關需求做一些統計,記錄,書寫年報,并發布。這樣的一個流程,相對不需要投入太多財力,卻很難提供令人滿意的結果。一方面,公司員工通常是按照部門的規定書寫年報,相對來說給出的是一個官方的書面報告,不能保證報告一系列完整的、詳細的數據信息;另一方面提供和傳播的年報信息往往很單一,關注者不能更好的進行統計分析出更有價值的結果;最后,在打印發布關于年報信息期刊時,因為財力,時間的耗費,對年報報道是不頻繁,不及時的。
[0005]網絡時代的來臨開拓了一個新的途徑,給特定的用戶提供了一種廉價的,即時接受信息的途徑。例如http://www.huagu.com/網站是一個財經網站對企業年報進行報道的系統。該網站為興趣愛好者提供國內企業年報的信息。該網站上面的信息僅來源于志愿者的上傳,需要志愿者將年報的信息提交給網站管理員,由網站管理員發布。當信息還沒有提交給管理員或是管理員沒有發布時,在網站上是不可獲取的。此外,有些年報的統計數據也是不可獲取的,因為沒有相關企業信息的詳細的描寫或演講信息。對于這類信息,感興趣的觀眾群必須依賴如當地的電視,報紙等傳統媒體報告。然而傳統媒體也只會抽出一些閑事時間報道年報或是介紹公司情況。
[0006]因此,對于企業(或是有小的觀眾群、需要分析統計數據進行報告的企業)的收集、分析,即時的、廉價的向觀眾發布報告成為一個必須滿足的需求。這個系統不僅可以向觀眾提供一個統計報告,同時可以向觀眾提供一個對企業進行詳細說明的報告,同時保證報告具有信息量和娛樂性。
[0007]總的來說,本發明提供了一個基于模板自動生成年報事件的系統。系統包括一個年報記錄的日志庫,根據日志生成統計數據的方法,一個數據庫和多樣化的模板庫,每個模板至少包含一個特有的規則。進一步來說,該系統包含根據統計信息的一個規則判別候選模板是否匹配年報的方法;從候選模板中選擇一個模板的方法以及使用選定的模板自動生成一個完整的年報報道并記錄企業的方法。
[0008]換一種說法,本發明提供了一個基于模板自動生成年報的描述報告的方法。方法包括在年報日志中按照預定格式生成年報記錄,根據年報記錄生成統計信息,根據統計信息匹配多個模板的多個規則并從中選擇至少一個模板;事實上,不止一個模板滿足條件,所以該方法包括從候選模板中選出最可能的一個,并根據預選擇的數據,在選定的模板中插入統計數據信息和事件記錄,生成一個年報報告并發布出去。
【發明內容】
[0009]本發明的目的是提出一個基于模板自動生成年報系統的方法,以達到較高的年報發布效率,提高年報發布的準確率與更新率。
[0010]為實現上述目的,本發明采用的技術方案為一種基于模板自動生成年報的系統,該系統包括新聞事件日志庫、新聞文章模板庫、規則庫、統計數據生成器、模板選擇器、自然語言生成、年報生成模塊;
[0011 ]新聞事件日志庫、新聞文章模板庫、規則庫組成該系統的數據庫,新聞事件日志庫通過選定事件日志與統計數據生成器連接,統計數據生成器分別與模板選擇器、自然語言生成進行交互,自然語言生成與年報生成模塊進行交互,統計數據生成器與模板選擇器相交互,新聞文章模板庫、模板選擇器與年報生成模塊相連接,年報生成模塊與數據庫進行連接。
[0012]基于上述系統,具體步驟闡述如下:
[0013](I)建立年報日志庫:當爬蟲抓取到新的年報信息時,建立年報日志庫。年報日志庫是指年報的記錄,所屬年報的記錄為公司、營業收入、凈利潤、每股收益信息。即對數據進行一個簡單的清洗整理,按照相應格式存儲在數據庫中。
[0014](2)建立模板庫:差異化處理各領域的新聞報告內容版式;年報和體育新聞,在內容表達和版面排列方面大不相同,經過專家討論進行領域的劃分,在模板庫中會建立很多對應不同領域的模板,同一領域亦建立多個模板,以保證新聞報道的新穎性和靈活可創造性。將建立的模板與專家進行討論,進行不斷地修改、訂正,以保證可以覆蓋領域信息的各個范圍,從而更好地表達信息。建立模板的過程中要根據不同的應用建立不同標準的模板,以滿足不同情況的應用。
[0015](3)建立規則庫:在建立模板的過程中,與領域專業討論模板中信息內容插入的規貝1J,以便區別于不同的模板同時準確的匹配信息,生成準確的對應文本。規則對應于每個模板,同時為了保證在選擇模板的過程中,保證模板的唯一性,為不同模板建立的規則設置權值,依據規則所攜帶的信息的重要性設置權重值。計算環比增長率,是一個比較重要的信息,在設置插入環比增長率的規則時,賦予較大的權重值。
[0016](4)選擇模板:使用模板選擇器根據以下步驟選擇匹配數據信息的模板,并且根據年報數據生成年報報告。第一步根據年報日志記錄和模板自身關聯的規則進行過濾選擇,得到至少一個候選模板;第二步,根據統計信息數據對候選模板進行二次篩選并進行權值計算,計算出權值最大的模板作為最后選擇使用的模板。
[0017](5)建立統計數據庫:統計數據庫是指根據日志數據庫分析數據得到一個統計結果,或是分析結果。如通過比較兩年中同一個月的營業額得出同比增長率;通過分析一年中相鄰兩個月的營業額,計算出環比增長率。統計數據庫的信息是經過進一步挖掘的信息,是通過分析獲取更加有用、新鮮的信息。
[0018](6)自然語言生成:經過模板選擇后,確定候選模板及需要表達的信息,通過自然語言生成將需要表達的信息表達出來。此系統中自然語言生成基于模板生成模式生成信息。
[0019](7)年報生成:將自然語言生成的信息插入到候選的模板中生成年報,保存到數據庫中。
[0020]本發明與現有技術相比,是一個技術上的飛躍,在新聞寫作行業,雖然不能幫助人們徹底的解放雙手,但在一定程度上,減輕了雙手的勞動量,同時也提高了新聞報道的效率,為新聞發展提供了里程碑性的改革。
【附圖說明】
[0021]圖1為基于模板自動生成年報的系統集成圖;
[0022]圖2為基于模板自動生成年報的系統模塊圖;
[0023]圖3a為基于模板自動生成年報的年報的日志庫圖;
[0024]圖3b為基于模板自動生成年報的年報日志結構圖;
[0025]圖4為基于模板自動生成年報的年報的模板結構圖;
[0026]圖5為基于模板自動生成年報的年報生成流程圖。
【具體實施方式】
[0027]以下選擇幾個多樣化的樣例進行詳細的描述來對本發明加以說明。本發明提出了很多可以應用在廣泛多樣化內容中的發明性概念。以下具體事例只是純粹說明使用本發明的具體方法,不限制本發明的使用范圍。
[0028]請參閱圖表所示,為基于模板自動生成新聞的系統和方法的流程圖。
[0029]參考圖1,集成系統通過使用塊狀圖來介紹一個簡單實例呈現本發明。集成年報信息系統通常可以用10來表明。集成年報信息系統包括web接口 12、數據庫管理14、年報記錄
11、發行商20、年報生成器18五個組件。簡單來說,一份年報可以作為一個年報新聞進行報道,但是一個單獨的總收入則作為一個事件來處理,以騰訊2015年第一季度年報為例。騰訊控股2015年第一季度業績作為一個年報進行報道,而在年報中出現的總收入、經營盈利、期內盈利等等作為一個事件。事實上,我們通常把年報作為一個年報事件處理,因為本發明不僅僅應用在財金中,還應用在多個領域中,所以在年報中的具體記錄都會作為一個簡單的事件處理。
[0030]集成年報信息系統10通過接口與多個實體相連從而保證信息的輸入和輸出。例如:一個爬蟲抓取3獲取具體公司季度業績的數據信息,然后通過年報記錄11把這些信息存儲入集成系統10 Jeb接口 12提供了2個接口包括證監會2接口和公司I接口,使證監會2和公司I可以進入系統10.例如:證監會可以向系統輸入信息:公司、年度季度,期貨清算。這些信息被系統10保存并傳播給公司I;公司可以查詢所在公司的年報,可以使用接口 12查詢與他相關的信息如盈利信息;證監會2可以通過這些信息來監管公司。此外系統10是新聞出版商7和編輯5進行消息交流的接口,在下面的章節會更詳細的介紹系統10怎么向關注者提供即時有效、廉價的新聞。
[0031]年報生成器18生成具有娛樂性和記敘性的報道。雖說本發明首先應用體現在年報文章生成中,也可以應用在想要生成敘事報告、摘要、文章集合等類似文本的其他內容事件中。
[0032]年報的關鍵信息一般是爬蟲獲取3使用年報記錄器16記錄傳遞給數據庫管理員14存儲到數據庫58中。報告生成器18拿到存儲的事件信息自動生成報告或文章給證監會2,公司I包括報社、新聞網、子公司、當地媒體(如報紙,廣播,電視)使用。如圖2所示,年報信息通過年報記錄11以事件日志66的格式存儲到數據庫58中。
[0033]圖3a展不了事件日志庫66的信息格式模板。一個事件日志庫66由一個事件日志102列表組成,其中包括各個領域的事件日志列表。圖3表中展示了一個事件日志102的結構:一個方向標識字段104標明記錄的內容方向,一個或多個域106a,106b等記錄關于具體內容的信息。內容方向標識字段104是一個唯一標識符,領域的事件日志庫66都存儲在數據庫58中;域106a,106b等提供用于生成年報報告的單個年報事件相關信息。在實例中,一個年報事件除了內容方向標識符字段還有有四個相關的字段,第一個域描述事件的類型;例如:域106a為年報事件類型,則年報事件中的106a域中記錄的是具體財金中的一個分類(如年報等)。其他的事件類型可以包括股票,理財,宏觀,數據庫等;域106e是目標類型,記錄了事件中的邏輯主體,如公司。域106e中的內容不包含具體公司的名稱,只是標明涉及的邏輯實體類型;域106b是目標域,標明年報中相關的具體公司。域106e和域106b共同描述事件參與的實體。例如,一個財金新聞中,目標類型106e是公司,目標106d中包含的是對應一個具體公司的代碼。例如106a中標明一個股票事件,106e中會標明一個公司,在106b中會標明一個和公司對應的代碼。相關的實體在實際中可能是整個國家,如一個全民GDP等等,那么在106e中會標明是國家,106b中是與國家對應的代碼。域106c是類型,這個字段標明年報事件中的一系列值是否可以直接獲取。如凈利潤是可以直接獲取的,在106c中設置為0,表示值可以直接獲取,106d中放置具體的值。但是有些值是不可以直接獲取的,環比增長率,需要挖掘數據進行分析計算得出,在106c中設置為I,在106d中放置挖掘計算的具體的值。
[0034]本發明使用在年報實例中,也適用在其他的領域中。例如:一個目標類型域可以用來對比兩個公司的年報(如:對比騰訊和新浪2015年第一季度的收入,增長率等),或是一個時間,用來標明事件涉及的兩個主體,如同比增長是一年中3月收入與第二年3月的收入比較。域106d還可以與其他的年報記錄識別域結合起來,與領域標識字段104連接。這樣,當有兩份對同一公司的記錄信息都很價值時,可以將兩份記錄聯系在一起生成事件日志66。領域事件102包含事件日志66,其中領域事件和事件日志中的信息可以基于模板生成一個完整的描述性報告或文章。在很多情況下,可以通過增加歷史信息來加深文章,如添加專題,企業排行等。從歷史財金日志中可以生成統計數據,將年報與過去相關的特別事件結合生成統計數據信息,在查找歷史背景時就可以快速查詢到。
[0035]從模板庫中選擇一個模板,再將從事件日志中生成的具體信息插入到模板中生成年報,在下面詳細介紹一下模板68。每一個模板都是對年報進行的預先定義描寫。更準確的說,一個模板是一個預先寫好的模擬年報報告,中間可以插入一些年報的具體數據。例如一個非常簡單的模板:【時間】【公司名稱】發布了【第幾季度】年報,年收入為【收入額】,同比增長【增長率】,凈利潤【利潤值】。這個模板非常簡單僅用來解釋,在實際中模板會提供更加詳細的信息,會更具有娛樂性和敘述性。這個簡單的例子演示模板是可以通用的,擁有屬性值,其中年報規則信息包括公司名稱,總收入,以用來生成一個實際的新聞報道。字段信息是由令牌生成的,這個會在下面的章節詳細說明。
[0036]圖2展示了一個系統中包含了很多個模板68,每個模板描述了不同類型的年報敘述模型(如運營年報,政府報告,財務報告等),可以通過修改來描述具體的年報。模板選擇器72必須可以快速的選擇一個模板68來準確的描述年報。對不同的年報需要不同的模板,一個運營年報的模板是不適合財金年報的,所以每一個模板都要與它可以描述的年報關聯,模板選擇器只會對那些符合年報類型的模板進行審查。
[0037]在圖4中,將一個模板68劃分為一系列領域,若干個規則域108為了判定模板是否滿足條件從而適合生成報告,在后面的章節后更加詳細的說明怎么用規則域來選擇模板;標題域110是生成文章的標題;作者域112是一個文本區,標明提供該模板的作者名字;文本域114包含使用模板68生成的文章。這個文本域包含文本中的令牌,令牌用來標識要用具體年報信息(公司名稱,總收入,凈利潤等)來替換的位置。
[0038]在下面的章節基于圖5介紹生成年報的過程。這個過程是從爬蟲抓取數據開始的,如圖中120所示,當網絡爬蟲抓取到新的數據時,將數據進行清洗輸入系統中,就開始根據數據選擇模板,生成新聞報道。最終用戶可以是新聞發布者如本地報紙通過發布接口 20請求一個新聞。如圖5所示,一旦抓取到新的年報信息,如120所示,數據經過清洗后進入數據庫58中的事件日志66,如122所示。統計數據生成器使用信息生成一系列年報統計數據(SP對比賽日志中的數據信息進行一個整理加工),如124所示。統計數據是一系列完整的年報統計數據信息,包含可以應用在很多年報中的統計數據,例如總收入,同環增長率,每股利益等,統計數據是根據年報的類型(運營,財金等)生成。在模板插入信息時,這些信息就可以直接插入而不需要參考歷史數據進行處理加工。
[0039]在模板的選擇過程中,會使用到令牌,令牌本質上是一個函數調用,可以從中獲取信息,所以令牌也被認為是一個變量。例如,在一份年報中,同比增長率,定義同比增長率為35%為大增,那么可以表示為“和上一年同期相比較的增長率大于等于35%”,這個條件可以使用令牌:(【本期數】-【同期數】)/【同期數】*100%> = 35%;使用兩個令牌來表示條件,第一個令牌表示本期數,這個令牌是由76自動生成的統計調用函數,用來返回本期數的具體值;第二個令牌表示同期數,令牌調用函數返回同期數的具體值。對返回的兩個期數值做一個簡單的計算,比較結果是否大于等于35%。正如下面所示,在模板中使用令牌來進行數據的匹配,當匹配成功后,選擇模板后,將返回的值、文本字符串插入到適當的位置。年報統計數據生成124后,將第一個模板從數據庫58中檢索出來并載入,如126所示。每個模板自身關聯有一到多個條件規則,比較年報統計數據信息和模板關聯的規則,如128,確認模板是否滿足統計數據信息,如130,若不滿足條件,則丟棄模板,如132所示,否則把模板標記為候選模板,如133所示。在比較的過程中,每個規則的比較都會導致一個“否”和“是”的結果的產生,“否”表示不滿足條件,“是”表示滿足條件。模板庫中有很多的模板滿足條件,如134所示,所以我們會繼續判斷下一個模板,這樣繼續126—134之間的步驟,從而剔除所有不符合數據條件的模板繼續往下篩選。對所有候選模板進行比較,會得到一個小的模板列表。這里面的每一個模板都可以精確的描述比賽。如圖5中的150所示,為了消除歧義,確定一個唯一的模板,給每個模板所關聯規則設置不同的權值,當經過二次審查后,剩余的只有一個模板的話,則直接作為最終模板使用,若是剩余多個模板,計算每個模板的權值,選擇最大權值的模板作為最終模板使用,若是沒有模板滿足數據信息,則選擇默認模板作為最終模板使用。
[0040]例如:一個終端用戶想要一份關于阿里的最近年報,基于美國通用會計準則GAAP,2015財年阿里營收達122.93億美元(約762.04億元),同期實現凈利潤39.23億美元(約243.20億元)。一篇年報若只是給出了公司的總收入和凈利潤是不會滿足用戶的需求的,使用模板可以進行修改使得描述比賽時顯得有趣又準確。一旦抓取到了具體公司的數據信息120,進行清洗并從數據庫58中檢索出相關的事件日志66,通過統計數據生成器生成統計數據124,如同比增長率,環比增長率,凈利潤等。加載模板庫中的模板126與統計數據比較128,若模板滿足統計數據規則,則標記為候選模板133,否則直接丟棄132,基本上是根據統計數據進行篩選,如一個示例:【時間】,【年份】-【企業名稱】在第四季度年報中報道【企業名稱】的營收為【營收額(第四季度)】,較【年份(本年的去年)】增長【增長率】。同期實現凈利潤【凈利潤額】,較【年份(本年的去年)】增長僅【增長率(增長率一般小于等于5%)】,增速明顯放緩。模板附帶的一個規則是增速放緩,則可以據此規則消除一大批模板。
[0041]顯然,在上面的模板中,公司,時間,總營收,凈利潤等都已經知道,另外還要滿足以下幾個條件,用令牌表示:I,企業本年的總營收額比去年的總營收額要多,【企業總營收(本年第四季度)】>【企業總營收(去年)】;2,企業本年的凈利潤額比去年的凈利潤額要多,【企業凈利潤(本年第四季度)】>【企業凈利潤(去年)】;3,企業本年的總營收額的增長率大于等于30%,(【企業營收額(本年)】-【企業營收額(去年)】)/【企業營收額(去年)】*100%>= 30%; 4,企業本年的凈利潤的增長率小于等于5%,(【企業凈利潤(本年)】-【企業凈利潤(去年)】)/【企業凈利潤(去年)】*100%〈 = 5%。每一個令牌可以調用一個文本字符串,如【時間】,【增長率】等。使用令牌具有很大靈活性,可以為簡單的模板修改更多的細節。
[0042]針對模板的設計上,有的模板所帶規則很具體,如企業本年的凈利潤必須比去年的凈利潤多。這種具體的條件使得模板可以描述更多的細節,也會導致模板的限制使用,因為每一個模板依賴于每一個不同的規則,為了更好的描述年報,需要盡可能多的為模板設置不同的規則,需要一個龐大的模板庫,在年報生成的過程中就會導致一定的系統響應延遲。
[0043]對于在經過篩選過后保留下來的候選模板,必須計算模板各自的權重和,如由用戶反饋,評價某個模板很好用,很有趣等,可以為該模板加一個額外的權值;用戶指定作者提供的模板候選,添加一個更大的權值等,這樣在計算候選模板后會出現一個數字排序,選擇最好的模板即可。
[0044]—旦模板選定,將會自動生成向用戶呈現的年報。在年報的生成過程中,從標題字段110,作者112,文本域114都要進行審查,若發現其中含有令牌,則調用適當的函數,將返回的相關參數插入到適應的位置上,并從文本中刪除標記,留下一個完整的年報。
[0045 ]在自動生成的文本中可以添加一些超鏈接,使用超文本傳輸協議(HTTP)提供快速訪問年報本身的某部分,包括在其他年報中的引用。一些年報中可能會包含一些音視頻,如發布會開場等,可以將這些日志存儲到事件日志66中,設置一個超鏈接,用戶可以點擊超鏈接查看音視頻。
[0046]在本發明中,自動生成的年報可能被存儲到數據庫58或一些其他的存儲設備或介質上,但并不是存儲所有生成的文章。對于一些重要年報可以選擇存儲或是根據用戶請求的次數進行有選擇的存儲年報。
【主權項】
1.基于模板自動生成新聞的系統,其特征在于:該系統包括新聞事件日志庫、新聞文章模板庫、規則庫、統計數據生成器、模板選擇器、自然語言生成、年報生成模塊; 新聞事件日志庫、新聞文章模板庫、規則庫組成該系統的數據庫,新聞事件日志庫通過選定事件日志與統計數據生成器連接,統計數據生成器分別與模板選擇器、自然語言生成進行交互,自然語言生成與年報生成模塊進行交互,統計數據生成器與模板選擇器相交互,新聞文章模板庫、模板選擇器與年報生成模塊相連接,年報生成模塊與數據庫進行連接。2.利用權利要求1所述系統進行的基于模板自動生成新聞的方法,其特征在于:該方法具體步驟闡述如下, (1)建立年報日志庫:當爬蟲抓取到新的年報信息時,建立年報日志庫;年報日志庫是指年報的記錄,所屬年報的記錄為公司、營業收入、凈利潤、每股收益信息;即對數據進行一個簡單的清洗整理,按照相應格式存儲在數據庫中; (2)建立模板庫:差異化處理各領域的新聞報告內容版式;年報和體育新聞,在內容表達和版面排列方面大不相同,經過專家討論進行領域的劃分,在模板庫中會建立很多對應不同領域的模板,同一領域亦建立多個模板,以保證新聞報道的新穎性和靈活可創造性;將建立的模板與專家進行討論,進行不斷地修改、訂正,以保證可以覆蓋領域信息的各個范圍,從而更好地表達信息;建立模板的過程中要根據不同的應用建立不同標準的模板,以滿足不同情況的應用; (3)建立規則庫:在建立模板的過程中,與領域專業討論模板中信息內容插入的規則,以便區別于不同的模板同時準確的匹配信息,生成準確的對應文本;規則對應于每個模板,同時為了保證在選擇模板的過程中,保證模板的唯一性,為不同模板建立的規則設置權值,依據規則所攜帶的信息的重要性設置權重值;計算環比增長率,是一個比較重要的信息,在設置插入環比增長率的規則時,賦予較大的權重值; (4)選擇模板:使用模板選擇器根據以下步驟選擇匹配數據信息的模板,并且根據年報數據生成年報報告;第一步根據年報日志記錄和模板自身關聯的規則進行過濾選擇,得到至少一個候選模板;第二步,根據統計信息數據對候選模板進行二次篩選并進行權值計算,計算出權值最大的模板作為最后選擇使用的模板; (5)建立統計數據庫:統計數據庫是指根據日志數據庫分析數據得到一個統計結果,或是分析結果;如通過比較兩年中同一個月的營業額得出同比增長率;通過分析一年中相鄰兩個月的營業額,計算出環比增長率;統計數據庫的信息是經過進一步挖掘的信息,是通過分析獲取更加有用、新鮮的信息; (6)自然語言生成:經過模板選擇后,確定候選模板及需要表達的信息,通過自然語言生成將需要表達的信息表達出來;此系統中自然語言生成基于模板生成模式生成信息; (7)年報生成:將自然語言生成的信息插入到候選的模板中生成年報,保存到數據庫中。
【文檔編號】G06F17/30GK106021389SQ201610312962
【公開日】2016年10月12日
【申請日】2016年5月12日
【發明人】呂銳, 曹學會, 龔雋鵬, 陳明祥, 熊立波, 鐘盈炯, 林波, 劉愛民, 儲達峰, 范瑛, 丁望, 瞿弋微, 王熠, 邢承磊, 石超, 張弛
【申請人】新華通訊社, 中國傳媒大學