一種基于深度學習技術的廣播電視輿情分析方法及系統的制作方法
【專利摘要】本發明公開了一種基于深度學習技術的廣播電視輿情分析方法及系統。本發明包括基于深度學技術的對輿情信息數據的提取鑒別過程:首先通過對大量的素材數據(包括圖像、視頻、語音和OCR光學字符)進行多次反復的學習和訓練生成數據模型,同時結合計算機視覺技術(局部特征抓取與匹配)生成圖像特征庫。從有線數字電視、有線廣播電視、衛星電視、無線廣播電視等傳播媒體中獲取待監測數據(包括音頻、視頻、圖片)作為深度學習數據模型的輸入,利用建立的數據模型對待監測數據進行識別。同時,結合計算機視覺技術將大量的素材數據形成特征指紋庫,待監測數據的特征值與特征指紋庫中的數據進行對比,若對比成功,則認為待監測數據中含有輿情信息。
【專利說明】
一種基于深度學習技術的廣播電視輿情分析方法及系統
技術領域
[0001]本發明涉及輿情監測領域,尤其涉及一種基于深度學習技術的廣播電視輿情分析方法及系統。
【背景技術】
[0002]隨著網絡技術的迅速發展,廣播電視傳輸手段多樣化,廣播電視已經形成了無線播出、衛星覆蓋、有線傳輸、網絡連通并舉,全國上下貫通的傳輸、覆蓋網。對于廣播電視的監管工作越來越受到國家有關部門的重視。傳統的廣播電視監管主要局限于信號質量監測和播放內容對比校驗,由于沒有實現監管全自動化,人工工作量較大。隨著信息技術的發展以及對監管工作的深入,除了傳統的監測廣播電視播出質量、節目效果、覆蓋情況外,對于節目內容的監管也變得尤為重要。一種基于深度學習的廣播電視輿情分析方法通過對廣播電視內容的提取,實現敏感信息的輿情分析,提高客戶對電視新聞媒體的輿情反應效率,并在出現重大負面輿情事件的情況下進行及時提示。該方法不僅能夠有效減少廣播電視相關人力投入,而且能夠為廣播電視節目內容安全監管提供高效的技術支持。
【發明內容】
[0003]本發明的目的在于克服現有技術的不足,提供一種基于深度學習技術的廣播電視輿情分析方法及系統,對廣播電視節目中的視頻、圖像、語音和文字信息進行自動化識別,提高客戶對電視新聞節目中特殊場景、企業圖標、特定地標、物體、敏感人物等內容的識別能力,將與客戶相關的電視節目進行自動識別分析、搜索查詢、統計分類,并在出現重大負面輿情事件的情況下進行及時提示,方便的對相關新聞進行調閱查看,以便采取對應措施。
[0004]本發明的目的是通過以下技術方案來實現的:一種基于深度學習技術的廣播電視輿情分析方法,它包括深度學習分析步驟和視覺技術分析步驟;
所述的深度學習分析步驟包括以下子步驟:
SI 1:建立輿情數據模型:在并行運算設備上,利用深度學習技術對大量的包括特殊場景、企業圖標、特定地標、物體、敏感人物在內的圖片素材和視頻素材進行訓練學習,最終形成包含特殊場景、企業圖標、特定地標、物體、敏感人物的基于圖像、語音和文字的分類數據豐旲型;
S12:基于深度學習數據模型的輿情監測:將待監測的圖像和視頻數據作為輸入數據,利用訓練后得到的分類數據模型對待監測的圖像和視頻數據進行識別,并將識別結果推送到輿情展示終端;
所述的視覺技術分析步驟包括以下子步驟:
S21:建立輿情信息特征庫:利用計算機視覺技術即局部特征抓取與匹配的SURF、SIFT特征點提取及匹配方法,提取包括特殊場景、企業圖標、特定地標、物體和敏感人物的素材圖片和視頻的特征點,將特征點匯集成特征庫并進行存儲;
S22:基于計算機視覺技術的輿情監測:特征庫形成后,將待監測的圖片和視頻特征點與特征庫中的特征點進行匹配,若匹配成功,則查找出電視節目中的輿情信息;將獲取到的敏感信息推送至輿情展示終端。
[0005]步驟Sll中所述的深度學習技術包括基于深度學習的語音識別和基于深度學習的ORC光學字符識別;所述的基于深度學習的語音識別將素材中的音頻內容進行識別,并轉化為通用格式的文檔以供分析判別;所述的基于深度學習的ORC光學字符識別將素材中的文字信息轉化為通用格式的文檔以供分析判別。
[0006]步驟S12中的對待監測的圖像和視頻數據進行識別包括:A、利用語音識別技術對待監測數據中的音頻內容進行識別并將識別到的語音內容轉化為文字信息,將轉換的文字信息與分類數據模型中的數據進行對比得到識別結果;B、利用OCR光學字符識別對待監測數據中的光學文字信息進行識別,經過影像輸入、影像前處理、文字特征抽取,形成基于文字的監測數據,將轉換的文字信息與分類數據模型中的數據進行對比得到識別結果。
[0007]所述的輿情展示終端包括預警展示墻或者智能終端。
[0008]根據用戶的自行選擇將用戶需要的內容推送到輿情展示終端,或者/和將后臺服務器認為是重大負面的輿情事件推送到輿情展示終端。
[0009]當深度學習分析步驟和視覺技術分析步驟中識別到有相同的輿情數據,則將所述輿情數據以第一等級的類別推送到輿情展示終端;當深度學習分析步驟和視覺技術分析步驟中得到不同的輿情數據,則將輿情數據以第二等級的類別推送到輿情展示終端;所述的第一等級和第二等級以不同的方式在輿情展示終端上進行顯示。
[0010]—種基于深度學習技術的廣播電視輿情分析方法還包括一個搜索查詢與統計分類步驟:用戶通過輿情監測終端對特定輿情相關事件進行搜索查詢,后臺進行統計分類后發送至輿情監測終端,用戶進行查看。
[0011]采用所述方法的系統包括數據采集終端、數據處理中心和展示區;所述的數據采集終端用于對待監測數據的采集;所述的處理中心包括:
大數據挖掘服務器:用于挖掘用于建立模型和特征庫的素材;
大數據處理服務器:用于對大數據挖掘服務器挖掘到的素材進行分析與處理,保留可以使用的素材;同時,還用于在需要的時候對存儲的素材進行提取與分析,分別形成分類數據模型和特征庫;
大數據存儲服務器:用于存儲通過大數據處理服務器處理過后的包括特殊場景、企業圖標、特定地標、物體、敏感人物在內的圖片素材和視頻素材;
媒體存儲數據庫:用于存儲從數據采集終端發送來的待監測數據;
媒體分析服務器:用于對待監測數據的分析匹配與結果輸出;
所述的展示區用于對待監測數據的分析結果進行展示。
[0012]本發明的有益效果是:本發明包括基于深度學技術的對輿情信息數據的提取鑒別過程:首先通過對大量的素材數據(包括圖像、視頻、語音和OCR光學字符)進行多次反復的學習和訓練生成數據模型,同時結合計算機視覺技術(局部特征抓取與匹配)生成圖像特征庫。從有線數字電視、有線廣播電視、衛星電視、無線廣播電視等傳播媒體中獲取待監測數據(包括音頻、視頻、圖片)作為深度學習數據模型的輸入,利用建立的數據模型對待監測數據進行識別。同時,結合計算機視覺技術將大量的素材數據形成特征指紋庫,待監測數據的特征值與特征指紋庫中的數據進行對比,若對比成功,則認為待監測數據中含有輿情信息。如果在待監測數據中檢測到輿情信息,系統將會通過app推送或者信息展示報警的方式將此輿情信息及關聯數據告知用戶。
【附圖說明】
[0013]圖1為本發明方法流程圖;
圖2為本發明系統方框圖。
【具體實施方式】
[0014]下面結合附圖進一步詳細描述本發明的技術方案:如圖1所示,一種基于深度學習技術的廣播電視輿情分析方法,它包括深度學習分析步驟和視覺技術分析步驟;
所述的深度學習分析步驟包括以下子步驟:
SI 1:建立輿情數據模型:在并行運算設備上,利用深度學習技術對大量的包括特殊場景、企業圖標、特定地標、物體、敏感人物在內的圖片素材和視頻素材進行訓練學習,最終形成包含特殊場景、企業圖標、特定地標、物體、敏感人物的基于圖像、語音和文字的分類數據模型;所述的深度學習技術包括基于深度學習的語音識別和基于深度學習的ORC光學字符識別;所述的基于深度學習的語音識別將素材中的音頻內容進行識別,并轉化為通用格式的文檔以供分析判別;所述的基于深度學習的ORC光學字符識別將素材中的文字信息轉化為通用格式的文檔以供分析判別。
[0015]S12:基于深度學習數據模型的輿情監測:將待監測的圖像和視頻數據作為輸入數據,利用訓練后得到的分類數據模型對待監測的圖像和視頻數據進行識別,并將識別結果推送到輿情展示終端;步驟S12中的對待監測的圖像和視頻數據進行識別包括:A、利用語音識別技術對待監測數據中的音頻內容進行識別并將識別到的語音內容轉化為文字信息,將轉換的文字信息與分類數據模型中的數據進行對比得到識別結果;B、利用OCR光學字符識別對待監測數據中的光學文字信息進行識別,經過影像輸入、影像前處理、文字特征抽取,形成基于文字的監測數據,將轉換的文字信息與分類數據模型中的數據進行對比得到識別結果。
[0016]所述的視覺技術分析步驟包括以下子步驟:
S21:建立輿情信息特征庫:利用計算機視覺技術即局部特征抓取與匹配的SURF、SIFT特征點提取及匹配方法,提取包括特殊場景、企業圖標、特定地標、物體和敏感人物的素材圖片和視頻的特征點,將特征點匯集成特征庫并進行存儲;
S22:基于計算機視覺技術的輿情監測:特征庫形成后,將待監測的圖片和視頻特征點與特征庫中的特征點進行匹配,若匹配成功,則查找出電視節目中的輿情信息;將獲取到的敏感信息推送至輿情展示終端。
[0017]所述的輿情展示終端包括預警展示墻或者智能終端。
[0018]通過app推送或者預警展示墻的方式將獲取到的敏感信息推送給客戶,提高客戶對電視新聞媒體的輿情反應效率,并在出現重大負面輿情事件的情況下進行及時提示,方便的對相關新聞進行調閱查看,以便采取對應措施。
[0019]根據用戶的自行選擇將用戶需要的內容推送到輿情展示終端,或者/和將后臺服務器認為是重大負面的輿情事件推送到輿情展示終端。
[0020]當深度學習分析步驟和視覺技術分析步驟中識別到有相同的輿情數據,則將所述輿情數據以第一等級的類別推送到輿情展示終端;當深度學習分析步驟和視覺技術分析步驟中得到不同的輿情數據,則將輿情數據以第二等級的類別推送到輿情展示終端;所述的第一等級和第二等級以不同的方式在輿情展示終端上進行顯示。
[0021]—種基于深度學習技術的廣播電視輿情分析方法還包括一個搜索查詢與統計分類步驟:用戶通過輿情監測終端對特定輿情相關事件進行搜索查詢,后臺進行統計分類后發送至輿情監測終端,用戶進行查看。
[0022]采用所述方法的系統包括數據采集終端、數據處理中心和展示區;所述的數據采集終端用于對待監測數據的采集;所述的處理中心包括:
大數據挖掘服務器:用于挖掘用于建立模型和特征庫的素材;
大數據處理服務器:用于對大數據挖掘服務器挖掘到的素材進行分析與處理,保留可以使用的素材;同時,還用于在需要的時候對存儲的素材進行提取與分析,分別形成分類數據模型和特征庫;
大數據存儲服務器:用于存儲通過大數據處理服務器處理過后的包括特殊場景、企業圖標、特定地標、物體、敏感人物在內的圖片素材和視頻素材;
媒體存儲數據庫:用于存儲從數據采集終端發送來的待監測數據;
媒體分析服務器:用于對待監測數據的分析匹配與結果輸出;
所述的展示區用于對待監測數據的分析結果進行展示。
【主權項】
1.一種基于深度學習技術的廣播電視輿情分析方法,其特征在于:它包括深度學習分析步驟和視覺技術分析步驟; 所述的深度學習分析步驟包括以下子步驟: Sll:建立輿情數據模型:在并行運算設備上,利用深度學習技術對大量的包括特殊場景、企業圖標、特定地標、物體、敏感人物在內的圖片素材和視頻素材進行訓練學習,最終形成包含特殊場景、企業圖標、特定地標、物體、敏感人物的基于圖像、語音和文字的分類數據豐旲型; S12:基于深度學習數據模型的輿情監測:將待監測的圖像和視頻數據作為輸入數據,利用訓練后得到的分類數據模型對待監測的圖像和視頻數據進行識別,并將識別結果推送到輿情展示終端; 所述的視覺技術分析步驟包括以下子步驟: S21:建立輿情信息特征庫:利用計算機視覺技術即局部特征抓取與匹配的SURF、SIFT特征點提取及匹配方法,提取包括特殊場景、企業圖標、特定地標、物體和敏感人物的素材圖片和視頻的特征點,將特征點匯集成特征庫并進行存儲; S22:基于計算機視覺技術的輿情監測:特征庫形成后,將待監測的圖片和視頻特征點與特征庫中的特征點進行匹配,若匹配成功,則查找出電視節目中的輿情信息;將獲取到的敏感信息推送至輿情展示終端。2.根據權利要求1所述的一種基于深度學習技術的廣播電視輿情分析方法,其特征在于:步驟SI I中所述的深度學習技術包括基于深度學習的語音識別和基于深度學習的ORC光學字符識別;所述的基于深度學習的語音識別將素材中的音頻內容進行識別,并轉化為通用格式的文檔以供分析判別;所述的基于深度學習的ORC光學字符識別將素材中的文字信息轉化為通用格式的文檔以供分析判別。3.根據權利要求2所述的一種基于深度學習技術的廣播電視輿情分析方法,其特征在于:步驟S12中的對待監測的圖像和視頻數據進行識別包括:A、利用語音識別技術對待監測數據中的音頻內容進行識別并將識別到的語音內容轉化為文字信息,將轉換的文字信息與分類數據模型中的數據進行對比得到識別結果;B、利用OCR光學字符識別對待監測數據中的光學文字信息進行識別,經過影像輸入、影像前處理、文字特征抽取,形成基于文字的監測數據,將轉換的文字信息與分類數據模型中的數據進行對比得到識別結果。4.根據權利要求1所述的一種基于深度學習技術的廣播電視輿情分析方法,其特征在于:所述的輿情展示終端包括預警展示墻或者智能終端。5.根據權利要求1所述的一種基于深度學習技術的廣播電視輿情分析方法,其特征在于:根據用戶的自行選擇將用戶需要的內容推送到輿情展示終端,或者/和將后臺服務器認為是重大負面的輿情事件推送到輿情展示終端。6.根據權利要求1或5所述的一種基于深度學習技術的廣播電視輿情分析方法,其特征在于:當深度學習分析步驟和視覺技術分析步驟中識別到有相同的輿情數據,則將所述輿情數據以第一等級的類別推送到輿情展示終端;當深度學習分析步驟和視覺技術分析步驟中得到不同的輿情數據,則將輿情數據以第二等級的類別推送到輿情展示終端;所述的第一等級和第二等級以不同的方式在輿情展示終端上進行顯示。7.根據權利要求1所述的一種基于深度學習技術的廣播電視輿情分析方法,其特征在于:還包括一個搜索查詢與統計分類步驟:用戶通過輿情監測終端對特定輿情相關事件進行搜索查詢,后臺進行統計分類后發送至輿情監測終端,用戶進行查看。8.采用權利要求1?7中任意一項所述方法的系統,其特征在于:包括數據采集終端、數據處理中心和展示區;所述的數據采集終端用于對待監測數據的采集;所述的處理中心包括: 大數據挖掘服務器:用于挖掘用于建立模型和特征庫的素材; 大數據處理服務器:用于對大數據挖掘服務器挖掘到的素材進行分析與處理,保留可以使用的素材;同時,還用于在需要的時候對存儲的素材進行提取與分析,分別形成分類數據模型和特征庫; 大數據存儲服務器:用于存儲通過大數據處理服務器處理過后的包括特殊場景、企業圖標、特定地標、物體、敏感人物在內的圖片素材和視頻素材; 媒體存儲數據庫:用于存儲從數據采集終端發送來的待監測數據; 媒體分析服務器:用于對待監測數據的分析匹配與結果輸出; 所述的展示區用于對待監測數據的分析結果進行展示。
【文檔編號】G06K9/62GK106095903SQ201610400856
【公開日】2016年11月9日
【申請日】2016年6月8日
【發明人】曾兵, 賈宇, 郭先會, 何海詣, 董文杰
【申請人】成都三零凱天通信實業有限公司