專利名稱::基于寬帶網絡的旅游景區景點在線景觀視頻主動信息服務系統的制作方法
技術領域:
:本發明屬于旅游信息化領域,具體涉及依據用戶興趣模型為用戶提供個性化主動視頻服務。
背景技術:
:中國已成為世界第四大入境旅游接待國、亞洲最大的出境旅游客源國,并將形成世界上最大的國內旅游市場,因此對旅游信息化的要求也越來越高。一般的旅游信息服務系統為用戶提供的服務形式簡單,有以下兩種方式1.系統主動向用戶派發信息。這種方式類似于在大街上免費向路人發放報紙,以達到推廣信息的目的,例如郵件信息廣告。此種方法操作簡單易行,但是大部分用戶對此比較反感,所以該種方法在操作過程當中難點便在于如何選擇用戶,以及如何把握頻度。目前此種方法依然存在,但已經退出了主流。2.用戶主動到系統信息平臺來獲取自己需要的信息。這是當前主流網絡信息提供方式,例如門戶信息網站。此種方法操作看似簡單,實際上卻很復雜,需要收集各種信息,并加以分類。此種方式是信息服務的主流,被絕大多數信息服務平臺采用。采用該方法的系統平臺缺乏主動性、智能性。本發明從互聯網、電信網絡和廣電網絡采集視頻資源,通過視頻信息的分類和挖掘,建立用戶興趣模型,向各類用戶提供個性化的視頻智能推拉服務。本發明能提高旅游信息服務的質量,使信息服務更好地滿足用戶需求。
發明內容本發明提出了一種旅游景區景點在線景觀視頻主動服務系統;系統從互聯網、電信網、廣電網采集視頻資源,采用基于本體的多媒體融合技術加以描述,并采用聚類方法對視頻分類與挖掘處理;系統通過顯式和隱式兩種方法采集用戶興趣信息,并依據獲得的用戶信息采用樸素貝葉斯方法建立用戶興趣模型,依據用戶興趣模型為用戶提供個性化主動視頻服務。本發明為數字旅游服務的智能化、個性化提供了解決方案。如圖1所示,本發明的技術方案是這樣實現的1.采集旅游相關視頻信息;2.對視頻分類并存儲;3.采集用戶興趣信息;4.基于采集到的用戶興趣信息構建用戶興趣信息模型;5.基于用戶興趣模型為用戶提供個性化旅游視頻服務。本發明有以下一些技術特征(1)步驟1所述的視頻信息是指從電信網、互聯網及廣電網中采集的旅游相關視頻信息,并將采集到的各種視頻信息存儲到視頻庫中;(2)步驟2所述的過程采用基于時間的視頻聚類技術對視頻加以分類;(3)步驟3所述的采集用戶興趣信息過程采用隱式及顯式兩種方法,顯式方法即為用戶直接向系統提交個人興趣描述的方法,隱式方法即為提取并分析用戶歷史操作記錄,從中提取出反映用戶興趣信息的內容;(4)步驟4所述的構建用戶興趣模型的方法是采用樸素貝葉斯方法構建用戶興趣模型;(5)步驟5所述的個性化旅游視頻服務是指用戶獲得的旅游視頻服務都是經過基于用戶興趣模型的方法處理,使不同的用戶獲得不同的服務,最大限度的滿足用戶的興趣需求。本發明提出了一種基于用戶興趣模型的旅游信息個性化服務方法,此方法切實可行,能滿足用戶的需求。圖1旅游景區景點在線景觀視頻主動信息服務系統;圖2基于“三網融合”技術的旅游視頻智能推拉;圖3旅游景區景點在線景觀視頻主動信息服務系統結構;圖4視頻智能推拉系統結構;圖5旅游景觀多媒體信息本體的構建;圖6基于本體的多媒體信息語義檢索系統;圖7旅游視頻標注框架;圖8視頻推送、拉取模型;圖9用戶興趣信息獲取方式;圖10視頻搜索排序模塊工作流程圖;圖11用戶反饋模塊工作流程圖;圖12系統前臺架構;圖13用戶服務模型;圖14旅游視頻推送服務流程圖;圖15視頻拉取服務流程圖。具體實施例方式旅游景區景點在線景觀視頻主動信息服務系統如圖1所示。系統從互聯網、電信網絡和廣電網絡采集視頻資源,通過視頻信息的分類和挖掘,向各類用戶提供視頻智能推拉服務。系統將需檢索的視頻信息進行特征提取、視頻標注等處理,利用智能匹配技術根據用戶需求在打上標簽的視頻源數據庫中進行檢索,將視頻流根據用戶終端類型進行處理后傳輸。基于“三網融合”技術的旅游視頻智能推拉如圖2所示。本發明針對在線景觀視頻主動信息服務系統中涉及的視頻標注、智能推送和基于本體的多媒體信息融合及語義檢索等關鍵技術進行了研究。系統結構系統中用戶界面主要用于用戶登錄、注冊、描述用戶的視頻查詢要求、對推送的視頻進行反饋評價;興趣知識庫是通過監控用戶的行為,再經過分析后總結抽象4出的有關用戶的知識,是一系列能體現用戶習慣和興趣的引導圖。此外,模型中有四個功能模塊相互協作用戶興趣獲取、視頻搜索排序、用戶反饋和視頻推拉模塊。系統結構如圖3所示。用戶興趣獲取主動從用戶興趣知識庫中提取用戶的興趣引導圖,據此分析用戶的需求,避免無用搜索。視頻搜索排序根據用戶興趣搜索用戶所需視頻,并進行相關興趣度排序,截取用戶可以接受的推送視頻數量。用戶反饋收集用戶對推送視頻的反饋評價信息,并更新到興趣知識庫。視頻推送拉取將按照用戶興趣進行搜索排序得到的視頻整理后,推送給終端用戶。1.視頻智能推拉模型引入在主流的視頻服務網站中,視頻獲取方式是按“拉”(Pull)的模型進行的服務器根據用戶發送的服務請求進行處理并返回用戶所需的結果。在“推”(Push)系統中,服務器把視頻“推”給用戶機系統。雖然兩者數據傳輸的方向都是從服務器流向用戶,但操作的發起者是不同的。從視頻源與用戶的關系分析,信息的流動可分為兩種模式即信息推送與信息拉取模式。視頻智能推拉技術是將推送模式與拉取模式結合,使二者優勢互補,并且結合了人工智能、知識發現和智能Agent及數據庫等技術,在用戶需求模糊的情況下,主動向用戶提供有價值的視頻服務。視頻智能推拉技術的產生,可以提高網絡及數據庫的智能水平,從而在根本上解決“推送”和“拉取”技術應用過程中所遇到的難題,即如何從海量視頻資源中提取有用視頻,為不同用戶提供個性化的視頻主動服務等。視頻智能推拉技術如圖4所示。視頻智能推送采用多模塊相互協作的方式,結合人工智能、機器學習方法,可以獲取和預測用戶的興趣或偏好,從而有針對性地向用戶主動推送所需視頻,以滿足不同用戶的個性化需求。視頻智能拉取應用知識工程的知識推理搜索方法,可提高搜索引擎的快速性和準確度,從而用戶可以更及時地拉取所需的最新動態視頻。視頻推拉結合視頻推送與拉取相結合,可取長補短。根據Pull的歷史趨勢,加強Push的針對性;利用Pull歷史和Push的功能,提高Pull的效率。這樣既可及時地、主動地將最新視頻推送給用戶,又可有針對性、選擇性地滿足用戶個性化需求。知識發現功能采用知識發現的方法和技術,可從用戶所選擇“推送_拉取”的視頻標簽和摘要信息中提取用戶興趣知識,發現隱藏在大量數據中的內在規律。綜上所述,視頻智能推拉技術能夠較好地解決面向個性化的旅游景觀視頻獲取問題。2.基于本體的多媒體信息融合及語義檢索本發明采用基于本體的描述方法處理旅游景觀多媒體信息的元數據,分析旅游景觀本體模型的核心概念及概念間的關系。出于本體資源可重用性和開發協同性的考慮,所有媒體概念和屬性類本體按照不同的媒體格式分別定義在不同的本體文件里,在文件中利用owlimports屬性在各個本體文件之間實現資源調用,如圖5。所有的owl文檔存儲于關系數據庫中,通過查詢獲取關系數據庫中相關信息的存儲地址。本發明選用OWL(WebOntologyLanguage)作為本體形式化描述語言,OWL的優點是定義完備,以Web資源為描述對象,而且是W3C的推薦標準,而多媒體信息資源適合于網絡傳播和瀏覽。對于概念、概念的層級關系、屬性的定義域和值域以及實例部分的編碼,可以通過本體構建工具進行操作,再通過導出功能獲取owl代碼,但是對多媒體信息的語義特征描述的部分則需要在MPEG-7框架下進行編碼。為了在owl建模語言中結合MPEG-7提供的描述語言對多媒體信息進行描述,我們采用將MPEG-7多媒體標準映射到RDFS的方法,生成基于RDFS的MPEG-7語義元數據通用參考模型,實現廣泛的信息共享和互操作性。因為MPEG-7與RDFS的語法都是基于XML的,所以基于RDFS結構對MPEG-7進行擴展可以呈現MPEG-7的隱含語義。具體方法是首先將MPEG-7中的XMLSchema結構轉換到RDFS框架中(稱為XSD2RDFS轉換),構建MPEG-7RDFS多媒體語義元數據參考模型,借助RDFS框架捕獲MPEG-7的隱含語義,使得XMLSchema中原來隱含的語義變得清晰。XMLSchema和RDFS之間的轉換如表1所示。然后,將XML表示的多媒體實例映射到RDF。最后以MPEG-7RDFS作為集成中心,集成不同來源的多媒體元數據。表1XSD2RDFS轉換關系<formula>formulaseeoriginaldocumentpage6</formula><table>tableseeoriginaldocumentpage7</column></row><table>通過集成不同來源的多媒體元數據,即使同一主題的所有信息以不同的名字、不同的媒體形式存儲在不同的多媒體系統中,通過語義檢索和推理,也可以檢索到同一主題的所有相關信息。因此,在基于本體的多媒體信息融合基礎上,建立了基于本體的多媒體信息語義檢索系統。系統采用三層體系結構,分別是語義元數據生成與管理層、數據存儲與管理層和應用層,如圖6所示。語義元數據生成與管理層的主要功能是多媒體數據的抽取并根據MPEG-7RDFS多媒體語義元數據參考模型進行語義標注、語義元數據編輯。語義元數據生成模塊采集多媒體數據并抽取相關元數據;語義標注模塊采用基于半監督學習的旅游視頻標注算法等實現對多媒體內容的語義概念標注。數據存儲與管理層采用關系數據庫對多媒體庫及其索引庫、語義元數據庫及其索引庫進行存儲和管理。后端處理模塊則包括聚類和索引子模塊、安全訪問控制子模塊。通過對多媒體信息的自動聚類,便于建立索引,從而提高檢索效率。根據用戶興趣和訪問歷史,為用戶建立并動態維護信息目錄,實現智能化的信息推送。應用層提供基于語義的檢索、基于內容的檢索和基于文本的檢索等多種檢索方式。基于文本的檢索根據用戶提交的關鍵詞進行查詢;基于內容的檢索采用相關反饋檢索技術實現基于多媒體特征的查詢;基于語義的檢索采用自然語言理解、基于本體的概念推理等技術實現反映主題語義的檢索。3.基于半監督學習方法的旅游視頻標注利用混合高斯模型(GMM)作為基本模型,以最大似然線性回歸(MLLR)方法進行模型自適應更新,建立視頻標注框架,如圖7。4.基于時間限制的視頻預聚類為了能有效地利用視頻中概念的時間相關性和局部聚集性特點,對視頻集中的鏡頭進行了預聚類處理。預聚類主要是根據鏡頭之間的視覺相似程度以及它們在時間上的相關性,以過分割的形式進行的。過分割的目的在于使所得聚類中每個鏡頭表示的語義概念盡可能一致。為了減少計算量,利用關鍵幀提取技術,以有限的關鍵幀集合替代鏡頭中的全部幀,計算鏡頭間的特征差異。同時,在聚類過程中考慮概念的時間相關性,即由于“語義鴻溝”的存在,對于在時間上間隔很遠的兩個鏡頭,即使它們之間的視覺相似度很高,也很難確定是否表達的是同一個概念,因此考慮鏡頭之間的時間限制,在聚類的相似度度量中引入了時間窗參數T,最終的鏡頭差異度量定義如下',mmd(fikJjm),ifi-j<T=(1)oo,otherwise其中d()是任意兩個關鍵幀之間的特征差異。當兩個鏡頭之間的特征差異小于某個給定門限時,則認為它們是相似的,或者說屬于同一個鏡頭聚類。5.聚類中的概念統一化方法經過預聚類后,假設同一聚類中鏡頭表達的是相同的概念。這樣,只要保證分類器具有一定的準確性,在聚類中那些錯分的孤立樣本(鏡頭)就可以通過一個概念統一化過程進行更正。對一個具有N個鏡頭的聚類Cl={χι,χ2,...,%},概念統一化的目標就是從給定的待標注概念集合ΙΛ,I2,...,1}中找到合適的標注Ii賦給聚類Cl中的全部鏡頭。假設在同一個聚類中各鏡頭所對應的特征矢量之間是相互條件獨立的,則聚類后驗概率可以表示為<formula>formulaseeoriginaldocumentpage9</formula>其中P(Ii)是概念Ii的先驗概率分布,P(XkIIi)是鏡頭Xk標注為概念Ii的條件概率。根據所估計的聚類后驗概率P(IkICl),聚類類別可通過最大后驗概率準則確定。同時計算分類結果的置信度得分<formula>formulaseeoriginaldocumentpage9</formula>其中Pmax={P(Ii|Cl),i=1,2,...,N},即取聚類標號所對應的最大后驗概率。Pmargin=Pmax-max{P(1」|Cl),i!=j,j=1,2,...,N},即最接近最大后驗概率的競爭概念的后驗概率。6.基于GMM的互適應方法及標號更正首先設定門限保證選擇樣本的準確性;然后按照置信度的不同,對未標注樣本的預測結果進行標號更正;更正后的樣本作為自適應數據集,對分類器模型進行自適應的更新。7.基于最小熵準則的聚類調整由于某特定概念在底層特征空間上分布的復雜多樣性,而鏡頭集的預聚類是在沒有結合任何語義信息的情況下以過分割方式進行的,因此不可避免的存在著錯誤。在這種情況下,簡單的將所有聚類的鏡頭賦于同一類別標號,將會人為地引入錯誤。在這里采用最小熵準則,利用分類結果對聚類進行調整,使調整后的聚類信息在語義概念上更為一致。定義聚類中的語義熵<formula>formulaseeoriginaldocumentpage9</formula>M為在聚類中各個樣本屬于不同待標注概念的個數。當聚類中語義熵較大時,說明該聚類中的預測結果較不一致。因此通過聚類分裂可獲得具有良好一致性的子聚類,此時再假設這些子聚類具有相同標號比較合理。子聚類是通過遞歸方式獲得的,在每一次遞歸過程中按如下公式確定最優的分割點<formula>formulaseeoriginaldocumentpage9</formula>8.視頻推送和拉取模型建立推送模型和拉取模型采用分布式的結構,將用戶需求分解作用到若干個子搜索,再將各個搜索返回的結果進行綜合整理,并結合用戶興趣知識庫進行相關度排序,推送給用戶。推送、拉取模型如圖8所示。在視頻推送過程中,根據用戶興趣知識庫中用戶的基本信息、需求信息、興趣愛好等,提取搜索關鍵字并作用于各個視頻數據庫,最后將排序后的視頻有選擇地發送給相應的用戶。在視頻拉取過程中,用戶有比較大的自主性,可以針對視頻類別、查找的關鍵字以及視頻摘要進行相關搜索。根據用戶輸入的拉取視頻關鍵字,選擇要查看的視頻類別,包括景區宣傳、景點介紹、酒店介紹、旅游產品展示等,同時結合其興趣愛好,通過多個子搜索從相應的數據庫中找到相關視頻。9.用戶興趣信息獲取系統采用顯式和隱式兩種用戶興趣信息獲取方式。顯式獲取用戶興趣信息是由用戶參與,直接向系統提交用戶興趣信息。隱式獲取用戶興趣信息是用戶不直接參與,在用戶使用系統的過程中,通過分析用戶的行為,間接獲得用戶的興趣信息。顯式獲取用戶興趣信息是通過用戶對自己的興趣愛好的描述,向系統提交興趣愛好的文本描述。隱式獲取用戶興趣信息主要采用三種方式,一是將用戶的視頻播放歷史記錄作為用戶興趣愛好的一種反映;二是將用戶的查詢記錄作為用戶興趣愛好的參考;三是將用戶創建的視頻收藏夾作為用戶興趣的集中體現。還要記錄用戶的非感興趣視頻信息作為用戶不感興趣的視頻信息描述。圖9描述了用戶興趣信息獲取的方式。10.興趣知識庫的創建本系統關鍵是進行機器自學習而獲取用戶的興趣知識庫,將用戶在系統平臺上的瀏覽活動記錄下來,結合用戶注冊資料,然后依據一定的算法從中抽取出用戶興趣引導圖,建立用戶興趣知識引導庫,作為系統已學習到的視頻推送經驗。興趣知識引導庫中的每條記錄由瀏覽結點的文檔名,文檔中的關鍵詞向量及對應的關鍵詞的權重向量及父文檔名組成。文檔中的關鍵詞向量及對應的關鍵詞的權重向量具體處理過程是先將文檔變為一個詞集,該詞集形成關鍵詞向量,詞集中每個詞的詞頻形成詞頻向量,該詞頻向量進行歸一化,形成關鍵詞權重向量。用戶興趣引導圖的抽取方法在用戶的瀏覽序列中,首先利用文檔間的鏈接關系將用戶某一次瀏覽活動中訪問過的全部文檔序列劃分為若干個瀏覽區域即有向圖,再將瀏覽區域組成若干個相似類,每個相似類就認為是一個引導圖,具體算法如下設D中<dl,d2,...,dn>是用戶某一次瀏覽活動中按時間先后順序訪問過的全部文檔序列,進行如下定義(1)瀏覽序列設S=<di,...,dj>是D中的某個子序列,如果對S中的任一文檔dq(i^q^j),都存在文檔dp(i彡ρ<q)使得dp中有指向dq的超鏈,且用戶是通過這條超鏈接訪問到dq的;并且用戶沒有通過S中某個文檔的超鏈接訪問dj+Ι;并且用戶沒有通過第k-Ι次瀏覽序列中的某一文檔里的超鏈接訪問di,稱S為該用戶的第k次瀏覽序列。(2)瀏覽區域以S中的文檔為結點,以這些文檔之間用戶使用過的超鏈接為邊構成的有向圖稱為該用戶的一個瀏覽區域。(3)相似性判別規則設A,B是兩個瀏覽區域,如A和B包含有重疊的部分,即有一些共同的文檔;或AO=A,Al,...,Aj=B使得Ai-I與Ai(i=1,…,j)是重疊的,其中j彡k(k是取2或3的常量),此時A和B在不超過k步傳遞的意義下是重疊的,則稱A,B是相似的。(4)相似類的興趣強度公式相似類是由彼此相似的瀏覽區域組成,反映了用戶的某種特定興趣的信息需求,設C是一個相似類,i是C中包含的文檔個數,L是本次瀏覽的文檔總數,η是C中含有的瀏覽過程的個數,N是用戶瀏覽過程的總數,則F(C)=(i/L+n/N)/2是相似類的興趣強度計算公式。(5)閥值由系統指定,由于引導圖是用戶特別感興趣的地方,因此閥值一般應明顯高于平均興趣強度值。根據上面定義的相似性判別規則、用戶興趣強度計算公式和閥值,就可以從用戶的瀏覽活動中自動地抽取引導圖。考慮到用戶活動的復雜性,提取出的引導圖可以再經過用戶的確認、編輯,生成有效的引導圖。顯然引導圖反映了用戶對特定信息的癖好,就可以據此推送給用戶特定的視頻。11.用戶興趣挖掘用戶興趣挖掘包括用戶興趣建模和用戶興趣模型更新兩部分。兩部分工作的基礎都是已經獲得的用戶興趣信息。隨著用戶興趣信息的逐漸增多,用戶興趣模型將越來越完善。用戶興趣模型是系統提供個性化視頻推拉聯播服務的主要支持部分。所以構建一個好的用戶模型對于服務質量是至關重要的。好的模型不僅要提高準確率還要有更好的效率。判斷視頻是否為用戶所感興趣的視頻的過程可以看成是對視頻分類的過程,要么歸為用戶感興趣的類中,要么歸為用戶不感興趣的類中。直接根據視頻內容分類不僅十分復雜,難以實現而且效率不高,為此將與視頻相關的文本信息作為視頻內容的描述,通過對文本進行分類,以達到對視頻分類的目的。系統利用樸素貝葉斯方法建立用戶興趣模型。貝葉斯定理是計算概率的一種方法,根據貝葉斯定理,對于事件X與Y,且已知X和Y的概率,則概率P(XIY)用公式表示為<formula>formulaseeoriginaldocumentpage11</formula>貝葉斯公式更形式化的定義為設X1,X2...Xn為樣本空間S的一個劃分,Y為一個事件,且P(Y)>0,P(Xi)>0(i=1,2···η),則<formula>formulaseeoriginaldocumentpage11</formula>樸素貝葉斯方法是貝葉斯方法的一種簡化,其前提是假設事件之間是相互獨立的。利用貝葉斯方法建立用戶A的興趣模型的系統流程。收集用戶A感興趣的視頻的內容描述文本,和用戶A不感興趣的視頻的內容描述文本,建立用戶A的興趣集和非興趣集。采用分詞技術提取特征源中的獨立字符串,例如將“山峰”作為TOKEN串并統計提取出的TOKEN串出現的次數,即字頻。用此方法分別處理興趣集和非興趣集中的所有視頻描述文本。使每一個視頻描述文本集對應一個哈希表,hashtable_interest對應興趣集,hashtable_dislike對應非興趣集。表中存儲TOKEN串到字頻的映射關系。計算每個哈希表中TOKEN串出現的概率P=(相應TOKEN串的字頻)/{對應哈希表的長度}。綜合考慮hashtalbe_interest和hashtable_dislike,推斷出新的視頻描述信息屬于興趣視頻描述的概率。事件S該視頻描述屬于興趣視頻描述,即該視頻屬于興趣視頻,ti;t2...,tn代表TOKEN串,則P{S/tJ表示在興趣描述中出現TOKEN串ti時,該視頻屬于興趣視頻的概率。設PlCti)=Cti在hashtable_interest中的值),Ρ2(、)=Cti在hashtable_dislike中的值),則P{S/tJ=PKt^/tPKt^+PKti)],i=1,2,···η建立新的哈希表hashtable_probability存儲TOKEN串、到P(SIti)的映射。形式為表2所示^2hashtab1e_probabilityTOKEN串興趣視頻概率_爬山—P(Slt1)游泳__P(Slt2)1城P(Slt3)根據建立的哈希表hashtabl^probability可以根據一個視頻的內容描述信息估算出其為用戶感興趣視頻的可能性。對于一個視頻,首先提取有關其內容描述的文本內容,根據文本內容生成TOKEN串,查詢與用戶A相關的haShtable_pr0babiIity得到該TOKEN串的鍵值。假設用該視頻內容描述共得到η個TOKEN串t1;t2...,tn,hashtable_probability中對應的值為P1,P2.··Pn,P(S11”t2...,tn)表示在視頻描述中同時出現多個TOKEN串t1;t2...,tn時,該視頻屬于用戶A感興趣的視頻的概率。由復合公式得P{S\txA,..tn)=-Wx…X尸"--(8)通過計算得到P(S|t1;t2...,tn),根據系統設定的閥值就可以判斷用戶是否對該視頻感興趣,依此也可對用戶所感興趣的視頻進行排序。哈希表hashtable_pr0bability即為用戶A的興趣模型。12.視頻搜索排序系統的視頻搜索排序的功能是按照興趣知識庫中用戶引導圖的關鍵詞或用戶主動輸入,在視頻庫中搜索視頻并進行形似度排序,然后將結果傳送給視頻推送模塊。視頻搜索排序模塊的工作流程如圖10所示。首先將感知的用戶當前對視頻的需求進行適當處理,即根據用戶興趣知識庫中的引導信息來生成向搜索引擎服務器的特定請求,并接受其返回的搜索結果,然后綜合搜索引擎返回的結果,形成η個與用戶相關性更強的URL,將這些URL涉及的視頻內容獲取,然后對每個視頻標簽或摘要提取形成關鍵詞向量及權重向量,再跟該用戶引導圖中的關鍵詞向量及權重向量進行比較,利用相似度篩選出面向用戶需求的視頻,最后選出相似度最高的N個視頻傳送給視頻推送模塊。兩向量W,P的相似度R可以利用余弦來衡量HwkPkR=cos(W,P)=^--(9)IpHH13.視頻推拉結果反饋調整反饋調整可以通過兩種方式進行,即顯性的用戶在客戶端界面上修改興趣方式和隱性地通過分析用戶瀏覽行為來調整興趣的方式。用戶對相關視頻的瀏覽即是對系統的一種隱性反饋,對反饋結果進行分析可以使推送的內容更加符合用戶的需求;反饋也可以主動接受獲取用戶的各種評價,然后調整用戶的興趣引導圖,并更新到對應的興趣知識庫。反饋的工作流程如圖11所示。在顯性反饋時,對用戶的反饋信息進行量化,把用戶對推送視頻的評價分為五個等級很滿意(+2)、滿意(+1)、一般(O)、不滿意(-1)、很不滿意(_2),用評價值f表示。隱性反饋時,由用戶的行為決定反饋更新,不同行為具有不同意義,如表3所示。表3用戶行為的意義___<table>tableseeoriginaldocumentpage13</column></row><table>設a(0_l之間的實數)為學習速度,用于控制調整的步調。則反饋學習中用戶興趣調整公式為P=P+a*f*D其中P為用戶興趣的矢量表示,D為用戶評價文檔的矢量表示。根據用戶的反饋信息,對相應用戶興趣知識庫進行調整,能夠更精確的描述用戶的興趣和需求。14.系統前臺設計與實現系統前臺采用B/S結構設計,其總體架構如圖12所示。旅游景區景點在線景觀視頻主動服務系統作為系統應用的總平臺,主要實現視頻推送、視頻拉取功能以及虛擬旅游、隨團旅游、自助旅游、游客信息、用戶模塊的接入功能。通過區分登錄用戶與非登錄用戶,向用戶提供差分服務。將所有的非登錄用戶視為同一個用戶,并在系統中為其創建一個用戶,作為系統的默認用戶,記錄用戶的操作記錄,分析非注冊用戶的行為,了解大眾興趣趨向。對于注冊用戶,通過分析其個人的用戶操作記錄,為其創建用戶興趣模型,從而為其提供更為優質的服務。用戶服務模型如圖13所示。15.用戶服務模塊旅游視頻推拉聯播服務是系統實現的主要目的。可以將視頻推拉聯播服務分為視頻推送服務,視頻拉取服務,和視頻網絡聯播服務三部分。視頻推送服務就是根據用戶的興趣,主動將相關的視頻推送給用戶;視頻拉取服務就是滿足用戶的視頻查詢需要,在用戶以查詢方式拉去視頻的時候,系統將用戶拉取到的視頻結合用戶的興趣對視頻組排序,然后再將排序后的視頻推送給用戶;視頻網絡聯播服務就是由系統給定需要網絡聯播的內容,主要包括旅游資訊、旅游推廣等信息,投放到地圖平臺、旅游視頻網站和用戶主頁上,形成網絡聯播,擴大旅游宣傳。旅游視頻推送服務的核心就是主動向用戶推送用戶想要的視頻內容,使用戶獲得信息的方式更簡單,更直接。推送服務的主要流程如圖14所示。系統根據用戶的興趣模型從視頻庫中提取出用戶最有可能感興趣的視頻信息,但其中必定存在用戶曾經觀看過的視頻和用戶收藏夾中的視頻,將這些視頻再次推送給用戶已經意義不大,效果也不會好,所以就需要根據用戶收藏夾中收藏的視頻信息和用戶觀看記錄將已被觀看過的視頻過濾掉。只需將那些用戶不曾看過的與用戶興趣相關的視頻和系統隨機添加的“雜質”視頻推送給用戶。旅游視頻拉取服務采用“拉中有推”的方式,由用戶進行查詢,系統接收查詢并進行查詢操作。在用戶進行視頻拉取過程當中,系統結合用戶興趣模型,將排序后的結果推送給用戶。在常規查詢過程中,由于查詢結果數據量比較大造成用戶很難找到自己希望的數據的情況經常出現。系統結合用戶興趣模型對查詢結果排序后,便可以在很大程度上避免這種情況的發生。提高了查詢命中率,節約了用戶時間。如圖15所示,為旅游視頻拉取服務流程圖。視頻網絡聯播服務就是將聯播內容推送到可能對此感興趣的用戶主頁中去。由數量龐大的用戶主頁和視頻網站、網絡地圖構成一個網絡聯播系統,為用戶提供網絡聯播服務。在為一個需要網絡聯播的內容選擇要推送到的用戶主頁時,結合考慮該用戶的興趣與此聯播內容是否相關,盡量選擇相關性比較高的用戶作為聯播對象,這樣既可以提高聯播效益,又可以節約聯播資源(不必將所有的聯播內容推送到所有的用戶主頁中去)。權利要求旅游景區景點在線旅游視頻主動信息服務系統,其特征在于,該方法包括采集視頻資源;對采集到的視頻分類、特征處理、標注;用戶進入系統獲得視頻服務;系統根據用戶興趣模型為用戶提供主動服務(視頻檢索服務,相關推薦服務,主動推送服務);系統提取用戶的操作記錄,據此數據建立用戶興趣模型。2.根據權利要求1所述的方法,其特征在于,采集來自于互聯網、電信網、和廣電網不同網絡的旅游相關視頻信息。3.根據權利要求1所述的方法,其特征在于,采用基于本體的多媒體信息融合技術描述視頻資源,選用OWL(WebOntologyLanguage)作為本體形式化描述語言。4.根據權利要求1所述的方法,其特征在于,采用基于時間的視頻預聚類技術對視頻進行分類處理,并選用基于最小熵準則的方法對聚類進行調整。5.根據權利要求1所述的方法,其特征在于,用戶獲得的主動視頻服務內容包括視頻拉取服務、視頻推送服務和視頻網絡聯播服務。6.根據權利要求1所述的方法,其特征在于,系統通過顯示和隱式兩種方式相結合的方法采集用戶興趣信息。7.根據權利要求1所述的方法,其特征在于,系統采用樸素貝葉斯方法構建用戶興趣模型。全文摘要本發明從互聯網、電信網絡和廣電網絡采集視頻資源,通過視頻信息的分類和挖掘,向各類用戶提供基于寬帶網絡的視頻智能推拉服務。系統將需檢索的視頻信息進行特征提取、視頻標注等處理,利用智能匹配技術,根據用戶需求在打上標簽的視頻源數據庫中進行檢索,將視頻流根據用戶終端類型進行處理后傳輸。本發明提出的方法為用戶提供的服務效率高,實時性好,具有較高的應用價值。文檔編號H04L29/08GK101834837SQ20091024254公開日2010年9月15日申請日期2009年12月18日優先權日2009年12月18日發明者孫波,杜軍平,王寶增,王肅申請人:北京郵電大學