一種交互式網絡電視內容調度方法及系統的制作方法
【技術領域】
[0001] 本發明涉及計算機多媒體、模式識別等領域,主要是一種基于邏輯斯回歸 (Logistic Regression)模型的交互式網絡電視(IPTV)內容調度方法及系統。
【背景技術】
[0002] 隨著網絡技術的發展,全球寬度用戶規模日益增加,而人們在網絡上獲取的信息 也越來越多的以圖像、聲音以及視頻等格式出現。數字化技術極大的方便了視頻信息的 存儲、傳輸和復制,使得數字視頻內容的數量飛速增長。以視頻點播服務(VOD,Video On Demand)為代表的視頻多媒體業務因其交互性和即時性,正在迅速成為互聯網的重要應用。
[0003] IPTV即IP電視,是利用寬帶IP網絡,以家用電視機或電腦作為終端,提供包括數 字電視節目在內的多種數字媒體服務。
[0004] 在IPTV業務中,點播主要集中在熱門節目,準確的預測出熱門的節目,可以減小 IPTV系統中的內容調整代價,提高資源利用率,提升用戶體驗等。Logistic Regression(下 稱LR)分類器適合于對兩類目標進行分類,其中,預測某部影片是否是熱門影片,這類、二 元分類為目前亟待解決的問題。
【發明內容】
[0005] 本發明所要解決的技術問題是,提供一種基于Logistic Regression預測的IPTV 內容調度系統與方法,以保證整個系統的服務質量最高,且存儲代價和調整代價最小化。
[0006] 為了解決上述技術問題,本發明公開了一種交互式網絡電視(IPTV)內容調度方 法,該方法包括 :
[0007] IPTV內容調度裝置獲取各電視節目不同歷史時間段的熱度數據,對所獲取的不同 歷史時間段的熱度數據分別進行預處理,使之滿足邏輯斯回歸(LR)模型的輸入數據格式 要求;
[0008] 將預處理后的不同歷史時間段的熱度數據作為LR模型的輸入,獲得各電視節目 熱度的預測結果;
[0009] 按照所述預測結果對所有電視節目進行分層,根據不同的電視節目分層的熱度不 同確定不同的存放份數,根據不同的電視節目分層和不同的存放規則,計算整體代價,選擇 整體代價最小的策略對整個系統進行內容調整。
[0010] 可選地,上述方法中,對所獲取的不同歷史時間段的熱度數據分別進行預處理的 過程如下:
[0011] 對所獲取的熱度數據中的每個輸入數據加1并取對數;
[0012] 計算取對數后的所有輸入數據的平均值,將所獲取的熱度數據中的每個輸入數據 除以所計算出的平均值。
[0013] 可選地,上述方法還包括LR模型的訓練,所述訓練過程如下:
[0014] 從點播日志歷史數據庫中取出當前時間之前m個時間段的點播日志數據,統計每 節目點播量m為大于等于3的正整數;
[0015] 對前一個時間段數據做預處理,得到輸入向量1 ;
[0016] 對前兩個時間段數據做預處理,得到輸入向量2 ;
[0017] 對前m個時間段數據做預處理,得到輸入向量3 ;
[0018] 得到輸入特征矩陣;
[0019] 根據經驗取前η個電視節目為熱門電視節目;
[0020] 對當前時間數據,LR模型被訓練的輸出向量,輸出向量根據節目是否熱門分為2 類,熱門為1,否則為〇。
[0021] 用LR模型對此輸入特征矩陣、輸出分類進行訓練。
[0022] 可選地,上述方法中,將預處理后的不同歷史時間段的熱度數據,作為LR模型的 輸入,獲得各電視節目熱度的預測結果的過程如下:
[0023] 獲取當前時間之前的6個時間段的歷史點播統計數據;
[0024] 對當前時間之前一個時間段的熱度數據做預處理,得到輸入向量1 ;
[0025] 對當前時間之前兩個時間段的熱度數據做預處理,得到輸入向量2 ;
[0026] 對當前時間之前6個時間段的熱度數據做預處理,得到輸入向量3 ;
[0027] 經過LR模型的計算得到預測結果;
[0028] 根據所需的電視節目的數目N,依次取預測結果排名的前N個電視節目作為熱門 電視節目。
[0029] 本發明還公開了一種交互式網絡電視(IPTV)內容調度系統,該系統包括:
[0030] 數據采集模塊,采集各電視節目不同歷史時間段的熱度數據;
[0031] 數據預處理模塊,對所采集的不同歷史時間段的熱度數據分別進行預處理,使之 滿足邏輯斯回歸(LR)模型的輸入數據格式要求;
[0032] LR預測模塊,將預處理后的不同歷史時間段的熱度數據作為LR模型的輸入,獲得 各電視節目熱度的預測結果;
[0033] 調整代價計算模塊,按照所述預測結果對所有電視節目進行分層,根據不同的電 視節目分層的熱度不同確定不同的存放份數,根據不同的電視節目分層和不同的存放規 貝1J,計算整體代價,選擇整體代價最小的策略對整個系統進行內容調整。
[0034] 可選地,上述系統中,所述數據預處理模塊對所采集的不同歷史時間段的熱度數 據分別進行預處理指:
[0035] 對所采集的熱度數據中的每個輸入數據加1并取對數;
[0036] 計算取對數后的所有輸入數據的平均值,將所獲取的熱度數據中的每個輸入數據 除以所計算出的平均值。
[0037] 可選地,上述系統中,所述LR預測模塊,還進行LR模型的訓練,從點播日志歷史數 據庫中取出當前時間之前m個時間段的點播日志數據,統計每節目點播量m為大于等于3 的正整數;
[0038] 對前一個時間段數據做預處理,得到輸入向量1 ;
[0039] 對前兩個時間段數據做預處理,得到輸入向量2 ;
[0040] 對前m個時間段數據做預處理,得到輸入向量3 ;
[0041] 得到輸入特征矩陣;
[0042] 根據經驗取前η個電視節目為熱門電視節目;
[0043] 對當前時間數據,LR模型被訓練的輸出向量,輸出向量根據節目是否熱門分為2 類,熱門為1,否則為0。
[0044] 用LR模型對此輸入特征矩陣、輸出分類進行訓練。
[0045] 可選地,上述系統中,所述LR預測模塊將預處理后的不同歷史時間段的熱度數 據,作為LR模型的輸入,獲得各電視節目熱度的預測結果指:
[0046] 獲取當前時間之前的6個時間段的歷史點播統計數據;
[0047] 對當前時間之前一個時間段的熱度數據做預處理,得到輸入向量1 ;
[0048] 對當前時間之前兩個時間段的熱度數據做預處理,得到輸入向量2 ;
[0049] 對當前時間之前6個時間段的熱度數據做預處理,得到輸入向量3 ;
[0050] 經過LR模型的計算得到預測結果;
[0051] 根據所需的電視節目的數目N,依次取預測結果排名的前N個電視節目作為熱門 電視節目。
[0052] 本申請技術方案基于LR模型進行熱門節目的預測,從而達到很高的精度,并且LR 算法簡單、計算復雜度小。本申請提出的內容調度方法以統籌考慮節目在網絡中的存儲代 價和運行時節目傳輸所需的網絡代價,從而能以最優的總體代價獲得最佳的服務性能。
【具體實施方式】
[0053] 圖1是本發明系統結構示意圖;
[0054] 圖2是本發明系統整體流程圖;
[0055] 圖3為本發明系統各模塊之間實現IPTV內容調度的具體流程圖;
[0056] 圖4是本發明節目的內容調度圖;
[0057] 圖5是本發明具體實施中節目內容調度圖。
【具體實施方式】 [0058]
[0059] 為使本發明的目的、技術方案和優點更加清楚明白,下文將結合附圖對本發明技 術方案作進一步詳細說明。需要說明的是,在不沖突的情況下,本申請的實施例和實施例中 的特征可以任意相互組合。
[0060] 實施例1
[0061] 本實施例提供一種基于Logistic Regression預測的IPTV內容調度系統,如圖1 所示,至少包括:
[0062] 數據通信接口,其包括若干接口模塊,用于和外界進行數據通信。
[0063] 需要說明的是,上述數據通信接口并非基于Logistic Regression預測的IPTV內 容調度系統的必須組成部分,該數據通信接口也可以放置在外界系統中。
[0064] 數據采集模塊,用于從外界獲取所需數據,即采集各電視節目不同歷史時間段的 熱度數據,并保存到本系統中。
[0