本發明涉及傳輸控制,尤其涉及一種基于多臂老虎機的信息年齡學習路徑感知恢復方法。
背景技術:
1、在現代網絡環境中,隨著視頻流量的持續高速增長,以及虛擬現實、增強現實和360度視頻等新興應用的廣泛普及,對網絡技術的承載能力和傳輸服務質量提出了更高的要求。
2、在利用現有技術進行數據傳輸時,通常是發送端周期性地向接收端發送探測數據包,并設置超時閾值以監控各個重傳路徑的狀態,當探測數據包未能及時確認時,激活探針超時機制,促使發送端采取快速恢復和快速重傳策略,以保證數據傳輸的穩定性和可靠性。
3、然而,由于探針超時機制以數據包的確認延遲來評估路徑的可用性。對于數據新鮮度要求較高的流媒體視頻等應用,其重傳路徑切換感知遲緩,導致流媒體視頻傳輸服務質量的劣化,進而降低用戶體驗。因此,亟需提供一種方案改善上述問題。
技術實現思路
1、本發明的目的在于提供一種基于多臂老虎機的信息年齡學習路徑感知恢復方法,用以改善現有技術重傳路徑切換感知遲緩,導致流媒體視頻傳輸服務質量效率低下的問題。
2、本發明提供的一種基于多臂老虎機的信息年齡學習路徑感知恢復方法,采用如下的技術方案:
3、基于流媒體視頻的發送端和接收端建立數據傳輸圖,發送端向接收端發送多個主數據包,當數據傳輸失敗時,發送端向接收端發送多個重傳數據包,其中,發送端與接收端之間具有多條重傳路徑;
4、基于重傳數據包的生成時間和接收端的接收時間獲得所述重傳數據包的信息年齡,并對所述信息年齡進行平滑處理后獲得平滑后重傳數據包的信息年齡;
5、計算所述平滑后重傳數據包的信息年齡的均值和方差,并基于所述均值和方差更新每條重傳路徑的收益后獲得使得所述收益最大化的最優路徑,并在所述最優路徑中進行數據包的重傳。
6、本發明提供的一種基于多臂老虎機的信息年齡學習路徑感知恢復方法的有益效果在于,首先,本發明提出了重傳數據包的信息年齡概念,保證了重傳數據包的新鮮度,從而保證了流媒體數據進行傳輸的時效性,其次,利用貝葉斯可信邊界調節因子減少了計算資源需求,提高了數據的傳輸效率和準確性,最后,基于收益最大化設計了數據包的重傳機制,確保在路徑狀態變化時,能夠迅速采取措施,保證數據傳輸的穩定性和可靠性,提升了流媒體視頻傳輸的服務質量。
7、可選的,所述重傳數據包的信息年齡表示為:
8、;
9、其中,表示重傳數據包的信息年齡,表示接收端在路徑接收到重傳數據包的本地時間戳,表示發送端發送的第個重傳數據包的生成時間。
10、可選的,發送端向接收端發送多個主數據包時,若其中一個或者多個主數據包丟失,接收端向發送端發送重傳數據指令,發送端接收到所述重傳數據指令后開始向接收端上傳重傳數據包。
11、可選的,獲得使得所述收益最大化的最優路徑的過程包括:
12、初始化老虎機臂的數量、重傳數據包的信息年齡和策略集合,其中,每條臂對應一條重傳路徑,臂的數量為重傳路徑的數量,每條重傳路徑對應一個收益的概率分布,所述策略集合由重傳數據包、重傳路徑集合、丟失輪次集合和調度輪次集合組成;
13、在每一個時間步長內,基于探索概率從重傳路徑集合中隨機選取一條路徑進行數據包的傳輸,并基于利用概率選擇當前收益最大化的一條重傳路徑進行數據包的傳輸;
14、若數據傳輸成功,基于貝葉斯可信邊界調節因子更新當前收益;若傳輸失敗,接收端將數據包加入重傳數據包列表后返回發送端,發送端重新向接收端發送重傳數據包;
15、更新多臂老虎機當前選擇的拉桿的頻次,并基于所述拉桿的頻次獲取使得收益最大化的最優路徑,直到達到最大時間步長。
16、可選的,所述貝葉斯可信邊界調節因子可表示為:
17、;
18、其中,表示重傳路徑總數,表示平滑后重傳數據包信息年齡的方差,表示多臂老虎機當前選擇的拉桿的頻次。
19、可選的,所述多臂老虎機當前選擇的拉桿的頻次表示為:
20、;
21、其中,表示多臂老虎機當前選擇的拉桿的頻次,表示重傳數據包丟失輪次的次數。
22、可選的,基于貝葉斯可信邊界調節因子更新當前收益時,每條重傳路徑的收益值為:
23、<mstyle displaystyle="true" mathcolor="#000000"><mi>q</mi><mi>=</mi><msub><mi>e</mi><mrow><mi>r</mi><mi>~</mi><mi>π</mi></mrow></msub><mi>[</mi><mfrac><mn>1</mn><mrow><mi>e</mi><mi>(</mi><msub><mi>δ</mi><msub><mi>d</mi><mi>p</mi></msub></msub><mi>)</mi><mo>+</mo><msqrt><mfrac><mrow><mi>ln(|</mi><mi>p</mi><mi>|)</mi></mrow><mrow><msub><mi>n</mi><mi>t</mi></msub><mi>(</mi><msub><mi>d</mi><mi>p</mi></msub><mi>)</mi></mrow></mfrac><mi>·</mi><mi>θ</mi></msqrt></mrow></mfrac><mi>]</mi></mstyle>;
24、其中,表示每條重傳路徑的收益值,表示平滑后重傳數據包的信息年齡的均值,表示重傳路徑總數,表示多臂老虎機當前選擇的拉桿的頻次,表示貝葉斯可信邊界調節因子。
25、可選的,平滑后重傳數據包的信息年齡服從對數正態分布,滿足關系:,其中:
26、;
27、;
28、其中,表示平滑后重傳數據包的信息年齡,表示對數信息年齡的均值,表示對數信息年齡的方差,表示平滑后重傳數據包的信息年齡的方差,表示平滑后重傳數據包的信息年齡的均值。