一種實時在線數據傳輸系統及課程數據遠程傳輸方法

文檔序號：7814949閱讀：248來源：國知局

一種實時在線數據傳輸系統及課程數據遠程傳輸方法
【專利摘要】本發明提供了一種實時在線數據傳輸系統，包括服務器和與之通信的應用端，所述服務器具有語音識別功能，服務器為2臺以上，各服務器之間互相連接且共享計算資源組成語音云；所述應用端為具有攝像系統、音頻輸入輸出功能，視頻數據壓縮功能，瀏覽功能，以及文字輸入輸出功能的設備。本發明還提供了一種課程數據遠程傳輸方法，提供語音輸入或視頻輸入進行授課和瀏覽，分別運用到云語音的語音識別技術和視頻壓縮技術，同時提供了實施在線交流。本發明使得網絡實時教學能夠維持高清晰度，又能夠減少網絡帶寬的消耗，增加網絡實時授課的流暢性和質量。
【專利說明】一種實時在線數據傳輸系統及課程數據遠程傳輸方法

【技術領域】
[0001]本發明涉及一種實時在線教育系統及課程數據遠程傳輸方法，屬于物流配送領域。

【背景技術】
[0002]隨著信息技術的發展，網絡化學習(E-Learning)作為一種新的學習方式逐漸流行起來。網絡化學習離不開由多媒體學習資源、網上學習社區及網絡技術平臺構成的全新的網絡學習環境。在網絡學習環境中，匯集了大量數據、檔案資料、程序、教學軟件、課件等課程資源，形成了一個高度綜合集成的資源庫。
[0003]傳統的E-Learning過程中，課程資源以網頁的形式存放在服務器中，訪問課程資源需要通過安裝了播放插件的瀏覽器來實現。用戶通過瀏覽器訪問學習網站，通過瀏覽網頁或播放在線視頻等來進行學習。
[0004]在現有的網絡化學習過程中，學習過程高度依賴播放插件，由于以瀏覽器作為宿主，出于對安全考慮，網頁腳本在本機的權限是受限的，只能訪問少量受限目錄，讀寫不方便，造成本地緩存無法自主控制。
[0005]此外，由于瀏覽器本身支持的媒體類型少，需要用戶另外安裝眾多的第三方播放插件，大量的插件其及版本問題讓瀏覽器的負擔加大，運行速度變慢，用戶使用不方便。

【發明內容】

[0006]為了解決現有技術的不足，本發明提供了一種實時在線教育系統及課程數據遠程傳輸方法，基于網頁的授課系統，只需要安裝插件，就可以登錄網頁使用。既能夠通過PC應用，又能夠通過以手機和平板電腦為代表，但不局限于手機和平板電腦的移動端使用。這樣解放了學生的空間束縛，讓學生能夠更加方便的接受授課。同時，本發明通過授課軟件的數據處理，使得網絡實時教學能夠維持高清晰度，又能夠減少網絡帶寬的消耗，增加網絡實時授課的流暢性和質量。
[0007]本發明提供了一種實時在線數據傳輸系統，包括服務器和與之通信的應用端，所述服務器具有語音識別功能，服務器為2臺以上，各服務器之間互相連接且共享計算資源組成語音云；所述應用端為具有攝像系統、音頻輸入輸出功能，視頻數據壓縮功能，瀏覽功能，以及文字輸入輸出功能的設備。
[0008]本發明還提供了一種課程數據遠程傳輸方法，其特征在于:應用端分為用于授課的應用端A以及用于瀏覽課程的應用端B，該方法具體包括以下步驟:
[0009](I)選擇采用語音輸入或采用視頻輸入；若采用語音輸入，則轉入步驟(2);若采用視頻輸入則轉入步驟(3)；
[0010](2)語音輸入過程:
[0011](2a)應用端A觸發語音識別過程；
[0012](2b)應用端A進行錄音以采集語音數據；
[0013](2c)應用端A將采集的語音數據發送至語音云；
[0014](2d)語音云對語音數據進行語音識別以將語音數據轉換為文字數據，生成記載文字數據的同步文本，將同步文本和語音數據進行存儲；
[0015](2e)語音云將同步文本和語音數據傳輸至應用端B以供瀏覽；
[0016](3)視頻輸入過程:
[0017](3a)應用端A觸發視頻壓縮過程；
[0018](3b)應用端A進行錄像以采集視頻數據；
[0019](3c)應用端A將采集的視頻數據壓縮，并上傳至服務器；
[0020](3d)服務器將壓縮后的視頻數據進行存儲，傳輸至應用端B ；
[0021](3e)應用端B將壓縮視頻解壓縮，以還原為原始分辨率的視頻數據以供瀏覽；
[0022](4)應用端B采集文字數據，并將文字數據上傳至服務器，服務器再將文字數據發送至應用端A和應用端B，以實現實時討論。
[0023]進一步地改進，應用端利用身份驗證方法區分本應用端為應用端A或應用端B，具體包括以下步驟:
[0024](Cl)應用端將登陸請求發送至存儲有身份信息的服務器；所述登陸請求至少包括用戶名、密碼和身份類型，身份類型為老師或學生；
[0025](c2)服務器驗證登陸請求是否同服務器存儲的身份信息一致；若一致，則通過身份驗證，并將身份類型傳輸回應用端；若不一致，則未通過身份驗證，提示用戶重新發送登陸請求；
[0026](c3)應用端根據從服務器反饋回的身份類型將本應用端設置為用于授課的應用端A或用于瀏覽的應用端B。
[0027]進一步地改進，步驟(2d)中，語音云的服務器中存儲有經驗數據；語音云進行語音識別時，將語音數據中無周期性規律的信號及背景噪聲信號去除，再根據各音節間存在的固有的信號停頓或突變確定每個音節的起止，從而獲取各單字的數字語音信號序列，再分別對各單字的數據進行識別，具體包括以下步驟:
[0028](2dl)對各單字識別相關參數的提取:對該單字的數字語音信號序列提取包絡線并進行波形分析，包括計算其上升時間及超調量，以及標定出該單字的數字語音信號序列基頻穩定階段的起點和終點；以波形兩個峰點之間計為一個周期，對該基頻穩定階段的波形進行周期界定，并計算出各個周期的基波頻率；及標定出該單字的數字語音信號序列的前端信息段；所述前端信息段，是指從該段數字語音信號序列的信號截取起點到基頻穩定階段起點之間的信號區段；
[0029]聲調識別:依據該單字的數字語音信號序列中周期變化的各信號時段的基波頻率的變化特征識別出該音節的聲調；
[0030]聲母識別:對該單字的數字語音信號序列的前端信息段進行波形動態時域分析，根據分析得到的包括有包絡線瞬態響應的上升時間長短及超調量大小在內的參數，結合經驗數據，識別出聲母；
[0031]韻母識別:用該單字的數字語音信號序列中除所述前端信息段外的余下信息段作為韻母識別處理的信息源；根據該信息段的基波數據分析出該信息段各周期變化時段的幅頻特性；以該幅頻特性的帶寬及矩形系數分別與韻母發音時共鳴腔的體積大小及張緊程度相對應，與收集統計得到的各韻母發音時共鳴腔體積大小及張緊程度的經驗數值進行比對，即可識別出該韻母；
[0032](2d2)將上述識別出的漢語語音聲母、韻母、聲調進行整合，輸出漢語單字拼音；
[0033]將識別出的各漢語單字拼音按時間順序進行組合，即形成漢語句子的拼音序列；所述聲母識別的方法步驟為:
[0034](2d21)標定出氣聲數據段:在本單字的數字語音信號序列的前端信息段里，標定出波形平穩期的起點；該起點與本單字的數字語音信號序列的起點之間的數據段，即為氣聲數據段；
[0035](2d22)將該氣聲數據段的時長與經驗閾值相比較，將聲母的類型劃分為有氣聲或無氣聲兩種類型；判斷無氣聲時，轉至(2d23);判斷有氣聲時，轉至(2d24)；
[0036](2d23)根據本單字的數字語音信號序列前端信息段的包絡線瞬態響應的上升時間長短，結合經驗數據，識別出聲母為w、m、n、r或I ;
[0037](2d24)對該單字的數字語音信號序列的前端信息段進行包絡檢波處理，計算其上升時間及超調量；將超調量大小與經驗閾值相比較，判斷是否存在爆鳴聲；判斷有爆鳴聲時，轉至(2d25);判斷無爆鳴聲時，轉至(2d26)；
[0038](2d25)結合經驗數據，根據超調量大小識別出聲母為p、t、g或k ;
[0039](2d26)進行氣聲長度分析:將所述氣聲數據段的長短與經驗閾值相比較，區分出短氣聲和長氣聲:
[0040]判斷為短氣聲時，將所述包絡線瞬態響應的上升時間與經驗閾值相比較，區分出聲母為b或d ;
[0041]判斷為長氣聲時,結合經驗數據,根據氣聲長度識別出聲母為f、h、z、c、s、j、q、x、zh、ch 或 sh0
[0042]進一步地改進，步驟(3c)進行視頻壓縮，具體包括以下步驟:
[0043](3cl)對于第一幀圖像；以上限量化因子作為當前幀量化因子對當前幀進行幀內編碼；
[0044](3c2)對于第一幀之后的圖像；判斷當前幀是否發生畫面切換，如果是則以上限量化因子作為當前幀量化因子對當前幀進行幀內編碼，否則根據參考幀量化因子計算得到當前幀量化因子，并根據當前幀量化因子對當前幀進行編碼。
[0045]進一步地改進，所述判斷當前幀是否發生畫面切換的步驟包括:統計當前幀與參與幀重建圖像像素值不同的像素點占整幀圖像的比例，當該比例大于預先設定的門限值時，得出發生畫面切換的結果，否則得出未發生畫面切換的結果。
[0046]進一步地改進，所述對當前幀整體進行幀內編碼的步驟包括:對于當前幀中各宏塊，根據當前幀中該宏塊內容變化劇烈程度和當前幀整體內容變化劇烈程度調整當前幀量化因子得到該宏塊的量化因子；將參考幀重建圖像中對于該宏塊的宏塊與該宏塊相減得到兩者的差值；對所述差值進行離散余弦變換；根據所述該宏塊的量化因子對離散余弦變換的結果進行量化處理；對量化后的數據進行數據編碼。
[0047]本發明基于其技術方案所具有的有益效果在于:
[0048](I)本發明的實時授課系統，是基于網頁的授課系統，只需要安裝插件，就可以登錄網頁使用。既能夠通過PC應用，又能夠通過以手機和平板電腦為代表，但不局限于手機和平板電腦的移動端使用。這樣解放了學生的空間束縛，讓學生能夠更加方便的接受授課;
[0049](2)傳統的網絡實時授課，經常會占用大量的寬帶資源。本發明通過授課軟件的數據處理，使得網絡實時教學能夠維持高清晰度，又能夠減少網絡帶寬的消耗，增加網絡實時授課的流暢性和質量；
[0050](3)傳統的聾啞人接受網絡授課，一般需要配相應的人員打字來解決問題。本發明應用開源語音識別技術，通過語音實時轉換為文字，不再需要專職的打字人員來專門打字。聾啞人可以任意選擇自己需要的教室進行上課，這樣，減輕了教育的投入，也有益于殘疾人接受和正常人一樣的教育。

【具體實施方式】
[0051]下面結合實施例對本發明作進一步說明。
[0052]本發明提供了一種實時在線數據傳輸系統，包括服務器和與之通信的應用端，所述服務器具有語音識別功能，服務器為2臺以上，各服務器之間互相連接且共享計算資源組成語音云；所述應用端為具有攝像系統、音頻輸入輸出功能，視頻數據壓縮功能，瀏覽功能，以及文字輸入輸出功能的設備。
[0053]本發明還提供了一種基于權利要求1所述系統的課程數據遠程傳輸方法，其特征在于:應用端分為用于授課的應用端A以及用于瀏覽課程的應用端B，該方法具體包括以下步驟:
[0054](I)選擇采用語音輸入或采用視頻輸入；若采用語音輸入，則轉入步驟(2);若采用視頻輸入則轉入步驟(3)；
[0055](2)語音輸入過程:
[0056](2a)應用端A觸發語音識別過程；
[0057](2b)應用端A進行錄音以采集語音數據；
[0058](2c)應用端A將采集的語音數據發送至語音云；
[0059](2d)語音云對語音數據進行語音識別以將語音數據轉換為文字數據，生成記載文字數據的同步文本，將同步文本和語音數據進行存儲；
[0060](2e)語音云將同步文本和語音數據傳輸至應用端B以供瀏覽；
[0061](3)視頻輸入過程:
[0062](3a)應用端A觸發視頻壓縮過程；
[0063](3b)應用端A進行錄像以采集視頻數據；
[0064](3c)應用端A將采集的視頻數據壓縮，并上傳至服務器；
[0065](3d)服務器將壓縮后的視頻數據進行存儲，傳輸至應用端B ；
[0066](3e)應用端B將壓縮視頻解壓縮，以還原為原始分辨率的視頻數據以供瀏覽；
[0067](4)應用端B采集文字數據，并將文字數據上傳至服務器，服務器再將文字數據發送至應用端A和應用端B，以實現實時討論。
[0068]其中應用端利用身份驗證方法區分本應用端為應用端A或應用端B，具體包括以下步驟:
[0069](Cl)應用端將登陸請求發送至存儲有身份信息的服務器；所述登陸請求至少包括用戶名、密碼和身份類型，身份類型為老師或學生；
[0070](c2)服務器驗證登陸請求是否同服務器存儲的身份信息一致；若一致，則通過身份驗證，并將身份類型傳輸回應用端；若不一致，則未通過身份驗證，提示用戶重新發送登陸請求；
[0071](c3)應用端根據從服務器反饋回的身份類型將本應用端設置為用于授課的應用端A或用于瀏覽的應用端B。
[0072]進一步地改進，步驟(2d)中，語音云的服務器中存儲有經驗數據；語音云進行語音識別時，將語音數據中無周期性規律的信號及背景噪聲信號去除，再根據各音節間存在的固有的信號停頓或突變確定每個音節的起止，從而獲取各單字的數字語音信號序列，再分別對各單字的數據進行識別，具體包括以下步驟:
[0073](2dl)對各單字識別相關參數的提取:對該單字的數字語音信號序列提取包絡線并進行波形分析，包括計算其上升時間及超調量，以及標定出該單字的數字語音信號序列基頻穩定階段的起點和終點；以波形兩個峰點之間計為一個周期，對該基頻穩定階段的波形進行周期界定，并計算出各個周期的基波頻率；及標定出該單字的數字語音信號序列的前端信息段；所述前端信息段，是指從該段數字語音信號序列的信號截取起點到基頻穩定階段起點之間的信號區段；
[0074]聲調識別:依據該單字的數字語音信號序列中周期變化的各信號時段的基波頻率的變化特征識別出該音節的聲調；
[0075]聲母識別:對該單字的數字語音信號序列的前端信息段進行波形動態時域分析，根據分析得到的包括有包絡線瞬態響應的上升時間長短及超調量大小在內的參數，結合經驗數據，識別出聲母；
[0076]韻母識別:用該單字的數字語音信號序列中除所述前端信息段外的余下信息段作為韻母識別處理的信息源；根據該信息段的基波數據分析出該信息段各周期變化時段的幅頻特性；以該幅頻特性的帶寬及矩形系數分別與韻母發音時共鳴腔的體積大小及張緊程度相對應，與收集統計得到的各韻母發音時共鳴腔體積大小及張緊程度的經驗數值進行比對，即可識別出該韻母；
[0077](2d2)將上述識別出的漢語語音聲母、韻母、聲調進行整合，輸出漢語單字拼音；
[0078]將識別出的各漢語單字拼音按時間順序進行組合，即形成漢語句子的拼音序列；所述聲母識別的方法步驟為:
[0079](2d21)標定出氣聲數據段:在本單字的數字語音信號序列的前端信息段里，標定出波形平穩期的起點；該起點與本單字的數字語音信號序列的起點之間的數據段，即為氣聲數據段；
[0080](2d22)將該氣聲數據段的時長與經驗閾值相比較，將聲母的類型劃分為有氣聲或無氣聲兩種類型；判斷無氣聲時，轉至(2d23);判斷有氣聲時，轉至(2d24)；
[0081](2d23)根據本單字的數字語音信號序列前端信息段的包絡線瞬態響應的上升時間長短，結合經驗數據，識別出聲母為w、m、n、r或I ;
[0082](2d24)對該單字的數字語音信號序列的前端信息段進行包絡檢波處理，計算其上升時間及超調量；將超調量大小與經驗閾值相比較，判斷是否存在爆鳴聲；判斷有爆鳴聲時，轉至(2d25);判斷無爆鳴聲時，轉至(2d26)；
[0083](2d25)結合經驗數據，根據超調量大小識別出聲母為p、t、g或k ;
[0084](2d26)進行氣聲長度分析:將所述氣聲數據段的長短與經驗閾值相比較，區分出短氣聲和長氣聲:
[0085]判斷為短氣聲時，將所述包絡線瞬態響應的上升時間與經驗閾值相比較，區分出聲母為b或d ;
[0086]判斷為長氣聲時,結合經驗數據,根據氣聲長度識別出聲母為f、h、z、c、s、j、q、x、zh、ch 或 sh0
[0087]進一步地改進，步驟(3c)進行視頻壓縮，具體包括以下步驟:
[0088](3cl)對于第一幀圖像；以上限量化因子作為當前幀量化因子對當前幀進行幀內編碼；
[0089](3c2)對于第一幀之后的圖像；判斷當前幀是否發生畫面切換，如果是則以上限量化因子作為當前幀量化因子對當前幀進行幀內編碼，否則根據參考幀量化因子計算得到當前幀量化因子，并根據當前幀量化因子對當前幀進行編碼。
[0090]進一步地改進，所述判斷當前幀是否發生畫面切換的步驟包括:統計當前幀與參與幀重建圖像像素值不同的像素點占整幀圖像的比例，當該比例大于預先設定的門限值時，得出發生畫面切換的結果，否則得出未發生畫面切換的結果。
[0091]進一步地改進，所述對當前幀整體進行幀內編碼的步驟包括:對于當前幀中各宏塊，根據當前幀中該宏塊內容變化劇烈程度和當前幀整體內容變化劇烈程度調整當前幀量化因子得到該宏塊的量化因子；將參考幀重建圖像中對于該宏塊的宏塊與該宏塊相減得到兩者的差值；對所述差值進行離散余弦變換；根據所述該宏塊的量化因子對離散余弦變換的結果進行量化處理；對量化后的數據進行數據編碼。
[0092]利用本發明提供的方法和系統，授課教師可以安排課程，制定課時，以及通知學生上課，以完成建設教室。授課教師安排語音授課，并且共享自己工作臺桌面授課，以進入會議。授課教師可以選擇語音輸入，以方便聾啞殘疾人學生聽課。使用者可以語音錄制授課過程。教師可以使用電子白板板書和學生進行交流。
[0093]當教師進行視頻授課的時候，視頻數據經過應用端的JAVA字程序，壓縮成低容量的圖像數據，經由服務器發送到各應用端，在應用端還原成高精度的視頻信息。
[0094]本發明可使用網頁交互式程序，使得從應用端的視頻信號，通過程序項的壓縮算法處理，大大縮減了視頻信號的容量。
[0095]本發明可使用網頁應用技術開發授課系統，使得應用端可以多樣化，包括但不局限于能夠加載網頁應用的PC，手機，平板電腦等應用端。
[0096]視頻信號可以由應用端存儲下來。
[0097]音頻信號可以由應用端存儲下來。
【權利要求】
1.一種實時在線數據傳輸系統，包括服務器和與之通信的應用端，其特征在于:所述服務器具有語音識別功能，服務器為2臺以上，各服務器之間互相連接且共享計算資源組成語音云；所述應用端為具有攝像系統、音頻輸入輸出功能，視頻數據壓縮功能，瀏覽功能，以及文字輸入輸出功能的設備。
2.一種基于權利要求1所述系統的課程數據遠程傳輸方法，其特征在于:應用端分為用于授課的應用端A以及用于瀏覽課程的應用端B，該方法具體包括以下步驟: (1)選擇采用語音輸入或采用視頻輸入；若采用語音輸入，則轉入步驟(2);若采用視頻輸入則轉入步驟(3)； (2)語音輸入過程: (2a)應用端A觸發語音識別過程； (2b)應用端A進行錄音以采集語音數據； (2c)應用端A將采集的語音數據發送至語音云； (2d)語音云對語音數據進行語音識別以將語音數據轉換為文字數據，生成記載文字數據的同步文本，將同步文本和語音數據進行存儲； (2e)語音云將同步文本和語音數據傳輸至應用端B以供瀏覽； (3)視頻輸入過程: (3a)應用端A觸發視頻壓縮過程； (3b)應用端A進行錄像以采集視頻數據； (3c)應用端A將采集的視頻數據壓縮，并上傳至服務器； (3d)服務器將壓縮后的視頻數據進行存儲，傳輸至應用端B ; (3e)應用端B將壓縮視頻解壓縮，以還原為原始分辨率的視頻數據以供瀏覽； (4)應用端B采集文字數據，并將文字數據上傳至服務器，服務器再將文字數據發送至應用端A和應用端B，以實現實時討論。
3.根據權利要求2所述的課程數據遠程傳輸方法，其特征在于:應用端利用身份驗證方法區分本應用端為應用端A或應用端B，具體包括以下步驟: (Cl)應用端將登陸請求發送至存儲有身份信息的服務器；所述登陸請求至少包括用戶名、密碼和身份類型，身份類型為老師或學生； (c2)服務器驗證登陸請求是否同服務器存儲的身份信息一致；若一致，則通過身份驗證，并將身份類型傳輸回應用端；若不一致，則未通過身份驗證，提示用戶重新發送登陸請求； (c3)應用端根據從服務器反饋回的身份類型將本應用端設置為用于授課的應用端A或用于瀏覽的應用端B。
4.根據權利要求2所述的課程數據遠程傳輸方法，其特征在于:步驟(2d)中，語音云的服務器中存儲有經驗數據；語音云進行語音識別時，將語音數據中無周期性規律的信號及背景噪聲信號去除，再根據各音節間存在的固有的信號停頓或突變確定每個音節的起止，從而獲取各單字的數字語音信號序列，再分別對各單字的數據進行識別，具體包括以下步驟: (2dl)對各單字識別相關參數的提取:對該單字的數字語音信號序列提取包絡線并進行波形分析，包括計算其上升時間及超調量，以及標定出該單字的數字語音信號序列基頻穩定階段的起點和終點；以波形兩個峰點之間計為一個周期，對該基頻穩定階段的波形進行周期界定，并計算出各個周期的基波頻率；及標定出該單字的數字語音信號序列的前端信息段；所述前端信息段，是指從該段數字語音信號序列的信號截取起點到基頻穩定階段起點之間的信號區段；聲調識別:依據該單字的數字語音信號序列中周期變化的各信號時段的基波頻率的變化特征識別出該音節的聲調；聲母識別:對該單字的數字語音信號序列的前端信息段進行波形動態時域分析，根據分析得到的包括有包絡線瞬態響應的上升時間長短及超調量大小在內的參數，結合經驗數據，識別出聲母；韻母識別:用該單字的數字語音信號序列中除所述前端信息段外的余下信息段作為韻母識別處理的信息源；根據該信息段的基波數據分析出該信息段各周期變化時段的幅頻特性；以該幅頻特性的帶寬及矩形系數分別與韻母發音時共鳴腔的體積大小及張緊程度相對應，與收集統計得到的各韻母發音時共鳴腔體積大小及張緊程度的經驗數值進行比對，即可識別出該韻母； (2d2)將上述識別出的漢語語音聲母、韻母、聲調進行整合，輸出漢語單字拼音；將識別出的各漢語單字拼音按時間順序進行組合，即形成漢語句子的拼音序列；所述聲母識別的方法步驟為: (2d21)標定出氣聲數據段:在本單字的數字語音信號序列的前端信息段里，標定出波形平穩期的起點；該起點與本單字的數字語音信號序列的起點之間的數據段，即為氣聲數據段； (2d22)將該氣聲數據段的時長與經驗閾值相比較，將聲母的類型劃分為有氣聲或無氣聲兩種類型；判斷無氣聲時，轉至(2d23);判斷有氣聲時，轉至(2d24)； (2d23)根據本單字的數字語音信號序列前端信息段的包絡線瞬態響應的上升時間長短，結合經驗數據，識別出聲母為w、m、n、r或I ; (2d24)對該單字的數字語音信號序列的前端信息段進行包絡檢波處理，計算其上升時間及超調量；將超調量大小與經驗閾值相比較，判斷是否存在爆鳴聲；判斷有爆鳴聲時，轉至(2d25);判斷無爆鳴聲時，轉至(2d26)； (2d25)結合經驗數據，根據超調量大小識別出聲母為p、t、g或k ; (2d26)進行氣聲長度分析:將所述氣聲數據段的長短與經驗閾值相比較，區分出短氣聲和長氣聲: 判斷為短氣聲時，將所述包絡線瞬態響應的上升時間與經驗閾值相比較，區分出聲母為b或d ; 判斷為長氣聲時，結合經驗數據，根據氣聲長度識別出聲母為f、h、z、C、S、j、q、X、zh、ch 或 sh0
5.根據權利要求2所述的課程數據遠程傳輸方法，其特征在于:步驟(3c)進行視頻壓縮，具體包括以下步驟: (3cl)對于第一幀圖像；以上限量化因子作為當前幀量化因子對當前幀進行幀內編碼； (3c2)對于第一幀之后的圖像；判斷當前幀是否發生畫面切換，如果是則以上限量化因子作為當前幀量化因子對當前幀進行幀內編碼，否則根據參考幀量化因子計算得到當前幀量化因子，并根據當前幀量化因子對當前幀進行編碼。
6.根據權利要求5所述的課程數據遠程傳輸方法，其特征在于:所述判斷當前幀是否發生畫面切換的步驟包括:統計當前幀與參與幀重建圖像像素值不同的像素點占整幀圖像的比例，當該比例大于預先設定的門限值時，得出發生畫面切換的結果，否則得出未發生畫面切換的結果。
7.根據權利要求6所述的課程數據遠程傳輸方法，其特征在于:所述對當前幀整體進行幀內編碼的步驟包括:對于當前幀中各宏塊，根據當前幀中該宏塊內容變化劇烈程度和當前幀整體內容變化劇烈程度調整當前幀量化因子得到該宏塊的量化因子；將參考幀重建圖像中對于該宏塊的宏塊與該宏塊相減得到兩者的差值；對所述差值進行離散余弦變換；根據所述該宏塊的量化因子對離散余弦變換的結果進行量化處理；對量化后的數據進行數據編碼。
【文檔編號】H04L29/08GK104202425SQ201410484485
【公開日】2014年12月10日申請日期:2014年9月19日優先權日:2014年9月19日
【發明者】孫淼申請人:武漢易象禪網絡科技有限公司

完整全部詳細技術資料下載