瀏覽器智能閱讀實現方法、裝置及其終端的制作方法
【技術領域】
[0001]本發明涉及瀏覽器技術領域,具體而言,涉及一種瀏覽器智能閱讀實現方法、裝置及其終端。
【背景技術】
[0002]隨著無線通訊技術和互聯網技術的飛速發展,目前在移動終端(例如,智能手機)上采用瀏覽器上網的用戶也越來越多。
[0003]為了提高用戶的瀏覽器使用體驗,各設備或方案提供商針對瀏覽器的各項功能也提出了多種改進方案,其中之一的閱讀模式便是用于方便用戶瀏覽多頁新聞或者小說類網頁而提出的一種瀏覽器附加功能。通過該閱讀模式功能,瀏覽器可以自動將具有多頁的新聞或小說類網頁的正文內容拼接在一起,以供用戶輕松地瀏覽,從而幫助用戶省去了頻繁翻頁的操作,并且無需用戶長時間多頻次的等待下頁加載的過程。
[0004]然而,本發明的發明人經研究發現,當前在瀏覽器上實現上述閱讀模式,主要還存在以下一些問題亟待解決:
[0005]第一、現有的瀏覽器支持的閱讀模式只是簡單地通過搜索“下一頁”等類似的文本標簽,并基于這些文本標簽來查找該網頁之后下頁的鏈接地址。但在實際情況之下,此類文本標簽在當前網頁中可能不止存在一個,也有可能存在較多的類似標簽,因此容易導致錯找或漏找真實的下頁鏈接地址,以致無法正確地加載下頁內容。
[0006]第二、現有的瀏覽器支持的閱讀模式在提取下頁的正文內容時,往往都是提取整個網頁的內容,例如其加載的內容同時還包括該當前頁面以前/以后節點的所有節點內容。
[0007]除此之外,該現有技術在提取已加載的頁面的正文內容時,對于各個頁面中重復的部分往往會重復提取,一則加大了處理能力的開銷,二則一定程度上影響了用戶的閱讀體驗。
【發明內容】
[0008]為了解決上述現有技術中的至少一個問題,本發明實施例的目的在于提供一種瀏覽器智能閱讀實現方法、裝置及其終端,其通過對比候選下頁標簽的鏈接地址與當前頁面的連接地址的相似度智能判別并準確地檢索到下文頁面的鏈接地址,從而提取下頁頁面的正文內容并拼接,從而可以極大地提高用戶的閱讀體驗。
[0009]為了達到本發明的目的,本發明采用以下技術方案實現:
[0010]一種瀏覽器智能閱讀實現方法,包括:
[0011]依據預先設置在當前頁面中檢索候選下頁標簽的鏈接信息,并選擇與當前頁面鏈接信息相似度最大的候選下頁標簽作為真實下頁標簽;
[0012]依據所述真實下頁標簽的鏈接信息預加載下頁頁面;
[0013]獲得下頁頁面的正文內容并將其拼接至該當前頁面。
[0014]優選地,所述預先設置為至少一個下頁加載鑒別符或自動觸發加載策略,所述下頁加載鑒別符至少定義了通過預定手勢觸發下頁頁面預加載或通過垂直滾動條的位置觸發下頁頁面預加載,所述自動觸發加載策略定義了至少一種通過預先配置的觸發規則自動觸發下頁頁面預加載。
[0015]優選地,所述通過預定手勢觸發下頁頁面預加載包括:
[0016]檢測與觸敏屏的接觸;
[0017]當所述接觸的軌跡延伸方向符合預定手勢時,即觸發下頁頁面預加載。
[0018]優選地,所述通過垂直滾動條的位置觸發下頁頁面預加載包括:
[0019]檢測垂直滾動條的當前位置;
[0020]當所述當前位置與預定的觸發位置相匹配時,即觸發下頁頁面預加載。
[0021]優選地,從候選下頁標簽中選擇真實下頁標簽包括:
[0022]檢索當前頁面中所有候選下頁標簽的鏈接信息;
[0023]采用以下數學式計算各候選下頁標簽的鏈接信息與當前頁面鏈接信息的相似度S:
[0024]S=T/N,其中,T為各候選下頁標簽的鏈接信息與當前頁面鏈接信息在相同位置上具有相同字符的個數,所述N為當前頁面鏈接信息的字符個數;
[0025]選取相似度最大且超出預定閾值的候選下頁標簽作為真實下頁標簽。
[0026]優選地,依據所述真實下頁標簽的鏈接信息獲得下頁頁面的正文內容包括:
[0027]分別獲取在文檔對象模型DOM樹中當前頁面以及真實下頁頁面的所有的節點集合,并將真實下頁頁面中與當前頁面屬性相同的節點予以濾除;
[0028]計算真實下頁頁面之中余下節點所包含正文的長度,并將正文長度最長的節點作為該真實下頁頁面的正文節點,并依據該正文節點獲取下頁頁面的正文內容。
[0029]一種瀏覽器智能閱讀實現裝置,其包括:
[0030]觸發檢索模塊,用于依據預先設置在當前頁面中檢索候選下頁標簽的鏈接信息;
[0031]主控模塊,用于在候選下頁標簽中選擇與當前頁面鏈接信息相似度最大的候選下頁標簽作為真實下頁標簽;
[0032]網頁預加載模塊,用于依據所述真實下頁標簽的鏈接信息預加載下頁頁面;
[0033]正文提取模塊,用于獲得下頁頁面的正文內容;
[0034]內容拼接模塊,用于將所述下頁頁面的正文內容拼接至該當前頁面。
[0035]優選地,所述預先設置為至少一個下頁加載鑒別符或自動觸發加載策略,所述下頁加載鑒別符至少定義了通過預定手勢觸發下頁頁面預加載或通過垂直滾動條的位置觸發下頁頁面預加載,所述自動觸發加載策略定義了至少一種通過預先配置的觸發規則自動觸發下頁頁面預加載。
[0036]優選地,所述觸發檢索模塊包括:
[0037]第一檢測模塊,用于檢測與觸敏屏的接觸;
[0038]第一觸發模塊,用于當所述接觸的軌跡延伸方向符合預定手勢時,即觸發下頁頁面加載。
[0039]優選地,所述觸發檢索模塊包括:
[0040]第二檢測模塊,用于檢測垂直滾動條的當前位置;
[0041]第二觸發模塊,用于當所述當前位置與預定的觸發位置相匹配時,即觸發下頁頁面預加載。
[0042]優選地,所述主控模塊包括:
[0043]檢索模塊,用于檢索當前頁面中所有候選下頁標簽的鏈接信息;
[0044]計算模塊,用于采用以下數學式計算各候選下頁標簽的鏈接信息與當前頁面鏈接信息的相似度S:
[0045]S=T/N,其中,T為各候選下頁標簽的鏈接信息與當前頁面鏈接信息在相同位置上具有相同字符的個數,所述N為當前頁面鏈接信息的字符個數;
[0046]判斷模塊,用于選取相似度最大且超出預定閾值的候選下頁標簽作為真實下頁標簽。
[0047]優選地,所述正文提取模塊包括:
[0048]過濾模塊,用于分別獲取在文檔對象模型DOM樹中當前頁面以及真實下頁頁面的所有的節點集合,并將真實下頁頁面中與當前頁面屬性相同的節點予以濾除;
[0049]提取模塊,用于計算真實下頁頁面之中余下節點所包含正文的長度,并將正文長度最長的節點作為該真實下頁頁面的正文節點,并依據該正文節點獲取下頁頁面的正文內容。
[0050]一種終端,其包括如上所述的瀏覽器智能閱讀實現裝置,所述裝置包括:
[0051]觸發檢索模塊,用于依據預先設置在當前頁面中檢索候選下頁標簽的鏈接信息;
[0052]主控模塊,用于在候選下頁標簽中選擇與當前頁面鏈接信息相似度最大的候選下頁標簽作為真實下頁標簽;
[0053]網頁預加載模塊,用于依據所述真實下頁標簽的鏈接信息預加載下頁