基于云盤的文件顯示方法及裝置的制造方法
【技術領域】
[0001]本發明涉及一種信息技術領域,特別是涉及一種基于云盤的文件顯示方法及裝置。
【背景技術】
[0002]近些年來,隨著信息技術的不斷發展,互聯網技術越來越成熟,其中,云盤是由互聯網公司推出的在線存儲服務,向用戶提供文件的存儲、訪問、備份、共享等文件管理功能。有時用戶將內容相似的多個文件保存在云盤中,例如,在用戶撰寫文檔文件期間,用戶將每次經過撰寫但沒有完成的文檔文件保存在云盤中,以方便下次進行撰寫。
[0003]目前云盤通常會將用戶保存的所有文件進行排列顯示,然而當云盤中保存的文件較多,且包含有大量的內容相似的文件時,將所有文件全部進行排列顯示,會造成文件顯示的精度較低,進而使得用戶無法快速獲取到所需要的文件。
【發明內容】
[0004]有鑒于此,本發明提供一種基于云盤的文件顯示方法及裝置,主要目的在于可以提高文件顯示的精度,可以幫助用戶快速獲取到所需要的文件。
[0005]依據本發明一個方面,提供了一種基于云盤的文件顯示方法,包括:
[0006]獲取云盤中保存的文件;
[0007]檢測所述文件中是否存在文件信息的相似度大于或等于預設閾值的多個文件;
[0008]若存在,則對所述多個文件進行聚合顯示。
[0009]依據本發明另一個方面,提供了一種基于云盤的文件顯示裝置,包括:
[0010]獲取單元,用于獲取云盤中保存的文件;
[0011]檢測單元,用于檢測所述獲取單元獲取的文件中是否存在文件信息的相似度大于或等于預設閾值的多個文件;
[0012]顯示單元,用于若所述檢測單元檢測出所述文件中存在文件信息的相似度大于或等于預設閾值的多個文件,則對所述多個文件進行聚合顯示。
[0013]借由上述技術方案,本發明實施例提供的技術方案至少具有下列優點:
[0014]本發明提供的一種基于云盤的文件顯示方法及裝置,首先獲取云盤中保存的文件;然后檢測所述文件中是否存在文件信息的相似度大于或等于預設閾值的多個文件;若存在,則對所述多個文件進行聚合顯示。與目前將用戶保存的所有文件全部進行排列顯示的方式相比,本發明通過將文件信息的相似度大于或等于預設閾值的多個文件進行聚合顯示,可以提高文件的顯示精度,可以幫助用戶快速獲取到所需要的文件,可以提升用戶的體驗。
[0015]上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發明的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本發明的【具體實施方式】。
【附圖說明】
[0016]通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優選實施方式的目的,而并不認為是對本發明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0017]圖1示出了本發明實施例提供的一種基于云盤的文件顯示方法流程示意圖;
[0018]圖2示出了本發明實施例提供的另一種基于云盤的文件顯示方法流程示意圖;
[0019]圖3示出了本發明實施例提供的一種基于云盤的文件顯示裝置結構示意圖;
[0020]圖4示出了本發明實施例提供的另一種基于云盤的文件顯示裝置結構示意圖。
【具體實施方式】
[0021]下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。
[0022]本發明實施例提供了一種基于云盤的文件顯示方法,如圖1所示,所述方法包括:
[0023]101、獲取云盤中保存的文件。
[0024]其中,所述云盤可以為互聯網存儲工具,可以通過互聯網為企業和個人提供信息的存儲、讀取、共享、下載等服務,具有安全穩定、海量存儲的特點;相對于傳統的實體磁盤,云盤更加方便,用戶不需要把儲存重要資料的實體磁盤帶在身上,并可以實現通過互聯網從云盤讀取用戶所存儲的信息。所述文件可以為音頻文件、文檔文件、視頻文件等。
[0025]102、檢測所述文件中是否存在文件信息的相似度大于或等于預設閾值的多個文件。
[0026]其中,所述文件信息可以為文件內容信息、文件屬性信息等,所述文件屬性信息可以為文件名稱信息、文件上傳時間等。所述預設閾值可以按用戶需求進行配置,也可以由系統默認配置,本發明實施例不做限定,所述預設閾值具體可以為百分比值,例如,60%、80%等。
[0027]例如,可以將預設閾值配置為65%,云盤中保存有3個文件,當檢測出3個文件中存在文件信息的相似度大于或等于65%的兩個文件時,判定云盤中保存的文件中存在文件信息的相似度大于或等于預設閾值的多個文件;當檢測出3個文件中不存在文件信息的相似度大于或等于65%的兩個文件時,判定云盤中保存的文件中不存在文件信息的相似度大于或等于預設閾值的多個文件。
[0028]對于本發明實施例,可以首先獲取云盤中保存的各個文件的文件信息,然后對所述各個文件的文件信息的相似度進行計算,具體可以通過余弦定理、Jaccard Similarity方法、SIFT (Scale-1nvariant feature transform,尺度不變特征轉換)算法等方法對所述各個文件的文件信息的相似度進行計算,當對各個文件中文件文本信息進行相似度計算時,可以選用余弦定理方法,其中,所述文件文本信息可以為文件的文件內容信息中的文本信息,也可以為文件的文件名稱信息中的文本信息。所述余弦定理方法包括:首先通過TF-1DF (term frequency-1nverse document frequency,詞頻-逆向文件頻率)算法,提取兩個文件文本信息中的關鍵詞;再將每個文件文本信息中提取的關鍵詞合并成一個集合,并計算出每個文件對于該集合中的詞的詞頻;然后生成兩個文件各自的詞頻向量;最后計算兩個詞頻向量的余弦相似度,其中,余弦相似度的值越大就表示越相似。
[0029]進一步地,當對各個文件中的文件文本信息進行相似度計算時,還可以選用Jaccard Similarity方法,其中,所述Jaccard Similarity方法可以概括為將兩個集合的交集除以兩個集合的并集,所得到的結果就是兩個集合的相似度,而兩個集合可以分別表示為兩個文件中的文件文本信息,集合中的元素可以表示為文件文本信息中出現的詞語。
[0030]再進一步地,當對各個文件中文件圖像信息進行相似度計算時,可以選用SIFT算法,其中,所述文件圖像信息可以為文件的文件內容信息中的圖像信息。所述SIFT算法是一種電腦視覺的算法,用來偵測與描述圖像中的局部性特征,SIFT算法的實質是在不同的尺度空間上查找關鍵點,并計算出關鍵點的方向,SIFT算法所查找到的關鍵點是一些十分突出,不會因光照、仿射變換和噪音等因素而變化的點。SIFT算法具體可以分解為四部分,四部分包括:尺度空間極值檢測;關鍵點定位;方向確定;關鍵點描述。
[0031]103、若所述文件中存在文件信息的相似度大于或等于預設閾值的多個文件,則對所述多個文件進行聚合顯示。
[0032]例如,可以將預設閾值配置為70%,云盤中保存有4個文件,4個文件分別為文件1、文件2、文件3、文件4,并且計算出文件1中的文件內容信息與文件2中的文件內容信息之間的相似度為75%,文件1中的文件內容信息與文件3中的文件內容信息之間的相似度為20%,文件3中的文件內容信息與文件4中的文件內容信息之間的相似度為80%,可以確定云盤中保存的4個文件中,文件1中的文件內容信息與文件2中的文件內容信息之間的相似度大于70%,并且文件3中的文件內容信息與文件4中的文件內容信息之間的相似度大于70%,即文件1中的文件內容信息與文件2中的文件內容信息相似,并且文件3中的文件內容信息與文件4中的文件內容信息相似;可以將文件1對應的文件圖標和文件2對應的文件圖標進行疊加顯示,并且將文件3對應的文件圖標和文件4對應的文件圖標進行置加顯不。
[0033]本發明提供的一種基于云盤的文件顯示方法,首先獲取云盤中保存的文件;然后檢測所述文件中