專利名稱:應用于操作系統的文件分類管理系統及方法
技術領域:
本發明涉及一種應用于操作系統的文件分類管理系統及文件分類管理方法,尤其涉及一種對現有的操作系統的文件系統中的物理文件進行分類管理的文件分類管理系統及文件分類管理方法。
隨著計算機及因特網的迅速普及,人們開始利用計算機來管理各種各樣的文件。另外,通過因特網查找和下載所感興趣的信息資源也成為越來越多的人所感興趣的事情。
眾所周知,信息通常是以各種各樣的文件形式存儲在計算機中。而現有的對文件進行管理的操作系統通常按照目錄樹的形式對文件進行管理,其中與一個應用相關的所有文件都被放在系統或用戶為該應用所建立的目錄之下。例如在Windows操作系統之下,系統把Windows操作系統文件均放在“Windows”目錄之下。而用戶可能將自己的所有文件放在自己在計算機上所建立的目錄,例如“Mydocuments”之下。在存儲大量信息的文件服務器中,大量的各種各樣的文件也是按照目錄樹的方式被操作員人為分別放到不同的目錄之下。
在采用這種方式對文件進行管理的過程中,尤其是在存儲的文件很多的情況下,用戶在搜索涉及某個具體主題的文件時是比較費時的,要么他應該知道這些文件的具體內容,要么他就不得不在成千上萬的文件中一個個地進行查找,而后者的作法,在現今的信息爆炸的時代中基本上是不可行的。
本發明就是為克服現有技術的上述問題而提出的,其目的在于提供一種應用于操作系統的文件分類管理系統,從而可以根據文件所涉及的內容對文件進行管理。
本發明另一個目的是提供一種應用于操作系統的文件分類管理方法,用于根據文件內容對文件進行分類管理。
本發明又一個目的是提供一種根據文件的內容對文件進行分類的設備和方法。
本發明再一個目的是提供一種對文件進行分類瀏覽管理的操作系統桌面文件資源管理器和瀏覽管理方法。
本發明再一個目的是提供一種用于添加新的文件分類類別及分類標準的文件分類添加器和分類添加方法。
為了實現上述目的,本發明提供一種應用于操作系統的文件分類管理系統,所述文件管理系統用于對文件進行分類管理,其特征在于該文件分類管理系統根據文件的內容將物理存儲的文件分別映射到一個或多個邏輯類別之下進行管理。
根據本發明提供的應用于操作系統的文件分類管理系統包括文件分類設備,用于按照文件的內容對文件進行分類;分類器,用于存放與各邏輯類別對應的分類標準以在對文件進行分類時進行參照;文件分類映射數據庫,用于存放文件分類結果。
根據本發明提供的文件分類設備包括文件信息抽取裝置,用于從一個待分類的文件中抽取關于文件類型及相關文件內容的信息;文件信息分析裝置,用于將所述抽取出的信息進行分析;文件分類裝置,用于將分析結果提供給分類器,并將分類器對文件與各邏輯類別進行匹配后找出的一個或多個最優的匹配結果存放到文件分類映射數據庫。
根據本發明提供的應用于操作系統的文件分類管理系統還包括一個操作系統桌面文件資源管理器,其中該操作系統桌面文件資源管理器以樹的形式顯示各類別及各類別之下的各文件信息。
根據本發明的應用于操作系統的文件分類管理系統還包括一個分類添加器,用于添加新的類別及與該類別對應的分類標準。
本發明還提供一種應用于操作系統的文件分類管理方法,所述文件管理方法用于對文件進行分類管理,其特征在于根據文件的內容將物理存儲的文件分別映射到一個或多個邏輯類別之下進行管理。
根據本發明的文件分類管理方法包括對文件進行分類的步驟,用于根據文件的內容對文件進行分類。
根據本發明的文件分類步驟包括如下子步驟從一個待分類的文件中抽取關于文件類型及相關文件內容的信息;將所述抽取出的信息進行分析;將分析結果按照預先存儲的關于分類的標準與各邏輯類別進行匹配,找出一個或多個最優的匹配結果,并將該分類結果存儲到一個文件分類映射數據庫中。
根據本發明的文件分類管理方法進一步包括應用于操作系統中對文件進行桌面分類瀏覽管理的步驟,用于以樹的形式顯示各類別及各類別之下的各文件信息。
根據本發明的文件分類管理方法還包括一個分類添加步驟,用于添加新的類別及與該類別對應的分類標準。
通過本發明的應用于操作系統的文件分類管理系統和方法,通過將文件按照其內容所涉及的主題進行分類管理和顯示,使得用戶可以直接選擇自己感興趣的主題進行瀏覽。從而使得人機界面更為友好。
下面將參考附圖對本發明的優選實施例進行詳細描述。
圖1是根據本發明的應用于操作系統的文件分類管理系統的概念圖。
圖2是根據本發明一個優選實施例的應用于操作系統的文件分類管理系統的結構方框圖。
圖3是根據本發明的進行文件分類的流程圖。
圖4是根據本發明的操作系統桌面文件資源管理器進行文件分類顯示的示意圖。
圖5是根據本發明的操作系統桌面文件資源管理器進行文件分類顯示的另一個示意圖。
如圖1所示,該圖示出根據本發明的應用于操作系統的文件分類管理系統的概念模式圖。其中,本發明的應用于操作系統的文件分類管理系統102對計算機等電子設備中物理存儲的文件系統101中的所有文件,根據其內容進行分類,從而將這些文件分別映射到各個類別1~類別n中。這種映射,也即分類的方法將在以后詳細描述。通過該概念模式圖可以容易地看出,本發明的文件分類管理系統實際上起到了用戶和物理文件之間接口的作用,通過這種邏輯接口,直接呈現給用戶的是在邏輯類別之下的各個文件。從而用戶通過各種分類,直接查找到所有自己感興趣的所有文件,大大地提高了文件管理系統的易用性能,使得人機接口十分友好,方便用戶使用。
為了實現圖1所示的文件分類管理系統,下面將參考圖2至圖5描述該文件分類管理系統的主要構成及其功能。
圖2是根據本發明一個優選實施例的文件分類管理系統的主要構成的方框圖。
該文件分類管理系統2包括用于對文件進行分類的文件分類設備200;文件分類映射數據庫300,用于存放文件分類設備200對文件進行分類后的分類結果;操作系統桌面文件資源管理器400,用于按照文件內容分類顯示各文件;分類器505,用于存放與各類別對應的各分類標準,在文件分類設備200工作時進行參考;分類添加器500,在需要時用于添加新的分類及分類標準;如圖2所示,物理文件數據庫100是現有的物理文件系統,用于存儲個人計算機或服務器上大量的物理文件。本領域技術人員將能夠理解,在現有的操作系統下管理的所有文件均可認為存放在該物理文件數據庫100中。
根據本發明的文件分類設備200包括如下裝置文件信息抽取裝置202,該文件信息抽取裝置202用于從物理文件數據庫100中存放的待分類的文件中抽取文本信息,由于物理文件可能采用各種文件類型,例如.doc,.pdf,.lwp,.zip等等,因而為了以后進行分類時更精確,該文件信息抽取裝置202將首先檢測待分類文件的文件類型,然后根據各不同的文件格式從原始文件中抽取相應的文本信息。
文件信息分析裝置203,用于將從文件信息抽取裝置202中抽取出的文本信息分離成便于以后進行分類所需的小的信息塊。在本發明的實施例中,由于要使用后述的基于統計的方法的分類器將文件進行分類,因而文件信息分析裝置203將文本信息進一步分離成各獨立的單詞,并然后統計出關鍵詞出現的頻率,并將統計結果暫時存儲起來。當然,對于本領域技術人員來講,文件信息分析裝置203的功能可以根據在進行文件分類時所使用的分類器進行靈活設計,例如,如果分類器是根據文件結構信息設定的,那么文件信息分析裝置203所抽取的信息與基于統計的方法時所抽取的信息將有所不同,這一點對于本領域技術人員來講是很容易理解。
文件信息分類裝置204,將文件信息分析裝置203的分析結果提供給分類器505,分類器505按照預先存儲的分類標準將文件與各邏輯類別進行匹配,找出一個或多個最優匹配結果,將待分類的文件分配到相應的類別之下,然后文件信息分類裝置204將作為匹配結果的該文件的文件名及其所屬的類別存儲在文件分類映射數據庫300中,當然為了方便用戶查看,還可以同時存儲文件的其它屬性信息例如,最后更新時間,文件類型,文件大小等等。當然,為了提高處理速度減少處理負擔從而提高性能,還可以提供一個二級數據庫,用于暫時存放對文件分類映射數據庫300進行更新和增加的少量操作結果,并在特定的定時將二級數據庫的內容插入文件分類映射數據庫300。對于本領域的技術人員來講,很容易實現這種改進,因而不再描述。
圖3是根據本發明的文件分類設備進行文件分類的流程圖。
如圖所示,在步驟S1,當存在有待分類的文件時,首先文件信息抽取裝置202從待分類的文件中抽取信息。
然后,在步驟S2,文件信息分析裝置203將抽取的信息分析為適合于進行分類的小信息塊,在本發明優先實施例中,是將抽取的信息進一步分離成單詞,找出關鍵詞,統計關鍵詞的出現頻率。
在步驟S3,文件信息分類裝置204將在步驟S2中所得到的分析結果提供給分類器505,分類器505按照預先存儲的分類標準將文件與各邏輯類別進行匹配,找出一個或多個最優匹配結果,將待分類的文件分配到相應的類別之下,然后在步驟S4,文件信息分類裝置204將作為匹配結果的該文件的文件名及其所屬的類別存儲在文件分類映射數據庫300中。
在步驟S5,判斷是否還有未分類的文件,如果有則返回步驟S1繼續處理,否則結束進行文件分類的處理。
在文件分類設備200對物理文件數據庫100中的文件進行分類并將分類結果存放到文件分類映射數據庫300中之后,操作系統桌面文件資源管理器400可以根據文件分類映射數據庫300中的內容以樹型的結構顯示文件分類映射數據庫300中所涉及的各類別及各類別之下的子類別,并且當用戶選中一個類別時以列表的形式顯示該類別下的所有文件信息。
當然本領域的技術人員將能夠理解,文件分類設備200也可以在操作系統桌面文件資源管理器400對文件進行瀏覽的同時實時地對文件進行分類處理。
圖4是根據本發明的操作系統桌面文件資源管理器400進行文件分類顯示的示意圖,其中該操作系統桌面文件資源管理器400按照樹型的結構顯示上述文件分類映射數據庫中存儲的類別信息及各類別下的文件信息。如圖4左半部分所示,操作系統桌面文件資源管理器400以樹型的結構顯示文件分類映射數據庫中的各大類,即類別1、類別2、類別3…類別n,并且以樹型的結構顯示各大類之下的子類別,例如類別1下的子類別11、子類別12、子類別13…。當然各子類別之下還可能存在更多的子類別,該圖未詳盡示出。
圖4的右半部分是顯示當類別2被選中后,操作系統桌面文件資源管理器400將類別2下的子類別21、22、23及文件1、文件2…文件n以列表的形式顯示出來的示意圖。
圖5示出當子類別21被選中后,操作系統桌面文件資源管理器400所顯示的該子類別21下的所有文件信息。
從圖4和圖5的示意圖可以清楚地看出,本發明的操作系統桌面文件資源管理器通過將文件按照其內容所涉及的主題進行分類顯示,使得用戶可以直接選擇自己感興趣的主題進行瀏覽。從而使得人機界面更為友好。
另外,關于分類器505,前面已經描述,可以根據需要建立多種進行分類時所使用的分類標準。在本發明的優選實施例中,使用了基于統計分類算法的分類標準。該統計分類算法的基本原理是,首先設定統計分類標準模型及分類判決函數,其中該分類判決函數的參數值待定。然后對帶有類別標記的文件樣本進行統計分析,該統計分析的對象包括統計樣本中出現的關鍵字及其在樣本集合中出現的頻率等,并利用這些信息對分類判決函數的各參數按照某種原則(例如分類錯誤率最小)進行調整,最終得到該類別的分類標準,包括各關鍵詞對分類的權重等。當對未知類別的文件進行分類時,計算分類判決函數,當其值大于判決閾值時,則將該文件判為屬于該類別,否則判定為不屬于該類別。
另外,在本發明的另一個優選實施例中,由基于規則的方法設定分類標準。其中該規則可以是人為設定的分類標準,也可以是基于機器學習的分類標準。在對文件進行分類的時候,通過用這些規則規定的判定標準進行判斷,來確定將文件分類到什么類別之下。
此外,用戶可以根據需要在文件管理系統中添加新的分類,這可以通過根據本發明提供的一個分類添加器500將新的分類標準添加到分類器505中來實現。具體地說,在采用統計分類算法的優選實施例中,當用戶希望添加一個新的分類時,例如當用戶希望將“旅游”這個主題作為一個類別,從而在以后一旦出現涉及“旅游”主題的文件,就將其分類到“旅游”主題之下時。用戶僅需向分類添加器提供若干個均涉及“旅游”主題的文件,然后分類添加器將基于統計分類算法對該分類進行訓練,并將訓練結果作為具體的分類標準添加到分類器505中。
當然,本領域技術人員應該理解,基于不同的分類器505,可以對分類添加器500的功能進行靈活設計。
例如在對由人為地設定各分類及各分類標準的方法來實現分類器505的優選實施例中,分類添加器500的實現就比較簡單,即只要人為地設定新的分類及編制新的分類標準即可。
再例如,在對由機器學習的方法設定各分類及各分類標準的方法來實現分類器505的優選實施例中,分類添加器500的實現就較為復雜,這時要通過機器學習的方法設定新的分類及新的分類標準。
這樣根據本發明的文件管理系統具有學習的功能,從而使得用戶可以根據需要設定新的類別。
本發明的應用于操作系統的文件分類管理系統通過將已經存在的各物理文件按照其內容涉及的主題邏輯地映射到不同的類別之下,向用戶呈現邏輯類別下的各文件,為用戶提供一個管理文件的良好方法。本發明尤其適用于存儲了大量文件的文件服務器。
另外,本領域的技術人員將能夠理解,根據本發明的分類方法將物理文件進行映射時可能會將一個物理文件映射到兩個以上的類別之下。從而使得在進行檢索時可以從多個角度為用戶提供盡可能全面的資源。
此外,在對文件進行分類時,可以按照本發明的分類方法,由本發明的分類設備自動進行分類。另外,用戶自己可以人為地將文件分類到各類別之下。本領域的技術人員當然可以理解,在本發明的優選實施例的基礎上可以添加一個選擇裝置來提示用戶進行系統自動分類或人工分類,因此省略其說明。
另外,本領域的技術人員當然可以理解,根據本發明進行的分類可以是多層分類,即在涉及一個主題的主類別之下可以有多層涉及更詳細的主題的子類別。
本發明已經根據具體的實施例和附圖進行了詳細描述,但這些描述并非用于限制本發明。在不偏離本發明的精神和范圍內,可以對其進行修改和改進
權利要求
1.一種應用于操作系統的文件分類管理系統,所述文件分類管理系統用于對文件進行分類管理,其特征在于該文件分類管理系統根據文件的內容將物理存儲的文件分別映射到一個或多個邏輯類別之下進行管理。
2.根據權利要求1所述的文件分類管理系統,其特征在于該系統包括文件分類設備,用于按照文件的內容對文件進行分類;分類器,用于存放與各邏輯類別對應的分類標準,在文件分類設備對文件進行分類時進行參照;文件分類映射數據庫,用于存放文件分類結果。
3.根據權利要求2所述的文件分類管理系統,其特征在于該文件分類設備包括文件信息抽取裝置,用于從一個待分類的文件中抽取關于文件類型及相關文件內容的信息;文件信息分析裝置,用于將所述抽取出的信息進行分析;文件分類裝置,用于將分析結果提供給分類器,將分類器對文件與各邏輯類別進行匹配后找出的一個或多個最優的匹配結果存放到文件分類映射數據庫中。
4.根據權利要求1-3任一項所述的文件分類管理系統,其特征在于該文件分類管理系統還包括一個操作系統桌面文件資源管理器,其中該操作系統桌面文件資源管理器以樹的形式顯示各類別及各類別之下的各文件信息。
5.根據權利要求4所述的文件分類管理系統,其特征在于所述文件信息包括文件名。
6.根據權利要求5所述的文件分類管理系統,其特征在于所述文件信息進一步包括文件類型,文件大小,文件最后更新日期中的至少一個信息。
7.根據權利要求1所述的文件分類管理系統,其特征在于該系統包括一個選擇裝置,當選擇進行人工分類時,人工地將待分類的文件分類到一個或多個邏輯類別之下,當選擇進行自動分類時,由權利要求2-6任一項所述中的文件分類裝置進行分類。
8.根據權利要求7所述的文件分類管理系統,其特征在于所述分類器使用基于統計的方法設定的分類標準。
9.根據權利要求7所述的文件分類管理系統,其特征在于所述分類器使用基于規則的方法設定的分類標準。
10.根據權利要求9所述的文件分類管理系統,其特征在于所述規則是人為設定的分類規則。
11.根據權利要求9所述的文件分類管理系統,其特征在于所述規則是基于機器學習的分類規則。
12.根據權利要求1-11任一項所述的文件分類管理系統,其特征在于所述類別是多層分類的類別。
13.根據權利要求1-6任一項所述的文件分類管理系統,其特征在于該文件分類管理系統還包括一個分類添加器,用于添加新的類別及與該類別對應的分類標準。
14.根據權利要求13所述的文件分類管理系統,其特征在于所述分類添加器使用基于統計的方法添加新的分類標準。
15.根據權利要求13所述的文件分類管理系統,其特征在于所述分類添加器使用基于規則的方法添加新的分類標準。
16.根據權利要求15所述的文件分類管理系統,其特征在于所述規則是人為設定的分類規則。
17.根據權利要求15所述的文件分類管理系統,其特征在于所述規則是基于機器學習的分類規則。
18.一種應用于操作系統的文件分類管理方法,所述文件管理方法用于對文件進行分類管理,其特征在于根據文件的內容將物理存儲的文件分別映射到一個或多個邏輯類別之下進行管理。
19.根據權利要求18所述的文件分類管理方法,其特征在于包括對文件進行分類的步驟,用于根據文件的內容對文件進行分類。
20.根據權利要求19所述的文件分類管理方法,該文件分類步驟包括如下子步驟從一個待分類的文件中抽取關于文件類型及相關文件內容的信息;將所述抽取出的信息進行分析;將分析結果按照預先存儲的關于分類的標準與各邏輯類別進行匹配,找出一個或多個最優的匹配結果,并將該分類結果存儲到一個文件分類映射數據庫中。
21.根據權利要求18-20任一項所述的文件分類管理方法,其特征在于該文件分類管理方法進一步包括對文件進行分類瀏覽管理的步驟,用于以樹的形式顯示各類別及各類別之下的各文件信息。
22.根據權利要求21所述的文件分類管理方法,其特征在于所述文件信息包括文件名。
23.根據權利要求22所述的文件分類管理方法,其特征在于所述文件信息進一步包括文件類型,文件大小,文件最后更新日期中的至少一個信息。
24.根據權利要求18所述的文件分類管理方法,其特征在于還包括一個選擇步驟,當選擇進行人工分類時,人工地將待分類的文件分類到一個或多個邏輯類別之下,當選擇進行自動分類時,由權利要求19-23任一項所述中的文件分類步驟進行分類。
25.根據權利要求24所述的文件分類管理方法,其特征在于所述分類步驟使用基于統計的方法設定的分類標準。
26.根據權利要求24所述的文件分類管理方法,其特征在于所述分類步驟使用基于規則的方法設定的分類標準。
27.根據權利要求26所述的文件分類管理方法,其特征在于所述規則是人為設定的分類規則。
28.根據權利要求26所述的文件分類管理方法,其特征在于所述規則是基于機器學習的分類規則。
29.根據權利要求18-28任一項所述的文件分類管理方法,其特征在于所述類別是多層分類的類別。
30.根據權利要求18-23任一項所述的文件分類管理方法,其特征在于所述文件分類管理方法還包括一個分類添加步驟,用于添加新的類別及與該類別對應的分類標準。
31.根據權利要求30所述的文件分類管理方法,其特征在于所述分類添加步驟使用基于統計的方法添加新的標準。
32.根據權利要求30所述的文件分類管理方法,其特征在于所述分類添加步驟使用基于規則的方法添加新的標準。
33.根據權利要求32所述的文件分類管理方法,其特征在于所述規則是人為設定的分類規則。
34.根據權利要求32所述的文件分類管理方法,其特征在于所述規則是基于機器學習的分類規則。
全文摘要
本發明提供一種應用于操作系統的文件分類管理系統和方法,用于對文件進行分類管理。該文件分類管理系統根據文件的內容將物理存儲的文件分別映射到一個或多個邏輯類別之下進行管理。并且通過一個操作系統桌面文件資源管理器向用戶呈現各邏輯類別下的文件。這樣用戶不用與成千上萬個文件直接打交道,而是通過各種分類,直接查找到所有自己感興趣的所有文件,從而大大地提高了文件管理系統的易用性能,使得人機接口十分友好,方便用戶使用。
文檔編號G06F17/30GK1378158SQ01112130
公開日2002年11月6日 申請日期2001年3月29日 優先權日2001年3月29日
發明者張俐, 楊力平, 潘越, 劉 東 申請人:國際商業機器公司