層次式數據分析方法
【技術領域】
[0001]本發明涉及一種層次式數據分析方法。更具體地講,涉及一種在利用基于以可擴展標記語言(XML extensible Markup Language)為基礎的結構的數據等具有基于標簽的層次式結構的數據來執行數據處理時,用于減少分析標簽層次結構所需的運算量及運算時間的層次式數據分析方法。
【背景技術】
[0002]XML文件是廣泛用于表示具有層次式結構的數據的文件格式。與超文本標記語言(HTML:HyperText Markup Language)等相比,XML文件的優點在于,具有用戶可直接對標簽結構進行定義的擴展性。
[0003]包含于XML文件的信息利用標簽來表示各個信息之間的連接關系。這些標簽具有樹形的層次結構。因此,為了對包含于XML文件的信息進行分析,需要預先執行對作為各個標簽的層次結構的樹形結構進行設置的工作。眾所周知,樹的節點數量為N時,探索樹所需的運算時間為O (log N)。雖然XML文件的樹形結構有可能是被很好地分配的樹形結構,但是在對具有高DEPTH的XML文件進行分析時,會需要更多的時間。因此,每次重新對具有高DEPTH的大容量XML文件的標簽層次結構進行分析會浪費運算量和運算時間。
[0004]【現有技術文獻】
[0005]第2013-0101153號韓國公開專利
[0006]第2008-0090647號韓國公開專利
【發明內容】
[0007]本發明要解決的技術問題在于,提供一種通過對XML文件等具有基于標簽的層次式結構的數據的標簽層次結構分析結果進行記錄,從而無需每當需要對記錄于XML文件的數據進行處理時都要重新對XML文件的標簽層次結構進行分析,而是利用已記錄的標簽層次結構分析結果來迅速地對記錄于XML文件的數據執行處理的方法。
[0008]本發明要解決的另一個技術問題在于,提供一種對分析對象文件的標簽層次結構分析結果進行記錄,并且分別按包含于分析對象文件的各個標簽將從根標簽到達相關的標簽的路徑作為所述標簽層次結構分析結果來進行記錄的方法。
[0009]本發明要解決的又一個技術問題在于,提供一種通過生成一眼就能夠掌握位于分析對象文件的各個標簽所適用的區域(即,位于初始標簽(〈tag〉)和終止標簽(〈/tag〉)之間)的句子結構的形態的數據結構來進行表示和記錄的方法。
[0010]本發明的技術問題不限于以上所述的技術問題,本領域技術人員通過以下的記載應該會清楚地理解未提及的其他的技術問題。
[0011]根據用于解決上述問題的本發明的一個實施例的層次式數據分析方法包括如下步驟:加載(load)包含數據的第一分析對象文件,所述數據具有基于標簽的層次式結構;對包含于所加載的所述第一分析對象文件的多個標簽(tag)的層次結構進行分析;利用所述分析的結果,將包含于所述第一分析對象文件的各個標簽的標簽路徑信息的列表記錄到存儲單兀。
[0012]根據一個實施例,所述各個標簽的標簽路徑信息可意味著位于從所述第一分析對象文件的根(root)標簽到所述各個標簽的路徑上的多個標簽的依次排列。
[0013]根據一個實施例,所述記錄的步驟可包括如下步驟:將關于包含于所述第一分析對象文件的第一標簽的所述標簽路徑信息記錄到存儲單元;將特定的分隔符字符串連接(string concatenat1n)到關于所述第一標簽的所述標簽路徑信息的末尾處;將關于包含于所述第一分析對象文件的第二標簽的所述標簽路徑信息字符串連接到所述分隔符后。此時,所述第二標簽可意味著在所述第一分析對象文件內位于緊挨所述第一標簽后的初始標簽。
[0014]根據一個實施例,所述記錄的步驟可包括如下步驟:對將所述標簽路徑信息的列表作為第一軸且將在所述第一分析對象文件內記載于與所述列表所包含的各個標簽路徑信息對應的標簽的區域的句子結構作為第二軸的二維數據進行顯示。
[0015]根據一個實施例,所述層次式數據分析方法還可包括如下步驟:將所述二維數據存儲到存儲單元。此時,具有所述二維數據結構的數據優選為是能夠根據棋盤式數據表(SPREAD SHEET)應用(Applicat1n)而被加載的數據。
[0016]根據一個實施例,所述層次式數據分析方法還可包括如下步驟:加載具有與所述第一分析對象文件相同的標簽層次結構的第二分析對象文件;加載記錄于所述存儲單元的標簽路徑信息的列表;對將所加載的所述標簽路徑信息的列表作為第一軸且將在所述第二分析對象文件內記載于與所加載的所述列表所包含的各個標簽路徑信息對應的標簽的區域的句子結構作為第二軸的二維數據進行顯示。
[0017]根據一個實施例,所述層次式數據分析方法可包括如下步驟:從所述存儲單元上刪除記錄于所述存儲單元的標簽路徑信息的列表中的至少一部分的標簽路徑信息;加載未被刪除的剩余標簽路徑信息;以所加載的所述剩余標簽路徑信息作為對象來檢索特定標簽的標簽路徑信息。此時,所述刪除的步驟可包括如下步驟:接收關于檢索范圍指定標簽的標簽路徑信息;刪除除所述檢索范圍指定標簽的標簽路徑信息及所述檢索范圍指定標簽的下級標簽的標簽路徑信息之外的所有標簽路徑信息。
[0018]根據一個實施例,所述層次式數據分析方法還可包括如下步驟:加載記錄于所述存儲單元的標簽路徑信息的整個列表;刪除所加載的所述標簽路徑信息的列表中的至少一部分的標簽路徑信息;將未被刪除的剩余標簽路徑信息作為對象來檢索特定標簽的標簽路徑信息。
[0019]根據如上所述的本發明,帶來能夠迅速分析XML文件的效果。
[0020]此外,能夠帶來如下效果:將XML文件的標簽結構存儲到存儲單元,并且在之后需要處理具有相同的標簽結構的其他的XML文件的數據時,通過加載存儲在所述存儲單元中的標簽結構來直接掌握標簽結構,并能夠利用該結果來迅速處理所述其他的XML文件的數據處理。
[0021]此外,利用第一軸配置各自的標簽的標簽路徑信息、第二軸配置各自的標簽適用區域內的句子結構的數據結構來顯示XML文件的分析結果,從而帶來能夠一眼掌握XML文件的結構的效果。具有所述第一軸、第二軸的數據結構通過棋盤式數據表(SPREAD SHEET)應用來被加載,從而可提高使用上的便利性。
【附圖說明】
[0022]圖1是根據本發明的一個實施例的層次式數據分析方法的順序圖。
[0023]圖2是XML文件的標簽結構示例。
[0024]圖3是將圖2中示出的文件的標簽結構用樹形表示的概念圖。
[0025]圖4是示出根據本發明的一個實施例的層次式數據分析方法來記錄的標簽路徑信息的列表的圖。
[0026]圖5是可接著圖1中示出的順序圖而執行的根據本發明的一個實施例的層次式數據分析方法的順序圖。
[0027]圖6是可接著圖1中示出的順序圖而執行的根據本發明的一個實施例的層次式數據分析方法的順序圖。
[0028]圖7是示出可根據本發明的一個實施例而生成的基于兩個軸的數據結構的圖。
[0029]圖8至圖10是可接著圖1中示出的順序圖而執行的根據本發明的一個實施例的層次式數據分析方法的順序圖。
[0030]圖11是可在執行根據圖8至圖10的層次式數據分析方法時被顯示的圖形用戶界面(GUI:Graphic User Interface)的不例。
[0031]圖12是示出在通過圖11中示出的GUI來執行檢索時的標簽路徑信息的列表中的刪除對象和檢索對象的圖。
[0032]圖13是根據本發明的另一個實施例的層次式數據分析裝置的構成圖。
【具體實施方式】
[0033]以下,將參照附圖對本發明的優選實施例進行詳細描述。本發明的優點及特征以及實現這些的方法通過參照附圖和詳細描述的實施例將會變得清楚。然而,本發明不限于以下公開的實施例,而是可以以彼此不同的形態實現,本實施例只是為了完整地公開本發明且向本發明所屬技術領域中具有通常的知識的技術人員完整地告知本發明的范圍而提供的,本發明僅由權利要求書所記載的范圍來確定。縱觀說明書,相同的標號表示相同的構成要素。
[0034]除非另有定義,否則這里使用的所有術語(包括技術術語和科學術語)具有與本發明所屬領域的普通技術人員所通常理解的意思相同的意思。除非另外明確定義,否則在通用字典中定義的術語不應以理想的或者過于正式的含義來解釋。本說明書中所使用的術語僅僅是為了描述實施例而使用,而不意圖限制本發明。在本說明書中,除非上下文另外明確指出,否則單數形式包括復數形式。還應理解的是,當在本說明書中使用術語“包含”及/或“包括”時,所提到的構成要素、步驟、操作及/或元件不排除存在或附加一個以上的其它構成要素、步驟、操作及/或元件。
[0035]應該理解的是,盡管在這里可使用術語第一、第二等來描述不同的元件、構成