專利名稱:一種基于技能學習的智能解答方法與系統的制作方法
技術領域:
本發明涉及計算機智能教學以及數字出版領域,尤其涉及一種基于技能學習的智能解答方法和系統。
背景技術:
人們在學習一些技能操作時,一般通過師傅傳授的方式,隨著科技進步,數字出版的發展,教材的形式發生著重大變化,人們可以通過一個智能的系統來學習技能知識。操作技能就是指掌握操作方法的能力,任意一個操作方法都是由一些更小的操作按一定的流程組成。計算機技術可以根據每個操作流程的一維定義,推理出一個操作技能所包含的操作方法有哪幾種組合。每一個操作方法都有一個完整的教材內容與之匹配,因此,學生向智能系統提出某一項技能的學習請求后,智能系統會為學生提供一個對應的教材內容組合。然而,如何能夠準確地提供教材內容組合是此領域的一個難題。
發明內容
鑒于現有技術的問題,本發明提供一種基于技能學習的智能解答方法,其特征在于包括如下步驟(I)以最小的完整操作技能為基本單元將教材內容拆分為多個片斷,并為每個片斷賦予用于標出每個片斷的所在章節及所在頁碼的信息的結構屬性;(2)將用于對所拆分的多個片斷進行語義描述所用到的詞進行規范并建立技能語義描述字典;(3)將每一個技能定義為一個技能本體,每一個技能本體由語義字典中的語義詞按一定的邏輯關系組成;(4)根據所述技能本體,對所述多個片斷的每一個進行語義描述;(5)根據各個技能之間的邏輯關系來建立一個基于技能本體的邏輯模型;(6)通過語義檢索分析用戶提出的技能需求,根據基于技能本體的邏輯模型推理出用戶所提出的技能由多少種子操作組合而成,每一個操作都是一個本體,根據本體中的語義詞以及其邏輯關系或者根據每一個本體的ID號,檢索出通過該本體來描述語義的片斷,并根據相應片斷的結構屬性提取出相對應的教材內容。此外,本發明還提供一種基于技能學習的智能解答系統,其特征在于包括如下裝置用于以最小的完整操作技能為基本單元將教材內容拆分為多個片斷,并為每個片斷賦予用于標出每個片斷的所在章節及所在頁碼的信息的結構屬性的裝置;用于對所拆分的多個片斷進行語義描述所用到的詞進行規范并建立技能語義描述字典的裝置;用于將每一個技能定義為一個技能本體,并且使每一個技能本體由語義字典中的語義詞按一定的邏輯關系組成的裝置;用于根據所述技能本體,對所述多個片斷的每一個進行語義描述的裝置; 用于根據各個技能之間的邏輯關系來建立一個基于技能本體的邏輯模型的裝置;用于通過語義檢索分析用戶提出的技能需求,根據基于技能本體的邏輯模型推理出用戶所提出的技能由多少種子操作組合而成,其中每一個操作都是一個本體,然后根據本體中的語義詞以及其邏輯關系或者根據每一個本體的ID號,檢索出通過該本體來描述語義的片斷,并根據相應片斷的結構屬性提取出相對應的教材內容的裝置。
本發明能夠實現教材的片斷內容的技能語義描述,教材不再是完整的、不可分割的,而是被有目的地分成若干個片斷,每一個片斷都對應著一個技能,教材以及相關的海量的圖書以及多媒體課件最終形成了海量的知識庫,而不是簡單的數據庫。讀者的提出的每一個關于技能學習的問題都能從知識庫中檢索到一個或多個可選擇的方案,讀者可以通過該系統與方法舉一反三,學習到更多、更廣的技能知識。甚至可以幫讀者解決從未遇到過的復雜問題。
圖I是本發明基于技能學習的智能解答方法的數據處理流程圖。
具體實施例方式為使本發明的上述目的、特征和優點更加明顯易懂,下面結合附圖和具體實施方式
對本發明作進一步詳細的說明。圖I是本發明基于技能學習的智能解答方法的數據處理流程圖,該處理流程包括如下步驟(I)以最小的完整操作技能為基本單元將教材內容拆分為多個片斷,并為每個片斷賦予用于標出每個片斷的所在章節及所在頁碼的信息的結構屬性;教材的內容可以看成一個一維的陣列,在一個一維陣列中可以任意提取一個子列。因此,教材的內容可以很容易地被人工或工具拆分成沒有嵌套及先后順序關系的片斷。 對于視頻、動畫兩樣如此。在該步驟中,以一個最小的完整操作技能作為最小單元來拆分教材內容,從教材中(包含圖書、視頻、動畫等)識別這些基本單元,使分割的片斷內容基本上包含了一個基本的操作方法;所拆分的片斷之間是并列關系的結構。拆分時要讀取片斷在原書內容的位置以及樣式的信息,并保存在文本中。這種“最小操作技能”并非絕對最小, 用戶可根據拆分難度與操作技能的粒度之間平衡一個最佳的選擇。因為一般情況下,越大的操作越容易拆分,但應用效果不好,反之亦然。(2)將用于對所拆分的多個片斷進行語義描述所用到的詞進行規范并建立技能語義描述字典;在該步驟中,為了讓其它工具更好識別這些語義,我們對語義描述中所用到的一些詞可以做一個規范,建立一個技能語義描述字典。例如,對OP i = (0 i, A i, AK i, C i)中的每個取值做如下說明屬性名、取值范圍、詳細說明
ID 屬性=id;ID取值范圍=整型;0.屬性名=主體詞;0 取值范圍=任意名詞;0.說明=語義所描述的對象A.屬性名=謂體詞;A.取值范圍=任意動詞或系動詞+名詞;A.說明=語義所描述的對象的功能性說明;
AK.屬性名=謂體詞的補充說明;AK 取值范圍=任意詞;AK.說明=語義所描述的對象的功能性說明的進一步補充C.屬性名=約束條件;C.取值范圍=多元詞組;C.說明=從多個方面來說明對象功能的條件(3)將每一個技能定義為一個技能本體,每一個技能本體由語義字典中的語義詞按一定的邏輯關系組成;由于用戶要學習的技能分解為一系列的操作或者動作,為了便于對技能本身的表達,我們將每一個技能都定義為一個技能本體,雖然每一個技能又是由一個多元組,但這并不影響把每一個技能都定義為一個本體,因此本發明的本體要比一般意義上的本體要復雜,每一個本體都是二維的,其中的一維用于描述該項技能的操作特點,另外一維用于描述本體之間的邏輯關系。(4)根據所述技能本體,對所述多個片斷的每一個進行語義描述;根據每一個片斷的內容,編輯人員采用一個多元因子來描述該內容是可實現的。 這個多元因子的屬性是清楚的,沒有二義性,雖然多元因子的取值具有人為因素干擾而偏差,但是對于出版該教材的編輯人員以及審校流程來說,可以消除這種偏差。在該步驟中,對于片斷最小單元S,用DD描述語義特征,這一步必須是手工填加, 實現對片斷內容的抽象過程I、DD = U {OP i},OP i = (ID i, 0 i, A i, AK i, C i)S卩,用多個屬性組合(OP i)從其用途、意義、內容概括、相關問題等多方面來描述片斷⑶的。其中,DD為技能語義描述集合;它由若干技能的語義描述組成。技能語義描述OP i是一個五元組。其中ID i表示該技能的唯一識別號;0 i表示語義的主體;A i為語義的謂體;AK i為A i的補充關鍵字;C 1為約束條件,是一個多元組{0’11,(’21,(’31……}C,Ii = {NAME, VALUE}C,2i = {NAME, VALUE}C,3i = {NAME, VALUE}......舉例,對于軟件類教材的C,1,C,2,C,3,可以分別取值為:C,I. name = “類別”, C’ 2. name =“軟件名稱”,C’ 3. name = “版本”通過對每一個片斷內容進行技能的語義描述,使計算機系統可以識別出這段內容對應著一個操作技能。(5)根據各個技能之間的邏輯關系來建立一個基于技能本體的邏輯模型;在該步驟中,建立一個基于技能本體邏輯模型。本體邏輯的描述語言與工具較成熟,完全可以實現技能本體之間存在的組合與順序的邏輯關系。邏輯關系主要設計為組合關系、組合內的先后關系。即描述A操作由A1、A2、…… 組成。同時,Al在A2的前面。由此,建立一個本體描述模型,反映每一個操作(本體)與其它操作(本體)之間的邏輯關系。(6)通過語義檢索分析用戶提出的技能需求,根據基于技能本體的邏輯模型推理出用戶所提出的技能 由多少種子操作組合而成,每一個操作都是一個本體,根據本體中的語義詞以及其邏輯關系或者根據每一個本體的ID號,檢索出通過該本體來描述語義的片斷,并根據相應片斷的結構屬性提取出相對應的教材內容。在該步驟中,建立一個計算機系統,用來推理用戶提出的某種技能的學習內容。具體的方案是用戶提出需求-計算機通過語義檢索分析該技能是什么-計算機推理出該技能由多少種子操作組合而成一計算機列出多種組合一計算機推薦使用最多的或人為推薦的組合-用戶確認其中某一種組合方案-計算機根據本體中的語義詞以及其邏輯關系或者根據每一個本體的ID號,檢索出通過該本體來描述語義的片斷,從數據庫中提取出相對應的教材內容(含視頻、動畫等)。由此,把任意一個學生提出來的技能學習訴求,分解為若干個小操作技能的組合,最終提供每個操作技能的教材內容。基本本體邏輯描述的機器推理工具比較成熟,設計人員既可以通過成熟的工具來實現推理,也可以重新設計推理程序來實現機器推理的功能。本發明能夠實現教材的片斷內容的技能語義描述,教材不再是完整的、不可分割的,而是被有目的地分成若干個片斷,每一個片斷都對應著一個技能,教材以及相關的海量的圖書以及多媒體課件最終形成了海量的知識庫,而不是簡單的數據庫。讀者的提出的每一個關于技能學習的問題都能從知識庫中檢索到一個或多個可選擇的方案,讀者可以通過該系統與方法舉一反三,學習到更多、更廣的技能知識。甚至可以幫讀者解決從未遇到過的復雜問題。下面以具體應用實例進行描述,以使得對本發明的應用理解更直觀。第一步,內容結構拆分取自任意一本電子教材,格式可以是DOC\H)F\EPUB\INDD\等可以提取內容的文件,本文以WORD格式的電子圖書為例,說明本方案的實施過程。I. I用相應的軟件打開這種格式的電子圖書,如《MICROSOFT WORD》。或者I. 2啟動《希望結構拆分工具》,運行“文件導入”功能,把word文件導入系統。2.用WORD中的“選擇”工具,依次把文檔內容中的片斷,按照用戶所需要的方式 COPY出來,手動粘貼到任意一個XML編輯器中,最終把全部內容COPY出來。COPY過程中, 片斷之間可以有重復的內容,但不能有遺漏的內容。3. I在XML編輯器中,嚴格按照本發明的方法為每一個內容定義其片斷的結構屬性,包括所在章節及所在頁碼的信息等。或者3. 2在《希望結構拆分工具》中運行導入功能,把當前XML文件自動賦予屬性,包括所在章節及所在頁碼的信息等。取代2與3. I。功能流程1、計算機讀取文件并識別出所有標題的樣式,2、計算機根據樣式的特點確定該標題的結構屬性,取值范圍為章標題、節標題、小節標題、小小節標題。3、計算機讀取該標題的正確的頁碼信息。4、把所有讀取的標題內容做為元素組成一個XML文件,并給這些元素賦予結構與頁碼的屬性值。通過上述手動還是自動的方法,結果產生一個XML文件,其特點是每個片斷內容之間是并列關系,但每個片斷都具有反映層次關系的結構屬性,如果沒有結構屬性也可以,不影響到智能解答的功能,但是如果有結構屬性,那么可以使在技能語義的標注工作中相對方便些。第二步,數據的語義處理 運行《希望語義標注系統》,導入上一環節輸出的XML文件,在系統中運行“生成圖書結構”功能,此功能讀取XML文件各個元素的結構屬性,并根據其屬性來判斷各元素的先后與層次關系。功能流程1、計算機讀取XML文件中的所有標題元素。2、計算機根據標題元素的結構屬性值,結合章包含節,節包含小節,小節包含小小節的原理,重新組織元素的包含關系。3、計算機根據新的組織關系生成一個有包含層次關系的新的XML文件。運行“瀏覽XML”功能,在瀏覽窗口中查看XML文件,這時的XML文件是具有先后順序及層次關系的,進一步瀏覽并檢查是否有錯誤,如果有,可以用鼠標拖動方式調整位置關系。運行《希望語義標注系統》的“語義字典”模塊,建立技能語義字典以及技能本體之間的邏輯關系。語義字典實質上是由一個個技能點組成,每一個技能點是由多個詞組成的一句話。比如“新建文件的方法”運行《希望語義標注系統》中的“語義標注”模塊,可以看到完整的圖書內容及對應的XML結構以及語義樹(技能點組成的樹),然后對每一個元素(片斷內容)進行技能語義標注。如果有視頻、動畫等課件需要標注,則運行《希望語義標注系統》的多媒體標注模塊,把視頻、動畫等多媒體導入系統,并對每一個多媒體內容進行技能語義的標注,方法同第7條。上述兩步實現了內容的入庫工作。下述兩步將實現機器智能推理的功能。第三步,分析用戶輸入問題用戶通過學習平臺輸入關于技能的問題,如“如何用PHOTOSHOP CS4消除紅眼? ”。《希望語義分析引擎》分解用戶提問的問題。并且分析出這樣一個技能語義“主體(紅眼)-謂體(消除)-版本(PHOTOSHOP CS4) ”《希望語義分析引擎》推理技能語義,并且推理出如下結論方案一“I.新建文件 2. COPY原圖3.新建圖層4.粘貼圖像5……方案二“I.消除紅眼案例”(假設有這樣的標注)第四步,結果輸出12、《希望語義分析引擎》啟動數據檢索服務,根據上述11方法得出的結論,按語義檢索的方式去檢索,向用戶輸出教材內容。如I.新建文件--------《PHOTOSHOP CS4教材》第二章第一位節第3頁2. COPY JPG-----《PH0P0SH0P案例教學》第一章第三位節第23頁3. COPY JPG-----《如何使用COPY命令的視頻教學》
最后應當說明的是以上實施例僅用以說明本發明的技術方案而非對其限制;盡管參照較佳實施例對本發明進行了詳細的說明,所屬領域的普通技術人員應當理解依然可以對本發明的具體實施方式
進行修改或者對部分技術特征進行等同替換;而不脫離本發明技術方案的精神,其均應涵蓋在本發明請求保護的技術方案范圍當中。
權利要求
1.一種基于技能學習的智能解答方法,其特征在于包括如下步驟 (1)以最小的完整操作技能為基本單元將教材內容拆分為多個片斷,并為每個片斷賦予用于標出每個片斷的所在章節及所在頁碼的信息的結構屬性; (2)將用于對所拆分的多個片斷進行語義描述所用到的詞進行規范并建立技能語義描述字典; (3)將每一個技能定義為一個技能本體,每一個技能本體由語義字典中的語義詞按一定的邏輯關系組成; (4)根據所述技能本體,對所述多個片斷的每一個進行語義描述; (5)根據各個技能之間的邏輯關系來建立一個基于技能本體的邏輯模型; (6)通過語義檢索分析用戶提出的技能需求,根據基于技能本體的邏輯模型推理出用戶所提出的技能由多少種子操作組合而成,每一個操作都是一個本體,根據本體中的語義詞以及其邏輯關系或者根據每一個本體的ID號,檢索出通過該本體來描述語義的片斷,并根據相應片斷的結構屬性提取出相對應的教材內容。
2.根據權利要求I所述的基于技能學習的智能解答方法,其特征在于所拆分的多個片斷之間是并列關系的結構。
3.根據權利要求I所述的基于技能學習的智能解答方法,其特征在于在拆分成多個片斷時,要讀取片斷在原教材內容的位置以及樣式的信息,并保存在文件中。
4.根據權利要求I所述的基于技能學習的智能解答方法,其特征在于對所述多個片斷的每一個進行語義描述的方式是手工輸入。
5.根據權利要求I所述的基于技能學習的智能解答方法,其特征在于所述教材內容包括圖書、視頻、動畫。
6.一種基于技能學習的智能解答系統,其特征在于包括如下裝置 用于以最小的完整操作技能為基本單元將教材內容拆分為多個片斷,并為每個片斷賦予用于標出每個片斷的所在章節及所在頁碼的信息的結構屬性的裝置; 用于對所拆分的多個片斷進行語義描述所用到的詞進行規范并建立技能語義描述字典的裝置; 用于將每一個技能定義為一個技能本體,并且使每一個技能本體由語義字典中的語義詞按一定的邏輯關系組成的裝置; 用于根據所述技能本體,對所述多個片斷的每一個進行語義描述的裝置; 用于根據各個技能之間的邏輯關系來建立一個基于技能本體的邏輯模型的裝置; 用于通過語義檢索分析用戶提出的技能需求,根據基于技能本體的邏輯模型推理出用戶所提出的技能由多少種子操作組合而成,其中每一個操作都是一個本體,然后根據本體中的語義詞以及其邏輯關系或者根據每一個本體的ID號,檢索出通過該本體來描述語義的片斷,并根據相應片斷的結構屬性提取出相對應的教材內容的裝置。
7.根據權利要求6所述的基于技能學習的智能解答系統,其特征在于所拆分的多個片斷之間是并列關系的結構。
8.根據權利要求6所述的基于技能學習的智能解答系統,其特征在于在拆分成多個片斷時,要讀取片斷在原教材內容的位置以及樣式的信息,并保存在文件中。
9.根據權利要求6所述的基于技能學習的智能解答系統,其特征在于對所述多個片斷的每一個進行語義描述的方式是手工輸入。
10.根據權利要求6所述的基于技能學習的智能解答系統,其特征在于所述教材內容包括圖書、視頻、動畫。
全文摘要
一種基于技能學習的智能解答方法與系統,其以最小的完整操作技能為基本單元將教材內容拆分為多個片斷,并為每個片斷賦予用于標出每個片斷的所在章節及所在頁碼的信息的結構屬性;將用于對所拆分的多個片斷進行語義描述所用到的詞進行規范并建立技能語義描述字典;將每一個技能定義為一個技能本體,每一個技能本體由語義字典中的語義詞按一定的邏輯關系組成;然后對所述多個片斷的每一個進行語義描述;最后根據各個技能之間的邏輯關系通過語義檢索分析用戶提出的技能需求,根據基于技能本體的邏輯模型推理出用戶所提出的技能由多少種子操作組合而成并根據相應片斷的結構屬性提取出相對應的教材內容。
文檔編號G09B7/02GK102622920SQ20111031821
公開日2012年8月1日 申請日期2011年10月19日 優先權日2011年10月19日
發明者張訓軍 申請人:北京中科希望軟件股份有限公司