文本分析系統(tǒng)的制作方法
【專利摘要】本發(fā)明描述了一種文本分析系統(tǒng)。將自然語言輸入單元(1)布置為使用戶能夠以自然語言輸入自由文本(10)。將自然語言處理單元(2)布置為在輸入自由文本(10)的同時(shí)對(duì)自由文本(10)的至少部分進(jìn)行處理以獲得所述自由文本所表示的語義的顯式表示(11)。將顯式信息輸入單元(3)布置為使用戶能夠輸入與語義的顯式表示(11)有關(guān)的顯式信息(12)。所述系統(tǒng)包括用于在用戶仍正在輸入自由文本(10)的同時(shí)為用戶可視化顯式表示(11)的至少部分的可視化單元(4)。將用戶界面(5)布置為向用戶提供對(duì)自然語言輸入單元(1)和顯式信息輸入單元(3)兩者的同時(shí)訪問。
【專利說明】文本分析系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及文本分析。
【背景技術(shù)】
[0002]當(dāng)前電子健康記錄(EHR)系統(tǒng)被廣泛實(shí)施,以幫助管理患者記錄,提高分析人員評(píng)估保健質(zhì)量的能力,以及減少由于醫(yī)療差錯(cuò)造成的患者痛苦。臨床決策支持工具是利用EHR系統(tǒng)中收集的數(shù)據(jù)的值的主要部件。這樣的工具可以允許醫(yī)生采用所述信息/數(shù)據(jù)達(dá)成患者特有決策。盡管自然語言的文本描述是EHR數(shù)據(jù)中的主要模態(tài)之一,但是仍然有待開發(fā)出能夠從患者記錄中自動(dòng)、魯棒、準(zhǔn)確地提取有用信息的工具。
[0003]在臨床環(huán)境內(nèi)實(shí)施這樣的方法的顯著障礙在于缺乏機(jī)器/計(jì)算機(jī)可理解的臨床文本。由此這意味著計(jì)算機(jī)或者其他種類的機(jī)器不能提取在臨床實(shí)踐中建立的文本報(bào)告的含義。通常將諸如出院總結(jié)、放射和病理報(bào)告等的臨床報(bào)告存儲(chǔ)到自然語言文檔當(dāng)中,而不是存儲(chǔ)成令語義更加明了的結(jié)構(gòu)化數(shù)據(jù)格式。在實(shí)施更加先進(jìn)的支持工具,例如臨床決策支持(CDS)工具時(shí),這樣的結(jié)構(gòu)化的并且語義豐富的數(shù)據(jù)格式是有用的。為了克服這一障礙,已經(jīng)專門開發(fā)了各種自然語言處理(NLP)和機(jī)器學(xué)習(xí)技術(shù),以識(shí)別自由文本中的概念和關(guān)系。但是,這一領(lǐng)域內(nèi)的很多工作是采用科學(xué)文本數(shù)據(jù)進(jìn)行的,其在一些重要的方式上與在臨床報(bào)告中常被發(fā)現(xiàn)的語法自由的特異性文本存在區(qū)別。在實(shí)際的臨床情況下,采用NLP方案提取相關(guān)信息的任務(wù)已經(jīng)被證明是極為復(fù)雜的。盡管自由文本出于主觀和客觀的原因始終是臨床醫(yī)生報(bào)告的優(yōu)選方式,但是就語義的解釋而言計(jì)算機(jī)無法很好地處理自由文本。在臨床護(hù)理當(dāng)中收集的數(shù)據(jù)量不斷提高的同時(shí),臨床用戶要想了解所述數(shù)據(jù)的意義,以及過濾并提取出實(shí)際相關(guān)的信息條目變得越來越困難。在這一背景下,使數(shù)據(jù)可被計(jì)算機(jī)理解,包含隱藏在數(shù)據(jù)中的語義,變得非常有價(jià)值。例如,為了找出適于具體的臨床試驗(yàn)的患者,必須使試驗(yàn)的合格標(biāo)準(zhǔn)與患者記錄中的數(shù)據(jù)進(jìn)行可靠地比較。對(duì)臨床護(hù)理當(dāng)中收集的數(shù)據(jù)充分結(jié)構(gòu)化的方案在臨床領(lǐng)域已經(jīng)遇到了很多的阻力。此外,最近的研究認(rèn)為這樣的完全結(jié)構(gòu)化方案是不現(xiàn)實(shí)的而且是起反作用的,其原因在于臨床護(hù)理和相關(guān)聯(lián)報(bào)告的復(fù)雜性。
[0004]US 7, 493, 253B1公開了這樣一種系統(tǒng)和方法:既米用語言相關(guān)術(shù)語又米用概念的獨(dú)立于語言的形式本體(formal ontology)對(duì)自由文本文檔進(jìn)行索引,以提取自由文本文檔的深層含義。通過提供語言本體作為形式本體的一部分而教導(dǎo)自然語言理解系統(tǒng)什么是概念之間的適當(dāng)關(guān)系以及什么不是。語言本體含有有關(guān)語言如何起用的規(guī)則以及人類思維在表達(dá)人類意識(shí)層面的事實(shí)時(shí)所遵循的原理。
[0005]US 2011/0033093公開了一種報(bào)告放射信息的方法。提供了一種用于對(duì)放射圖像研究報(bào)告的內(nèi)容進(jìn)行圖形表示的系統(tǒng)和方法。而且還提供了一種用于呈現(xiàn)結(jié)構(gòu)化放射報(bào)告的內(nèi)容的系統(tǒng)和方法,所述報(bào)告在單一圖示當(dāng)中包含了多項(xiàng)成像研究及其對(duì)應(yīng)研究結(jié)果。采用放射知識(shí)的本體解釋報(bào)告內(nèi)容并生成要在圖形圖中顯示的信息。
【發(fā)明內(nèi)容】
[0006]具有對(duì)自由文本的改進(jìn)的分析,尤其是為計(jì)算機(jī)提供對(duì)自由文本的更深的理解將是有利的。為了更好地解決這一問題,本發(fā)明的第一方面提供了一種文本分析系統(tǒng),包括:
[0007]用于使用戶能夠以自然語言輸入自由文本的自然語言輸入單元;
[0008]用于在輸入文本的同時(shí)對(duì)文本的至少部分進(jìn)行處理以獲得所述自由文本所限定的語義的顯式表示的自然語言處理單元;以及
[0009]用于使用戶能夠輸入與語義的顯式表示有關(guān)的顯式信息的顯式信息輸入單元。
[0010]所描述的系統(tǒng)提供了一種有效率的方式來產(chǎn)生一般在報(bào)告工作流中生成的自由文本所表達(dá)的語義的顯式表示。所述顯式表示可以是結(jié)構(gòu)化的表示,或者尤其可以是機(jī)器可讀或機(jī)器可理解的表示。通過在用戶輸入自由文本時(shí)執(zhí)行自然語言處理,與此同時(shí)使用戶除了自由文本外還能夠提供與語義的顯式表示相關(guān)的顯式信息,收集有關(guān)自由文本的作者意在通過所述自由文本表達(dá)的語義的有價(jià)值的信息。至少可以通過兩種方式使用這樣的信息:首先,改進(jìn)描述該具體自由文本的語義的顯式表示,從而更好地理解文本所表示的語義。其次,改進(jìn)自然語言處理算法,從而對(duì)其參數(shù)進(jìn)行細(xì)調(diào),或者改進(jìn)自然語言處理算法中所使用的本體??梢詫⑺鱿到y(tǒng)布置為只要用戶已經(jīng)輸入了額外的文本或者只要用戶已經(jīng)提供了與語義的顯式表示有關(guān)的顯式信息,就持續(xù)地或者定期地更新所述自由文本所表示的語義的顯式表示。
[0011]所述系統(tǒng)可以包括可視化單元,其用于在用戶仍正在輸入自由文本的同時(shí),向用戶可視化顯式表示的至少部分。這允許用戶檢查所生成的顯式表示,并根據(jù)需要對(duì)其做出校正或添加。由于在用戶仍正在寫文檔的同時(shí)將所述表示呈現(xiàn)給了用戶,因而用戶更易于提供準(zhǔn)確的校正,因?yàn)橛脩糁浪蛩胍ㄟ^自由文檔表達(dá)什么。例如,只要已經(jīng)輸入了自由文檔的新的部分(例如句子),就可以對(duì)所述可視化進(jìn)行更新。
[0012]所述系統(tǒng)包括被布置成為用戶提供對(duì)自然語言輸入單元和顯式信息輸入單元兩者的同時(shí)訪問的用戶界面。例如,這可以采用圖形用戶界面元件或相互并排顯示的微件實(shí)現(xiàn),從而用戶能夠通過引發(fā)點(diǎn)擊事件或觸摸事件而選擇它們當(dāng)中的任何一者。因而,能夠使用戶采用自然語言輸入單元輸入一些自由文本,之后采用顯式信息輸入單元輸入一些顯式信息,爾后繼續(xù)輸入更多的自由文本。這樣,用戶能夠采用自由文本和顯式信息的組合向系統(tǒng)傳達(dá)預(yù)期的信息,并且能夠在用戶正輸入自由文本時(shí)直接對(duì)顯式信息做出任意校正。用戶不必執(zhí)行對(duì)數(shù)據(jù)的任何回顧性檢查來驗(yàn)證正確性。
[0013]可以將輸入單元布置為使用戶能夠確認(rèn)或拒絕語義的顯式表示。這允許所述系統(tǒng)響應(yīng)于拒絕而提議替代的顯式表示。或者,所述系統(tǒng)可以收集確認(rèn)/拒絕,并采用其作為信息對(duì)自然語言處理系統(tǒng)做出改進(jìn),如上文所述。
[0014]可以將輸入單元布置為使用戶能夠輸入與語義的顯式表示當(dāng)中的差錯(cuò)的校正有關(guān)的信息。可以采用該信息來改進(jìn)表示,或者收集自由文本和對(duì)應(yīng)的顯式語義表示的基礎(chǔ)事實(shí)對(duì)。
[0015]可以將所述輸入單元布置為使用戶能夠提供與概念實(shí)例或者兩個(gè)概念實(shí)例之間的語義關(guān)系的添加、改變或刪除有關(guān)的信息。這些是含有要包含在語義的顯式表示當(dāng)中的相關(guān)信息的信息片斷的例子。
[0016]所述系統(tǒng)可以包括關(guān)聯(lián)單元,其用于在自由文本的部分和語義的顯式表示的對(duì)應(yīng)部分之間建立關(guān)聯(lián),其中,語義的顯式表示的對(duì)應(yīng)部分表示文本的所述部分的語義。這允許執(zhí)行針對(duì)正確性的檢查,并且允許對(duì)導(dǎo)出顯式表示的部分之處進(jìn)行重構(gòu)。此外,在已經(jīng)對(duì)顯式表示的對(duì)應(yīng)部分做出了校正時(shí),其允許跟蹤不能對(duì)自由文本的哪一部分自動(dòng)處理。該信息有助于改進(jìn)自然語言處理系統(tǒng)。
[0017]可以將所述關(guān)聯(lián)單元布置為基于用戶所輸入的顯式信息而建立關(guān)聯(lián)。用戶的輸入可以提供所述輸入所涉及的自由文本部分的線索。例如,在用戶注意顯式表示中的差錯(cuò)并對(duì)其校正時(shí),就有所述校正涉及剛剛鍵入的文本部分的線索?;蛘?,可以將所述系統(tǒng)布置為使用戶能夠通過例如高亮顯示明確指示自由文本的部分,并且指示校正或者顯式語義的具體部分對(duì)應(yīng)于高亮顯示的自由文本部分。這提供了自由文本和顯式信息之間的關(guān)系的更為詳細(xì)的基礎(chǔ)事實(shí)信息。
[0018]所述系統(tǒng)可以包括更新單元,其用于基于用戶所輸入的顯式信息而生成文本所表示的語義的更新顯式表示。該更新單元使用用戶提供的輸入,來生成語義的改進(jìn)的更新顯式表不。
[0019]所述系統(tǒng)可以包括存儲(chǔ)單元,用于存儲(chǔ)自由文本以及以下中的至少兩項(xiàng):用戶所輸入的顯式信息、自然語言處理單元生成的語義的顯式表示、以及文本表示的語義的更新顯式表示。這允許檢查每種情況的校正連同所述自由文本。其提供了有關(guān)如何改進(jìn)自然語目處理系統(tǒng)的/[目息。
[0020]所述系統(tǒng)可以包括獎(jiǎng)勵(lì)發(fā)生器,其用于基于用戶輸入的與語義的顯式表示有關(guān)的顯式信息而生成對(duì)用戶的獎(jiǎng)勵(lì)的指示。這提供激勵(lì)用戶在使用所述系統(tǒng)時(shí)提供反饋。例如,可以通過獎(jiǎng)勵(lì)激勵(lì)醫(yī)生在他或她輸入報(bào)告的常規(guī)工作中提供有關(guān)語義的顯式表示的反饋。這樣,可以收集到在改進(jìn)自然語言處理系統(tǒng)時(shí)感興趣的有價(jià)值信息。
[0021]所述系統(tǒng)可以包括算法改進(jìn)單元,其用于基于用戶所輸入的顯式信息而改進(jìn)自然語言處理單元所使用的自然語言處理算法。這允許自動(dòng)改進(jìn)用于自然語言處理的算法,從而使將來需要的校正更少。
[0022]在另一方面當(dāng)中,本發(fā)明提供了一種包括所闡述的系統(tǒng)的工作站。
[0023]在另一方面當(dāng)中,本發(fā)明提供了一種用于提供電子報(bào)告工作流的保健信息系統(tǒng)。所述保健信息系統(tǒng)可以包括所闡述的系統(tǒng)。所述保健信息系統(tǒng)還可以包括用于存儲(chǔ)自由文本報(bào)告的電子健康記錄數(shù)據(jù)庫。所述系統(tǒng)在保健信息系統(tǒng)中的這一集成允許將反饋收集實(shí)現(xiàn)為保健工作流的整體部分。這樣,反饋收集可以更有效率,和/或所收集的反饋可以更加完整。
[0024]在另一方面當(dāng)中,本發(fā)明提供了一種文本分析方法,包括:
[0025]使用戶能夠以自然語言輸入自由文本;
[0026]在正輸入自由文本的同時(shí)采用自然語言處理對(duì)自由文本的至少部分進(jìn)行處理,以獲得所述自由文本所表示的語義的顯式表示;以及
[0027]使用戶能夠輸入與語義的顯式表示有關(guān)的顯式信息。
[0028]在另一方面當(dāng)中,本發(fā)明提供了一種包括指令的計(jì)算機(jī)程序產(chǎn)品,所述指令用于使處理器系統(tǒng)執(zhí)行所闡述的方法。
[0029]本領(lǐng)域的技術(shù)人員將會(huì)認(rèn)識(shí)到,可以通過任何認(rèn)為有用的方式組合兩個(gè)或更多上述本發(fā)明的實(shí)施例、實(shí)現(xiàn)方式和/或方面。[0030]本領(lǐng)域技術(shù)人員能夠基于本說明書執(zhí)行對(duì)工作站、保健信息系統(tǒng)、文本分析系統(tǒng)、方法和/或計(jì)算機(jī)程序產(chǎn)品的修改和變化,所述修改和變化對(duì)應(yīng)于所描述的對(duì)系統(tǒng)的修改和變化。
【專利附圖】
【附圖說明】
[0031]通過參考附圖本發(fā)明的這些和其他方面將變得顯而易見,并且將參考其得到闡述。
[0032]圖1是示出了文本分析系統(tǒng)的各方面的方框圖。
[0033]圖2是示出了文本分析方法的各方面的流程圖。
[0034]圖3是示出了文本分析系統(tǒng)的各方面的另一方框圖。
[0035]圖4示出了簡(jiǎn)化的本體和語義圖。
【具體實(shí)施方式】
[0036]圖1示意性地示出了文本分析系統(tǒng)的部件。可以在工作站上實(shí)現(xiàn)文本分析系統(tǒng),或者可以將其實(shí)現(xiàn)為諸如保健信息系統(tǒng)的分布式計(jì)算環(huán)境的部分。也可以采用專用電子電路實(shí)現(xiàn)所述系統(tǒng)。所述系統(tǒng)可以包括用戶接口硬件,例如顯示器、觸摸屏、鍵盤、定位裝置等,從而允許用戶對(duì)所述系統(tǒng)進(jìn)行操作,并提供本文所描述的用戶輸入。麥克風(fēng)連同語音識(shí)別軟件或硬件也可以是所述系統(tǒng)的一部分。所述系統(tǒng)可以包括或者操作地連接至數(shù)據(jù)存儲(chǔ)系統(tǒng),例如,數(shù)據(jù)庫系統(tǒng),尤其是健康記錄數(shù)據(jù)庫系統(tǒng)或醫(yī)院信息系統(tǒng),或者文件系統(tǒng),以存儲(chǔ)文檔,例如,所創(chuàng)建的自由文本文檔和/或以顯式格式表示自由文本文檔的語義的結(jié)構(gòu)化文檔。
[0037]也可以將所述系統(tǒng)實(shí)現(xiàn)為諸如放射報(bào)告系統(tǒng)或保健信息系統(tǒng)(如電子健康記錄系統(tǒng))的文檔創(chuàng)建系統(tǒng)的插件。這樣,可以將現(xiàn)有系統(tǒng)的報(bào)告特征擴(kuò)展為具有用于提取自由文本10報(bào)告的語義的顯式表示11的即時(shí)自然語言處理,以及對(duì)與正在創(chuàng)建的報(bào)告的語義的顯式表示11有關(guān)的由用戶提供的顯式語義信息12的即時(shí)收集。
[0038]所述系統(tǒng)可以包括自然語言輸入單元1,其被布置為使用戶能夠以自然語言輸入自由文本10。該自然語言輸入單元I可以包括常規(guī)文本編輯器或者具有實(shí)時(shí)語音識(shí)別的口授系統(tǒng)。但是,將自然語言輸入單元I布置為一接收到任何自由文本就將其轉(zhuǎn)發(fā)給所述自然語言處理單元。
[0039]自然語言輸入單元I還可以包括到保健信息系統(tǒng)的軟件接口。例如,所述系統(tǒng)可以是保健信息系統(tǒng)的插件。所述插件可以與保健信息系統(tǒng)通信??梢詫⑺霰=⌒畔⑾到y(tǒng)布置為定期向自然語言輸入單元I輸送由用戶經(jīng)由所述保健信息系統(tǒng)的報(bào)告子系統(tǒng)輸入的任何自由文本。也可以將這樣的自然語言輸入單元I連接至放射觀察站;例如,在查看圖像時(shí),可以自動(dòng)彈出文本輸入窗口,從而使醫(yī)生能夠提供對(duì)所述圖像的評(píng)述。
[0040]所述系統(tǒng)可以包括自然語言處理單元2,其被布置為在正在輸入的同時(shí)對(duì)自由文本的至少一部分進(jìn)行處理。因此,基于在到目前為止已經(jīng)輸入的自由文本的部分,利用不完整的文本信息開始所述處理。所述自然語言處理可以產(chǎn)生所述自由文本所表示的語義的顯式表示11。自然語言處理技術(shù)本身是本領(lǐng)域已知的。因此,這里不再對(duì)其詳細(xì)描述。但是,有可能應(yīng)用這樣的技術(shù),例如,模板匹配以及本體中定義的概念實(shí)例和概念實(shí)例之間的關(guān)系的識(shí)別,從而按照自由文本的表達(dá)建立語義概念實(shí)例及其關(guān)系的網(wǎng)絡(luò)??梢砸灾T如XML格式的計(jì)算機(jī)可讀格式表達(dá)這一顯式語義信息。這樣的計(jì)算機(jī)可讀格式可以與機(jī)器可理解格式兼容,例如,資源描述框架(RDF)、資源描述框架模式(RDFS)、網(wǎng)絡(luò)本體語言(OWL)。
[0041]所述系統(tǒng)可以包括顯式信息輸入單元3,其被布置為使用戶能夠輸入與語義的顯式表示11相關(guān)的顯式信息12。該顯式信息12可以包括自由文本所表達(dá)的顯式語義概念或者語義關(guān)系的指示??梢酝ㄟ^很多種不同的方式實(shí)現(xiàn)這樣的顯式信息輸入單元3。例如,有可能使用戶能夠輸入含有語義信息的XML代碼的片斷,如上文所述。或者,可以實(shí)施允許輸入顯式語義信息的各種圖形用戶界面元件。例如,可以呈現(xiàn)最有可能意指的概念和/或關(guān)系的列表,用戶能夠根據(jù)其做出選擇。這允許所述系統(tǒng)通過要求用戶從對(duì)自由文本的可能的不同解釋中做出選擇而解決自由文本中的歧義問題。在下文中將描述其他可能性。
[0042]所述系統(tǒng)可以包括可視化單元4,其用于在用戶仍然在輸入自由文本10的同時(shí)向用戶可視化顯式表示11的至少一部分。這樣的可視化能夠采取顯示顯式表示11的“原始版本”的形式。例如,假設(shè)所述原始版本包括XML,則可以采用XML查看器?;蛘撸蓤D形可視化。可以通過不同的方式實(shí)現(xiàn)這樣的圖形可視化。例如,可以將自由文本中所使用的概念實(shí)例做成圖形的節(jié)點(diǎn),并且可以通過表示節(jié)點(diǎn)的符號(hào)示出識(shí)別所述概念的術(shù)語??梢允褂霉?jié)點(diǎn)之間的邊來表示概念實(shí)例之間的關(guān)系??梢圆捎脙蓚€(gè)連接的概念實(shí)例之間的關(guān)系的種類的指示對(duì)所述邊加以注釋。
[0043]所述系統(tǒng)可以包括用戶界面5,其被布置用于為用戶提供對(duì)自然語言輸入單元I和顯式信息輸入單元3兩者的同時(shí)訪問。例如,可以在顯示設(shè)備上顯示兩個(gè)窗口,一個(gè)窗口用于輸入自由文本10,另一個(gè)用于輸入顯式信息12。例如,用于輸入自由文本10的窗口可以包括文本編輯器。用于輸入顯式信息12的窗口可以示出語義的顯式表示11的可視化??梢允褂脩裟軌蚺c作為后者的可視化進(jìn)行交互,從而做出改變或添加,以此作為輸入顯式信息12的方式。例如,可以使得采用具有節(jié)點(diǎn)和邊的圖形的圖形表示可交互,從而能夠?qū)呁戏藕?或能夠用更加適當(dāng)?shù)男g(shù)語替代節(jié)點(diǎn)中所示的術(shù)語,也可以提供其他種類的交互。
[0044]可以將顯式信息輸入單元3布置為使用戶能夠確認(rèn)或拒絕語義的顯式表示11。這可以采用簡(jiǎn)單的單選按鈕或復(fù)選按鈕實(shí)現(xiàn),并且可以將其存儲(chǔ)成布爾變量,以作為顯式信息12。
[0045]可以將顯式信息輸入單元3布置為使用戶能夠輸入與語義的顯式表示11中的校正相關(guān)的信息。如上文所述,這可以采用顯式表示11的可視化的拖/放以及其他交互實(shí)現(xiàn)。可替代地,所述系統(tǒng)可以提供命令提示符,其使得用戶能夠輸入校正作為命令,其可選地采用語音識(shí)別技術(shù)。
[0046]可以將顯式信息輸入單元3布置為使用戶能夠提供與概念實(shí)例或者兩個(gè)概念實(shí)例之間的語義關(guān)系的添加、改變或刪除相關(guān)的信息。而且,這可以采用拖放功能或者通過其他方式實(shí)現(xiàn),如上文所述或其它方式。
[0047]所述系統(tǒng)可以包括關(guān)聯(lián)單元6,其用于在自由文本10的一部分和語義的顯式表示11的對(duì)應(yīng)部分之間建立關(guān)聯(lián)。關(guān)聯(lián)單元6可以操作地連接至自然語言處理單元2,以接收有關(guān)從自由文本的哪部分提取哪些語義元素的信息。語義的顯式表示11的對(duì)應(yīng)部分應(yīng)當(dāng)表示與之相關(guān)聯(lián)的自由文本10的部分的語義。例如,可以將這些關(guān)聯(lián)存儲(chǔ)到存儲(chǔ)語義的顯式表示11的數(shù)據(jù)結(jié)構(gòu)內(nèi)。也可以將所述關(guān)聯(lián)存儲(chǔ)為單獨(dú)的數(shù)據(jù)結(jié)構(gòu)。
[0048]也可以將所述關(guān)聯(lián)單元布置為(還)基于用戶輸入的顯式信息來建立關(guān)聯(lián)。例如,可以使用戶能夠提供具體的語義構(gòu)造所涉及的文本部分的顯式指示。
[0049]所述系統(tǒng)可以包括更新單元7,其用于基于用戶輸入的顯式信息12,生成自由文本10所表示的語義的更新的顯式表示11’。這是所述系統(tǒng)的可選特征,因?yàn)樗鱿到y(tǒng)的一個(gè)應(yīng)用可以是收集顯式信息12作為反饋,從而能夠在將來對(duì)所述系統(tǒng)做出改進(jìn)。可以使更新單元7與顯式信息輸入單元集成,尤其是在由用戶提供顯式信息以作為對(duì)語義的顯式表示11、11’的編輯時(shí)。
[0050]所述系統(tǒng)可以包括存儲(chǔ)單元13。可以將這樣的存儲(chǔ)單元布置為記錄用戶經(jīng)由顯式信息輸入單元3對(duì)顯式表示11、11’所做的任何編輯。這樣,可以保存顯式信息12以供將來之用。這樣的將來使用可以包括改進(jìn)自然語言處理,例如,通過采用機(jī)器學(xué)習(xí)。另外或可替代地,可以將存儲(chǔ)單元13布置為存儲(chǔ)自然語言處理單元所生成的語義的顯式表示11和/或所述文本所表示的語義的更新的顯式表示11’。顯式信息12、顯式表示11和更新的顯式表示11’中的至少兩個(gè)可以允許識(shí)別出顯式表示11的哪些方面需要用戶校正。這允許識(shí)別并改進(jìn)所使用的自然語言處理算法的弱點(diǎn)。存儲(chǔ)自由文本10還允許對(duì)照顯式表示11、11’和/或顯式信息12,尤其是用戶對(duì)顯式表示11所做的校正來匹配顯式表示。
[0051]所述系統(tǒng)可以包括獎(jiǎng)勵(lì)發(fā)生器8,其被布置為在用戶輸入的與語義的顯式表示11有關(guān)的顯式信息12的基礎(chǔ)上生成對(duì)用戶的獎(jiǎng)勵(lì)的指示??梢宰詣?dòng)地或者通過控制人員的介入將該獎(jiǎng)勵(lì)提供給用戶。例如,在用戶已經(jīng)提供了相當(dāng)大量的顯式信息12來改進(jìn)語義時(shí),可以為用戶提供財(cái)務(wù)獎(jiǎng)勵(lì)。這有助于激勵(lì)用戶提供相關(guān)反饋。
[0052]所述系統(tǒng)可以包括算法改進(jìn)單元9,其被布置為基于用戶輸入的顯式信息12,來改進(jìn)自然語言處理單元2所使用的自然語言處理算法。這可以由機(jī)器學(xué)習(xí)算法執(zhí)行。算法改進(jìn)單元9可以包括用于使操作人員能夠控制實(shí)際施加至機(jī)器學(xué)習(xí)算法的改進(jìn)的用戶界面。所述機(jī)器學(xué)習(xí)算法的可以以這種方式而進(jìn)行改進(jìn)的各方面包括:本體、自然語言處理算法的參數(shù)、或者自然語言處理算法的算法步驟。
[0053]圖2示出了文本分析方法的示范性實(shí)現(xiàn)的流程圖。所述方法可以開始于步驟201,其使得用戶能夠以自然語言輸入自由文本。在用戶正輸入自由文本的部分的同時(shí),所述方法可以例如根據(jù)預(yù)定的自然語言處理算法采用自然語言處理技術(shù)在已經(jīng)輸入的范圍內(nèi)執(zhí)行對(duì)自由文本的至少部分進(jìn)行處理的步驟202。這可以在已經(jīng)輸入的自由文本的范圍內(nèi)產(chǎn)生由所述自由文本限定的語義的顯式表示。盡管用戶正在輸入自由文本的部分,但是所述方法可以執(zhí)行使用戶能夠輸入與語義的顯式表示相關(guān)的顯式信息的步驟203。例如,可以使用戶能夠在自由文本的輸入過程中隨時(shí)提供這樣的顯式信息。在執(zhí)行這些步驟之后,可以在步驟204中判定是否要對(duì)下一文檔重復(fù)所述過程。如果是,那么所述方法再一次從步驟201開始,以創(chuàng)建下一具有自由文本和對(duì)應(yīng)的語義顯式表示的文檔。
[0054]可以基于對(duì)文中的系統(tǒng)的功能的描述而對(duì)所述方法進(jìn)行擴(kuò)展或修改。類似地,可以基于對(duì)所述方法的描述而對(duì)所述系統(tǒng)進(jìn)行擴(kuò)展或修改。可以采用軟件和/或采用專用硬件實(shí)施所述方法。
[0055]同音異義、一詞多義、共指、直接和暗示否定、時(shí)間性是在臨床報(bào)告中經(jīng)常發(fā)現(xiàn)的語言特征,眾所周知,這些特征對(duì)于NLP框架而言難以進(jìn)行處理并提取意指含義。由于自然語言的模糊性,在一些情況下,甚至專業(yè)人員都無法提取出作者所意指的文本描述的本義。
[0056]為了為將來的智能臨床決策支持系統(tǒng)(CDS)提供結(jié)構(gòu)化的、語義確切的并且恰當(dāng)描述的數(shù)據(jù),從而允許CDS執(zhí)行自動(dòng)推理,可能必須改進(jìn)當(dāng)今的數(shù)據(jù)獲取。對(duì)現(xiàn)有的文本報(bào)告進(jìn)行回顧性分析并試圖猜測(cè)隱藏含義可能不具有效率。
[0057]理論上,對(duì)于所有的數(shù)據(jù)獲取都強(qiáng)加嚴(yán)格的結(jié)構(gòu)化報(bào)告并且不允許自由文本字段將產(chǎn)生結(jié)構(gòu)化和計(jì)算機(jī)可處理性高得多的數(shù)據(jù),但是假定這將被臨床醫(yī)生所接受是不現(xiàn)實(shí)的。此外,相信結(jié)構(gòu)化的報(bào)告就能夠獲取自由文本報(bào)告的全部復(fù)雜性和必要的微小差別也是不現(xiàn)實(shí)的。因而,在信息變得易于通過計(jì)算機(jī)處理的同時(shí),可能會(huì)遺失一些必要的含義。在臨床醫(yī)生的報(bào)告系統(tǒng)當(dāng)中,可能對(duì)于未來的很多年而言,自由文本的易于使用及其表達(dá)性都是臨床醫(yī)生所需要的東西。當(dāng)然,在很多醫(yī)療子領(lǐng)域當(dāng)中,例如,在乳腺癌的B1-RADS報(bào)告標(biāo)準(zhǔn)當(dāng)中,成功地使用了一些部分結(jié)構(gòu)化的報(bào)告解決方案,但是仍然必須具有伴隨報(bào)告的自由文本。
[0058]大多數(shù)現(xiàn)有的試圖從自由文本中提取語義的NLP系統(tǒng)提供對(duì)所提取的含義實(shí)際上就是作者實(shí)際所意指的含義的非常少(如果有的話)的驗(yàn)證。如果我們要處理歷史數(shù)據(jù),尤其是因?yàn)闅v史數(shù)據(jù)的作者可能再也找不到了,那么這樣的驗(yàn)證就很困難,甚至不可能。
[0059]上文描述的很多困難源自于所述系統(tǒng)(或?qū)I(yè)人員)必須“二次猜測(cè)”意指語義這一事實(shí)。在本說明書中提供了一種系統(tǒng),其將使數(shù)據(jù)的創(chuàng)建者能夠在必要時(shí)核對(duì)意指語義并提供有關(guān)其的反饋。
[0060]其原因之一在于,作者最了解他或她所書寫的文本的含義,而且在數(shù)據(jù)輸入時(shí)就對(duì)其進(jìn)行驗(yàn)證將使得二次猜測(cè)沒有必要。這一方案還允許所述系統(tǒng)例如用用戶在他或她的描述中選擇的優(yōu)選短語而學(xué)習(xí)和個(gè)性化NLP管線。
[0061]可以通過語義圖獲取自由文本敘述的語義。
[0062]可以使用文中公開的技術(shù)來記錄用戶的反饋,并從中學(xué)習(xí),從而使自然語言處理系統(tǒng)更加個(gè)性化,繼而將其修整為適應(yīng)臨床領(lǐng)域內(nèi)的具體微小差別以及用戶的“書寫風(fēng)
格”/措辭。
[0063]圖3示出了集成文檔創(chuàng)建和處理系統(tǒng)的圖解視圖。所述系統(tǒng)包括報(bào)告系統(tǒng)301和文本處理系統(tǒng)302。報(bào)告系統(tǒng)301可以是現(xiàn)有的保健信息系統(tǒng)的一部分,可以將文本處理系統(tǒng)302實(shí)現(xiàn)為現(xiàn)有的報(bào)告系統(tǒng)301的插件或擴(kuò)展?;蛘?,可以將兩個(gè)系統(tǒng)實(shí)現(xiàn)為集成單元。報(bào)告系統(tǒng)301包括報(bào)告創(chuàng)建工具303,其允許用戶304 (例如,臨床醫(yī)師)創(chuàng)建文本文檔或報(bào)告。隨著報(bào)告的創(chuàng)建,將其提供為文本處理系統(tǒng)302的自然語言處理插件304的即時(shí)文本輸入311。將文本輸入311輸送給NLP管線306,其采用來自例如包括個(gè)性化短語模式、基礎(chǔ)事實(shí)等的領(lǐng)域本體305和數(shù)據(jù)庫308的知識(shí)執(zhí)行從文本輸入311即時(shí)提取語義關(guān)系。將所提取的語義的顯式表示307輸送給交互式語義觀察器309 (對(duì)應(yīng)于可視化單元4),其向用戶示出所提取的語義。將用戶反饋模塊310 (對(duì)應(yīng)于顯式信息輸入單元3)布置為從用戶304收集關(guān)于可視化的語義的反饋。
[0064]根據(jù)用戶所創(chuàng)建的敘述性自由文本,通過提取所述敘述中存在的相關(guān)概念集合、建立它們之間的關(guān)系并識(shí)別出實(shí)例,而建立語義圖。通過交互式語義觀察器309將所構(gòu)造的實(shí)例及其關(guān)系的圖呈現(xiàn)給用戶,以供確認(rèn)或校正。
[0065]可以在模式(schema)層面和實(shí)例層面進(jìn)行區(qū)分。已知的概念提取方案只關(guān)注模式層面,其對(duì)于很多臨床應(yīng)用而言可能過于籠統(tǒng)。在實(shí)例層面,識(shí)別出自由文本中的概念實(shí)例,并且在有可能的情況下識(shí)別出與實(shí)例相關(guān)聯(lián)的文字值。然后將這些項(xiàng)呈現(xiàn)給用戶以供檢查。
[0066]例如,在創(chuàng)建有關(guān)患者髖部骨折的報(bào)告時(shí),可以描述并提取其偏側(cè)性,以及骨折發(fā)生的日期,如果其在文本中可得的話。在僅使用概念/模式層面時(shí),那么做將是不可能的。
[0067]與其他表示(例如表格)相比,嘗試獲取語義圖中的患者EHR記錄可以提供更大的靈活性,因?yàn)橹苯訕?biāo)示的圖能夠很好地適合醫(yī)療敘述中經(jīng)常發(fā)生纏結(jié)或交叉鏈接的基礎(chǔ)語義關(guān)系。
[0068]下文將描述一種示范性情況。該例子可以代表經(jīng)常在臨床報(bào)告中發(fā)現(xiàn)的情況??梢蕴崛』颊哚t(yī)療史和家族史的摘要的語義圖。醫(yī)療史可能很重要,因?yàn)槠涮峁┝酸槍?duì)當(dāng)前護(hù)理情節(jié)的信息,并且為診斷和治療提供了相關(guān)背景。家族史可能在各種各樣的可能具有基因原因的疾病(例如,癌癥、心血管病)中有關(guān),因?yàn)槠淇梢蕴崾井?dāng)前患者的易患病體質(zhì)和加大的風(fēng)險(xiǎn)。也可以將家族史用于診斷和治療選擇這兩者。
[0069]例如,可以通過下述彼此交互的部件中的一者或多者實(shí)現(xiàn)所述系統(tǒng)。
[0070]插件部件304可以負(fù)責(zé)與臨床醫(yī)師的報(bào)告軟件連接。這樣的插件的應(yīng)用編程接口(API)可以在從簡(jiǎn)單的文本提取模塊到與包括外觀和感覺的報(bào)告系統(tǒng)的全面UI集成的范圍內(nèi)變動(dòng)。
[0071]插件304可以提供用戶能夠看到的用戶界面部件。首先,可以是領(lǐng)域特有的語義觀察器將涵蓋基礎(chǔ)NLP框架集中以確定的既定醫(yī)療領(lǐng)域內(nèi)的最重要的數(shù)據(jù)項(xiàng)。例如,就乳腺癌而言,可以將觀察器實(shí)現(xiàn)為腫瘤所處位置的圖形演示,從而指示其尺寸等。其次,反饋系統(tǒng)可以為用戶提供機(jī)會(huì),使其能夠提供針對(duì)可視化的提取語義的反饋。該部件能夠在從簡(jiǎn)單的是/否(認(rèn)可/反對(duì))反饋選項(xiàng)到更加完善的能夠?qū)崿F(xiàn)用戶一計(jì)算機(jī)交互的Π的范圍內(nèi)變動(dòng),例如,假設(shè)NLP框架在自動(dòng)確定結(jié)構(gòu)化數(shù)據(jù)時(shí)出現(xiàn)差錯(cuò),那么應(yīng)請(qǐng)求輸入結(jié)構(gòu)化數(shù)據(jù)。
[0072]基礎(chǔ)系統(tǒng)還可以包括描述既定臨床領(lǐng)域的知識(shí)部件。例如,這可以通過從SNOMED提取的本體實(shí)現(xiàn),并且可以在必要時(shí)通過領(lǐng)域?qū)<覍?duì)其進(jìn)行裁剪。這樣的本體應(yīng)當(dāng)含有那些在既定的臨床領(lǐng)域內(nèi)具有重要性的語義概念,因而NLP框架應(yīng)當(dāng)集中于確定它們的的值
/綁定。
[0073]可以提供NLP管線306的實(shí)例以執(zhí)行語義提取??梢詫?shí)施從自然語言提取顯式語義的NLP框架。該框架可以含有諸如句子檢測(cè)、分詞器、詞干器、否定檢測(cè)等的部件。
[0074]可以用接收到的用戶反饋填充數(shù)據(jù)庫308。每次在用戶與反饋模塊交互時(shí),都可以將信息存儲(chǔ)到數(shù)據(jù)庫內(nèi)。這可以含有用戶對(duì)既定短語內(nèi)的某些值的確認(rèn)。該信息及時(shí)地呈現(xiàn)了用戶短語選擇以及相對(duì)于本體范疇的意指含義,其能夠針對(duì)具體用戶實(shí)現(xiàn)NLP解決方案的真正個(gè)性化。
[0075]來自自由文本的摘錄的例子如下,下文簡(jiǎn)稱為例I 我被要求對(duì)這一患者執(zhí)行針對(duì)乳腺癌的醫(yī)療腫瘤學(xué)會(huì)診。[姓名]女士 [年齡]歲,白種女性,據(jù)過去的醫(yī)療史中描述存在多種醫(yī)療問題。她體重已經(jīng)有些下降,但是不知道有多少。既往醫(yī)療史:她以前做過主動(dòng)脈瘤修復(fù)。她還在很多年前因跌倒而使左髖部發(fā)生過非病理性骨折?!?br>
[0076]作為語義圖的可能的語法之一,可能采用資源描述框架(RDF)和/或資源描述框架模式(RDFS),這是W3C聯(lián)盟所提供的標(biāo)準(zhǔn)。可以采用任何現(xiàn)有的工具和推理器(reasoner)來處理遵守所述語法的圖。
[0077]文中提出的NLP管線的一個(gè)方面在于,其可以導(dǎo)出已知類別或概念的實(shí)例或出現(xiàn)、以及這些概念的實(shí)例之間的關(guān)系。已知類別可以取自于諸如SNOMED的現(xiàn)有本體。只要有可能,就可以將那些實(shí)例與文字值鏈接起來,例如,從短語“左側(cè)側(cè)面發(fā)生髖部骨折”的短語當(dāng)中,可以使概念實(shí)例“髖部骨折”與位置值“左側(cè)側(cè)面”關(guān)聯(lián)起來。
[0078]圖4的上半部分示出了從SNOMED提取的類別401的層級(jí)的摘錄。該圖的下半部分示出了類別實(shí)例的語義圖402,即上文列舉的例I的句子的語義的顯式表示。
[0079]在示范性實(shí)施例中,在對(duì)文本(諸如例I的文本)進(jìn)行處理時(shí),可以識(shí)別出幾個(gè)階段。但是這些只是例子。其他實(shí)現(xiàn)方式也是可能的。
[0080]階段1:識(shí)別感興趣的部分。基于可以針對(duì)每一機(jī)構(gòu)進(jìn)行定制的一組規(guī)則來選擇報(bào)告的有關(guān)部分。在這種情況下,在明確地引用醫(yī)療史的部分之后,所述系統(tǒng)還選擇對(duì)當(dāng)前會(huì)診的描述,因?yàn)槠浜杏糜诮?dāng)前醫(yī)療遭遇的醫(yī)療史的相關(guān)概念。
[0081]階段2:識(shí)別在自由文本中引用的相關(guān)概念以及這些概念的實(shí)例。該步驟可以通過NLP執(zhí)行??梢圆捎糜糜谠~句分割、詞性標(biāo)記、詞干提取、否定檢測(cè)等的部件。NLP管線可以采用本體來識(shí)別相關(guān)概念及其實(shí)例。類別的實(shí)例可能具有相互之間的關(guān)系或者具有帶文字值的屬性。例如,“髖部骨折”具有“側(cè)面”屬性,就例I的情況而言,其與值“左側(cè)”綁定。緊挨著來自本體的關(guān)系,可能有所述系統(tǒng)搜索的預(yù)先定義的一組關(guān)系。
[0082]階段3:建立針對(duì)患者歷史的語義圖。在識(shí)別出相關(guān)概念及其關(guān)系之后,系統(tǒng)采用例如RDF和/或RDFS語法構(gòu)建語義圖。
[0083]可以將所述系統(tǒng)布置為檢測(cè)自由文本中的歧義性。在這種情況下,可以通過可見的指示、聲音信號(hào)或其他指示警示用戶??梢詫⑴c自由文本兼容的語義的顯式表示的一個(gè)或多個(gè)提議呈現(xiàn)給用戶,并且可以使用戶能夠做出選擇,和/或細(xì)化自由文本,從而使自由文本不具歧義。
[0084]要認(rèn)識(shí)到,本發(fā)明還適用于適于實(shí)踐本發(fā)明的計(jì)算機(jī)程序,尤其是載體上或載體中的計(jì)算機(jī)程序。程序可以是源代碼、目標(biāo)代碼、居于源和目標(biāo)代碼中間的代碼形式,例如部分編譯的形式,或適于用在實(shí)施根據(jù)本發(fā)明的方法的任何其他形式。還要認(rèn)識(shí)到,這樣的程序可能具有很多不同的架構(gòu)設(shè)計(jì)。例如,實(shí)施根據(jù)本發(fā)明的方法或系統(tǒng)功能的程序代碼可以細(xì)分成一個(gè)或多個(gè)子例程。對(duì)于技術(shù)人員而言,在這些子例程之間分配功能的很多不同方式將是顯而易見的。可以將子例程一起存儲(chǔ)在一個(gè)可執(zhí)行文件中以形成獨(dú)立自足的程序。這樣的可執(zhí)行文件可以包括計(jì)算機(jī)可執(zhí)行指令,例如,處理器指令和/或解釋器指令(例如Java解釋器指令)??商娲?,可以在至少一個(gè)外部庫文件中存儲(chǔ)一個(gè)或多個(gè)或所有子例程,并例如在運(yùn)行時(shí)間將其與主程序靜態(tài)或動(dòng)態(tài)地鏈接。主程序包含至少一個(gè)對(duì)至少一個(gè)子例程的調(diào)用。所述子例程也可以包括相互調(diào)用。涉及計(jì)算機(jī)程序產(chǎn)品的實(shí)施例包括與這里闡述的方法中的至少一個(gè)的每個(gè)處理步驟對(duì)應(yīng)的計(jì)算機(jī)可執(zhí)行指令??梢詫⑦@些指令細(xì)分成子例程和/或存儲(chǔ)在可以靜態(tài)或動(dòng)態(tài)鏈接的一個(gè)或多個(gè)文件中。涉及計(jì)算機(jī)程序產(chǎn)品的另一實(shí)施例包括與這里闡述的系統(tǒng)和/或產(chǎn)品中的至少一個(gè)的每個(gè)模塊對(duì)應(yīng)的計(jì)算機(jī)可執(zhí)行指令??梢詫⑦@些指令細(xì)分成子例程和/或存儲(chǔ)在可以靜態(tài)或動(dòng)態(tài)鏈接的一個(gè)或多個(gè)文件中。[0085]計(jì)算機(jī)程序的載體可以是能夠承載程序的任何實(shí)體或設(shè)備。例如,所述載體可以包括諸如ROM的存儲(chǔ)介質(zhì),例如CDROM或半導(dǎo)體R0M,或者可以包括諸如閃速驅(qū)動(dòng)或硬盤的磁記錄介質(zhì)。此外,載體可以是可傳輸載體,例如電信號(hào)或光信號(hào),其可以經(jīng)由電纜或光纜或通過無線電或其他手段傳輸它們。當(dāng)在這種信號(hào)中實(shí)現(xiàn)程序時(shí),載體可以由這樣的電纜或其他設(shè)備或模塊構(gòu)成。或者,載體可以是其中嵌入了程序的集成電路,該集成電路適于執(zhí)行相關(guān)方法或在執(zhí)行相關(guān)方法時(shí)使用。
[0086]應(yīng)當(dāng)指出,上述實(shí)施例例示而非限制本發(fā)明,本領(lǐng)域的技術(shù)人員將能夠設(shè)計(jì)很多替代實(shí)施例而不脫離所附權(quán)利要求的范圍。在權(quán)利要求中,置于括號(hào)之間的任何附圖標(biāo)記都不應(yīng)被解釋為限制權(quán)利要求。使用動(dòng)詞“包括”及其詞形變化不排除存在權(quán)利要求中所述那些之外的元件或步驟。元件前的冠詞“一(a或an)”不排除存在多個(gè)這樣的元件。可以利用包括若干不同元件的硬件并利用適當(dāng)編程控制的計(jì)算機(jī)來實(shí)施本發(fā)明。在枚舉了若干模塊的設(shè)備權(quán)利要求中,可以由同一件硬件實(shí)現(xiàn)這些模塊中的幾個(gè)。在互不相同的從屬權(quán)利要求中列舉特定手段的簡(jiǎn)單事實(shí)并不表示不能有利地使用這些手段的組合。
【權(quán)利要求】
1.一種文本分析系統(tǒng),包括: 用于使用戶能夠以自然語言輸入自由文本(10)的自然語言輸入單元(I); 用于在輸入所述自由文本(10)的同時(shí)對(duì)所述自由文本(10)的至少部分進(jìn)行處理以獲得所述自由文本所限定的語義的顯式表示(11)的自然語言處理單元(2);以及 用于使用戶能夠輸入與語義的所述顯式表示(11)有關(guān)的顯式信息(12)的顯式信息輸入單元(3)。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),包括用于在用戶仍正在輸入所述自由文本(10)的同時(shí),向用戶可視化所述顯式表示(11)的至少部分的可視化單元(4)。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),包括用于為用戶提供對(duì)所述自然語言輸入單元(I)和所述顯式信息輸入單元(3)兩者的同時(shí)訪問的用戶界面(5)。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,將所述顯式信息輸入單元(3)布置為使用戶能夠確認(rèn)或拒絕所述語義的所述顯式表示(11)。
5.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,將所述顯式信息輸入單元(3)布置為使用戶能夠輸入與所述語義的所述顯式表示(11)中的校正有關(guān)的信息。
6.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,將所述顯式信息輸入單元(3)布置為使用戶能夠提供與概念實(shí)例或者兩個(gè)概念實(shí)例之間的語義關(guān)系的添加、改變或刪除有關(guān)的信息。
7.根據(jù)權(quán)利要求1所述的系統(tǒng),包括用于在所述自由文本(10)的部分和語義的所述顯式表示(11)的對(duì)應(yīng)部分之間建立關(guān)聯(lián)的關(guān)聯(lián)單元(6),其中語義的所述顯式表示(11)的對(duì)應(yīng)部分表示所述自由文本(10)的所述部分的語義。
8.根據(jù)權(quán)利要求1所述的系統(tǒng),包括用于基于用戶所輸入的所述顯式信息(12)而生成所述自由文本(10)所表示的語義的更新顯式表示(11’)的更新單元(7)。
9.根據(jù)權(quán)利要求1或8所述的系統(tǒng),包括存儲(chǔ)單元(13),其用于存儲(chǔ)自然語言的所述自由文本(10)以及以下中的至少兩項(xiàng):用戶所輸入的顯式信息(12)、所述自然語言處理單元生成的語義的所述顯式表示(11)、以及文本所表示的語義的更新顯式表示(11’)。
10.根據(jù)權(quán)利要求1所述的系統(tǒng),還包括基于用戶所輸入的與語義的所述顯式表示(11)有關(guān)的所述顯式信息(12)而生成對(duì)用戶的獎(jiǎng)勵(lì)的指示的獎(jiǎng)勵(lì)發(fā)生器(8)。
11.根據(jù)權(quán)利要求1所述的系統(tǒng),包括用于基于用戶所輸入的所述顯式信息(12)而改進(jìn)所述自然語言處理單元(2)所采用的自然語言處理算法的算法改進(jìn)單元(9)。
12.一種包括根據(jù)權(quán)利要求1所述的系統(tǒng)的工作站。
13.一種用于提供電子報(bào)告工作流的保健信息系統(tǒng),包括根據(jù)權(quán)利要求1所述的系統(tǒng)以及用于存儲(chǔ)自由文本報(bào)告的電子健康記錄數(shù)據(jù)庫。
14.一種文本分析方法包括: 使用戶能夠以自然語言輸入自由文本(201); 在正輸入所述自由文本的同時(shí)采用自然語言處理對(duì)所述自由文本的至少部分進(jìn)行處理(202),以獲得所述自由文本所限定的語義的顯式表示;以及 使用戶能夠輸入與語義的所述顯式表示有關(guān)的顯式信息(203)。
15.一種計(jì)算機(jī)程序產(chǎn)品,包括用于使處理器系統(tǒng)執(zhí)行根據(jù)權(quán)利要求14所述的方法的指令。
【文檔編號(hào)】G06F19/00GK104011711SQ201280065030
【公開日】2014年8月27日 申請(qǐng)日期:2012年12月17日 優(yōu)先權(quán)日:2011年12月27日
【發(fā)明者】G·R·曼科維奇, R·弗多夫亞克, A·I·D·布庫爾, 錢悅晨, M·塞芬斯特, T·D·D·S·馬博杜瓦納 申請(qǐng)人:皇家飛利浦有限公司