專利名稱:語音聊天系統、信息處理裝置、話語識別和關鍵字檢測的制作方法
技術領域:
本發明涉及語音(voice)聊天系統、信息處理裝置、話語(speech) 識別方法、關鍵字檢測方法和程序。
背景技術:
話語識別已經得到很長時間的研究,并且已經變得能夠提供關于被讀 出的話語的非常高的精確識別率。但是,仍然難以提供在識別人類之間的 自然談話方面的高性能。
近年來,已經對用于從話語中提取談話主題的技術執行認真的研究, 該技術還稱為話題檢測技術。當采用話題檢測技術時,從話語中提取文本 信息的話語識別單元起到了重要作用。
作為從話語中提取關鍵字的方法,已知存在一種僅關注關鍵字的從話 語中提取關鍵字的方法和一種使用大詞匯量話語識別來識別全部話語然后 從識別結果中提取關鍵字的方法。具體而言,前一種方法使用例如從音素 網格(phoneme lattice)中提取其音素網格可識別的字序列的方法。同時, 后一種方法使用了 LVCSR (大詞匯量連續話語識別)。如果關鍵字的數 目巨大,則后一種方法由于其計算效率而較有利。在這些方法的任何一種 中,都需要對將被識別的詞匯具有語言上的理解,這可以通過使用關于將 被檢測的詞匯的出現頻率的信息來解決。
話語識別可以分成對孤立字進行識別的孤立字識別和對包括多個字的 字序列進行識別的連續字識別。連續字識別使用了語言模型——"存儲了 字之間的聯接相似性的數據庫",從而防止"具有相似的聲音但是意義完 全不同的字序列"作為識別結果被輸出。
但是,語言模型僅僅描述了原先可識別的那些字的信息(以下稱為已 知字),因此,很難正確地識別后來登記的字(以下稱為登記字)。另一方面,在孤立字識別的情況下, 一旦字被登記在識別字字典(word dictionary)中,在登記之后這些字立即被識別。但是,在連續字識別的情 況下,僅僅對字進行登記是不夠的,而需要反映到語言模型上,但不幸的 是反映到語言模型上通常很難。
基于此,相關技術的一個示例,JP-A NO. 2004-252121公開了一種方 法,該方法將登記字分成諸如"人名"和"地名"之類的類別,提供與這 些類別相對應的語言模型,并且使用語言模型來關聯登記字與類別,由此 新的詞匯可通過連續話語識別來識別。
同時,登記字的選擇存在很大的問題。特別地,專有名詞通常是重要 關鍵字,原因在于專有名詞的識別允許向用戶提供有用信息。
基于此,作為相關技術的一個示例,JP-A NO. 2002-216026公開了--種方法,該方法從因特網上的信息中獲取關鍵字,并從所獲得的關鍵字中 提取關鍵字。
但是,存在大量專有名詞,因此,實踐中可能很難預先登記用戶將說 到的用于話語識別的所有字。
發明內容
出于這些原因,即使是JP-A NO. 2002-216026所公開的方法也可能很 難以高精確度來從語音聊天期間的談話對話中識別與最近的話題相關的關 鍵字。
本發明是鑒于上述情形而設計出來的。存在對提供下述新的且改進了 的語言聊天系統、信息處理裝置和程序的需要,這些系統、裝置和程序能 夠以高精確度來識別存在于語音聊天期間的談話對話中的關鍵字。
還存在對提供下述新的且改進了的信息處理裝置、關鍵字檢測方法和 程序的需要,這些系統、裝置和程序能夠以高精確度來檢測存在于廣播信 息(節目信息)中的關鍵字。
根據本發明的一個觀點,提供了一種語音聊天系統,該語音聊天系統 包括執行語音聊天同時執行話語識別的多個信息處理裝置;和經由通信 網絡而與所述多個信息處理裝置相連接的搜索服務器,其中,搜索服務器向至少一個信息處理裝置公開搜索關鍵字列表,該搜索關鍵字列表包含由 搜索服務器搜索的搜索關鍵字,所述至少一個信息處理裝置包括識別字 字典生成單元,該識別字字典生成單元從搜索服務器獲取所述搜索關鍵字 列表,以生成包含在話語識別時使用的字的識別字字典;話語識別單元, 該話語識別單元通過參考包含識別字字典的識別數據庫來對從語音聊天期 間的談話對話中獲得的語音數據執行語音識別;語音談話控制單元,該語 音談話控制單元執行與至少一個信息處理裝置之間的語音數據的通信控 制;以及關鍵字檢測單元,該關鍵字檢測單元從所述話語識別的結果中檢
測與語音聊天期間的談話內容相關的關鍵字。
根據本發明的另一個觀點,提供了一種信息處理裝置,該裝置從搜索 服務器獲取包含由搜索服務器搜索的搜索關鍵字的搜索關鍵字列表并執行
與其它信息處理裝置的語音聊天,所述裝置包括識別字字典生成單元, 該識別字字典生成單元從搜索服務器獲取搜索關鍵字列表,以生成包含在
話語識別時使用的字的識別字字典;話語識別單元,該話語識別單元通過
參考包含識別字字典的識別數據庫來對從語音聊天期間的談話對話中獲得
的語音數據執行話語識別;語音談話控制單元,該語音談話控制單元執行 與所述其它信息處理裝置之間的語音數據的通信控制;以及關鍵字檢測單 元,該關鍵字檢測單元從話語識別的結果中檢測與語音聊天期間的談話內 容相關的關鍵字。
所述識別字字典可以包括預先登記了預定的字的固定字字典;和按 需來更新所登記的字的可變字字典,并且識別字字典生成單元可以從包含 搜索服務器的較高等級的搜索關鍵字的所述搜索關鍵字列表中選擇將被登 記在可變字字典中的字,以生成可變字字典。
識別字字典生成單元可以基于由關鍵字檢測單元檢測得到的關鍵字的 歷史信息來確定所述信息處理裝置的用戶的偏好,并基于該偏好來從搜索 關鍵字列表中選擇字。
識別字字典生成單元可以使用搜索服務器來搜索所述從搜索關鍵字列 表中選擇出來的字,并從通過所述搜索而獲得的搜索結果中獲取與所述字 相關的次關鍵字,從而以與所述字相關聯的方式來將次關鍵字登記在可變識別字字典生成單元可以基于搜索等級信息來對從搜索關鍵字列表中 選擇的各個字進行加權,其中,搜索等級信息是利用所述字被搜索服務器 搜索的頻率來確定的。
識別字字典生成單元可以基于由關鍵字檢測單元檢測到的關鍵字的歷 史信息來計算這些關鍵字的頻率,并改變登記在可變字字典中且與這些關 鍵字相對應的字的權重。
根據本發明的又一個觀點,提供了一種信息處理裝置,該裝置從搜索 服務器獲取包含由搜索服務器搜索的搜索關鍵字的搜索關鍵字列表,從該 搜索關鍵字列表中選擇字,從對所選擇的字施加在話語識別時使用的權重 信息的識別字字典生成設備獲取被施加了權重信息的字,并與其它信息處 理裝置執行語音聊天,所述信息處理裝置包括話語識別單元,該話語識 別單元通過參考包含從識別字字典生成設備獲得的字的識別數據庫來對從 語音聊天期間的談話對話中獲得的語音數據執行話語識別;語音談話控制 單元,該語音談話控制單元執行與其它信息處理裝置之間的語音數據的通 信控制;以及關鍵字檢測單元,該關鍵字檢測單元從話語識別的結果中檢 測與語音聊天期間的談話內容相關的關鍵字。
根據本發明的又一個觀點,提供了一種在信息處理裝置中使用的話語 識別方法,所述裝置從搜索服務器獲取包含由搜索服務器搜索的搜索關鍵 字的搜索關鍵字列表并與其它信息處理裝置執行語音聊天,所述方法包括 以下步驟從搜索服務器獲取搜索關鍵字列表,以生成包含在話語識別時 使用的字的識別字字典;從語音聊天期間的談話內容中獲得語音數據;基 于所述語音數據的聲學特征來分析該語音數據,并生成與所述談話內容相
對應的字序列候選;以及通過參考在話語識別時使用的包含識別字字典的
識別數據庫、基于在構成所述字序列的字之間的語言學串聯特征來分析所 生成的字序列候選,從而選擇最合適的字序列。
根據本發明的又一個觀點,提供了一種在信息處理裝置中使用的話語 識別方法,所述裝置從搜索服務器獲取包含由搜索服務器搜索的搜索關鍵 字的搜索關鍵字列表、從所述搜索關鍵字列表中選擇字、從對所選擇的字施加在話語識別時使用的權重信息的識別字字典生成設備獲取被施加了權 重信息的字、并與其它信息處理裝置執行語音聊天,所述方法包括以下步 驟從識別字字典生成設備獲取被施加了權重信息的字,并將所述字存儲 在識別數據庫中以在話語識別時使用;從語音聊天期間的談話內容中獲得 語音數據;基于所述語音數據的聲學特征來分析該語音數據,并生成與所 述談話內容相對應的字序列候選;以及通過參考識別數據庫、基于在構成
所述字序列的字之間的語言學串聯特征來分析所生成的字序列候選,從而 選擇最合適的字序列。
根據本發明的又一個觀點,提供了一種用于對信息處理裝置進行控制 的計算機的程序,所述裝置從搜索服務器獲取包含由搜索服務器搜索的搜 索關鍵字的搜索關鍵字列表并與其它信息處理裝置執行語音聊天,所述程
序允許計算機執行以下功能識別字字典生成功能,從搜索服務器獲取搜
索關鍵字列表以生成包含在話語識別時使用的字的識別字字典;話語識別
功能,通過參考包含識別字字典的識別數據庫來對從語音聊天期間的談話
對話中獲得的語音數據執行話語識別;語音談話控制功能,執行與其它信 息處理裝置之間的語音數據的通信控制;以及關鍵字檢測功能,從話語識 別的結果中檢測與語音聊天期間的談話內容相關的關鍵字。
根據上述實施例,計算機程序被存儲在計算機的存儲單元中,并且在 計算機的CPU讀取該程序時被執行,從而致使計算機作為信息處理裝置來 進行工作。也可以提供在其中記錄計算機程序的計算機可讀記錄介質。該 記錄介質例如可以是磁盤、光盤、磁性光盤、和閃存。計算機程序可以例 如經由網絡而不是使用記錄介質來分發。
根據本發明的又一個觀點,提供了一種用于對信息處理裝置進行控制 的計算機的程序,所述裝置從搜索服務器獲取包含由搜索服務器搜索的搜 索關鍵字的搜索關鍵字列表、從搜索關鍵字列表中選擇字、從對所選擇的 字施加在話語識別時使用的權重信息的識別字字典生成設備獲取被施加了 權重信息的字、并與其它信息處理裝置執行語音聊天,所述程序允許計算 機執行以下功能話語識別功能,通過參考包含從識別字字典生成設備獲
取的字的識別數據庫來對從語音聊天期間的談話對話中獲得的語音數據執行話語識別;語音談話控制功能,執行與其它信息處理裝置之間的語音數 據的通信控制;以及關鍵字檢測功能,從話語識別的結果中檢測與語音聊
天期間的談話內容相關的關鍵字。
根據本發明的又一個觀點,提供了一種信息處理裝置,包括識別字 字典生成單元,該識別字字典生成單元從搜索服務器獲取包含由搜索服務 器搜索的搜索關鍵字的搜索關鍵字列表,以生成包含在語言識別時使用的
字的識別字字典;廣播文本信息接收單元,該廣播文本信息接收單元接收 從廣播站發送而來的廣播文本信息;關鍵字檢測單元,該關鍵字檢測單元 通過參考識別字字典來從廣播文本信息中檢測預定關鍵字;以及外部顯示 設備連接控制單元,該外部顯示設備連接控制單元執行與外部顯示設備的 連接控制并將從廣播文本信息中檢測到的關鍵字輸出到該外部顯示設備。
廣播文本信息接收單元可以從與信息處理裝置相連接的外部顯示設備 獲取關于該外部顯示設備正通過其接收的廣播頻道的接收頻道信息以及與 該廣播頻道相對應的廣播文本信息。或者,廣播文本信息接收單元可以從 與信息處理裝置相連接的外部顯示設備獲取關于該外部顯示設備正通過其 接收的廣播頻道的接收頻道信息,并從廣播站獲取與所述廣播頻道相對應 的廣播文本信息。
信息處理裝置可以將所述關鍵字的參考歷史存儲在外部顯示設備中, 并且外部顯示設備連接控制單元可以將外部顯示設備所選擇的關鍵字通知 給搜索引擎。
根據本發明的又一個觀點,提供了一種信息處理裝置,包括識別字
字典生成單元,該識別字字典生成單元從搜索服務器獲取包含由搜索服務 器搜索的搜索關鍵字的搜索關鍵字列表,以生成包含在話語識別時使用的
字的識別字字典;廣播音頻信息接收單元,該廣播音頻信息接收單元接收 從廣播站發送而來的廣播音頻信息;話語識別單元,該話語識別單元通過 參考包含識別字字典的識別數據庫來對廣播音頻信息執行話語識別;關鍵 字檢測單元,該關鍵字檢測單元從對廣播音頻信息的話語識別的結果中檢 測預定關鍵字;以及外部顯示設備連接控制單元,該外部顯示設備連接控 制單元執行與外部顯示設備的連接控制并將從廣播音頻信息中檢測到的關鍵字輸出到外部顯示設備。
廣播音頻信息接收單元可以從與信息處理裝置相連接的外部顯示設備 獲取關于該外部顯示設備正通過其接收的廣播頻道的接收頻道信息以及與 該廣播頻道相對應的廣播音頻信息。或者,廣播音頻信息接收單元可以從 與信息處理裝置相連接的外部顯示設備獲取關于該外部顯示設備正通過其 接收的廣播頻道的接收頻道信息,并從廣播站獲取與所述廣播頻道相對應 的廣播音頻信息。
信息處理裝置可以將所述關鍵字的參考歷史存儲在外部顯示設備中, 并且外部顯示設備連接控制單元可以將外部顯示設備所選擇的關鍵字通知 給搜索引擎。
根據本發明的又一個觀點,提供了一種關鍵字檢測方法,包括以下步 驟從搜索服務器獲取包含由搜索服務器搜索的搜索關鍵字的搜索關鍵字 列表,以生成包含在語言識別時使用的字的識別字字典;接收從廣播站發
送而來的廣播文本信息;通過參考識別字字典來從廣播文本信息中檢測預 定關鍵字;以及執行與外部顯示設備的連接控制,并將從廣播文本信息中 檢測到的關鍵字輸出到外部顯示設備。
根據本發明的又一個觀點,提供了一種關鍵字檢測方法,包括以下步 驟從搜索服務器獲取包含由搜索服務器搜索的搜索關鍵字的搜索關鍵字 列表,以生成包含在話語識別時使用的字的識別字字典;接收從廣播站發 送而來的廣播音頻信息;通過參考包含識別字字典的識別數據庫來對廣播 音頻信息執行話語識別;從對廣播音頻信息的話語識別的結果中檢測預定 關鍵字;以及執行與外部顯示設備的連接控制并將從廣播音頻信息中檢測 到的關鍵字輸出到外部顯示設備。
根據本發明的又一個觀點,提供了一種程序,允許計算機實現以下功 能識別字字典生成功能,從搜索服務器獲取包含由搜索服務器搜索的搜 索關鍵字的搜索關鍵字列表,以生成包含在語言識別時使用的字的識別字 字典;廣播文本信息接收功能,接收從廣播站發送而來的廣播文本信息; 關鍵字檢測功能,通過參考識別字字典從廣播文本信息中檢測預定關鍵 字;以及外部顯示設備連接控制功能,執行與外部顯示設備的連接控制,并將從廣播文本信息中檢測到的關鍵字輸出到外部顯示設備。
根據上述實施例,計算機程序被存儲在計算機的存儲單元中,并且在 計算機的CPU讀取該程序時被執行,從而致使計算機作為信息處理裝置來 進行工作。可以提供在其中記錄計算機程序的計算機可讀記錄介質。該記 錄介質例如可以是磁盤、光盤、磁性光盤、和閃存。計算機程序可以例如 經由網絡而不是使用記錄介質來分發。
根據本發明的又一個觀點,提供了一種程序,該程序允許計算機實現 以下功能識別字字典生成功能,從搜索服務器獲取包含由搜索服務器搜 索的搜索關鍵字的搜索關鍵字列表,以生成包含在話語識別時使用的字的 識別字字典;廣播音頻信息接收功能,接收從廣播站發送而來的廣播音頻
信息;話語識別功能,通過參考包含識別字字典的識別數據庫來對廣播音 頻信息執行話語識別;關鍵字檢測功能,從對廣播音頻信息的話語識別的 結果中檢測預定關鍵字;以及外部顯示設備連接控制功能,執行與外部顯 示設備的連接控制并將從廣播音頻信息中檢測到的關鍵字輸出到外部顯示
根據上述實施例,計算機程序被存儲在計算機的存儲單元中,并且在 計算機的CPU讀取該程序時被執行,從而致使計算機作為信息處理裝置來 進行工作。也可以提供在其中記錄計算機程序的計算機可讀記錄介質。該 記錄介質例如可以是磁盤、光盤、磁性光盤、和閃存。計算機程序可以例 如經由網絡而不是使用記錄介質來分發。
根據上述本發明的實施例,用于話語識別的識別字字典被使用從搜索 服務器獲得的數據庫來創建,并且話語識別被使用識別字字典來執行。因 此,可以以高精確度來識別存在于語音聊天期間的談話對話中的關鍵字。 此外,用于語言識別的識別字字典被使用從搜索服務器獲得的數據庫來創 建,并且關鍵字檢測被使用識別字字典來執行。因此,可以以高精確度來 檢測存在于廣播信息(節目信息)中的關鍵字。
圖1是示出根據本發明第一實施例的語音聊天系統的示意圖;圖2是用于說明根據第一實施例的信息處理裝置的硬件配置的框圖3是用于說明根據第一實施例的信息處理裝置的配置的框圖4是用于說明根據第一實施例的話語識別單元的配置的框圖5是示出根據第一實施例的識別數據庫的示意圖6是示出根據第一實施例的固定字字典的一個示例的示意圖7是示出根據第一實施例的固定字字典的另一個示例的示意圖8是示出根據第一實施例的可變字字典的一個示例的示意圖9是示出根據第一實施例的類別表格的一個示例的示意圖IO是示出根據第一實施例的類別表格的另一個示例的示意圖11是示出根據第一實施例的語言模型的一個示例的示意圖12是示出根據第一實施例的音素列表的一個示例的示意圖13是示出根據第一實施例的假名-音素轉換規則的示意圖14是用于說明根據第一實施例的話語識別處理的一個示例的流程
圖15是示出根據第一實施例的語言分數的計算公式的一個示例的示 意圖16是示出根據第一實施例的常用字典的一個修改示例的示意圖; 圖17是示出根據第一實施例的固定字字典的一個修改示例的示意
圖18是示出根據第一實施例的類別表格的一個修改示例的示意圖; 圖19是用于說明根據第一實施例的識別字字典生成單元的框圖; 圖20是示出根據第一實施例的識別字字典生成/更新處理的示意圖; 圖21A是示出根據第一實施例的語音聊天系統的配置的示意圖; 圖21B是示出根據第一實施例的語音聊天系統的一個修改示例的示意
圖22是示出根據本發明第二實施例的關鍵字檢測系統的配置的示意
圖23是用于說明根據第二實施例的信息處理裝置的配置的框圖; 圖24是用于說明根據第二實施例的外部顯示設備的配置的框圖;圖25是示出根據第二實施例的外部顯示設備的信息顯示屏幕的示意
圖26是用于說明根據第二實施例的關鍵字檢測方法的流程圖27是用于說明根據第二實施例的信息處理裝置的第一修改示例的 配置的框圖28是用于說明根據本修改示例的關鍵字檢測方法的流程圖; 圖29是示出根據本發明第三實施例的語音聊天系統的示意圖30是用于說明根據第三實施例的信息處理裝置的硬件配置的框
圖31是用于說明根據第三實施例的信息處理裝置的配置的框圖32是用于說明根據第三實施例的信息處理裝置所使用的話語識別
方法和關鍵字提取方法的一個示例的流程圖33是用于說明在根據第三實施例的語音聊天系統中的關鍵字同步
方法的流程圖34是示出由根據第三實施例的信息處理裝置顯示的搜索信息顯示 的示例的示意圖35是示出根據第三實施例的搜索信息的參考歷史數據的示意圖; 圖36A是用于說明根據第三實施例的信息處理裝置的話語識別方法的 簡化框圖36B是用于說明根據第三實施例的信息處理裝置的話語識別方法的 第一修改示例的簡化框圖36C是用于說明根據第三實施例的信息處理裝置的話語識別方法的 第二修改示例的簡化框圖36D是用于說明根據第三實施例的信息處理裝置的話語識別方法的
第三修改示例的簡化框圖37是示出根據本發明第四實施例的關鍵字提取系統的示意圖; 圖38是用于說明根據第四實施例的信息處理裝置的配置的框圖; 圖39是用于說明根據第四實施例的外部顯示設備的配置的框圖; 圖40是示出根據第四實施例的外部顯示設備的信息顯示屏幕的示意圖41是用于說明根據第四實施例的關鍵字提取方法的流程圖; 圖42是用于說明根據第四實施例的信息處理裝置的第一修改示例的 配置的框圖;以及
圖43是用于說明根據本第一修改示例的關鍵字提取方法的流程圖。
具體實施例方式
以下將參考附圖來詳細描述本發明的優選實施例。注意,在本說明書 和附圖中,實質上具有相同功能和結構的結構元素被用相同的標號來表 示,并且對這些結構元素的重復說明被省略。 (第一實施例)
以下將詳細描述根據本發明第一實施例的語音聊天系統。
圖1是示出根據第一實施例的語音聊天系統的示意圖。語音聊天系統 IO包括通信網絡12、搜索服務器14、以及信息處理裝置20A和20B (下 文中有時候統稱為信息處理裝置20)。
通信網絡12是連接信息處理裝置20和搜索服務器14以使能它們之間 的雙向或單向通信的通信網絡。通信網絡12例如可以由公共網絡(例 如,因特網、電話網絡、衛星通信網絡、或者廣播通信頻道)或私有網絡 (例如,WAN (廣域網)、LAN (局域網)、IP-VPN (因特網協議-虛擬 私有網絡)、以太網(注冊商標)、或者無線LAN)構成。通信網絡12 可以是有線的或無線的。
搜索服務器14是用戶可以使用關鍵字等通過因特網來搜索可用信息 的網站。在本實施例中,搜索服務器14可以提供全文搜索服務,全文搜 索服務允許使用關鍵字來搜索所存儲的信息的全文;或者可以是目錄服 務,目錄服務允許搜索經類別分類的信息。
信息處理裝置20以語音方式來與經由通信網絡12而與其相連接的另 一個信息處理裝置20進行聊天(語音聊天)。信息處理裝置20可以經由 通信網絡12來請求經由通信網絡12而與其相連接的搜索服務器14執行信 息搜索。執行語言聊天的另一個信息處理裝置20可以經由通信網絡12而與其相連接,如圖所示。或者,另一個信息處理裝置20可以不經由通信
網絡12而直接連接到USB (通用串行總線)端口、諸如i丄ink之類的 IEEE 1394端口、 SCSI (小型計算機系統接口)端口、 RS-232C端口等。
在如圖所示的示例中,信息處理裝置20是臺式PC;但是,在本實施 例中,信息處理裝置20可以是筆記本式PC。在本實施例中,信息處理裝 置20并不限于如上所述的示例,而可以例如由電視機機頂盒(television set-top checkbox)、諸如家用游戲機之類的信息設備、移動電話、PDA (個人數字助理)等來構成,只要是具有經由網絡來通信的功能的設備就 可以。另外或者可替代地,信息處理裝置20可以是由擁有者攜帶的便攜 式設備,例如,便攜式游戲機、PHS、或者便攜式視頻/音頻播放機。
在圖1中,僅有兩個信息處理裝置20與通信網絡12相連接。但是, 本實施例并不限于該示例,而可以有多個信息處理裝置20與通信網絡12 相連接。
(信息處理裝置20的硬件配置) 接下來,將參考圖2來簡要描述根據本實施例的信息處理裝置20的 硬件配置。
圖2是用于說明根據第一實施例的信息處理裝置20的硬件配置的框 圖。信息處理裝置20包括中央處理單元(CPU) 201、只讀存儲器 (ROM) 203、隨機存取存儲器(RAM) 205、主機總線207、橋209、外 部總線211、接口 213、輸入設備215、輸出設備217、存儲設備219、驅 動器221、以及通信設備223。
CPU 201用作算術處理單元和控制單元。CPU 201根據記錄在ROM 203、 RAM 205、存儲設備219或可移動記錄介質16中的各種程序來控制 信息處理裝置20中的內部操作的全部或一部分。ROM 203存儲由CPU 201使用的程序、算術參數等。RAM 205暫時存儲CPU 201執行時所使用 的程序和在CPU 201執行時適當地變化的參數。CPU 201、 ROM 203和 RAM 205經由包括內部總線(例如,CPU總線)在內的主機總線207而相 互連接。
主機總線207經由橋209而與外部總線211 (例如,外圍組件互連(PCI)總線)相連接。輸入設備215包括諸如鼠標、鍵盤、觸摸屏、按鈕、開關、和控制桿之類的由用戶操作的操作單元和諸如麥克風和頭戴式耳機之類的語音輸入單元。輸入設備215可以是使用紅外光或者其它電波的遙控單元(所謂的 遙控器),或者可以是與信息處理裝置20的操作相對應的諸如移動電話 或PDA之類的外部連接設備。輸入設備215可以是一種輸入控制電路, 該輸入控制電路基于用戶使用操作單元或語言輸入單元輸入的信息來生成 輸入信號并將所生成的輸入信號輸出到CPU 201 。信息處理裝置20的用戶 可以操作輸入設備215來向信息處理裝置20輸入各種數據或者指示信息 處理裝置20執行處理操作。輸出設備217例如可以由可以以可視或可聽的方式來通知用戶所獲得 的信息的顯示單元(例如,陰極射線管(CRT)顯示單元、液晶顯示 (LCD)單元、等離子顯示面板(PDP)單元、電致發光(EL)顯示單 元、或燈)、音頻輸出單元(包括揚聲器和頭戴式耳機)、以及諸如打印 機、移動電話或傳真機之類的設備來構成。輸出設備217例如輸出搜索服 務器搜索的各種信息。具體而言,顯示單元將搜索服務器對各種信息的搜 索結果作為文本或圖像來顯示。同時,音頻輸出單元將被播放的語音數據 轉換成語音并輸出該語音。存儲設備219是作為根據本實施例的信息處理裝置20的存儲單元的 一個示例的數據存儲設備。存儲設備219例如由諸如硬盤驅動器(HDD) 之類的磁存儲單元、半導體存儲設備、光存儲設備、磁光存儲設備等來構 成。存儲設備219存儲由CPU 201執行的程序或各種數據以及從外部獲得 的各種數據。驅動器221是存儲介質的讀寫器。驅動器221設置在信息處理裝置20 中,或者從外部附接于信息處理裝置20。驅動器221讀出記錄在諸如磁 盤、光盤、磁光盤、或半導體存儲器之類的可移動存儲介質16中的信息 (該信息被載入到驅動器221),并將所讀出的信息輸出到RAM 205。驅 動器221可以將載入到驅動器221中的信息記錄在諸如磁盤、光盤、磁光 盤或半導體存儲器之類的可移動存儲介質16中。可移動存儲介質16例如可以是DVD介質、HD-DVD介質、藍光介質、緊湊式閃存(CF)、記憶 棒、或安全數字(SD)存儲卡。可移動存儲介質16例如可以是其上安裝 有非接觸式IC芯片的電子設備或集成電路(IC)卡。通信設備223是由用于連接到通信網絡12的通信設備構成的通信接 口。通信設備223例如可以是用于有線或無線局域網(LAN)的通信卡、 藍牙或無線USB (WUSB)、用于光通信的路由器、用于非對稱數字用戶 線路(ADSL)的路由器、或者用于各種通信協議的調制解調器。通信設 備223在收發關于與另一個信息處理裝置20聊天的語音的信息時向因特 網或其它通信設備發送各種信息以及從其接收各種信息。連接到通信設備 223的通信網絡12可以由以有線或無線方式來連接的諸如因特網、家庭 LAN、紅外光通信、或者衛星通信之類的網絡構成。利用上述配置,信息處理裝置20可以與直接連接到信息處理裝置20 的另一個信息處理裝置或者與經由通信網絡12來連接到其的另一個信息 處理裝置進行語音聊天,同時從經由通信網絡12來連接到其的搜索服務 器14等獲得各種信息。此外,信息處理裝置20可以使用可移動存儲介質 16來取出存儲在信息處理裝置20中的信息。在上文中,已經描述了可以實現根據本實施例的信息處理裝置20的 功能的硬件配置的示例。上述組件可以使用通用元件來構成,或者利用專 用于各種組件的功能的專用硬件來構成。因此,可以根據實施本實施例時 的技術水平來適當地修改硬件配置。上述硬件配置僅僅用于說明性目的, 并且本發明決不局限于此。可以依據使用的形式來省略諸如主機總線 207、外部總線211或接口 213之類的一些組件。 (信息處理裝置20的配置)接下來,將詳細描述根據本實施例的信息處理裝置20的配置。在以 下描述中,執行語音聊天的兩個信息處理裝置20將被稱為第一信息處理 裝置20A和第二信息處理裝置20B。第一和第二信息處理裝置20A和20B 根據信息處理裝置的各個用戶的聲音來生成語音數據,并將該語音數據發 送到作為語音聊天的對應方的另一個信息處理裝置。圖3是用于說明根據 第一實施例的第一信息處理裝置20A的配置的框圖。在以下描述中,術語"字"指的是在話語識別處理中便于作為單個字 來處理的單元。其并不一定與語言學上的字相同。例如,"夕口O君(發音為tarou kun)"可以視為一個字,或者可以視為"tarou"和"kun"形式的兩個字。此外,更大的單元"二入1;:$ 夕口,君(發音為konnichiwataroukun)"可以被視為一個字。另外,術語"音素"指的是從聲學的角度便于視為單個單元的單元。 其并不一定與語音音節或音素相同。例如,在字"東京(發音為tou kyou)"中,"tou"部分可以用三個音素符號"t/o/u"來表示,或者用 "to:" ( "o"的長音)來表示。此外,"tou"部分可以用"t/o/o"來表 示。另外,可以采用表示靜音的符號。此外,可以采用將靜音分成"發音 之前的靜音"、"插入在發音之間的短靜音"、"發音中的靜音"、以及 "與',(發音為tsu),相對應的靜音"的符號。如圖3所示,根據本實施例的第一信息處理裝置20A包括語音輸入單 元251、話語識別單元253、關鍵字檢測單元255、關鍵字管理單元257、 語音談話控制單元259、顯示單元261、語音輸出單元263、通信單元 265、存儲單元267、以及識別字字典生成單元269。語音輸入單元251是在語音聊天期間向第一信息處理裝置20A輸入作 為由第一信息處理裝置20A的用戶發出的話語的談話對話的接口。語音輸 入單元251例如由與第一信息處理裝置20A相連接的諸如麥克風或頭戴式 耳機之類的輸入設備來構成。用戶向麥克風或頭戴式耳機發出的話語被實 時自動地輸入到第一信息處理裝置20A,被轉換成作為電信號的語音信 號,并被經由語音輸入單元251來發送到話語識別單元253。話語識別單元253例如由CPU、 ROM或RAM來構成。話語識別單元 253根據由語音輸入單元251自發輸入并被實時發送的用戶的話語來生成 語音數據,并將該語音數據發送到稍后將描述的語音談話控制單元259, 從而基于所生成的語音數據來執行話語識別。作為話語識別的結果,話語 識別單元253生成了與所生成的語音數據相對應的字序列,并將所生成的 字序列發送到稍后將描述的關鍵字檢測單元255。話語識別單元253可以 被配置成將所生成的字序列發送到稍后將描述的顯示單元261。稍后將描述話語識別單元253的細節。關鍵字檢測單元255判斷在從話語識別單元253發送而來的字序列中 是否存在由關鍵字管理單元257管理的關鍵字,并且如果關鍵字存在,則 將與該關鍵字相對應的字作為關鍵字來輸出。如果在一個字序列中存在多 個關鍵字,則關鍵字檢測單元255可以被配置成檢測出所有對應關鍵字。 關鍵字檢測單元255可以被配置成將從字序列中檢測得到的關鍵字發送到 稍后將描述的顯示單元261。例如,當從話語識別單元253發送來識別結果"近年來結構改革己凸 現"時,并且當在關鍵字管理單元257所管理的關鍵字中存在關鍵字"結 構改革"時,關鍵字檢測單元255輸出"結構改革"作為關鍵字。關鍵字管理單元257對將從話語識別單元253所生成的字序列提取的 關鍵字進行管理。關鍵字管理單元257將搜索歷史信息或聊天歷史信息存 儲在存儲單元267中,其中,搜索歷史信息是第一信息處理裝置20A的用 戶使用搜索服務器14來執行搜索的歷史,而聊天歷史信息是用戶使用本 實施例的語音聊天系統的歷史。基于包含在歷史信息中的搜索關鍵字或者 所檢測到的關鍵字來選擇被管理的關鍵字。關鍵字管理單元257所管理的 關鍵字由關鍵字檢測單元255自由地參考。關鍵字管理單元257還可以向 話語識別單元253提供所管理的關鍵字,并且話語識別單元253可以基于 關鍵字管理單元257所提供的關鍵字來更新稍后將描述的諧振循環數據庫 (resonant cycle database)。語音談話控制單元259例如由CPU、 ROM和RAM來構成,并且對與 經由通信網絡12來連接的第二信息處理裝置20B的語音聊天進行控制。 語音談話控制單元259接收話語識別單元253所生成的語音數據,并經由 通信單元265將該語音數據發送到第二信息處理裝置20B。語音談話控制 單元259接收經由通信單元265從第二信息處理裝置20B發送而來的語音 數據,并將該語音數據發送到語音輸出單元263。語音談話控制單元259 可以被配置成每次語音聊天被執行時就以關聯方式來將執行語音聊天的曰 期、用于標識語音聊天的標識符、以及用于標識語音聊天的對應方的標識 符存儲在存儲單元267中,作為聊天歷史信息。語音談話控制單元259可以由專用于語音談話控制的專用硬件構成, 或者可以被作為諸如語音聊天程序之類的應用程序來提供。顯示單元261通過諸如第一信息處理裝置20A的顯示器之類的顯示設 備來向第一信息處理裝置20A的用戶顯示從關鍵字檢測單元255發送而來 的關鍵字。顯示單元261可以被配置成顯示作為從話語識別單元253發送 而來的話語識別的結果的字序列自身。語音輸出單元263是接收第二信息處理裝置20B的用戶所發出的話語 的語音數據并將所接收的語音數據輸入到第一信息處理裝置20A的接口。 語音輸出單元263例如由作為與第一信息處理裝置20A相連接的輸出設備 的揚聲器或耳機構成。經由通信單元265從第二信息處理裝置20B接收的語音數據被經由語 音輸出單元263來輸出給第一信息處理裝置20A的用戶。通信單元265例如是安裝在第一信息處理裝置20A中的通信設備。通 信單元265中繼在第一信息處理裝置20A (具體而言是話語識別單元 253、關鍵字管理單元257、語音談話控制單元259和識別字字典生成單元 269)和第一信息處理裝置20A的外部設備(具體而言是搜索服務器14) 或第二信息處理裝置20B之間的經由通信網絡12來進行的信息通信。此 外,通信單元265可以與直接而非經由通信網絡12來連接到第一信息處 理裝置20A的其它信息處理裝置進行信息通信。存儲單元267例如是安裝在第一信息處理裝置20A中的存儲設備,并 在其中存儲諸如由關鍵字檢測單元255檢測到的關鍵字或由關鍵字管理單 元257管理的關鍵字信息之類的數據。除了這些數據之外,存儲單元267 還可以在其中存儲諸如由話語識別單元253生成的字序列或語音數據之類 的識別結果或者各種數據庫。存儲單元267可以適當地在其中存儲在第一 信息處理裝置20A執行處理時需要存儲的各種參數以及該處理的進程信 息。在話語識別單元253、關鍵字檢測單元255、關鍵字管理單元257、語 音談話控制單元259、識別字字典生成單元269等執行對存儲單元267的 讀寫時,存儲單元267可以自由地被訪問。識別字字典生成單元269從搜索服務器14獲取搜索關鍵字列表等,并從所獲得的搜索關鍵字列表中僅選擇合適的關鍵字,從而生成在話語識 別時使用的識別字字典。識別字字典生成單元269不僅可以從所獲得的搜 索關鍵字列表中選擇關鍵字,而且還可以向所選擇的關鍵字添加這些關鍵 字的屬性信息或者相關的次關鍵字或者添加在話語識別時使用的識別權重。稍后將描述識別字字典生成單元269的細節。 (話語識別單元253)接下來,將參考圖4來詳細描述根據本實施例的話語識別單元253。 圖4是用于說明根據第一實施例的話語識別單元253的配置的框圖。如圖4所示,根據本實施例的話語識別單元253包括AD轉換單元 301、特征參數提取單元303、匹配單元305、常用字典存儲單元307、和 識別數據庫309。AD轉換單元301對語音信號(從語音輸入單元251發送而來的模擬 信號)進行采樣和量化,并將該模擬語音信號轉換成作為數字信號的語音 數據。在完成向語音數據的轉換之后,AD轉換單元301將所生成的語音 數據發送到語音談話控制單元259和特征參數提取單元303。 AD轉換單元 301可以將所生成的語音數據存儲在存儲單元267中。特征參數提取單元303從AD轉換單元301所生成的適當語音數據的 每一幀中提取諸如Mel頻率倒譜系數(MFCC)及其時差參數、頻譜、功 率線性預測系數、倒譜系數、和線譜對之類的特征參數。在完成特征參數 的提取之后,特征參數提取單元303將所提取的特征參數發送到稍后將描 述的匹配單元305。特征參數提取單元303可以將從語音數據中提取的各 種特征參數存儲在存儲單元267中。匹配單元305基于從特征參數提取單元303發送而來的各種特征參 數、通過適當地參考識別數據庫309和常用字典存儲單元307來生成與輸 入到語音輸入單元251的話語(即,語音聊天期間的談話內容)最接近的 字序列,作為話語識別的結果。字序列的生成方法將在稍后描述。在完成 字序列的生成之后,匹配單元305將所生成的字序列發送到關鍵字檢測單 元255。匹配單元305可以將所生成的字序列存儲在存儲單元267中。匹配單元305可以使用基于集束搜索(beam search)的維特比(Viterbi)解碼器或者基于A忖叟索的堆棧解碼器來執行匹配。另外或者可 替代地,在匹配時可以使用所謂的關鍵字辨認(keyword spotting)方法。 如果向匹配單元305所參考的各種字字典添加了稍后將描述的"識別權 重"信息,則可以對稍后將描述的語言分數進行加權,并且識別結果可以 按加權后的分數來分等級。常用字典存儲單元307存儲常用字典,該常用字典是在話語識別中通 常使用的字的字典。在存儲在常用字典存儲單元307中的常用字典中,登 記在其中的所有字都與發音信息和類別信息一起以關聯方式來記載。例如, 當專有名詞"<于口一 (人名)"被登記在常用字典中時,專有名詞 于口一"與發音信息(音素信息)"ichiro"和類別"_人名—" 一起以關聯 方式來被登記。稍后將描述常用字典的細節。識別數據庫309是存儲由匹配單元305用于生成字序列的各種模型或 規則的數據庫。以下將描述識別數據庫309的細節。<識別數據庫309>接下來,將參考圖5來詳細描述根據本實施例的識別數據庫309。圖 5是示出根據第一實施例的識別數據庫309的示意圖。如圖5所示,根據本實施例的識別數據庫309包括識別字字典存儲單 元401、聲學模型存儲單元403、語言模型存儲單元405、音素列表407、 和假名-音素轉換規則409。識別字字典存儲單元401在其中存儲由匹配單元305在生成字序列時 使用的識別字字典。識別字字典例如包括固定字字典,可變字字典和類別 表格。在固定字字典中,記載了諸如不會經歷登記和刪除的字(即,預先在 系統中建立的字(以下稱為固定字))的發音(音素序列)和描述了音素 的串聯關系的模型之類的各種信息。在可變字字典中,記載了諸如作為關鍵字的字(keyword word)的發 音和描述音素的串聯關系的模型之類的各種信息。諸如作為關鍵字的字的 登記和刪除以及發音的改變之類的處理主要是針對登記在固定字字典中的 字來執行的。可變字字典可以不在其中存儲任何信息。例如,在檢測與棒球相關的關鍵字的情況下,常用字典存儲單元307 可以在其中登記日常談話中通常會使用的字(例如,在諸如日語語言字典之類的普通字典中記載的字);在識別字字典存儲單元401中的固定字字 典可以在其中登記在棒球領域中通常會使用的字,例如,"擊打"、"雙 殺"、"擊球手"、或者"捕手"。在識別字字典存儲單元401中的可變 字字典可以在其中登記隨時間變化的專有名詞,例如"ichiro"。由于可變 字字典是按需來更新的,所以可以很容易地執行包括與最近的關于棒球的 話題相關的關鍵字的識別。接下來,將參考圖6和7來描述根據本實施例的固定字字典。圖6和 7是示出根據第一實施例的固定字字典的示例的示意圖。在圖6中,"符號"是用于標識字的字符串,并且可以例如用日語假 名記號來表示。相同符號的條目被視為相同字的條目。本實施例的語言模 型用這種符號來表示。"副本(transcription)"表示字的記號,并且作為 識別結果來輸出的字符串是副本。"音素序列"是用音素序列來表達的字 的發音。本實施例的固定字字典不僅記載如圖6所示的假名記號的符號, 而且還記載如圖7所示的混合有漢語字符和日語平假名的字符串。在圖6和7中記載的"<開始>"和"<結束>"是分別表示"發音之前 的靜音"和"發音之后的靜音"的特殊符號。因此,這些特殊符號在副本 欄中沒有相應的記號,并且被表示為"[]"(空白)。除了圖6和7所記載的項目之外,本實施例的固定字字典還可以包括 對字的話語的各個部分進行描述的"屬性"欄(例如,名詞或動詞,或者 字的類型)以及對在計算稍后將描述的語言分數時使用的字的權重信息進 行描述的"識別權重"欄。接下來,將參考圖8來描述根據本實施例的可變字字典。圖8是示出 根據第一實施例的可變字字典的一個示例的示意圖。如圖8所示,本實施例的可變字字典包括"符號"欄和"假名發 音"。在圖8所示的示例中,兩個類別"—人名一"和"—地名—"被描述成 "符號"。在"—人名—"類別中,兩個字"<千口一(發音為ichiro)" 和"廿二一夕口々(發音為sanitarou)"的發音被記載在假名發音中。在"—地名—"類別中,字"年夕V于力7 (發音為kitashinagawa)"的發音被記載在假名發音中。本實施例的可變字字典可以記載特定字以及類別, 如圖8所示。在將如圖所示的除了類別之外的特定字記載在可變字字典中 時,各個字被記載在"符號"欄中,并且將在可變字字典中提供與這些字 相對應的"副本"或"音素序列"。類似于固定字字典的情況,本實施例的可變字字典可以包括對字的話 語的各個部分進行描述的"屬性"欄(例如,名詞或動詞,或者字的類 型)以及對在計算稍后將描述的語言分數時使用的字的權重信息進行描述 的"識別權重"欄。由于記載在可變字字典中的字主要是隨時間變化的 字,所以記載在"識別權重"欄中的值優選地被設置成大于記載在固定字 字典中的"識別權重"。這樣,對記載在可變字字典中的字設置了較大的 "識別權重"。因此,在用戶通常交談關于當前的話題的語音聊天中,可 以基于偏好來選擇特定關鍵字或者與特定關鍵字相關的字。因此,可以執 行高識別率的話語識別。稍后將描述根據本實施例的可變字字典的生成和更新處理的細節。在類別表格中,包含在語言模型存儲單元405中的語言模型所包含的 類別和關于包含在這些類別中的字的信息是以關聯方式來描述的。類別表 格可以以列表形式或者表格形式來描述。如果語言模型不包括任何類別, 則類別表格可以不在其中存儲任何信息或數據。這些類別可以基于語義屬性來分成各個類(例如,"一人名—"、 用戶名—"、"—地名—"、"—店名—"等),或者基于話語的各個部分來 分成各個類(例如,"—名詞—"、"—動詞—"、"—小品詞—"等)。以 下,記號指的是類別名稱。圖9示出了類別表格的一個示例。在該類別表格中,記載了在稍后將 描述的語言模型中使用的類別種類和有關屬于該類別的字的信息。例如, 當在語言模型中使用兩個類別"—人名—"和"_地名—"時,這兩個類別 "—人名一"和"一地名一"被輸入到類別表格中,如圖9所示。當向類別表 格添加新類別時,屬于該新添加的類別的字可以用空白來表示,并且可以 隨著語言模型的學習或調整的進程而向其添加所屬字(belonging word)。在圖9中,屬于類別"_人名—"和"—地名—"的字被表示為"[]",這種 記號表示不存在所屬字。圖10示出了識別字字典存儲單元401的類別表格的另一個示例,其 中,輸入了關于字的信息。在圖10中,第一行上的條目表示字"<千口-(發音為ichiro)"和"廿二一夕口々(發音為sanitarou)"屬于類別 "—人名—"。聲學模型存儲單元403在其中存儲聲學模型,聲學模型表示將被識別 的話語的各個音素的聲學特征。這里,聲學模型是表示各個發音符號(例 如元音或輔音)的話語的聲學特征的模型。在對輸入話語的語音數據與識 別候選字進行比較同時關注與聲音的相似度時會使用聲學模型。作為聲學 模型,例如可以使用隱馬爾可夫模型(HMM, Hidden Markov Model), 但是,根據本實施例的聲學模型并不限于HMM。作為存儲在聲學模型存儲單元403中的聲學模型,可以提供兩種模 型, 一種模型用于安靜的環境(在安靜環境下能夠提供高識別率的聲學模 型),而另一種模型用于嘈雜的環境(在嘈雜環境下能夠提供良好的識別 率的聲學模型),以使得可以依據環境來參考這兩種模型中的任一種。語言模型存儲單元405在其中存儲語言模型,語言模型描述了表示登 記在常用字典存儲單元307和識別字字典存儲單元401的各個字典中的字 如何串聯(連接)的信息(以下稱為串聯信息)。作為描述方法,可以使 用統計字串聯概率(n-gram或者基于類的n-gram (class n-gram))、生成 語法、有限狀態自動機(FSA)等。包含在語言模型存儲單元405中的語言模型包含從特定視角來分類的 字的類別的串聯信息以及這些字的串聯信息。例如,當"表示人名的字所 屬于的類別"被表示為符號"—人名一"并且"表示食物的字所屬于的類 別"被表示為符號"一食物_"時,語言模型還描述了 "—人名_"和"_食 物—"的串聯信息,即,還描述了預先存儲在字典中的各種類別之間的串 聯以及類別和字之間的串聯。因此,可以獲得語言模型中沒有包含的字的串聯信息。例如,當獲得 ""Y于口一 (發音為ichiro)"和(小品詞,發音為wa)"之間的串聯信息時,即使語言模型中沒有描述"<于口一(發音為ichiro)"的串 聯信息,如果可以獲悉"<千口一(發音為ichiro)"屬于表示為符號"— 人名—"的類別,也可以通過獲得"一人名—"和"y:(小品詞,發音為 wa)"之間的串聯信息來獲得"吖千口一 (發音為ichiro)"和(小 品詞,發音為wa)"之間的串聯信息。 <語言模型>接下來,將參考圖11來描述根據本實施例的語言模型的特定示例。 圖11是示出根據第一實施例的語言模型的一個示例的示意圖。在圖11中,使用統計語言模型作為語言模型。統計語言模型是使用 條件概率來描述字的串聯信息的模型。在圖11所示的語言模型中,使用 了三元組(tri-gram)作為統計語言模型,其中,三元組表示三個字1、 2 和3的連續概率,S卩,字的三串聯概率。在圖11中,"P (字31字1字2)"表示在字序列中在連續的"字 1"和"字2"之后出現"字3"的概率。在圖中示出的示例中,在連續的 "<開始>"和"—人名—"之后出現(發音為wa)"的概率是 "0.012"。這樣的概率可以通過分析描述了大量聊天談話的文本來獲得。 作為語言模型,除了三元組之外,還可以根據需要而使用二元組(二串聯 概率)或者一元組(出現一個字的概率)。在圖11的語言模型中,語法是使用類別和字來描述的。即,在圖11 中,"—人名_"和"—地名—"指的是類別"—人名_"和"—地名_",因 此,通過使用這樣的類別來描述三元組,如果表示人名或地名的字被登記 在可變字字典中,則這些字可以被話語識別單元253識別出來。音素列表407是在識別數據庫309中使用的音素符號的列表。音素列 表407將一個音素(或者對應的一個)表示為一個符號,如圖12所示。 例如,在圖12的音素列表中,元音+冒號(例如,"a:")表示延長音, 并且"N"表示"/u (日語平假名,發音為ng)"。另外,"sp"、 "silB" 、 "silE"和"q"全都表示靜音,它們分別表示"發音中的靜 音"、"發音之前的靜音"、"發音之后的靜音"以及"與',,(發音 為tsu)相對應的靜音"。假名-音素轉換規則409是用于將假名字符串轉換成音素序列的規則。這樣,通過存儲假名-音素轉換規則409,常用字典存儲單元307或者識別 字字典存儲單元401可以在其中存儲和維護與音素序列相獨立的假名字符 串,作為發音信息。假名-音素轉換規則409描述了從假名記號向音素(例 如,與記號或者所有可能的假名記號相關的音素的符號)轉換的規則。根 據圖13所示的假名-音素轉換規則409,例如,假名字符串"<千口一" 被轉換為音素序列"i/cM/r/o:"。在上文中,已經描述了根據本發明的第一信息處理裝置20A的功能的 示例。上述組件可以使用通用元件或電路來構成,或者可以用專用于各個 組件的功能的專用硬件來構成。這些組件的全部功能可以利用CPU等來執 行。因此,可以根據實施本實施例時的技術水平來適當地修改硬件配置。第二信息處理裝置20B的配置基本上與第一信息處理裝置20A的相 同,并且將省略它的描述。(話語識別單元253的話語識別處理)接下來,將參考圖14來描述根據本實施例的話語識別單元253的話 語識別處理。圖14是用于說明根據第一實施例的話語識別處理的一個示 例的流程圖。當話語從第一信息處理裝置20A的用戶輸入到諸如麥克風之類的語音 輸入單元251時,開始稍后將描述的話語識別處理。由語音輸入單元251生成的語音信號首先被AD轉換單元301轉換成 作為數字信號的語音數據,并被發送到特征參數提取單元303 (步驟 S101)。此時,AD轉換單元301可以將所生成的語音數據存儲在存儲單 元267中。接下來,語音數據被發送到其的特征參數提取單元303從發送 而來的語音數據中提取諸如Mel倒譜之類的特征量(步驟S103)。在提取 特征參數時,可以使用各種分析方法,例如,倒譜分析、線性預測分析、 基于使用MFCC系數的聲學濾波器的分析。特征參數提取單元303可以在 存儲單元267中存儲從語音數據中提取得到的各種特征參數。一旦特征量被特征參數提取單元303提取出來,匹配單元305就參考 存儲在常用字典存儲單元307中的常用字典或者存儲在識別數據庫309的37識別字字典存儲單元401中的固定字字典和可變字字典,從而通過連接被 表示為這些字典中的符號的一些字來生成字序列(步驟S105)。隨后,匹配單元305基于存儲在識別數據庫309的聲學模型存儲單元403中的聲學 模型來計算所生成的字序列的聲學分數(步驟S105)。這里,聲學分數是 表示作為話語識別的結果的候選的字序列在聲音方面(從聲學的角度)與 輸入語音的相似程度的分數。較高的聲學分數意味著所生成的字序列在聲 學上接近于輸入語音。一旦基于特征參數來計算得到聲學分數,匹配單元305就基于計算得 到的聲學分數來選擇預定數目的具有較高聲學分數的字序列(步驟 S107)。順便提及,匹配單元305可以在存儲單元267中存儲計算得到的 聲學分數或者所選擇的字序列。在完成聲學分數計算之后,匹配單元305基于包含在識別數據庫309 的語言模型存儲單元405中的語言模型來計算在步驟S107中選擇的各個 字序列的語言分數(步驟S109)。例如,如果使用存儲在語言模型存儲單 元405中的各種語言模型中的語法或者有限狀態自動機,則當字序列對于 該語言模型可接受時,該字序列的語言分數為"1";當字序列對于該語 言模型不可接受時,該字序列的語言分數為"0"。當所生成的字序列對于語言模型可接受時,匹配單元305可以留下在 步驟S107中選擇的字序列。或者,當所生成的字序列作為語言可接受, 但是對于語言模型不可接受時,匹配單元305可以刪除在步驟S107中選 擇的字序列。當使用諸如n-gram或者基于類的n-gram之類的統計語言模型作為語 言模型時,使用字序列的生成概率作為語言分數。在本申請人所提出的曰 本專利申請No. 2001-382579 (對應于JP-ANO. 2003-186494)中描述了計 算語言分數的詳細的方法。順便提及,匹配單元305可以將計算所得的語 言分數存儲在存儲單元267中。根據本實施例的語言模型使用存儲在常用字典存儲單元307中的常用 字典或者存儲在識別數據庫309的識別字字典存儲單元401中的固定字字 典和可變字字典來計算語言分數。由于在可變字字典中以按需更新方式來描述隨時間變化的專有名詞,所以可以對語音聊天期間頻繁用作話題的字 進行語言分數計算。在完成聲學分數和語言分數的計算之后,匹配單元305對在步驟S105 中計算得到的聲學分數和在步驟S109中計算得到的語言分數進行合成并 對字序列進行排序,從而將具有最大合成分數的字序列確定為識別結果 (步驟S1U)。具體而言,匹配單元305將根據聲學模型來獲得的聲學分 數和根據語言模型來獲得的語言分數的乘積或對數和為最大的字序列確定 為識別結果。當諸如字的識別權重之類的信息被添加到在語言模型中使用 的字典時,可以使用在其中并入了識別權重的語言分數。在這種情況下,從聲學和語言學角度來看最為合適的字序列被確定為 識別結果。 一旦最合適的字序列被確定為識別結果,匹配單元305就將所 確定的識別結果發送到關鍵字檢測單元255 (步驟S113)。順便提及,匹 配單元305可以將作為所確定的識別結果的字序列存儲在存儲單元267 中。這樣,在根據本實施例的話語識別處理中,在計算語言分數時,通過 參考可變字字典(該可變字字典記載了與用戶在語音聊天期間可能交談的 最近的話題(特定話題)相關的詞匯),可以基于偏好來識別與最近的話 題相關的詞匯。因此,可以提高在通常的話語識別處理中很難識別的最近 的關鍵字或者與關鍵字相關的詞匯的識別率。作為識別結果來顯示的信息 很可能是關于最近的話題的信息,即,用戶感興趣的信息。因此,即使被 顯示的信息不知何故而與用戶語音聊天時的談話不同(即,即使話語識別 的結果存在錯誤),語音聊天的用戶也可能能夠展寬談話。在這種情況 下,執行語音聊天的用戶可以設法允許話語識別處理中的錯誤。<語言分數的計算方法>接下來,將參考圖15來描述根據本實施例的語言分數的計算方法。 圖15是示出根據第一實施例的語言分數的計算公式的示例的示意圖。圖 15示出了當匹配單元305在圖14的步驟S109中選擇字序列"<幵始><千 口一 (發音為ichiro) (發音為wa)何時(發音為nanji) t二 (發音為 ni)起tt (發音為okita) (D (發音為no) <結束〉"時的語言分數的計算公式。語言分數"Score (<開始><千口一(發音為ichiro) (發音為 wa)何時(發音為nanji) t二 (發音為ni)起^;t (發音為okita) (D (發 音為no) <結束>)"是字序列"<開始><千口一 (發音為ichiro) & (發 音為wa)何時(發音為nanji) t二 (發音為ni)起^t (發音為okita) (7) (發音為no) <結束>"的生成概率,如公式(1)所示。語言分數"Score(〈開始〉ichiro wa nanji ni okita no <結束〉"的準確值 是利用"P(〈開始〉)P(ichiro I <開始〉)P(wa I <開始〉ichiro) P(nanji | <開始> ichiro) P(ni | <開始> ichiro wa nanji) P(okita | <開始> ichiro wa nanji ni) P(no | <開始> ichiro wa nanji ni okita) P(〈結束〉| <開始〉ichiro wa nanji ni okita no)"來計算的,如公式(2)所示。如圖16所示,由于語言模型112使用 了三元組,所以條件式"<開始〉ichiro wa"、"<開始〉ichiro wa nanji"、"<開始> ichiro wa nanji ni"、"<開始〉ichiro wa nanji ni okita" 和"<開始〉ichiro wa nanji ni okita no"是利用字序列局限于緊跟在前的兩 個字(即,分別為"ichiro wa" 、 "wa nanji" 、 "nanji ni" 、 "ni okita" 和"okita no")的條件概率來近似得到的(公式(3))。條件概率是通過參考如圖11所示的語言模型來獲得的。但是,由于 語言模型并不包含符號"ichiro",所以匹配單元305通過參考存儲在識別 數據庫309的識別字字典存儲單元401中的類別表格而識別出用符號 "ichiro"表示的字屬于"—人名_"類別,從而將"ichiro"轉換成"一人名具體而言,如公式(4)所示,"P(ichiro I <開始>)"被轉換成 "P(_personal name一 | <開始>)P(ichiro | _personal name—)",然后近似得到 "PCpersonal name—I <開始>>^"。這里,N是屬于類別表格中的"—人名一"類別的字的數目。具體而言,當以P(X I Y)的形式來描述概率時,如果字X屬于類別 C,則首先根據語言模型來得到P(C I Y)的值,并且將所獲得的值乘以P(X IC)的值,其中,P(X I C)是從類別C中生成字X的概率。假設屬于類別C 的字的生成概率相同,那么如果屬于類別C的字的數目為N,則P(X I C)的值可以近似等于1/N。
例如,在"—人名」'類別中僅存在用符號"ichiro"表示的一個字,則 N的值為"1"。因此,如公式(5)所示,"P(wa I <開始> ichiro)"等于 "P(wa I 〈開始〉jersonal name—)"。另夕卜,"P(nanji | ichiro wa)"等于 "P(nanji I _personal name—wa)",如公式(6)所示。
通過使用語言分數的計算方法,可以計算包含可變字的字序列的語言 分數。其結果是,可變字可以被作為識別結果來輸出。
在上述示例中,在系統啟動時,常用字典存儲單元307的常用字典并 不包含任何信息或數據。但是,可以預先在常用字典中存儲若干字。
圖16示出了常用字典的一個示例,其中,在系統啟動時在"—人名 一"類別中輸入了關鍵字"ichiro"。在圖16的示例中,由于在系統啟動 時在"—人名—"類別中輸入了假名發音"<于口一",所以無需登記該關 鍵字就可以檢測到該關鍵字。
在上述示例中,在語言模型中描述了存儲在固定字字典中的字,并且 存儲在可變字字典中的字屬于至少一個類別。屬于該類別的一些字可以存 儲在固定字字典中。
圖17示出了固定字字典的一個示例,并且圖18示出了啟動時的類別 表格的示例。具體而言,在圖16的類別表格中,預先登記了類別"_人名 _"和屬于類別"_人名—"的字的符號"<千口一"。在圖17的固定字字 典131中,預先登記了符號"<千口一"、用符號"一于口一"表示的字 的副本"i千口一"以及音素序列"i/ch/i/r/o:"。
在以上情況下,話語識別處理被執行以使得字"ichiro"屬于"—人名 —"類別。即,從一開始字"ichiro"就被視為人名。但是,由于字 "ichiro"存儲在固定字字典中,所以很難刪除或修改。
這樣,通過預先將可能的字存儲在固定字字典中,可以識別關鍵字而 無需將它們登記在字典中。
(識別字字典生成單元269)
接下來,將參考圖19來詳細描述根據本實施例的識別字字典生成單 元269。圖19是用于說明根據第一實施例的識別字字典生成單元的框圖。如圖19所示,根據本實施例的識別字字典生成單元269包括搜索關
鍵字列表獲取單元501、關鍵字選擇單元503、次關鍵字獲取單元505和 關鍵字信息添加單元507。
搜索關鍵字列表獲取單元501從經由通信網絡12連接到其的搜索服 務器14獲取包含搜索服務器所搜索得到的較高等級的搜索關鍵字的較高 等級搜索關鍵字列表。所獲得的較高等級搜索關鍵字可以是搜索服務器14 的整體上的較高等級搜索關鍵字,或者可以是特定領域的較高等級搜索關 鍵字。所獲得的較高等級搜索關鍵字的數目是任意的。
當從特定領域獲得較高等級搜索關鍵字時,搜索關鍵字列表獲取單元 501可以通過參考存儲在存儲單元267中的語音聊天歷史信息或者所識別 關鍵字的歷史信息來確定第一信息處理裝置20A的用戶的偏好,從而僅獲 取符合用戶偏好的較高等級搜索關鍵字。例如,搜索關鍵字列表獲取單元 501可以使用概率潛在語義分析(PLSA)等來將語音聊天的歷史信息和所 識別關鍵字的歷史信息轉換成具有預定維度的話題矢量的形式。類似地, 搜索服務器的較高等級搜索關鍵字可以被使用PLSA等來轉換成話題矢量 的形式。可以對基于歷史信息的話題矢量和基于較高等級搜索關鍵字的話 題矢量進行比較,從而獲得具有與基于歷史信息來生成的話題矢量相似的 矢量的較高等級搜索關鍵字。
搜索關鍵字列表獲取單元501將從搜索服務器14獲得的搜索關鍵字 列表發送到關鍵字選擇單元503。搜索關鍵字列表獲取單元501可以將所 獲得的搜索關鍵字列表存儲在存儲單元267中。
關鍵字選擇單元503基于第一信息處理裝置20A的偏好來從搜索關鍵 字列表獲取單元501已經從搜索服務器14獲得的搜索關鍵字列表中選擇 關鍵字。可以如下地執行關鍵字的選擇。關鍵字檢測單元255所檢測到的 關鍵字的歷史信息被使用PLSA等來轉換成具有預定維度的話題矢量的形 式。類似地,所獲得的關鍵字可以被使用PLSA等來轉換成話題矢量的形 式。可以對基于歷史信息的話題矢量和基于所獲得的關鍵字列表的話題矢 量進行比較,從而選擇具有與基于歷史信息來生成的話題矢量相似的矢量 的搜索關鍵字。當可以從第二信息處理裝置20B (語音聊天的對應方)獲得語音聊天 的歷史信息或者所識別關鍵字的歷史信息時,可以在執行對從第二信息處
理裝置20B獲得的歷史信息和存儲在第一信息處理裝置20A中的歷史信息 的匹配處理的同時執行關鍵字的選擇。在這種情況下,兩種歷史信息的匹 配可以取兩種歷史信息的并集(union)、合成(integration)或者XOR。 可替代地,可以針對第一或第二信息處理裝置20A或20B的用戶的偏好來 統一匹配。當向所獲得的關鍵字添加稍后將描述的識別權重信息時,可以 使用識別權重的最大值、最小值或平均值來作為新的識別權重信息。
關鍵字選擇單元503可以從搜索關鍵字列表獲取單元501已經從搜索 服務器14獲得的搜索關鍵字列表中刪除不適合登記在可變字字典中的 字。這里,不適合登記在可變字字典中的字可以包括(1)通用字
(general word) ; (2)從常識的角度來看不適合的字;以及(3)話語識 別難以識別的字,例如,僅具有一個或兩個音素的字。
在從搜索服務器14獲得的搜索關鍵字列表中選擇關鍵字之后,關鍵 字選擇單元503將所選擇的關鍵字發送給次關鍵字獲取單元505和關鍵字 信息添加單元507,并將所選擇的關鍵字存儲在可變字字典中,該可變字 字典被存儲在識別字字典存儲單元401中。關鍵字選擇單元503可以將所 選擇的關鍵字存儲在存儲單元267中。
次關鍵字獲取單元505使用搜索服務器14來搜索關鍵字選擇單元503 所選擇的關鍵字,以獲得與關鍵字選擇單元503所選擇的關鍵字相關的次 關鍵字。當搜索服務器14搜索得到一個關鍵字時,作為搜索結果將獲得 多個文檔。次關鍵字獲取單元505使用諸如術語頻率-逆文檔頻率
(TFIDF, term frequency-inverted document frequency)之類的力口權方法來 從所獲得的多個文檔中獲取次關鍵字。通過搜索服務器14從搜索結果中 獲取次字的方法并不限于上述方法,而可以使用所有已知方法。例如,如 果字"廿、乂力一 日本代表(日本足球隊隊員)"被作為關鍵字從關鍵字選 擇單元503發送,則次關鍵字獲取單元505使用搜索服務器14利用關鍵字
"日本足球隊隊員"來執行搜索,以從通過搜索所獲得的文檔中獲得諸如
"才、〉厶(Osim)"或者"中田(Nakata)"之類的關鍵字。在從搜索服務器14獲取次關鍵字完成之后,次關鍵字獲取單元505 將所獲得的次關鍵字以與在搜索時使用的關鍵字相關聯的方式來存儲在識
別字字典存儲單元401中的可變字字典中。次關鍵字獲取單元505將所獲 得的次關鍵字發送到稍后將描述的關鍵字信息添加單元507。順便提及, 次關鍵字獲取單元505可以將所獲得的次關鍵字存儲在存儲單元267中。
關鍵字信息添加單元507向關鍵字選擇單元503所選擇的關鍵字添加 關鍵字信息并將所選擇的關鍵字和關鍵字信息以關聯方式存儲在可變字字 典中,其中,關鍵字信息包括在計算語言分數時使用的識別權重信息以及 話語的一部分或者關鍵字的類型。
可以向與關鍵字相關聯的次關鍵字添加關鍵字信息。
識別權重信息是描述了識別權重(在計算語言分數時使用的校正系數 (權重因子))的信息,語言分數的校正值隨著識別權重的值的增大而增 大,因而具有較大識別權重的關鍵字很可能會被用作識別結果。例如,識 別權重為10的關鍵字被話語識別的概率將是識別權重為1的關鍵字 (即,未經加權的關鍵字)的十倍。
關于識別權重的確定,可以使用從搜索服務器14獲得的搜索關鍵字 列表的等級信息或者關鍵字在話語識別的結果的輸出中的出現頻率。由于 搜索關鍵字列表是在搜索服務器14中被置于較高等級上的搜索關鍵字的 列表,所以可以按在搜索時關鍵字的出現頻率的遞減順序來向它們分配等 級;按等級順序來確定預定的識別權重。具體而言,按在搜索時關鍵字的 出現頻率的遞減順序來向它們分配預定系數,并且將歸一化后的關鍵字頻 率乘以所分配的系數,從而得到識別權重。
關于識別權重的確定,可以使用關于第一信息處理裝置20A的用戶是 否已經使用搜索服務器14來對作為話語識別的結果而獲得的關鍵字執行 搜索的信息或者第一信息處理裝置20A的用戶的偏好。
可以使用在設在因特網上的公告牌或網站中的描述內容或者使用形態 分析工具來添加屬性信息,該屬性信息是關于話語的各個部分或者關鍵字 的類型的信息。可替代地,可以適當地使用因特網上可以得到的百科全 書、維基百科或者日語字典。關于搜索關鍵字列表和次關鍵字的獲取以及關鍵字信息的添加,取代 搜索服務器14可以使用存儲在經由通信網絡12來連接的服務器上的辭
典、本體(ontology)數據庫、百科全書、日語字典、或者形態分析工
具。除了辭典、本體數據庫、百科全書、日語字典和形態分析工具之外,
還可以使用搜索服務器14。
<識別字字典生成/更新處理〉
接下來,將參考圖20來詳細描述根據本實施例的識別字字典生成單 元的操作。圖20是示出根據第一實施例的識別字字典生成/更新處理的示 意圖。
首先,識別字字典生成單元269的搜索關鍵字列表獲取單元501基于 用戶的偏好來從搜索服務器14獲得記載了較高等級的搜索關鍵字的搜索 關鍵字列表。如圖20所示,在搜索關鍵字列表中,記載了 力一日 本代表(日本足球隊隊員)"、"7—》卜-《一7求一》夕,-〉7夕(世 界棒球經典賽事)"、"王監督(王教練)"、"-一3 (濟科)"、 "歌詞(歌詞)"、"27"、"于< ,$ ^ (提拉米蘇)"、"萬座e' — f (曼扎海灘)"、"飲*會(下班后的聚會)"、"'〉二一卜(射 擊)"以及"卑猥(猥瑣)"。搜索關鍵字列表獲取單元501將所獲得的 關鍵字存儲在存儲單元267中,并將它們發送到識別字字典生成單元269 的關鍵字選擇單元503。
關鍵字選擇單元503通過參考發送而來的搜索關鍵字列表來刪除不適 于登記的字。在上述示例中,諸如"飲*會(下班后的聚會)"、 一卜(射擊)"、"歌詞(歌詞)"和"27"之類的通用字以及諸如"卑 猥(猥瑣)"之類的從常識角度來看并不合適的字被從搜索關鍵字列表中 刪除。關鍵字選擇單元503額外地在可變字字典中描述了這樣的字被刪除 了的搜索關鍵字列表。關于在可變字字典中的額外描述,關鍵字選擇單元 503還可以添加關于諸如音素序列或者副本之類的項目以及圖20所示的項 目的描述。
隨后,次關鍵字獲取單元505獲得這樣的在可變字字典中得到額外描 述的關鍵字,并使用搜索服務器14等來獲得與所獲得的關鍵字相關的次關鍵字。例如,如圖20所示,作為搜索服務器14基于關鍵字力一 日本代表(日本足球隊隊員)"來進行搜索的結果,獲得了次關鍵字"才
少厶(Osim)"、"中田(Nakata)"、"巻(Maki)"禾Q " V—^ (Zico)"。這些次關鍵字被以與關鍵字"寸7力一日本代表(日本足球 隊隊員)"相關聯的方式來額外地記載在可變字字典中。類似地,其它關 鍵字的次關鍵字可以被獲得,并且按與它們相關聯的方式來記載在可變字 字典中。
接下來,關鍵字信息添加單元507按在搜索服務器14中的搜索關鍵 字的搜索等級的遞減順序來向刪除了不必要的字的搜索關鍵字分配預定系 數。例如,關鍵字信息添加單元507按在搜索關鍵字列表中的關鍵字的等 級的遞減順序來向關鍵字分配系數10、 9、 8、等,并將所分配的系數乘以 一個值(該值是將各個關鍵字的頻率除以正態期望值而得到的),從而計 算得到識別權重。這樣獲得的識別權重例如可以被乘以S型函數(sigmoid ftmction)。關鍵字信息添加單元507將按上述方式來獲得的識別權重信息 添加到各個關鍵字,并額外地將它們記載在可變字字典中。
識別權重信息的計算方法僅僅是用于說明目的的。根據本實施例的識 別權重信息的計算方法并不限于上述方法,并且在計算識別權重信息時可 以使用除了上述方法之外的其它方法。
如圖20所示,在固定字字典中,預先登記了諸如"食人3 (吃)" "飲tr (喝)"、"匕7卜(擊打)"、")二一卜(射擊)"、"選手
(選手)"和"飲*會(下班后的聚會)"之類的日常談話中通常使用的 字。預先登記在固定字字典中的這些字是如上所述的通用字,并且基于偏 好極有可能不被話語識別,因此,針對這些字,"l"被登記為識別權重
"f曰息。
關鍵字信息添加單元507從使用形態分析工具來獲得的或者可以從搜 索服務器14上的公告牌得到的信息中獲取屬性信息(例如,話語的一部 分或者各個字的類型),從而將它們額外地記載在可變字字典中。例如, 將"名詞運動"作為屬性信息添加到關鍵字"廿'7力一日本代表(曰本 足球隊隊員)",如圖20所示。通過執行上述處理,識別字字典生成單元269可以按需來執行可變字
字典的生成和更新處理。當本實施例的第一信息處理裝置20A第一次被啟
動時,可能存在沒有信息或數據被記載在可變字字典中的情況。出于這個
原因,識別字字典生成單元269根據上述方法來執行可變字字典的生成。 可變字字典的更新可以按任意方式來執行。例如,可變字字典的更新可以 周期性地每隔預定時間段地執行,或者可以根據來自第一信息處理裝置 20A的用戶的更新命令來執行。
關于可變字字典的更新,當作為次關鍵字來記錄的一些字被高頻度地 話語識別時,被高頻度地話語識別出的這些次關鍵字可以被作為關鍵字重 新存儲在可變字字典中。
當執行話語識別處理時,匹配單元305基于存儲在識別數據庫309的 語言模型存儲單元405中的統計語言模型或者語法模型、使用記載在各種 字字典中的內容來執行語言模型的計算。當計算存儲在可變字字典中的字 的語言分數時,匹配單元305使用常用方法基于語言模型來計算語言分 數,并將計算得到的語言分數乘以添加給關鍵字的識別權重,從而獲得在 話語識別時實際使用的語言分數。由于向存儲在可變字字典中的字添加了 大于或等于1的識別權重,如圖20所示,所以為這些字計算得到的語言 分數相對地要大于存儲在常用字典或固定字字典中的字的語言分數。出于 這個原因,在存儲在可變字字典中的字中,經常出現在最近的話題中的特 定字被以高概率識別出。
在上述方法中,使用常用方法來計算得到的語言分數被乘以識別權 重,因此,作為計算結果而得到的語言分數在某種情況下可能等于或大于 1。但是,在話語識別處理中,各個關鍵字就語言分數而言的相對等級比 語言分數的絕對值更重要,因此,語言分數可以具有等于或大于1的值。
如圖21A所示,可以向執行語音聊天的第一和第二信息處理裝置20A 和20B兩者都提供識別字字典生成單元269。如圖21B所示,可以不向執 行語音聊天的第一和第二信息處理裝置20A和20B提供識別字字典生成單 元269,而在服務器18中提供識別字字典生成單元269,服務器18對第 一和第二信息處理裝置20A和20B之間的通信進行中繼。作為圖21B所示的服務器,當在服務器18中提供識別字字典生成單元269時,圖21B 所示的服務器18充當從搜索服務器14獲取搜索關鍵字列表、使用上述方 法從所獲得的搜索關鍵字列表中選擇關鍵字、并向所選擇的關鍵字添加上 述權重信息的識別字字典生成設備。
服務器18中的識別字字典生成單元183基于從語音談話控制單元181 獲得的語音談話的內容來從搜索服務器14獲取搜索關鍵字列表,并根據 上述處理方法、使用所獲得的搜索關鍵字列表來執行字的選擇和識別權重 信息的添加,從而創建可變字字典。之后,服務器18中的識別字字典生 成單元183將所創建的可變字字典發送到第一和第二信息處理裝置20A和 20B。這些信息處理裝置將發送而來的可變字字典存儲在各個識別數據庫 309中,因此,在話語識別處理中可以使用可變字字典。順便提及,第一 和第二信息處理裝置20A和20B可以從服務器18獲取添加了識別權重信 息的字的列表,并基于所獲得的字列表來創建可變字字典。
在圖21A和21B所示的第一和第二信息處理裝置20A和20B中,僅 示出了各個信息處理裝置的一些處理單元。不言而喻,除了所示出的處理 單元之外,這些信息處理裝置還包括圖3到5所示的處理單元。
根據上述本實施例的語音聊天系統,在生成字典時搜索服務器14的 數據庫被用于話語識別。因此,可以使用在最近的話題中經常出現的關鍵 字作為話語識別的語言知識。另外,與話題的關鍵字相關的字被使用銘記 (treasure)等來設置成具有高出現概率,因此,可以使用關聯關鍵字來執 行話語識別。在這種情況下,在根據本實施例的語音聊天系統中,優先識 別與用戶可能交談的最近的話題相關的詞匯,從而提高了識別率。作為識 別結果來顯示的信息很可能是關于最近的話題的信息,即,用戶感興趣的 信息。因此,即使被顯示的信息不知何故而與用戶的談話不同,也可以提 供語音聊天的用戶可以擴寬談話的優點。 (第二實施例)
以下將詳細描述根據本發明第二實施例的關鍵字檢測系統。
圖22是示出根據本發明第二實施例的關鍵字檢測系統的配置的示意圖。如圖22所示,根據本實施例的關鍵字檢測系統ll包括通信網絡12、
搜索服務器14、和信息處理裝置20A和20B (下文中,有時候統稱為信息 處理裝置20)。信息處理裝置20A與家庭網絡19內的外部顯示設備70相 連接。信息處理裝置20A和20B以及外部顯示設備70可以接收從廣播站 80發送而來的廣播信息。
通信網絡12和搜索服務器14具有與根據第一實施例的通信網絡12和 搜索服務器14相同的配置,并提供基本上相同的效果,并且將省略對它 們的詳細描述。
信息處理裝置20A以語音方式與經由通信網絡12連接到其的另一個 信息處理裝置20B執行聊天(語音聊天)。信息處理裝置20A和20B可 以經由通信網絡12來請求經由通信網絡12連接到其的搜索服務器14執行 數據庫的參考或信息的搜索。執行語言聊天的另一個信息處理裝置20B可 以不經由通信網絡12 (如圖所示)來與信息處理裝置20B相連接。可替代 地,另一個信息處理裝置20B可以直接而不是經由通信網絡12來連接到 信息處理裝置20A,即,連接到USB端口、諸如i丄ink之類的IEEE 1394 端口、 SCSI端口、 RS-232C端口等。
信息處理裝置20A與家庭網絡19內的稍后將描述的外部顯示設備70 相連接,因此,可以在信息處理裝置20A和外部顯示設備70之間進行各 種數據的通信。信息處理裝置20A和外部顯示設備70之間的連接可以經 由諸如HDMI-CEC (高清晰多媒體接口-消費電子控件)之類的連接端口 來執行。信息處理裝置20A可以使用在其中設置的接收功能來接收包含從 稍后將描述的廣播站80發送而來的廣播信息的廣播電波。
在如圖所示的示例中,信息處理裝置20是臺式PC,但是,在本實施 例中,信息處理裝置20可以是筆記本式PC。在本實施例中,信息處理裝 置20并不限于上述示例,而例如可以由電視機機頂盒、諸如家用游戲機 之類的信息設備、移動電話、PDA等來構成,只要是能夠具有經由網絡來 通信的功能的設備即可。另外或者是可替代地,信息處理裝置20可以是 由擁有者攜帶的便攜式設備,例如,便攜式游戲機、PHS、或者便攜式視 頻/音頻播放機。外部顯示設備70是顯示單元,例如,CRT顯示單元、液晶顯示單
元、等離子顯示面板單元、或者電致發光(EL)顯示單元。外部顯示設備 70接收包含從稍后將描述的廣播站80發送而來的廣播信息的廣播電波, 并在顯示單元的顯示區域上顯示廣播信息的內容。這里,從廣播站發送而 來的廣播信息指的是通過諸如單波段數字廣播或者12波段數字廣播(以 下稱為全波段數字廣播)之類的地面數字廣播、有線廣播、或者經由網絡 的因特網廣播來提供的諸如廣播文本信息、廣播音頻信息、或者視頻信息 之類的數據。包含廣播信息的廣播電波指的是諸如單波段數字廣播或者全 波段數字廣播之類的地面數字廣播的電波。外部顯示設備70可以經由諸 如HDMI-CEC之類的連接端口將所接收的廣播信息發送到信息處理裝置 20。外部顯示設備70可以接收從信息處理裝置20發送而來的各種數據, 并顯示與該數據相對應的信息。
以下,將通過地面數字廣播的示例來描述第二實施例。
廣播站80發送包含廣播信息的廣播電波,其中,廣播信息包括以下 數據..廣播文本信息、廣播音頻信息、和視頻信息。外部顯示設備70接 收從廣播站80發送而來的廣播電波,并顯示字幕信息或者輸出基于包含 在廣播電波中的廣播文本信息的聲音。信息處理裝置20可以接收從廣播 站80發送而來的廣播電波,以在各種處理中使用該廣播電波的內容。 (信息處理裝置20的配置)
接下來,將詳細描述根據本實施例的信息處理裝置20的配置。根據 本實施例的信息處理裝置20的硬件配置基本上與根據第一實施例的硬件 配置相同,并且將省略對它的詳細描述。
圖23是用于說明根據第二實施例的信息處理裝置20的配置的框圖。 如圖23所示,根據本實施例的信息處理裝置20包括關鍵字管理單元 257、顯示單元261、通信單元265、存儲單元267、識別字字典生成單元 269、廣播文本信息接收單元271、關鍵字檢測單元273、以及外部顯示設 備連接控制單元275。
關鍵字管理單元257管理將從與稍后將描述的廣播文本信息接收單元 271所接收的廣播文本信息相對應的字序列中提取出來的關鍵字。關鍵字管理單元257將搜索歷史信息存儲在存儲單元267中,并基于包含在該歷
史信息中的搜索關鍵字或者所檢測到的關鍵字來選擇被管理的關鍵字,其
中,歷史信息是信息處理裝置20的用戶使用搜索服務器14來執行搜索的 歷史。關鍵字管理單元257所管理的關鍵字由稍后將描述的關鍵字檢測單 元273自由參考。關鍵字管理單元257可以將所管理的關鍵字提供給稍后 將描述的識別字字典生成單元269,并且識別字字典生成單元269可以使 用關鍵字管理單元257所提供的關鍵字和從搜索服務器14獲得的搜索關 鍵字來執行識別字字典的生成或更新。
顯示單元261通過諸如信息處理裝置20的顯示器之類的顯示設備向 信息處理裝置20的用戶顯示從關鍵字檢測單元273發送而來的關鍵字。 顯示單元261可以被配置成顯示與廣播文本信息接收單元271所接收的廣
播文本信息相對應的字序列自身。
通信單元265是安裝在信息處理裝置20中的通信設備。通信單元265 經由通信網絡12對在信息處理裝置20 (具體而言是關鍵字管理單元257 和識別字字典生成單元269)與信息處理裝置20的外部設備(具體而言是 搜索服務器14)或者另一個信息處理裝置20之間的信息通信進行中繼。 此外,通信單元265可以與直接而非經由通信網絡12來連接到信息處理 裝置20的另一個信息處理裝置進行信息通信。
存儲單元267例如是安裝在信息處理裝置20中的存儲設備,并且在 其中存儲諸如由關鍵字檢測單元273檢測到的關鍵字或者由關鍵字管理單 元257管理的關鍵字信息之類的數據。除了這些數據之外,存儲單元267 可以在其中存儲各種數據庫或者由廣播文本信息接收單元271接收的廣播 文本信息。存儲單元267可以適當地在其中存儲在信息處理裝置20執行 處理時需要存儲的各種參數以及該處理的進程信息。當關鍵字管理單元 257、顯示單元261、通信單元265、識別字字典生成單元269、廣播文本 信息接收單元271、關鍵字檢測單元273、外部顯示設備連接控制單元275 等執行對存儲單元267的讀寫時,可以自由地訪問存儲單元267。
識別字字典生成單元269從搜索服務器14獲得搜索關鍵字列表,并 從所獲得的搜索關鍵字列表中僅選擇適當的關鍵字,從而生成在話語識別
51中使用的識別字字典。識別字字典生成單元269從所獲得的搜索關鍵字列 表中選擇關鍵字,并且可以向所選擇的關鍵字添加關鍵字的屬性信息或者 相關的次關鍵字或者添加在話語識別中使用的識別權重。另外,識別字字
典生成單元269可以使用從關鍵字管理單元257發送而來的關鍵字或者關 鍵字檢測單元273已經從稍后將描述的廣播文本信息接收單元271所接收 的廣播文本信息中檢測到的關鍵字來執行識別字字典的生成或更新。根據 本實施例的識別字字典生成單元269的詳細配置或者識別字字典的生成方 法基本上與根據第一實施例的識別字字典生成單元269的配置或者生成方 法相同,并且將省略對它們的詳細描述。
廣播文本信息接收單元271從外部顯示設備70獲得關于外部顯示設 備70當前通過其來進行接收的廣播頻道的接收頻道信息。這里,接收頻 道信息指的是表示下述廣播頻道的信息,其中,外部顯示設備1070當前 正通過該廣播頻道來進行接收。廣播文本信息接收單元271可以通過從外 部顯示設備70獲取接收頻道信息來同步廣播文本信息接收單元271的接 收廣播頻道和外部顯示設備70的接收廣播頻道。
廣播文本信息接收單元271基于所獲得的接收頻道信息來直接從廣播 站80接收與外部顯示設備70的接收廣播頻道相對應的廣播電波。此時, 廣播文本信息接收單元271可以被配置成直接接收從廣播站80發送而來 的廣播電波中的單波段廣播電波,并從所接收的電波中獲取文本信息。廣 播文本信息接收單元271可以被配置成直接接收從廣播站80發送而來的 全波段廣播電波。
廣播文本信息接收單元271可以被配置成基于所獲得的接收頻道信息 來接收由外部顯示設備70接收的并從外部顯示設備70發送到信息處理裝 置20的廣播文本信息。
廣播文本信息接收單元271將所接收的廣播文本信息輸出到稍后將描 述的關鍵字檢測單元273。廣播文本信息接收單元271可以將所接收的廣 播文本信息記錄在存儲單元267中。
關鍵字檢測單元273判斷在與從廣播文本信息接收單元271發送而來 的廣播文本信息相對應的字序列中是否存在由關鍵字管理單元257管理的關鍵字,并且如果存在該關鍵字就將與關鍵字相對應的字作為關鍵字來輸 出。如果在一個字序列中存在多個關鍵字,則關鍵字檢測單元273可以被
配置成檢測所有的相應關鍵字。關鍵字檢測單元273可以被配置成將從字 序列中檢測得到的關鍵字發送到顯示單元261。
例如,當識別結果"最近的結構改革已凸現"被從廣播文本信息接收 單元271發送,并且關鍵字"結構改革"存在于由關鍵字管理單元257管 理的關鍵字中時,關鍵字檢測單元273輸出"結構改革"作為關鍵字。
外部顯示設備連接控制單元275執行信息處理裝置20和連接到信息 處理裝置20的外部顯示設備70之間的連接控制。外部顯示設備連接控制 單元275將關鍵字檢測單元273所檢測到的關鍵字等發送到外部顯示設備 70。在從外部顯示設備70得到關于外部顯示設備70的用戶已經參考或者 選擇特定關鍵字或者與關鍵字相關的文章的通知時,外部顯示設備連接控 制單元275可以將參考歷史或者選擇歷史記錄在存儲單元267中,并經由 通信單元265來通知搜索服務器14。搜索服務器14可以在在搜索服務器 14內執行的各種處理中使用該參考歷史或者選擇歷史。順便提及,當向外 部顯示設備70發送與各種信息相對應的數據時,外部顯示設備連接控制 單元275可以將有待發送的數據的格式轉換成可以由外部顯示設備70顯 示的格式。
在上文中,已經描述了根據本實施例的信息處理裝置20的功能的示 例。上述組件可以使用通用元件或電路來構成,或者可以由專用于各個組 件的功能的專用組件來構成。這些組件的全部功能可以用CPU等來執 行。因此,可以根據實施本實施例時的技術水平來適當地修改硬件配置。
根據本實施例的信息處理裝置20還可以包括根據第一實施例的信息 處理裝置20的話語識別單元或者語音談話控制單元。信息處理裝置20還 可以包括用于存儲記錄在搜索服務器14中的搜索關鍵字列表的內容的數 據庫存儲單元。在這種情況下,搜索關鍵字列表的內容可以存儲在設在信 息處理裝置20中的數據庫存儲單元中。因此,可以縮短信息處理裝置20 訪問搜索服務器14所需的時間。另外,通過周期性地更新數據庫存儲單 元的內容,信息處理裝置20可以獲取記錄在搜索服務器14中的最近的搜索關鍵字列表的內容。
(外部顯示設備70的配置)
接下來,將參考圖24和25來詳細描述根據本實施例的外部顯示設備 70的配置。圖24是用于說明根據第二實施例的外部顯示設備的配置的框 圖。圖25是示出根據第二實施例的外部顯示設備的信息顯示屏幕的示意 圖。
根據本實施例的外部顯示設備70的硬件包括諸如CRT、液晶顯示面 板、等離子顯示面板、或者EL面板之類的顯示元件,以及由CPU、 ROM 和RAM構成且在控制顯示元件的驅動時使用的驅動控制電路。
如圖24所示,本實施例的外部顯示設備70包括廣播接收單元701、 連接端口控制單元703、廣播信息顯示控制單元705、關鍵字信息顯示控 制單元707以及顯示單元709。
廣播接收單元701接收從廣播站80發送而來的廣播電波并將廣播電 波中包含的諸如廣播文本信息、廣播音頻信息、或者視頻信息之類的數據 輸出到連接端口控制單元703和廣播信息顯示控制單元705 (稍后將描 述)。廣播接收單元701可以被配置成將所接收的信息記錄在設在外部顯 示設備70中的存儲單元(未示出)中,或者記錄在與外部顯示設備70相 連接的外部附接的存儲單元(未示出)中。
連接端口控制單元703控制能夠與信息處理裝置20進行數字通信的 諸如HDMI-CEC之類的連接端口 。連接端口控制單元703將關于廣播接收 單元701正通過其來接收的廣播頻道的接收頻道信息經由諸如MDMI-CEC 之類的連接端口來發送到信息處理裝置20。廣播接收單元701所接收的諸 如廣播文本信息、廣播音頻信息、以及視頻信息之類的數據可以經由連接 端口控制單元703來輸出到信息處理裝置20。從信息處理裝置20發送而 來的各種數據被經由連接端口控制單元703來輸入到外部顯示設備70。從 信息處理裝置20發送而來的各種數據被發送到稍后將描述的關鍵字信息 顯示控制單元707。
當在稍后將描述的顯示單元709上顯示從廣播接收單元701發送而來 的廣播文本信息、廣播音頻信息和視頻信息時,廣播信息顯示控制單元705執行顯示控制。
當在稍后將描述的顯示單元709上顯示從信息處理裝置20發送而來 的關鍵字信息時,關鍵字信息顯示控制單元707執行顯示控制。這里,從 信息處理裝置20發送而來的關鍵字信息指的是這樣的信息,該信息包括 由信息處理裝置20提取的關鍵字、對所提取的關鍵字的搜索結果、以及 與這些關鍵字相關的文章。在從顯示單元709接收到對關于外部顯示設備 70的用戶通過諸如鼠標、鍵盤、或遙控器之類的輸入設備來選擇的在顯示 單元709上顯示的信息的詳細信息的獲取請求之后,關鍵字信息顯示控制 單元707將該詳細信息獲取請求經由連接端口控制單元703來發送到信息 處理裝置20。
顯示單元709在外部顯示設備70的信息顯示屏幕上顯示由廣播信息 顯示控制單元705來進行顯示控制的廣播文本信息、廣播音頻信息和視頻 信息,以及由關鍵字信息顯示控制單元707來進行顯示控制的關鍵字信 息。
外部顯示設備70的信息顯示屏幕751通常包括圖像顯示區域753,廣 播文本信息、廣播音頻信息和視頻信息被顯示在圖像顯示區域753上。這 里,當從'信息處理裝置20發送而來關鍵字信息時,信息顯示屏幕751的 顯示區域被分割以生成關鍵字信息顯示區域755,關鍵字信息被顯示在該 關鍵字信息顯示區域755上。圖像顯示區域753例如由廣播信息顯示控制 單元705來控制,并且關鍵字信息顯示區域755例如由關鍵字信息顯示控 制單元707來控制。
關鍵字信息顯示區域755的細節基本上與根據本發明第一實施例的信 息處理裝置的搜索結果顯示屏幕50相同,并且將省略對它的詳細描述。
在上文中,已經描述了根據本發明的外部顯示設備70的功能的示 例。上述組件可以使用通用元件或電路來構成,或者可以利用專用于各個 組件的功能的專用硬件來構成。這些組件的全部功能可以利用CPU等來 執行。因此,可以根據實施本實施例時的技術水平來適當地修改硬件配 置。
(關鍵字檢測方法)接下來,將參考圖26來詳細描述由根據本實施例的信息處理裝置20
執行的關鍵字檢測方法的示例。圖26是用于說明根據第二實施例的關鍵
字檢測方法的流程圖。
首先,信息處理裝置20的廣播文本信息接收單元271基于從外部顯 示設備70獲得的接收頻道信息來接收來自外部顯示設備70或者廣播站80 的廣播文本信息,從而獲得廣播字幕的字符串作為文本信息數據(步驟 S201)。廣播文本信息接收單元271將所獲得的文本信息數據輸出到關鍵 字檢測單元273。
接下來,關鍵字檢測單元273對發送而來的文本信息數據應用形態分 析,以從字符串中提取字,并將所提取的字記錄在信息處理裝置20的存 儲器上(步驟S203)。
接下來,關鍵字檢測單元273使用關鍵字管理單元257的內容來對所 提取的字進行搜索(步驟S205)。
隨后,關鍵字檢測單元273判斷所提取的字是否存在于關鍵字管理單 元257中(步驟S207)。當所提取的字存在于關鍵字管理單元257中時, 關鍵字檢測單元273將存在的所提取字記錄在存儲器上,作為廣播關鍵字 數據(步驟S209)。當所提取的字并不存在于關鍵字管理單元257中時, 關鍵字檢測單元273執行稍后將描述的步驟S211的處理。
接下來,關鍵字檢測單元273判斷所提取的、沒有在關鍵字管理單元 257中找到的字是否存在于存儲器上(步驟S211)。當未找到的字存在于 存儲器上時,執行步驟S205的處理。當未找到的字并不存在于存儲器中 時,關鍵字檢測單元273輸出存在于存儲器上的廣播關鍵字數據,作為所 提取的關鍵字(步驟S213)。
通過使用上述方法,根據本實施例的信息處理裝置20可以從所接收 的廣播文本信息中提取關鍵字。
在根據本實施例的信息處理裝置20中,存在于關鍵字管理單元257 中的字(關鍵字)是被自動地從發送自廣播站的廣播文本信息中提取出 來。因此,可以向外部顯示設備70顯示所提取的關鍵字。通過使用這樣 的功能,使用信息處理裝置20或者外部顯示設備70來執行諸如聊天之類的雙向通信的用戶可以使用所提取的關鍵字作為聊天的話題等。 (根據第二實施例的信息處理裝置的第一修改示例)
接下來,將參考圖27和28來詳細描述根據本實施例的信息處理裝置 20的第一修改示例。圖27是用于說明信息處理裝置20的第一修改示例的 配置的框圖。圖28是用于說明根據本修改示例的關鍵字檢測方法的流程 圖。根據本修改示例的信息處理裝置20的硬件配置基本上與本發明第二 實施例的硬件配置相同,并且將省略對它的詳細描述。
如圖27所示,根據本修改示例的信息處理裝置20包括話語識別單元 253、關鍵字檢測單元255、關鍵字管理單元257、顯示單元261、通信單 元265、存儲單元267、識別字字典生成單元269、廣播音頻信息接收單元 277、外部顯示設備連接控制單元275。
根據本修改示例的關鍵字管理單元257、顯示單元261、通信單元 265、存儲單元267和外部顯示設備連接控制單元275具有與根據第一實 施例的關鍵字管理單元257、顯示單元261、通信單元265、存儲單元 267、和外部顯示設備連接控制單元275基本相同的配置,并提供基本相 同的效果,并且將省略對它們的詳細描述。
話語識別單元253基于由稍后將描述的廣播音頻信息接收單元277接 收的廣播音頻信息來執行話語識別。話語識別單元253生成與廣播音頻信 息相對應的字序列作為話語識別的結果,并將所生成的字序列發送到稍后 將描述的關鍵字檢測單元255。話語識別單元253可以被配置成將所生成 的字序列發送給顯示單元261。話語識別單元253的詳細配置和話語識別 方法與根據本發明第一實施例的話語識別單元253的配置和話語識別方法 基本相同,并且將省略對它們的詳細描述。
關鍵字檢測單元255判斷在與從話語識別單元253發送而來的廣播音 頻信息相對應的字序列中是否存在由關鍵字管理單元257管理的關鍵字, 并且如果存在該關鍵字,就將與該關鍵字相對應的字作為關鍵字來輸出。 如果在一個字序列中存在多個關鍵字,則關鍵字檢測單元255可以被配置 成檢測所有的相應關鍵字。關鍵字檢測單元255可以被配置成將從字序列 中檢測到的關鍵字發送到稍后將描述的顯示單元261。
57例如,當識別結果"最近的結構改革已凸現"被從話語識別單元253
發送時并且當關鍵字"結構改革"存在于關鍵字管理單元257所管理的關 鍵字中時,關鍵字檢測單元255輸出"結構改革"作為關鍵字。
識別字字典生成單元269從搜索服務器14獲取搜索關鍵字列表等, 并從所獲得的搜索關鍵字列表中僅選擇合適的關鍵字,從而生成在話語識 別中使用的識別字字典。識別字字典生成單元269從所獲得的搜索關鍵字 列表中選擇關鍵字,并可以向所選擇的關鍵字添加關鍵字的屬性信息或者 相關的次關鍵字,或者添加在話語識別中使用的識別權重。另外,識別字 字典生成單元269可以使用從關鍵字管理單元257發送而來的關鍵字或者 關鍵字檢測單元255已經從稍后將描述的廣播音頻信息接收單元277所接 收的廣播音頻信息中檢測得到的關鍵字來執行識別字字典的生成或更新。 根據本實施例的識別字字典生成單元269的詳細配置或者識別字字典的生 成方法與根據第一實施例的識別字字典生成單元269的配置或者生成方法 基本相同,并且將省略對它們的詳細描述。
廣播音頻信息接收單元277從外部顯示設備70獲取關于外部顯示設 備當前正通過其來接收的廣播頻道的接收頻道信息。廣播音頻信息接收單 元277可以通過從外部顯示設備70獲取接收頻道信息來同步廣播音頻信 息接收單元277的接收廣播頻道和外部顯示設備70的接收廣播頻道。
廣播音頻信息接收單元277基于所獲得的接收頻道信息來直接從廣播 站80接收與外部顯示設備70的接收廣播頻道相對應的廣播電波。此時, 廣播音頻信息接收單元277可以被配置成直接接收從廣播站80發送而來 的廣播電波中的單波段廣播電波,并從所接收的電波中獲取音頻信息。廣 播音頻信息接收單元277可以被配置成直接接收從廣播站80發送而來的 全波段廣播電波。
廣播音頻信息接收單元277可以被配置成基于所獲得的接收頻道信息 來接收由外部顯示設備70接收的并且被從外部顯示設備70發送到信息處 理裝置20的廣播音頻信息。
廣播音頻信息接收單元277將所接收的廣播音頻信息輸出到話語識別 單元253。廣播音頻信息接收單元277可以將所接收的廣播音頻信息記錄在存儲單元267中。
在上文中,已經描述了根據本修改示例的信息處理裝置20的功能的
示例。上述組件可以使用通用元件或電路來構成,或者可以利用專用于各
個組件的功能的專用硬件來構成。這些組件的全部功能可以利用CPU等
來執行。因此,可以根據實施本實施例時的技術水平來適當地修改硬件配 置。
根據本修改示例的信息處理裝置20還可以包括根據第一實施例的信 息處理裝置20的話語識別單元或者語音談話控制單元。信息處理裝置20 還可以包括用于存儲記錄在搜索服務器14中的搜索關鍵字列表的內容的 數據庫存儲單元。在這種情況下,搜索關鍵字列表的內容可以存儲在設在 信息處理裝置20中的數據庫存儲單元中。因此,可以縮短信息處理裝置 20訪問搜索服務器14所需的時間。另外,通過周期性地更新數據庫存儲 單元的內容,信息處理裝置20可以獲取記錄在搜索服務器14中的最近的 搜索關鍵字列表的內容。 (關鍵字檢測方法)
接下來,將參考圖28來詳細描述由根據本修改示例的信息處理裝置 20執行的關鍵字檢測方法的示例。
首先,信息處理裝置20的廣播音頻信息接收單元277基于從外部顯 示設備70獲得的接收頻道信息來從外部顯示設備70或廣播站80接收廣播 音頻信息,并且話語識別單元253對該廣播音頻信息執行話語識別,以確 定話語識別的結果(步驟S301)。話語識別單元253將所確定的話語識別 的結果輸出到關鍵字檢測單元255。
接下來,關鍵字檢測單元255對話語識別的結果應用形態分析以從話 語識別的結果中提取字,并將所提取的字記錄在信息處理裝置20的存儲 器上(步驟S303)。
接下來,關鍵字檢測單元255使用關鍵字管理單元257的內容來對所 提取的字進行搜索(步驟S305)。
隨后,關鍵字檢測單元255判斷所提取的字是否存在于關鍵字管理單 元257中(步驟S307)。當所提取的字存在于關鍵字管理單元257中時,關鍵字檢測單元255將存在的所提取字記錄在存儲器上,作為廣播關鍵字
數據(步驟S309)。當所提取的字并不存在于關鍵字管理單元257中時, 關鍵字檢測單元255執行稍后將描述的步驟S311的處理。
接下來,關鍵字檢測單元255判斷所提取的沒有在關鍵字管理單元 257中找到的字是否存在于存儲器上(步驟S311)。當未找到的字存在于 存儲器上時,執行步驟S305的處理。當未找到的字并不存在于存儲器中 時,關鍵字檢測單元255將存在于存儲器上的廣播關鍵字數據作為所提取 關鍵字來輸出(步驟S313)。
通過使用上述方法,根據本修改示例的信息處理裝置20可以從所接 收的廣播音頻信息中提取關鍵字。
在根據本修改示例的信息處理裝置20中,存在于關鍵字管理單元257 中的字(關鍵字)被自動地從發送自廣播站80的廣播音頻信息中提取。 因此,可以向外部顯示設備70顯示所提取的關鍵字。通過使用這樣的功 能,使用信息處理裝置20或者外部顯示設備70來執行諸如聊天之類的雙 向通信的用戶可以使用所提取的關鍵字作為聊天的話題等。
本領域技術人員應當了解,在所附權利要求或其等同物的范圍內,可 以依據設計要求和其它因素來進行各種修改、組合、子組合和變更。
例如,在上述實施例中,廣播站80發送地面數字廣播。但是,廣播 站80可以提供有線廣播或者因特網廣播。
在上述實施例中,圖27示出了廣播站80通過地面數字廣播來提供電 視節目的情況。但是,利用可攜式攝像機來提供的AV內容也可以,其 中,用戶利用該可攜式攝像機來親自捕捉和再現圖像。
在上述實施例中,在話語識別中使用的各種字字典被存儲在常用字典 存儲單元307和識別數據庫309的識別字字典存儲單元401中。但是,在 話語識別中使用的各種字字典可以存儲在這些存儲單元的任意一個中。
在上述實施例中,在識別字字典存儲單元401中存儲了僅僅一個固定 字字典、僅僅一個可變字字典、以及僅僅一個類別表格。但是,在識別字 字典存儲單元401中可以存儲多個固定字字典、多個可變字字典、和/或多 個類別表格。通過在識別字字典存儲單元401中存儲多個固定字字典、多個可變字字典、和/或多個類別表格,可以生成專用于特定領域的多個識別
字典。關于與特定關鍵字高度相關的字,出現頻率或者N-gram或基于類 的N-gram概率可以被設置成較高,以增加該特定關鍵字的識別率。
順便提及,在本說明書中的步驟并不必須以這里所描述的順序、按時 間順序來處理,并且可以并行或單獨地處理。
同時,隨著因特網相關技術的發展,已經變得可以在個人計算機 (PC)之間通過語音來進行聊天(這種聊天在下文中被稱為語音聊天)。
如果可以使用安裝在PC中的語音聊天應用來在PC的顯示設備上顯示 與談話內容相關的信息,則可以提高用戶在聊天時的便利性。基于此,作 為相關技術的一個示例,JP-B-3526101公開了一種系統,該系統對語音聊 天的談話內容執行話語識別,從談話內容中提取關鍵字,從數據庫中搜索 相關信息,并將搜索結果顯示在屏幕上。
作為相關技術的另一個示例,公開了一種同步系統,用于對兩臺PC 進行同步,以使得可以利用兩臺PC的瀏覽器來顯示相同的屏幕顯示。但 是,該同步系統并不涉及語音聊天技術。
但是,在JP-B-3526101所公開的系統中,用戶必須手動地向語音聊天 的對應方發送在屏幕上顯示的信息,以共享在屏幕上顯示的信息,因而該 系統并不適合通信。
在利用PC瀏覽器來允許用戶看見相同的顯示的同步系統中,由于該 系統并沒有被配置成與談話相關,所以每次談話話題變化時,用戶可能就 必須手動地輸入信息以搜索與該談話相關的網站。因此,在實踐上可能很 難自動且有效地同步談話內容和所有講話者的終端。
本發明是鑒于上述情形而設計出來的。存在對提供下述新的且改進了 的語言聊天系統、信息處理裝置和程序的需要,這些系統、裝置和程序能 夠在語言聊天期間自動且高效地同步與談話內容相關的關鍵字。
還存在對提供下述新的且改進了的信息處理裝置和程序的需要,該信 息處理裝置和程序能夠自動且高效地同步在從廣播站發送而來的廣播信息 中包含的關鍵字。
根據本發明的觀點,提供了一種語音聊天系統,該語音聊天系統包括執行語音聊天的多個信息處理裝置;在語音聊天期間從談話對話中提 取關鍵字時由信息處理裝置參考的關鍵字提取數據庫;以及在使用所提取 的關鍵字來搜索關鍵字和與這些關鍵字相關的文章時由信息處理裝置使用 的搜索引擎,其中,至少一個信息處理裝置包括參數提取單元,其從根 據談話來生成的語音數據中提取參數,該參數表現了語音數據的特征;關 鍵字提取單元,其識別所生成的語音數據并基于參數和關鍵字提取數據庫 來從語音數據中提取關鍵字;信息搜索單元,其使用搜索引擎來搜索所提 取的關鍵字,并獲得針對這些關鍵字的搜索結果和與這些關鍵字相關的文 章;顯示單元,其顯示與針對所述關鍵字的搜索結果的地址信息相關聯的 關鍵字以及與和關鍵字相關的文章的地址信息相關聯的文章;以及關鍵字 同步單元,其將所提取的關鍵字發送給作為聊天的對應方的信息處理裝 置,并執行與對應方信息處理裝置的關鍵字同步。
根據上述實施例,在執行語音聊天的信息處理裝置中,參數提取單元 從根據語音聊天期間的談話對話來生成的語音數據中提取參數,該參數表 現了語音數據的特征;關鍵字提取單元識別所生成的語音數據,并基于所 述參數和關鍵字提取數據庫來從語音數據中提取關鍵字;信息搜索單元使 用搜索引擎來搜索所提取的關鍵字,并獲得針對這些關鍵字的搜索結果和 與這些關鍵字相關的文章;顯示單元以與針對所述關鍵字的搜索結果的地 址信息以及所述文章的地址信息相關聯的方式來顯示這些關鍵字和與這些 關鍵字相關的文章;并且關鍵字同步單元將所提取的關鍵字發送給作為聊 天的對應方的信息處理裝置,并執行與對應方信息處理裝置的關鍵字同 步。在本發明實施例的語音聊天系統中,對語音聊天期間的談話內容自動 地執行話語識別以提取關鍵字,并且這些關鍵字被自動地發送到語音聊天 的對應方。因此,可以提高用戶在語音聊天時的便利性。
根據本發明的另一個觀點,提供了與另一個信息處理裝置執行語音聊 天的信息處理裝置,該裝置包括參數提取單元,其從根據語音聊天期間 的談話對話來生成的語音數據中提取參數,該參數表現了語音數據的特 征,-關鍵字提取單元,其識別所生成的語音數據,并基于所述參數和關鍵 字提取數據庫來從語音數據中提取關鍵字;信息搜索單元,其使用搜索引擎來搜索所提取的關鍵字,并獲取針對這些關鍵字的搜索結果和與這些關 鍵字相關的文章;以及搜索信息聚積單元,其以分別與針對所述關鍵字的 搜索結果的地址信息以及所述文章的地址信息相關聯的方式來聚積關鍵字 和文章。
根據上述實施例,參數提取單元從根據語音聊天期間的談話對話來生
成的語音數據中提取參數,該參數表現了語音數據的特征;關鍵字提取單
元識別所生成的語音數據,并基于關鍵字提取數據庫來從語音數據中提取
關鍵字;信息搜索單元使用搜索引擎來搜索所提取的關鍵字,并獲得針對 這些關鍵字的搜索結果和與這些關鍵字相關的文章;并且搜索信息聚積單
元以分別與針對所述關鍵字的搜索結果的地址信息以及所述文章的地址信 息相關聯的方式來聚積關鍵字和文章。從語音數據的生成到搜索信息的獲 取的處理是自動地被執行的。因此,信息處理裝置的用戶不必執行任何額 外的操作,并且可以自動地獲取可以用作語音聊天的話題的信息。
信息處理裝置還可以包括關鍵字同步單元,該關鍵字同步單元將所提 取的關鍵字發送給作為聊天的對應方的信息處理裝置,并執行與對應方信 息處理裝置的關鍵字同步。根據上述實施例,關鍵字同步單元將所提取的 關鍵字發送給作為聊天的對應方的信息處理裝置,并執行關鍵字同步。所 提取的關鍵字被自動地發送給聊天的對應方信息處理裝置,因此,語音聊 天的對應方可以共享所提取的關鍵字,而無需執行額外的操作。
信息處理裝置還可以包括存儲關鍵字提取數據庫的數據庫存儲單元。 根據上述實施例,關鍵字提取數據庫被存儲在信息處理裝置的數據庫存儲 單元中,并因而可以縮短信息處理裝置訪問關鍵字提取數據庫所需的時 間。其結果是,可以縮短信息處理裝置執行關鍵字檢測所需的時間。
搜索引擎可以設置在信息處理裝置內。根據上述實施例,搜索引擎被 設置在信息處理裝置中。其結果是,可以縮短信息處理裝置訪問搜索引擎 所需的時間。結果,可以縮短搜索與關鍵字相關的信息所需的時間。
信息處理裝置還可以包括顯示單元,該顯示單元顯示與針對關鍵字的 搜索結果的地址信息相關聯的關鍵字以及與和關鍵字相關的文章的地址信 息相關聯的文章。根據上述實施例,關鍵字和與關鍵字相關的文章分別被以與針對關鍵字的搜索結果的地址信息以及文章的地址信息相關聯的方式 來顯示在顯示單元上。由于關鍵字和與關鍵字相關的文章都被顯示,所以 當所顯示的文章包含用戶感興趣的信息時,用戶可以容易地訪問該信息。
信息處理裝置還可以包括參考歷史存儲單元,該參考歷史存儲單元存 儲關鍵字的參考歷史。根據上述實施例,關鍵字的參考歷史被存儲在信息 處理裝置的參考歷史存儲單元中。信息處理裝置在從語音數據中提取關鍵 字時對參考歷史存儲單元進行參考,從而使能高效的關鍵字檢測。
參考歷史存儲單元可以按與指派給各個聊天和聊天的對應方的標識符 相關聯的方式來存儲被參考的關鍵字。根據上述實施例,與被參考的關鍵 字相關的信息被以與指派給各個聊天和聊天的對應方的標識符相關聯的方 式來存儲在參考歷史存儲單元中。因此,通過使用參考歷史存儲單元的內 容,可以使能更高效的關鍵字檢測。
關鍵字提取單元可以基于偏好來提取位于參考歷史的更高等級的關鍵 字。可替代地,關鍵字提取單元可以基于偏好來提取搜索引擎的更高等級 搜索關鍵字。根據上述實施例,位于參考歷史的更高等級的關鍵字或者搜 索引擎的更高等級搜索關鍵字是由關鍵字檢測單元基于偏好來提取的。由 于這樣的關鍵字高度可用作語音聊天的話題,所以可以提高話語識別的精 確度。
根據本發明的又一個實施例,提供了一種與另一個信息處理裝置執行 語音聊天的信息處理裝置,至少一個信息處理裝置包括參數提取單元, 其從根據語音聊天期間的談話對話來生成的語音數據中提取參數,該參數 表現了語音數據的特征;關鍵字提取單元,其識別所生成的語音數據并基
于所述參數和關鍵字提取數據庫來從語音數據中提取關鍵字;信息搜索單
元,其使用搜索引擎來搜索所提取的關鍵字,并獲得針對這些關鍵字的搜
索結果和與這些關鍵字相關的文章;以及搜索信息聚積單元,其以分別與 針對所述關鍵字的搜索結果的地址信息和所述文章的地址信息相關聯的方 式來聚積關鍵字和文章,其中,信息處理裝置包括關鍵字同步單元,該關 鍵字同步單元接收從所述至少一個信息處理裝置發送而來的關鍵字,并執 行與相應的信息處理裝置的關鍵字同步。根據上述實施例,關鍵字同步單元接收從作為語音聊天的對應方的至 少一個信息處理裝置(具有參數提取單元、關鍵字提取單元、信息搜索單 元和搜索信息聚積單元)發送而來的關鍵字,并執行與該信息處理裝置的 關鍵字同步。由于施加巨大處理負荷的話語識別或關鍵字檢測是由作為語 音聊天的對應方的至少一個信息處理裝置執行的,所以可以在沒有向用戶 自己的信息處理裝置施加額外負荷的情況下執行語音聊天。
根據本發明的又一個觀點,提供了一種用于允許計算機實現以下功能 的程序從根據語音聊天期間的談話對話來生成的語音數據中提取參數的 參數提取功能,所述參數表現了語音數據的特征;識別所生成的語音數據 并基于所述參數和關鍵字提取數據庫來從語音數據中提取關鍵字的關鍵字 提取功能;使用搜索引擎來搜索所提取的關鍵字并獲得針對所述關鍵字的
搜索結果和與這些關鍵字相關的文章的信息搜索功能;以及以分別與針對
所述關鍵字的搜索結果的地址信息和所述文章的地址信息相關聯的方式來 存儲關鍵字和文章的搜索信息存儲功能。
根據上述實施例,計算機程序被存儲在計算機的存儲單元中,并且在
計算機的CPU讀取程序時該計算機程序被執行,從而致使計算機作為信 息處理裝置來進行工作。可以提供在其中記錄計算機程序的計算機可讀記 錄介質。該記錄介質例如可以是磁盤、光盤、磁性光盤、以及閃存。計算 機程序可以例如經由網絡來分發,而無需使用記錄介質。
根據本發明的又一個觀點,提供了一種允許計算機實現以下功能的程 序接收從至少一個信息處理裝置發送而來的關鍵字,并執行與相應的信
息處理裝置的關鍵字同步的關鍵字同步功能。
根據上述實施例,計算機程序被存儲在計算機的存儲單元中,并且當
計算機的CPU讀取程序時該計算機程序被執行,從而致使計算機作為信
息處理裝置來進行工作。可以提供在其中記錄計算機程序的計算機可讀記 錄介質。該記錄介質例如可以是磁盤、光盤、磁性光盤、和閃存。計算機 程序可以例如經由網絡來分發,而無需使用記錄介質。
根據本發明的又一個觀點,提供了一種信息處理裝置,該裝置包括
廣播文本信息接收單元,其接收從廣播站發送而來的廣播文本信息;關鍵字提取單元,其基于關鍵字提取數據庫來從廣播文本信息中提取關鍵字; 信息搜索單元,其使用搜索引擎來搜索所提取的關鍵字,并獲得針對這些 關鍵字的搜索結果和與這些關鍵字相關的文章;以及外部顯示設備連接控 制單元,其執行與外部顯示設備的連接控制,并將所述關鍵字、針對這些 關鍵字的搜索結果、以及與這些關鍵字相關的文章輸出到外部顯示設備。
根據上述實施例,廣播文本信息接收單元接收從廣播站發送而來的廣 播文本信息;關鍵字提取單元基于關鍵字提取數據庫來從廣播文本信息中 提取關鍵字;信息搜索單元使用搜索引擎來搜索所提取的關鍵字,并獲得 針對這些關鍵字的搜索結果和與這些關鍵字相關的文章;并且外部顯示設 備連接控制單元執行與外部顯示設備的連接控制,并將所述關鍵字、針對 這些關鍵字的搜索結果、以及與這些關鍵字相關的文章輸出到外部顯示設 備。從廣播文本信息的接收到搜索信息的獲取的處理被自動地執行。因 此,信息處理裝置的用戶不必執行任何額外的操作,并且所獲得的搜索信 息可以自動地被顯示到外部顯示設備。
廣播文本信息接收單元可以從與信息處理裝置相連接的外部顯示設備 獲取有關外部顯示設備正通過其來進行接收的廣播頻道的接收頻道信息以 及與該廣播頻道相對應的廣播文本信息。可替代地,廣播文本信息接收單 元可以從與信息處理裝置相連接的外部顯示設備獲取有關外部顯示設備正 通過其來進行接收的廣播頻道的接收頻道信息,并從廣播站獲取與該廣播 頻道相對應的廣播文本信息。
信息處理裝置還可以包括參考歷史存儲單元,該單元存儲在外部顯示 設備中的關鍵字的參考歷史,并且外部顯示設備連接控制單元可以將外部 顯示設備所選擇的關鍵字通知給搜索引擎。
信息處理裝置還可以包括關鍵字同步單元,該單元將所提取的關鍵字 發送給至少一個信息處理裝置,并執行與該至少一個信息處理裝置的關鍵 字同步。
根據本發明的又一個觀點,提供了一種信息處理裝置,該裝置包括
廣播音頻信息接收單元,其接收從廣播站發送而來的廣播音頻信息;參數 提取單元,其從包含在廣播音頻信息中的語音數據中提取參數,該參數表現了語音數據的特征;關鍵字提取單元,其識別所述語音數據,并基于所 述參數和關鍵字提取數據庫來從語音數據中提取關鍵字;信息搜索單元, 其使用搜索引擎來搜索所提取的關鍵字,并獲取針對這些關鍵字的搜索結 果和與這些關鍵字相關的文章;以及外部顯示設備連接控制單元,其執行 與外部顯示設備的連接控制,并將所述關鍵字、針對這些關鍵字的搜索結 果、以及與這些關鍵字相關的文章輸出到外部顯示設備。
根據上述實施例,廣播音頻信息接收單元接收從廣播站發送而來的廣 播音頻信息;參數提取單元從包含在廣播音頻信息中的語音數據中提取參 數,該參數表現了語音數據的特征;關鍵字提取單元識別所述語音數據, 并基于所述參數和關鍵字提取數據庫來從語音數據中提取關鍵字;信息搜 索單元使用搜索引擎來搜索所提取的關鍵字,并獲取針對這些關鍵字的搜 索結果和與這些關鍵字相關的文章;并且外部顯示設備連接控制單元執行 與外部顯示設備的連接控制,并將所述關鍵字、針對這些關鍵字的搜索結 果、以及與這些關鍵字相關的文章輸出到外部顯示設備。從包含在廣播音 頻信息中的語音數據的接收到搜索信息的獲取的處理被自動地執行。因 此,信息處理裝置的用戶不必執行任何額外的操作,并且所獲得的搜索信 息可以自動地被顯示到外部顯示設備。
廣播音頻信息接收單元可以從與信息處理裝置相連接的外部顯示設備 獲取有關外部顯示設備正通過其來進行接收的廣播頻道的接收頻道信息以 及與該廣播頻道相對應的廣播音頻信息。可替代地,廣播音頻信息接收單 元可以從與信息處理裝置相連接的外部顯示設備獲取有關外部顯示設備正 通過其來進行接收的廣播頻道的接收頻道信息,并從廣播站獲取與該廣播 頻道相對應的廣播音頻信息。
信息處理裝置還可以包括參考歷史存儲單元,該單元存儲在外部顯示 設備中的關鍵字的參考歷史,并且外部顯示設備連接控制單元可以將外部 顯示設備所選擇的關鍵字通知給搜索引擎。
信息處理裝置還可以包括關鍵字同步單元,該單元將所提取的關鍵字 發送給至少一個信息處理裝置,并執行與該至少一個信息處理裝置的關鍵 字同步。根據本發明的又一個觀點,提供了一種用于允許計算機實現以下功能 的程序接收從廣播站廣播的廣播文本信息的廣播文本信息接收功能;基 于關鍵字提取數據庫從廣播文本信息中提取關鍵字的關鍵字提取功能;使 用搜索引擎來搜索所提取的關鍵字并獲取針對這些關鍵字的搜索結果和與 這些關鍵字相關的文章的信息搜索功能;以及執行與外部顯示設備的連接 控制并將所述關鍵字、針對這些關鍵字的搜索結果、以及與這些關鍵字相 關的文章輸出到外部顯示設備的外部顯示設備連接控制功能。
根據上述實施例,計算機程序被存儲在計算機的存儲單元中,并且在 計算機的CPU讀取程序時該計算機程序被執行,從而致使計算機作為信 息處理裝置來進行工作。可以提供在其中記錄計算機程序的計算機可讀記 錄介質。該記錄介質例如可以是磁盤、光盤、磁性光盤、和閃存。計算機 程序可以例如經由網絡而不是使用記錄介質來分發。
根據本發明的又一個觀點,提供了一種用于允許計算機實現以下功能 的程序接收從廣播站發送而來的廣播音頻信息的廣播音頻信息接收功 能;從包含在廣播音頻信息中的語音數據中提取參數的參數提取功能,其 中,所述參數表現了語音數據的特征;識別所述語音數據并基于所述參數 和關鍵字提取數據庫從語音數據中提取關鍵字的關鍵字提取功能;使用搜 索引擎來搜索所提取的關鍵字并獲取針對這些關鍵字的搜索結果和與這些 關鍵字相關的文章的信息搜索功能;以及執行與外部顯示設備的連接控制 并將所述關鍵字、針對這些關鍵字的搜索結果、以及與這些關鍵字相關的 文章輸出到外部顯示設備的外部顯示設備連接控制功能。
根據上述實施例,計算機程序被存儲在計算機的存儲單元中,并且在 計算機的CPU讀取程序時該計算機程序被執行,從而致使計算機作為信 息處理裝置來工作。可以提供在其中記錄計算機程序的計算機可讀記錄介 質。該記錄介質例如可以是磁盤、光盤、磁性光盤、和閃存。計算機程序 可以例如經由網絡而不是使用記錄介質來分發。
以下將參考附圖來詳細描述本發明的優選實施例。注意,在本說明書 和附圖中,具有基本相同的功能和結構的結構元件被用相同的標號來表 示,并且將省略對這些結構元件的重復說明。(第三實施例)
以下,將詳細描述根據本發明第三實施例的語音聊天系統。
圖29是示出根據第三實施例的語音聊天系統的示意圖。語音聊天系
統1010包括通信網絡1012、關鍵字提取數據庫1030、搜索引擎1040、以 及信息處理裝置1020A和1020B (下文中,有時候統稱為信息處理裝置 1020)。
通信網絡1012是連接信息處理裝置1020、關鍵字提取數據庫1030和 搜索引擎1040以使能在它們之間的雙向或單向通信的通信網絡。通信網 絡1012例如可以由諸如因特網、電話網絡、衛星通信網絡或廣播通信頻 道之類的公共網絡或者諸如WAN (廣域網)、LAN (局域網)、IP-VPN (因特網協議-虛擬私有網絡)、以太網(注冊商標)、或者無線LAN之 類的私有網絡來構成。通信網絡1012可以是有線的或者是無線的。
信息處理裝置1020以語音的方式與經由通信網絡1012連接到其的另 一個信息處理裝置1020執行聊天(語音聊天)。信息處理裝置1020可以 經由通信網絡1012來請求經由通信網絡1012連接到其的關鍵字提取數據 庫1030和搜索引擎1040執行數據庫的參考或信息的搜索。
執行語音聊天的另一個信息處理裝置1020可以經由通信網絡1012來 與其相連接,如圖所示。可替代地,另一個信息處理裝置1020可以直接 而非經由通信網絡1012來連接到USB (通用串行總線)端口、諸如i丄ink 之類的IEEE 1394端口、 SCSI (小型計算機系統接口)端口、 RS-232C端 口等。
在圖示的示例中,信息處理裝置1020是臺式PC,但是,在本實施例 中,信息處理裝置1020可以是筆記本式PC。在本實施例中,信息處理裝 置1020并不限于上述示例,而可以例如由電視機機頂盒、諸如家用游戲 機之類的信息設備、移動電話、PDA (個人數字助手)等來構成,只要是 能夠具有經由網絡來通信的功能的設備即可。另外或者可替代地,信息處 理裝置1020可以是由擁有者攜帶的便攜式設備,例如,便攜式游戲機、 PHS、或便攜式視頻/音頻播放機。
在圖29中,僅僅兩個信息處理裝置1020與通信網絡1012相連接。但是,本實施例并不限于此示例,并且多個信息處理裝置1020可以與通信 網絡1012相連接。
關鍵字提取數據庫1030是在信息處理裝置1020從根據語音聊天期間 的談話內容來獲得的語音數據中提取關鍵字時信息處理裝置1020所參考 的數據庫。在關鍵字提取數據庫1030中,描述了諸如充當關鍵字的字的 發音、音素和音節的串聯關系以及關鍵字的類別之類的各種信息。例如, 在關鍵字提取數據庫1030中,搜索引擎的較高等級搜索關鍵字或者頻繁 地被用作博客中的話題的術語被描述成關鍵字。關鍵字提取數據庫1030 可以是根據搜索引擎(搜索服務器)的較高等級搜索關鍵字或者頻繁地被 用作博客中的話題的術語的變化而按需來更新的動態數據庫;或者,關鍵 字提取數據庫1030可以是靜態數據庫。在關鍵字提取數據庫1030中描述 的關鍵字可以利用概率潛在語義分析(PLSA)模型等來處理,并且被轉 換成合適的話題矢量的形式。這里,話題矢量指的是話題的矢量空間表 示,并且被用于確定話題的共性。另外,可以向在關鍵字提取數據庫1030 中描述的關鍵字添加稍后將描述的識別權重信息。
充當關鍵字的字的發音、音素和音節的串聯關系指的是這樣的關系, 該關系表示出被描述成關鍵字提取數據庫1030中的關鍵字的字是如何在 它們的發音、音素和音節方面相互串聯(連接)的。作為描述該串聯關系 的一種方法,可以使用統計字串聯概率(n-gram或者基于類的n-gmrn)、 生成語法、有限狀態自動機(FSA)等。
搜索引擎1040是用戶可以使用關鍵字等通過因特網來搜索可用信息 的網站的數據庫。這里,所述信息可以是向公眾開放的或者是不公開的。 在本實施例中,搜索引擎1040可以提供允許使用關鍵字來搜索所存儲的 信息的全文的全文搜索服務;或者可以是允許搜索按類別來分類的信息的 目錄服務。
(信息處理裝置1020的配置)
接下來,將參考圖30來簡要描述根據本實施例的信息處理裝置1020 的配置。
在以下描述中,術語"字"指的是在話語識別處理中便于作為單個字
70來處理的單元。其并不一定與語言學上的字相同。例如,"夕口々君(發
音為ta醒kun)"可以處理為一個字,或者可以處理為"tarou"和"kun"
形式的兩個字。此外,更大的單元"二入t;:sy:夕口o君(發音為
konnichiwataroukun)"可以被作為一個字來處理。
另外,術語"音素"指的是從聲學的角度便于作為單個單元來處理的 單元。其并不一定與語音音節或音素相同。例如,在字"東京(發音為 tou kyou)"中,"tou"部分可以用三個音素符號"t/o/u"來表示,或者 用"to:" ( "o"的長音)來表示。此外,"tou"部分可以用"t/o/o"來 表示。另外,可以采用表示靜音的符號。此外,可以采用將靜音分成"發 音之前的靜音"、"插入在發音之間的短靜音"、"發音中的靜音"、以 及"與'3 (發音為tsu)'相對應的靜音"的符號。
圖30是示出根據本實施例的信息處理裝置1020的硬件配置的示意 圖。信息處理裝置1020包括中央處理單元(CPU) 1201、只讀存儲器 (ROM) 1203、隨機存取存儲器(RAM) 1205、主機總線1207、橋 1209、外部總線1211、接口 1213、輸入設備1215、輸出設備1217、存儲 設備1219、驅動器1221、以及通信設備1233。
CPU 1201用作算術處理單元和控制單元。CPU 1201根據記錄在ROM 1203、 RAM 1205、存儲設備1219或可移動記錄介質1014中的各種程序 來控制信息處理裝置1020中的內部操作的全部或一部分。ROM 1203存儲 由CPU 1201使用的程序、算術參數等。RAM 1205暫時存儲CPU 1201執 行時所使用的程序和在CPU 1201執行時適當地變化的參數。CPU 1201、 ROM 1203和RAM 1205經由主機總線1207 (例如,CPU總線)而相互連 接。
主機總線1207經由橋1209而與外部總線1211 (例如,外圍組件互連 (PCI)總線)相連接。
輸入設備1215包括諸如鼠標、鍵盤、觸摸屏、按鈕、開關、和控制 桿之類的由用戶操作的操作單元和諸如麥克風和頭戴式耳機之類的語音輸 入單元。輸入設備1215可以是使用紅外光或者其它電波的遙控單元(所 謂的遙控器),或者可以是與信息處理裝置1020的操作相對應的諸如移動電話或PDA之類的外部連接設備。輸入設備1215可以是一種輸入控制 電路,該輸入控制電路基于用戶使用操作單元或語音輸入單元輸入的信息
來生成輸入信號并將所生成的輸入信號輸出到CPU 1201。信息處理裝置 1020的用戶操作輸入設備1215來向信息處理裝置1020輸入各種數據或者 指示信息處理裝置1020執行處理操作。
輸出設備1217例如可以由可以以可視或可聽的方式來將所獲得的信 息通知給用戶的顯示單元(例如,陰極射線管(CRT)顯示單元、液晶顯 示(液晶顯示)單元、等離子顯示面板(PDP)單元、電致發光(EL)顯 示單元、或燈)、音頻輸出單元(包括揚聲器和頭戴式耳機)、以及諸如 打印機、移動電話或傳真機之類的設備來構成。輸出設備1217例如輸出 搜索服務器搜索的各種信息。具體而言,顯示單元將搜索服務器對各種信 息的搜索結果作為文本或圖像來顯示。同時,音頻輸出單元將被播放的語 音數據轉換成語音并輸出該語音。
存儲設備1219是作為根據本實施例的信息處理裝置1020的存儲單元 的一個示例的數據存儲設備。存儲設備1219例如由諸如硬盤驅動器 (HDD)之類的磁存儲單元、半導體存儲設備、光存儲設備、磁光存儲設 備等來構成。存儲設備1219存儲由CPU 1201執行的程序或各種數據以及 從外部獲得的各種數據。
驅動器1221是存儲介質的讀寫器。驅動器1221被設置在信息處理裝 置1020中,或者從外部附接于信息處理裝置1020。驅動器1221讀出記錄 在諸如磁盤、光盤、磁光盤、或半導體存儲器之類的可移動存儲介質1014 中的信息(該信息被載入到驅動器1221),并將所讀出的信息輸出到 RAM 1205。驅動器1221可以將載入到驅動器1221中的信息記錄在諸如 磁盤、光盤、磁光盤或半導體存儲器之類的可移動存儲介質1014中。可 移動存儲介質1014例如可以是DVD介質、HD-DVD介質、藍光介質、緊 湊式閃存(CF)、記憶棒、或安全數字(SD)存儲卡。可移動存儲介質 1014例如可以是其上安裝有非接觸式IC芯片的電子設備或集成電路 (IC)卡。
通信設備1223是由用于連接到通信網絡1012的通信設備構成的通信接口。通信設備1223例如可以是用于有線或無線局域網(LAN)的通信 卡、藍牙或無線USB (WUSB)、用于光通信的路由器、用于非對稱數字 用戶線路(ADSL)的路由器、或者用于各種通信協議的調制解調器。通 信設備1223在收發有關與另一個信息處理裝置1020語音聊天的信息時向 因特網或其它通信設備發送各種信息以及從其接收各種信息。連接到通信 設備1223的通信網絡1012可以由以有線或無線方式來連接的諸如因特 網、家庭LAN、紅外光通信、或者衛星通信之類的網絡構成。
利用上述配置,信息處理裝置1020可以與直接連接到信息處理裝置 1020的另一個信息處理裝置或者與經由通信網絡1012來連接到其的另一 個信息處理裝置進行語音聊天,同時從經由通信網絡1012來連接到其的 關鍵字提取數據庫1030、搜索引擎1040等獲取各種信息。此外,信息處 理裝置1020可以使用可移動存儲介質1014來取出存儲在信息處理裝置 1020中的信息。
在上文中,已經描述了可以實現根據本實施例的信息處理裝置1020 的功能的硬件配置的示例。上述組件可以使用通用元件來構成,或者可以 利用專用于各種組件的功能的專用硬件來構成。因此,可以根據實施本實 施例時的技術水平來適當地修改硬件配置。上述硬件配置僅僅用于說明性 目的,并且本發明決不局限于此。可以依據使用的形式來省略諸如主機總 線1207、外部總線1211或接口 1213之類的一些組件。
接下來,將詳細描述根據本實施例的信息處理裝置1020的配置。在 以下描述中,執行語音聊天的兩個信息處理裝置1020將被稱為第一信息 處理裝置1020A和第二信息處理裝置1020B。第一和第二信息處理裝置 1020A和1020B根據信息處理裝置的各個用戶的聲音來生成語音數據,并 將該語音數據發送到作為語音聊天的對應方的另一個信息處理裝置。圖31 是用于說明根據第三實施例的第一信息處理裝置1020A的配置的框圖。
根據本實施例的第一信息處理裝置1020A包括語音輸入單元1231、 話語識別單元1233、語音談話控制單元1239、語音輸出單元1241、信息 搜索單元1243、關鍵字同步單元1245、顯示單元1247、通信單元1249和 存儲單元1251。語音輸入單元1231是向第一信息處理裝置1020A輸入語音聊天期間 的談話對話(第一信息處理裝置1020A的用戶所發出的話語)的接口。語 音輸入單元1231例如由與第一信息處理裝置1020A相連接的諸如麥克風 或頭戴式耳機之類的輸入設備來構成。用戶向麥克風或頭戴式耳機發出的 話語被自動實時地輸入到第一信息處理裝置1020A。所輸入的模擬信號被 通過AD轉換來采樣量化,并被作為語音數據(數字信號)經由語音輸入 單元1231來發送到話語識別單元1233。
話語識別單元1233例如由CPU、 ROM或RAM來構成。話語識別單 元1233基于從語音輸入單元1231發送而來的語音數據實時地執行話語識 別。話語識別單元1233還包括參數提取單元1235和關鍵字提取單元 1237。
參數提取單元1235從所生成的語音數據的每一幀(按適當的時間間 隔)中提取諸如Mel頻率倒譜系數(MFCC)及其時差參數、語音數據的 頻譜、功率線性預測系數、倒譜系數、和線譜對之類的特征參數。
參數提取單元1235將所提取的特征參數發送到關鍵字提取單元 1237。關鍵字提取單元1237可以將所提取的特征參數存儲在稍后將描述 的存儲單元1251中。
關鍵字提取單元1237基于關鍵字提取數據庫1030和由參數提取單元 1235提取并生成的特征參數來從語音數據(第一信息處理裝置1020A的用 戶所發出的話語的數字信號)中提取關鍵字。當關鍵字提取單元1237提 取關鍵字時,關鍵字提取單元1237可以經由通信單元1249來參考與通信 網絡1012相連接的關鍵字提取數據庫1030。
在語音聊天期間用戶所發出的話語的語句中包含多個關鍵字。關鍵字 提取單元1237自動地提取存在于話語語句中的所有關鍵字。關鍵字提取 單元1237將所提取的關鍵字發送到稍后將描述的信息搜索單元1243。關 鍵字提取單元1237可以將所提取的關鍵字存儲在存儲單元1251中。
稍后將描述話語識別單元1233識別從語音輸入單元1231發送而來的 語音并從所識別的語音中提取關鍵字的方法。
語音談話控制單元1239例如由CPU、 ROM禾n RAM來構成,并控制與經由通信網絡1012來連接的第二信息處理裝置1020B的語音聊天。語
音談話控制單元1239接收語音輸入單元1231所生成的語音數據,并經由 通信單元1249將該語音數據發送到第二信息處理裝置1020B。語音談話控 制單元1239經由通信單元1249來接收從第二信息處理裝置1020B發送而 來的語音數據,并將該語音數據發送到語音輸出單元1241。語音談話控制 單元1239可以被配置成,每次語音聊天被執行時就將執行語音聊天的日 期、用于標識語音聊天的標識符、和用于標識語音聊天的對應方的標識符 以關聯方式來存儲在存儲單元1251中。
語音談話控制單元1239可以用專用于語音談話控制的專用硬件來構 成,并且可以被設置為諸如語音聊天程序之類的應用程序。
語音輸出單元1241是這樣的接口,該接口接收由第二信息處理裝置 1020B的用戶發出的話語的語音數據,并將所接收的語音數據輸入到第一 信息處理裝置1020A。語音輸出單元1241例如由作為與第一信息處理裝 置1020A相連接的輸出設備的揚聲器或耳機來構成。
經由通信單元1249從第二信息處理裝置1020B接收的語音數據被經 由語音輸出單元1241來輸入給第一信息處理裝置1020A的用戶。
信息搜索單元1243以關聯方式將從關鍵字提取單元1237發送而來的 關鍵字和這些關鍵字被從關鍵字提取單元1237發送的時間存儲在存儲單 元1251中。信息搜索單元1243判斷是否將對從關鍵字提取單元1237發送 而來的關鍵字執行關鍵字同步處理。當判定關鍵字同步處理應當被執行 時,信息搜索單元1243將這些關鍵字發送到關鍵字同步單元1245,從而 請求執行關鍵字同步處理。信息搜索單元1243經由通信單元1249來訪問 搜索引擎1040,并執行從關鍵字提取單元1237發送而來的關鍵字的信息 搜索,從而獲取針對所述關鍵字的搜索結果和與這些關鍵字相關的文章。 信息搜索單元1243將所獲得的搜索結果存儲在存儲單元1251的搜索結果 存儲單元1253中,并將該搜索結果發送到顯示單元1247。這里,信息搜 索單元1243從搜索引擎1040獲得的搜索結果包括關于搜索關鍵字的信息 在搜索引擎1040中的標題或URL以及信息的元數據,例如信息的類型。
當顯示單元1247請求獲取關于特定關鍵字或與該關鍵字相關的文章的更詳細的信息時,信息搜索單元1243經由通信單元1249來訪問搜索引 擎1040以獲取更詳細的信息,并將從顯示單元1247通知的特定關鍵字存 儲在存儲單元1251的參考歷史存儲單元1255中。
關鍵字同步單元1245將關鍵字提取單元1237從語音數據中提取的關 鍵字經由通信單元1249來發送到第二信息處理裝置1020B,從而同步第一 和第二信息處理裝置1020A和1020B。關鍵字同步處理不僅可以在從第一 信息處理裝置1020 A到第二信息處理裝置1020B的方向上執行,而且可 以按以下方式在從第二信息處理裝置1020B到第一信息處理裝置1020A的 方向上執行。即,第一信息處理裝置1020A可以響應于由第二信息處理裝 置1020B啟動的關鍵字同步處理,以使得從第二信息處理裝置1020B發送 的關鍵字被第一信息處理裝置1020A所接收。
顯示單元1247將從信息搜索單元1243發送而來的信息搜索結果例如 經由瀏覽器應用來顯示給對第一信息處理裝置1020A提供的諸如顯示器等 的輸出設備。信息搜索單元1243從搜索引擎1040獲得的信息包含信息或 文章在搜索引擎1040中的URL等。因此,當第一信息處理裝置1020A的 用戶通過與第一信息處理裝置1020A相連接的諸如鼠標或鍵盤之類的輸入 設備來選擇被顯示的信息時,顯示單元1247請求信息搜索單元1243獲取 被選擇的信息的細節。
通信單元1249例如是安裝在第一信息處理裝置1020A中的通信設 備。通信單元1249對經由通信網絡1012的在第一信息處理裝置1020A (具體而言,是關鍵字提取單元1237、語音談話控制單元1239、信息搜 索單元1243和關鍵字同步單元1245)與第一信息處理裝置1020A的外部 設備(具體而言,關鍵字提取數據庫1030、搜索引擎1040)或者第二信 息處理裝置1020B之間信息通信進行中繼。此外,通信單元1249可以與 直接而非經由通信網絡1012來與第一信息處理裝置1020A相連接的其它 信息處理裝置進行信息通信。
存儲單元1251例如是安裝在第一信息處理裝置1020A中的存儲設 備,并且在其中存儲諸如關鍵字提取單元1237所提取的關鍵字或者信息 搜索單元1243所獲得的搜索信息之類的數據。除了這些數據之外,存儲單元1251還可以在其中存儲各種數據庫或者由語音輸入單元1231生成的 語音數據。此外,存儲單元1251還可以在其中存儲在第一信息處理裝置 1020A執行處理時需要存儲的各種參數以及該處理的進程信息。在話語識 別單元1233、語音談話控制單元1239、信息搜索單元1243、關鍵字同步 單元1245等對存儲單元1251自由地執行讀取時,存儲單元1251可以自由 地被訪問。存儲單元1251還可以包括搜索信息聚積單元1253和參考歷史 存儲單元1255。
搜索信息聚積單元1253以關聯方式來聚積信息獲取數據和信息搜索 單元1243所獲得的搜索信息。當需要顯示已經獲得的搜索信息時,可以 參考存儲在搜索信息聚積單元1253中的信息以顯示該己經獲得的信息。
參考歷史存儲單元1255將在顯示單元1247上顯示的關鍵字或文章中 的、第一信息處理裝置1020A的用戶為了更詳細的信息而參考的關鍵字存 儲作為參考歷史。參考歷史是這樣的數據,該數據包括所參考的關鍵字、 所參考關鍵字的權重信息、已經參考關鍵字的語音聊天自身的標識符、以 及語音聊天的對應方。當關鍵字提取單元1237提取關鍵字時可以使用存 儲在參考歷史存儲單元1255中的參考歷史。
信息搜索單元1243、關鍵字同步單元1245、和顯示單元1247可以用 專用于各種功能的專用硬件來構成,并且可以被設置為諸如話語識別程序 之類的應用程序。
第二信息處理裝置1020B的配置與第一信息處理裝置1020A基本相 同,并且將省略對它的描述。
在上文中,己經描述了根據本發明的信息處理裝置1020的功能的示 例。上述組件可以使用通用元件或電路來構成,或者可以用專用于各個組 件的功能的專用硬件來構成。這些組件的全部功能可以利用CPU等來執 行。因此,可以根據實施本實施例時的技術水平來適當地修改硬件配置。 (話語識別方法和關鍵字提取方法)
以下,將參考圖32來簡要描述話語識別單元1233執行話語識別以從 話語識別的結果中提取關鍵字的方法。根據本實施例的話語識別單元1233 所使用的話語識別方法和關鍵字提取方法并不限于以下所描述的示例。圖32是用于說明根據本實施例的話語識別單元1233所使用的話語識別方法
和關鍵字提取方法的示例的流程圖。
語音輸入單元1231根據輸入到其的第一信息處理裝置1020A的用戶 的話語來生成語音數據。在語音輸入單元1231中,所輸入的用戶話語被 AD轉換以對該作為模擬信號的話語進行采樣量化,并且該模擬話語信號 被轉換成作為數字信號的語音數據(步驟S1101)。在完成向語音數據的 轉換之后,語音輸入單元1231將所生成的語音數據發送到話語識別單元 1233和語音談話控制單元1239。
隨后,參數提取單元1235從所生成的語音數據的每一幀(以適當的 時間間隔)中提取諸如Mel頻率倒譜系數(MFCC)及其時差參數、語音 數據的頻譜、功率線性預測系數、倒譜系數、和線譜對之類的特征參數 (步驟S1103)。
關鍵字提取單元1237計算與輸入到語音輸入單元1231的話語(輸入 語音)最接近的字序列作為識別結果,并例如通過參考關鍵字提取數據庫 1030、聲學模型、語音模型、以及在聲學模型或語音模型中使用的字典基 于從參數提取單元1235獲得的特征參數來從識別結果中提取關鍵字。
這里,聲學模型在其中存儲這樣的模型,該模型表示將被識別的話語 的各個音素、音節等的聲學特征。作為聲學模型,例如可以使用隱馬爾可 夫模型(HMM)。作為聲學模型,可以提供兩種模型, 一種模型用于安 靜的環境(能夠在安靜環境下提供高識別率的聲學模型),而另一種模型 用于嘈雜環境(能夠在嘈雜環境下提供良好的識別率的聲學模型),從而 可以依據環境來參考任一種模型。
語言模型在其中存儲這樣的模型,該模型描述了表示登記在各個字典 中的字是如何串聯(連接)的信息(串聯信息)。作為語言模型,可以使 用統計字串聯概率(n-gram或者基于類的n-gram)、生成語法、有限狀態 自動機(FSA)等。
語言模型可以在其中存儲字的類別的串聯信息以及字的串聯信息。例 如,當"表示人名的字所屬于的類別"被表示為符號"—人名—"并且"表 示食物的字所屬于的類別"被表示為符號"—食物—"時,語言模型還描述了 "—人名」,和"—食物一"的串聯信息,艮P,還描述了預先存儲在字典中 的各種類別之間的串聯以及類別和字之間的串聯。
因此,可以獲得語言模型中沒有包含的字的串聯信息。例如,當獲得
"丫于口一 (發音為ichiro)"和(小品詞,發音為wa)"之間的串 聯信息時,即使語言模型中沒有描述"吖于口一 (發音為ichiro)"的串 聯信息,如果可以獲悉"吖于口一 (發音為ichiro)"屬于表示為符號"— 人名—"的類別,也可以通過獲得"_人名—"和"1* (小品詞,發音為 wa)"之間的串聯信息來獲得"一千口一 (發音為ichiro)"和(小 品詞,發音為wa)"之間的串聯信息。
在從語音輸入單元1231接收到語音數據之后,關鍵字提取單元1237 通過基于聲學模型按照字的發音或音素來連接這些字中的一些從而生成字 序列。關鍵字提取單元1237基于聲學模型來計算所生成的字序列的聲學 分數(步驟S1105)。這里,聲學分數是表示作為話語識別的結果的字序 列與輸入語音在聲音方面(從聲學角度)的相似程度的數值。關鍵字提取 單元1237基于計算得到的聲學分數來選擇具有較高聲學分數的預定數目 的字序列。
關鍵字提取單元1237可以使用基于集束搜索的維特比解碼器或者基 于A4叟索的堆棧解碼器來執行匹配。另外或者可替代地,在匹配時可以 使用所謂的關鍵字辨認方法。如果向關鍵字提取單元1237所參考的各種 字字典添加"識別權重"信息,則可以對稍后將描述的語言分數進行加 權,并且識別結果可以按加權后的分數來分等級。識別權重信息是描述了 識別權重的信息,其中,識別權重是在計算語音分數時使用的校正系數 (權重系數);當識別權重具有較大值時,語言分數的校正值隨之增加, 因而具有較大識別權重的關鍵字極有可能被用作識別結果。例如,識別權 重為10的關鍵字將被話語識別的概率是識別權重為1的關鍵字(即,未 經加權的關鍵字)將被話語識別的概率的10倍。
關于識別權重的確定,可以使用從搜索引擎1040獲得的搜索關鍵字 列表的等級信息或者關鍵字在話語識別的結果的輸出中的出現頻率。由于 搜索關鍵字列表是在搜索引擎1040中被置于較高等級上的搜索關鍵字的列表,所以可以按關鍵字在搜索時的出現頻率的遞減順序來向這些關鍵字 賦予等級;預定的識別權重是按等級的順序來確定的。
具體而言,按關鍵字在搜索時的出現頻率的遞減順序來向這些關鍵字 賦予預定系數,并且歸一化的關鍵字頻率被乘以所賦予的系數,從而獲得 識別權重。關于搜索關鍵字列表和次關鍵字的獲取以及關鍵字信息的添
加,取代搜索引擎1040可以使用存儲在經由通信網絡1012來連接的服務
器中的辭典、本體數據庫、百科全書、日語字典、或者形態分析工具。除 了辭典、本體數據庫、百科全書、日語字典和形態分析工具之外,還可以
使用搜索引擎1040。
關于識別權重的確定,可以使用關于第一信息處理裝置1020A的用戶 是否己經使用搜索引擎1040來對作為話語識別的結果而獲得的關鍵字執 行搜索的信息,或者第一信息處理裝置1020A的用戶的偏好。
隨后,關鍵字提取單元1237基于語言模型來計算各個所選擇的字序 列的語言分數(步驟S1109)。這里,語言分數是用于判斷所選擇的字序 列是否適合語言模型的數值。如果使用語法或者有限狀態自動機來作為語 言模型,則語言分數是指示出字序列對于該語言模型是否可接受的數值。 如果使用靜態語言模型作為語言模型,則語言分數是字序列的生成概率。 具體而言,如果使用語法或有限狀態自動機作為語言模型,則當字序列對 于該語言模型可接受時,字序列的語言分數為"1";當字序列對于該語 言模型不可接受時,字序列的語言分數為"0"。當使用諸如n-gram或基 于類的n-gram之類的靜態語言模型來作為語言模型時,使用字序列的生成 概率作為語言分數。在由本申請人提出的日本專利申請No. 2001-382579 (對應于JP-A NO. 2003-186494)中描述了計算語言分數的詳細方法。
隨后,關鍵字提取單元1237對在之前的步驟中計算得到的聲學分數 和語言分數進行合成和排序,并利用該分數來選擇字序列(步驟 Sllll),從而確定具有最大合成分數的字序列作為識別結果(步驟 S1113)。具體而言,關鍵字提取單元1237將根據聲學模型來獲得的聲學 分數和根據語言模型來獲得的語言分數的乘積或算術和為最大的字序列確 定為識別結果。當向在語言模型中使用的字典添加了諸如字的識別權重之類的信息時,可以使用其中并入了識別權重信息的語言分數。
在這種情況下,從聲學和語言學角度來看最適合的字序列別確定為識 別結果。
隨后,關鍵字提取單元1237經由通信單元1249來訪問關鍵字提取數 據庫1030,以對話語識別的結果和登記在關鍵字提取數據庫1030中的關 鍵字進行比較(步驟S1115)。如果在話語識別的結果中包含登記在關鍵 字提取數據庫1030中的字,則關鍵字提取單元1237確定將提取該包含在 話語識別的結果中的字(步驟S1117)。
關鍵字提取單元1237可以被配置成在訪問關鍵字提取數據庫1030之 前訪問作為語音聊天的對應方的第二信息處理裝置1020B,從而交換語音 聊天的識別結果。例如,通過交換語音信息或者講話者的說話方式,可以 提高話語識別的精確度。為了使信息處理裝置的話語識別的結果生效,可 以交換話語識別的結果的話題矢量。
通過使用上述話語識別方法和關鍵字提取方法,不僅可以適當地識別 語音聊天期間的談話內容,而且可以適當地從話語識別的結果中提取關鍵 字。
(關鍵字同步方法)
接下來,將參考圖33來詳細描述在根據本實施例的語音聊天系統中 的關鍵字同步方法。圖33是用于說明在根據第三實施例的語言聊天系統 中的關鍵字同步的流程圖。圖33示出了第一信息處理裝置1020A的用戶 對第二信息處理裝置1020B說話的情況。
當第一信息處理裝置1020A的用戶向與第一信息處理裝置1020A相連 接的諸如麥克風或頭戴式耳機之類的語音輸入單元1231發出聲音時,語 音輸入單元1231根據用戶所發出的聲音來生成語音數據(步驟S1201)。 所生成的語音數據被發送到參數提取單元1235和語音談話控制單元 1239。語音談話控制單元1239經由通信單元1249將所生成的語音數據發 送到第二信息處理裝置1020B,從而在第一和第二信息處理裝置1020A和 1020B之間進行語音談話(步驟S1203)。
參數提取單元1235將語音數據和所提取的各種參數發送到關鍵字提取單元1237,并且關鍵字提取單元1237對語音數據執行話語識別,以從 話語識別的結果中提取關鍵字。隨后,關鍵字提取單元1237經由通信單 元1249來與第二信息處理裝置1020B交換話語識別的結果(步驟 S1205),以提高話語識別的結果的精確度。之后,關鍵字提取單元1237 經由通信單元1249來訪問與通信網絡1012相連接的關鍵字提取數據庫 1030 (步驟S1207)。關鍵字提取數據庫1030向第一信息處理裝置1020A 發出參考許可,從而允許參考登記在其中的數據庫(步驟S1209)。第-一 信息處理裝置1020A的關鍵字提取單元1237通過參考關鍵字提取數據庫 1030來提取關鍵字(步驟S1211)。
當提取關鍵字時,關鍵字提取單元1237可以被配置成訪問搜索引擎 1040等,并基于偏好來提取搜索引擎1040的較高等級的搜索關鍵字或者 頻繁地被用作博客中的話題的術語。語音聊天的話題通常是在語音聊天時 流行的話題。因此,與這樣的話題相關的關鍵字極有可能是搜索引擎1040 的較高等級的搜索關鍵字或者頻繁地被用作博客中的話題的術語。因此, 通過基于偏好來提取這樣的關鍵字,可以更高效地執行關鍵字提取。
隨后,關鍵字提取單元1237將所提取的關鍵字發送到信息搜索單元 1243,并且信息搜索單元1243將發送而來的關鍵字以與發送時間相關聯 的方式來存儲在存儲單元1251中(步驟S1213)。隨后,信息搜索單元 1243判斷所發送而來的關鍵字是否為在當前的語音聊天期間之前提取的舊 關鍵字(步驟S1215)。如果所發送而來的關鍵字是之前沒有提取的新關 鍵字,則關鍵字提取單元1237新登記這些關鍵字(步驟S1219)。
如果所發送而來的關鍵字是舊關鍵字,則信息搜索單元1243搜索這 些舊關鍵字的發送時間,并判斷在發送時間之后是否已經過了預定時間段 (例如,5分鐘)(步驟S1217)。在以上判斷步驟中使用的預定時間段 并不限于此,而可以設置成任意時間段。如果在這些舊關鍵字的發送時間 之后還沒有過預定時間段,則信息搜索單元1243丟棄所發送而來的關鍵 字,并且關鍵字提取處理結束。如果在這些舊關鍵字的發送時間之后已經 過了預定時間段,則信息搜索單元1243更新新關鍵字的發送時間并重新 登記這些關鍵字(步驟S1219)。當關鍵字被新登記時,信息搜索單元1243將新登記的關鍵字發送到
關鍵字同步單元1245。在接收到這些關鍵字之后,關鍵字同步單元1245 經由通信單元1249將發送而來的關鍵字發送給第二信息處理裝置1020B
(步驟S1221)。利用這樣的發送處理來進行對第一信息處理裝置1020A 所提取的關鍵字與作為語音聊天的對應方的第二信息處理裝置1020B進行 同步的同步處理。這里,同步處理僅涉及關鍵字的交換。因此,無需在信 息處理裝置的存儲器上準備同步區域。
在登記了新關鍵字的第一信息處理裝置1020A中,信息搜索單元 1243經由通信單元1249來訪問與通信網絡1012相連接的搜索引擎1040
(步驟S1223),并獲取針對這些新關鍵字的搜索結果以及描述了與這些 關鍵字相關的文章的URL等的元數據(步驟S1225)。之后,信息搜索單 元1243將所獲得的信息存儲在搜索信息聚積單元1253中,并將所獲得的 信息發送到顯示單元1247。隨后,顯示單元1247通過瀏覽器等來在顯示 設備上顯示發送而來的信息(步驟S1227)。
在關鍵字被發往的第二信息處理裝置1020B中,與第一信息處理裝置 1020A相獨立地執行對關鍵字是否是舊的的判斷,并且如果是舊的則判斷 是否已經過了預定時間段。如果關鍵字不是舊的,或者雖然是舊的但已經 過了預定時間段,則第二信息處理裝置1020B新登記所發送而來的關鍵 字。
之后,第二信息處理裝置1020B訪問搜索引擎1040 (步驟S1229), 并獲取描述了發送而來的關鍵字的URL等的元數據(步驟S1231)。與第 一信息處理裝置1020A相同,第二信息處理裝置1020B將所獲得的信息存 儲在搜索信息聚積單元1253中,并將所獲得的信息發送到顯示單元 1247。隨后,顯示單元1247通過瀏覽器等來在顯示設備上顯示所發送來 的信息(步驟S1233)。
從將語音聊天期間的談話內容輸入到第一信息處理裝置1020A的步驟 開始到對關鍵字進行同步以顯示針對與關鍵字相關的信息的搜索結果的步 驟為止的處理被第一信息處理裝置1020A自動地執行。因此,第一信息處 理裝置1020A的用戶無需做任何針對話語識別、關鍵字檢測、和關鍵字同步處理的專門操作。因此,第一信息處理裝置1020A的用戶可以全神貫注
于語音聊天。同時,在第二信息處理裝置1020B中,關鍵字同步處理和信 息搜索結果顯示處理也被自動地執行。第二信息處理裝置1020B的用戶無 需做任何針對這些處理的專門操作,并且可以全神貫注于語音聊天。
如上所述,第一信息處理裝置1020A基于第一信息處理裝置1020A的 用戶所發出的聲音來執行關鍵字提取,隨后針對第二信息處理裝置1020B 來執行關鍵字同步。其結果是,己經執行關鍵字提取的第一信息處理裝置 1020A和已經進行關鍵字同步的第二信息處理裝置1020B使用搜索引擎 1040來執行搜索并以相互獨立的方式來顯示搜索結果。利用這樣的處理, 在第一和第二信息處理裝置1020A和1020B的顯示設備上,在具有與固有 通信延時相對應的很小的時間延遲的情況下基本同時顯示相同的關鍵字和 相同的與關鍵字相關的文章。由于與關鍵字相關的信息也被顯示,所以可 以自動地提供可以用作語音聊天的話題的信息,并因而擴展了語音聊天的 談話。
已經描述了第一信息處理裝置1020A的用戶向第二信息處理裝置 1020B發出聲音的情況。但是,針對第二信息處理裝置1020B的用戶向第 一信息處理裝置1020A發出聲音的情況可以類似地執行上述處理。在這種 情況下,第二信息處理裝置1020B執行語音數據的生成和關鍵字的提取, 獲得新登記的關鍵字,并執行針對第一信息處理裝置1020A的關鍵字同步 處理。其結果是,由第一和第二信息處理裝置1020A和1020B以類似于上 述方式的獨立且并行的方式來執行關鍵字相關信息的搜索和搜索結果的顯 示。這樣,語音聊天期間的談話的輸入(語音數據的生成)和關鍵字的提
取被各個信息處理裝置以獨立且并行的方式來處理。
當第一和第二信息處理裝置1020A和1020B之間的語音聊天結束時,
登記在信息處理裝置1020A和1020B中的關鍵字和與關鍵字相關的臨時信 息被刪除,并且新的關鍵字被登記以待稍后使用。
在以上描述中,關鍵字提取數據庫1030被獨立地與連接到第一信息 處理裝置1020A的通信網絡1012相連接。關鍵字提取數據庫1030可以設 置在第一信息處理裝置1020A中。在這種情況下,關鍵字提取數據庫1030例如被存儲在第一信息處理裝置1020A的數據庫存儲單元中。當關鍵 字提取數據庫1030被設置在第一信息處理裝置1020A中時,可以消除關 鍵字提取期間的通信時間延遲。因此,可以以縮短的時間段來執行關鍵字 提取。數據庫存儲單元可以獨立地設置在第一信息處理裝置1020A中,或 者可以設置在第一信息處理裝置1020A的存儲單元1251中。
在以上描述中,搜索引擎1040被獨立地與連接到第一信息處理裝置 1020A的通信網絡1012相連接。但是,第一信息處理裝置1020A可以包 括搜索引擎1040。當搜索引擎1040設置在第一信息處理裝置1020A中 時,可以消除信息搜索期間的通信時間延遲。因此,可以以縮短的時間段 來執行信息搜索。
(搜索結果顯示屏幕)
接下來,將參考圖34來詳細描述根據本實施例的信息搜索結果顯示 屏幕的示例。圖34是示出由根據第三實施例的信息處理裝置顯示的搜索 信息顯示的示例的示意圖。
搜索結果顯示屏幕1050以更新方式顯示了在顯示屏幕上的、語音聊 天期間檢測到的關鍵字。在該顯示屏幕上,較新的關鍵字被置于上面部 分,而較舊的關鍵字被置于下面部分。可以適當地設置可以在一個屏幕上 顯示的關鍵字的最大數目。當關鍵字的數目超過該最大值時,首先刪除屏 幕上最下方的關鍵字。
在圖34的示例中,關鍵字被顯示在欄1503中,其中,具有在欄1501 中的按它們的登記時間來指派的索引號。較新的關鍵字,即,在欄1503 中的、欄1501中的索引號較大的關鍵字被顯示在上面部分。除了索引號 欄1501和關鍵字欄1503之外,顯示屏幕還包括鎖定(pin lock)復選框欄 1505和刪除復選框欄1507。對各個關鍵字提供鎖定復選框和刪除復選 框。鎖定復選框用于鎖定關鍵字,以使得被鎖定的關鍵字保留在屏幕上。 刪除復選框用于選擇在更新所顯示的內容時將被刪除的關鍵字。
欄1503中的關鍵字與它們的搜索結果顯示屏幕相鏈接,搜索結果顯 示屏幕示出了欄1503中的關鍵字被使用搜索引擎1040來搜索時的搜索結 果。當例如使用鼠標來點擊欄1503中的關鍵字時,用戶可以看到針對該
85關鍵字的由搜索引擎1040搜索得到的搜索結果。
如果欄1505中的鎖定復選框被打鉤,則鎖定復選框選中的關鍵字被
移動到最上面的部分并且被鎖定。因此,即使當在屏幕上顯示新的關鍵字 時,鎖定的關鍵字也不會被往下移動。如果存在多個鎖定關鍵字,則可以 按它們的登記時間來顯示它們。
在所登記的從語音聊天期間的談話對話中提取出來的關鍵字中,可能 存在對信息處理裝置的用戶在語音聊天時沒有用的關鍵字。在這樣的情況
下,通過對相應的關鍵字旁邊的欄1507中的刪除復選框打鉤,可以在更 新所顯示的內容時刪除該關鍵字。
關于欄1503中的一個關鍵字,不僅顯示該關鍵字的表示,而且還例 如在欄1503中的相應關鍵字下方的欄1509中的縮略圖中顯示記載在搜索 引擎1040中的與欄1503中的關鍵字相關的文章。當用戶例如使用鼠標指 針來點擊欄1509中的與關鍵字相關的文章時,欄1509中的文章被鏈接到 記載在搜索引擎1040中的文章的全文。也對欄1509中的各篇文章提供欄 1505中的鎖定復選框和欄1507中的刪除復選框。可以顯示在欄1509中的 與欄1503中的關鍵字相關的文章的數目并不限于圖中所示的情況,而可 以被任意地設置。顯示在搜索結果顯示屏幕1050的欄1509中的文章可以 是在搜索引擎1040中頻繁參考的文章。
在圖34所示的搜索結果顯示屏幕1050的示例中,在語音聊天期間, 關鍵字"力、〉厶(人名,發音為Cassim)"、"代表(代表,發音為 daihyou )"、" <工乂 > (國名,Yemen )"、"千葉(地名, Chiba)"、"牧(發音為boku)"被順序地提取。由于關鍵字"力-〉厶 (人名,發音為Cassim)"的鎖定復選框被打鉤,因此雖然它是所登記的 關鍵字中的最舊的關鍵字,但是它被顯示在顯示屏幕1050的最上面部分。 關鍵字"代表(代表,發音為daihyou)"和與關鍵字"牧(發音為 boku)"相關的信息"新潟市牧支所*一^《一7'(新滹市社會福利協會 的主頁)"的刪除復選框被打鉤。因此,該關鍵字和關鍵字相關信息在所 顯示的內容被更新時被刪除。
關于在顯示屏幕1050的欄1503中顯示的關鍵字,相同的關鍵字基本同時被安裝在語音聊天的各個講話者的信息處理裝置1020中的關鍵字同
步單元1245顯示在各個信息處理裝置1020的屏幕上。但是,由于鎖定復 選框和刪除復選框的打鉤是由各個講話者獨立操作的,所以隨著語音聊天 的進展,不同的內容可以被顯示在信息處理裝置1020的各個顯示屏幕 1050上。
(搜索信息的參考歷史數據)
接下來,將參考圖35來描述根據本實施例的、在關鍵字提取期間使 用搜索信息的參考歷史的方法。圖35是示出根據第三實施例的搜索信息 的參考歷史數據的示意圖。
在根據本實施例的信息處理裝置1020中,信息處理裝置1020的用戶 在搜索結果顯示屏幕1050上選擇的欄1503中的關鍵字被以與信息相關聯 的方式、作為參考歷史數據來存儲在參考歷史存儲單元1255中,例如如 圖35所示。
如圖35所示,參考歷史數據包括欄1601中的用戶所選擇的關鍵字、 欄1603中的表示欄1601中的關鍵字的選擇次數的權重信息、欄1605中的 會話(session) ID、以及欄1607中的表示被賦予了會話ID的各個語音聊 天的對應方的談話對應方信息,其中,欄1605中的會話ID是用于標識欄 1601中的關鍵字被選擇的語音聊天的標識符。
欄1603中的權重信息是表示在本實施例的語音聊天系統1010中選擇 欄1601中的關鍵字的次數的信息。在圖35所示的參考歷史信息中,關鍵 字"- x八。 > 力'7 y (japan Cup)"總共被選擇兩次;而關鍵字"寸'> 7" 口 " (Zanblock)"和"牧(Maki)"分別被選擇一次。
在根據本實施例的語音聊天系統中,無論何時執行語音聊天,都對各 個語音聊天會話賦予欄1605中的包括語音聊天的日期和在該日期中的語 音聊天的會話次數在內的會話ID。在圖35所示的參考歷史數據中,關鍵 字"、y、 X /、° >力7 7° (japan Cup)"被選擇兩次 一次在會話ID "200609150001"的語音聊天中; 一次在會話ID "200609150002"的語音 聊天中。
欄1607中的談話對應方信息是表示欄1601中的關鍵字被選擇的語音聊天的對應方的數據。在圖35所示的參考歷史數據中,關鍵字〃 >力'乂 7。 (Japan Cup)"被兩個參與者選擇了兩次 一次在會話ID "200609150001 "的語音聊天中被參與者"A"選擇; 一次在會話ID "200609150002"的語音聊天中被參與者"B"選擇。
在根據本實施例的信息處理裝置1020中,可以在從語音數據中提取 關鍵字時使用這樣的參考歷史數據。通過使用參考歷史數據,可以獲取諸 如談話對應方談話題的定向性或者字之間的相關性之類的信息。利用這樣 的信息,可以更高效地執行話語識別或者關鍵字提取。以下,將簡要描述 使用參考歷史信息的方式。
根據本實施例的關鍵字提取單元1237可以參考存儲了上述參考歷史 數據的參考歷史存儲單元1255,以在執行話語識別時使用在參考歷史數據 中包含的各種信息來作為在話語識別中使用的參考信息中的一個。例如, 當執行話語識別時,關鍵字提取單元1237可以通過參考參考歷史存儲單 元1255來提高參考歷史數據的權重信息欄1603中的數目較大的關鍵字的 話語識別優先級。因此,可以高效地執行話語識別。
當關鍵字提取單元1237所識別的關鍵字被登記在參考歷史數據中 時,可以提高在會話ID與所登記的關鍵字相同的聊天會話中選擇的另一 個關鍵字的話語識別優先級。這是因為可以預測到具有相同會話ID的關 鍵字彼此強相關。
當關鍵字提取單元1237所識別的關鍵字被登記在參考歷史數據中 時,可以提高由與所登記的關鍵字相同的談話對應方選擇的另一個關鍵字 的話語識別優先級。這是因為可以預測到在語音聊天期間由同一談話對應 方選擇的關鍵字在談話對應方談話題的定向性方面相互一致。
如上所述,根據本實施例的信息處理裝置1020,通過有效地反饋參考 歷史數據,變得可以更高效地執行話語識別和關鍵字提取。 (信息處理裝置的修改示例)
接下來,將參考圖36A到36D來簡要描述根據本實施例的信息處理裝 置1020的修改示例。圖36A是用于說明根據第三實施例的信息處理裝置 的話語識別方法的簡要框圖。圖36B到36D是用于說明根據第三實施例的信息處理裝置的話語識別方法的修改示例的簡要框圖。
在圖36A到36D所示的信息處理裝置1020A和1020B中,僅示出了 各個信息處理裝置的一些處理單元。不言而言,除了所示出的處理單元之 外,圖31所示的處理單元也包括在這些信息處理裝置中。
在根據本實施例的信息處理裝置1020中,如圖36A所示,已經描述 了這樣的情況,其中,執行語音聊天的第一和第二信息處理裝置1020A和 1020B接收由相應用戶發出的聲音,從而致使話語識別單元1233執行話語 識別并致使關鍵字同步單元1245執行關鍵字同步處理。但是,本實施例 的信息處理裝置可以按以下方式來修改。 (第一修改示例)
圖36B的第一修改示例示出了執行這樣的情況,其中,語音聊天的信 息處理裝置1020A和1020B將相應用戶所發出的聲音如其原樣地發送給它 們的對應方信息處理裝置,并對所接收的由對應方信息處理裝置的用戶發 出的聲音執行話語識別。
具體而言,第一信息處理裝置1020A的用戶所發出的聲音經由語音談 話控制單元1239和通信單元1249而被如其原樣地發送到第二信息處理裝 置1020B,并被第二信息處理裝置1020B話語識別。類似地,第二信息處 理裝置1020B的用戶所發出的聲音經由語音談話控制單元1239和通信單 元1249而被如其原樣地發送到第一信息處理裝置1020A,并被第一信息 處理裝置1020A話語識別。在本修改示例中,在第一和第二信息處理裝置 1020A和1020B中都執行話語識別、關鍵字提取、和關鍵字相關信息搜 索。
(第二修改示例)
圖36C的第二修改示例示出了這樣的情況,其中,僅在一個信息處理 裝置中執行話語識別,并在另一個信息處理裝置中執行關鍵字同步和信息 搜索。具體而言,在第一信息處理裝置1020A中執行話語識別,并在第二 信息處理裝置1020B中執行關鍵字同步處理。第一信息處理裝置1020A的 用戶所發出的聲音被話語識別單元1233話語識別并被關鍵字提取,然后 被發送到第二信息處理裝置1020B。然后,第二信息處理裝置1020B執行關鍵字同步處理和關鍵字相關信息的搜索。第二信息處理裝置1020B的用
戶所發出的聲音被如其原樣地發送到第一信息處理裝置1020A,隨后被話 語識別單元1257話語識別并被關鍵字提取。
在圖36C的示例中,話語識別在第一信息處理裝置1020A中被獨立地 執行。但是,話語識別可以在第二信息處理裝置1020B中被獨立地執行。 在圖36C的示例中,在第一信息處理裝置1020A中提供了兩個獨立話語識 別單元。但是,上述話語識別可以僅通過一個話語識別單元來執行。當一 個信息處理裝置的處理能力遠高于另一個信息處理裝置時,本修改示例會 很有用,反之亦然。 (第三修改示例)
圖36D的第三修改示例示出了這樣的情況,其中,幾乎不在信息處理 裝置中而是在中繼信息處理裝置之間的連接的服務器1016中執行話語識 別,并且信息處理裝置僅執行關鍵字同步和信息搜索。具體而言,第一信 息處理裝置1020A的用戶所發出的聲音被如其原樣地發送到服務器 1016,并被服務器1016的話語識別單元1161話語識別,從而被發送到第 二信息處理裝置1020B。同時,第二信息處理裝置1020B的用戶所發出的 聲音被如其原樣地發送到服務器1016,并被服務器1016的話語識別單元 1163話語識別,從而被發送到第一信息處理裝置1020A。在圖36D的示例 中,在服務器1016中提供了兩個獨立的話語識別單元。但是,上述話語 識別可以僅由 一個話語識別單元來執行。 (第四實施例)
以下,將詳細描述根據本發明第四實施例的關鍵字提取系統。 圖37是示出根據本發明第四實施例的關鍵字提取系統的配置的示意 圖。如圖37所示,根據本實施例的關鍵字提取系統1011包括通信網絡 1012、關鍵字提取數據庫1030、搜索引擎1040、以及信息處理裝置 1020A和1020B (在下文中,有時候統稱為信息處理裝置1020)。信息處 理裝置1020A與家庭網絡1018內的外部顯示設備1070相連接。信息處理 裝置1020A和1020B以及外部顯示設備1070可以接收從廣播站1080發送 而來的廣播信息。通信網絡1012、關鍵字提取數據庫1030和搜索引擎1040具有與根據 第三實施例的通信網絡1012、關鍵字提取數據庫1030和搜索引擎1040相 同的配置并提供基本相同的效果,并且將省略對它們的詳細描述。
信息處理裝置1020以語音方式與經由通信網絡1012而連接到其的另 一個信息處理裝置1020執行聊天(語音聊天)。信息處理裝置1020可以 經由通信網絡1012來請求經由通信網絡1012而與其相連接的搜索引擎 1040執行數據庫的參考或者信息的搜索。
執行語音聊天的另一個信息處理裝置1020可以經由通信網絡1012來 連接到信息處理裝置1020,如圖所示。可替代地,另一個信息處理裝置 1020可以直接而非經由通信網絡1012來連接到USB端口、諸如i丄ink之 類的IEEE 1394端口、 SCSI端口、 RS-232C端口等。
信息處理裝置1020與家庭網絡1018內的稍后將描述的外部顯示設備 1070相連接,因此,可以在信息處理裝置1020和外部顯示設備1070之間 進行各種數據的通信。信息處理裝置1020和外部顯示設備1070之間的連 接可以經由諸如HDMI-CEC (高清晰多媒體接口-消費電子控件)之類的 連接端口來執行。信息處理裝置1020可以使用設置在其中的接收功能來 接收包含從稍后將描述的廣播站1080發送而來的廣播信息的廣播電波。
在圖示的示例中,信息處理裝置1020是臺式PC,但是,在本實施例 中,信息處理裝置1020可以是筆記本式PC。
在本實施例中,信息處理裝置1020并不限于上述示例,而可以例如 由電視機機頂盒、諸如家用游戲機之類的信息設備、移動電話、PDA等來 構成,只要是能夠具有經由網絡來通信的功能的設備即可。另外或者可替 代地,信息處理裝置1020可以是由擁有者攜帶的便攜式設備,例如,便 攜式游戲機、PHS、或者便攜式視頻/音頻播放機。
外部顯示設備1070是顯示單元,例如,CRT顯示單元、液晶顯示單 元、等離子顯示面板單元、或者電致發光(EL)顯示單元。外部顯示設備 1070接收包含從稍后將描述的廣播站1080發送而來的廣播信息的廣播電 波,并在顯示單元的顯示區域上顯示廣播信息的內容。這里,從廣播站發 送而來的廣播信息指的是通過諸如單波段數字廣播或者12波段數字廣播(下文中稱為全波段數字廣播)之類的地面數字廣播、有線廣播、或者經 由網絡的因特網廣播來提供的諸如廣播文本信息、廣播音頻信息、或者視 頻信息之類的數據。包含廣播信息的廣播電波指的是諸如單波段數字廣播 或者全波段數字廣播之類的地面數字廣播的電波。外部顯示設備1070可
以經由諸如HDMI-CEC之類的連接端口將所接收的廣播信息發送到信息 處理裝置1020。外部顯示設備1070可以接收從信息處理裝置1020發送而 來的各種數據,并顯示與該數據相對應的信息。
以下,將通過地面數字廣播的示例來描述第四實施例。 廣播站1080發送包含廣播信息的廣播電波,其中,該廣播信息包含 以下數據廣播文本信息、廣播音頻信息和視頻信息。外部顯示設備1070 接收從廣播站1080發送而來的廣播電波,并顯示字幕信息或者輸出基于 在廣播電波中包含的廣播文本信息的聲音。信息處理裝置1020可以接收 從廣播站1080發送而來的廣播電波,以在各種處理中使用廣播電波的內 容。
(信息處理裝置1020的配置)
接下來,將詳細描述根據本實施例的信息處理裝置1020的配置。根 據本實施例的信息處理裝置1020的硬件配置與根據第三實施例的硬件配 置基本相同,并且將省略對它的詳細描述。
圖38是用于說明根據第四實施例的信息處理裝置1020的配置的框 圖。如圖38所示,根據本實施例的信息處理裝置1020包括關鍵字同步單 元1245、顯示單元1247、通信單元1249、存儲單元1251、廣播文本信息 接收單元1261、關鍵字提取單元1263、信息搜索單元1265、以及外部顯 示設備連接控制單元1267。
關鍵字同步單元1245經由通信單元1249將關鍵字提取單元1237從語 音數據中提取的關鍵字發送到其它信息處理裝置1020,從而同步第一和第 二信息處理裝置1020A和1020B。關鍵字同步處理不僅可以在從信息處理 裝置1020到另一個信息處理裝置1020的方向上執行,而且可以按以下方 式在從另一個信息處理裝置1020到信息處理裝置1020的方向上執行。 即,信息處理裝置1020可以響應于由另一個信息處理裝置1020啟動的關鍵字同步處理,從而使得從另一個信息處理裝置1020發送的關鍵字被信
息處理裝置1020接收。
顯示單元1247例如經由瀏覽器應用將從信息搜索單元1265發送而來 的信息搜索結果顯示給為信息處理裝置1020設置的諸如顯示器等的輸出 設備。信息搜索單元1265從搜索引擎1040獲得的信息包含信息或文章在 搜索引擎1040中的URL等。因此,當信息處理裝置1020的用戶通過與信 息處理裝置1020相連接的諸如鼠標或鍵盤之類的輸入設備來選擇被顯示 的信息時,顯示單元1247請求信息搜索單元1265獲取被選擇的信息的細
通信單元1249例如是安裝在信息處理裝置1020中的通信設備。通信 單元1249對在信息處理裝置1020 (具體而言,是信息處理裝置1020的信 息搜索單元1265、關鍵字提取單元1263、和關鍵字同步單元1245)與信 息處理裝置1020的外部設備(具體而言,是關鍵字提取數據庫1030、搜 索引擎1040)或者另一個信息處理裝置1020之間的經由通信網絡1012的 信息通信進行中繼。
此外,通信單元1249可以與直接而非經由通信網絡1012來連接到信 息處理裝置1020的另一個信息處理裝置進行信息通信。
存儲單元1251例如是安裝在信息處理裝置1020中的存儲設備,并且 在其中存儲諸如關鍵字提取單元1263所提取的關鍵字或信息搜索單元 1265所獲得的搜索信息之類的數據。除了這些數據之外,存儲單元1251 還可以在其中存儲各種數據庫。此外,存儲單元1251還可以適當地在其 中存儲在信息處理裝置1020執行處理時需要存儲的各種參數以及該處理 的進程信息。在廣播文本信息接收單元1261、關鍵字同步單元1245等自 由地執行對存儲單元1251的讀寫時,存儲單元1251可被訪問。存儲單元 1251還包括搜索信息聚積單元1253和參考歷史存儲單元1255。
搜索信息聚積單元1253以關聯方式來聚積信息獲取數據和信息搜索 單元1265所獲得的搜索信息。當需要顯示已經獲得的搜索信息時,可以 參考存儲在搜索信息聚積單元1253中的信息以顯示該已經獲得的搜索信 息。參考歷史存儲單元1255將在顯示單元1247上顯示的關鍵字或文章中 的、信息處理裝置1020的用戶為了更詳細的信息而參考的關鍵字存儲作 為參考歷史。參考歷史是這樣的數據,該數據包括所參考的關鍵字、所參 考關鍵字的權重信息、已經參考關鍵字的語音聊天自身的標識符、以及語 音聊天的對應方。當關鍵字提取單元1263提取關鍵字時可以使用存儲在 參考歷史存儲單元1255中的參考歷史。信息搜索單元1265、關鍵字同步單元1245、和顯示單元1247可以用 專用于各種功能的專用硬件來構成,并且可以被設置為諸如話語識別程序 之類的應用程序。廣播文本信息接收單元1261從外部顯示設備1070獲取關于外部顯示 設備1070當前正通過其來接收的廣播頻道的接收頻道信息。這里,接收 頻道信息指的是表示下述廣播頻道的信息,其中,外部顯示設備1070當 前正通過該廣播頻道來進行接收。廣播文本信息接收單元1261可以通過 從外部顯示設備1070獲取接收頻道信息來同步廣播文本信息接收單元 1261的接收廣播頻道與外部顯示設備1070的接收廣播頻道。廣播文本信息接收單元1261基于所獲得的接收頻道信息直接從廣播 站1080接收與外部顯示設備1070的接收廣播頻道相對應的廣播電波。此 時,廣播文本信息接收單元1261可以被配置成直接接收從廣播站1080發 送而來的廣播電波中的單波段廣播電波,并從所接收的電波中獲取文本信 息。廣播文本信息接收單元1261可以被配置成直接接收從廣播站1080發 送而來的全波段廣播電波。廣播文本信息接收單元1261可以被配置成基于所獲得的接收頻道信 息來接收外部顯示設備1070所接收的并被從外部顯示設備1070發送到信 息處理裝置1020的廣播文本信息。廣播文本信息接收單元1261將所接收的廣播文本信息輸出到稍后將 描述的關鍵字提取單元1263。廣播文本信息接收單元1261可以將所接收 的廣播文本信息記錄在存儲單元1251中。關鍵字提取單元1263基于關鍵字提取數據庫1030從在廣播文本信息 接收單元1261所接收的廣播文本信息中包含的字符串中提取關鍵字。當關鍵字提取單元1263提取關鍵字時,關鍵字提取單元1263可以經 由通信單元1249來參考與通信網絡1012相連接的關鍵字提取數據庫 1030。
在表示廣播文本信息的字符串中包含多個關鍵字。關鍵字提取單元 1263自動地提取存在于該字符串中的所有關鍵字。關鍵字提取單元1263 將所提取的關鍵字發送給信息搜索單元1265和外部顯示設備連接控制單 元1267 (稍后將描述)。關鍵字提取單元1263可以將所提取的關鍵字存 儲在存儲單元1251中。
信息搜索單元1265以關聯方式將從關鍵字提取單元1263發送而來的 關鍵字和這些關鍵字被從關鍵字提取單元1263發送的時間存儲在存儲單 元1251中。信息搜索單元1265判斷是否要對從關鍵字提取單元1263發送 而來的關鍵字執行關鍵字同步處理。當判定關鍵字同歩處理應當被執行 時,信息搜索單元1265將這些關鍵字發送到關鍵字同步單元1245,從而 請求執行關鍵字同步處理。信息搜索單元1265經由通信單元1249來訪問 搜索引擎1040,并執行對從關鍵字提取單元1263發送而來的關鍵字的信 息搜索,從而獲取針對這些關鍵字的搜索結果和與這些關鍵字相關的文 章。信息搜索單元1265將所獲得的搜索結果存儲在存儲單元1251的搜索 搜索結果存儲單元1253中,并將搜索結果發送到顯示單元1247和外部顯 示設備連接控制單元1267 (稍后將描述)。這里,信息搜索單元1265從 搜索引擎1040獲得的搜索結果包括關于搜索關鍵字的信息在搜索引擎 1040中的標題或URL以及信息的元數據,例如信息的類型。
當顯示單元1247或外部顯示設備連接控制單元1267請求獲取關于特 定關鍵字或與該關鍵字相關的文章的更詳細的信息時,信息搜索單元1265 經由通信單元1249來訪問搜索引擎1040以獲取更詳細的信息,并將從顯 示單元1247或外部顯示設備連接控制單元1267通知的特定關鍵字存儲在 存儲單元1251的參考歷史存儲單元1255中。
外部顯示設備連接控制單元1267執行信息處理裝置1020和與信息處 理裝置1020相連接的外部顯示設備1070之間的連接控制。外部顯示設備 連接控制單元1267將關鍵字提取單元1263所提取的關鍵字和信息搜索單元1265所獲得的針對關鍵字的搜索結果發送到外部顯示設備1070。當外 部顯示設備1070請求獲取關于特定關鍵字和與該關鍵字相關的文章的更 詳細的信息時,外部顯示設備連接控制單元1267可以將該請求發送到信 息搜索單元1265。當信息搜索單元1265響應于該請求而從搜索引擎1040 等獲得更詳細的信息時,外部顯示設備連接控制單元1267將信息搜索單 元1265所獲得的更詳細信息輸出到外部顯示設備1070。順便提及,當將 與各種信息相對應的數據發送到外部顯示設備1070時,外部顯示設備連 接控制單元1267可以將有待發送的數據的格式轉換成可以被外部顯示設 備1070顯示的格式。外部顯示設備連接控制單元1267可以基于記錄在參考歷史存儲單元 1255中的內容向搜索引擎1040發送關于被選擇的關鍵字的信息。搜索引 擎1040可以在在搜索引擎1040內執行的各種處理中使用從外部顯示設備 連接控制單元1267發送而來的信息。在上文中,已經描述了根據本實施例的信息處理裝置1020的功能的 示例。上述組件可以使用通用元件或電路來構成,或者可以用專用于各個 組件的功能的專用硬件來構成。這些組件的全部功能可以利用CPU等來 執行。因此,可以根據實施本實施例時的技術水平來適當地修改硬件配 置。根據本實施例的信息處理裝置1020還可以包括根據第三實施例的信 息處理裝置1020的話語識別單元或語音談話控制單元。信息處理裝置 1020還可以包括存儲關鍵字提取數據庫1030的內容的數據庫存儲單元。 在這種情況下,關鍵字提取數據庫1030的內容可以被存儲在設置在信息 處理裝置1020中的數據庫存儲單元中。因此,可以縮短信息處理裝置 1020訪問關鍵字提取數據庫1030所需的時間。其結果是,可以縮短信息 處理裝置1020執行關鍵字提取所需的時間。另外,通過周期性地更新數 據庫存儲單元的內容,信息處理裝置1020可以獲取記錄在關鍵字提取數據庫1030中的更新后的數據庫的內容。 (外部顯示設備1070的配置) 接下來,將參考圖39和40來詳細描述根據本實施例的外部顯示設備1070的配置。圖39是用于說明根據第四實施例的外部顯示設備的配置的
框圖。圖40是示出根據第四實施例的外部顯示設備的信息顯示屏幕的示意圖。
根據本實施例的外部顯示設備1070的硬件包括諸如CRT、液晶顯示 面板、等離子顯示面板或者EL面板之類的顯示元件以及由CPU、 ROM和 RAM構成的并且在控制顯示元件的驅動時使用的驅動控制電路。
如圖39所示,本實施例的外部顯示設備1070包括廣播接收單元 1701、連接端口控制單元1703、廣播信息顯示控制單元1705、關鍵字信 息顯示控制單元1707和顯示單元1709。
廣播接收單元1701接收從廣播站1080發送而來的廣播電波并將廣播 電波中包含的諸如廣播文本信息、廣播音頻信息或視頻信息之類的數據輸 出到連接端口控制單元1703和廣播信息顯示控制單元1705 (稍后將描 述)。廣播接收單元1701可以被配置成將所接收的信息記錄在設置在外 部顯示設備1070中的存儲單元(未示出)中,或者存儲在與外部顯示設 備1070相連接的外部附接存儲單元(未示出)中。
連接端口控制單元1703控制能夠與信息處理裝置1020進行數字通信 的諸如HDMI-CEC之類的連接端口。連接端口控制單元1703經由諸如 HMDMI-CEC之類的連接端口將關于廣播接收單元1701正通過其接收的 廣播頻道的接收頻道信息發送到信息處理裝置1020。諸如廣播文本信息、 廣播音頻信息和視頻信息之類的由廣播接收單元1701接收的數據可以經 由連接端口控制單元1703而被輸出到信息處理裝置1020。從信息處理裝 置1020發送而來的各種數據經由連接端口控制單元1703而被輸入到外部 顯示設備1070。從信息處理裝置1020發送而來的各種數據被發送到稍后 將描述的關鍵字信息顯示控制單元1707。
當在稍后將描述的顯示單元1709上顯示從廣播接收單元1701發送而 來的廣播文本信息、廣播音頻信息和視頻信息時,廣播信息顯示控制單元 1705執行顯示控制。
當在稍后將描述的顯示單元1709上顯示從信息處理裝置1020發送而 來的關鍵字信息時,關鍵字信息顯示控制單元1707執行顯示控制。這里,從信息處理裝置1020發送而來的關鍵字信息指的是這樣的信息,該 信息包括信息處理裝置1020所提取的關鍵字、針對所提取的關鍵字的搜索結果、以及與這些關鍵字相關的文章。在從顯示單元1709接收到對關 于外部顯示設備1070的用戶通過諸如鼠標、鍵盤或遙控器之類的輸入設 備而在顯示單元1709上顯示的信息中所選擇的信息的更詳細信息的獲取 請求之后,關鍵字信息顯示控制單元1707經由連接端口控制單元1703將 該更詳細信息的獲取請求發送到信息處理裝置1020。顯示單元1709在外部顯示設備1070的信息顯示屏幕上顯示由廣播信 息顯示控制單元1705進行顯示控制的廣播文本信息、廣播音頻信息和視 信息以及由關鍵字信息顯示控制單元1707進行顯示控制的關鍵字信息。外部顯示設備1070的信息顯示屏幕1751通常包括圖像顯示區域 1753,廣播文本信息、廣播音頻信息和視頻信息被顯示在圖像顯示區域 1753上。這里,當從信息處理裝置1020發送而來關鍵字信息時,信息顯 示屏幕1751的顯示區域被分割以生成關鍵字信息顯示區域1755,關鍵字 信息被顯示在該關鍵字信息顯示區域1755上。圖像顯示區域1753例如由 廣播信息顯示控制單元1705來控制,并且關鍵字信息顯示區域1755例如 由關鍵字信息顯示控制單元1707來控制。關鍵字信息顯示區域1755的細節基本上與根據本發明第三實施例的 信息處理裝置的搜索結果顯示屏幕1050相同,并且將省略對它的詳細描 述。在上文中,已經描述了根據本發明的外部顯示設備1070的功能的示 例。上述組件可以使用通用元件或電路來構成,或者可以利用專用于各個 組件的功能的專用硬件來構成。這些組件的全部功能可以利用CPU等來 執行。因此,可以根據實施本實施例時的技術水平來適當地修改硬件配 置。(關鍵字提取方法) 接下來,將參考圖41來詳細描述由根據本實施例的信息處理裝置 1020執行的關鍵字提取方法的示例。圖41是用于說明根據第四實施例的 關鍵字提取方法的流程圖。首先,信息處理裝置1020的廣播文本信息接收單元1261基于從外部
顯示設備1070獲得的接收頻道信息而從外部顯示設備1070或者廣播站 1080接收廣播文本信息,從而獲取廣播字幕的字符串作為文本信息數據 (步驟S1301)。廣播文本信息接收單元1261將所獲得的文本信息數據輸 出到關鍵字提取單元1263。
接下來,關鍵字提取單元1263對發送而來的文本信息數據應用形態 分析以從字符串中提取字,并將所提取的字記錄在信息處理裝置1020的 存儲器上(步驟S1303)。
接下來,關鍵字提取單元1263使用與通信網絡1012相連接的關鍵字 提取數據庫1030的信息或者關鍵字提取數據庫1030的內容來搜索所提取 的字(步驟S1305)。
隨后,關鍵字提取單元1263判斷所提取的字是否存在于關鍵字提取 數據庫1030中(步驟S1307)。當所提取的字存在于關鍵字提取數據庫 1030中時,關鍵字提取單元1263將存在的所提取字記錄在存儲器上作為 廣播關鍵字數據(步驟S1309)。當所提取字并不存在于關鍵字提取數據 庫1030中時,關鍵字提取單元1263執行稍后將描述的步驟S1311的處 理。
接下來,關鍵字提取單元1263判斷沒有在關鍵字提取數據庫1030中 找到的所提取字是否存在于存儲器上(步驟S1311)。當未找到的字存在 于存儲器上時,執行步驟S1305的處理。當未找到的字不存在于存儲器中 時,關鍵字提取單元1263將存在于存儲器上的廣播關鍵字數據輸出作為 所提取關鍵字(步驟S1313)。
通過使用上述方法,根據本實施例的信息處理裝置1020可以從所接 收的廣播文本信息中提取關鍵字。
由根據本實施例的信息處理裝置1020執行的關鍵字同步方法與由根 據本發明第三實施例的信息處理裝置1020執行的關鍵字同步方法基本相 同,并且將省略對它的詳細描述。
在根據本實施例的信息處理裝置1020中,存在于關鍵字提取數據庫 1030中的字(關鍵字)被自動地從發送自廣播站1080的廣播文本信息中提取。因此,可以向外部顯示設備1070顯示所提取的關鍵字。通過使用這樣的功能,使用信息處理裝置1020或外部顯示設備1070來執行諸如聊天之類的雙向通信的用戶可以使用所提取的關鍵字作為聊天的話題等。 (根據第四實施例的信息處理裝置的第一修改示例)接下來,將參考圖42和43來詳細描述根據本實施例的信息處理裝置 1020的第一修改示例。圖42是用于說明根據本修改示例的信息處理裝置 1020的配置的框圖。圖43是用于說明根據本修改示例的關鍵字提取方法 的流程圖。根據本修改示例的信息處理裝置1020的硬件配置與本發明第 四實施例的硬件配置基本相同,并且將省略對它的詳細描述。如圖42所示,根據本修改示例的信息處理裝置1020包括關鍵字同步 單元1245、顯示單元1247、通信單元1249、存儲單元1251、廣播音頻信 息接收單元1269、信息搜索單元1265、外部顯示設備連接控制單元 1267、參數提取單元1271、和關鍵字提取單元1273。根據本修改示例的關鍵字同步單元1245、顯示單元1247、通信單元 1249、存儲單元1251、信息搜索單元1265和外部顯示設備連接控制單元 1267具有與根據第四實施例的關鍵字同步單元1245、顯示單元1247、通 信單元1249、存儲單元1251、信息搜索單元1265和外部顯示設備連接控 制單元1267基本相同的配置,并提供基本相同的效果,并且將省略對它 們的詳細描述。廣播音頻信息接收單元1269從外部顯示設備1070獲取關于外部顯示 設備1070當前正通過其接收的廣播頻道的接收頻道信息。廣播音頻信息 接收單元1269通過從外部顯示設備1070獲取接收頻道信息可以同步廣播 音頻信息接收單元1269的接收廣播頻道和外部顯示設備1070的接收廣播 頻道。廣播音頻信息接收單元1269基于所獲得的接收頻道信息直接從廣播 站1080接收與外部顯示設備1070的接收廣播頻道相對應的廣播電波。此 時,廣播音頻信息接收單元1269可以直接接收從廣播站1080發送的廣播 電波中的單波段廣播電波,并從所接收的電波中獲取音頻信息。廣播音頻 信息接收單元1269可以被配置成直接接收從廣播站1080發送的全波段廣廣播音頻信息接收單元1269可以被配置成基于所獲得的接收頻道信
息來接收外部顯示設備1070所接收的并且被從外部顯示設備1070發送到 信息處理裝置1020的廣播音頻信息。
廣播音頻信息接收單元1269將所接收的廣播音頻信息輸出到參數提 取單元1271。廣播音頻信息接收單元1269可以將所接收的廣播音頻信息 記錄在存儲單元1251中。
參數提取單元1271和關鍵字提取單元1273是根據本修改示例的信息 處理裝置1020的話語識別單元1233的處理單元。參數提取單元1271從所 生成的語音數據的每一幀(以適當的時間間隔)中提取諸如Mel頻率倒譜 系數(MFCC)及其時差參數、語音數據的頻譜、功率線性預測系數、倒 譜系數、和線譜對之類的特征參數。
參數提取單元1271將所提取的特征參數發送給關鍵字提取單元 1273。關鍵字提取單元1273可以將所提取的特征參數存儲在稍后將描述 的存儲單元1251中。
關鍵字提取單元1273基于關鍵字提取數據庫1030和由參數提取單元 1271生成并提取的特征參數來從在廣播音頻信息中包含的語音數據中提取 關鍵字。當關鍵字提取單元1273提取關鍵字時,關鍵字提取單元1273可 以經由通信單元1249來參考與通信網絡1012相連接的關鍵字提取數據庫 1030。
在包含在廣播音頻信息中的語音數據中一般包含多個關鍵字。關鍵字 提取單元1273自動地提取存在于該語音數據中的所有關鍵字。關鍵字提 取單元1273將所提取的關鍵字發送到信息搜索單元1265。關鍵字提取單 元1273可以將所提取的關鍵字存儲在存儲單元1251中。
在上文中,已經描述了根據本修改示例的信息處理裝置1020的功能 的示例。上述組件可以使用通用元件或電路來構成,或者可以利用專用于 各個組件的功能的專用硬件來構成。這些組件的全部功能可以利用CPU 等來執行。因此,可以根據實施本實施例時的技術水平來適當地修改硬件 配置。根據本修改示例的信息處理裝置1020還可以包括根據本發明第三實施例的信息處理裝置1020的語音談話控制單元。信息處理裝置1020還可 以包括存儲關鍵字提取數據庫1030的內容的數據庫存儲單元。在這種情 況下,關鍵字提取數據庫1030的內容可以被存儲在設置在信息處理裝置 1020中的數據庫存儲單元中。因此可以縮短信息處理裝置1020訪問關鍵 字提取數據庫1030所需的時間。其結果是,可以縮短信息處理裝置1020 執行關鍵字提取所需的時間。 (關鍵字提取方法)接下來,將參考圖43來詳細描述根據本修改示例的信息處理裝置 1020所執行的關鍵字提取方法的示例。首先,信息處理裝置1020的廣播音頻信息接收單元1269基于從外部 顯示設備1070獲得的接收頻道信息來從外部顯示設備1070或廣播站1080 接收廣播音頻信息。參數提取單元1271和關鍵字提取單元1273對語音數 據執行話語識別并確定話語識別的結果(步驟S1401)。接下來,關鍵字提取單元1273對話語識別的結果應用形態分析,以 從話語識別的結果中提取字,并將所提取的字存儲在信息處理裝置1020 的存儲器上(步驟S1403)。接下來,關鍵字提取單元1273使用與通信網絡1012相連接的關鍵字 提取數據庫1030的信息或者關鍵字提取數據庫1030的內容來搜索所提取 的字(步驟S1405)。隨后,關鍵字提取單元1273判斷所提取字是否存在于關鍵字提取數 據庫1030中(步驟S1407)。當所提取字存在于關鍵字提取數據庫1030 中時,關鍵字提取單元1273將存在的所提取字記錄在存儲器上作為廣播 關鍵字數據(步驟S1409)。當所提取字并不存在于關鍵字提取數據庫 1030中時,關鍵字提取單元1273執行稍后將描述的步驟S1411的處理。接下來,關鍵字提取單元1273判斷沒有在關鍵字提取數據庫1030中 找到的所提取字是否存在于存儲器上(步驟S1411)。當未找到的字存在 于存儲器上時,執行步驟S1405的處理。當未找到的字不存在于存儲器中 時,關鍵字提取單元1273將存在于存儲器上的廣播關鍵字數據輸出作為102所提取關鍵字(步驟S1413)。通過使用上述方法,根據本修改示例的信息處理裝置1020可以從所接收的廣播音頻信息中提取關鍵字。由根據本修改示例的信息處理裝置1020執行的關鍵字同步方法與由 根據本發明第三實施例的信息處理裝置1020執行的關鍵字同步方法基本 相同,并且將省略對它的詳細描述。在根據本修改示例的信息處理裝置1020中,存在于關鍵字提取數據 庫1030中的字(關鍵字)被自動地從發送自廣播站1080的廣播音頻信息 中提取。因此,可以向外部顯示設備1070顯示所提取的關鍵字。通過使 用這樣的功能,使用信息處理裝置1020或外部顯示設備1070來執行諸如 聊天之類的雙向通信的用戶可以使用所提取的關鍵字作為聊天的話題等。本領域技術人員應當了解,在所附權利要求或其等同物的范圍內,根 據設計要求和其它因素可以進行各種修改、組合、子組合和變更。例如,在上述實施例中,廣播站1080發送地面數字廣播。但是,廣 播站1080可以提供有線廣播或者因特網廣播。在上述實施例中,圖38示出了廣播站1080通過地面數字廣播來提供 電視節目的情況。但是,利用可攜式攝像機來提供的AV內容也可以,用 戶可以親自使用該可攜式攝像機來捕捉和再現圖像。在上述實施例中,兩個信息處理裝置執行語音聊天。但是,在根據本 實施例的語音聊天系統中,可以在多個信息處理裝置中執行語音聊天,并 且可以在各個信息處理裝置之間執行關鍵字同步。如上所述,根據本發明的實施例,與語音聊天期間的會話內容相關的 關鍵字被自動高效地同步。另外,在廣播信息中包含的關鍵字被自動高效 地同步。本發明包含與2007年4月16日向日本專利局提交的日本專利申請JP 2007-107319、 2007年4月16日向日本專利局提交的日本專利申請JP 2007-107324、 2007年12月17日向日本專利局提交的日本專利申請JP 2007-325274、以及2007年12月17日向日本專利局提交的日本專利申請 JP 2007-325275相關的主題,這些申請的全部內容通過引用而結合于此。
權利要求
1.一種語音聊天系統,包括執行語音聊天同時執行話語識別的多個信息處理裝置;以及經由通信網絡而與所述多個信息處理裝置相連接的搜索服務器,其中,所述搜索服務器向至少一個所述信息處理裝置公開搜索關鍵字列表,所述搜索關鍵字列表包含由所述搜索服務器搜索的搜索關鍵字,所述至少一個信息處理裝置包括識別字字典生成單元,該識別字字典生成單元從所述搜索服務器獲取所述搜索關鍵字列表,以生成包含在話語識別時使用的字的識別字字典;話語識別單元,該話語識別單元通過參考包含所述識別字字典的識別數據庫來對從所述語音聊天期間的談話對話中獲得的語音數據執行話語識別;語音談話控制單元,該語音談話控制單元執行與至少一個信息處理裝置之間的所述語音數據的通信控制;以及關鍵字檢測單元,該關鍵字檢測單元從所述話語識別的結果中檢測與所述語音聊天期間的談話內容相關的關鍵字。
2. —種信息處理裝置,該裝置從搜索服務器獲取搜索關鍵字列表并 執行與其它信息處理裝置的語音聊天,所述搜索關鍵字列表包含由所述搜 索服務器搜索的搜索關鍵字,所述裝置包括識別字字典生成單元,該識別字字典生成單元從所述搜索服務器獲取 所述搜索關鍵字列表,以生成包含在話語識別時使用的字的識別字字典;話語識別單元,該話語識別單元通過參考包含所述識別字字典的識別 數據庫來對從所述語音聊天期間的談話對話中獲得的語音數據執行話語識 別;語音談話控制單元,該語音談話控制單元執行與所述其它信息處理裝 置之間的所述語音數據的通信控制;以及關鍵字檢測單元,該關鍵字檢測單元從所述話語識別的結果中檢測與 所述語音聊天期間的談話內容相關的關鍵字。
3. 如權利要求2所述的信息處理裝置,其中,所述識別字字典包括固定字字典,在該固定字字典中預先登記了預定的字;和可變字字典,在該可變字字典中按需來更新所登記的字,并且其中,所述識別字字典生成單元從所述搜索服務器的包含較高等級的搜索關鍵字的所述搜索關鍵字列表中選擇將被登記在所述可變字字典中的字,以生成所述可變字字典。
4. 如權利要求3所述的信息處理裝置,其中,所述識別字字典生成單元基于由所述關鍵字檢測單元檢測得到的所述關鍵字的歷史信息來確定 所述信息處理裝置的用戶的偏好,并基于所述偏好來從所述搜索關鍵字列 表中選擇所述字。
5. 如權利要求3所述的信息處理裝置,其中,所述識別字字典生成單元使用所述搜索服務器來搜索從所述搜索關鍵字列表中選擇出來的所述 字,并從通過所述搜索而獲得的搜索結果中獲取與所述字相關的次關鍵 字,從而以與所述字相關聯的方式來將所述次關鍵字登記在所述可變字字典中°
6. 如權利要求3所述的信息處理裝置,其中,所述識別字字典生成 單元基于搜索等級信息來對從所述搜索關鍵字列表中選擇的各個字進行加 權,其中,所述搜索等級信息是利用所屬字被所述搜索服務器搜索的頻率 來確定的。
7. 如權利要求6所述的信息處理裝置,其中,所述識別字字典生成 單元基于由所述關鍵字檢測單元檢測到的所述關鍵字的歷史信息來計算所 述關鍵字的頻率,并改變登記在所述可變字字典中且與所述關鍵字相對應 的字的權重。
8. —種信息處理裝置,該裝置從搜索服務器獲取包含由所述搜索服 務器搜索的搜索關鍵字的搜索關鍵字列表,從所述搜索關鍵字列表中選擇 字,從對所選擇的字施加在話語識別時使用的權重信息的識別字字典生成 設備獲取被施加了權重信息的字,并與其它信息處理裝置執行語音聊天, 所述信息處理裝置包括 .話語識別單元,該話語識別單元通過參考包含從所述識別字字典生成 設備獲得的所述字的識別數據庫來對從語音聊天期間的談話對話中獲得的 語音數據執行話語識別;語音談話控制單元,該語音談話控制單元執行與所述其它信息處理裝 置之間的所述語音數據的通信控制;以及關鍵字檢測單元,該關鍵字檢測單元從所述話語識別的結果中檢測與 所述語音聊天期間的談話內容相關的關鍵字。
9. 一種在信息處理裝置中使用的話語識別方法,所述裝置從搜索服務器獲取包含由所述搜索服務器搜索的搜索關鍵字的搜索關鍵字列表并與其它信息處理裝置執行語音聊天,所述方法包括以下步驟從所述搜索服務器獲取所述搜索關鍵字列表,以生成包含在話語識別時使用的字的識別字字典;從所述語音聊天期間的談話內容中獲得語音數據;基于所述語音數據的聲學特征來分析所述語音數據,并生成與所述談 話內容相對應的字序列候選;以及通過參考在所述話語識別時使用的包含所述識別字字典的識別數據 庫、基于在構成所述字序列的字之間的語言學串聯特征來分析所生成的字 序列候選,從而選擇最合適的字序列。
10. —種在信息處理裝置中使用的話語識別方法,所述裝置從搜索服 務器獲取包含由所述搜索服務器搜索的搜索關鍵字的搜索關鍵字列表、從 所述搜索關鍵字列表中選擇字、從對所選擇的字施加在話語識別時使用的 權重信息的識別字字典生成設備獲取被施加了權重信息的字、并與其它信 息處理裝置執行語音聊天,所述方法包括以下步驟從所述識別字字典生成設備獲取被施加了所述權重信息的字,并將所 述字存儲在識別數據庫中以在話語識別時使用;從所述語音聊天期間的談話內容中獲得語音數據;基于所述語音數據的聲學特征來分析所述語音數據,并生成與所述談 話內容相對應的字序列候選;以及通過參考所述識別數據庫、基于在構成所述字序列的字之間的語言學串聯特征來分析所生成的字序列候選,從而選擇最合適的字序列。
11. 一種用于對信息處理裝置進行控制的計算機的程序,所述裝置從 搜索服務器獲取包含由所述搜索服務器搜索的搜索關鍵字的搜索關鍵字列 表并與其它信息處理裝置執行語音聊天,所述程序允許所述計算機執行以 下功能識別字字典生成功能,從所述搜索服務器獲取所述搜索關鍵字列表以 生成包含在話語識別時使用的字的識別字字典;話語識別功能,通過參考包含所述識別字字典的識別數據庫來對從所 述語音聊天期間的談話對話中獲得的語音數據執行話語識別;語音談話控制功能,執行與所述其它信息處理裝置之間的所述語音數 據的通信控制;以及關鍵字檢測功能,從所述話語識別的結果中檢測與所述語音聊天期間 的談話內容相關的關鍵字。
12. —種用于對信息處理裝置進行控制的計算機的程序,所述裝置從 搜索服務器獲取包含由所述搜索服務器搜索的搜索關鍵字的搜索關鍵字列 表、從所述搜索關鍵字列表中選擇字、從對所選擇的字施加在話語識別時 使用的權重信息的識別字字典生成設備獲取被施加了權重信息的字、并與 其它信息處理裝置執行語音聊天,所述程序允許計算機執行以下功能話語識別功能,通過參考包含從所述識別字字典生成設備獲取的所述 字的識別數據庫來對從所述語音聊天期間的談話對話中獲得的語音數據執行話語識別;語音談話控制功能,執行與所述其它信息處理裝置之間的所述語音數據的通信控制;以及關鍵字檢測功能,從所述話語識別的結果中檢測與所述語音聊天期間 的談話內容相關的關鍵字。
13. —種信息處理裝置,包括識別字字典生成單元,該識別字字典生成單元從搜索服務器獲取包含 由所述搜索服務器搜索的搜索關鍵字的搜索關鍵字列表,以生成包含在語 言識別時使用的字的識別字字典;廣播文本信息接收單元,該廣播文本信息接收單元接收從廣播站發送 而來的廣播文本信息;關鍵字檢測單元,該關鍵字檢測單元通過參考所述識別字字典來從所述廣播文本信息中檢測預定關鍵字;以及外部顯示設備連接控制單元,該外部顯示設備連接控制單元執行與外 部顯示設備的連接控制并將從所述廣播文本信息中檢測到的所述關鍵字輸 出到所述外部顯示設備。
14. 如權利要求13所述的信息處理裝置,其中,所述廣播文本信息 接收單元從與所述信息處理裝置相連接的所述外部顯示設備獲取關于所述 外部顯示設備正通過其接收的廣播頻道的接收頻道信息以及與所述廣播頻 道相對應的廣播文本信息。
15. 如權利要求13所述的信息處理裝置,其中,所述廣播文本信息 接收單元從與所述信息處理裝置相連接的所述外部顯示設備獲取關于所述 外部顯示設備正通過其接收的廣播頻道的接收頻道信息,并從所述廣播站 獲取與所述廣播頻道相對應的廣播文本信息。
16. 如權利要求13所述的信息處理裝置,其中,所述信息處理裝置 將所述關鍵字的參考歷史存儲在所述外部顯示設備中,并且其中,所述外部顯示設備連接控制單元將所述外部顯示設備所選擇的 關鍵字通知給所述搜索引擎。
17. —種信息處理裝置,包括識別字字典生成單元,該識別字字典生成單元從搜索服務器獲取包含 由所述搜索服務器搜索的搜索關鍵字的搜索關鍵字列表,以生成包含在話 語識別時使用的字的識別字字典;廣播音頻信息接收單元,該廣播音頻信息接收單元接收從廣播站發送 而來的廣播音頻信息;話語識別單元,該話語識別單元通過參考包含所述識別字字典的識別 數據庫來對所述廣播音頻信息執行話語識別;關鍵字檢測單元,該關鍵字檢測單元從對所述廣播音頻信息的所述話 語識別的結果中檢測預定關鍵字;以及外部顯示設備連接控制單元,該外部顯示設備連接控制單元執行與外 部顯示設備的連接控制并將從所述廣播音頻信息中檢測到的所述關鍵字輸 出到所述外部顯示設備。
18. 如權利要求17所述的信息處理裝置,其中,所述廣播音頻信息接收單元從與所述信息處理裝置相連接的所述外部顯示設備獲取關于所述 外部顯示設備正通過其接收的廣播頻道的接收頻道信息以及與所述廣播頻 道相對應的廣播音頻信息。
19. 如權利要求17所述的信息處理裝置,其中,所述廣播音頻信息 接收單元從與所述信息處理裝置相連接的所述外部顯示設備獲取關于所述 外部顯示設備正通過其接收的廣播頻道的接收頻道信息,并從所述廣播站 獲取與所述廣播頻道相對應的廣播音頻信息。
20. 如權利要求17所述的信息處理裝置,其中,所述信息處理裝置 將所述關鍵字的參考歷史存儲在所述外部顯示設備中,并且其中,所述外部顯示設備連接控制單元將所述外部顯示設備所選擇的 關鍵字通知給所述搜索引擎。
21. —種關鍵字檢測方法,包括以下步驟從搜索服務器獲取包含由所述搜索服務器搜索的搜索關鍵字的搜索關 鍵字列表,以生成包含在語言識別時使用的字的識別字字典; 接收從廣播站發送而來的廣播文本信息;通過參考所述識別字字典來從所述廣播文本信息中檢測預定關鍵字;以及執行與外部顯示設備的連接控制,并將從所述廣播文本信息中檢測到 的所述關鍵字輸出到所述外部顯示設備。
22. —種關鍵字檢測方法,包括以下步驟從搜索服務器獲取包含由所述搜索服務器搜索的搜索關鍵字的搜索關 鍵字列表,以生成包含在話語識別時使用的字的識別字字典; 接收從廣播站發送而來的廣播音頻信息;通過參考包含所述識別字字典的識別數據庫來對所述廣播音頻信息執 行話語識別;從對所述廣播音頻信息的所述話語識別的結果中檢測預定關鍵字;以及執行與外部顯示設備的連接控制并將從所述廣播音頻信息中檢測到的 所述關鍵字輸出到所述外部顯示設備。
23. —種程序,允許計算機實現以下功能識別字字典生成功能,從搜索服務器獲取包含由所述搜索服務器搜索 的搜索關鍵字的搜索關鍵字列表,以生成包含在語言識別時使用的字的識別字字典;廣播文本信息接收功能,接收從廣播站發送而來的廣播文本信息; 關鍵字檢測功能,通過參考所述識別字字典來從所述廣播文本信息中檢測預定關鍵字;以及外部顯示設備連接控制功能,執行與外部顯示設備的連接控制,并將從所述廣播文本信息中檢測到的所述關鍵字輸出到所述外部顯示設備。
24. —種程序,允許計算機實現以下功能識別字字典生成功能,從搜索服務器獲取包含由所述搜索服務器搜索 的搜索關鍵字的搜索關鍵字列表,以生成包含在話語識別時使用的字的識 別字字典;廣播音頻信息接收功能,接收從廣播站發送而來的廣播音頻信息;話語識別功能,通過參考包含所述識別字字典的識別數據庫來對所述 廣播音頻信息執行話語識別;關鍵字檢測功能,從對所述廣播音頻信息的所述話語識別的結果中檢 測預定關鍵字;以及外部顯示設備連接控制功能,執行與外部顯示設備的連接控制并將從 所述廣播音頻信息中檢測到的所述關鍵字輸出到所述外部顯示設備。
25. —種語音聊天系統,包括 執行語音聊天的多個信息處理裝置;在從所述語音聊天期間的談話對話中提取關鍵字時由所述信息處理裝 置參考的關鍵字提取數據庫;以及在使用所提取的關鍵字來搜索所述關鍵字以及與所述關鍵字相關的文章時由所述信息處理裝置使用的搜索引擎, 其中,至少一個信息處理裝置包括參數提取單元,該參數提取單元從根據所述對話來生成的語音數據中 提取參數,所述參數表現了所述語音數據的特征;關鍵字提取單元,該關鍵字提取單元識別所生成的語音數據,并基于 所述參數和所述關鍵字提取數據庫來從所述語音數據中提取所述關鍵字;信息搜索單元,該信息搜索單元使用所述搜索引擎來搜索所提取的關 鍵字,并獲取針對所述關鍵字的搜索結果和與所述關鍵字相關的文章;顯示單元,該顯示單元顯示與針對所述關鍵字的搜索結果的地址信息 相關聯的關鍵字以及與和所述關鍵字相關的文章的地址信息相關聯的文 章;以及關鍵字同步單元,該關鍵字同步單元將所提取的關鍵字發送到作為所 述聊天的對應方的信息處理裝置,并執行與該對應方信息處理裝置的關鍵 字同步。
26. —種與其它信息處理裝置執行語音聊天的信息處理裝置,該裝置 包括參數提取單元,該參數提取單元從根據所述語音聊天期間的談話對話 來生成的語音數據中提取參數,所述參數表現了所述語音數據的特征;關鍵字提取單元,該關鍵字提取單元識別所生成的語音數據,并基于 所述參數和關鍵字提取數據庫來從所述語音數據中提取關鍵字;信息搜索單元,該信息搜索單元使用搜索引擎來搜索所提取的關鍵 字,并獲取針對所述關鍵字的搜索結果和與所述關鍵字相關的文章;以及搜索信息聚積單元,該搜索信息聚積單元分別以與針對所述關鍵字的 搜索結果的地址信息和所述文章的地址信息相關聯的方式來聚積所述關鍵 字和所述文章。
27. 如權利要求26所述的信息處理裝置,還包括關鍵字同步單元, 該關鍵字同步單元將所提取的關鍵字發送到作為所述聊天的對應方的信息 處理裝置,并執行與所述對應方信息處理裝置的關鍵字同步。
28. 如權利要求26所述的信息處理裝置,還包括存儲關鍵字提取數據庫的數據庫存儲單元。
29. 如權利要求26所述的信息處理裝置,其中,所述搜索引擎被設置在所述信息處理裝置中。
30. 如權利要求26所述的信息處理裝置,還包括顯示單元,該顯示 單元顯示與針對所述關鍵字的搜索結果的地址信息相關聯的關鍵字以及與 和所述關鍵字相關的文章的地址信息相關聯的文章。
31. 如權利要求26所述的信息處理裝置,還包括參考歷史存儲單 元,該參考歷史存儲單元存儲所述關鍵字的參考歷史。
32. 如權利要求31所述的信息處理裝置,其中,所述參考歷史存儲 單元以與被賦予相應聊天和該聊天的對應方的標識符相關聯的方式來存儲 所述被參考的關鍵字。
33. 如權利要求31所述的信息處理裝置,其中,所述關鍵字提取單 元基于偏好來提取位于所述參考歷史的較高等級的關鍵字。
34. 如權利要求26所述的信息處理裝置,其中,所述關鍵字提取單 元基于偏好來提取所述搜索引擎的較高等級處搜索關鍵字。
35. —種與其它信息處理裝置執行語音聊天的信息處理裝置,至少一 個所述信息處理裝置包括參數提取單元,該參數提取單元從根據所述語 音聊天期間的談話對話來生成的語音數據中提取參數,所述參數表現了所 述語音數據的特征;關鍵字提取單元,該關鍵字提取單元識別所生成的語 音數據,并基于所述參數和關鍵字提取數據庫來從所述語音數據中提取關 鍵字;信息搜索單元,該信息搜索單元使用搜索引擎來搜索所提取的關鍵 字,并獲取針對所述關鍵字的搜索結果和與所述關鍵字相關的文章;以及 搜索信息聚積單元,該搜索信息聚積單元分別以與針對所述關鍵字的搜索 結果的地址信息和所述文章的地址信息相關聯的方式來聚積所述關鍵字和 所述文章,其中,所述信息處理裝置包括關鍵字同步單元,該關鍵字同步單元接 收從所述至少一個信息處理裝置發送而來的所述關鍵字,并執行與相應的 信息處理裝置的關鍵字同步。
36. —種程序,允許計算機實現以下功能參數提取功能,從根據語音聊天期間的談話對話來生成的語音數據中 提取參數,所述參數表現了所述語音數據的特征;關鍵字提取功能,識別所生成的語音數據,并基于所述參數和關鍵字 提取數據庫來從所述語音數據中提取關鍵字;信息搜索功能,使用搜索引擎來搜索所提取的關鍵字,并獲取針對所述關鍵字的搜索結果和與所述關鍵字相關的文章;以及搜索信息存儲功能,分別以與針對所述關鍵字的搜索結果的地址信息 和所述文章的地址信息相關聯的方式來存儲所述關鍵字和所述文章。
37. —種程序,允許計算機實現以下功能關鍵字同步功能,接收從至少一個信息處理裝置發送而來的關鍵字, 并執行與相應信息處理裝置的關鍵字同步。
38. —種信息處理裝置,包括廣播文本信息接收單元,該廣播文本信息接收單元接收從廣播站發送而來的廣播文本信息;關鍵字提取單元,該關鍵字提取單元基于關鍵字提取數據庫來從所述 廣播文本信息中提取關鍵字;信息搜索單元,該信息搜索單元使用搜索引擎來搜索所提取的關鍵 字,并獲取與所述關鍵字相關的文章;以及外部顯示設備連接控制單元,該外部顯示設備連接控制單元執行與外 部顯示設備的連接控制,并將所述關鍵字、針對所述關鍵字的搜索結果、 以及與所述關鍵字相關的文章輸出到所述外部顯示設備。
39. 如權利要求38所述的信息處理裝置,其中,所述廣播文本信息接收單元從與所述信息處理裝置相連接的所述外部顯示設備獲取關于所述 外部顯示設備正通過其接收的廣播頻道的接收頻道信息以及與所述廣播頻 道相對應的廣播文本信息。
40. 如權利要求38所述的信息處理裝置,其中所述廣播文本信息接 收單元從與所述信息處理裝置相連接的所述外部顯示設備獲取關于所述外 部顯示設備正通過其接收的廣播頻道的接收頻道信息,并從所述廣播站獲 取與所述廣播頻道相對應的廣播文本信息。
41. 如權利要求38所述的信息處理裝置,還包括參考歷史存儲單元,該參考歷史存儲單元將所述關鍵字的參考歷史存儲在所述外部顯示設 備中,其中,所述外部顯示設備連接控制單元將所述外部顯示設備所選擇的 關鍵字通知給所述搜索引擎。
42. 如權利要求38所述的信息處理裝置,還包括關鍵字同步單元, 該關鍵字同步單元將所提取的關鍵字發送到至少一個信息處理裝置,并執 行與所述至少一個信息處理裝置的關鍵字同步。
43. —種信息處理裝置,包括廣播音頻信息接收單元,該廣播音頻信息接收單元接收從廣播站發送 而來的廣播音頻信息;參數提取單元,該參數提取單元從包含在所述廣播音頻信息中的語音 數據中提取參數,所述參數表現了所述語音數據的特征;關鍵字提取單元,該關鍵字提取單元識別所述語音數據并基于所述參 數和關鍵字提取數據庫來從所述語音數據中提取關鍵字;信息搜索單元,該信息搜索單元使用搜索引擎來搜索所提取的關鍵 字,并獲取針對所述關鍵字的搜索結果和與所述關鍵字相關的文章;以及外部顯示設備連接控制單元,該外部顯示設備連接控制單元執行與外 部顯示設備的連接控制,并將所述關鍵字、針對所述關鍵字的搜索結果、 以及與所述關鍵字相關的文章輸出到所述外部顯示設備。
44. 如權利要求43所述的信息處理裝置,其中,所述廣播音頻信息 接收單元從與所述信息處理裝置相連接的所述外部顯示設備獲取關于所述 外部顯示設備正通過其接收的廣播頻道的接收頻道信息以及與所述廣播頻 道相對應的廣播音頻信息。
45. 如權利要求43所述的信息處理裝置,其中所述廣播音頻信息接 收單元從與所述信息處理裝置相連接的所述外部顯示設備獲取關于所述外 部顯示設備正通過其接收的廣播頻道的接收頻道信息,并從所述廣播站獲 取與所述廣播頻道相對應的廣播音頻信息。
46. 如權利要求43所述的信息處理裝置,還包括參考歷史存儲單元,該參考歷史存儲單元將所述關鍵字的參考歷史存儲在所述外部顯示設 備中,其中,所述外部顯示設備連接控制單元將所述外部顯示設備所選擇的 關鍵字通知給所述搜索引擎。
47. 如權利要求43所述的信息處理裝置,還包括關鍵字同步單元, 該關鍵字同步單元將所提取的關鍵字發送到至少一個信息處理裝置,并執 行與所述至少一個信息處理裝置的關鍵字同步。
48. —種程序,允許計算機實現以下功能 廣播文本信息接收功能,接收從廣播站廣播的廣播文本信息;關鍵字提取功能,基于關鍵字提取數據庫來從所述廣播文本信息中提取關鍵字;信息搜索功能,使用搜索引擎來搜索所提取的關鍵字,并獲取針對所 述關鍵字的搜索結果和與所述關鍵字相關的文章;以及外部顯示設備連接控制功能,執行與外部顯示設備的連接控制,并將 所述關鍵字、針對所述關鍵字的搜索結果、以及與所述關鍵字相關的文章 輸出到所述外部顯示設備。
49. 一種程序,允許計算機實現以下功能廣播音頻信息接收功能,接收從廣播站發送而來的廣播音頻信息;參數提取功能,從包含在所述廣播音頻信息中的語音數據中提取參 數,所述參數表現了所述語音數據的特征;關鍵字提取功能,識別所述語音數據并基于所述參數和關鍵字提取數 據庫來從所述語音數據中提取關鍵字;信息搜索功能,使用搜索引擎來搜索所提取的關鍵字,并獲取針對所 述關鍵字的搜索結果和與所述關鍵字相關的文章;以及外部顯示設備連接控制功能,執行與外部顯示設備的連接控制,并將 所述關鍵字、針對所述關鍵字的搜索結果、以及與所述關鍵字相關的文章 輸出到所述外部顯示設備。
全文摘要
本發明提供了語音聊天系統、信息處理裝置、話語識別方法。語音聊天系統包括執行語音聊天同時執行話語識別的多個信息處理裝置;和經由通信網絡而與所述多個信息處理裝置相連接的搜索服務器。搜索服務器向至少一個信息處理裝置公開搜索關鍵字列表,該搜索關鍵字列表包含由搜索服務器搜索的搜索關鍵字。至少一個信息處理裝置包括識別字字典生成單元,該識別字字典生成單元從搜索服務器獲取搜索關鍵字列表,以生成包含在話語識別時使用的字的識別字字典;以及話語識別單元,該話語識別單元通過參考包含該識別字字典的識別數據庫來對從語音聊天期間的談話對話中獲得的語音數據執行語音識別。
文檔編號H04M3/56GK101309327SQ20081009048
公開日2008年11月19日 申請日期2008年4月16日 優先權日2007年4月16日
發明者中出元樹, 倉田宜典, 小川浩明, 本田等, 石塚大介 申請人:索尼株式會社;索尼通訊網路公司