專利名稱:語音信息系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及媒體播放器,更具體地說,涉及在媒體播放器上提供語音信息。
背景技術(shù):
在信息時代,計算機能夠共享信息的能力是非常重要的。網(wǎng)絡(luò)是計算機借以能彼此進行通信的的機構(gòu)。一般,提供資源的裝置稱為服務(wù)器,而利用這些資源的裝置稱為客戶機。根據(jù)網(wǎng)絡(luò)類型,裝置可能專用于一種類型的任務(wù)或者可能既作為客戶機又作為服務(wù)器,這取決于裝置是給出資源還是請求資源。
人們想共享的資源類型通常與娛樂有關(guān),這種情況日益增多。具體地說,音樂、電影、圖片和印刷物是用戶可能想通過網(wǎng)絡(luò)訪問的娛樂相關(guān)媒體的全部類型。例如,盡管音樂庫可以駐留在臺式計算機上,但媒體擁有者可能想在攜帶式媒體播放器上聽音樂。
為了實現(xiàn)便攜性,許多便攜式媒體播放器使用讓用戶經(jīng)由簡單圖形用戶界面訪問音樂的最低限(minimalist)顯示屏。顯示屏并不總是被良好照明,在黑暗中也許不可導(dǎo)航。而且,用戶可能在某些場合(例如,開車時)不便于或不適合看顯示屏,或者用戶可能殘疾,這使得不可能對菜單進行可視導(dǎo)航。另外,許多人可輕易發(fā)現(xiàn)顯示屏太小且不便于以常規(guī)方式使用。
雖然所描述的技術(shù)在很多應(yīng)用中效果不錯,但仍需繼續(xù)努力以進一步提高用戶感受。
發(fā)明內(nèi)容
本發(fā)明提供用于提供音頻信息的方法。在一個實施例中,音頻信息屬于音頻菜單。首先,在服務(wù)器上提供正文串,每個正文串能夠表示一個菜單選項。其次,產(chǎn)生音頻文件,每個音頻文件表示正文串之一的語音名稱,并且將每個音頻文件與其正文串相關(guān)聯(lián)。然后服務(wù)器將音頻文件及其關(guān)聯(lián)傳送到客戶機。
包括由正文串代表的菜單選項的菜單隨后呈現(xiàn)在客戶機上,該菜單選項能夠被突出顯示即選擇。當(dāng)與音頻文件關(guān)聯(lián)的菜單選項被突出顯示時,在客戶機上播放該音頻文件。
在本發(fā)明的另一方面,設(shè)有包含處理器、存儲器和網(wǎng)絡(luò)接口的服務(wù)器。該服務(wù)器的處理器可用來執(zhí)行指令,包括提供正文串這樣的指令。該服務(wù)器的處理器也可用于執(zhí)行其它指令,例如產(chǎn)生正文串的音頻表達的音頻文件并將音頻文件傳送到客戶機裝置。在一個實施例中,正文串代表菜單組件。菜單組件可為能從客戶機裝置的菜單中選擇的若干選項之一。在一個實施例中,客戶機裝置是媒體播放器,例如手持媒體播放器。
在本發(fā)明的又一方面,提供包括處理器、存儲器和網(wǎng)絡(luò)接口的客戶機裝置。客戶機的處理器可用來執(zhí)行包括允許其從服務(wù)器接收菜單組件的音頻表達的音頻文件的指令,由此菜單組件是可從菜單中選擇的若干選項之一??蛻魴C的處理器也可用于執(zhí)行包括關(guān)于允許它更新菜單以包括菜單組件并且在突出顯示菜單組件時播放音頻文件的指令。
在本發(fā)明的又一方面,提供媒體管理系統(tǒng)。該媒體管理系統(tǒng)包括媒體數(shù)據(jù)庫、媒體集合記錄、媒體記錄、語音名稱數(shù)據(jù)庫和字符串關(guān)聯(lián)記錄。媒體數(shù)據(jù)庫存儲媒體文件。媒體集合記錄包括與媒體文件分組有關(guān)的數(shù)據(jù)。媒體記錄包括與媒體文件有關(guān)的元數(shù)據(jù)。語音名稱數(shù)據(jù)庫存儲音頻文件。字符串關(guān)聯(lián)記錄將音頻文件與媒體集合記錄中的數(shù)據(jù)以及媒體記錄中的元數(shù)據(jù)關(guān)聯(lián)起來。
通過參照以下結(jié)合附圖的描述可很好地理解本發(fā)明,附圖中圖1是說明可實現(xiàn)本發(fā)明的示例性環(huán)境的方框圖;圖2是說明本發(fā)明一實施例的媒體管理系統(tǒng)的組織機構(gòu)的方框圖;圖3是說明可與本發(fā)明一實施例結(jié)合使用的一般步驟的流程圖;圖4是說明一種按照圖3所示的本發(fā)明一實施例產(chǎn)生語音名稱的可能方法的流程圖;圖5是說明本發(fā)明一實施例的在客戶機裝置中激活可聞菜單選項時執(zhí)行的步驟的流程圖。
圖6是說明本發(fā)明一實施例的可在菜單導(dǎo)航期間執(zhí)行的步驟的流程圖;以及圖7是說明可實現(xiàn)本發(fā)明不同實施例的示例性計算裝置的圖。
應(yīng)理解,附圖中相同的數(shù)字指示相同的構(gòu)成要素。同樣應(yīng)理解,圖中的描繪未必按比例。
具體實施例方式
在下面的描述中,闡述許多具體細節(jié)以提供對本發(fā)明的深入理解。然而,本領(lǐng)域技術(shù)人員顯見,無需若干或全部這些具體細節(jié)也可實現(xiàn)本發(fā)明。在其他情況,為了避免不必要地使本發(fā)明的闡述變得不清晰,未對眾所周知的處理步驟作詳細描述。
本發(fā)明提供用于提供音頻信息的方法。在一個實施例中,該音頻信息屬于音頻菜單。
本發(fā)明通??紤]到可更新的聲音菜單。雖然裝置可能有一些預(yù)裝的菜單組件,但其他的菜單組件接收自服務(wù)器。例如,可以與音樂播放器一起提供一些預(yù)裝的菜單組件(例如,“播放列表”、“歌曲”、“藝術(shù)家”、“設(shè)置”和“關(guān)于”的頂層菜單級),但也允許其他菜單組件添加到各種菜單選項(例如,用戶添加的頂級菜單“風(fēng)格”或可用播放列表、歌曲和藝術(shù)家的二級菜單列表)。每個菜單組件,無論是原有的還是接收自服務(wù)器,均有相關(guān)的語音名稱。在用戶將菜單選項突出顯示時,播放其語音名稱。然后用戶可選擇該菜單選項或翻到新菜單選項。這樣,用戶無須觀看顯示屏就可對菜單導(dǎo)航。
圖1是說明可實現(xiàn)本發(fā)明的示例性環(huán)境的方框圖。網(wǎng)絡(luò)105將服務(wù)器110連接到各客戶機115、120、125和130。網(wǎng)絡(luò)105通常為數(shù)據(jù)網(wǎng)絡(luò),例如LAN、WAN或因特網(wǎng)。服務(wù)器110可以是專用裝置或者不是專用裝置。在圖1所示的例中,服務(wù)器110是通用計算機。各種客戶機115、120、125和130可以是具有不同級別處理能力的肥或瘦客戶機。客戶機可包括便攜式計算機115、臺式計算機120、專用裝置例如可從加利福尼亞庫珀蒂諾的蘋果計算機公司買到的iPodsTM125、甚至設(shè)計用來跨網(wǎng)絡(luò)105工作的網(wǎng)絡(luò)感知的音頻/視頻部件130。某些裝置例如iPod 125可以經(jīng)由FireWire、USB或一些其它的允許客戶機125和服務(wù)器110更直接聯(lián)網(wǎng)在一起的外部總線直接連接到服務(wù)器110。
圖2是說明本發(fā)明一實施例的媒體管理系統(tǒng)200的組織機構(gòu)的方框圖。媒體管理系統(tǒng)200是允許用戶組織和訪問數(shù)字媒體的計算機程序。為簡單起見,下面討論將假設(shè)數(shù)字媒體限于音樂。然而,應(yīng)了解,對“歌曲”或“音樂”的任何引用可以推廣到任何形式的數(shù)字媒體,這包括聲音文件、圖片數(shù)據(jù)、電影、文本文件或任何其他類型的可采用數(shù)字方式存儲在計算機上的媒體。類似的,對“播放列表”的任何引用可以推廣到媒體集合,包括混合數(shù)字媒體集合。
雖然服務(wù)器110和客戶機115、120、125、130均可以具有特別適合那些裝置所需的特定功能性的媒體管理系統(tǒng)200的不同版本,但是媒體管理系統(tǒng)200的基本組件是相似的。具體而言,媒體管理系統(tǒng)200可包括媒體管理器205、音樂數(shù)據(jù)庫210和語音名稱數(shù)據(jù)庫215。媒體管理器205管理數(shù)據(jù)庫210和215。
音樂數(shù)據(jù)庫210有許多歌曲記錄220和用于分類、識別和/或描述音樂數(shù)據(jù)庫210中的媒體(即,媒體項)的播放列表記錄225。歌曲記錄220包含關(guān)于在數(shù)據(jù)庫210中可得的每個媒體項的元數(shù)據(jù)。元數(shù)據(jù)可包括例如歌曲名稱、藝術(shù)家、專輯、歌曲大小、歌曲格式和任何其他適當(dāng)?shù)男畔?。?dāng)然,信息類型可能取決于媒體類型。視頻文件可能還有導(dǎo)演和制片人字段,但可不使用專輯字段。
播放列表記錄225包含關(guān)于在音樂數(shù)據(jù)庫210中可得的每個播放列表的信息。而且,關(guān)于給定播放列表的信息可包括該播放列表內(nèi)的每首歌曲的識別信息。播放列表可以是采用任何特定順序或者不采用任何特定順序的媒體的集合。用戶可以選擇按流派、基調(diào)、藝術(shù)家、聽眾或任何其他有意義的安排來組合媒體。
一些包含在各種記錄220、225和230中的信息用作菜單組件。例如,頂級的菜單組件可允許用戶通過“歌曲”、“藝術(shù)家”或“播放列表”導(dǎo)航。這些分類可能與媒體管理系統(tǒng)200預(yù)裝在一起,或者在媒體管理系統(tǒng)200允許修改時由用戶修改過。然后用戶將能夠通過若干不同的路徑導(dǎo)航到特定媒體。
例如,如果用戶想通過“歌曲”菜單組件訪問歌曲“Little Angel ofMine”,則用戶將翻滾頂級選項,直到“歌曲”菜單組件被突出顯示。一旦突出顯示,用戶將選擇“歌曲”并用菜單組件的二級列表來呈現(xiàn)。該二級列表可能只是用戶可得的所有歌曲的按字母順序的列表,每首歌曲作為二級菜單組件。一般,這些二級菜單組件中沒有一個是預(yù)裝的,并且它們完全取決于用戶的特殊音樂偏好。該用戶將翻滾歌曲直到“Little Angel of Mine”被突出顯示,然后選擇該菜單組件來播放該歌曲。
或者,如果用戶想通過“藝術(shù)家”訪問歌曲,則用戶將翻滾到菜單組件的頂級,直到“藝術(shù)家”被突出顯示,然后選擇“藝術(shù)家”以用菜單組件的第二級來呈現(xiàn)。用戶將翻滾藝術(shù)家的按字母順序的列表,直到組合“No Secrets”被突出顯示。若選擇“No Secrets”二級菜單組件則將用戶導(dǎo)引到列出由組合“No Secrets”演奏的全部歌曲的菜單組件的第三級。然后歌曲“Little Angel of Mine”就會在第三級菜單組件當(dāng)中。
導(dǎo)航到聲音的另一備選方法是通過用戶定義的播放列表訪問歌曲。選擇頂級菜單組件“播放列表”將用戶帶到用戶已經(jīng)創(chuàng)建的所有播放列表的二級列表。歌曲“Little Angel of Mine”可能列出于若干不同的播放列表下。例如“Stuart Little 2 Soundtrack”或者“SongsWritten by Orrin Hatch”播放列表可能包含該歌曲。選擇這些二級菜單組件中的任一個將都將用戶帶到播放列表中的歌曲的三級列表。
所描述菜單組件中的每一個均直接從記錄220和225得到。與各菜單組件關(guān)聯(lián)的是菜單組件的音頻表達。在前例中,“歌曲”、“藝術(shù)家”、“播放列表”、“No Secrets”、“Stuart Little 2 Soundtrack”、“Songs Written by Orrin Hatch”和″Little Angle of Mine″都需要相關(guān)聯(lián)的發(fā)音,以讓用戶無須任何視覺的提示對菜單導(dǎo)航。
一種保存發(fā)音的機構(gòu)是語音名稱數(shù)據(jù)庫215。語音名稱數(shù)據(jù)庫215包含每個發(fā)音的音頻文件以及保存音頻文件和其對應(yīng)菜單組件之間的關(guān)聯(lián)的多個記錄230。雖然也能采用另一些機構(gòu)(例如,在歌曲記錄220和播放列表記錄225中嵌入發(fā)音,從而不需要語音名稱數(shù)據(jù)庫215),但是使用分離的語音名稱數(shù)據(jù)庫215允許與用戶如何導(dǎo)航到特定菜單組件無關(guān)地使用單個發(fā)音。
圖3是說明可與本發(fā)明一實施例結(jié)合而執(zhí)行的一般步驟的流程圖。在步驟305,將表示新菜單組件的正文串引入服務(wù)器110。這種引入可能發(fā)生在用戶手工輸入例如新播放列表的新條目時,或者引入可自動發(fā)生,例如在購買與歌曲記錄215裝在一起的新歌曲文件時。
在步驟310,必要時產(chǎn)生菜單組件的語音名稱的音頻文件。如果購買的歌曲包括語音名稱或如果語音名稱已經(jīng)存在于語音名稱數(shù)據(jù)庫215,則不必產(chǎn)生語音名稱。例如,如果用戶已有″The Beatles″的語音名稱,則每當(dāng)將新的Beatles歌曲增加到音樂數(shù)據(jù)庫210時,就不需要創(chuàng)建完全相同的語音名稱。
圖4是說明本發(fā)明一實施例的產(chǎn)生語音名稱涉及的詳細步驟的流程圖。在步驟405,媒體管理系統(tǒng)200接收觸發(fā)信號以創(chuàng)建語音名稱。一般,該觸發(fā)信號通過引入新歌曲記錄220或新播放列表記錄225創(chuàng)建一個新菜單組件而產(chǎn)生。然而,如果語音名稱選項先前已關(guān)閉,則第一次開啟該選項將產(chǎn)生一個觸發(fā)信號,通知媒體管理系統(tǒng)200需要語音名稱。
一旦產(chǎn)生了觸發(fā)信號,媒體管理系統(tǒng)200就在步驟410確定是否已經(jīng)存在特定字符串的語音名稱。如果不存在語音名稱,則服務(wù)器110在415能使用標(biāo)準的文本/話音轉(zhuǎn)換工具來產(chǎn)生音頻文件。最好,還對這些文件進行壓縮以節(jié)省空間。一種普遍采用的編碼并壓縮話音的編解碼器是Qualcomm PureVoice,加利福尼亞圣迭戈的Qualcomm公司有售。
一旦創(chuàng)建了一個音頻文件,服務(wù)器110在步驟420視情況可為用戶重放語音名稱,使得用戶能聽到該音頻文件。在步驟425,用戶可作出許可或拒絕發(fā)音的選擇。如果用戶許可發(fā)音,則媒體管理系統(tǒng)200在步驟430將創(chuàng)建適當(dāng)?shù)淖址P(guān)聯(lián)記錄230,使得音頻文件與適當(dāng)?shù)牟藛谓M件相關(guān)聯(lián)。
如果用戶在步驟425不認可發(fā)音,則在步驟435用戶可選擇修改文本/語音轉(zhuǎn)換工具用來創(chuàng)建語音名稱的文本。能以選擇方式讓用戶輸入的文本獨立于菜單組件,從而允許用戶試聽菜單組件而無需改變用于記錄220和225的實際正文,從而使得菜單組件在拼寫和發(fā)音上都正確。在步驟420,向用戶播放新發(fā)音,給用戶認可新發(fā)音的選擇機會。
或者,如果用戶在435不選擇改變文本,則媒體管理系統(tǒng)200可允許用戶在440記錄他或她自己的發(fā)音或者可提供其他音頻文件。于是,用戶自己的語音能用于稍后對菜單的導(dǎo)航。
再參考圖3,在步驟3 10創(chuàng)建語音名稱的音頻文件之后,服務(wù)器110在步驟315將所有新文件傳送到客戶機裝置115、120、125或130。一般,當(dāng)用戶從服務(wù)器110將音樂數(shù)據(jù)庫210和它們相關(guān)的記錄220和225下載到客戶機裝置115、120、125或130時,將傳送語音名稱數(shù)據(jù)庫215和字符串關(guān)聯(lián)記錄230的內(nèi)容。但是,并不存在語音名稱數(shù)據(jù)庫215和關(guān)聯(lián)記錄230不能獨立于音樂數(shù)據(jù)庫210及其記錄220和225而傳送的理由。
在步驟320,客戶機裝置115、120、125或130接收音頻文件以及所有適當(dāng)?shù)男虏藛谓M件。一旦接收,客戶機的媒體管理系統(tǒng)200上的菜單就在步驟325被更新,以反映任何變化。然后,在步驟330,只要用戶突出顯示任一菜單組件,向用戶重放適當(dāng)?shù)囊纛l文件,讓用戶通過聲音提示來對菜單導(dǎo)航。
一般,媒體管理系統(tǒng)200讓用戶選擇是打開或關(guān)閉可聽菜單。圖5是說明本發(fā)明一實施例中在設(shè)置可聽菜單選項時可執(zhí)行的步驟的流程圖。在步驟505,用戶可視情況選擇語言選項。語言選項允許以其它語言呈現(xiàn)預(yù)裝的菜單組件。例如,“歌曲”菜單組件將以其他語言呈現(xiàn)。例如, “歌曲”菜單組件以西班牙語“Canciones”、以法語“Chansons”和意大利語“Canzoni”呈現(xiàn)給用戶。另外,英語版本的語音名稱將不再是適當(dāng)?shù)?,并可以用適當(dāng)?shù)耐庹Z發(fā)音替換。外語發(fā)音可以預(yù)裝在媒體管理系統(tǒng)200中,或者可能需要從服務(wù)器110處下載。一般,語言選項一旦設(shè)定,它們將不被改變。
在步驟510,用戶激活可聽菜單特征。雖然這可能導(dǎo)致客戶機裝置115、120、125、或130使用預(yù)定義的設(shè)置,但是也能向用戶呈現(xiàn)各種定制選項。例如,在步驟515,用戶能選擇在瀏覽菜單時播放音樂。一旦用戶選擇要播放的歌曲,用戶可能想在聽他或她的第一選擇時將另一歌曲排隊等候。因此,用戶可被給予在第一首選定歌曲播放時允許呈現(xiàn)語音名稱的選項。如果用戶不想在菜單導(dǎo)航期間播放音樂,則可在520將系統(tǒng)設(shè)置為暫停或靜音。
如果用戶想在對菜單導(dǎo)航時聽音樂,則在步驟525可允許用戶將音樂與語音名稱混合。通過在當(dāng)前播放的歌曲中播放音頻文件簡單地實現(xiàn)混合。如果希望混合,則在步驟530設(shè)置混合選項。如果不希望混合,但用戶仍想在對菜單導(dǎo)航時播放音樂,則媒體管理系統(tǒng)200在步驟535可以允許在一個聲道(左邊或右邊的揚聲器)中播放音樂,并通過設(shè)置單聲道選項在另一聲道中播放語音名稱。因此,當(dāng)用戶戴耳機時,語音名稱將在一個耳朵中呈現(xiàn)而不需要中斷在另一耳朵播放音樂。另外,即使用戶在步驟530選擇了混合選項或在步驟520選擇了暫停音樂選項,用戶仍有理由在步驟540還選擇在單聲道中輸出語音名稱。
一旦設(shè)置了所有可聽菜單特征,在菜單導(dǎo)航期間客戶機裝置115、120、125或130就隨時可使用語音名稱。圖6是說明本發(fā)明一實施例中在菜單導(dǎo)航期間可執(zhí)行的步驟的流程圖。
在步驟605將菜單激活。如果菜單總是活動的,則可能不需要激活,在但經(jīng)過一段非激活時間之后一些客戶機裝置115、120、125或130會使菜單休眠。一般,通過按壓導(dǎo)航控制件使菜單停止休眠。導(dǎo)航控制件可包括撥號盤、按鈕、觸摸屏或任何其他便利的輸入機構(gòu)。導(dǎo)航控制件可呈現(xiàn)在客戶機裝置115、120、125或130上,或通過遠程控制來實現(xiàn)。應(yīng)知,許多遠程控制件沒有任何可視顯示,如果在客戶機裝置115、120、125或130上必須使用可視顯示,則菜單導(dǎo)航會變得不方便。
一旦激活,媒體管理系統(tǒng)200在步驟610選擇確定菜單組件是否已突出顯示了充分的時間。用戶翻滾菜單組件并聽到各菜單組件開始的語音名稱,只是被下一菜單組件的語音名稱打斷,然后又被下一菜單組件的語音名稱打斷,這可能很令人煩擾。最好是,媒體管理系統(tǒng)200具有較短的延遲,使得用戶沒有這種煩擾就可以快速地翻滾各種選項。在615,媒體管理系統(tǒng)200等待直到用戶停止翻滾菜單組件,并在單個菜單組件上暫停足夠的時間以允許在620播放語音名稱。這段時間不需要太長,一般不超過幾秒,甚至可以是幾分之一秒。
在625,用戶則具有導(dǎo)航到新菜單組件并重新開始處理的選擇權(quán)??赏ㄟ^滾動,或者如果當(dāng)前突出顯示的菜單組件導(dǎo)向另一級菜單,則通過選擇當(dāng)前菜單組件來實現(xiàn)導(dǎo)航。或者,如果用戶簡單地停止對菜單導(dǎo)航,或進行沒有導(dǎo)向更多菜單選項(例如,播放歌曲)的菜單組件選擇,該處理可結(jié)束。
一般,本發(fā)明的方法可以在軟件和/或硬件中實現(xiàn)。例如,它們可以在操作系統(tǒng)、在單獨的用戶處理、在綁定到應(yīng)用程序中的庫程序包或在特別構(gòu)造的設(shè)備中實現(xiàn)。在本發(fā)明特定實施例中,本發(fā)明的方法采用軟件(例如操作系統(tǒng)和/或運行在操作系統(tǒng)上的應(yīng)用程序)實現(xiàn)。
本發(fā)明技術(shù)的軟件或軟件/硬件混合實現(xiàn)可以實現(xiàn)在由存儲在存儲器中的計算機程序選擇性激活或重新配置的通用可編程設(shè)備上。在備選實施例中,本發(fā)明的方法可實現(xiàn)在通用網(wǎng)絡(luò)主機例如個人計算機、工作站或服務(wù)器上。而且,本發(fā)明可至少部分實現(xiàn)在通用計算裝置上。
現(xiàn)在參考圖7,適于實現(xiàn)本發(fā)明技術(shù)的計算裝置700包括主中央處理器(CPU)705、接口710、存儲器715和總線720。當(dāng)在適當(dāng)?shù)能浖蚬碳目刂葡鹿ぷ鲿r,CPU 705可以負責(zé)實現(xiàn)與期望的計算裝置的功能相關(guān)聯(lián)的特定功能。優(yōu)選是,CPU 705在包括操作系統(tǒng)(例如,Mac OSX)和任何適合的應(yīng)用軟件(例如,iTunes)的軟件的控制下完成所有這些功能。
CPU 705可包括一個或多個處理器,例如來自摩托羅拉微處理器族或MIPS微處理器族的那些處理器。在備選實施例中,特別設(shè)計處理器作為控制計算裝置700的操作的硬件。
通常提供接口710作為接口卡。一般來說,它們控制通過網(wǎng)絡(luò)發(fā)送和接收數(shù)據(jù)包并且有時支持與計算裝置700一起使用的其他外圍設(shè)備??商峁┑慕涌诎ㄒ蕴W(wǎng)接口、幀中繼接口、電纜接口、DSL接口、令牌環(huán)接口等等。另外,可以提供各種超高速度接口,例如高速以太網(wǎng)接口、十億比特以太網(wǎng)接口、ATM接口、HSSI接口、POS接口、FDDI接口、ASI接口、DHEI接口、Firewire接口、USB接口等等。一般來說,這些接口可包括適于與適當(dāng)?shù)拿襟w通信的端口。在某些情況下,它們還可包括獨立處理器以及,在一些情況下,易失性RAM。
不管計算裝置的配置,可使用一個或多個配置用于儲存數(shù)據(jù)、程序指令和/或與本文描述的技術(shù)的功能性有關(guān)的其他信息的存儲器或存儲模塊(例如,存儲器715)。例如,程序指令可控制操作系統(tǒng)和/或一個或多個應(yīng)用程序的操作。
因為可使用這種信息和程序指令來實現(xiàn)本文描述的系統(tǒng)/方法,所以本發(fā)明涉及包括程序指令、狀態(tài)信息等用于執(zhí)行本文描述的各種操作的可讀媒體的設(shè)備(例如,計算機)。機器可讀媒體的例子包括但不限于例如硬盤、軟盤和磁帶的磁性媒體;例如CD-ROM光盤的光學(xué)媒體;例如光磁軟盤的磁光媒體;以及特別配置以存儲程序指令的硬件裝置,例如只讀存儲器裝置(ROM)和隨機存取存儲器(RAM)。本發(fā)明還可嵌入在通過適當(dāng)?shù)拿襟w例如電波、光纜、電線等傳播的載波中。程序指令的例子包括機器代碼、例如由編譯器產(chǎn)生的機器代碼以及可由計算機(例如,使用解釋器)執(zhí)行的較高級代碼。
雖然本文示出并描述本發(fā)明的說明性實施例和應(yīng)用,但是許多變化和修改是可能的,它們保持在本發(fā)明的概念、范圍和精神之內(nèi),在熟讀本應(yīng)用之后,這些變化對本領(lǐng)域技術(shù)人員而言是顯見的。例如,術(shù)語“滾動”和“突出顯示”用于菜單的上下文時,并不局限于它們的字面解釋??梢杂靡粋€菜單組件替換上一菜單組件在單線上“滾動”菜單選項。同樣地,即使菜單選項是斜體、粗體或以著重號列出,也可“突出顯示”該菜單選項。因此,所呈現(xiàn)的實施例認為是說明性的而非限制性的,并且本發(fā)明不局限于本文所給出的細節(jié),而是可在所附權(quán)利要求的范圍和等效物內(nèi)修改。
權(quán)利要求
1.一種用于提供可聽菜單的方法,包括在服務(wù)器上設(shè)置正文串,每個正文串能代表一個菜單選項;生成音頻文件,每個音頻文件代表所述正文串之一的語音名稱;將各所述音頻文件和與其對應(yīng)的正文串相關(guān)聯(lián);將所述音頻文件從服務(wù)器傳送到客戶機;在包括由所述正文串代表的菜單選項的所述客戶機上呈現(xiàn)菜單,所述菜單選項能被突出顯示或選擇;當(dāng)關(guān)聯(lián)的菜單選項被突出顯示時,在所述客戶機上播放所述音頻文件。
2.如權(quán)利要求1所述的方法,還包括提供可通過所述客戶機上的所述菜單來導(dǎo)航的遠程控制。
3.如權(quán)利要求1所述的方法,其中所述語音名稱采用非英語的語言。
4.如權(quán)利要求1所述的方法,其中所述客戶機能夠播放音樂;以及在播放音樂時播放所述音頻文件并不停止所述音樂的播放。
5.如權(quán)利要求4所述的方法,其中所述客戶機至少在兩個聲道中生成音頻輸出;以及僅通過一個聲道輸出所述音頻文件。
6.如權(quán)利要求5所述的方法,其中恰好有兩個聲道用于所述客戶機的音頻輸出,所述兩個聲道是左聲道和右聲道。
7.如權(quán)利要求4所述的方法,其中在播放音樂時所述音頻文件與所述音樂混合。
8.一種在服務(wù)器計算機上創(chuàng)建音頻表達而用于客戶機裝置的方法,包括提供正文串;生成作為所述正文串的音頻表達的音頻文件;將所述音頻文件傳送到客戶機裝置。
9.如權(quán)利要求8所述的方法,其中所述正文串屬于菜單組件,因此所述菜單組件是可從所述客戶機裝置上顯示的菜單中選擇的若干選項之一。
10.如權(quán)利要求8所述的方法,其中所述客戶機裝置是媒體播放器,且所述正文串屬于媒體項。
11.如權(quán)利要求8至10中任一權(quán)利要求所述的方法,還包括播放所述音頻文件;以及在將所述音頻文件傳送到客戶機裝置之前,請求認可所播放的音頻文件。
12.如權(quán)利要求11所述的方法,其中通過一個文本/話音轉(zhuǎn)換算法來實現(xiàn)所述音頻文件的生成。
13.如權(quán)利要求12所述的方法,其中如果未得到認可,則提供修改所述正文串的機會;以及如果修改了所述正文串,則用根據(jù)所修改的正文串生成的新音頻文件替換所述音頻文件;播放音頻文件;以及請求認可所播放的音頻文件。
14.如權(quán)利要求13所述的方法,其中如果所述正文串未被修改,則提供用從錄音生成的新音頻文件替換所述音頻文件的機會。
15.如權(quán)利要求8至10中任一權(quán)利要求所述的方法,其中所述音頻文件的生成至少包括所述音頻文件的壓縮。
16.如權(quán)利要求8至10中任一權(quán)利要求所述的方法,其中所述音頻文件的傳送包括在元數(shù)據(jù)中嵌入所述音頻文件。
17.如權(quán)利要求8至10中任一權(quán)利要求所述的方法,還包含確定所述音頻文件是否呈現(xiàn)在所述客戶機裝置上;其中,僅當(dāng)所述音頻文件未呈現(xiàn)在所述客戶機裝置上時才執(zhí)行所述音頻文件的傳送。
18.一種服務(wù)器,包括處理器;以及在操作上與所述處理器連接的存儲器;其中,所述處理器可用來執(zhí)行指令,所述指令包括提供代表菜單組件的正文串,從而所述菜單組件是可從客戶機裝置上的菜單中選擇的若干選項之一;生成作為所述菜單組件的音頻表達的音頻文件;將所述音頻文件傳送到客戶機裝置。
19.一種在菜單中使用音頻文件的方法,包括從服務(wù)器接收作為菜單組件的音頻表達的音頻文件,從而所述菜單組件是可選自所述菜單的若干選項之一;更新所述菜單以包括所述菜單組件;以及當(dāng)所述菜單組件被突出顯示時,播放所述音頻文件。
20.如權(quán)利要求19所述的方法,其中所述菜單包括還未被所述服務(wù)器接收的菜單組件;以及預(yù)裝音頻文件與還未被所述服務(wù)器接收的所述菜單組件相關(guān)聯(lián)。
21.如權(quán)利要求19所述的方法,其中僅在所述菜單組件已被突出顯示一段預(yù)定時間之后播放所述音頻文件。
22.一種客戶機裝置,包括處理器;以及在操作上與所述處理器連接的存儲器;其中,所述處理器可用來執(zhí)行包括以下操作的指令從服務(wù)器接收作為正文串的音頻表達的音頻文件;在所述存儲器中存儲與相應(yīng)的正文串相關(guān)聯(lián)的所述音頻文件;以及在所述相應(yīng)的正文串被顯示時播放所述音頻文件。
23.一種媒體管理系統(tǒng),包括存儲媒體文件的媒體數(shù)據(jù)庫;包含與媒體文件分組有關(guān)的數(shù)據(jù)的媒體集合記錄;包含與所述媒體文件有關(guān)的元數(shù)據(jù)的媒體記錄;存儲音頻文件的語音名稱數(shù)據(jù)庫;以及將所述音頻文件與所述媒體集合記錄中的數(shù)據(jù)和所述媒體記錄中的元數(shù)據(jù)相關(guān)聯(lián)的字符串關(guān)聯(lián)記錄。
24.如權(quán)利要求23所述的媒體管理系統(tǒng),其中所述媒體管理系統(tǒng)在便攜式數(shù)字音樂播放器上運行。
全文摘要
公開了一種語音信息系統(tǒng)。本發(fā)明一般地適用于可更新的音頻信息(例如、菜單)。雖然裝置可能有一些預(yù)裝的菜單組件,但是也可從服務(wù)器接收其他的菜單組件。每個菜單組件,不管它是原有的或接收自服務(wù)器的,均具有相關(guān)的語音名稱。當(dāng)用戶突出顯示菜單選項時,語音名稱可被播放。于是用戶擁有選擇該菜單選項或翻滾到新菜單選項的選擇權(quán)。這樣,用戶無須實際看著菜單的可視顯示屏就可以對菜單導(dǎo)航,這可能對于不能看到可視顯示屏的用戶或有視力障礙的用戶特別有用。
文檔編號G06F3/033GK1849579SQ200480026208
公開日2006年10月18日 申請日期2004年5月25日 優(yōu)先權(quán)日2003年7月18日
發(fā)明者A·B·比曼 申請人:蘋果電腦公司