專利名稱:進行帶可選語音到文本轉換的電話會議的方法和系統的制作方法
技術領域:
本發明一般地涉及通信,更具體而言,涉及用于進行電話會議的方法和系統。
背景技術:
現代商業實踐常常需要若干人在電話上接觸來參加電話會議。電話會議已引入了某些應用和技術,其優于會議中人們物理上位于相同位置的情形。例如,當時并未積極參與的電話會議參與者可能希望減弱音頻輸出,而僅僅收聽電話會議。這種靈活性允許特定參與者在關注另一事務的同時,例如在與另一方談話時,有選擇地參與該電話會議。
但是,在進行次要任務的同時,尤其是進行需要聽或說的那些任務時,在實際監視電話會議中仍然有很大的障礙。例如,減弱音頻輸出并收聽電話會議的參與者在與第二方談話或收聽該電話會議中可能有困難。
發明內容
根據本發明的一個實施例,提供了一種在兩個或更多參與者之間進行電話會議的方法。該方法包括從參與者接收文本請求的指示。該方法還包括響應于所述指示,將所述電話會議的其他參與者的任何語音轉換成文本。所述方法還包括將所述文本發送到與請求文本的所述參與者相關聯的設備。所述設備可操作來顯示所述文本。
本發明的一些實施例提供許多技術優點。一些實施例可從這些優點中的某些、不從這些優點或從所有這些優點受益。例如,根據一個實施例,向被動參與者提供了電話會議的文本,這允許該被動參與者在進行第二任務的同時,視覺監視電話會議。這樣一種選擇允許被動參與者在與第二方會談的同時通過閱讀來監視電話會議,而不是被強迫來收聽多方并試圖來恰當地響應。根據另一個實施例,向被動參與者提供發言者的身份,由此允許被動參與者在進行第二任務的同時有選擇的參與。有選擇地參與電話會議的能力,允許被動參與者更關注其他任務,這增加了被動參與者的工作效率。
本領域技術人員可以很容易確定其他技術優點。
現在結合附圖來參考以下說明,所述附圖中類似的標號指示類似的元件,其中圖1是圖示可能從本發明的教導受益的通信網絡的示意圖;圖2是圖示圖1的通信網絡的多個部分的示意圖,所述多個部分包括根據本發明一個實施例用于進行電話會議的系統;圖3是圖示根據本發明一個實施例的圖2的會議橋和語音到文本引擎的示意圖;和圖4是圖示用于利用根據本發明一個實施例的圖2的系統來進行電話會議的方法的流程圖。
具體實施例方式
通過參考附圖中的圖1至4來最好地理解本發明的實施例,類似的標號被用于各個附圖中類似和相應的部分。
圖1圖示了可能從本發明的教導受益的通信系統12。在本實施例中,通信系統12是在源和目的端點之間傳輸音頻、視頻、語音、數據以及其他合適類型的實時和非實時流量的分布式系統;但是,傳輸任何形式流量的其他通信系統也可以從本發明的教導受益。通信系統12包括連接到網絡14的多個通信設備16,以及通過網關20和公共交換電話網絡(“PSTN”)22連接到網絡14的多個模擬電話18。通信設備16、模擬電話18和網關20通過以下鏈路連接到網絡14和/或PSTN 22雙絞線、電纜、光纖、射頻、紅外、微波或任何其他合適類型或組合的有線或無線鏈路28。
在一個實施例中,網絡14是因特網、廣域網(“WAN”)、局域網(“LAN”)或其他合適網絡。在因特網實施例中,網絡14以因特網協議(“IP”)分組來傳輸信息。電話語音信息以IP語音(“VoIP”)格式來傳輸。諸如VoIP分組之類的實時IP分組被封裝在實時傳輸協議(“RTP”)分組中以在網絡14上傳輸。網絡14可以包括任何其他合適類型的元件和鏈路,在所述鏈路上可以使用其他協議和格式來以其它方式合適地傳輸流量。
通信設備16包括諸如IP電話16A(在圖2中示出,在下面討論)之類的IP或其他數字電話、諸如個人計算機16B(在圖2中示出,在下面討論)之類的個人和其他合適的計算機或計算設備、諸如個人數字助理(“PDA”)之類的電子個人組織器、或其他合適類型的通信設備。通信設備16還可以包括能夠傳遞實時音頻、視頻和/或其他信息,并能夠通過網絡14與其他設備或設備集一起參加會議的蜂窩或其他移動電話或手機或任何其他合適的通信設備或設備集,其例子是模擬電話18和網關20的組合。通信設備16還可以包括顯示文本消息的屏幕,例如IP顯示器16C(在圖2中示出,在下面討論)。除了傳遞實體信息之外,通信設備16還與網絡14傳遞控制信息,以控制呼叫設置、掛斷和處理,以及呼叫服務。
對于語音呼叫,通信設備16包括一個或多個實時應用,這些應用在接收到流量或基本接收到流量時播放該流量。可以利用編碼/解碼器(“codec”,未明確示出)來將以下信號從模擬信號轉換成數字形式用戶所產生的音頻、視頻或其他信號,例如來自用戶對電話機所說的話。數字編碼的數據被封裝到IP或其他合適的分組,以在網絡14上傳輸。從網絡14接收到的IP分組被轉換回模擬信號并對用戶播放。通信設備16可以以其它方式合適地編碼、解碼、壓縮和解壓縮在網絡14上傳輸或從網絡14接收的信號。
網關20提供模擬和/或數字格式之間的轉換。模擬電話18通過PSTN22向網關20傳遞標準電話信號。在網關20處,標準電話信號被轉換成VoIP格式的IP分組。類似地,從網絡14所接收的VoIP分組被轉換成標準電話信號,以通過PSTN 22傳送到模擬電話18。網關20還在IP網絡呼叫控制系統以及在PSTN 22中使用的ISDN、T1、CAS和其他信令協議之間進行轉換。
在一個實施例中,呼叫管理器30和會議橋32被連接到網絡14。呼叫管理器30和會議橋32可以位于中心設備中,或者使其功能分布于網絡14或其外圍設備。呼叫管理器30和會議橋32通過任何合適類型的有線或無線鏈路28耦合到網絡14。在另一個實施例中,網絡14可以在沒有呼叫管理器30的情況下工作,其中通信設備16可以彼此或者與其他合適的網絡元件直接傳遞控制信息。在此實施例中,由通信設備16和/或其他合適的網絡元件提供服務。
呼叫管理器30管理網絡14中的呼叫。呼叫是兩個或多個端點之間的任何通信會話。端點可以是人和/或諸如電話或計算機之類的設備。會話可以包括實時連接、具有實時特性的連接、非實時連接和/或連接類型的組合。
呼叫管理器30響應于來自通信設備16的服務請求,包括通過網關20來自模擬電話18的服務請求。例如,呼叫管理器30可以為通信設備16提供語音郵件、橋接、群播、呼叫保持、電話會議和其他多方通信以及/或者其他合適的服務。呼叫管理器30通過以下方式來提供服務實際進行服務、控制服務的進行、委托服務的進行、和/或以其它方式啟動服務。
會議橋32在通信設備16之間提供電話會議以及其他合適的音頻、視頻和/或實時多方通信會話。多方通信會話包括交換音頻和/或其他合適信息的兩方或多方。具體而言,會議橋32接收來自參與的通信設備16的媒體,并使用合適的信號處理技術來混和來自每個參與的通信設備16的媒體,以生成會議輸出流。在正常操作期間,各通信設備16接收這樣的會議輸出流,其包括來自所有其他參與的通信設備16的貢獻。
在一個實施例的操作中,當呼叫被置于網絡14上時首先向呼叫管理器30發送呼叫啟動請求。例如,呼叫啟動請求可以由通信設備16和/或用于模擬電話18的網關20生成。一旦呼叫管理器30接收到該呼叫啟動請求,呼叫管理器30就向想要呼叫目的設備的啟動通信設備16和/或用于模擬電話18的網關20發送控制信號。如果目的設備可以接受該呼叫,則目的設備答復呼叫管理器30其將接受該呼叫。通過接收到此承諾,呼叫管理器30向目的設備傳輸信號使其響鈴。當該呼叫被應答時,呼叫管理器30指示被呼叫的設備和發起的設備開始向彼此發送媒體流。如果發起設備是模擬電話18,那么媒體流就發生在網關20和目的設備之間。網關20隨后將媒體傳輸到模擬電話18。
在一個實施例中,對于電話會議,呼叫管理器30基于被呼叫的號碼或其他合適準則來識別參與者。參與者是電話會議所涉及的任一方。在一個實施例中,呼叫管理器30控制會議橋32來設置、處理和掛斷電話會議以及其他多方通信會話。在另一個實施例中,會議橋32設置、處理和掛斷電話會議以及其他多方通信會話。在多方通信會話期間,參與者被連接到會議橋32,并且使媒體通過會議橋32流動。在一個實施例中,混和媒體以生成要被傳輸到各參與者的會議輸出流。參與者的會議輸出流包括所有其他參與者的媒體、其他參與者的子集、或由參與者和/或多方會話的類型所要求的其他合適的混和。
涉及在諸如網絡14之類的網絡上的音頻通信的傳統電話會議中的任何參與者,可以選擇作為該電話會議的被動參與者。被動參與者是希望部分或完全不向電話會議提供輸入的任何參與者。采用這樣一種選擇的原因可能是要應答另一個呼叫、與同事談話、看新聞、或可以在監視電話會議的同時進行的任何其他任務。有許多被動參與電話會議的方法。例如,被動參與者可以減弱他/她的音頻輸出并僅僅收聽電話會議。被動參與者還可以保持該電話會議。在關注另一事務的同時監視電話會議的靈活性增加了被動參與者的工作效率。但是,某些任務難以與聽覺監視電話會議同時進行。例如,正在聽覺監視電話會議的被動參與者可能發現難以參與同另一方的第二談話,因為收聽兩個不同方會產生混亂和理解的隔閡。在這種情況下,聽覺監視電話會議、第二談話、或者這兩者的質量都可能變差。
根據本發明的教導,用于進行電話會議的方法和系統包括向被動參與者提供電話會議的基本實時的文本流。這是有益的,因為被動參與者可能發現在進行另一任務的同時,使用視覺要比使用聽覺更容易監視電話會議。可以在音頻信號之外或代替音頻信號來提供這樣的文本。根據本發明的另一個實施例,這樣的文本可以被提供給也主動參與電話會議的參與者。下面結合圖2至4來更詳細地描述該系統和方法的示例實施例的其他細節。
圖2是圖示圖1的通信網絡的多個部分的示意圖,所述多個部分包括根據本發明的一個實施例進行電話會議的系統。會議橋32有助于在IP網絡14上參與電話會議的通信設備16之間的通信。可從Cisco Systems得到名為“Cisco會議連接”的會議橋32的示例。會議橋32被耦合到語音到文本引擎46。語音到文本引擎46的示例可從IBM和Microsoft得到。或者,可以使用一般提供比語音到文本引擎更有限的語法能力的自適應語音識別系統,以及將語音轉換成文本的現有或還未開發的任何其他合適設備。自適應語音識別系統的一個示例可從Nuance得到。語音到文本引擎46可以是會議橋32的一個組成部分或獨立于會議橋32的單獨組件。通信設備16通過鏈路28和IP網絡14被鏈接到會議橋32。由通信設備16傳輸的參與者的語音,通過鏈路28被發送到IP網絡14上的會議橋32。會議橋32恰當地轉換并混和來自各通信設備16的語音,并將所得到的會議輸出流發送到各通信設備16。語音到文本引擎46內的資源可以與會議橋32同時被保存,或者在其他合適時間被保存。
當參與者希望被動地參與電話會議或希望接收文本時,參與者傳輸文本請求的指示。參與者可以通過例如按下通信設備16上的“保持”按鈕或“減弱”按鈕或其他合適按鈕來做出這樣的請求。或者,可以通過合適的“軟按鈕”或其他合適技術來做出這樣的請求。在一個示例中,傳輸指示文本請求的“信息元素”(IE)。當通信設備16在抑制輸出的語音,或者當與通信相關聯的用戶僅僅希望在接收或不接收音頻的情況下看到文本時,可以從通信設備16傳輸文本請求的指示。響應于接收到指示文本請求的信息元素,會議橋32將來自通信設備16的語音發送到語音到文本引擎46。語音到文本引擎46將語音轉換成文本表示,并將文本發送回會議橋32。接著,會議橋32將文本發送到之前傳輸文本請求的通信設備16。下面結合圖3提供關于會議橋32和語音到文本引擎46的其他細節。在其他實施例中,通信設備16可以繞過會議橋32直接向語音到文本引擎46發送音頻。
在另一個實施例中,IP電話16a如上所述接收到文本請求的指示,但并不將這樣的指示發送到會議橋32,而是將接收自會議橋32的任何語音直接傳輸到具體與IP電話17相關聯的相關聯語音到文本引擎,例如語音到文本引擎146。語音到文本引擎146隨后將所接收的語音轉換到文本,并將文本提供回給IP電話16a。這樣,可以在不要求會議橋維持知道哪些參與者在請求文本的必要功能的情況下,將語音轉換到文本。
在一個實施例中,被動參與者可以使用具有文本顯示屏17的IP電話16a。當被動參與者使IP電話16a調用接收文本的特征時,會議橋32就將電話會議的文本傳輸到IP電話16a。接著,IP電話16a將文本顯示到文本顯示屏17上。請求文本的參與者在參與另一談話的同時,可以通過閱讀由文本顯示屏17所顯示的文本來監視電話會議。在請求文本的參與者是被動參與者的示例中,當被動參與者希望恢復主動參與電話會議時,被動參與者可以通過請求IP電話16a向會議橋32傳輸請求停止接收文本的指示,來調用停止文本特征。在一個示例中,通過放開參與者的通信設備16上的“減弱”或“保持”按鈕可以發起這樣的請求。在進入的語音被抑制的實施例中,響應于請求停止接收文本的指示,會議橋32恢復將會議輸出流傳輸到發起該請求的通信設備16,并停止傳輸相關聯的文本。或者,在進入的語音未被抑制的實施例中,停止接收文本的請求僅僅停止接收文本。
在一個實施例中,會議橋32可以傳輸電話會議的各發言參與者的身份。在另一個實施例中,會議橋32可以向IP電話16a傳輸會議輸出流、文本以及與文本相關聯的參與者的身份。取決于被動參與者所表達的需要,會議輸出流、文本和/或參與者的身份每一種自身或者任何的組合,都可以由會議橋32傳輸到任何的通信設備16。在另一個實施例中,當其他參與者中的某一個在發言時,被動參與者可以收到提醒。在另一個實施例中,會議橋32可以生成伴隨文本的時間戳,這里該時間戳將文本關聯到各參與者的語音和/或會議輸出流。例如,時間戳可以包括會議橋32接收到各參與者的語音時的時間。本領域技術人員將能夠確定將文本關聯到各參與者的語音和/或會議輸出流的不同方法。在另一個實施例中,IP電話16a可以使用耦合到IP電話16a的存儲介質19來記錄文本、發言者的身份、時間戳和/或會議輸出語音流。存儲設備19也可以連接到網絡14,而不是與某個電話相關聯。
在一個實施例中,通過網關20使用模擬電話18來參與電話會議的被動參與者或者其他請求文本的參與者,也可以包括個人計算機16b來監視電話會議。個人計算機16b可以耦合到模擬電話18或者位于模擬電話18附近,以使得參與者可以通過個人計算機16來監視電話會議,并取決于參與者的需要來訪問模擬電話18以主動參與電話會議。一旦通過使用模擬電話18或個人計算機16b將特征調用傳輸到會議橋32,會議橋32就可以通過以下來響應,即取決于被動參與者所表達的需要,將文本、各發言參與者的身份、會議輸出流和/或時間戳每一種自身或者任何的組合,傳輸到個人計算機16b。
在一個實施例中,被動參與者或其他請求文本的參與者可以選擇使用耦合到個人計算機16b或連接到網絡14的存儲介質19,來記錄文本和/或時間戳和/或身份和/或會議輸出流。在另一個實施例中,可以使用IP電話16a的存儲介質19來記錄這些。在另一個實施例中,存儲可以發生在中心站點。可以組合使用模擬電話18和個人計算機16b來向參與者提供與IP電話16a相同的選擇。例如,模擬電話18可以用來主動參與電話會議,而個人計算機16b用來記錄進入的數據并監視電話會議。一旦向會議橋32傳輸了指示參與者希望在電話會議中停止接收文本的請求,模擬電話18就又通過網關20從會議橋32接收會議輸出流。在被動參與者的情況下,通過放開通信設備16上的“減弱”或“保持”按鈕或與被動參與者相關聯的其他合適按鈕,這樣的請求可以有效。如上所述,在一個實施例中用戶可以在沒有抑制語音分組的情況下同時接收到語音和文本兩者。
在一個實施例中,IP顯示器16c可以接收電話會議的發言參與者的身份。監視IP顯示器16c上的發言參與者的身份,允許被動參與者或其他請求文本的參與者在某個發言者開始在電話會議中發言時,使用通信設備16來有選擇地參與電話會議。可以結合IP電話16a、模擬電話18或其他通信設備來使用IP顯示器16c,以允許參與者監視發言參與者的身份。IP顯示器16c還可以顯示由會議橋32發送的文本。
在一個實施例中,IP顯示器16c通過系統目錄21與IP電話1 7相關聯。系統目錄21可以包括傳統用于網絡中的認證目的的訪問信息,但在此實施例中包括將IP顯示器16c與IP電話16a相關聯的信息。這樣,無論何時要將數據發送到IP電話16a,會議橋32都知道替代地將數據發送到IP顯示器16c。在此實施例中IP顯示器16c和IP電話16a具有不同的IP地址。這種關聯可以響應于用戶選擇IP顯示器16c來接收文本的指示而發生,或者可以響應于確定IP電話不具有相關聯的顯示器而由會議橋32自動進行。如果會議橋32確定IP電話16a不具有相關聯的顯示器,那么會議橋32還可以從IP電話16a請求另一個屏幕來向其發送文本。
在一個實施例中,會議橋32可以使用加密引擎33來加密任何輸出的數據。加密引擎33可以是會議橋32的組成部分或者獨立于會議橋32。
系統24提供了這樣的技術優點,即在進行其他任務的同時提供監視電話會議的其它方法。取決于其它任務的性質,被動參與者可以選擇通過閱讀文本、發言者的身份,或在接收文本的同時收聽發言者,或記錄所有進入數據以在以后回顧,或者通過這些的任何組合,來監視電話會議。例如,如果其它任務是參與同另一方的談話,被動參與者可以選擇通過閱讀電話會議的文本并以較低的音量來收聽相應的會議輸出流,來監視電話會議。
圖3圖示了根據本發明一個實施例的會議橋32的細節。在此實施例中,會議橋32被耦合到語音到文本引擎46。會議橋32提供兩或多個參與者之間的實時多方音頻連接。會議橋32可以在不偏離本發明的范圍的情況下支持其他類型的合適的多方通信會話,包括實時視頻流。
會議橋32包括控制器50、緩沖器52、數字信號處理器53、混和器58和數據庫60,數字信號處理器53包括代碼轉換器54、增益控制單元55、定時單元57和濾波器59。會議橋32的控制器50、代碼轉換器54、增益控制單元55、定時單元57、濾波器59和混和器58,以及通信系統12的其他合適組件,可以包括在介質中編碼的邏輯。邏輯包括用于執行所編程任務的功能指令。介質可以包括計算機磁盤或其他合適的計算機可讀介質、專用集成電路(ASIC)、現場可編程門陣列(FPGA)或其他合適的專用或通用目的處理器、傳輸介質、或可在其中編碼并使用邏輯的其他合適介質。在此示例中,通過數字信號處理器53來實現代碼轉換器54、增益控制單元55、定時單元57和濾波器59。
緩沖器52包括輸入和輸出緩沖器。輸入緩沖器接收并緩沖來自通信設備16的輸入音頻流的分組,以由會議橋32來處理。輸出緩沖器接收并緩沖由會議橋32和/或語音到文本引擎46所產生的會議輸出流和/或會議輸出流的文本形式(文本),以傳輸到通信設備16,通信設備16包括例如IP電話16a、個人計算機16b和IP顯示器16c。
數字信號處理器53內的代碼轉換器54包括輸入和輸出代碼轉換器。輸入代碼轉換器54從相應的緩沖器52接收輸入音頻流,并將該音頻流從通信設備16的壓縮格式轉換成會議橋32的未壓縮格式,以在會議橋32或語音到文本引擎46中混和和處理。在一個示例中,未壓縮格式指的是表示原始、未壓縮的語音或數據的G.711格式,而壓縮格式指的是表示壓縮語音的G.729格式。相反,代碼轉換器54接收未壓縮格式的會議輸出流,并將會議輸出流轉換成各參與者的通信設備16以及被動參與者的通信設備16的壓縮格式。這樣,會議橋32允許參與者使用各種設備和技術來參與電話會議。
增益控制55為會議橋32的各個組件提供增益控制。定時單元57控制與會議橋32的各個組件相關聯的定時。濾波器59為會議橋32提供濾波能力。在此示例中,這些組件中的每一個都如所示地通過數字信號處理器53來實現。
混和器58包括多個求和器或其他合適的信號處理資源,每個都可操作來將多個輸入音頻流求和、相加或組合成用于參與電話會議的通信設備16的會議輸出流。一旦混和器58已生成了會議輸出流,那么就可以取決于是否曾從參與者接收到文本請求的指示,而將會議輸出流路由到語音到文本引擎46。會議輸出流由相應的代碼轉換器54轉換,并由相應的輸出緩沖器52緩沖,以傳輸到相應的通信設備16。
數據庫60包括用于會議橋32的各個正在進行的電話會議的一組會議參數62。各個電話會議的會議參數62包括對電話會議的參與者64的標識。在一個實施例中,在電話會議開始時基于呼叫者ID、電話號碼、IP地址或其他合適的標識符來識別相應通信設備16的參與者。進入的媒體流的每個分組可以直接或間接地識別相關聯的參與者,或者可以提供對參與者身份的其他合適指示。在一個實施例中,來自各通信設備16的每組分組可以包含與特定通信設備16相關聯的參與者的IP地址。接著,會議橋32可以向被動參與者或者向以其它方式請求文本的參與者,發送特定參與者身份的指示,同時發送或不發送該參與者的語音或語音的文本版本。
控制器50指示會議橋32的其他組件,并在一個實施例中與呼叫管理器30通信來設置、處理和掛斷電話會議。控制器50還可以或者直接從通信設備16或者通過呼叫管理器30接收希望接收文本的指示。可以在頻帶內與音頻流一起或在頻帶外的控制鏈路或信道上,從參與者接收這樣的指示。
響應于希望接收文本的指示,控制器50指示混和器58將進入到混和器58的所有流的組合發送到語音到文本引擎46。一接收到進入流的組合,語音到文本引擎46就將會議輸出流轉換成文本。在轉換之后,語音到文本引擎46將文本發送回會議橋32。會議橋32通過使用恰當的代碼轉換器54和/或緩沖器52,隨后將文本發送到發起文本請求的通信設備16。在一個實施例中,會議橋32將會議輸出語音流與輸出的文本一起發送。在另一個實施例中,會議橋32傳輸存儲在數據庫60中的各參與者的身份64。在另一個實施例中,會議橋32將文本和/或會議輸出流與負責特定發言和/或文本的各參與者的身份64一起傳輸。在另一個實施例中,會議橋32可以生成時間戳來耦合到文本,其中時間戳有助于將文本與語音關聯起來。取決于被動參與者的需要,可以由會議橋32分別或以任何組合提供文本、語音、時間戳和/或身份64。在另一個實施例中,可以使用加密引擎33來加密從輸出緩沖器52傳輸的所有或部分媒體流。在另一個實施例中,端點16直接與語音到文本引擎通信。
圖4示出了根據本發明一個實施例的方法110的流程圖。可以由圖2的系統24利用圖3的會議橋32和語音到文本引擎46,或者由其他系統來實現方法110的一個實施例。方法110開始于步驟80。在步驟82,使用或不使用呼叫管理器30來設置電話會議。會議橋32或呼叫管理器30可以確定電話會議的各參與者的身份64。可以從例如通信設備16的IP地址來做出此確定。在另一個實施例中,用戶登陸到電話會議,此時認證用戶的身份。在步驟84,會議橋32確定是否至少有一個通信設備16在被動參與者的指導下或者在以其它方式指示轉錄文本的請求的指導下正在抑制任何輸出的信號。當參與者的通信設備16觸發了對要傳輸文本的請求時,會議橋32可以做出此確定,所述請求表示參與者請求在抑制或不抑制輸出的語音分組的情況下的文本。用戶可以通過通信設備16上的按鈕、通過軟鍵或通過其他合適技術來表示在抑制或不抑制輸出的語音分組的情況下接收文本的這樣一種要求,以使得被轉錄的文本被發送到通信設備16。
如果會議橋32確定沒有通信設備16在抑制任何輸出的信號或者確定未請求文本,那么會議橋32就在步驟86繼續向各通信設備16發送會議輸出流。在一個實施例中,如果會議橋32從一個或多個通信設備16接收到文本請求,那么會議橋32就在步驟88采取措施將來自各通信設備16的語音轉換成文本。一旦語音被轉換成文本,那么會議橋32就在步驟90將文本發送到發起文本請求的通信設備16。當在通信設備16處接收到文本時,接收文本的參與者就在步驟92監視文本。接收文本的參與者可以在進行另一任務的同時監視文本。方法110在步驟100結束。
在一個實施例中,會議橋32可以在步驟102僅傳輸各發言參與者的身份64,而非相關聯的實際文本。接收文本的參與者隨后在步驟92監視各發言參與者的身份64,以有選擇地參與電話會議。在另一個實施例中,可以在步驟104加密從會議橋32傳輸的所有或部分媒體流。例如,在步驟102處發送身份64之前,會議橋32可以在步驟104使用加密引擎33來加密身份64。在另一個實施例中,在步驟90發送文本和/或會議輸出流和/或身份64之前,加密引擎33可以被用來在步驟104加密文本和/或會議輸出流和/或身份64。在另一個實施例中,會議橋32可以在步驟106生成時間戳并將其耦合到輸出的文本。可以通過使用網絡連接存儲設備來記錄語音分組或轉錄文本,網絡連接存儲設備指被連接到網絡的中央存儲站點;但是,在一些實施例中,在本地記錄這樣的信息可能是有益的,例如在IP電話16a的存儲介質19中,如步驟108所圖示。
以上詳細描述的方法和系統對于在執行另一任務的同時進行電話會議的難題提供了一種解決方案。本發明的一些實施例的好處在于,參與者可以根據其它任務的性質來選擇監視電話會議的方法。
雖然已經詳細描述了本發明,但是應該理解到可以向其做出各種變化、替代和改變,而不偏離如權利要求所限定的本發明的精神和范圍。
權利要求
1.一種在兩個或多個參與者之間進行電話會議的方法,包括從所述電話會議的參與者接收文本請求的指示;響應于來自所述參與者的所述指示,將所述電話會議的其他參與者的任何語音轉換成文本;以及將所述文本發送到與從其接收到所述文本請求的指示的所述參與者相關聯的設備,所述設備可操作來顯示所述文本。
2.如權利要求1所述的方法,還包括將所述電話會議的各參與者的身份發送到所述設備,其中所述身份與關聯到各參與者的所述語音的所述文本相關聯。
3.如權利要求1所述的方法,還包括加密所述文本。
4.如權利要求1所述的方法,還包括將與所述文本相對應的所述語音發送到所述設備。
5.如權利要求4所述的方法,其中所述文本包括時間戳,所述時間戳將所述文本與對應于所述文本的所述語音關聯起來。
6.如權利要求1所述的方法,還包括在所述設備處記錄所述文本。
7.如權利要求1所述的方法,其中響應于參與者將所述電話會議置于保持而接收到所述文本請求的指示。
8.如權利要求1所述的方法,其中響應于參與者減弱呼叫而接收到所述文本請求的指示。
9.如權利要求1所述的方法,其中所述文本請求的指示包括以下指示,即在與請求文本的所述參與者相關聯的電話上按下按鈕的指示。
10.如權利要求1所述的方法,其中所述文本請求的指示包括以下指示,即按下與請求文本的所述參與者相關聯的軟鍵的指示。
11.如權利要求1所述的方法,其中所述文本請求的指示包括以下指示,即請求文本的所述參與者正在抑制向請求文本的所述參與者傳輸語音媒體分組的指示。
12.如權利要求1所述的方法,其中所述文本請求的指示包括以下指示,即請求文本的所述參與者正在抑制從請求文本的所述參與者傳輸語音媒體分組的指示。
13.如權利要求1所述的方法,還包括將請求文本的所述參與者的任何語音轉換成文本。
14.如權利要求1所述的方法,還包括提醒請求文本的所述參與者所述其他參與者中的特定一個正在發言。
15.一種與多個參與者進行電話會議的方法,包括確定向所述電話會議提供輸入的每個參與者的身份;從所述電話會議的參與者接收文本請求的指示;響應于從所述參與者接收到所述文本請求的指示,當各個其他參與者在發言時,將所述電話會議的所述各個其他參與者的所述身份,發送到與從其接收到所述文本請求的指示的所述參與者相關聯的設備,所述設備可操作來顯示各參與者的所述身份。
16.如權利要求15所述的方法,還包括響應于所述文本請求的指示,將所述電話會議的各個其他參與者的任何語音轉換成文本,并將所述文本發送到所述設備,所述文本與各個參與者的所述身份相關聯。
17.如權利要求16所述的方法,還包括加密所述文本。
18.如權利要求16所述的方法,還包括將與所述文本相關聯的所述語音發送到所述設備。
19.如權利要求18所述的方法,其中所述文本包括時間戳,所述時間戳將所述文本與對應于所述文本的所述語音關聯起來。
20.如權利要求19所述的方法,還包括在所述設備處記錄所述文本和對應于所述文本的所述語音。
21.如權利要求20所述的方法,其中記錄所述文本和語音,包括在所述設備處記錄所述語音和文本。
22.如權利要求20所述的方法,其中記錄所述文本和語音,包括在連接到網絡的中央存儲單元中記錄所述語音和文本。
23.如權利要求15所述的方法,其中響應于參與者將所述電話會議置于保持而接收到所述文本請求的指示。
24.如權利要求15所述的方法,其中響應于參與者減弱呼叫而接收到所述文本請求的指示。
25.如權利要求15所述的方法,其中所述文本請求的指示包括以下指示,即在與請求文本的所述參與者相關聯的電話上按下按鈕的指示。
26.如權利要求15所述的方法,其中所述文本請求的指示包括以下指示,即按下與請求文本的所述參與者相關聯的軟鍵的指示。
27.如權利要求15所述的方法,其中所述文本請求的指示包括以下指示,即請求文本的所述參與者正在抑制向請求文本的所述參與者傳輸語音媒體分組的指示。
28.如權利要求15所述的方法,其中所述文本請求的指示包括以下指示,即請求文本的所述參與者正在抑制從請求文本的所述參與者傳輸語音媒體分組的指示。
29.如權利要求15所述的方法,還包括當請求文本的所述參與者在發言時,向所述設備發送請求文本的所述參與者的所述身份。
30.一種與多個參與者進行電話會議的系統,包括會議橋,所述會議橋可操作來從至少一個所述參與者接收文本請求的指示,并響應于所述指示,向請求文本的所述參與者發送代表一個或多個所述參與者的語音的文本;和被耦合到所述會議橋的語音到文本引擎,所述引擎可操作來將所述一個或多個參與者的所述語音轉換成所述文本,并將所述文本發送到所述會議橋。
31.如權利要求30所述的系統,其中所述會議橋可操作來確定所述電話會議的各個參與者的身份,并將所述身份發送到做出所述文本請求的所述參與者,每個身份與代表各個參與者的所述語音的相對應文本相關聯。
32.如權利要求30所述的系統,還包括被耦合到所述會議橋的加密引擎。
33.如權利要求30所述的系統,其中所述會議橋可操作來將各個參與者的所述語音與所述文本一起發送到請求文本的所述參與者。
34.如權利要求33所述的系統,其中所述會議橋可操作來將時間戳與所述文本耦合,隨后將所述文本發送到請求文本的所述參與者,所述時間戳將所述文本與對應于所述文本的所述語音關聯起來。
35.如權利要求30所述的系統,還包括與所述參與者相關聯的設備,所述設備包括存儲介質。
36.如權利要求35所述的系統,其中所述設備是耦合到因特網協議電話的文本顯示屏。
37.如權利要求35所述的系統,其中所述設備是計算機。
38.如權利要求30所述的系統,其中來自至少一個所述參與者的所述文本請求的指示,還指示所述參與者正在抑制向所述參與者傳輸語音媒體分組。
39.如權利要求30所述的系統,其中所述會議橋和語音到文本引擎每個都可操作來響應于并發保留請求。
40.一種進行電話會議的系統,包括會議管理裝置,所述會議管理裝置用于從至少一個參與者接收文本請求的指示,并響應于所述指示,向請求文本的所述參與者發送代表各個參與者的語音的文本;和被耦合到所述會議管理裝置的語音到文本轉換裝置,所述語音到文本轉換裝置用于將各個參與者的所述語音轉換成所述文本,并將所述文本發送到所述會議管理裝置。
41.如權利要求38所述的系統,還包括這樣的裝置,所述裝置用于將所述電話會議的各個參與者的身份與各個參與者對所述電話會議的輸入相關聯,并將所述身份耦合到相對應的文本,所述裝置被耦合到所述會議管理裝置。
42.如權利要求38所述的系統,還包括用于收聽所述語音的通信裝置,所述通信裝置被耦合到顯示裝置。
43.如權利要求38所述的系統,其中所述會議管理裝置還用于將所述語音傳輸到所述通信裝置。
44.如權利要求41所述的系統,其中所述會議管理裝置還用于將時間戳與所述文本耦合,隨后將所述文本傳輸到所述顯示裝置,所述時間戳將所述文本與對應于所述文本的所述語音關聯起來。
45.如權利要求42所述的系統,還包括用于記錄所述文本和所述語音的存儲裝置,所述存儲裝置被耦合到所述通信裝置。
46.如權利要求38所述的系統,其中來自至少一個所述參與者的所述文本請求的指示,還指示所述參與者正在抑制向所述參與者傳輸語音媒體分組。
47.一種顯示信息的方法,包括從連接到網絡并具有第一地址的因特網協議電話傳輸對數據的請求;以及響應于所述被傳輸的請求,在連接到所述網絡并具有不同于所述第一地址的第二地址的因特網協議顯示器處接收數據。
48.如權利要求47所述的方法,其中所述數據包括文本。
49.如權利要求47所述的方法,還包括將所述因特網協議電話與所述因特網協議顯示器關聯起來。
50.如權利要求49所述的方法,其中所述關聯包括通過連接到所述網絡的系統目錄來將所述因特網協議電話與所述因特網協議顯示器關聯起來。
51.一種在兩個或多個參與者之間進行電話會議的方法,包括在電話處,從使用所述電話的所述電話會議的參與者接收文本請求的指示;響應于所述指示,自動將在所述電話處接收到的任何語音從所述電話傳輸到語音到文本引擎;以及在所述電話處從所述語音到文本引擎接收指示所接收語音的文本。
52.如權利要求51所述的方法,其中響應于參與者將所述電話會議置于保持而接收到所述文本請求的指示。
53.如權利要求51所述的方法,其中響應于參與者減弱呼叫而接收到所述文本請求的指示。
54.如權利要求51所述的方法,其中所述文本請求的指示包括以下指示,即在與請求文本的所述參與者相關聯的電話上按下按鈕的指示。
55.如權利要求51所述的方法,其中所述文本請求的指示包括以下指示,即按下與請求文本的所述參與者相關聯的軟鍵的指示。
全文摘要
根據本發明的一個實施例,提供了一種用于在兩個或多個參與者(16)之間進行電話會議的方法。該方法包括從參與者(16)接收文本請求的指示。該方法還包括響應于所述指示,將所述電話會議的其他參與者的任何語音轉換成文本。所述方法還包括將所述文本發送到與請求文本的所述參與者相關聯的設備。所述設備可操作來顯示所述文本。
文檔編號H04M7/00GK1636384SQ03804197
公開日2005年7月6日 申請日期2003年2月11日 優先權日2002年2月20日
發明者尚塔努·薩卡爾, 拉比士·帕特爾, 什穆埃爾·謝弗 申請人:思科技術公司