專利名稱:元數據的數據結構及其復制方法
技術領域:
本發明涉及用于通過組合存在于客戶機裝置中的運動圖像數據和存在于客戶機裝置或網絡上的服務器裝置中的元數據來實現運動圖像超媒體,以及用于在運動圖像上顯示字幕或氣球形圓圈的元數據的數據結構,并且涉及其復制方法。
背景技術:
超媒體是在例如運動圖像、靜止圖像、音頻與文本的媒體之間定義的稱為超鏈接的連接,并且可以進行相互地或者從一個到另一個的引用。例如,在以HTML描述的可以使用互聯網瀏覽的主頁中,排列了文本和靜止圖片,并且在整個文本和靜止圖片中都定義了鏈接。當鏈接被指定時,有關鏈接目的地的相關信息可以被立即顯示。當有趣的表達被直接指定時,可以對相關信息進行訪問,因此,操作是容易且直觀的。
另一方面,在其中運動圖像而非文本和靜止圖片為主要內容的超媒體中,定義了從出現在運動圖像上的對象例如人或事到用于說明它的相關內容例如文本或靜止圖片的鏈接,當觀看者指定該對象時,相關內容被顯示。這時,為了定義出現在運動圖像上的對象的時空區與其相關內容的鏈接,需要表示運動圖像中對象的時空區的數據(對象區數據)。
關于對象區數據,可能使用具有二進制值或更高值的屏蔽圖像系列,MPEG-4的任意形狀編碼,在專利文獻1(JP-A-2000-285253)中說明的描述圖的特征點軌跡的方法,在專利文獻2(JP-A-2001-111996)中說明的方法,等等。為了實現其中運動圖像為主要內容的超媒體,除了這點之外,需要描述用于在對象被指定時顯示其它相關內容的操作的數據(操作信息)以及類似數據。除了運動圖像之外的這些數據被稱為元數據。
關于向觀看者提供運動圖像和元數據的方法,首先,有產生運動圖像和元數據都記錄在其中的記錄介質(視頻CD、DVD等)的方法。此外,為了提供已經被擁有為視頻CD或DVD的運動圖像的元數據,只有元數據可以從網絡下載或者通過流傳送。而且,運動圖像的數據和元數據兩者都可以通過網絡傳送。這時,期望元數據具有能夠有效使用緩沖器、適于隨機訪問且能防止網絡中數據丟失的格式。
在其中運動圖像的轉換頻繁發生的情況中(例如,在其中準備了以多個攝像角取得的運動圖像,并且觀看者可以自由選擇攝像角的情況中,例如DVD視頻的多角視頻),元數據必須與運動圖像的轉換相應地以高速度轉換。
此外,元數據需要具有這樣的結構,其中容易根據運動圖像的編輯進行編輯。即,由運動圖像的編輯導致的元數據的改變可以在短時間內被處理,并且不失去與運動圖像的同步是必要的。
關于與在觀看者控制中的運動圖像相關的、且經由網絡通過流分給觀看者的元數據,或者由觀看者所有且被復制的元數據,期望元數據可以根據運動圖像的編輯而被容易編輯。
已經使本發明用于解決上述問題。
發明內容
將參照圖4描述本發明實施例的元數據的數據結構。
元數據與運動圖像相關,數據結構與暫時存儲在緩沖器中直到元數據被復制的元數據相關。元數據具有包括一個或多個訪問單元的流數據結構,每一個訪問單元是可以被單獨處理的數據單元。
訪問單元(圖4的Vclick AU)中每一個包括如下給出的數據。
為了使作為用于元數據描述的時間的訪問單元時間對應于作為用于運動圖像的時間的運動圖像時間,這里包括有用于確定訪問單元時間中的基準時間的第一數據(例如,圖4的時間標記402),描述運動圖像中時空區的對象區數據(例如,圖4的對象區數據400),以及第二數據(圖4的對象屬性信息403),第二數據包括用于指定與時空區相關的顯示方法的數據和用于指定在時空區被指定時將進行的處理的數據的兩者之一或者兩者。
然后,基于第一數據中的基準時間,使得運動圖像時間對應于訪問單元時間,并且可能指定有效期間作為其中至少第二數據可以被調用的期間。
此外,在其中運動圖像被壓縮的情況中,使與在被壓縮的運動圖像中可以被單獨解碼的幀設置(例如MPEG的GOP或者DVD視頻的VOB)對應的時間部分作為訪問單元的有效期間,使得與幀設置的單元中運動圖像的編輯相對應的運動圖像元數據的編輯被簡化。
當元數據具有上述實施例的結構時,訪問單元根據運動圖像的編輯被刪除或者增加,并且與運動圖像的編輯相對應的元數據的編輯可以容易地進行。
此外,即使在其中由于運動圖像的編輯而在訪問單元中間出現了非必要的元數據的情況下,只通過重寫第一數據和第三數據來改變有效時間,與運動圖像的編輯相對應的元數據的編輯就可以容易地進行。
根據上述內容,使得訪問單元的有效期間能夠被指定,從而運動圖像元數據的編輯可以通過訪問單元的單元中的編輯并通過訪問單元中無效期間的設置來實現。這樣,變得可能容易地進行編輯,而不需要重新建立運動圖像數據。
此外,使得運動圖像的結構例如MPEG的GOP或者DVD視頻的VOB與訪問單元的有效期間相一致,從而可以通過訪問單元的單元中的編輯來實現與GOP或VOB單元中的運動圖像編輯相對應的運動圖像元數據的編輯。這樣,簡單的編輯變為可能。
圖1A和1B是用于說明根據本發明實施例的超媒體的顯示實例的視圖。
圖2是示出了根據本發明實施例的系統的結構實例的框圖。
圖3是用于說明根據本發明實施例的對象區與對象區數據之間關系的視圖。
圖4是用于說明根據本發明實施例的對象元數據的訪問單元的數據結構實例的視圖。
圖5是用于說明根據本發明實施例的Vclick流的構建方法的視圖。
圖6是用于說明根據本發明實施例的Vclick訪問表的結構實例的視圖。
圖7是用于說明根據本發明實施例的傳輸分組的結構實例的視圖。
圖8是用于說明根據本發明實施例的傳輸分組的另一個結構實例的視圖。
圖9是用于說明根據本發明實施例的服務器與客戶機之間通信的實例的視圖。
圖10是用于說明根據本發明實施例的服務器與客戶機之間通信的另一個實例的視圖。
圖11是用于說明根據本發明實施例的Vclick流報頭的數據元素的實例的視圖。
圖12是用于說明根據本發明實施例的Vclick訪問單元(AU)報頭的數據元素的實例的視圖。
圖13是用于說明根據本發明實施例的Vclick訪問單元(AU)時間標記的數據元素的實例的視圖。
圖14是用于說明根據本發明實施例的Vclick訪問單元(AU)時間標記跳省(skip)的數據元素的實例的視圖。
圖15是用于說明根據本發明實施例的對象屬性信息的數據元素的實例的視圖。
圖16是用于說明根據本發明實施例的對象屬性信息種類的實例的視圖。
圖17是用于說明根據本發明實施例的對象的名字屬性的數據元素實例的視圖。
圖18是用于說明根據本發明實施例的對象的行動屬性的數據元素實例的視圖。
圖19是用于說明根據本發明實施例的對象的概評屬性的數據元素實例的視圖。
圖20是用于說明根據本發明實施例的對象的閃爍區屬性的數據元素實例的視圖。
圖21是用于說明根據本發明實施例的對象的鑲嵌區屬性的數據元素實例的視圖。
圖22是用于說明根據本發明實施例的對象的填充區屬性的數據元素實例的視圖。
圖23是用于說明根據本發明實施例的對象的文本信息屬性的數據元素實例的視圖。
圖24是用于說明根據本發明實施例的對象的文本屬性的數據元素實例的視圖。
圖25是用于說明根據本發明實施例的對象的文本亮顯效果屬性的數據元素實例的視圖。
圖26是用于說明根據本發明實施例的對象的文本亮顯效果屬性項的數據元素實例的視圖。
圖27是用于說明根據本發明實施例的對象的文本閃爍效果屬性的數據元素實例的視圖。
圖28是用于說明根據本發明實施例的對象的文本閃爍效果屬性項的數據元素實例的視圖。
圖29是用于說明根據本發明實施例的對象的文本滾動效果屬性的數據元素實例的視圖。
圖30是用于說明根據本發明實施例的對象的卡拉OK效果屬性的數據元素實例的視圖。
圖31是用于說明根據本發明實施例的對象的卡拉OK效果屬性項的數據元素實例的視圖。
圖32是用于說明根據本發明實施例的對象的層屬性擴展的數據元素實例的視圖。
圖33是用于說明根據本發明實施例的對象的層屬性擴展項的數據元素實例的視圖。
圖34是用于說明根據本發明實施例的Vclick訪問單元(AU)的對象區數據的數據元素實例的視圖。
圖35是用于說明根據本發明實施例的增強的DVD視頻盤的結構實例的視圖。
圖36是用于說明根據本發明實施例的增強的DVD視頻盤中的目錄結構實例的視圖。
圖37是示出了根據本發明實施例的普通復制的開始處理程序的流程圖(其中,Vclick數據在服務器裝置中)。
圖38是示出了根據本發明實施例的普通復制的另一個開始處理程序的流程圖(其中,Vclick數據在服務器裝置中)。
圖39是示出了根據本發明實施例的普通復制的結束處理程序的流程圖(其中,Vclick數據在服務器裝置中)。
圖40是示出了根據本發明實施例的隨機訪問復制的開始處理程序的流程圖(其中,Vclick數據在服務器裝置中)。
圖41是示出了根據本發明實施例的隨機訪問復制的另一個開始處理程序的流程圖(其中,Vclick數據在服務器裝置中)。
圖42是示出了根據本發明實施例的普通復制的開始處理程序的流程圖(其中,Vclick數據在客戶機裝置中)。
圖43是示出了根據本發明實施例的隨機訪問復制的開始處理程序的流程圖(其中,Vclick數據在客戶機裝置中)。
圖44是示出了根據本發明實施例的超媒體的顯示實例的視圖。
圖45是用于說明根據本發明實施例的與圖12不同的Vclick訪問單元(AU)的報頭的數據元素實例的視圖。
圖46A和46B是用于說明根據本發明實施例的Vclick訪問單元(AU)的無效期間的設置實例的視圖。
圖47是用于說明根據本發明實施例的Vclick流的編輯實例的視圖。
圖48是用于說明根據本發明實施例的Vclick流的編輯處理實例的視圖。
圖49是用于說明根據本發明實施例的Vclick訪問單元(AU)與運動圖像之間的相應關系的視圖。
圖50是用于說明根據本發明實施例的Vclick流的編輯實例的視圖。
圖51是用于說明元數據解碼器的處理流程的實例的視圖。
具體實施例方式
在下文中,將參照附圖描述本發明的實施例。
(1)應用概述圖1示出了通過使用該實施例的對象元數據以及運動圖像實現的應用(運動圖像超媒體)在屏幕上的顯示實例。
圖1A的標號100指運動圖像的復制屏幕;101是鼠標。在運動圖像的復制屏幕100上復制的運動圖像數據被記錄在本地運動圖像數據記錄介質上。標號102指出現在運動圖像上的對象區。當用戶移動鼠標進入對象區中并通過點擊等選擇對象時,指定的功能被執行。例如在圖1B中,在本地磁盤和/或網絡上的文檔(與所點擊對象相關的信息)103被顯示。此外,可能進行下面的功能,例如跳到運動圖像的另一個場景,復制另一個運動圖像文件,改變復制模式。
對象區102的數據、在其中該區通過點擊等被指定的情況中的客戶機裝置的操作數據等,將被統稱為對象元數據或Vclick數據。Vclick數據可以與運動圖像數據一起被記錄在本地運動圖像數據記錄介質(光盤、硬盤、半導體存儲器等)上,或者可以存儲在網絡上的服務器中并通過網絡傳送給客戶機。
圖44示出了通過使用該實施例的Vclick數據以及運動圖像實現的應用(運動圖像超媒體)在與圖1不同的屏幕上的顯示實例。
在圖1中,運動圖像和相關信息被顯示在其上的窗口是彼此分開的,但是,在圖44中,運動圖像A02和相關信息A03被顯示在一個窗口A01上。關于相關信息,不僅文本,而且靜止圖片A04和與A02不同的運動圖像也可以被顯示。
在下文中,將給出如何實現應用的詳細描述。
(2)系統結構圖2是根據本發明實施例的流裝置(能聯網的磁盤播放器)的大體結構的視圖。將使用圖2描述各結構單元的功能。
標號200指客戶機裝置;201,服務器裝置;221,連接服務器裝置與客戶機裝置的網絡。客戶機裝置200包括運動圖片復制引擎203、Vclick引擎202、磁盤設備230、用戶接口240、網絡管理器208和磁盤設備管理器213。標號204到206指包含在運動圖片復制引擎中的設備;207、209到212以及214到218,是包含在Vclick引擎中的設備;219和220,是包含在服務器裝置中的設備。客戶機裝置200可以復制存在于磁盤設備230中的運動圖像數據,并顯示以標記語言例如HTML描述的文檔。還可能顯示存在于網絡上的HTML等形式的文檔。關于與記錄在運動圖像數據記錄介質231上的運動圖像數據相關的Vclick數據,有數據與運動圖像數據一起被記錄在運動圖像數據記錄介質231上的情況,也有數據被記錄在服務器裝置201的元數據記錄介質219上的情況。在Vclick數據存在于服務器裝置201中的情況下,客戶機裝置200可以以下面描述的方式使用Vclick數據和磁盤設備230中的運動圖像數據進行復制。首先,響應于來自客戶機裝置200的請求,服務器裝置201將包括Vclick數據的媒體數據M1通過網絡221傳送給客戶機裝置200。客戶機裝置200與運動圖像的復制同步處理被傳送的Vclick數據,并實現例如超媒體的額外功能。
運動圖片復制引擎203是用于復制存在于磁盤設備230中的運動圖像數據的引擎,包括設備204、205和206。標號231指運動圖像數據記錄介質,具體指DVD、視頻CD、視頻帶、硬盤、半導體或存儲器等。數字和/或模擬運動圖像數據被記錄在運動圖像數據記錄介質231上。也有于運動圖像數據相關的元數據于運動圖像數據一起被記錄在運動圖像數據記錄介質231上的情況。標號205指用于運動圖像復制控制的控制器,被構造成能夠根據從Vclick引擎202的接口處理器207輸出的“控制”信號來控制對來自運動圖像數據記錄介質231的視頻/音頻/子視頻數據D1的復制。
具體地,在運動圖像復制時,根據當事件(例如,通過用戶指令的菜單調用或標題跳換)發生時從接口處理器207傳送來的“控制”信號,運動圖像復制控制器205可以向接口處理器207輸出表示視頻/音頻/子視頻數據D1的復制狀態的“觸發”信號。這時(與觸發信號的輸出同時,或者在這之前或之后的合適定時),運動圖像復制控制器205可以向接口處理器207輸出表示性能信息(例如,播放器中設置的錄音語言、子視頻副標題語言、復制操作、復制位置、各種時間信息、磁盤內容等)的“狀態”信號。通過這些信號的傳送/接收,變得可能開始和停止運動圖像數據的讀出,并且可能訪問運動圖像數據中的期望位置。
AV解碼器206具有解碼記錄在運動圖像數據記錄介質231上的視頻數據、音頻數據和子視頻數據,以及分別輸出被解碼的視頻數據(通過合成前述視頻數據和前述子視頻數據得到的)和音頻數據的功能。據此,運動圖片復制引擎203具有與基于現有DVD視頻標準制造的普通DVD視頻播放器的復制引擎相同的功能。即,圖2的客戶機裝置200可以類似于不同DVD視頻播放器復制MPEG 2程序流結構的數據,例如視頻和音頻,據此,變得可能復制現有的DVD視頻盤(符合傳統DVD視頻標準的盤)(確保了與現有DVD軟件的復制兼容性)。
接口處理器207進行模塊之間的接口控制,所述模塊例如運動圖片復制引擎203、磁盤設備管理器213、網絡管理器208、元數據管理器210、緩沖器管理器211、腳本解釋器212、媒體解碼器216(包括元數據解碼器217)、布置管理器215以及AV呈現器218。此外,通過用戶操作(對輸入設備例如鼠標、觸摸板或鍵盤的操作)的輸入事件從用戶接口240被接收,并且事件被傳送到合適的模塊。
接口處理器207包括用于解釋Vclick訪問表(在后面描述)的訪問表分析器,用于解釋Vclick信息文件(在后面描述)的信息文件分析器,用于記錄由Vclick引擎管理的性能的性能緩沖器,Vclick引擎的系統時鐘,其中在運動圖片復制引擎中的運動圖像時鐘204被拷貝的運動圖像時鐘,等等。
網絡管理器208具有通過網絡獲得到緩沖器209中的HTML等形式的文檔以及例如靜止圖片和音頻的數據,以及控制互聯網連接部分222的操作的功能。當連接到網絡或與網絡斷開的指令通過用戶操作發出或者由接收來自元數據管理器210的請求的接口處理器207發出時,網絡管理器208在互聯網連接部分222的連接與斷開之間轉換。此外,當網絡在服務器裝置201與互聯網連接部分222之間建立時,元數據例如控制數據和Vclick數據的媒體數據的傳送/接收被進行。媒體數據包括Vclick數據、HTML等形式的文檔、靜止圖片和與其相伴的運動圖像數據等。
從客戶機裝置200傳送到服務器裝置201的數據包括會話配置的請求、結束的請求、元數據例如Vclick數據的傳送請求以及狀態信息例如正確或錯誤。此外,可以進行客戶機裝置的狀態信息的傳送。另一方面,從服務器裝置傳送到客戶機裝置的數據包括元數據例如Vclick數據,以及狀態信息例如正確或錯誤。
磁盤設備管理器213具有通過網絡獲得到緩沖器209中的HTML等形式的文檔以及例如靜止圖片和音頻的數據的功能,以及將視頻/音頻/子視頻數據D1傳送到運動圖片復制引擎203的功能。磁盤設備管理器213根據來自元數據管理器210的指令進行數據傳送處理。
緩沖器209暫時存儲通過網絡(經由網絡管理器)從服務器裝置201傳送來的媒體數據M1例如Vclick數據。同樣,在媒體數據M2被記錄在運動圖像數據記錄介質231上的情況中,媒體數據M2被類似地通過磁盤設備管理器存儲緩沖器209中。
在媒體數據M2被記錄在運動圖像數據記錄介質231上的情況中,在視頻/音頻/子視頻數據D1被復制之前,媒體數據M2被預先從運動圖像數據記錄介質231中讀出,并且可以被存儲在緩沖器209中。這成為避免下面缺點的措施。即,因為媒體數據M2在運動圖像數據記錄介質231上的數據存儲位置與視頻/音頻/子視頻數據D1的不同,在進行普通復制的情況下,會出現尋找磁盤等情況,不能確保無縫復制。
如上陳述的,從服務器裝置201下載下來的媒體數據M1例如Vclick數據與記錄在運動圖像數據記錄介質231上的例如Vclick數據的媒體數據M2類似地也被存儲在緩沖器209中,從而變得可能同時讀和復制視頻/音頻/子視頻數據D1以及媒體數據。
順便提一下,緩沖器209的存儲能力是有限的。即,可以存儲在緩沖器209中的媒體數據M1和M2的數據大小是有限的。這樣,非必需的數據可能通過元數據管理器210和/或緩沖器管理器211的控制(緩沖器控制)而被擦除。
元數據管理器210管理存儲在緩沖器209中的元數據,并與運動圖像的復制同步從接口處理器207接收合適的定時(“運動圖像時鐘”信號),并將具有相關時間標記的元數據從緩沖器209傳遞到媒體解碼器216。
順便提一下,在具有相關時間標記的Vclick數據沒有存在于緩沖器209中的情況下,到媒體解碼器216的傳遞可能不進行。元數據管理器210進行控制以讀具有特定大小的數據,所述特定大小為傳送自緩沖器209的Vclick數據的大小或者從服務器裝置201或磁盤設備230到緩沖器209的任意大小。關于具體的處理,元數據管理器210經由接口處理器207向網絡管理器208或磁盤設備管理器213發出對具有指定大小的Vclick數據的獲得請求。網絡管理器208或磁盤設備管理器213將具有指定大小的Vclick數據讀到緩沖器209中,并經由接口處理器207通知元數據管理器210 Vclick數據已經獲得。
緩沖器管理器211管理除存儲在緩沖器209中的Vclick數據之外的數據(HTML等形式的文檔、靜止圖片和與其相伴的運動圖像數據等),與運動圖像的復制同步從接口處理器207接收合適的定時(“運動圖像時鐘”信號),并將除存儲在緩沖器209中的Vclick數據之外的數據傳送到分析器214或媒體解碼器216。緩沖器管理器211可以從緩沖器209中刪除已經變為非必需的數據。
分析器214對以標記語言例如HTML寫的文檔進行分析,將腳本傳送到腳本解釋器212,并將與布置相關的信息傳送到布置管理器215。
腳本解釋器212解釋從分析器214輸入的腳本,并執行它。在腳本的執行中,從接口處理器207輸入的事件和性能信息可以被使用。在其中運動圖像中的對象由用戶指定的情況下,腳本被從元數據解碼器217輸入到腳本解釋器212。
AV呈現器218具有控制視頻/音頻/文本輸出的功能。具體地,根據從布置管理器215輸出的“布置控制”信號,AV呈現器218控制例如視頻和文本的顯示位置和顯示大小(除了這些之外,可以包括顯示定時和顯示時間),以及音頻的響度(除此之外,可以包括輸出定時和輸出時間),并且根據所指定馬達的種類和/或將要顯示的視頻的種類進行視頻的象素轉換。作為控制對象的視頻/音頻/文本輸出是從運動圖片復制引擎203和媒體解碼器216的輸出。此外,AV呈現器218具有根據從接口處理器207輸出的“AV輸出控制”信號,控制從運動圖片復制引擎203輸入的視頻/音頻數據與從媒體解碼器輸入的視頻/音頻/文本數據的混合和轉換的功能。
布置管理器215將“布置控制”信號輸出到AV呈現器218。“布置控制”信號包括與將被輸出的運動圖片/靜止圖片/文本的大小和位置相關的信息(可以包括與顯示時間相關的信息例如顯示開始/結束/繼續),并且是指導AV呈現器218選擇其中進行顯示的布置的信息。此外,關于從接口處理器207輸入的輸入信息,例如用戶進行的點擊,判斷哪個對象已經被指定,并且給元數據解碼器217指令用于提取對指定對象限定的操作指令,例如相關信息的顯示。被提取的操作指令被傳送給腳本解釋器212,并被執行。
媒體解碼器216(包括元數據解碼器)解碼運動圖片/靜止圖片/文本數據。被解碼的視頻數據和文本圖像數據被從媒體解碼器216傳送到AV呈現器218。此外,解碼數據通過來自接口處理器202的“媒體控制”信號的指令被解碼,并且與來自接口處理器202的“定時”信號同步被解碼。
標號219指服務器裝置的元數據記錄介質,并且是其上存儲有將被傳送到客戶機裝置200的Vclick數據的硬盤、半導體存儲器、磁帶等。Vclick數據是與記錄在運動圖像數據記錄介質231上的運動圖像數據相關的元數據。Vclick數據包括后面描述的對象元數據。標號220指服務器的網絡管理器,通過網絡221進行到/從客戶機裝置200的數據的傳送/接收。
(3)EDVD數據結構和IFO文件圖35是示出了在增強的DVD視頻磁盤被用作運動圖像數據記錄介質231時的數據結構實例的視圖。增強的DVD視頻磁盤的DVD視頻區存儲具有與DVD視頻標準相同數據結構的DVD視頻內容(具有MPEG2程序流結構)。此外,增強的DVD視頻磁盤的另一個DVD視頻區存儲可以豐富視頻內容復制的增強的導航(此后縮寫為ENAV)內容。順便提一下,上述記錄區的存在在DVD視頻標準中也被接受。
這里,將描述DVD視頻磁盤的基本數據結構。即,DVD視頻磁盤的記錄區從內圓周開始順序包括導入區、容量空間和導出區。容量空間包括容量/文件結構信息區和DVD視頻區(DVD視頻帶),并且可選地還可以包括其它記錄區(DVD其它帶)。
容量/文件結構信息區2是分配給UDF(通用磁盤格式)橋結構的區。UDF橋格式的容量根據ISO/IEC13346部分2被識別。其中容量被識別的空間由連續扇區組成,并且從圖35的容量空間的第一邏輯扇區開始。第一16個邏輯扇區被預留用于由ISO9660規定的系統使用。為了確保與傳統DVD視頻標準的兼容,具有這種內容的容量/文件結構信息區變為必需。
此外,稱為視頻管理器VMG的管理信息和稱為視頻標題設置VTS(VTS#1到VTS#n)的至少一個視頻內容被記錄在DVD視頻區中。VMG是存在于DVD視頻區中的所有視頻標題設置VTS的管理信息,包括控制數據VMG1、VMG菜單數據VMGM_VOBS(可選)和VMG的備份數據。此外,每一個視頻標題設置VTS包括VTS的控制數據VTSI、VTS菜單數據VMGM_VOBS(可選)、VTS(標題)的內容(電影等)數據VTSTT_VOBS以及VTSI的備份數據。為了確保與傳統DVD視頻標準的兼容,具有這種內容的DVD視頻區也變為必需。
每一個標題(VTS#1到VTS#n)的復制選擇菜單等由供應商(DVD視頻磁盤的生產商)使用VMG預先給定。具體標題(例如VTS#1)中的復制章節選擇菜單、記錄內容(小區)的復制程序等由供應商使用VTSI預先給定。因此,磁盤的觀看者(DVD視頻播放器的用戶)可以根據供應商預先準備的VMG/VTSI的菜單和VTSI中的復制控制信息(程序鏈信息PGCI)來欣賞磁盤1的記錄內容。但是,在DVD視頻標準中,觀看者(用戶)不能用與供應商準備的VMG/VTSI不同的方法來復制VTS的內容(電影或音樂)。
圖35的增強的DVD視頻磁盤被準備成下面的發明,其能夠用與供應商準備的VMG/VTSI不同的方法來進行VTS內容(電影或音樂)的復制,并且能夠增加和復制與供應商準備的VMG/VTSI不同的內容。該磁盤中包含的ENAV內容不能被基于DVD視頻標準制造的DVD視頻播放器訪問(即使它被訪問,內容也不能被使用),但是,它可以被根據本發明實施例的DVD視頻播放器訪問,并且被復制的內容可以被使用。
ENAV內容被構造成包括數據,例如音頻、靜止圖片、字體和文本、運動圖片、動畫和Vclick數據以及作為用戶控制這些復制的信息的ENAV文檔(其以標記/腳本語言描述)。在用于控制復制的信息中,ENAV內容(包括音頻、靜止圖片、字體/文本、運動圖片、動畫和Vclick數據等)和/或DVD視頻內容的復制方法(顯示方法、復制程序、復制轉換程序、復制對象的選擇等)以標記語言或腳本語言描述。例如,作為標記語言的HTML(超文本標記語言)/XHTML(可擴展超文本標記語言)或SMIL(同步多媒體集成語言),以及作為腳本語言的ECMA(歐洲計算機制造協會)腳本或Java腳本可以在它們被組合的時候被使用。
這里,在圖35的增強的DVD視頻磁盤中,因為除其它記錄區的內容之外的內容遵守DVD視頻標準,所以即使使用已經很普遍的DVD視頻播放器,記錄在DVD視頻區中的視頻內容也可以被復制(即,它與傳統DVD視頻磁盤兼容)。雖然記錄在其它記錄區中的ENAV內容不能被傳統DVD視頻播放器復制(或者不能被使用),它可以被根據本發明實施例的DVD視頻播放器復制和使用。因此,當根據本發明實施例的DVD視頻播放器被使用并且ENAV內容被復制時,種類豐富的視頻復制變為可能,而不是僅限于先前由供應商準備的VMG/VTSI的內容。
特別地,如圖35所示,ENAV內容包括Vclick數據,并且Vclick數據被構造成包括Vclick信息文件(Vclick info)、Vclick訪問表、Vclick流、Vclick信息文件備份(Vclick info備份)和Vclick訪問表備份。
Vclick信息文件是表示后面提到的Vclick流被添加到DVD視頻內容(例如,DVD視頻內容的整個標題、整個章節或者其一部分)的哪個部分的數據。Vclick訪問表對后面提到的Vclick流中每一個都存在,是用于訪問Vclick流的表。Vclick流是包括對象在運動圖像中的位置信息以及例如在對象被點擊時的操作描述的數據的流。Vclick信息文件備份是前述Vclick信息文件的備份,并且總是具有與Vclick信息文件相同的內容。Vclick訪問表備份是前述Vclick訪問表的備份,并且總是具有與Vclick訪問表相同的內容。在圖35的實例中,Vclick數據被記錄在增強的DVD視頻磁盤上。但是,如前面描述的,也有Vclick數據被放在網絡上的服務器裝置中的情況。
圖36示出了構成Vclick信息文件、Vclick訪問表、Vclick流、Vclick信息文件備份和Vclick訪問表備份的文件的實例。構成Vclick信息文件的文件(VCKINDEX.IFO)以XML(可擴展標記語言)描述,并且Vclick流和Vclick流將被添加到其中的DVD視頻內容的位置信息(VTS號、標題號、PGC號等)被描述。Vclick訪問表由一個或多個文件(VCKSTR01.IFO到VCKSTR99.IFO,或者任意文件名)構成,并且一個訪問表文件對應于一個Vclick流。
Vclick流的位置信息(從文件報頭開始的相對字節大小)與時間信息(相應運動圖像的時間標記或與文件報頭的相對時間信息)之間的關系在Vclick流文件中描述,并且與給定時間對應的復制開始位置可以被檢索。
Vclick流由一個或多個文件(VCKSTR01.VCK到VCKSTR99.VCK或者任意文件名)構成,并且可以通過參照Vclick信息文件的描述與增加的DVD視頻內容一起被復制。在其中存在多個屬性的情況(例如,用于日語的Vclick數據和用于英語的Vclick數據等)下,還可能為每一個屬性構造不同的Vclick流,即不同的文件。此外,各個屬性是多元的,并且一個Vclick流即一個文件可以被構造。順便提一下,在前者的情況(不同的屬性由多個Vclick流構成)下,當其一旦被存儲在復制裝置(播放器)中時的緩沖器占據容量可以被減少。在后者的情況(不同的屬性由一個Vclick流構成)下,當屬性被轉換時,因為一個文件可以保持被復制而不用轉換文件,所以轉換率可以很高。
這里,Vclick流與Vclick訪問表的關聯可以通過例如文件名進行。在前述實例中,一個Vclick訪問表(VCKSTRXX.IFO,XX是01到99)被分配給一個Vclick流(VCKSTRXX.VCK,XX是01到99),并且當使除擴展名的文件名彼此一致時,Vclick流與Vclick訪問表的關聯變得可以被識別。
除此之外,當Vclick流與Vclick訪問表的關聯以Vclick信息文件(并行描述的)描述時,Vclick流與Vclick訪問表的關聯變得可以被識別。
Vclick信息文件備份由VCKINDEX.BUP文件構成,并且具有與Vclick信息文件(VCKINDEX.IFO)正好相同的內容。在VCKINDEX.IFO由于某種原因(由于磁盤的刮痕、灰塵等)不能被讀的情況中,VCKINDEX.BUP被讀,使得可以進行期望的復制。Vclick訪問表備份由VCKSTR01.BUP到VCKSTR99.BUP文件構成,并且具有與Vclick訪問表(VCKSTR01.IFO到VCKSTR99.IFO)正好相同的內容。一個Vclick訪問表備份(VCKSTRXX.BUP,XX是01到99)被分配給一個Vclick訪問表(VCKSTRXX.IFO,XX是01到99),并且當除擴展名之外的文件名彼此一致時,Vclick訪問表與Vclick訪問表備份的關聯變為可以被識別。在VCKSTRXX.IFO由于某種原因(由于磁盤的刮痕、灰塵等)不能被讀的情況中,VCKSTRXX.BUP被讀,使得可以期望的程序。
(4)數據結構和訪問表概述Vclick流包括與出現在記錄在運動圖像數據記錄介質231上的運動圖像上的對象例如人或事的區相關的數據,以及對象在客戶機裝置200中的顯示方法以及在對象被指定時經由客戶機裝置進行的操作的數據。在下文中,將Vclick數據的結構及其結構元素的概要。
首先,將描述作為與出現在運動圖像上的對象例如人或事的區相關的數據的對象區數據。
圖3是用于解釋對象區數據的結構的視圖。標號300指由一個對象畫出的以三維坐標X(視頻在水平方向上的坐標值)、Y(視頻在豎直方向上的坐標值)和T(視頻的時間)表示的軌跡。對象區被轉換成時間間隔在預先確定范圍(例如,從0.5秒到1.0秒,或者從2秒到5秒)內的對象區數據。在圖3中,1個對象區300被轉換成5個對象區數據301到305,并且這些對象區數據被存儲在單獨的Vclick訪問單元(AU)(在后面描述)中。關于此時的轉換方法,例如,可以使用MPEG-4形狀編碼或MPEG-7時空區域描述符。因為MPEG-4形狀編碼或MPEG-7時空定位符是其中數量量通過使用對象區的時間相關性被減少的系統,所以存在數據不能從中間被解碼的問題,并且在數據在某個時間丟失的情況下,該時間附近的數據也不能被解碼。如圖3所示,長時間連續出現在運動圖像上的對象區在時間方向上被分開,并且被轉換成數據,從而使得隨機訪問很容易,并且部分數據遺失的影響可以被減小。每一個Vclick_AU只在運動圖像的特定時間部分中有效。其中Vclick_AU有效的時間部分被稱為Vclick_AU的有效期間(壽命)。
圖4示出了在本發明實施例中使用的Vclick流中可以被單獨訪問的一個單元(Vclick_AU)的結構。標號400指對象區數據。如圖3所示,這里,在一個對象區的某個連續時間部分中的軌跡被轉換成數據。其中該對象區被描述的時間部分被稱為Vclick_AU的活動期間(活動時間)。一般而言,Vclick_AU的活動期間與Vclick_AU的有效期間相同。但是,也可能使Vclick_AU的活動期間是Vclick_AU的有效期間的一部分。
標號401指Vclick_AU的報頭。報頭401包括用于標識Vclick_AU的ID,以及用于指定AU的數據大小的數據。標號402指時間標記,并且指Vclick_AU的有效期間開始的時間標記。一般而言,因為Vclick_AU的活動期間及其有效期間彼此相等,所以它也指示在對象區數據400中描述的對象區對應于運動圖像中的哪個時間。如圖3所示,因為對象區在一個時間范圍上延伸,所以一般而言,對象區報頭的時間被寫在時間標記402中。當然,在對象區數據中描述的對象區的時間間隔以及對象區結束的時間也可以被描述。標號403指對象屬性信息,并且包括例如對象名、當對象被指定時的時間的操作描述、對象顯示屬性等。在Vclick_AU中的數據將在后面詳細描述。以時間標記順序來順序地排列和記錄Vclick_AU是更好的,從而使得其可以從報頭被處理。
圖5是用于說明其中多個AU以時間標記順序被排列并且Vclick流被產生的方法的視圖。在該圖中,有兩個攝像角,即,攝像角1和攝像角2,假設當攝像角在客戶機裝置中被轉換時,將被顯示的運動圖像也被轉換。此外,假設,可選語言模式包括兩種,即日語和英語,并且準備了用于各個語言的單獨的Vclick數據。
在圖5中,Vclick_AU 500、501和502是用于攝像角1和日語的,Vclick_AU 503是用于攝像角2和日語的。Vclick_AU 504和505是用于英語的。Vclick_AU 500到505中每一個是對應于運動圖像中一個對象的數據。即,如圖3和4描述的,與一個對象相關的元數據由一個或多個Vclick_AU構成(在圖5中,一個矩形指一個AU)。該圖中的水平軸對應于運動圖像中的時間,Vclick_AU 500到505被與對象的出現時間相應地表示。
雖然每一個Vclick_AU的時間間隔符可以是任意的,如圖5所圖示的,但是當Vclick_AU的間隔符對于所有對象都對齊時,數據的管理變得容易。標號506指由這些Vclick_AU(500到705)構成的Vclick流。Vclick流通過以時間標記的順序在報頭部分507后排列Vclick_AU來構成。
因為有很大的可能性所選攝像角在用戶觀看期間被改變,所以更好的是通過在Vclick流中將Vclick_AU與不同攝像角復合來形成Vclick流。這是因為可以在客戶機裝置中進行高速的顯示轉換。例如,當Vclick數據被放在服務器裝置201中時,并且當包括多個攝像角的Vclick_AU的Vclick流被原樣傳送到客戶機裝置時,因為與觀看期間攝像角對應的Vclick_AU總是被發送到客戶機裝置,所以攝像角的轉換可以被瞬時進行。當然,客戶機裝置200的設置信息被發送到服務器裝置201,并且只有必要的Vclick_AU被從Vclick流中選擇并且可以被傳送。但是,在該情況下,因為必需進行與服務器的通信,所以處理變得稍慢(但是,當例如光纖的高速措施被用于通信時,處理延遲的問題就可以被解決)。
另一方面,因為例如運動圖像標題、DVD視頻的PGC、運動圖像的高寬比以及觀看區的屬性具有低頻變化,并且當它們被準備作為單獨的Vclick流時,客戶機裝置的處理變得很輕,并且網絡的負荷也變得很輕。在其中存在多個Vclick流的情況中,如前面描述的,通過參照Vclick信息文件,可能確定應該選擇哪個Vclick流。
在其中Vclick數據存在于服務器裝置201中的情況下,以及在其中運動圖像從報頭被復制的情況下,服務器裝置201只必須將Vclick流從報頭順序傳遞到客戶機裝置。但是,在其中發生隨機訪問的情況下,必需從Vclick流的中間傳遞數據。這時,為了以高速訪問Vclick流中的期望位置,變得必需提供Vclick訪問表。
圖6示出了Vclick訪問表的實例。該表被預先準備,并且與Vclick流一起被存儲。該表還可以被做成與Vclick信息文件相同的文件。標號600指時間標記的排列,運動圖像的時間標記被列出。標號601指接入點的排列,并且列出了對應于運動圖像時間標記的Vclick流與報頭的偏移值。在其中對應于運動圖像隨機訪問目的地的時間標記的值沒有存在于Vclick訪問表中的情況下,參考相近值的時間標記的接入點,并且在參照接入點附近Vclick流中的時間標記的同時搜索傳送開始位置。可替換地,從Vclick訪問表中搜索在運動圖像隨機訪問目的地的時間標記之前的時間的時間標記,并且Vclick流從對應于該時間標記的接入點被傳送。
Vclick訪問表被存儲在服務器裝置中,并且被提供用于根據來自客戶機的隨機訪問來幫助服務器裝置檢索將被傳送的Vclick數據。但是,存儲在客戶機裝置中的Vclick訪問表被下載到客戶機裝置,可以使客戶機裝置搜索Vclick流。特別地,在其中Vclick流被立刻從服務器裝置下載到客戶機裝置的情況下,Vclick訪問表也被立刻從服務器裝置下載到客戶機裝置。
另一方面,也有Vclick流被記錄在運動圖像記錄介質例如DVD上并且被提供的情況。同樣在該情況下,為了根據復制內容的隨機訪問檢索將被使用的數據,客戶機裝置使用Vclick訪問表是有效的。在該情況下,與Vclick流類似地,Vclick訪問表被記錄在運動圖像記錄介質上,并且客戶機裝置從運動圖像記錄介質將Vclick訪問表讀到內部主要存儲器或類似裝置中,并使用它。
與運動圖像的隨機復制一起被產生的Vclick流的隨機復制由元數據解碼器217處理。在圖6的Vclick訪問表中,時間標記“時間”是具有記錄在運動圖像記錄介質上的運動圖像的時間標記格式的時間信息。例如,當允許圖像由MPEG-2壓縮并被記錄時,時間標記“時間”具有MPEG-2的PTS的格式。此外,在運動圖像具有導航結構例如在如DVD中的標題或程序鏈的情況下,表示它們的參數(TTN、VTS_TTN、TT_PGCN、PTTN等)以時間標記“時間”的格式被包含。時間標記的值以升序或降序排列。例如,在PTS被用于時間標記的情況下,它們可以以時間順序排列。此外關于包括DVD參數的時間標記,因為順序關系可以根據DVD的自然復制順序來定義,所以可能順序排列時間標記。
在圖6的Vclick訪問表中,接入點“偏移”指示在Vclick流上的位置。例如,Vclick流是文件,那么接入點“偏移”指示文件的文件指針的值。與時間標記“時間”成對的接入點“偏移”的關系如下i)由“偏移”指示的位置是某個Vclick AU的報頭位置。
ii)某個AU的時間標記的值不大于時間標記“時間”的值。
iii)在某個AU前一個的AU的時間標記的值確實比時間標記“時間”小。
Vclick訪問表中時間標記“時間”的排列間隔可以是任意的,并且不需要是一致的。但是,考慮到獲得的方便性等,可以使它們一致。
接下來,將描述服務器裝置與客戶機裝置之間的協議。關于在Vclick數據被從服務器裝置201傳送到客戶機裝置200時所用的協議,有例如RTP(實時傳輸協議)。RTP與UDP/IP兼容,并且重要性被附加到實時性能中,從而有分組被丟失的可能性。當使用RTP時,Vclick流被分成傳送分組(RTP分組),并且被傳送。這里,將描述Vclick流到傳送分組中的存儲方法的實例。
圖7和8是用于說明在Vclick流的數據大小很小的情況以及其數據大小很大的情況下的傳送分組構造的視圖。圖7的標號700指Vclick流。傳送分組包括分組報頭701和凈負荷。分組報頭701包括分組的系列號、傳送時間、傳送源的具體信息等。凈負荷是用于存儲傳送數據的數據區。從Vclick_AU 700順序提取的Vclick_AU(702)被存儲在凈負荷中。在下一個Vclick_AU不能被接收到凈負荷中的情況下,填充數據703被插入到其余部分中。填充數據是用于調節數據大小的偽數據,并且是例如0值的附加部分。在可以使凈負荷的大小等于一個或多個Vclick_AU的大小的情況下,填充數據是不必要的。
另一方面,圖8示出了在一個Vclick_AU不能在凈負荷中被接收到的情況下傳送分組的構造方法。首先,只有可以被裝到第一傳送分組的凈負荷中的Vclick_AU(800)的一部分(802)被存儲在凈負荷中。其余數據(804)被存儲在第二傳送分組的凈負荷中,并且當凈負荷的存儲大小出現過剩時,其以填充數據805嵌入類似的方法應用于其中一個Vclick_AU被分成三個或更多分組的情形。
可以使用HTTP(超文本傳輸協議)或HTTPS作為除了RTP之外的協議。HTTP是與TCP/IP兼容的,并且在該情況下,因為丟失的數據被重新傳送,所以可以進行非常可靠的數據通信。但是,在網絡吞吐量很低的情況下,恐怕會發生數據延遲。因為在HTTP中數據是不丟棄的,所以沒有必要考慮Vclick流如何被分成分組并被存儲。
(5)在Vclick數據存在于服務器裝置中的情況下的復制程序接下來,將描述Vclick流存在于服務器裝置201中的情況下的復制處理程序。
圖37是表示從用戶的復制開始指令到復制開始的復制開始處理程序的流程圖。首先,在步驟S3700,復制開始的指令由用戶輸入。接口處理器207接收該輸入,并向運動圖像復制控制器205發出運動圖像復制準備的指令。接下來,在分支處理步驟S3701,判斷與服務器裝置201的會話是否已經被配置。當會話還沒有被配置時,處理進行到步驟S3702,當會話已經被配置時,過程進行到S3703。在步驟S3702,進行配置服務器與客戶機之間會話的處理。
圖9示出了在RTP被用于服務器與客戶機之間的通信協議的情況下,從會話配置到會話斷開的通信程序的實例。雖然有必要在會話開始時在服務器與客戶機之間進行協商,但是在RTP的情況下,通常使用RTSP(實時流協議)。但是,因為RTSP的通信需要高的可靠性,所以優選的是通信由RTSP中的TCP/IP以及RTP中的UDP/IP進行。首先,為了配置會話,客戶機裝置(圖2實例中的200)請求服務器裝置(圖2實例中的201)來提供與將經受流方法(RTSP的描述方法)的Vclick數據相關的信息。
這里,假設用于傳遞與將被復制的運動圖像相應的數據的服務器地址是被客戶機通過例如將地址信息記錄在運動圖像數據記錄介質上的方法預先知道的。響應于此,服務器裝置將Vclick數據的信息發送到客戶機裝置。具體地,例如會話的協議版本、會話所有者、會話名、連接信息、會話的時間信息、元數據名和元數據屬性的信息被發送到客戶機裝置。關于這些的信息描述方法,例如,使用SDP(會話描述協議)。接下來,客戶機裝置請求服務器裝置配置會話(RTSP的SETUP方法)。服務器裝置準備流方法,并將會話ID返回給客戶機裝置。到該點的處理是在使用RTP情況下步驟S3702的處理。
在使用HTTP而非RTP情況下的通信程序被如例如圖10所示進行。首先,進行在作為低于HTTP的層的TCP處的會話配置(3向握手)。這里,與前面類似,假設用于傳遞與將被復制的運動圖像相應的數據的服務器地址是被客戶機是預先知道的。之后,可以進行通過使用SDP等將客戶機裝置的狀態(例如,制造國家、語言、各種參數的選擇狀態等)傳送給服務器裝置的處理。到該點的處理是在HTTP情況下步驟S3702的處理。
在步驟S3703,在服務器裝置與客戶機裝置之間的會話被配置的狀態下,進行請求服務器傳送Vclick數據的處理。這以下面的方式進行,使得接口處理器向網絡管理器208發出指令,并且網絡管理器208向服務器發出請求。在RTP的情況下,網絡管理器208將RTSP的PLAY方法發送給服務器,并請求Vclick數據傳送。服務器裝置參考迄今接收自客戶機的信息以及存在于服務器裝置中的Vclick信息,并指定將被傳送的Vclick流。此外,服務器裝置使用包含在Vclick數據傳送請求中的復制開始位置的時間標記信息和存在于服務器裝置中的Vclick訪問表來指定Vclick流中的傳送開始位置,將Vclick流分成分組,并通過RTP將它們發送給客戶機裝置。
另一方面,在HTTP的情況下,網絡管理器208傳送HTTP的GET方法,并請求Vclick數據傳送。該請求可以包括運動圖像復制開始位置的時間標記信息。服務器裝置通過RTP時的類似方法指定將被傳送的Vclick流和流中的傳送開始位置,并通過HTTP將Vclick流發送到客戶機裝置。
接下來,在步驟S3704,進行對被從服務器發送到緩沖器209中的Vclick流進行緩沖的處理。這被進行以避免從服務器的Vclick流傳送在Vclick流復制期間變得不充分,并且緩沖器變空的狀態。當從元數據管理器210向接口處理器通知足夠的Vclick流被存儲在緩沖器中時,處理進行到步驟S3705。在步驟S3705,接口處理器將運動圖像的復制開始指令發給控制器205,并指示元數據管理器210開始向元數據解碼器217的Vclick流傳送。
圖38是用于說明于圖37不同的復制開始處理程序的流程圖。在圖37的流程圖說明的處理中,根據網絡的狀態以及服務器和客戶機裝置的處理能力,有在步驟S3704要花大量時間來進行緩沖固定量Vclick流的處理的情況。即,有從用戶的復制指令到真正復制開始要經過大量時間的情況。在圖38的處理程序中,當在步驟S3800用戶指示復制開始時,運動圖像的復制在下一個步驟S3801立即開始。即,從用戶接收復制開始指令的接口處理器207立刻向控制器205發出復制開始指令。據此,在復制指令后,直到運動圖像可以被觀看,才會使用戶等待。從下一個步驟S3802到步驟S3805的處理與圖37中從步驟S3701到步驟S3704的處理相同。
在步驟S3806,與復制期間運動圖像同步進行解碼Vclick流的處理。即,當從元數據管理器210接收固定量的Vclick流被存儲在緩沖器中的通知時,接口處理器207指導元數據管理器210開始向元數據解碼器的Vclick流傳送。元數據管理器210從接口處理器接收復制期間運動圖像的時間標記,從存儲在緩沖器中的數據中指定與時間標記相應的Vclick_AU,并將其傳送給元數據解碼器。
在圖38的處理程序中,雖然在復制指令后,直到運動圖像可以被觀看才會使用戶等待,但是有下面的問題,即因為Vclick的解碼不是在復制開始之后立刻進行的,所以有關對象的顯示不被進行,或者即使對象被點擊,也不會發生任何操作。
在運動圖像的復制期間,客戶機裝置的網絡管理器208接收從服務器裝置順序發出的Vclick流,并將其存儲在緩沖器209中。所存儲的對象元數據在合適的定時被發送到元數據解碼器217。即,元數據管理器208參照復制期間從元數據管理器210發出的運動圖像的時間標記,從存儲在緩沖器209中的數據中指定與時間標記相應的Vclick_AU,并將所指定的對象元數據發送到AU單元中的元數據解碼器217。元數據解碼器217解碼所接收的數據。但是,與客戶機裝置當前選擇的攝像角不同的攝像角的數據可以不被解碼。在已知與復制期間運動圖像的時間標記對應的Vclick_AU存在于元數據解碼器217中的情況下,可以使對象元數據不被發送到元數據解碼器。
復制期間運動圖像的時間標記被從接口處理器順序發送到元數據解碼器217。元數據解碼器與時間標記同步對Vclick_AU進行解碼,并將必需的數據發送到AV呈現器218。例如,在對象區的顯示由在Vclick_AU中描述的屬性信息指導的情況下,屏蔽圖像和對象區輪廓被建立,并且與復制期間運動圖像的時間標記同步被發送到AV呈現器218。此外,元數據解碼器比較復制期間運動圖像的時間標記與Vclick_AU的有效時間,以判斷出非必需的老對象元數據,并刪除這些數據。
圖39是用于說明復制停止處理程序的流程圖。在步驟S3900,用戶指示在運動圖像復制期間的復制停止。接下來,在步驟S3901,進行停止運動圖像復制的處理。這以這樣的方式進行使得接口處理器207向控制器205發出停止指令。同時,接口處理器指示元數據管理器210停止向元數據解碼器的對象元數據的傳送。
步驟S3902是用于斷開與服務器的會話的處理。在使用RTP的情況下,如圖9所示,RTSP的TEARDOWN方法被發送到服務器。當接收TEARDOWN的消息時,服務器裝置停止數據傳送,結束會話,并發送確認消息到客戶機裝置。通過該處理,用戶會話的會話ID變為無效。另一方面,在使用HTTP的情況下,如圖10所示,HTTP的CLOSE方法被發送給服務器,會話被結束。
(6)Vclick數據存在于服務器裝置中的情況下的隨機訪問程序接下來,將描述Vclick數據存在于服務器裝置201中的情況下的隨機訪問復制程序。
圖40是示出了從用戶的隨機訪問復制開始指令到復制開始的處理程序的流程圖。首先,在步驟S4000,隨機訪問復制的開始指令由用戶輸入。關于輸入方法,有用戶從例如章節的可訪問位置列表中進行選擇的方法,用戶從與運動圖像的時間標記相應的滾動條中指定一個點的方法,或者運動圖像的時間標記被直接輸入的方法。接口處理器207接收所輸入的時間標記,向運動圖像復制控制器205發出運動圖像復制準備的指令。在運動圖像已經正被復制的情況下,復制期間運動圖像的復制停止被指示,并且運動圖像復制準備指令被發出。接下來,作為分支處理步驟S4001,判斷與服務器裝置201的會話是否已經被配置。在會話已經如例如在運動圖像正被復制的情況一樣被配置的情況下,進行步驟S4002的會話斷開處理。當會話還沒有被配置時,不進行步驟S4002的處理,并且處理進行到步驟S4003。在步驟S4003,進行配置服務器與客戶機之間會話的處理。該處理與圖37中的步驟S3702相同。
接下來,在步驟S4004,在服務器裝置與客戶機裝置之間的會話被配置的狀態下,復制開始位置的時間標記被指定給服務器,并且進行請求Vclick數據傳送的處理。這以這樣的方式進行使得接口處理器向網絡管理器208發出指令,并且網絡管理器208向服務器發出請求。在RTP的情況下,網絡管理器208向服務器發送RTSP的PLAY方法,并請求Vclick數據傳送。這時,用于指定復制開始位置的時間標記也通過使用范圍描述的方法被發送到服務器。服務器裝置參考迄今接收自客戶機的信息以及存在于服務器裝置中的Vclick信息,并指定將被傳送的對象元數據流。此外,服務器裝置使用包含在Vclick數據傳送請求中的復制開始位置的時間標記信息以及存在于服務器裝置中的Vclick訪問表來指定Vclick流中的傳送開始位置,將Vclick流分成分組,并通過RTP將它們發送到客戶機裝置。
另一方面,在HTTP的情況下,網絡管理器208傳送HTTP的GET方法,并請求Vclick數據傳送。該請求包括運動圖像復制開始位置的時間標記信息。類似于RTP,服務器裝置參照用于指定將被傳送的Vclick流的Vclick信息文件,并進一步使用時間標記信息和存在于服務器裝置中的Vclick訪問表來指定Vclick流中的傳送開始位置,并通過HTTP將Vclick流發送到客戶機裝置。
接下來,在步驟S4005,進行對被從服務器發送到緩沖器209中的Vclick流進行緩沖的處理。這被進行以避免從服務器的Vclick流傳送在Vclick流復制期間變得不充分,并且緩沖器變空的狀態。當從元數據管理器210向接口處理器通知足夠的Vclick流被存儲在緩沖器中時,處理進行到步驟S4006。在步驟S4006,接口處理器將運動圖像的復制開始指令發給控制器205,并且還向元數據管理器210發出指令以開始向元數據解碼器的Vclick流傳送。
圖41是用于說明于圖40不同的隨機訪問復制開始處理程序的流程圖。在圖40的流程圖說明的處理中,根據網絡的狀態以及服務器和客戶機裝置的處理能力,有在步驟S4005要花大量時間來進行緩沖固定量Vclick流的處理的情況。即,有從用戶的復制指令到真正復制開始要經過大量時間的情況。
另一方面,在圖41的處理程序中,在步驟S4100,當用戶指示復制開始時,運動圖像的復制在步驟S4101立即開始。即,從用戶接收復制開始指令的接口處理器207立刻向控制器205發出隨機訪問復制開始指令。據此,在復制指令后,直到運動圖像可以被觀看,才會使用戶等待。從下一個步驟S4102到步驟S4106的處理與圖40中從步驟S4001到步驟S4005的處理相同。
在步驟S4107,與復制期間運動圖像同步進行解碼Vclick流的處理。即,當從元數據管理器210接收固定量的Vclick流被存儲在緩沖器中的通知時,接口處理器207指導元數據管理器210開始向元數據解碼器的Vclick流傳送。元數據管理器210從接口處理器接收復制下運動圖像的時間標記,從存儲在緩沖器中的數據中指定與該時間標記相應的Vclick_AU,并將其傳送給元數據解碼器。
在圖41的處理程序中,雖然在復制指令后,直到運動圖像可以被觀看才會使用戶等待,但是因為Vclick的解碼不是在復制開始之后立刻進行的,所以有下面的問題,即有關對象的顯示不被進行,或者即使對象被點擊,也不會發生任何操作。
順便提一下,因為運動圖像復制期間的處理和運動圖像停止處理與普通復制處理的情況下相同,所以將省略對它們的說明。
(7)Vclick流存在于客戶機裝置中的情況的復制程序接下來,將描述Vclick流存在于運動圖像數據記錄介質231中的情況下的復制處理程序。
圖42是示出了從用戶的復制開始指令到復制開始的復制開始處理程序的流程圖。首先,在步驟S4200,復制開始的指令由用戶輸入。接口處理器207接收該輸入,并向運動圖像復制控制器205發出運動圖像復制準備的指令。接下來,在步驟S4201,進行指定將被使用的Vclick流的處理。在該處理下,接口處理器參考運動圖像記錄介質231上的Vclick信息文件,并指定與其復制由用戶指示的運動圖像相對應的Vclick流。
在步驟S4202,進行將Vclick流存儲到緩沖器中的處理。為了進行該處理,接口處理器207首先指示元數據管理器210分配緩沖器。雖然將被分配的緩沖器的大小被確定為對于存儲所指定的Vclick流足夠的大小,但是一般而言,描述該大小的緩沖器初始化文檔被記錄在運動圖像數據記錄介質231上。在沒有初始化文檔的情況下,應用預先確定的大小。當緩沖器的分配結束時,接口處理器207向控制器205發出指令,以讀所指定的Vclick流并將其存儲在緩沖器中。
當Vclick流被存儲在緩沖器中時,接下來在步驟S4203進行復制開始處理。在該處理下,接口處理器207向運動圖像復制控制器205發出運動圖像的復制指令,同時向元數據管理器210發出指令用于開始向元數據解碼器的Vclick流傳送。
在運動圖像復制期間,從運動圖像數據記錄介質231上讀的Vclick_AU被存儲在緩沖器209中。所存儲的Vclick流在合適的定時被發送給元數據解碼器217。即,元數據管理器208參考從元數據管理器210發送來的復制期間運動圖像的時間標記,從存儲在緩沖器209中的數據中指定與時間標記相應的Vclick_AU,并將該指定的Vclick_AU發送給元數據解碼器217。元數據解碼器217解碼所接收的數據。但是,用于與客戶機裝置當前選擇的攝像角不同的攝像角的數據可以不被解碼。在已知與復制期間運動圖像的時間標記對應的Vclick_AU存在于元數據解碼器217中的情況下,Vclick流可以不被發送到元數據解碼器。
復制期間運動圖像的時間標記被從接口處理器順序發送到元數據解碼器217。元數據解碼器與時間標記同步對Vclick_AU進行解碼,并將必需的數據發送到AV呈現器218。例如,在對象區的顯示由在對象元數據的AU中描述的屬性信息指導的情況下,屏蔽圖像和對象區輪廓被建立,并且與復制期間運動圖像的時間標記同步被發送到AV呈現器218。此外,元數據解碼器比較復制期間運動圖像的時間標記與Vclick_AU的有效時間,判斷出非必需的老Vclick_AU,并刪除這些數據。
當在運動圖像復制期間由用戶指示復制停止時,接口處理器207向控制器205發出運動圖像復制停止指令以及Vclick流讀出停止指令。通過這些指令,運動圖像的復制結束。
(8)Vclick數據存在于客戶機裝置中的情況下的隨機訪問程序接下來,將描述Vclick流在運動圖像數據記錄介質231上的情況下的隨機訪問復制處理程序。
圖43是示出了從用戶的隨機訪問復制開始指令到復制開始的處理程序的流程圖。首先,在步驟S4300,隨機訪問復制開始的指令由用戶輸入。關于輸入方法,有用戶從例如章節的可訪問位置列表中進行選擇的方法,用戶從與運動圖像的時間標記相應的滾動條中指定一個點的方法,或者運動圖像的時間標記被直接輸入的方法。接口處理器207接收所輸入的時間標記,并向運動圖像復制控制器205發出運動圖像隨機訪問復制準備的指令。
接下來,在步驟S4301,進行指定將被使用的Vclick流的處理。在該處理下,接口處理器參考運動圖像記錄介質231上的Vclick信息文件,并指定與其復制由用戶指示的運動圖像相對應的Vclick流。此外,接口處理器參考運動圖像數據記錄介質231上的Vclick訪問表或者讀到存儲器上的Vclick訪問表,并指定Vclick流中與運動圖像隨機訪問目的地相應的Vclick流的接入點。
步驟S4302是分支處理,判斷所指定的Vclick流當前是否在緩沖器209中被讀。在它在緩沖器中沒有被讀的情況下,在進行步驟S4303的處理之后,過程進行到步驟S4304。在它當前在緩沖器中被讀的情況下,不進行步驟S4303的處理,過程進行到步驟S4304。在步驟S4304,開始運動圖像的隨機訪問復制,并且開始Vclick流的解碼。在該處理下,接口處理器207向運動圖像復制控制器205發出運動圖像的隨機訪問復制指令,同時向元數據管理器210發出指令用于開始向元數據解碼器的Vclick流傳送。之后,Vclick的解碼處理與運動圖像的復制同步進行。因為運動圖像復制期間的處理和運動圖像復制停止處理與普通復制處理的情況相同,所以將省略對它們的說明。
(9)從點擊到相關信息顯示的程序接下來,將描述在用戶使用例如鼠標的指示設備來點擊對象區的情況下客戶機裝置的操作。當用戶點擊時,運動圖像上被點擊的坐標位置被輸入到接口處理器207中。接口處理器將點擊時的時間標記和運動圖像坐標發送給元數據解碼器217。根據時間標記和坐標,元數據解碼器進行處理以標識由用戶指示的對象。
元數據解碼器與運動圖像的復制同步解碼Vclick流。因此,因為時間標記的對象區在點擊時被產生,所以該處理可以容易進行。在多個對象區存在于所點擊坐標處的情況下,參考包含在Vclick_AU中的層信息,并標識最前面的對象。
當由用戶指定的對象被標識時,元數據解碼器217將對象屬性信息403中描述的行動描述(用于指示操作的腳本)發送給腳本解釋器212。已經接收了行動描述的腳本解釋器解釋操作內容并執行它。例如,所指定的HTML文件被顯示,或者所指定的運動圖像的復制被開始。HTML文件和運動圖像數據可以被記錄在客戶機裝置200中,或者可以通過網絡從服務器裝置201被發送,或者可以存在于網絡上的另一個服務器中。
(10)數據結構的細節接下來,將描述數據結構的更具體的結構實例。如圖5所示,Vclick流506包括Vclick的報頭和多個Vclick AU。圖11示出了Vclick流的報頭的數據結構的實例。數據元素中每一個的含義如下“vclick_版本”指Vclick流的報頭的開始,并指定格式的版本;以及“vclick_長度”指Vclick流中“Vclick_長度”之后的一部分的數據長度,單位為字節。
接下來,將描述Vclick AU的詳細數據結構。Vclick AU的大致數據結構如圖4所描述。
圖12示出了Vclick AU的報頭401的數據結構的實例。數據元素中每一個的含義如下“vau_start_code”指Vclick_AU中每一個的開始;“vau_長度”指Vclick_AU報頭中“vau_長度”之后的一部分的數據長度,單位為字節;“vau_id”指Vclick_AU的身份ID,并且由表示客戶機裝置狀態的參數和該ID判斷Vclick_AU是否應該被解碼;“對象_id”指Vclick數據中描述的對象的身份號,并且在兩個Vclick_AU中使用相同值的“對象_id”的情況下,兩者基于語義都指用于相同對象的數據;“對象_subid”指對象的語義連續性,并且在其中兩個Vclick_AU中的“對象_id”和“對象_subid”都相同的情況下,意味著兩者是連續(出現在相同景象上且一致)的對象;“continue_flag”指標記(在第一位是“1”的情況下,它表示在Vclick_AU中描述的對象區與在具有相同對象_id的前一個Vclick_AU中描述的對象區是連續的。在不是這樣的情況下,該標記變為“0”。類似地,第二位指在Vclick_AU中描述的對象區與在下一個Vclick_AU中描述的且具有相同“對象_id”的對象區的連續性。);以及“層”指對象的層值。當層值較大(或較小)時,意味著對象被定位在屏幕前面。在多個對象存在于所點擊位置的情況下,判定具有最大(或最小)層值的對象被點擊。
圖13示出了Vclick_AU的時間標記402的數據結構的實例。在該實例中,假設DVD被用作運動圖像數據記錄介質204。通過使用隨后的時間標記,變得可能指定DVD上運動圖像的任意時間,并且可以實現運動圖像與Vclick數據的同步。數據元素中每一個的含義如下“時間_類型”指用于DVD的時間標記的開始;“VTSN”指DVD視頻的VTS(視頻標題組)號;“TTN”指DVD視頻標題域中的標題號,并且對應于存儲在DVD播放器的系統參數SPRM(4)中的值;“VTS_TTN”指DVD視頻的標題域中的VTS標題號,并且對應于存儲在DVD播放器的系統參數SPRM(5)中的值;“TT_PGCN”指DVD視頻的標題域中的標題PGC(程序鏈)號,并且對應于存儲在DVD播放器的系統參數SPRM(6)中的值;“PTTN”指DVD視頻的部分標題(Part_of_Title)號,并且對應于存儲在DVD播放器的系統參數SPRM(7)中的值;
“CN”指DVD視頻的小區號;“AGLN”指DVD視頻的角度號;以及“PTS[s...e]”指在DVD視頻的顯示時間標記中從第s位到第e位的數據。
圖14示出了Vclick_AU的時間標記跳省的數據結構的實例。在時間標記跳省而非時間標記在Vclick_AU中被描述的情況下,意味著Vclick_AU的時間標記與剛好前面的Vclick_AU的時間標記相同。每一個數據元素的含義如下“時間_類型”指時間標記跳省的開始。
圖15示出了Vclick_AU的對象屬性信息403的數據結構實例。數據元素中每一個的含義如下“屬性_長度”指對象屬性信息中“屬性_長度”之后的一部分的數據長度,單位為字節;以及“數據_字節”指對象屬性信息的數據部分。在圖16中示出的一個或多個屬性數據在該部分中被描述。可以在相對于每個屬性的一個Vclick_AU中描述的最多數量的數據實例在圖16的“最大值”欄中說明。數據元素“屬性_id”指包含在每一個屬性數據中的ID,并且指用于區分屬性種類的數據。“名字”屬性表示用于指定對象名字的信息。在“行動”屬性中,描述了當運動圖像中的對象區被點擊時應該進行什么行動。“輪廓”屬性表示如何顯示對象輪廓的屬性。“閃爍區”屬性指定當對象區被閃動和顯示時的閃爍顏色。在“鑲嵌區”屬性中,描述了在對象區被鑲嵌并顯示時形成鑲嵌的方式。“填充區”屬性指定當對象區被著色并顯示時的顏色。
屬于“文本”目錄的屬性定義了當期望人物被顯示在運動圖像上時與將被顯示的人物有關的屬性。將被顯示的文本在“文本信息”中描述。“文本屬性”指定將被顯示文本的顏色、字體等的屬性。“亮顯效果”屬性指定當文本的一部分或全部被亮顯顯示時,什么人物將以什么方式被亮顯顯示。“閃爍效果”屬性指定當文本的一部分或全部被閃爍顯示時,什么人物將以什么方式被閃爍顯示。在“滾動效果”屬性中,描述了當將被顯示的文本被滾動時所進行滾動的方向和速度。在“卡拉OK效果”屬性中,指定了當文本顏色被順序改變時,哪個人物的顏色應該在何時被改變。最后,“層擴展”屬性被用于定義層值以及其在對象的層值在Vclick_AU中被改變的情況下的值的改變定時。下面將分別描述上述屬性的數據結構。
圖17示出了對象的名字數學的數據結構實例。數據元素中每一個的含義如下“屬性_id”指屬性數據類型,并且使該值相對于名字屬性為00h;“數據_長度”指名字屬性數據的“數據_長度”之后的數據長度,單位為字節;“語言”指用于后面元素描述(名字和注釋)的語言,并且SIO-639“用于代表語言名字的碼”被用于指定語言;“名字_長度”指“名字”元素的數據長度,單位為字節;“名字”指字符串,并且表示在該Vclick_AU中描述的對象的名字;“注釋_長度”指“注釋”元素的數據長度;以及“注釋”指字符串,并且表示與在Vclick_AU中描述的對象相關的注釋。
圖18示出了對象行動數學的數據結構的實例。數據元素中每一個的含義如下“屬性_id”指屬性數據的類型,并且使該值相對于“行動”屬性為01h;“數據_長度”指行動屬性數據中“數據_長度”之后的一部分的數據長度,單位為字節;“腳本_語言”指在“腳本”元素中描述的腳本語言的種類;“腳本_長度”指字節單元的“腳本”元素的數據長度;以及“腳本”指字符串,以及在由用戶指定的在Vclick_AU中描述的對象被以由“腳本_語言”指定的腳本語言描述的情況下將被執行的行動。
圖19示出了對象輪廓屬性的數據結構的實例。數據元素中每一個的含義如下“屬性_id”指屬性的類型,并且使該值相對于輪廓屬性為02h;“數據_長度”指輪廓屬性數據中“數據_長度”之后的一部分的數據長度,單位為字節;“顏色_r”、“顏色_g”、“顏色_b”和“顏色_a”指在對象元數據AU中描述的對象輪廓的顯示顏色;“顏色_r”、“顏色_g”和“顏色_b”分別指顏色的RGB表示中紅色、綠色和藍色的值,“顏色_a”指透明度;“線_類型”指在Vclick_AU中描述的對象輪廓的種類(實線、虛線等);以及“厚度”指在Vclick_AU中描述的對象輪廓的厚度。
圖20示出了對象的閃爍區屬性的數據結構的實例。數據元素中每一個的含義如下“屬性_id”指屬性數據的類型,并且使該值相對于閃爍區屬性數據為03h;“數據_長度”指閃爍區屬性數據中“數據_長度”之后的一部分的數據長度,單位為字節;“顏色_r”、“顏色_g”、“顏色_b”和“顏色_a”指在Vclick_AU中描述的對象區的顯示顏色(“顏色_r”、“顏色_g”和“顏色_b”分別指顏色的RGB表示中紅色、綠色和藍色的值。另一方面,“顏色_a”指透明度。對象區的閃爍是通過交替顯示在填充區屬性中指定的顏色和由該屬性指定的顏色而實現的);以及“間隔”指閃爍的時間間隔。
圖21示出了對象的鑲嵌區屬性的數據結構的實例。數據元素中每一個的含義如下“屬性_id”指屬性數據的類型,并且使該值相對于鑲嵌區屬性數據為04h;“數據_長度”指閃爍區屬性數據中“數據_長度”之后的一部分的數據長度,單位為字節;
“鑲嵌_大小”指象素單位的鑲嵌塊的大小;以及“隨機性”指在鑲嵌塊的位置被交換的情況下的隨機交換度。
圖22示出了對象的鑲嵌區屬性的數據結構的實例。數據元素中每一個的含義如下“屬性_id”指屬性數據的類型,并且使該值相對于填充區屬性數據為05h;“數據_長度”指填充區屬性數據中“數據_長度”之后的一部分的數據長度,單位為字節;以及“顏色_r”、“顏色_g”、“顏色_b”和“顏色_a”指在Vclick_AU中描述的對象區的顯示顏色,并且“顏色_r”、“顏色_g”和“顏色_b”分別指顏色的RGB表示中紅色、綠色和藍色的值,另一方面,“顏色_a”指透明度。
圖23示出了對象的文本信息的數據結構的實例。數據元素中每一個的含義如下“屬性_id”指屬性數據的類型,并且使該值相對于對象的文本信息為06h;“數據_長度”指對象的文本信息中“數據_長度”之后的一部分的數據長度,單位為字節;“語言”指所描述文本的語言,并且關于語言的指示方法,例如可以使用ISO-639“用于語言名字表示的代碼”;“字符_代碼”指文本的代碼種類,并且例如UTF-8、UTF-16、ASCII或Shift JIS被指定;“方向”指作為字符被排列的方向的向左方向、向右方向、向下方向或向上方向(例如,在英語或法語中,字符通常以向左方向排列。另一方面,在阿拉伯語中,字符以向右方向排列,在日語中,它們在向左方向或向下方向上排列。但是,可以指定除對每一種語言確定的排列方向之外的方向。此外,可以指定傾斜方向。)“文本_長度”指“時間_文本”的長度,單位為字節;以及“文本”指字符串,并且指使用由“字符_代碼”指定的字符代碼描述的文本。
圖24示出了對象的文本屬性的數據結構的實例。數據元素中每一個的含義如下“屬性_id”指屬性數據的類型,并且使該值相對于對象的文本屬性為07h;“數據_長度”指對象的文本屬性中“數據_長度”之后的一部分的數據長度,單位為字節;“字體_長度”指字節單位的字體的描述長度;“字體”指字符串,并且指定在文本被顯示時使用的字體;以及“顏色_r”、“顏色_g”、“顏色_b”和“顏色_a”指在文本被顯示時使用的顯示顏色。顏色由RGB表示,“顏色_r”、“顏色_g”和“顏色_b”分別指紅色、綠色和藍色的值,“顏色_a”指透明度。
圖25示出了對象的文本亮顯效果屬性的數據結構的實例。數據元素中每一個的含義如下“屬性_id”指屬性數據的類型,并且使該值相對于對象的文本亮顯效果屬性數據為08h;“數據_長度”指對象的文本亮顯效果屬性數據中“數據_長度”之后的一部分的數據長度,單位為字節;“項”指文本亮顯效果屬性數據中“亮顯_效果_項”的數目;以及“亮顯_項”包括“亮顯_效果_項”的“項”號。
接下來將描述“亮顯_效果_項”的詳細內容。
圖26示出了對象的文本亮顯效果屬性的項的數據結構的實例。數據元素中每一個的含義如下“開始_位置”指由從報頭到字符的字符數表示的將被加重的字符的開始位置;“結束_位置”指由從報頭到字符的字符數表示的將被加重的字符的結束位置;以及“顏色_r”、“顏色_g”、“顏色_b”和“顏色_a”指在加重之后字符的顯示顏色。顏色由RGB表示。此外,“顏色_r”、“顏色_g”和“顏色_b”分別指紅色、綠色和藍色的值,“顏色_a”指透明度。
圖27示出了對象的文本閃爍效果屬性的數據結構的實例。數據元素中每一個的含義如下“屬性_id”指屬性數據的類型,并且使該值相對于對象的閃爍效果屬性為09h;“數據_長度”指文本閃爍效果屬性數據中“數據_長度”之后的一部分的數據長度,單位為字節;“項”指文本閃爍效果屬性數據中“閃爍_效果_項”的數目;以及“閃爍_項”包括“閃爍_效果_項”的“項”號。
下面將描述“閃爍_效果_項”的具體內容。
圖28示出了對象的文本閃爍效果屬性的數據結構的實例。數據元素中每一個的含義如下“開始_位置”指由從報頭到字符的字符數表示的將被閃爍的字符的開始位置;“結束_位置”指由從報頭到字符的字符數表示的將被閃爍的字符的結束位置;“顏色_r”、“顏色_g”、“顏色_b”和“顏色_a”指閃爍字符的顯示顏色(以RGB表示的顏色。此外,“顏色_r”、“顏色_g”和“顏色_b”分別指紅色、綠色和藍色的值,“顏色_a”指透明度。這里指定的顏色和由文本屬性指定的顏色被交替顯示,從而使字符閃爍。);以及“間隔”指閃爍的時間間隔。
圖29示出了對象的文本滾動效果屬性項的數據結構的實例。數據元素中每一個的含義如下“屬性_id”指屬性數據的類型,并且使該值相對于對象的文本滾動效果屬性數據為0ah;“數據_長度”指文本滾動效果屬性數據中“數據_長度”之后的一部分的數據長度,單位為字節;“方向”指字符被滾動的方向,例如,0指從右到左的方向,1指從左到右的方向,2指從上到下的方向,3指從下到上的方向;以及
“延遲”指由將被顯示的第一字符的顯示與最后字符的顯示之間的時間差表示的滾動速度。
圖30示出了對象的文本卡拉OK效果屬性項的數據結構的實例。數據元素中每一個的含義如下“屬性_id”指屬性數據的類型,并且使該值相對于對象的文本卡拉OK效果屬性數據為0bh;“數據_長度”指文本卡拉OK效果屬性數據中“數據_長度”之后的一部分的數據長度,單位為字節;“開始_時間”指由包含在屬性數據的“數據_字節”中的第一“卡拉OK_效果_項”指定的字符串字符的顏色改變的開始時間;“項”指示在文本卡拉OK效果屬性數據中“卡拉OK_效果_項”的數目;以及“卡拉OK_項”包括“卡拉OK_效果_項”的“項”號。
接下來將描述“卡拉OK_效果_項”的詳細內容。
圖31示出了對象的文本卡拉OK效果屬性項(卡拉OK_效果_項”)的數據結構的實例。數據元素中每一個的含義如下“結束_時間”指由該項指定的字符串的字符顏色改變結束的時間,并且在該項之后存在項的情況下,它還指由下一個項指定的字符串的字符顏色變化的開始時間;“開始_位置”指由從報頭到字符的字符數表示的、其中字符顏色將被改變的字符串的第一字符的位置;“結束_位置”指由從報頭到字符的字符數表示的、其中字符顏色將被改變的字符串的最后字符的位置。
圖32示出了對象的層屬性擴展的數據結構的實例。數據元素中每一個的含義如下“屬性_id”指屬性數據的類型,并且使該值相對于對象的層屬性擴展數據為0ch;“數據_長度”指層屬性擴展數據中“數據_長度”之后的一部分的數據長度,單位為字節;
“開始_時間”指當由包含在屬性數據的“數據_字節”中的第一“層_擴展_項”指定的層值變為有效的開始時間;“項”指包含在層屬性擴展數據中的“層_擴展_項”的數目;以及“層_項”包括“層_擴展_項”的“項”號。
接下來將描述“層_擴展_項”的詳細內容。
圖33示出了對象的層屬性擴展項(層_擴展_項)的數據結構的實例。數據元素中每一個的含義如下“結束_時間”指由“層_擴展_項”指定的層值變為無效的時間,并且在該項之后存在項的情況下,它同時還指由下一個項指定的層值變為有效的時間;以及“層”指對象的層值。
圖34示出了對象元數據的AU的對象區數據400的數據結構的實例。數據元素中每一個的含義如下“vcr_start_code”指對象區數據的開始;“數據_長度”指對象區數據中“數據_長度”之后的一部分的數據長度,單位為字節;“數據_字節”指其中對象區被描述的數據部分。例如,可以使用MPEG-7的“SpatioTemporalLocator”二進制格式來描述對象區。
(11)Vclick AU單元中的編輯在對其中Vclick數據例如Vclick流被建立的運動圖像進行編輯的情況下,Vclick數據也必須被改變。在下文中,在其中運動圖像中的部分景象被刪除或連接的情況下,將描述Vclick數據的改變。
(11-1)數據結構首先,將描述用于使得能夠編輯Vclick流的簡單數據結構。
圖45示出了與圖12不同的Vclick訪問單元的報頭的數據結構。與圖12的不同在于新增加了無效_標記和時間_偏移。無效_標記和時間_偏移形成一對,并指定Vclick AU中的無效期間。無效_標記指用于指定Vclick AU中無效期間存在的標記,而時間_偏移指從Vclick_AU的開始時間的時間偏移值。將參照圖46A和46B描述該狀態。
圖46A和46B是用于說明訪問單元中的描述與運動圖像的時間軸之間相應關系的視圖。通過使用圖46A和46B,首先,有效期間、無效期間和活動期間將被清楚限定。
首先,用于運動圖像的時間將被稱為運動圖像時間。雖然最一般的是使用其中運動圖像的開始時間為0的時間軸,但是也有使除0之外的時間為運動圖像開始時間的情況,或者其中照相時間被用作運動圖像時間的情況。
接下來,用于Vclick AU的描述的時間將被稱為訪問單元時間。圖46A示出了其中使訪問單元時間的原點(時間0)為由Vclick AU的時間標記402指定的運動圖像時間的時間T的實例。對象區數據400在訪問單元時間中描述。即,在圖46A的情況下,在運動圖像時間中的時間T+t時的對象區被描述為在Vclick AU中的時間t時的對象區。如上所述,與訪問單元時間原點相應的運動圖像時間上的時間由Vclick AU的時間標記402指定,從而定義兩個時間軸的相關性。
Vclick AU的“有效期間”是其中Vclick AU的訪問單元時間和運動圖像時間被使得彼此對應、且對象屬性信息403和對象區數據400可以被調用的期間。如前面描述的,Vclick AU的有效期間從由VclickAU的時間標記指定的時間T到由文本Vclick AU的時間標記指定的時間T’(但是,當下一個Vclick AU的時間標記為T時,后面的VclickAU被檢索直到時間標記不是T的Vclick AU被找到且T’被得到)。
Vclick AU的“無效期間”是運動圖像時間中除有效期間之外的所有期間。即,該無效期間是不可能調用對象屬性信息403和對象區數據400的期間。
“活動期間”是在Vclick AU的有效期間中對象區在對象區數據400中被描述的期間。因此,即使在Vclick AU的有效期間中,對象區也不能存在于除活動期間之外的期間中。另一方面,即使對象區被描述,在它在無效期間被描述的情況下,該期間中的對象區也不是有效的。
在圖46A的實例中,運動圖像時間上與訪問單元時間原點相應的時間由Vclick AU的時間標記402指定。這是在無效_標記被設置為OFF(0)情況下的Vclick AU的有效期間和活動期間的實例。
圖46B示出了無效_標記為OFF、且時間_偏移指定Vclick AU的時間標記402對應于訪問單元時間的哪個時間(除原點之外)的情況。在該情況下,雖然運動圖像時間與訪問單元時間之間的相關性漂移了時間_偏移,但是有效期間、無效期間和活動期間的定義是完全相同的。
(11-2)Vclick流的編輯方法接下來,將描述使用圖45的Vclick AU的報頭來編輯Vclick流的方法。
圖47是用于說明在運動圖像的一部分被切掉時與運動圖像相應的Vclick流如何被編輯的視圖。在圖47的上部,AU#1、AU#2...分別指Vclick流中的Vclick AU,并且Vclick AU的有效期間在它們上方說明。例如,起始Vclick AU(AU#1)的有效期間為從0分00秒(0’00”)到0分10秒(0’10”)。雖然AU#2和AU#3具有相同的有效期間,但是它們分別具有與不同對象相關的信息。
這里,假設從0分16秒(0’16”)到0分42秒(0’42”)的運動圖像部分被切掉。
這時,因為只有與切掉的視頻部分相關的數據被包含在AU#4和AU#5中,所以兩個Vclick AU可以被刪除。
另一方面,相應于切掉的視頻部分的數據和相應于未切掉的視頻部分的數據都包含在AU#3和AU#6中。
在AU#3中,雖然必須使4秒的后面數據無效,但是這(根據Vclick AU的有效期間的定義)只可通過僅僅使順序排列的Vclick AU的時間標記為0’16”來實現。
在AU#6中,使無效_標記為1,時間_偏移的值被從0改變為2秒,并且如在圖46B的方法中一樣,使在校正之前與運動圖像的0’40”到0’42”對應的期間為無效期間,并且進一步,Vclick AU的時間標記被改變為期望使其為AU#3的有效期間結束的時間(0’16”)。最后,在AU#6之后的Vclick AU的時間標記被改變為通過減去切掉時間(在該實例的情況下為26秒)得到的值。
通過這些處理,具有圖47下部的Vclick AU結構的Vclick流被新建立,并且可以與被編輯的運動圖像一起被使用,而不會沖突。
(11-3)當Vclick流被編輯時的處理流圖48是示出了在進行編輯以刪除從時間TS到時間TE的運動圖像并且編輯Vclick流時的處理流程的流程圖。
首先,在步驟S4800,從Vclick流中指定在有效期間中包括TS的Vclick AU。但是,因為有多個Vclick AU在有效期間中包括時間TS的情況,所以Vclick流序列中的最后Vclick AU被選擇。被選擇的Vclick AU由US指代。
在步驟S4801,從Vclick流中指定在有效期間中包括TE的VclickAU。與前面類似,有多個Vclick AU在有效期間中包括時間TE的情況,所以Vclick流序列中最前面的Vclick AU被選擇。被選擇的VclickAU由UE指代在步驟S4802,Vclick流中位于US之后、UE之前的所有Vclick AU都被從Vclick流中刪除。
在步驟S4803,UE的時間標記被改變為TS。據此,與從US的有效期間中切掉的部分相應的數據變為無效的。而且,US的無效_標記被改變為1,并且時間_偏移的值被設置使得在UE的有效期間中與切掉運動圖像部分相應的時間為無效期間。
最后,在步驟S4804,在UE之后的所有Vclick AU的時間標記的值被改變為通過減去切掉運動圖像的時間后得到的值。
根據上述處理,在運動圖像的一部分被刪除的情況下,變得可能通過部分數據改變來進行編輯,而無需從頭開始重新建立與該運動圖像相應的Vclick流。
(11-4)運動圖像數據具有適于進行編輯的結構的情況接下來,將描述當運動圖像數據具有適于進行編輯的結構時,能夠通過使用該結構而容易進行Vclick流的編輯的方法。
因為運動圖像一般在連續的幀之間包括類似的圖像,所以其通常使用相鄰幀的信息被壓縮。雖然這導致高的壓縮效率,但是例如刪除部分視頻部分的編輯難以進行。
然后,如同MPEG的GOP(圖片組)或者DVD視頻的VOB(視頻對象),通常使用使一些連續幀成組、并且可以在其中完成解碼的結構。在該情況下,雖然在一個幀的單元中的編輯仍舊很困難,但是在GOP或VOB的單元中的編輯可以被進行而無需再次進行壓縮。
如上所述,在運動圖像在GOP或VOB的單元中被編輯的情況下,當使Vclick流中Vclick AU的有效期間與運動圖像的GOP或VOB一致時,更便于編輯。
圖49示出了其中使得運動圖像數據的VOB結構與Vclick流中的Vclick AU結構一致的結構實例。在該實例中,每一個VOB對應于一個或多個Vclick AU,一個Vclick AU僅對應于一個VOB。在采用如上所述的結構的情況下,當運動圖像在VOB的單元中被編輯時,Vclick流只需要在Vclick AU的單元中被編輯。例如,在其中VOB#5和VOB#6被如圖50所示刪除的情況下,相應的AU#9、AU#10和AU#11在Vclick流中被刪除。雖然AU#12之后的Vclick AU的時間標記最終必須被重寫,但是沒有必要改變其它數據,因此,可以非常容易地進行處理。
(12)包括無效期間的Vclick AU的解碼處理將給出在包括用于指定無效期間的時間_偏移數據的Vclick流被解碼時的處理程序的描述。
圖51是用于說明在元數據解碼器217中的處理流程的實例的視圖。
首先,在步驟S5100,進行初始化處理。這包括例如將初始值替換為在處理中使用的變量的處理,用于保護將被使用的存儲器的處理,以及用于初始化被保護存儲器的處理。在該處理中還進行當前整備復制的運動圖像的時間T的值的初始化。
在步驟S5101,進行將Vclick AU的數據存儲到元數據解碼器217的存儲器中的處理。當該處理被首先進行時,Vclick流中的起始VclickAU被存儲。但是,在隨機訪問時,Vclick流中的不完全Vclick AU被首先存儲。在步驟S5101的處理不是第一個的情況下,在當前正被處理的Vclick AU下一個的Vclick AU被存儲。但是,在存在具有相同時間標記的多個Vclick AU的情況下,所有Vclick AU都被存儲。Vclick AU的數據在合適的定時被從緩沖器209輸入。
在步驟S5202,Vclick AU的時間標記的值被替換為變量T0。
類似地,在步驟S5103,由Vclick AU的時間偏移指定的時間被替換為變量TA。
在步驟S5104,進行將當前被復制的運動圖像的時間T轉變為由對象區數據400使用的時間的處理。雖然在對象區數據中可以使用各種時間軸,但是典型的方法包括使用使Vclick AU報頭的時間為0的時間軸的方法,以及原樣使用運動圖像時間的方法。在使用使VclickAU報頭的時間為0的時間軸的情況下,運動圖像時間T對應于對象區數據的時間T-T0+TA。另一方面,在原樣使用運動圖像時間的情況下,運動圖像時間T對應于對象區數據的時間T+TA。在步驟S5104,進行如上所述的時間轉變。
然后,在步驟S5105,與被轉變的對象區數據時間相應的對象區被復制。
在步驟S5106,正被復制的運動圖像的時間T被更新。該時間可以從接口處理器207收到。
在步驟S5107,判斷當前正被處理的Vclick AU是否是Vclick流中的最后Vclick AU。如果是最后的,那么處理結束,如果不是最后的,那么處理進行到步驟S5108。
在步驟S5108,進行分支處理,并且判斷當前正被處理的VclickAU下一個的Vclick AU的時間標記是否是T或更大。當是T或更大時,接下來進行步驟S5101,當小于T時,接下來進行步驟S5104。
通過上述處理,與正被復制的運動圖像時間相應的對象區總是在元數據解碼器中被復制。因此,當用戶點擊屏幕上的對象時,可以立刻進行用于指定被點擊對象的處理。此外,變得可能進行用于清楚表示屏幕上可點擊對象的處理。
(改變的實例)順便提一下,本發明不嚴格限于上述實施例,在實踐階段,結構元素可以被進行各種改變,并且可以包含在本發明的范圍內而不脫離其要旨。
(1)改變的實例1例如,本發明不僅可以應用于當前在全球范圍內流行的DVD-ROM視頻,而且可以應用于其需求在近年來快速增長的可記錄/可復制DVD-VR(視頻記錄器)。此外,本發明還可以應用于在不久的將來似乎流行的下一代HD-DVD的復制系統或記錄系統。
(2)改變的實例2此外,通過適當組合實施例中公開的多個結構元素,可以構造各種發明。例如,一些結構元素可以從實施例中公開的所有結構元素中被刪除。此外,不同實施例的結構元素可以被適當組合。
權利要求
1.一種元數據的數據結構,所述元數據與運動圖像相關,且具有包括一個或多個訪問單元的流數據結構,所述每一個訪問單元是能夠被單獨處理的數據單元,其中,訪問單元中每一個包括第一數據,其確定訪問單元時間中的基準時間,以使作為用于元數據描述的時間的訪問單元時間對應于作為用于運動圖像的時間的運動圖像時間;對象區數據,描述運動圖像中的時空區;以及第二數據,包括用于指定與時空區相關的顯示方法的數據和用于指定在時空區被指定時將進行的處理的數據的兩者之一或者兩者,并且,其中,基于第一數據中的基準時間使運動圖像時間對應于訪問單元時間,并且作為至少第二數據可以被調用的期間的有效期間被指定。
2.根據權利要求1的元數據的數據結構,其中,第一數據包括用于指定與有效期間的開始時間相應的訪問單元時間的時間的數據。
3.根據權利要求1的元數據的數據結構,其中,運動圖像被壓縮,并且使與其中被壓縮的運動圖像可以被單獨解碼的幀設置對應的時間部分為訪問單元的有效期間。
4.根據權利要求3的元數據的數據結構,其中,運動圖像以MPEG被壓縮,并且使與MPEG的GOP相應的時間部分為訪問單元的有效期間。
5.根據權利要求3的元數據的數據結構,其中,運動圖像是DVD視頻,并且使與DVD視頻的VOB相應的時間部分為訪問單元的有效期間。
6.一種與運動圖像相關的元數據的編輯方法,其中,元數據具有包括一個或多個訪問單元的流數據結構,所述每一個訪問單元是能夠被單獨處理的數據單元,其中,訪問單元中每一個包括第一數據,其確定訪問單元時間中的基準時間,以使作為用于元數據描述的時間的訪問單元時間對應于作為用于運動圖像的時間的運動圖像時間;對象區數據,描述運動圖像中的時空區;以及第二數據,包括用于指定與時空區相關的顯示方法的數據和用于指定在時空區被指定時將進行的處理的數據的兩者之一或者兩者,并且,其中,基于第一數據中的基準時間使運動圖像時間對應于訪問單元時間,并且作為至少第二數據可以被調用的期間的有效期間被指定,并且當元數據被編輯時,在訪問單元的單元中進行刪除或添加。
7.一種與運動圖像相關的元數據的編輯方法,其中,元數據具有包括一個或多個訪問單元的流數據結構,所述每一個訪問單元是能夠被單獨處理的數據單元,其中,訪問單元中每一個包括第一數據,其確定訪問單元時間中的基準時間,以使作為用于元數據描述的時間的訪問單元時間對應于作為用于運動圖像的時間的運動圖像時間;對象區數據,描述運動圖像中的時空區;以及第二數據,包括用于指定與時空區相關的顯示方法的數據和用于指定在時空區被指定時將進行的處理的數據的兩者之一或者兩者,并且,其中,基于第一數據中的基準時間使運動圖像時間對應于訪問單元時間,并且作為至少第二數據可以被調用的期間的有效期間被指定,在元數據被編輯時,只有訪問單元中每一個的第一數據和第二數據被重寫,并且除第一數據和第二數據之外的數據不被重寫。
8.一種與運動圖像相關的元數據的編輯裝置,其中,元數據具有包括一個或多個訪問單元的流數據結構,所述每一個訪問單元是能夠被單獨處理的數據單元,其中,訪問單元中每一個包括第一數據,其確定訪問單元時間中的基準時間,以使作為用于元數據描述的時間的訪問單元時間對應于作為用于運動圖像的時間的運動圖像時間;對象區數據,描述運動圖像中的時空區;以及第二數據,包括用于指定與時空區相關的顯示方法的數據和用于指定在時空區被指定時將進行的處理的數據的兩者之一或者兩者,并且,其中,基于第一數據中的基準時間使運動圖像時間對應于訪問單元時間,并且作為至少第二數據可以被調用的期間的有效期間被指定,并且其中,元數據的編輯裝置包括用于在元數據被編輯時在訪問單元的單元中進行刪除或增加編輯的處理部分。
9.一種與運動圖像相關的元數據的編輯裝置,其中,元數據具有包括一個或多個訪問單元的流數據結構,所述每一個訪問單元是能夠被單獨處理的數據單元,其中,訪問單元中每一個包括第一數據,其確定訪問單元時間中的基準時間,以使作為用于元數據描述的時間的訪問單元時間對應于作為用于運動圖像的時間的運動圖像時間;對象區數據,描述運動圖像中的時空區;以及第二數據,包括用于指定與時空區相關的顯示方法的數據和用于指定在時空區被指定時將進行的處理的數據的兩者之一或者兩者,其中,基于第一數據中的基準時間使運動圖像時間對應于訪問單元時間,并且作為至少第二數據可以被調用的期間的有效期間被指定,并且其中,元數據的編輯裝置包括用于在元數據被編輯時進行只重寫訪問單元每一個中的第一數據和第二數據的編輯、而不重寫除第一數據和第二數據之外的數據的處理部分。
10.一種用于使計算機實現與運動圖像相關的元數據的編輯方法的程序,其中,元數據具有包括一個或多個訪問單元的流數據結構,所述每一個訪問單元是能夠被單獨處理的數據單元,其中,訪問單元中每一個包括第一數據,其確定訪問單元時間中的基準時間,以使作為用于元數據描述的時間的訪問單元時間對應于作為用于運動圖像的時間的運動圖像時間;對象區數據,描述運動圖像中的時空區;以及第二數據,包括用于指定與時空區相關的顯示方法的數據和用于指定在時空區被指定時將進行的處理的數據的兩者之一或者兩者,其中,基于第一數據中的基準時間使運動圖像時間對應于訪問單元時間,并且作為至少第二數據可以被調用的期間的有效期間被指定,并且其中,元數據的編輯方法的程序實現當元數據被編輯時在訪問單元的單元中進行刪除或增加的編輯功能。
11.一種用于使計算機實現與運動圖像相關的元數據的編輯方法的程序,其中,元數據具有包括一個或多個訪問單元的流數據結構,所述每一個訪問單元是能夠被單獨處理的數據單元,其中,訪問單元中每一個包括第一數據,其確定訪問單元時間中的基準時間,以使作為用于元數據描述的時間的訪問單元時間對應于作為用于運動圖像的時間的運動圖像時間;對象區數據,描述運動圖像中的時空區;以及第二數據,包括用于指定與時空區相關的顯示方法的數據和用于指定在時空區被指定時將進行的處理的數據的兩者之一或者兩者,其中,基于第一數據中的基準時間使運動圖像時間對應于訪問單元時間,并且作為至少第二數據可以被調用的期間的有效期間被指定,并且其中,元數據的編輯方法的程序實現在元數據被編輯時只重寫訪問單元每一個中的第一數據和第二數據、而不重寫除第一數據和第二數據之外的數據的編輯功能。
全文摘要
在運動圖像被編輯的情況下,必須重新建立與該運動圖像相關的元數據,因此編輯處理變得復雜。然后,提供了其中元數據編輯可以容易進行的數據結構。元數據包括一個或多個訪問單元的流數據結構,所述每一個訪問單元是能夠被單獨處理的數據單元,并且訪問單元中每一個包括第一數據,其確定訪問單元時間中的基準時間,以使作為用于元數據描述的時間的訪問單元時間對應于作為用于運動圖像的時間的運動圖像時間;對象區數據,描述運動圖像中的時空區;以及第二數據,包括用于指定與時空區相關的顯示方法的數據和用于指定在時空區被指定時將進行的處理的數據的兩者之一或者兩者。基于第一數據中的基準時間使運動圖像時間對應于訪問單元時間,并且作為至少第二數據可以被調用的期間的有效期間被指定。
文檔編號G11B27/034GK1717054SQ200510080909
公開日2006年1月4日 申請日期2005年6月28日 優先權日2004年6月28日
發明者金子敏充, 井田孝, 大盛善啟, 三田雄志, 松本信幸, 山本晃司, 增倉孝一, 竹島秀則, 田口安則, 五十川賢造 申請人:株式會社東芝