專利名稱:生成多媒體盤的方法
技術領域:
本發(fā)明總體上涉及編輯實現了多媒體的盤。
背景技術:
數字相機的應用在近些年與日俱增。因此商用和個人所持有的數字圖像文件的數量也相應地增長了。與壁櫥中滿是隨意裝有相片的鞋盒的問題非常相似,在數字環(huán)境中,存在著裝滿了隨意存儲的數字圖像的計算機“鞋盒”。這就導致了在定位這些數字文件和將其分類的過程中出現了一些問題,特別是對于圖形圖像的數字文件,即數字圖形文件。
傳統(tǒng)的相冊存儲了相片。這些相片被放置在相冊中并且經常被加上了注解以標示該相片的特定信息。電子相冊能夠通過與傳統(tǒng)相冊相似的方法存儲數字圖形圖像。伊士曼柯達公司已經開發(fā)了一些數字圖形相冊的應用軟件,例如Kodak Picture Page或者Kodak MemoryAlbum軟件,這種軟件允許用戶將數字圖形圖像組織成相冊頁。用戶可以通過不同的方法組織這些圖像,例如通過時間、地點或主題。該軟件可以允許用戶通過輸入文本或描述該數字圖形圖像的其他信息來給該數字圖形圖像加上注釋。
一個電子相冊所包含的數字圖形圖像,除了來自電子相冊的擁有者/用戶之外,可能還有許多來源。例如,該數字圖形圖像可能是利用數字相機拍攝的,或者是相片經掃描并轉變成數字格式的。作為替換方案,該數字圖形圖像也可能是通過電子方法產生的,比如通過圖形軟件程序或照片編輯軟件程序。圖形圖像的私人或商業(yè)來源,例如庫存式照片經銷商以及共享照片資源,如因特網。將數字圖形圖像通過因特網下載到個人計算機并放置于數字相冊中,從而可以對這些數字圖形圖像加以訪問。在單一的數字圖形相冊中,多媒體數字圖形相冊可以包括數字靜止圖像、計算機生成的圖形,以及例如視頻剪輯、音頻剪輯和語音注釋的項目。
可能希望將數字相冊轉移到另一個數字媒體,例如實現了多媒體的盤上,從而能夠使用市場上能買到的大眾型用戶設備進行觀看,并且能夠在多種用戶設備上播放,該設備包括用戶視聽設備以及計算機。
已經公開的用于多媒體編輯的方法包括美國專利第5592602號(Edmunds等),該專利涉及在多媒體技術的編輯過程中用于操縱屏幕目標的編輯工具;美國專利第5907704號(Gudmundson等),該專利涉及用于編輯交互式多媒體應用程序的系統(tǒng);以及美國專利第5515490號(Buchanan等),該專利涉及用于自動瞬時格式化多媒體文件的系統(tǒng)和方法。然而,這些參考文獻均未涉及如何編輯多媒體數字圖形相冊。
在用于多媒體編輯的個人計算機中可以利用一些軟件應用程序。例如,由Ulead系統(tǒng)公司提供的Ulead VideoStudio V5.0,該程序在www.ulead.com中進行了說明。
然而,對于能夠兼容于個人計算機和用戶視聽設備的多媒體盤的生成方法的需求仍然存在。同樣,能夠使用不同的系統(tǒng)訪問該多媒體盤。對于用于編輯實現了多媒體的盤的方法的需求也同樣存在,該實現了多媒體的盤可以包括基于PC的軟件應用程序和/或與PC兼容的數字圖像,并且包含能夠在各種用戶設備上播放的多媒體數字圖形相冊。
本發(fā)明提供一種生成實現了多媒體的盤的方法,該盤與個人計算機和用戶視聽設備相兼容,借此能夠使用不同的系統(tǒng)訪問該多媒體盤。該方法用于編輯實現了多媒體的盤,所述實現了多媒體的盤包含基于PC的軟件應用程序和/或與PC兼容的數字圖像,并且包含能夠在各種用戶設備上播放的多媒體數字相冊。
發(fā)明內容
本發(fā)明的一個目的是提供一種生成多媒體盤的方法。
本發(fā)明的另一個目的是提供這樣一種方法,其中該盤與個人計算機和用戶視聽設備相兼容。
本發(fā)明的又一個目的是提供這樣一種方法,其中該盤可包括基于PC的軟件應用程序和/或與PC兼容的數字圖像,并且包含能夠在各種用戶設備上播放的多媒體數字相冊。
這些目的僅以示例的方式給出,而且這些目的可以作為本發(fā)明的一個或多個實施例可仿效的范例。通過公開本發(fā)明而自然實現的其他希望的目的和優(yōu)點對于本領域技術人員來講,都是可能發(fā)生并且顯而易見的。本發(fā)明通過附加的權利要求書進行限定。
根據本發(fā)明的一個方面,提供了一種生成多媒體盤的方法。該方法包括以下步驟訪問多幅數字靜止圖像;生成單一的MPEG比特流,該比特流包含多幅數字靜止圖像中的至少一幅;訪問多幅數字靜止圖像中的至少一幅;生成說明文件,該文件定義了一個包含了MPEG比特流以及多幅數字靜止圖像中的至少一幅的文件結構;解譯該說明文件,以生成該多媒體盤的盤圖像;利用該盤圖像生成多媒體盤。
根據本發(fā)明的另一方面,提供了一種生成多媒體盤的方法。該方法包括以下步驟訪問多幅數字靜止圖像;生成單一的MPEG比特流,該比特流包含多幅數字靜止圖像中的至少一幅數字靜止圖像;訪問多幅數字靜止圖像中的至少一幅數字靜止圖像;依照圖像處理和再現(rendering)的軟件應用程序,將多幅數字靜止圖像中的至少一幅數字靜止圖像格式化為JPEG圖像;生成說明文件,該文件定義了一個包含圖像處理和再現的軟件應用程序、MPEG比特流和JPEG圖像的文件結構;解譯該說明文件,以生成該多媒體盤的盤圖像;利用該盤圖像生成多媒體盤。
根據本發(fā)明的又一方面,提供了一種生成多媒體盤的方法。該方法包括以下步驟訪問多幅數字靜止圖像;生成第一MPEG比特流,該比特流包含多幅數字靜止圖像中的第一幅圖像;使第一圖像位置與第一MPEG比特流相關聯(lián);生成包含多幅數字靜止圖像中的第二幅圖像的第二MPEG比特流;使第二圖像位置與第二MPEG比特流相關聯(lián);為用戶提供用于選擇相冊選項的選擇裝置;訪問與第一MPEG比特流相關聯(lián)的第一圖像位置,以便訪問多幅數字靜止圖像中的第一幅圖像;訪問與第二MPEG比特流相關聯(lián)的第二圖像位置,以便訪問多幅數字靜止圖像中的第二幅圖像;依照圖像處理和再現的軟件應用程序分別對多幅數字靜止圖像中的第一幅和第二幅圖像進行格式化,以便生成第一和第二JPEG圖像;生成說明文件,該文件定義了一個包含第一和第二MPEG比特流、第一和第二JPEG圖像以及圖像處理和再現的軟件應用程序的文件結構;解譯該說明文件,從而生成該多媒體盤的盤圖像;利用該盤圖像生成多媒體盤。
通過對以下相應的附圖所示的發(fā)明優(yōu)選實施例所進行的更加詳細的描述,本發(fā)明前述的以及其他目的、特征和優(yōu)點將變得顯而易見。
圖1表示適合實施符合本發(fā)明的方法的系統(tǒng);圖2表示依照本發(fā)明第一實施例的用于生成多媒體盤的方法的流程圖;圖3表示圖2所示方法的示范性的屏幕;圖4表示圖3的示范性屏幕,其顯示了多幅數字靜止圖像;圖5表示圖2所示方法的一個步驟的流程圖;圖6表示圖2所示方法的另一個步驟的流程圖;圖7表示盤的結構;圖8表示圖7中的盤結構的軌道;圖9表示用于提供一個與Picture CD兼容的目錄結構的存儲器;圖10表示依照本發(fā)明第二實施例的用于生成多媒體盤的方法的流程圖;圖11表示圖10所示方法的示范性的屏幕;圖12表示圖3的示范性屏幕,其顯示了多幅數字靜止圖像以及軟件應用程序的選擇;圖13表示圖10所示方法的一個步驟的流程圖;圖14表示XML文件的腳本,從而將JPEG文件加入多媒體盤中。
以下參照附圖對本發(fā)明優(yōu)選實施例進行詳細說明,其中在各幅附圖中相同的附圖標記表示相同的結構部件。
具體實施例方式
參考共同轉讓的以Loui等人的名義于2002年6月10日提交的歐洲申請第02077246.3號,題為“用于在光盤上記錄多媒體信息的系統(tǒng)和方法(SYSTEM AND METHOD FOR RECORDING MULTIMEDIA INFORMATIONON AN OPTICAL DISC)”,該申請被轉讓給本申請的受讓人。
術語“多媒體”指包含或涉及多個媒體。優(yōu)選地,該媒體用于生成數字圖形相冊。該多媒體素材包含多種媒體素材,從而提供了豐富和充足的環(huán)境和圖像表達,并且使觀察者在觀看時享受到更多的樂趣。這樣的多媒體素材可以包括但不限于圖像、音頻、視頻和它們的任何組合。
本發(fā)明提供一種用于編輯實現了多媒體的盤的方法,該盤包含基于計算機(諸如個人計算機)的內容以及多媒體數字圖形相冊。例如,該盤上的基于計算機的內容可能包含相冊的原始圖像/視頻/音頻(即相冊原始內容)。如果將原始內容置于與相冊相同的盤上,那么該原始內容能夠被輕易地共享、傳送、觀看、打印、電子郵件收發(fā),和/或被用于網站中。通過舉例說明,在用戶設備上觀看了該相冊之后,觀看者可能希望獲得相冊中觀看過的圖像之一的打印件。如果原始內容置于該盤上,那么觀看者能夠通過個人計算機使用該盤,從而輕易地獲得想要的圖像。
此外,基于計算機的內容可以是軟件應用程序。在優(yōu)選實施例中,該軟件應用程序是圖像處理和再現的軟件應用程序。例如可從伊士曼柯達公司獲得的Picture CD。如果包含了軟件應用程序就能允許用戶使用他們的個人計算機以及使用電視機觀看到置于該盤上的圖像。用戶可以利用個人計算機編輯和/或增強圖像、傳送圖像(例如電子郵件)、打印圖像等等??梢允褂眉矣糜嬎銠C在用戶家里完成打印,或者通過在線服務,例如柯達公司的Ofoto在遙遠的地點完成打印。
圖1表示適合實施符合本發(fā)明的方法的系統(tǒng)10。系統(tǒng)10包含處理單元11和用于與用戶交流的輸入裝置12。優(yōu)選地,輸入裝置12是顯示屏或具有觸摸屏幕界面的監(jiān)視器,可供選擇的有用戶可以使用的鍵盤14或其他輸入裝置(諸如鼠標或軌跡球)。系統(tǒng)10可以是獨立系統(tǒng)或通過網絡連接的系統(tǒng)13。此外,該系統(tǒng)可被安置在住宅中或住宅外,例如零售店、專業(yè)照相室、或其他商業(yè)街道中。如果設置在住宅中,則該系統(tǒng)10可以由家用個人計算機構成。如果設置在住宅外,則該系統(tǒng)10可以由信息站構成,例如Kodak Picture Maker(來自伊士曼柯達公司)等。如果是通過網絡連接的系統(tǒng),則該連接可以安置在處理單元11內部或其外部。到因特網的連接15以及到其他系統(tǒng)的連接19都是希望的,例如連接到照相洗印加工裝置或連接到諸如Kodak Picture Maker的信息站。
多媒體素材可以包括獨立或組合獲取的數字圖像、音頻和視頻。因此,系統(tǒng)10可以包括輸入端口16以用于提供/獲得數字圖像、音頻和視頻。輸入端口16的實例包括CD驅動器、DVD-ROM驅動器、閃存卡或記憶卡讀取器、軟盤驅動器、麥克風等等。系統(tǒng)10還包括媒體生成裝置17,用于產生可記錄光盤,例如用于生成實現了多媒體的盤的CD/DVD刻錄機。
系統(tǒng)10可被設置為訪問來自不同來源的圖像,如圖1中所示的圖像18。該圖像可以是使用數字相機拍攝的,即數字靜止圖像。作為替換方案,數字靜止圖像也可以從利用攝影膠片拍攝的圖像中獲得,其中該圖像經過沖印、掃描并且轉變?yōu)閿底指袷?。該數字靜止圖像可以存儲在軟盤、壓縮盤、記憶卡或閃存卡上。相應地,系統(tǒng)10可以利用輸入端口16作為輸入數字靜止圖像的裝置。系統(tǒng)10中的圖像18可以包括由特定主題的圖像組成的圖像數據庫,該特定主題的圖像諸如婚禮、生日聚會、嬰兒出生以及畢業(yè)典禮的場景。該數據庫也可以包含區(qū)域特色的圖像,例如受歡迎的游覽勝地、國家紀念碑、國家公園以及歷史遺跡的景象。此外,圖像還可以包含卡通角色、動畫以及圖形技術。同樣,該圖像也可以通過因特網、網絡或別的系統(tǒng)從其他可利用的來源中選取。
用于圖像18的輸入格式包括BMP、DCS、DIB、EXIF、FlashPix、IMPS、JPEG、JPEG2000、PhotoCD、PPM、TIFF以及Raw圖像格式。
圖像18可以是背景圖像,例如用于扉頁、目錄和/或用于為其他圖像鑲邊/裝框,與如何為懸掛于貼了壁紙的墻壁上的圖片鑲邊/裝框相似。如同用于數字靜止圖像的輸入格式一樣,用于背景圖像的輸入格式也包括BMP、DCS、DIB、EXIF、FlashPix、IMPS、JPEG、JPEG2000、PhotoCD、PPM、TIFF以及Raw圖像格式。
也可以包括音頻素材,如圖1中的音頻20。如同圖像18一樣,音頻20也可以從不同來源中選取。例如,依照本發(fā)明的系統(tǒng)可以包括具有多個音頻剪輯的音頻數據庫,該音頻剪輯具有不同的風格,例如輕音樂、古典樂、搖滾以及特定主題的,例如用于婚禮、生日聚會、嬰兒出生和畢業(yè)典禮的音樂。系統(tǒng)10可以利用輸入端口16來提供用于以數字形式輸入音頻的裝置,該數字形式的音頻來自例如記憶卡、閃存卡或其他類似的裝置。這樣的輸入端口允許用戶提供親自編寫的音樂組成部分。音頻素材也可以通過因特網、網絡或別的系統(tǒng)從其他可利用的來源中選取。
除了音樂,該音頻數據庫可以包含語音剪輯。例如從有名的小說、戲劇或電影中引用的部分,以及諸如演員和政治家等名人的聲音。利用輸入端口16,用戶可以提供個人語音剪輯。例如,如果輸入端口16包含麥克風,那么就可以錄制個人的語音剪輯了。當用戶希望用數字相機為他們的圖像加上注釋時,可以利用這個特征。同樣,每幅圖像將包括與之相關聯(lián)的語音文件(例如.wav文件)。由此產生的具有這個特征的多媒體數字圖形相冊將與敘事放映幻燈片相似,或者具有相似的感覺。
用于音頻的輸入格式包括Wave文件、MP3、音樂CD音頻、Apple/SGI格式(.AIFF、.AIF)、Sun音頻(.AU)以及Creative Lab格式(.VOC)。
也可以包括視頻素材。該視頻可以從不同的來源中選取,如圖1所示的視頻22。例如,依照本發(fā)明的系統(tǒng)10可以包括視頻數據庫。該數據庫可能包含多個視頻剪輯,該視頻剪輯是特定主題的,諸如婚禮、生日聚會、嬰兒出生以及畢業(yè)典禮的場景??梢岳幂斎攵丝?6來完成視頻的輸入。例如,來自軟盤、記憶卡、閃存卡或其他類似的裝置。這樣的輸入端口允許用戶提供親自編寫的視頻組成部分。視頻圖像也可以通過因特網、網絡或別的系統(tǒng)從其他可利用的來源中選取。
該視頻可被作為移動的背景,并且可以伴有音頻,也可以不伴有音頻。作為替換方案,該視頻可以由多幅靜止圖像組成,并且可以伴有音頻,也可以不伴有音頻。
用于視頻的輸入格式包括MPEG-1、MPEG-2、MPEG-4、H.261、H.262、H.263、CCIR601(數字視頻標準)、AVI(MS Windows媒體格式)、Quicktime、DV(來自于數字視頻便攜攝像機)和real視頻(Real網絡)。
系統(tǒng)10也可以包括注釋裝置24。即用于實時文本注釋和語音注釋的裝置。注釋可被加入作為標題的一部分,或者用于為多媒體數字圖形相冊加上字幕。例如,對于語音輸入,注釋裝置24可以包含麥克風和將語音轉變?yōu)槲谋镜膬戎谜Z音-文本引擎。這樣的注釋裝置優(yōu)選地包括一個界面(例如鍵盤)以允許用戶進行校正。
該數據庫(用于圖像、音頻或視頻)可以是一個現有的由庫存式圖像組成的數據庫,或一個私人數據庫。庫存式數據庫通常要求用戶交付版權費才能訪問圖形素材,并且或許還會征收基本的訂閱費。
媒體生成裝置17,例如用于CD-R和DVD可記錄盤的刻錄機/生成器是市場上可以買到的裝置??梢再徺I這些裝置以供家用。為了實現快速的寫入處理,優(yōu)選使用高速刻錄機(高于4倍)。通過媒體生成裝置17可以生成各種實現了多媒體的盤,例如VCD(視頻壓縮盤)、SVCD(超級視頻壓縮盤)或者DVD(數字視頻盤)。用于以上每種實現了多媒體的盤的播放器適于作為用戶視聽設備。VCD和SVCD都使用CD媒體,而DVD使用DVD媒體。相應地,當希望VCD時,生成VCD圖像并且優(yōu)選地連同預設菜單一起被燒刻成最終的VCD(利用媒體生成裝置17)。相似地,當希望SVCD時,就生成了SVCD圖像并且優(yōu)選地連同預設菜單一起被燒刻成最終的SVCD(利用媒體生成裝置17)。同樣,當希望DVD時,就生成了DVD圖像并且優(yōu)選地連同預設菜單一起被燒刻成最終的DVD(利用媒體生成裝置17)。
圖2表示依照本發(fā)明第一實施例的用于生成多媒體盤的方法的流程圖。在步驟110中,啟動編輯應用程序。加載圖像(步驟120)并且生成多媒體組成部分(步驟130)。在步驟140中,對該組成部分編碼。選擇處理和再現的軟件應用程序(步驟150)。然后,利用媒體生成裝置17生成該盤(步驟160)?,F在將參照附圖3到9更具體地描述這些步驟。
步驟110表示在系統(tǒng)10中啟動編輯應用程序。啟動步驟包括如圖3所示的圖形用戶界面(GUI)基礎操作系統(tǒng)的初始化。如圖3所示,編輯應用程序顯示了屏幕30,該屏幕包括表示編輯應用程序特征的圖標/字符/圖形(下文中的圖標32)以及圖像顯示區(qū)域34。例如文件夾、音樂、時間、語音和視頻。
通過訪問數字靜止圖像完成步驟120。優(yōu)選地,訪問多幅數字靜止圖像。如上所述,可以訪問來自不同來源的圖像,包括來自圖像數據庫18的圖像。參照圖4,多幅圖像I1-I6已被訪問并被顯示在圖像顯示區(qū)域34中。
在步驟130中生成數字圖形相冊的組成部分。該生成過程可以包括選擇包含于組成部分中的圖像、添加背景圖像、音頻、視頻、語音注釋、音樂并指示特定圖像顯示的持續(xù)時間。圖標32可以用于在組成部分生成過程中輔助用戶。例如,音樂圖標(如圖4中的32a所示)可以被用作用戶指示在圖像放映中添加音樂的手段。如圖4所示,通過在圖像顯示區(qū)域34中接近圖像的位置顯示音樂圖標,使得I1-I6中的每一幅圖像與音樂相關聯(lián)。
生成組成部分的過程在 共同轉讓的以Loui等人的名義于2002年6月10日提交的歐洲申請第02077246.3號,題為“用于在光盤上記錄多媒體信息的系統(tǒng)和方法(SYSTEM AND METHOD FOR RECORDINGMULTIMEDIA INFORMATION ON AN OPTICAL DISC)”中得到了更具體地描述。
在步驟140中,當已經生成了組成部分時,對包含該組成部分的圖像編碼以生成單一的MPEG比特流。也就是說,所生成的單一MPEG比特流包含所選取的圖像。
在步驟150中,選擇了圖像處理和再現的軟件應用程序,并且依照所選取的圖像處理和再現的軟件應用程序,將包含該組成部分的數字靜止圖像格式化為JPEG圖像。優(yōu)選的圖像處理和再現的軟件應用程序是從伊士曼柯達公司獲得的柯達Picture CD。也可以使用其他圖像處理和再現的軟件應用程序,諸如ACD系統(tǒng)公司的ACDSee。屏幕30上的圖標能夠用來指示軟件應用程序的選擇。這個步驟將在下面進行更具體地描述。
在對數字靜止圖像進行了格式化并生成了單一MPEG比特流之后,就可以生成該多媒體盤了(步驟160)。特別是,所生成的說明文件定義了包含圖像處理和再現的軟件應用程序、MPEG比特流和格式化JPEG圖像的文件結構。解譯這個說明文件以生成多媒體盤的盤圖像。這個步驟將在下面進行更具體地描述??梢赃x擇屏幕30上的圖標以激活/啟動步驟160。
如上所述,在步驟150中選取了圖像處理和再現的軟件應用程序,依照所選取的圖像處理和再現的軟件應用程序對包含組成部分的數字靜止圖像進行格式化?,F在參照圖5對步驟150進行更具體地描述。
在步驟151中,訪問包含組成部分的數字靜止圖像。在生成組成部分的過程中,可以多次使用一幅特定的數字靜止圖像。同樣,可以具有數字靜止圖像的副本。在步驟152中,如果希望的話,可以確定這個副本。如果確定了,該副本也可以被刪除。在步驟153中,可以修改每幅數字靜止圖像的特征。這些修改包括音頻(諸如音樂)、文本注釋、語音注釋和圖形。例如,文本或語音注釋可以被添加到圖像中,也可以從圖像中刪除,或者可以修改文本或語音注釋,包括字體、大小、顏色、音量等等。在另一個實例中,音樂剪輯可能與一幅或多幅數字靜止圖像是相關聯(lián)的,而可能希望刪除/改變這種關聯(lián)關系。或者,音樂剪輯可能不與該特定的數字靜止圖像相關聯(lián),而可能希望添加這種關聯(lián)關系。
一旦該數字靜止圖像是用戶所希望的形式,系統(tǒng)10就依照所選取的圖像處理和再現的軟件應用程序將該數字靜止圖像格式化為JPEG圖像(步驟154)。也就是說,該圖像以與再現的軟件應用程序相一致的方式被轉變。繼而生成了XML文件結構(步驟155)。
如上所述,在步驟160中生成了多媒體盤?,F在參照圖6更具體地描述這個步驟。在步驟161中解譯了該XML文件(即說明文件)并對該文件結構進行解碼從而生成盤圖像。由步驟161生成的盤圖像可以是不同的用于描述該盤圖像的格式。例如bin/cue文件和ISO圖像文件。然后在步驟162中,將該盤圖像(使用媒體生成裝置17)寫入多媒體盤。
當寫入時,在計算機上可以運行圖像處理和再現的軟件應用程序,并且可以利用該圖像處理和再現的軟件應用程序觀看該JPEG圖像。
該實現了多媒體的盤優(yōu)選設置為普通壓縮盤,從而使其能夠在個人計算機上觀看和操作,并且能夠被用作視頻CD(VCD)、超級視頻CD(SVCD)或DVD。相應地,對于VCD來講,具有高分辨率圖像和其他軟件應用程序(例如柯達Picture CD所提供的)的普通CD-ROM文件結構被包括在一張標準的壓縮盤中,以至于包含在MPEG比特流中的數字靜止圖像也可以被作為JPEG文件進行訪問,從而可以在個人計算機上觀看和操作它們。
編碼為數字圖像文件的數字圖像被寫入到盤結構(如圖7中所示的VCD盤結構)的軌道1中。依照盤標準,軌道1區(qū)域包含該盤的信息區(qū)域、ISO9660(CD-ROM)文件結構和其他選項,例如段播放項目區(qū)域。錄制在軌道1中的信息的更加詳細的分類在圖8中進行描述。
數字靜止圖像的編碼使該數字圖像能夠被不同的用戶設備使用,例如個人計算機,以及被圖像編輯軟件應用程序使用。圖9表示如何將數字圖像文件(JPEG數字圖像文件)和/或軟件應用程序存儲為VCD的實例。舉例說明了VCD的根目錄結構。這個目錄提供與柯達PictureCD兼容的目錄結構。該數字圖像文件存儲在圖9所示的“Pictures”目錄中。其他的軟件應用程序,例如用于觀看和編輯這些數字圖像文件的軟件應用程序可以存儲在諸如“Coolstuf”目錄或其他Picture CD目錄中。由于用于多媒體數字圖形相冊的包含于MPEG比特流中的數字靜止圖像也分開地存儲為與Picture CD兼容的JPEG圖像文件,作為結果,該多媒體盤提供了與柯達Picture CD兼容的實現了多媒體的盤。
圖10表示依照本發(fā)明第二實施例的用于生成多媒體盤的方法的流程圖。在第二實施例中,生成了多個用于存儲在多媒體盤上的圖形相冊。
在步驟110,啟動編輯應用程序。加載圖像(步驟120)并且生成多媒體組成部分(步驟130)。在步驟140中,對該組成部分編碼。由于要生成多個圖形相冊,所以對于每個相冊重復步驟120、130、140。選擇處理和再現的軟件應用程序(步驟150)。然后,利用媒體生成裝置17生成該盤(步驟160)。此外,對于各個圖形相冊的圖像位置信息也需要進行編碼(步驟170)?,F在將參照附圖10到13更具體地描述這些步驟。
如同第一實施例一樣,訪問了多幅數字靜止圖像(步驟120)。第一圖形相冊由第一多幅數字靜止圖像組成(步驟130),并且生成了相應的包含了第一多幅數字靜止圖像的第一MPEG比特流(步驟140)。使第一圖像位置與第一MPEG比特流相關聯(lián)(步驟170)。然后,在組成第二圖形相冊之前,訪問相同/另外的數字靜止圖像(步驟120)。第二圖形相冊由第二多幅數字靜止圖像組成(步驟130),并且生成相應的包含第二多幅數字靜止圖像的第二MPEG比特流(步驟140)。使第二圖像位置與第二MPEG比特流相關聯(lián)(步驟170)。
在步驟150中,將選擇裝置提供給用戶以選擇相冊選項。通過選擇嵌入的圖像處理和再現的軟件應用程序的相冊選項,這一點能夠由系統(tǒng)10來完成。優(yōu)選地,這個軟件應用程序是柯達Picture CD,并且同樣對于多個相冊來講,如圖11和12所最佳地示出的,選取了“select”選項?,F在參照圖13對這個第二實施例的步驟150進行更具體地描述。
對于每個圖形相冊重復步驟151到155。相應地,對于第二圖形相冊來講,訪問與第二MPEG比特流相關聯(lián)的第二圖像位置,從而訪問第二多幅數字靜止圖像(步驟151)。在步驟152中,確定可選擇的副本。在步驟153中,可以修改每幅數字靜止圖像特性。一旦該數字靜止圖像是用戶所希望的形式,系統(tǒng)10就依照所選取的圖像處理和再現的軟件應用程序將該數字靜止圖像格式化為JPEG圖像(步驟154)。繼而生成了XML文件結構(步驟155)。
因此,在步驟154中,依照圖像處理和再現的軟件應用程序對第一多幅和第二多幅數字靜止圖像進行了格式化,從而生成了第一和第二JPEG圖像。
在步驟155中,生成了說明文件(即XML文件),該文件定義了包含第一和第二MPEG比特流、第一和第二JPEG圖像以及圖像處理和再現的軟件應用程序的文件結構。在這個實施例中,由于出現了多個相冊,因此該說明文件包括相冊的說明部分(即如以下進一步所述的album.xml)。
如上所述,如參照圖6所述的那樣,在步驟160中生成了多媒體盤。在步驟161中,解譯了該XML文件(即說明文件)并解碼了該結構,從而生成了盤圖像。然后在步驟162中,將盤圖像(使用媒體生成裝置17)寫入該多媒體盤。
利用幾種方法可以將圖像位置信息與比特流保持在一起或使圖像位置信息與比特流相關聯(lián)。在第一種方法中,該圖像位置以文本文件的形式進行存儲。更具體地說,為每個MPEG比特流生成一個具有該圖像文件的全路徑的文本文件,并且將該文本文件設在存儲各自MPEG流的相同目錄中。
在第二種方法中,將該圖像位置嵌入在MPEG比特流中。更具體地說,將該圖像文件的全路徑名嵌入到各自的MPEG流中。這種方法的一個優(yōu)點在于,如果移動了MPEG比特流,仍然保持圖像文件的關聯(lián)關系。這可以通過MPEG-1標準(ISO/IEC11172-2)內的用戶數據域完成。特別是在MPEG-1中,可以通過MPEG視頻流的sequence_header()中的user_data_start_code將用戶專用數據插入到壓縮MPEG比特流中。以下是利用sequence_header()內的用戶數據的語句
if(nextbits()=user_data_start_code) {user_data_start_codewhile(nextbits()!=‘0000 0000 0000 0000 0000 0001’) {user_data}}user_data_start_code是十六位字符串000001B2。它標識了用戶數據的開始。該用戶數據一直繼續(xù),直到收到另一起始碼為止。根據MPEG標準,該用戶數據不會包含23個或更多零位的字符串。
值得注意的是,在本發(fā)明的一個實施例中,生成了與柯達PictureCD/Picture CD Select兼容的視頻CD,成為系統(tǒng)10編輯特征的一部分。這個特征使得可以生成一種既能在DVD播放器中播放又可以在電腦上播放的單獨的盤。當把這種復合型盤插到兼容于視頻CD標準的DVD播放器中時,該盤將作為視頻CD播放。當它被插入到PC的CD-ROM驅動器中時,其啟動柯達Picture CD應用程序,從而允許用戶觀看和操作它們的原始圖像。這種編輯特征將利用出現在系統(tǒng)編輯應用程序的用戶工作空間區(qū)域中的圖像以及預先保存在MPEG流中的圖像,自動地生成Picture CD應用程序。在這個實施例中,Picture CD文件夾包括以下文件和文件夾Coolstuf(文件夾)、Kodakpcd(文件夾)、Pcd(文件夾)、Albums(文件夾)、Album.xml、Autorun.inf、Content.dat、Info.cd、Launch.exe、eadme.wri、Startmac、PcdPreLaunch.exe,圖9中示出了其中的一部分。
在這個實施例中,系統(tǒng)10生成一個稱作Pictures的文件夾以存儲用戶的圖像。該應用程序優(yōu)選地檢查工作空間區(qū)域以及MPEG流,以便識別所要包含于Picture CD應用程序中的圖像文件名稱。然后,如果這些圖像的原始版本是其他的格式,則被轉變?yōu)镴PEG格式。本領域技術人員眾所周知的不同的圖像變換方法可以用于進行這個轉換,同時具有與標準Picture CD相近的圖像質量因數。此外,將在工作空間區(qū)域中對復制圖像進行檢查,從而使一幅唯一的圖像包含于PictureCD應用程序中。
系統(tǒng)10生成info.cd文件,其具有盤上的圖像號碼和唯一的順序標識符。
系統(tǒng)10還生成album.dtd和album.xml文件,以描述Picture CDSelect盤的相冊功能。以下的實例腳本包括了XML,以描述一個具有3幅圖像的相冊</AlbumCD>
<?xml version=″1.0″encoding=″UTF-8″?>
<!DOCTYPE AlbumCD SYSTEM ″Album.dtd″>
<AlbumCD title1=″KODAK Picture CD Select″title2=″″title3=″″>
<Album title=″Family″description=″″>
<Picture title=″″description=″″>000_1.jpg</Picture>
<Picture title=″″description=″″>000_2.jpg</Picture>
<Picture title=″″description=″″>000_3.jpg</Picture>
</Album>
如上所述,在步驟153中,可以對該數字靜止圖像進行用于注釋的修改。與圖像位置信息相似,該注釋可以存儲在文本文件中或者嵌入在MPEG比特流中。當生成了Picture CD/Picture CD Select應用程序時,用戶插入到圖像中的文本注釋可以被轉移到相同的圖像。當生成Picture CD時,將提示用戶加入這樣的注釋。可以通過以下方法將這些文本注釋與單個的圖片保持在一起并使這些文本注釋與單個的圖片相關聯(lián)(a)將包含注釋信息(諸如字體大小、顏色和位置)的文本文件設于與相應的MPEG流相同的目錄中;或(b)通過MPEG-1標準中所描述的用戶數據區(qū)域,將注釋信息(諸如字體大小、顏色和位置)嵌入到相應的MPEG比特流中。當選擇了Picture CD選項時,在圖像位于工作空間區(qū)域中的情況下,如果他/她希望將該注釋轉移到Picture CD應用程序,那么用戶將得到提示。如果是,該應用程序將自動轉移注釋以及圖片,使之包含到Picture CD/Picture CD Select中。
為了將用戶JPEG文件添加到多媒體盤中,系統(tǒng)10生成一示例性XML文件,該文件包括圖14中所示的腳本。這個示例性XML腳本包括了要被添加到與多媒體盤上的Picture CD應用程序中的3個JPEG文件的信息。此外,這個XML文件被另一應用程序解譯以生成包含最終的盤圖像的bin/cue文件。然后,該bin/cue文件被CD刻錄應用程序(諸如CDRWIN)所使用,從而生成了其上帶有Picture CD應用程序的最終的多媒體盤。(參照步驟161和162)
在第三實施例中,圖像處理和再現的軟件應用程序不包括在多媒體盤中。在這個實施例中,生成多媒體盤的方法包括以下步驟訪問多幅數字靜止圖像;生成包含多幅數字靜止圖像中的至少一幅數字靜止圖像的單一MPEG比特流;訪問多幅數字靜止圖像中的至少一幅數字靜止圖像;生成一個定義了包含MPEG比特流和多幅數字靜止圖像中的至少一幅數字靜止圖像的文件結構的說明文件;解譯該說明文件以生成多媒體盤的盤圖像;利用該盤圖像生成多媒體盤。
一種計算機程序產品可以包括一種或多種存儲媒體,例如磁存儲媒體,諸如磁盤(例如軟盤)或磁帶;光存儲媒體,諸如盤、光帶或機器可讀條形碼;固態(tài)電存儲裝置,諸如隨機存取存儲器(RAM)、或只讀存儲器(ROM);或任何用于存儲計算機程序的其他物理裝置或媒體,該計算機程序具有用于控制一個或多個計算機來實現符合本發(fā)明的方法的指令。
權利要求
1.一種生成多媒體盤的方法,該方法包括以下步驟訪問多幅數字靜止圖像;生成單一的MPEG比特流,該MPEG比特流包含多幅數字靜止圖像中的至少一幅數字靜止圖像;訪問多幅數字靜止圖像中的至少一幅數字靜止圖像;生成說明文件,該說明文件定義了包含MPEG比特流以及多幅數字靜止圖像中的至少一幅數字靜止圖像的文件結構;解譯該說明文件,以便生成該多媒體盤的盤圖像;和利用該盤圖像生成多媒體盤。
2.如權利要求1所述的方法,其中該多媒體盤是視頻CD、超級視頻CD或DVD。
3.一種生成多媒體盤的方法,該方法包括以下步驟訪問多幅數字靜止圖像;生成單一的MPEG比特流,該MPEG比特流包含多幅數字靜止圖像中的至少一幅數字靜止圖像;訪問多幅數字靜止圖像中的至少一幅數字靜止圖像;依照圖像處理和再現的軟件應用程序,將多幅數字靜止圖像中的至少一幅數字靜止圖像格式化為JPEG圖像;生成說明文件,該說明文件定義了包含圖像處理和再現的軟件應用程序、MPEG比特流和JPEG圖像的文件結構;解譯該說明文件,以便生成該多媒體盤的盤圖像;和利用該盤圖像生成多媒體盤。
4.如權利要求3所述的方法,其中圖像處理和再現的軟件應用程序可以在計算機上運行,并且該JPEG圖像可以使用該圖像處理和再現的軟件應用程序進行觀看。
5.如權利要求3所述的方法,其中圖像處理和再現的軟件應用程序是柯達Picture CD軟件應用程序。
6.一種生成多媒體盤的方法,該方法包括以下步驟訪問多幅數字靜止圖像;生成第一MPEG比特流,該MPEG比特流包含多幅數字靜止圖像中的第一幅數字靜止圖像;使第一圖像位置與第一MPEG比特流相關聯(lián);生成包含多幅數字靜止圖像中的第二幅數字靜止圖像的第二MPEG比特流;使第二圖像位置與第二MPEG比特流相關聯(lián);為用戶提供用于選擇相冊選項的選擇裝置;訪問與第一MPEG比特流相關聯(lián)的第一圖像位置,以便訪問多幅數字靜止圖像中的第一幅數字靜止圖像;訪問與第二MPEG比特流相關聯(lián)的第二圖像位置,以便訪問多幅數字靜止圖像中的第二幅數字靜止圖像;依照圖像處理和再現的軟件應用程序分別對多幅數字靜止圖像中的第一和第二數字靜止圖像進行格式化,從而生成第一和第二JPEG圖像;生成說明文件,該說明文件定義了包含第一和第二MPEG比特流、第一和第二JPEG圖像和圖像處理和再現的軟件應用程序的文件結構;解譯該說明文件,從而生成該多媒體盤的盤圖像;利用該盤圖像生成多媒體盤。
7.如權利要求6所述的方法,還包含修改多幅數字靜止圖像中的至少一幅數字靜止圖像以使之包含文本注釋、語音注釋和圖形的步驟。
8.如權利要求7所述的方法,其中將文本或語音注釋嵌入到第一MPEG比特流中。
9.如權利要求6所述的方法,還包含修改多幅數字靜止圖像中的至少一幅數字靜止圖像以使之包含音頻的步驟。
10.如權利要求9所述的方法,其中使音頻與音頻位置相關聯(lián),并且以文本文件的形式存儲該音頻位置。
全文摘要
一種生成多媒體盤的方法。該方法包括以下步驟訪問多幅數字靜止圖像;生成單一的MPEG比特流,該比特流包含多幅數字靜止圖像中的至少一幅;訪問多幅數字靜止圖像中的至少一幅;生成說明文件,該文件定義了一個包含了MPEG比特流以及多幅數字靜止圖像中的至少一幅的文件結構;解譯該說明文件,以生成該多媒體盤的盤圖像;利用該盤圖像生成多媒體盤。
文檔編號H04N5/91GK1538445SQ20041003174
公開日2004年10月20日 申請日期2004年3月25日 優(yōu)先權日2003年3月25日
發(fā)明者P·雷, A·C·路易, H·K·德沃爾斯基, P 雷, 德沃爾斯基, 路易 申請人:伊斯曼柯達公司