專利名稱:內容記錄裝置、內容記錄方法和內容記錄程序的制作方法
技術領域:
本發明涉及內容記錄裝置、內容記錄方法和內容記錄程序,具 體地涉及用于在增加搜索內容的標簽后記錄內容的內容記錄裝置、內 容記錄方法和內容記錄程序。
背景技術:
在管理諸如圖像之類內容的數據庫中,內容和與內容相關聯的 關鍵詞之類的元數據被存儲在一起,并且通過搜索關鍵詞得到目標內 容。關鍵詞由記錄內容的人來記錄。當有很多的內容要被記錄時,記 錄這些關鍵詞就會很麻煩。另外,記錄的關鍵詞是基于記錄內容的人 的主觀被選擇的,用于搜索的關鍵詞是基于搜索內容的人(下文稱搜 索者)的主觀而被選擇的。當記錄內容的人和搜索者對同一內容選擇 了不同的關鍵詞時,可能不會很容易就搜索到目標內容。為了解決基于關鍵詞選擇的搜索困難,在日本專利公開No. 10-049542中,分析了輸入圖像的一部分,從該部分的形狀、顏 色、尺寸、質地等特征中提取諸如"樹"、"人臉"之類的關鍵詞。 隨后,關鍵詞被記錄為與圖像相關聯。在日本專利公開 No. 2002-259410中,分別管理圖像之類的內容的元數據以及內容的 特征量。當新的圖像被記錄在數據庫中時,將和新圖像有相似特征量 的之前輸入的圖像的元數據賦給新的圖像。按照日本專利公開No. 10-049542中公開的發明,由于關鍵詞是 被自動提取的,所以只要了解提取方法,就可以類推地知道關鍵詞, 從而改善搜索的命中率。然而,由于關鍵詞被限制在從圖像中提取的 那些特征中,因此不能執行更寬范圍的搜索。按照日本專利公開No. 2002-259410的專利,由于之前記錄的元 數據被用于新輸入的內容,所以需要存儲相當多的內容以便有足夠多
的元數據可以用于新輸入的內容,否則,搜索精度不會得到改善。 發明內容本發明的一個目的是提供內容記錄裝置、內容記錄方法和內容 記錄程序,以自動地提供具有關鍵詞的內容,這些關鍵詞有助于對內 容進行精確的寬范圍搜索,即使所述內容只有少量的記錄數據。為了達到上述及其他的目的,本發明的內容記錄裝置包括內容 輸入裝置、標簽產生裝置、詞庫、關聯詞獲取裝置、評分獲取裝置和 內容數據庫。當通過內容輸入裝置輸入內容時,標簽產生裝置自動產 生一個標簽,在該標簽上描述表示內容特征的關鍵詞。在該詞庫中, 按照有相似意思的組對詞進行分類和排列。通過搜索詞庫,關聯詞獲 取裝置獲取該關鍵詞的關聯詞。通過使用詞庫,評分獲取裝置獲取表 示關聯詞和關鍵詞之間關聯程度的評分。內容數據庫將內容、標簽、 關聯詞和評分互相關聯地記錄在一起。標簽產生裝置包括特征提取部分、詞表、和關鍵詞選擇部分。 特征提取部分提取特征,通過分析內容或附在內容上的元數據,該特 征可以變成關鍵詞。特征和詞被相互關聯地存儲在詞表中。關鍵詞選 擇部分通過搜索詞表選擇對應于特征的詞,并在標簽中將該詞描述為 關鍵詞。當內容為圖像時,特征提取部分至少提取該圖像的一個特征顏 色。詞表互相關聯地存儲特征顏色和顏色名稱。關鍵詞選擇部分通過 搜索詞表選擇對應于特征顏色的顏色名稱,并在標簽中將該顏色名稱 描述為關鍵詞。標簽產生部分可以包括圖像識別部分和對象名稱表。圖像識別 部分識別圖像中對象的種類和/或形狀。在對象名稱表中,把對象的 種類與對象名稱相關聯地存儲,和/或把對象的形狀與形狀名稱相關 聯地存儲。此時,關鍵詞選擇部分通過搜索詞表選擇對應于對象種類 的對象名稱和/或對應于對象形狀的形狀名稱,并在標簽中將該對象 名稱和/或形狀名稱描述為關鍵詞。標簽產生裝置可以包括顏色名稱轉換表,對象名稱和/或形狀名 稱、對象的最初顏色名稱、和對應于最初顏色名稱的普通顏色名稱被 相互關聯地存儲在該顏色名稱轉換表中。此時,通過基于對象名稱和 /或形狀名稱和特征顏色的顏色名稱來搜索顏色名稱轉換表,關鍵詞 選擇部分選擇對應的最初顏色名稱,并在標簽中將對應的最初顏色名 稱描述為關鍵詞。標簽產生裝置可以包括顏色印象表,多個顏色組合和從顏色組 合得到的顏色印象被相互關聯地存儲在該顏色印象表中。此時,通過 基于由特征提取部分提取的特征顏色搜索顏色印象表,關鍵詞選擇部 分對應的顏色印象,并在標簽中將對應的顏色印象描述為關鍵詞。特征提取部分可以提取諸如內容被創建日期和之間之類的時間 信息。此時,關鍵詞選擇部分通過搜索存儲了與所述日期和時間相關 的詞的詞表來選擇與時間信息關聯的詞。在標簽中,把由關鍵詞選擇 部分選擇的詞描述為關鍵詞。特征提取部分可以提取諸如創建內容的地點之類的位置信息。 此時,關鍵詞選擇部分通過搜索存儲了與位置和地點相關的詞的詞表 來選擇與位置信息關聯的詞。在標簽中,將由關鍵詞選擇部分選擇的 詞描述為關鍵詞。按照本發明的一個實施例,內容記錄裝置還包括進度管理裝置, 該進度管理裝置含有事件輸入裝置和事件存儲裝置。事件輸入裝置輸 入事件的名稱、事件的日期及時間。事件存儲裝置相互關聯地存儲事 件的名稱、事件的日期及時間。此時,標簽產生裝置包括進度關聯部 分,通過基于時間信息搜索事件存儲裝置,以選擇事件名稱、事件日 期、和對應于諸如內容的創建日期和時間之類的時間信息的時間,并 在標簽中將事件名稱和事件日期及時間描述為關鍵詞。在詞庫中,按照詞的概念廣泛性將詞排列在樹形結構中。評分獲取部分按照關鍵詞和關聯詞之間的詞的數目,獲取評分。內容記錄裝置還可以包括權重裝置,以向關鍵詞分配權重。權重裝置基于內容數據庫中存在的關鍵詞的數目分配權重。本發明的內容記錄方法和內容記錄程序包括下列步驟輸入內容;自動產生標簽,在標簽中描述表示內容特征的關鍵詞;通過搜索 詞以相近含義的組分類和排列的詞庫獲取關鍵詞的關聯詞;利用詞 庫,獲取表示關聯詞和關鍵詞之間相關程度的評分;并相互關聯地記錄內容、標簽、關聯詞和評分。按照本發明,當記錄內容時,自動地將關鍵詞增加到內容以便 于內容記錄。另外,由于關鍵詞是按照預訂的規則被選擇的,所以記 錄內容的人和搜索者基于他們主觀使用的關鍵詞并沒有差異。相應 地,可以提高搜索中的搜索精度和搜索命中率。由于關聯詞也是自動地和關鍵詞一起被選擇和記錄的,通過利 用關聯詞,即使使用了模糊的關鍵詞,內容也可以被搜索。因此,可 以執行大范圍搜索。而且,由于還記錄了關聯詞的評分和關鍵詞的權 重,可以基于關聯詞和關鍵詞的關聯程度、關鍵詞的重要級別等來執 行精確搜索。包括在標簽中的關鍵詞是從多個諸如從內容中提取的特征顏 色、時間信息、位置信息、按照圖像識別的對象種類和/或對象形狀、 對象的最初顏色、從多個顏色組合產生的顏色印象等特征中提取出來 的。于是,可以執行大范圍搜索。而且,由于可以將記錄在進度管理 裝置中的事件名稱描述為關鍵詞,還可以執行基于用戶個人動作的搜 索。
結合附圖,從下文的優化實施例的詳細描述中,本發明的所述 的和其他的目的以及優點可以很清楚地描述出來,其中,相同的參照數字表示這些圖中相似的或者對應的部分,其中圖1是圖示應用了本發明的圖像管理裝置結構的框圖;圖2A是圖示被輸入圖像管理裝置的圖像文件結構的示例性視圖,圖2B是圖示已經被記錄在圖像數據庫中的圖像文件結構的示例 性視圖;圖3是圖示圖像記錄部分的結構的框圖;圖4是圖示詞表例子的示例性視圖;圖5是圖示詞庫的一部分的示例性視圖; 圖6是圖示記錄圖像過程的流程圖; 圖7是圖示產生標簽過程的流程圖;圖8是圖示標簽產生部分的結構的功能性框圖,其中該標簽產生部分有識別對象形狀等圖像識別功能;圖9是圖示獲取對象名稱或類似名稱的過程的流程圖;圖IO是圖示標簽產生部分的結構的功能性框圖,其中該標簽產生部分有獲取對象最初顏色名稱的功能;圖ll是圖示獲取最初顏色名稱的過程的流程圖;圖12是圖示標簽產生部分的結構的功能性框圖,其中該標簽產生部分有從進度管理程序中獲取事件名稱的功能; 圖13是圖示獲取事件名稱過程的流程圖;圖14是圖示標簽產生部分的結構的功能性框圖,其中該標簽產生部分有從多個顏色組合中獲取顏色印象的功能; 圖15是圖示獲取顏色印象過程的流程圖;圖16是圖示標簽產生部分的結構的功能性框圖,其中該標簽產生部分有為關鍵詞分配權重的功能;圖17是圖示為關鍵詞分配權重過程的流程圖。
具體實施方式
在圖1中,圖像管理裝置2包括用以控制圖像管理裝置2每一 部分的CPU 3、存儲圖像管理程序4的硬盤驅動器(HDD) 6、圖像 數據庫5或類似功能的部件、裝載程序和數據的RAM7、用來進行多 種操作的鍵盤8和鼠標9、用以對監視器IO輸出圖形用戶界面(GUI) 和圖像的顯示控制器ll、諸如掃描儀之類的圖像輸入裝置12、用以 從諸如數碼相機13之類的外部裝置輸入圖像的1/0接口 14以及類似 的功能部件。當圖像管理裝置2連接了網絡適配器或類似功能的裝置 時,還可以通過網絡向圖像管理裝置2輸入圖像。如圖2A所示,在數碼相機13中產生的圖像文件17遵循DCF (Design rule for Camera File Standard,數碼相機文件標準設計 準則)標準。該圖像文件17由圖像數據18和EXIF數據19組成。該 E XIF數據19包括類似諸如拍攝日期和時間之類的時間信息的信息、 相機型號、諸如快門速度、光圈和ISO曝光速度之類的拍攝狀況以及 類似的數據。當數碼相機13有GPS (Global Position System,全 球定位系統)功能時,圖像文件17的EXIF數據19還存儲諸如拍攝 地點的經緯度之類的位置信息。如圖3所示,當CPU3基于圖像管理程序4運轉時,CPU3作為 圖像記錄部分21來運轉。圖像記錄部分21有圖像輸入部分22、標 簽產生部分23、詞庫24、關聯詞獲取部分25以及評分獲取部分26。 圖像記錄部分21在圖像數據庫5中記錄圖像。圖像輸入部分22接收 從I/0端口 14或類似端口輸入的圖像文件,并將接收的圖像文件輸 入標簽產生部分23和圖像數據庫5。標簽產生部分23由特征提取部分29、詞表30以及關鍵詞選擇 部分31組成。標簽產生部分23產生標簽35以備數據搜索,并像圖 2B所示的己分析圖像數據34那樣,將標簽35添加至圖像數據18。特征提取部分29對輸入的圖像文件17進行分析并提取可以作 為關鍵詞的特征。例如,特征提取部分29從圖像數據18中提取圖像 的特征顏色,并從EXIF數據19中獲取諸如拍攝日期和拍攝時間的時 間信息以及諸如拍攝地點的經緯度之類的位置信息。有最高像素數的 顏色(顏色有最大的面積)、有最高像素密度的顏色或類似的顏色可 以被選擇作為特征顏色。可以按照日本專利公開No. 10-143670中描 述的顏色采樣中的出現頻率來提取特征顏色。注意特征顏色可以不只 是一種顏色。詞表30以相互關聯的方式存儲特征提取部分29提取的特征和 用作關鍵詞的詞。如圖4所示,詞表30提供有特征顏色表40、時間 信息表41、位置信息表42以及類似的表。在特征顏色表40中,作 為關鍵詞以16進制形式00-FF表示的紅、綠、藍顏色分布的RGB值 和它們的顏色名稱被相互關聯地存儲。例如,用以產生HTML文件的 Netscape顏色調色板、HTML 3. 2標準的16色調色板或者類似的調色 板可以被用作特征顏色表40。時間信息表41存儲表示季節、假曰、 時區和類似的對應于日期與時間的信息作為關鍵詞。位置信息表42
存儲城市名稱、國家名稱、地標名稱以及類似對應于經緯度的名稱作 為關鍵詞。關鍵詞選擇部分31基于輸入的特征顏色、時間信息和/或位置信息搜索詞表30并選擇對應的詞。從而,關鍵詞選擇部分31產生將 被選詞作為關鍵詞的標簽35,并將標簽35輸入關聯詞獲取部分25。關聯詞獲取部分25在詞庫24中搜索在標簽35中被描述為關鍵 詞的關聯詞,并將這些關聯詞輸入評分獲取部分26。在詞庫24中, 以有相近含義的組分類和排列詞,并按照這些詞的概念廣泛性將這些 詞以樹形結構排列。如圖5所示,當關鍵詞為"紅色",該詞被排列 在"顏色名稱"和"AKA (日語中表示紅色的詞)"。和"紅色"處 于同樣級別的還有"深紅色"、"朱紅色"和用為"紅色"關聯詞的 類似的詞。另外,其他類似的像"粉色"、"橙色"或類似顏色的顏 色名稱還可以關聯于"紅色"被記錄。在圖5中,詞"AO"是表示藍 色的日語詞匯以及詞"MIDORI"是表示綠色的日語詞匯。在關聯詞獲取部分25中獲取的關聯詞被作為關聯詞數據36加 到如圖2B所示的已分析圖像文件34中。關聯詞的范圍沒有具體限制, 但可以按照關聯詞數據36的可用記錄空間設置關聯詞。利用詞庫24,評分獲取部分26獲取表示關聯詞和關鍵詞關聯程 度的評分。例如,如圖5所示,當關鍵詞是"紅色"時,關聯詞是"粉 色"時,加入二者之間的節間距離"1"作為評分。當關聯詞是"深 紅色"時,加入"2"作為評分。如圖2B所示,評分獲取部分26獲 取的評分作為評分數據37被加到已分析圖像文件34。通過改變級到 級之間的添加數據可以計算評分。其他的計算方法還可以應用于評分 獲取方法。在下文中,將參照圖6和圖7所示的流程圖對上述實施例的操 作進行解釋。基于圖像管理程序4, CPU3作為圖像輸入部分22、標 簽產生部分23、詞庫24、關聯詞獲取部分25以及評分獲取部分26 運轉。圖像輸入部分22接收從1/0端口 14或類似的端口輸入的圖像 文件17,并將接收到的圖像文件17輸入標簽產生部分23。特征提取部分29從圖像文件17的圖像數據18中提取圖像的特
征顏色。特征提取部分29還可以從圖像文件17的EXIF數據19提取 諸如拍攝日期和拍攝時間的時間信息和/或諸如拍攝地點的位置信 息。關鍵詞選擇部分31搜索詞表30并選擇對應于由特征提取部分 29提取的特征的詞作為關鍵詞。例如,當圖像數據18的特征顏色有表示顏色紅色的FF0000的 RGB值時,從顏色表40中選取顏色名稱"紅色"作為關鍵詞。當時 間信息是"1月1日",從時間信息表41中選取"新年"和/或"元 旦"之類的詞作為關鍵詞。基于位置信息的經緯度,從位置信息表 42中選取"札幌市"之類的城市名稱作為關鍵詞。關鍵詞選擇部分 31選擇這樣的詞匯作為關鍵詞,并產生有這些被描述的關鍵詞的標 簽。該標簽被輸入關鍵詞獲取部分25。關鍵詞獲取部分25在詞庫24中搜索與標簽中的關鍵詞關聯的 詞,并選擇關聯詞。例如,像"紅色"、"深紅色"、"朱紅色"等 等之類的關聯詞以及像"粉色"、"橙色"等等相似顏色名稱的詞從 "紅色"這個關鍵詞中被選擇出來。像"元旦早晨"、"春天來了" 等等之類的關聯詞從關鍵詞"新年"和/或"元旦"中被選擇出來。 像"北海道"、"北海道中部"或類似的關聯詞從關鍵詞"札幌"中 被選擇出來。關聯詞和標簽被輸入評分獲取部分26。利用詞庫24,評分獲取部分26獲取表示關聯詞和關鍵詞關聯程 度的評分。按照關鍵詞和關聯詞之間的節間距離計算評分。例如,關 聯詞"紅色"到"紅色"的評分是"1",關聯詞"深紅色"到"紅 色"的評分是"2"。評分和標簽以及關聯詞被一起輸入圖像數據庫 5。圖像數據庫5將標簽、關聯詞和評分增加到從圖像輸入部分22 輸入的圖像文件17,并產生已分析圖像文件34,將該圖像文件34 存儲到預定的存儲器區域。標簽中的關鍵詞和關聯詞允許進行圖像文 件搜索。這樣,由于表示輸入圖像特征的關鍵詞是自動增加到圖像文件 中的,記錄圖像的人不需要輸入關鍵詞。于是,促進了圖像記錄。另 外,由于關鍵詞是按照預定的規則被選擇的,通過類推的方法可以輕
易地知道關鍵詞,這樣可以改善搜索的精度和搜索的命中率。由于不 但可以以關鍵詞執行圖像搜索,而且還可以以關聯詞執行圖像搜索, 從而可以執行大范圍搜索。當為關鍵詞分配權重的評分被用作輸出圖 像搜索結果時,可以以更高的精度執行圖像搜索。在所述的實施例中,特征顏色是從圖像數據18中提取出來的。 在圖像中識別和使用對象種類和對象形狀作為關鍵詞也是可行的。例如,在圖8中,對標簽產生部分23提供圖像識別部分50和對象名稱 表51。圖像識別部分50在圖像數據18中識別對象種類和對象名稱。 對象名稱表51關聯對象名稱存儲對象種類,和/或關聯形狀名稱存儲 對象形狀。在圖9所示的流程圖中,圖像識別部分50在特征提取部 分29提取特征之前、之后或同時執行圖像識別。關鍵詞選擇部分31 通過搜索對象名稱表51和詞表30,選擇對應于對象種類的對象名稱 和對應于對象形狀的形狀名稱,并在標簽中將對象名稱和/或形狀名 稱描述為關鍵詞。于是,可以利用圖像中對象的名稱和/或對象的形 狀來執行圖像搜索。每一產物都可以利用最初顏色名稱。可以利用這樣的最初顏色 名稱執行圖像搜索。例如,如圖IO所示,標簽產生部分23可以被提 供有顏色名稱轉換表54。對象名稱或形狀名稱、對象的最初顏色名 稱以及對應于最初顏色名稱的共同顏色名稱被相互關聯地存儲在顏 色名稱轉換表54中。如圖ll所示的流程圖,關鍵詞選擇部分31利 用對象名稱和/或對象的形狀名稱以及特征顏色的顏色名稱,搜索顏 色名稱轉換表54,選擇對產物唯一的最初顏色名稱,并在標簽中將 選擇的最初顏色名稱描述為關鍵詞。于是,可以執行更大范圍的圖像 搜索。圖像管理程序4可以在通用個人計算機(PC)上運行。將進度 管理程序安裝在PC上以管理進度是非常常見的。輸入到進度管理程 序的進度可以被用以圖像管理。例如,如圖12所示,有事件輸入部分57和事件存儲部分58的 進度管理程序被安裝在PC 59上。事件輸入部分57輸入事件名稱和 事件的日期和時間。事件存儲部分58以相互相關的方式存儲事件名 稱和事件日期和時間。標簽產生部分23被提供了進度關聯部分60。 進度關聯部分60基于時間信息搜索事件存儲部分58,該時間信息是 由特征提取部分29提取的。從而,進度關聯部分60得到事件名稱以 及對應于時間信息的事件日期和時間。如圖13所示的流程圖,由進 度關聯部分60獲取的事件名稱被輸入關鍵詞選擇部分31,并在標簽 中和其他關鍵詞一起被描述。于是,可以執行更大范圍的圖像搜索。可以從多個顏色組合中得到多種顏色印象是已知的。例如,主 要由淡紅色和淡藍色組成的低亮度顏色組合可以給人高雅的印象。主 要由淺灰色組成的中亮度顏色組合可以給人自然的、生態的或類似的 印象。這樣的顏色印象可以被用于圖像搜索。如圖14所示,標簽產生部分23被提供了顏色印象表63。多個顏色組合和從顏色組合中得到的顏色印象被相互關聯地存儲在顏色 印象表63中。在圖15所示的流程圖中,基于由特征提取部分29提 取的多個特征顏色,關鍵詞選擇部分31搜索顏色印象表63,選擇對 應的顏色印象。在標簽中將選取的顏色印象描述為關鍵詞。對于這種 配置,可以利用圖像的顏色印象執行圖像搜索,這促進了更大范圍的 圖像搜索。還可以為關鍵詞分配權重。例如,如圖16所示,標簽產生部分 23被提供了權重部分66。權重部分66為關鍵詞選擇部分31選取的 關鍵詞分配權重。在標簽中描述關鍵詞和權重。在圖17所示的流程 圖中,權重部分66對存在于圖像數據庫5中的關鍵詞進行計數。權 重部分66取決于存在的關鍵詞數目確定權重。例如,更大的權重被 分配給在數據庫5中出現次數最多的關鍵詞,或者,更大的權重被分 配給在數據庫5中出現次數最少的關鍵詞。當圖像搜索結果被顯示在監視器IO上時,關鍵詞以權重降序的 形式從頂部被顯示。于是,每一個關鍵詞的重要級別被反映在搜索結 果上,這促進了更大范圍的搜索。當按照在圖像數據庫5中出現的關 鍵詞數目確定權重時,權重隨新記錄的圖像改變。因此,每當圖像被 記錄時,優選地是,重新評估被分配給關鍵詞的權重。雖然關鍵詞的 權重和關聯詞的評分是被分別記錄的,但是可以利用一些計算方法將
權重和評分聯系(關聯)起來。雖然在所述實施例中,本發明應用于圖像管理裝置,但本發明 可以應用于諸如數碼相機、打印機和類似的裝置之類的處理圖像的其 他裝置中。而且,本發明不但可以應用于處理圖像的內容管理裝置中, 而且可以應用于處理諸如音頻數據或類似數據的其他數據類型的內 容管理裝置中。在本發明中可以實現多種變化和修改,這些變化和修改應當理 解為處在本發明范圍之內。
權利要求
1.一種內容記錄裝置,包括內容輸入裝置,用于輸入內容;標簽產生裝置,用于自動產生標簽,在該標簽中描述了表示所述內容的特征的關鍵詞;詞庫,其中包含按照相近意思對詞進行分類和排列的組;關聯詞獲取裝置,用于通過搜索所述詞庫來獲取所述關鍵詞的關聯詞;評分獲取裝置,用于利用所述的詞庫來獲取表示所述關聯詞和所述關鍵詞的關聯程度的評分;以及內容數據庫,用于相關聯地記錄所述內容、所述標簽、所述關聯詞以及所述評分。
2. 按照權利要求1所述的內容記錄裝置,其中,所述標簽產生 裝置包括特征提取部分,用以提取所述特征,通過分析所述內容或附在 所述內容上的元數據,所述特征可以成為所述關鍵詞; 詞表,用來相互關聯地存儲所述特征和詞;以及 關鍵詞選擇部分,用來通過搜索所述詞表來選擇對應于所述特 征的詞,并在所述標簽中將所述詞描述為所述關鍵詞。
3. 按照權利要求2所述的內容記錄裝置,其中, 當所述內容是圖像時,所述特征提取部分提取所述圖像的至少一種特征顏色;所述詞表將所述特征顏色和顏色名稱彼此關聯地存儲起來;并且所述關鍵詞選擇部分通過搜索所述詞表來選擇對應于所述特征 顏色的顏色名稱,并在所述標簽中將所述顏色名稱描述為所述關鍵詞o
4. 按照權利要求3所述的內容記錄裝置,其中,所述標簽產生 裝置還包括圖像識別部分,用以在所述圖像中識別對象種類和/或形狀;以及對象名稱表,以與對象名稱關聯的形式存儲所述對象種類和/或 以與形狀名稱關聯的形式存儲所述對象形狀,其中,所述關鍵詞選擇部分通過搜索所述詞表來選擇對應于所述對象 種類的對象名稱和/或對應于所述對象形狀的形狀名稱,并在所述標 簽中將所述對象名稱和/或所述形狀名稱描述為所述關鍵詞。
5. 按照權利要求4所述的內容記錄裝置,其中,所述標簽產生裝置還包括顏色名稱轉換表,以相互關聯的形式存儲所述對象名稱和/或所 述形狀名稱、所述對象的最初顏色名稱、和對應于所述最初顏色名稱 的共同顏色名稱,其中,所述關鍵詞選擇部分基于所述對象名稱和/或所述形狀名稱以 及所述特征顏色的所述顏色名稱,來搜索所述顏色名稱轉換表,從而 選擇對應的最初顏色名稱,并在所述標簽中將所述對應的最初顏色名 稱描述為所述關鍵詞。
6. 按照權利要求3所述的內容記錄裝置,其中,所述標簽產生裝置包括顏色印象表,以相互關聯的形式存儲多個顏色組合和從所述顏 色組合中得到的顏色印象,其中,所述關鍵詞選擇部分基于所述特征提取部分提取的所述特征顏 色搜索所述顏色印象表,從而選擇對應的顏色印象,并在所述標簽中 將所述對應的顏色印象描述為所述關鍵詞。
7. 按照權利要求2所述的內容記錄裝置,其中,所述特征提取部分提取諸如所述內容創建日期和時間的時間信息;所述詞表存儲關于日期和時間的詞;以及所述關鍵詞選擇部分通過搜索所述詞表,選擇關聯于所述時間 信息的詞,并在所述標簽中將所述詞描述為關鍵詞。
8. 按照權利要求2所述的內容記錄裝置,其中, 所述特征提取部分提取諸如所述內容創建地點的位置信息; 所述詞表存儲關于位置和地點的詞;以及所述關鍵詞選擇部分通過搜索所述詞表來選擇與所述位置信息 相關聯的詞,并在所述標簽中將所述詞描述為所述關鍵詞。
9. 按照權利要求1所述的內容記錄裝置,還包括.-進度管理裝置,其具有事件輸入裝置和事件存儲裝置,所述事件輸入裝置輸入事件名稱以及所述事件的日期及時間,所述事件存儲 裝置相互關聯地存儲所述事件名稱和所述事件日期及時間,其中, 所述標簽產生裝置包括進度關聯部分,其基于諸如所述內容的創建日期及時間的時間 信息,來搜索所述事件存儲裝置,從而選擇事件名稱和與諸如所述內 容的創建日期及時間之類的時間信息相對應的事件日期及時間,并在 所述標簽中將所述事件名稱和所述事件日期及時間描述為所述關鍵 詞。
10. 按照權利要求1所述的內容記錄裝置,其中,所述詞庫含 有按照所述詞的概念寬廣性以樹形結構排列的詞,所述評分獲取部分 根據所述關鍵詞和所述關聯詞之間詞數獲取所述評分。
11. 按照權利要求l所述的內容記錄裝置,另外還包括 權重裝置,用于為所述關鍵詞分配權重。
12. 按照權利要求ll所述的內容記錄裝置,其中,所屬的權重 裝置基于存在于所述內容數據庫中的所述關鍵詞的個數來分配權重。
13. —種內容記錄方法,包括下列步驟 輸入內容;自動產生標簽,在所述標簽中描述表示所述內容特征的關鍵詞; 通過搜索具有以相近含義的組分類和排列的詞的詞庫,來獲取所述關鍵詞的關聯詞;利用所述詞庫來獲取表示所述關聯詞和所述關鍵詞之間的關聯 程度的評分;以及以相互關聯的形式記錄所述內容、所述標簽、所述關聯詞和所 述評分。
14. 一種內容記錄程序,其使計算機能夠執行下列步驟 輸入內容;自動產生標簽,在所述標簽中描述表示所述內容特征的關鍵詞; 通過搜索具有以相近含義的組分類和排列的詞的詞庫來獲取所述關鍵詞的關聯詞;利用所述詞庫來獲取表示所述關聯詞和所述關鍵詞之間的關聯 程度的評分;以及以相互關聯的形式記錄所述內容、所述標簽、所述關聯詞和所 述評分。
全文摘要
本發明涉及內容記錄裝置、內容記錄方法和內容記錄程序,其中在內容記錄裝置中,標簽產生部分分析從圖像輸入部分輸入的圖像文件,并提取諸如特征顏色、時間信息和位置信息之類的特征;詞表以相互關聯的形式存儲多種特征和表示這些特征的關鍵詞;關鍵詞選擇部分基于提取的特征來搜索字表并選擇相應的關鍵詞;關聯詞獲取部分搜索詞庫以發現關鍵詞的關聯詞;評分獲取部分獲取表示關聯詞和關鍵詞的關聯程度的評分;在圖像數據庫中,圖像文件有一個標簽,關鍵詞在該標簽上被描述,關聯詞和附加的評分被記錄在該標簽上。
文檔編號G06F17/30GK101211370SQ20071030700
公開日2008年7月2日 申請日期2007年12月27日 優先權日2006年12月27日
發明者宮坂恭正, 寺橫素 申請人:富士膠片株式會社