本國際申請要求2014年8月8日在日本專利局提交的日本發明專利申請第2014-162623號的優先權,以及2015年1月6日在日本專利局提交的日本發明專利申請第2015-000945號的優先權,所述日本發明專利申請的全部內容通過引用而并入本文。
技術領域
本公開涉及對數據庫進行處理的信息處理系統。
背景技術:
以往,基于商品的銷售數據對顧客的購買行為進行分析。為了利于商業活動,還對顧客接觸大眾傳媒或網絡內容的行為進行分析。
還通過問卷形式或面對面提問的形式,對顧客的購買行為、接觸大眾傳媒/網絡內容的行為、以及生活方式等多種信息進行收集。
近年來,每個企業都擁有這種具備有關顧客的數據的龐大的數據庫。然而,每個企業以保護個人信息為主要理由,不愿向外部提供這些有關顧客的數據。當這些數據從持有該數據的企業被提供給外部時,或被加密處理后加以提供,或在將牽扯到確定顧客方面的信息大幅削除后加以提供,或有意地在變更為含有錯誤(雜訊)的狀態下加以提供(參照專利文獻1)。
現有技術文獻
專利文獻
專利文獻1:日本特開第2014-109647號公報
技術實現要素:
發明要解決的問題
如上所述,從數據持有企業提供有關顧客的數據出于保護個人信息的觀點而受到限制。不僅對于有關顧客的數據,即使對于粒度精細的數據,由于擔心因該信息的價值高度或提供而引起不利,因此數據持有企業容易在數據提供方面變得消極。所以,根據以往的技術,難以有效地利用社會上存在的各種數據。
因此,本公開的一個方面在于希望能夠提供一種可有效地利用社會上存在的各種數據的、有關數據庫的新技術。
解決問題的技術方案
本公開一個方面的信息處理系統包括:儲存單元,構成為儲存第一數據庫以及第二數據庫;以及合并單元,構成為對第一數據庫和第二數據庫進行合并。在本公開的一個方面,信息處理系統還可以具備構成為生成第一數據庫的生成單元。
第一數據庫是具備與第一組的結構體有關的每個虛擬結構體的特征數據的數據庫。該每個虛擬結構體的特征數據可基于第一組的每個結構體的特征數據,將特征一致或相似的多個結構體的特征數據進行統合而生成。結構體的特征數據表示與該結構體有關的特征。例如,生成單元可構成為,在第一組中,以特征一致或相似的多個結構體為單位,對該多個結構體的特征數據進行統計處理,由此對特征一致或相似的多個結構體的特征數據進行統合,從而生成每個虛擬結構體的特征數據。
第二數據庫具備第二組的每個結構體的特征數據。第二組是與第一組相同或不同的組。第一數據庫以及第二數據庫所具備的每一個特征數據構成為均包含參照數據,該參照數據為合并時供參照的參照數據,并且表示第一數據庫與第二數據庫之間共同種類的特征。
合并單元以將第一數據庫與第二數據庫之間參照數據所表示的特征一致或相似的特征數據彼此合并的方式,對第一數據庫和第二數據庫進行合并。
根據本公開一個方面的信息處理系統,對多個特征數據進行統合,從而生成具備上述每個虛擬結構體的特征數據的數據庫。虛擬結構體的特征數據是混合有多個結構體的特征的數據。例如,第一組為顧客的集合,當統合前的特征數據為表示一個顧客的特征的單一顧客的特征數據時,虛擬結構體的特征數據則對應于將多個顧客的特征進行混合而成的數據。
若將每個結構體的特征數據轉換成每個虛擬結構體的特征數據,則能夠擴大特征數據的信息粒度,由此能夠實現對于具體信息的信息保護。所以,根據本公開的一個方面,能夠減小數據持有者以信息保護為由而在數據提供上制造的障礙。因此,根據本公開的一個方面,能夠提供可有效利用社會上存在的各種數據的系統。
上述特征一致或相似的多個結構體可以是特征一致的結構體和特征相似的結構體這兩者混合存在的集合。本說明書中的用語“相似”可理解成是包含“一致”作為下位概念的廣義用語。
對特征一致或相似的多個結構體的特征數據進行統合時,可利用周知的聚類技術(分類技術)。作為聚類技術,在語言處理、模式識別、以及人工智能等領域已知有各種聚類技術。作為廣為人知的聚類技術,已知有k-means(k平均算法)、和BIRCH(利用層次方法的平衡迭代規約和聚類)等硬聚類技術、以及LSA(潛在語義分析)、pLSA(概率潛在語義分析)、和LDA(隱含狄利克雷分布)等軟聚類技術。
在本公開的一個方面,生成單元可構成為,利用這些周知的聚類技術,或利用其他聚類技術,以如下方式使與第一組有關的特征數據的集合集群化,即,按照特征一致或相似的多個特征數據為單位,將與第一組有關的特征數據的集合分類。該生成單元可構成為以每個集群為單位,對與該集群對應的多個特征數據進行統合。
在本公開的一個方面,生成單元可構成為,以每個集群為單位,對與集群相對應的多個特征數據進行統計處理。具體地,生成單元可構成為,對每個集群計算與集群相對應的多個特征數據所具有的各參數的統計量。統計量的示例包括平均值、最大值、最小值、以及表示分布的值(比例等)。特征數據的參數值及其統計量可以是標量,也可以是向量。可以對每個集群生成虛擬結構體的特征數據。在本公開的一個方面,虛擬結構體的特征數據可生成為包含上述統計量作為表示與虛擬結構體有關的特征的參數值。
上述第一數據庫可通過上述生成單元生成,也可通過人工操作生成,還可通過其他方法(例如計算機信息處理與人工操作的組合)生成。
在本公開的一個方面,上述第二數據庫也可以與第一數據庫同樣地進行生成。第二數據庫具備的每個結構體的特征數據可以是有關每個虛擬結構體的特征數據。該每個虛擬結構體的特征數據可基于與第一組相同或不同的組的每個結構體的特征數據,將特征一致或相似的多個結構體的特征數據進行統合而生成。在本公開的一個方面,信息處理系統可以具備生成第二數據庫的生成單元。
在本公開的一個方面,第二數據庫可以是具備未進行上述統合的特征數據的數據庫。第二數據庫可具備單一來源數據(single-souroe data)作為特征數據。每個單一來源數據是基于從單一信息源收集的信息的數據。單一來源數據可以是未進行統計化以及模型化的結構體的特征數據,可以是表示與單一結構體有關的特征的數據。
上述第一組以及第二組各自可以是人、物、服務、以及地點的至少一者的集合。上述結構體可以是該集合的元素。即,上述結構體可以是人、物、服務、以及地點的任一者。物、服務、以及地點可以是與人相關的物、服務、以及地點。
根據本公開的一個方面,第一組以及第二組的一方可以是人的集合,第一組以及第二組的另一方可以是物、服務、以及地點的至少一者的集合。第一組以及第二組各自可以是物、服務、以及地點的至少一者的集合。
根據本公開的一個方面,信息處理系統可構成為包括多個生成單元、以及合并單元,所述多個生成單元構成為生成與彼此相同或不同的組有關的數據庫,所述合并單元構成為對由多個生成單元生成的多個數據庫進行合并。每一個生成單元可構成為生成具備每個虛擬結構體的特征數據的數據庫,所述每個虛擬結構體的特征數據是基于對應組的每個結構體的特征數據,將特征一致或相似的多個結構體的特征數據進行統合而成的。
多個數據庫所具備的每個特征數據可包含參照數據,所述參照數據是合并時供參照的參照數據,并且表示與作為合并對象的數據庫共同種類的特征。合并單元可構成為,以將多個數據庫之間參照數據所表示的特征一致或相似的特征數據彼此合并的方式,對多個數據庫進行合并。
根據本公開的一個方面,可提供一種信息處理系統,該信息處理系統包括:儲存單元,構成為對具備每個虛擬結構體的特征數據的多個數據庫進行儲存;以及合并單元,構成為對儲存單元所儲存的多個數據庫進行合并。通過該信息處理系統也能夠有效地利用社會上存在的數據。
在本公開的一個方面,合并單元可構成為經由特定種類的數據庫對上述多個數據庫之間進行合并,所述特定種類的數據庫是與和多個數據庫相同或不同的組有關的數據庫,并且以組的每個結構體為單位而具備單一來源數據作為特征數據。單一來源數據可包括參照數據,所述參照數據是在數據庫合并時供參照的參照數據,并且表示與作為合并對象的數據庫共同種類的特征。
在本公開的一個方面,合并單元可構成為,以將參照數據所表示的特征一致或相似的特征數據彼此合并的方式,對上述特定種類的數據庫和除此之外的每個數據庫進行合并,由此經由特定種類的數據庫對多個數據庫之間進行合并。
單一來源數據在未進行上述統合這一點充分表現結構體的特征。因此,經由單一來源數據對各數據庫進行合并,由此能夠更恰當地對數據庫之間的每個虛擬結構體的特征數據進行結合。
在本公開的一個方面,作為上述生成單元以及合并單元的功能,能夠通過硬件實現。也可以通過程序使計算機實現作為該各單元的功能。也可以通過多個計算機分散實現作為該各單元的功能。可以對計算機提供一種程序,該程序用于使計算機實現作為這些單元中至少一個單元的功能。程序可記錄在半導體制存儲器、磁盤以及光盤等計算機可讀取的非暫時性記錄介質中。
根據本公開的一個方面,可提供一種儲存程序的計算機可讀取的非暫時性記錄介質,所述程序用于使計算機實現作為生成單元以及合并單元的至少一方的功能。根據本公開的一個方面,可提供一種信息處理系統,其具備計算機(處理器)以及存儲器,并在存儲器儲存有上述程序。
根據本公開的一個方面,可提供一種數據庫合并方法,其包括:生成或獲取上述第一數據庫的步驟;以及使第一數據庫與上述第二數據庫合并的步驟。根據本公開的另一方面,可提供一種數據庫合并方法,其包括:生成或獲取第一數據庫的步驟;生成或獲取第二數據庫的步驟;以及對第一數據庫和第二數據庫進行合并的步驟。
上述數據庫可以是有關顧客的數據庫。數據庫可構成為具備表示與顧客有關的人、物、服務、以及地點的至少一者的特征的特征數據。根據本公開一個方面的信息處理系統,可以在保護顧客個人信息的同時向合并單元提供有關顧客的數據。合并單元能夠生成將與不同數據提供源的顧客有關的數據合并而成的數據庫。
當每個數據庫具備表示顧客特征的特征數據時,上述參照數據可作為表示顧客的人口統計屬性的數據而構成。人口統計屬性包含在各個企業持有的有關顧客的數據中。若基于這樣的表示人口統計屬性的參照數據對數據庫之間進行合并,則能夠恰當地合并不同數據庫之間的特征數據。當然,參照數據可以是表示在人口統計屬性附加除人口統計屬性以外的顧客特征,或者表示以除人口統計屬性以外的顧客特征取代人口統計屬性的數據。
與顧客有關的特征數據中,作為參照數據以外的非參照數據,可以包括表示顧客的消費行為、接觸大眾傳媒的行為、接觸網絡內容的行為、生活方式、價值觀、以及品牌意識的至少一者的特征的數據。若將數據庫之間這種包含與顧客有關的多種信息的特征數據彼此合并,則能夠從合并后的數據庫中通過分析而抽取與顧客(消費者)有關的多種有意義的統計信息。
在此作為示例而列舉的非參照數據也可以變成參照數據。參照數據可以是表示在多個數據庫內被直接合并的數據庫之間共同種類的特征的數據。
附圖說明
圖1是表示第一實施例的信息處理系統的構成的框圖。
圖2A是表示數據加工裝置的構成的框圖;圖2B是表示由數據加工裝置的運算部執行的處理的框圖。
圖3A-3D是表示顧客相關數據庫所具有的特征數據的構成的圖。
圖4是說明加工后數據庫的示例的圖。
圖5A是表示數據合并裝置的構成的框圖;圖5B是表示由數據合并裝置的運算部執行的處理的框圖。
圖6A是說明加工后數據庫的合并示例的圖。
圖6B是對作為合并對象的加工后數據庫的構成進行例示的圖。
圖6C是表示基于加工后數據庫的合并數據庫的構成示例的圖。
圖7是說明合并數據庫的分析示例的圖。
圖8A是說明第二實施例中加工后數據庫的合并示例的圖。
圖8B是表示第二實施例中合并數據庫的構成示例的圖。
圖9A是說明第三實施例中顧客相關數據庫的構成的圖。
圖9B是說明第四實施例中顧客相關數據庫的構成的圖。
圖10A是說明第五實施例中顧客相關數據庫的構成的圖。
圖10B是說明第六實施例中顧客相關數據庫的構成的圖。
圖11A是說明第七實施例中顧客相關數據庫的構成的圖。
圖11B是說明第八實施例中顧客相關數據庫的構成的圖。
具體實施方式
以下參照附圖說明本公開的實施例。
[第一實施例]
圖1所示的本實施例的信息處理系統1包括多個數據加工裝置10、以及數據合并裝置50。數據加工裝置10對企業持有的有關顧客的數據庫153進行加工,并將加工后數據庫155提供給數據合并裝置50。數據加工裝置10設置在持有與顧客有關的數據庫153的企業側。
以下將與顧客有關的數據庫153表示為顧客相關數據庫153。將對顧客相關數據庫153進行加工和提供的企業表示為數據提供源。顧客相關數據庫153具備有關顧客的特征數據組。
作為特征數據的一例可列舉將顧客的消費行為、接觸大眾傳媒的行為、接觸網絡內容的行為、生活方式、價值觀、以及品牌意識的至少一者的特征連同顧客的識別ID或人口統計屬性一起進行表示的數據。
上述顧客的識別ID可以是識別碼,該識別碼能夠從儲存顧客信息的數據庫中提取表示顧客的人口統計屬性的數據。顧客的消費行為中包括顧客的購買行為。
例如,上述特征數據可構成為一并具有顧客的人口統計屬性和顧客的購買數據。購買數據可以是表示購買商品以及/或購買款額的數據。該情形下,顧客相關數據庫153可以具有每個顧客以及每項結算的特征數據。
數據加工裝置10以如下方式進行加工,即,基于顧客相關數據庫153所具有的上述特征數據組,將特征相似的多個特征數據統合成一個特征數據。本說明書中使用的用語“相似”可理解成是包含“一致”作為下位概念的廣義用語。數據加工裝置10生成具備加工后的特征數據作為虛擬顧客的特征數據的數據庫,作為上述加工后數據庫155。本說明書中還將加工后的顧客相關數據庫表示為加工后數據庫155。加工后數據庫155例如以與多個顧客對應的每個虛擬顧客為單位而具備該虛擬顧客的特征數據。
例如利用通信向數據合并裝置50提供加工后數據庫155。為了防止數據庫的泄漏,通信可利用加密密鑰或專用線路。作為其他示例,可將加工后數據庫155保存在可攜帶且計算機可讀取的記錄介質中,并通過該記錄介質的搬運將加工后數據庫155提供給數據合并裝置50側。作為記錄介質可列舉半導體制存儲器、CD-ROM和DVD等光盤、以及硬盤等磁盤作為一例。
數據合并裝置50對從每個數據加工裝置10提供的多個加工后數據庫155進行合并,從而生成合并數據庫557。作為數據提供源可列舉如上所述的具備顧客相關數據庫153的企業作為一例,其中,顧客相關數據庫153包含顧客的購買數據作為特征數據。
作為擁有購買數據的企業,可列舉經營便利商店、超級市場以及/或百貨店等的零售(商品銷售)商、經營自動售貨機的企業、提供利用電子貨幣進行結算服務的企業、以及提供利用信用卡進行結算服務的企業作為一例。
零售商各自分別擁有積累了經由POS系統等獲取的每項結算的購買數據的數據庫。作為POS系統已知有能夠對顧客進行確定的ID-POS系統。
顧客在結算時向零售商出示積分卡,零售商通過與由積分卡確定的顧客ID建立關聯而對購買數據進行積累,由此零售商還對具備能夠確定顧客的每項結算的購買數據的數據庫進行構建。結算時通過銷售人員輸入根據外表辨別的顧客的性別以及年齡,而使顧客的人口統計屬性和購買數據建立關聯,由此零售商還對每項結算的購買數據進行積累。
數據合并裝置50對這樣數據提供源不同的、包含購買數據的多個加工后數據庫155進行合并,由此能夠構建出憑一個企業無法構建的龐大的數據庫。例如,能夠生成可對與大范圍的商品有關的顧客(消費者)的購買行為進行分析的合并數據庫557。
如圖2A所示,每個數據加工裝置10具備運算部11、儲存部15、輸入部17、以及輸出部19。運算部11具備按照各種程序151執行處理的CPU13。運算部11還具備在由CPU13執行處理時作為工作存儲器而使用的RAM14。如圖2B所示,通過執行CPU13中的上述處理,使運算部11作為聚類處理部110以及加工處理部115發揮作用。
儲存部15對各種程序151以及加工前的顧客相關數據庫153進行儲存,各種程序151包含用于使運算部11作為聚類處理部110以及加工處理部115而發揮作用的程序。儲存部15進一步構成為,對通過加工該顧客相關數據庫153而生成的加工后數據庫155進行儲存。
從輸入部17輸入構成顧客相關數據庫153的數據。輸入部17可以是能夠從記錄介質取入構成顧客相關數據庫153的數據的界面,也可以是能夠利用通信從企業內的系統取入該數據的界面。
圖3A-3D表示顧客相關數據庫153所具備的特征數據(記錄)的示例。根據圖3A的示例,特征數據具有表示顧客的性別以及年齡的參數作為顧客的人口統計屬性。并且該特征數據還具有表示商品的購買地點、JAN(Japanese Article Number)碼、購買數量、以及商品單價的參數,作為與顧客購買的商品有關的參數。JAN碼是在日本廣泛普及的商品編碼。包含如圖3A所示的購買商品的具體信息的顧客相關數據庫153例如為便利商店和超級市場等零售商所擁有。
根據圖3B所示的另一例,特征數據具有表示顧客的性別以及年齡的參數作為顧客的人口統計屬性。并且該特征數據還具有表示商品的購買地點以及購買款額的參數,作為與顧客購買的商品有關的參數。包含如圖3B所示的特征數據的顧客相關數據庫153例如為信用卡公司所擁有。與零售商相比,該顧客相關數據庫153具有巨大的購買數據,在這一點上優越于零售商所擁有的顧客相關數據庫153,但是在無法確定到具體的購買商品這一點則與零售商所擁有的顧客相關數據庫153呈互補關系。
根據圖3C所示的另一例,特征數據具有表示顧客的性別、年齡以及職業的參數作為顧客的人口統計屬性。并且該特征數據還具有表示對多個大眾傳媒(報紙/雜志/廣播/電視/電影等)的利用情況的參數,作為有關顧客對大眾傳媒的接觸情況的參數。例如,當顧客正在利用相符的大眾傳媒(訂閱/觀看收聽等)時,表示利用情況的參數顯示數值1,當未利用時則顯示數值0。這種信息例如通過問卷形式或對話形式進行收集,并作為特征數據積累在顧客相關數據庫153中。這種顧客相關數據庫153通常是與大眾宣傳有關的企業所擁有的數據庫,而非零售商所擁有的數據庫。
根據圖3D所示的另一例,特征數據具有表示顧客的性別、年齡以及居住地區的參數作為顧客的人口統計屬性。并且該特征數據還具有表示對多個互聯網網站的利用情況的參數,作為有關顧客對網絡內容的接觸情況的參數。例如,當顧客正在利用(訪問)相符的網站時,表示利用情況的參數顯示數值1,當未利用時則顯示數值0。這種信息例如通過預先征得顧客的同意而安裝在顧客的信息終端的訪問日志生成程序而積累在特定的服務器上。該顧客相關數據庫153通常是IT企業所擁有的數據庫,而非零售商所擁有的數據庫。
輸出部19構成為能夠從數據加工裝置10將基于上述顧客相關數據庫153的加工后數據庫155提取到外部。例如,輸出部19構成為,具有可利用通信向數據合并裝置50提供加工后數據庫155的通信界面,或具有可向記錄介質輸出加工后數據庫155的界面。
聚類處理部110從儲存部15所儲存的加工前的顧客相關數據庫153讀取特征數據的集合,按照特征相似的多個特征數據為單位,使這些特征數據的集合集群化。作為聚類的方法可采用上述周知的方法。
作為簡單的聚類方法,可列舉以下方法作為一例,即,將每個特征數據作為特征向量設置在特征空間上,基于特征向量之間的余弦相似度,確定特征相似的特征數據,從而進行集群化的方法。
對于顧客特征相似的特征向量組,還可以使降維矩陣作用于每個特征向量,以在特征空間上使顧客特征相似的特征向量組與其他特征向量充分分離。通過降維矩陣的調整,能夠更恰當地進行聚類。
作為聚類技術,還已知有如pLSA(概率潛在語義分析),將一個特征數據概率性地分類成多個集群。是將一個特征數據的80%分類成第一集群,將其余20%分類成第二集群這樣的情形。
數據合并裝置50的管理者可以考慮基于合并數據庫557的數據分析的目的,來決定如何判斷特征的相似性并使特征數據組集群化。數據合并裝置50的管理者可以向數據提供源提供用于使運算部11作為聚類處理部110以及加工處理部115而發揮作用的程序,并從數據提供源獲取充分符合數據分析目的加工后數據庫155。
在一個方面中,信息處理系統1可通過對數據提供源所持有的顧客相關數據庫153的統計處理,而生成保護個人信息的加工后數據庫155。該情形下,優選以如下方式進行聚類,即,使每個集群通過統計處理(統合)而包含具有能夠保護個人信息的個數以上的特征數據。當產生未包含具有能夠保護個人信息的個數以上的特征數據的集群時,則可以考慮不將屬于該集群的特征數據作為加工處理部115中的處理對象從而將其廢棄。
加工處理部115進行以下統計處理,即,用于以由聚類處理部110集群化的多個特征數據為單位,換言之,以每個集群為單位,對這些屬于同一集群的多個特征數據進行統合。具體地,加工處理部115進行以下處理,即,對每個集群計算屬于同一集群的多個特征數據所具有的各參數的統計量,生成包含這些統計量作為參數值的特征數據,作為與集群相對應的虛擬顧客的特征數據。加工處理部115對于所有的集群,對每個集群生成一個虛擬顧客的特征數據,由此生成具備這些特征數據的加工后數據庫155,并將其錄入儲存部15。
根據圖4的示例,加工處理部115計算集群內特征數據所表示的性別的比值,作為有關性別參數的統計量,將該比值作為與集群相對應的虛擬顧客特征數據中性別的參數值而進行記載。并且,加工處理部115計算集群內特征數據所表示的年齡的平均值,作為有關年齡參數的統計量,將該平均值作為與集群相對應的虛擬顧客特征數據中年齡的參數值而進行記載。
根據圖4上半部分的示例,加工前的特征數據以JAN碼與購買地點的每個組合為單位而具有表示顧客于該購買地點購買該JAN碼商品的款額總計的購買參數。該情形下,加工處理部115可以對JAN碼與購買地點的每個組合計算集群內特征數據所表示的款額的平均值,作為有關購買參數的統計量,并將其記載在與集群相對應的虛擬顧客的特征數據中。
圖4下半部分所示的加工后的特征數據以JAN碼與購買地點的每個組合為單位而對虛擬顧客的人口統計屬性(性別以及年齡)和虛擬顧客購買商品的款額(平均值)一并進行表示。
作為其他示例,加工處理部115也可以不計算上述款額的平均值,而是計算上述款額的最大值以及最小值,作為表示購買款額分布的數值。即,加工處理部115可以以JAN碼與購買地點的每個組合為單位而將上述款額的最大值以及最小值作為有關購買參數的統計量記載在虛擬顧客特征數據中。
根據圖4,除了加工后的特征數據為表示統計量的數據這一點、以及將表示加工前特征數據的個數(樣本數)的參數添加到加工后的特征數據中這一點之外,加工前后的特征數據基本相同。
不過,加工處理部115也可以根據具有圖3A所示的特征數據的顧客相關數據庫153,生成具備如圖4下半部分所示的每個虛擬顧客(集群)的特征數據的加工后數據庫155。即,無需使特征數據具有的參數的種類在加工前后一致,可以將加工前的一個或多個參數在加工時置換成可由此計算出的其他種類的參數。
作為統計量,以上對計算比值(比例)、平均值、或最大值和最小值組的示例進行了描述,不過除此之外還可以計算中位數作為統計量,計算平均值和方差組分。可以根據數據分析目的確定計算哪種統計量,以在分析中不遺失有意義的信息。
這樣,數據加工裝置10以每個集群為單位,將屬于該集群的特征數據組加工(統合)成表示統計量的特征數據,并向數據合并裝置50輸出包含該加工后的特征數據的加工后數據庫155。
接下來,參照圖5A以及圖5B說明數據合并裝置50的構成。如圖5A所示,數據合并裝置50包括運算部51、儲存部55、輸入部57、以及輸出部59。運算部51具備按照各種程序551執行處理的CPU53。運算部51還具備由CPU53執行處理時作為工作存儲器而使用的RAM54。運算部51通過由CPU53執行上述處理,而如圖5B所示作為數據融合處理部510發揮作用。
儲存部55儲存各種程序551,該各種程序551包含用于使運算部51作為數據融合處理部510發揮作用的程序。儲存部55還構成為儲存由數據加工裝置10提供的加工后數據庫155、以及通過將這些加工后數據庫155進行合并而生成的合并數據庫557。通過輸入部57將由數據加工裝置10提供的加工后數據庫155輸入數據合并裝置50內。輸入部57可以是能夠從記錄介質輸入加工后數據庫155的界面,也可以是能夠輸入從數據加工裝置10利用通信傳送來的加工后數據庫155的界面。輸出部59用于例如將合并數據庫557或將基于合并數據庫557的數據分析結果從數據合并裝置50提取到外部。
數據融合處理部510對儲存部55所儲存的多個加工后數據庫155進行合并,從而生成合并數據庫557。具體地,數據融合處理部510參照發揮接合部功能的特征數據內的參數,以將作為合并對象的加工后數據庫155之間參照參數所表示的特征相似的特征數據彼此合并的方式,對作為合并對象的加工后數據庫155之間進行合并。
如上所述,加工后數據庫155所具備的各特征數據在數據提供源不同的加工后數據庫155之間也共同具有表示顧客的人口統計屬性的參數。例如,特征數據在數據提供源不同的特征數據之間也共同具有表示性別的參數和表示年齡的參數。
這樣,數據融合處理部510參照作為合并對象的加工后數據庫155具備的特征數據所共同具有的參數(以下表示為共同參數),以將共同參數所表示的顧客特征相似的特征數據彼此合并的方式,對加工后數據庫155之間進行合并。
如圖6A所示,使儲存部55所儲存的第1加工后數據庫155與第2加工后數據庫155合并,使第2加工后數據庫155與第3加工后數據庫155合并,使第m加工后數據庫155與第(m+1)加工后數據庫155合并(m為3以上的整數),以如上方式依次對加工后數據庫155之間進行合并,由此可實現加工后數據庫155之間的合并。作為另一例,相對于特定的加工后數據庫155,數據融合處理部510將其余每個加工后數據庫155與該特定的加工后數據庫155進行合并,由此能夠以特定的加工后數據庫155為中心將儲存部55所儲存的加工后數據庫155之間合并成星形(參照圖8A)。
作為數據融合技術已知有各種技術。在本實施例的數據融合處理部510中也能夠利用周知的數據融合技術對加工后數據庫155之間進行合并。根據簡單的數據融合方法,能夠以如下方式對兩個加工后數據庫155之間相似的特征數據彼此進行匹配(合并)。
例如,對于用來評價相似度的共同參數(例如年齡以及性別),對加工后數據庫155之間所有的特征數據的組合計算在將以這些共同參數為元素的特征向量設置在特征空間時特征向量之間的距離(例如余弦距離)。然后,對距離最短的特征向量彼此進行匹配,由此將共同參數所表示的顧客特征相似的特征數據彼此合并,以如上方式能夠對加工后數據庫155之間進行合并。
當在特征空間上用距離評價二個特征數據間的相似度時,還可以援引運輸問題的解法,以使運輸費呈“整體上最小”的方式,對加工后數據庫155之間的特征數據彼此進行匹配。
通過如上的匹配而生成的合并數據庫557可作為下述數據庫而構成,即,該數據庫保存有使二個加工后數據庫155中的特征數據之間建立聯系的數據。
圖6C示出已對圖6B所示的加工后數據庫155A和圖6B所示的加工后數據庫155B進行合并的情形下的合并數據庫557的構成,其中,加工后數據庫155A具備包含樣本數、性別、年齡、購買P1,P2,…,購買Q1,Q2,…的參數的特征數據;加工后數據庫155B具備包含樣本數、性別、年齡、購買R1,R2,…,購買Q1,Q2,…的參數的特征數據。
根據該加工后數據庫155A和155B,共同參數為性別、年齡、購買Q1,Q2,…。而購買P1,P2,…,購買Q1,Q2,…,購買R1,R2,…為例如JAN碼與購買地點的每個組合的購買參數。例如,該購買參數表示與對應的組合有關的顧客的購買款額或有無購買。
例如,購買Pi(i為2以上的整數)可以是表示顧客在與購買P1不同的購買地點購買與購買P1相同JAN碼的商品的款額或對與購買P1相同JAN碼的商品有無購買的參數。購買Qj,Rj(j為1以上的整數)可以是表示顧客在與參數j相對應的購買地點購買與購買Pj不同JAN碼的商品的款額或對與購買Pj不同JAN碼的商品有無購買的參數。
在將這樣構成的加工后數據庫155A、155B進行合并而成的合并數據庫557中,被彼此合并的加工后數據庫155A的特征數據和加工后數據庫155B的特征數據通過使它們的識別號建立關聯而得以表現。即,在合并數據庫557中,記載與加工后數據庫155A的特征數據的識別號相關聯的、與該特征數據合并的加工后數據庫155B的特征數據的識別號。
如圖6C所示,還可以包括使加工后數據庫155B中的多個特征數據(B20056,B00234,B01123)相對于加工后數據庫155A中的一個特征數據(A00001)建立關聯的情形。
加工后數據庫155中的各特征數據可以是與加工前的多個特征數據相對應的特征數據,并且可以是與加工前的特征數據相對應的、集群內的樣本數彼此不同的特征數據。該情形下,可以認為各特征數據是存在與樣本數相對應的量的各特征數據,將顧客特征最相似的特征數據以相同樣本數份進行合并,再將剩余樣本數份的特征數據與其次相似的特征數據以同一樣本數份進行合并。
在圖6C中,記載有A00001、B20056、5.3的記錄表示,將加工后數據庫155A中識別號A00001的特征數據和加工后數據庫155B中識別號B20056的特征數據彼此合并樣本數5.3份。同樣地,接下來的記錄表示,將加工后數據庫155A中識別號A00001的特征數據和加工后數據庫155B中識別號B00234的特征數據彼此合并樣本數8.2份。再接下來的記錄表示,將加工后數據庫155A中識別號A00001的特征數據和加工后數據庫155B中識別號B01123的特征數據彼此合并樣本數6.5份。加工后數據庫155A中識別號A00001的特征數據基于樣本數20的集群而生成。將加工后數據庫155A中識別號A00001的特征數據分配到加工后數據庫155B中識別號B20056、識別號B00234、以及識別號B01123的特征數據中并進行合并。
通過如上構成的合并數據庫557,使加工后數據庫155之間彼此合并,合并數據庫557以及加工后數據庫155構成一個龐大的數據庫。根據圖6B以及圖6C的示例,對不具備有關購買R1,R2,…信息的加工后數據庫155A和不具備有關購買P1,P2,信息的加工后數據庫155B進行合并,由此構建出結合了購買P1,P2,…,購買Q1,Q2,…,購買R1,R2,…信息的龐大的數據庫。因此,能夠分析例如對購買P1,P2,…進行購買的顧客對購買R1,R2顯示出何種傾向。
圖7是將JAN碼與購買地點的每個組合的數據塊橫向排列、在縱向以每個虛擬顧客為單位對該數據塊的排列進行設置的圖。影線數據塊表示對應的虛擬顧客在該購買地點購買了與該JAN碼相對應的商品。非影線數據塊表示對應的虛擬顧客未在該購買地點購買與該JAN碼相對應的商品。
根據圖7,在虛線所示的區域,集中存在有影線數據塊。該集中顯示出在區域內對于JAN碼與購買地點的組合存在購買層。因此,若在該區域內對與非影線數據塊相對應的顧客層進行對應商品的宣傳,則能夠發揮有價值的宣傳效果。例如,粗線圍起的虛擬顧客雖然幾乎未發生與虛線所示區域相對應的購買行為,但是統計上仍符合購買層。因此,若對所對應的顧客層進行對應商品的宣傳,則可期待發揮有價值的宣傳效果。
若基于以往有關顧客的數據進行如上所述的數據分析,則有可能在分析過程中詳細地確定出有關顧客隱私的信息。與此相對,根據本實施例,圖6B以及圖7所示的各行數據是與進行了統計處理的虛擬顧客有關的數據。根據本實施例,由于基于進行了統計處理的數據進行上述數據分析,因此能夠抑制上述以往技術中存有的問題的產生,同時能夠通過數據分析獲取有利于商業活動的信息。
以上對本實施例的信息處理系統1進行了說明。根據本實施例,數據加工裝置10對顧客相關數據庫153進行加工,并將加工后數據庫155提供給數據合并裝置50。然后,數據合并裝置50對由數據加工裝置10生成的多個加工后數據庫155之間進行合并。
數據加工裝置10的運算部11基于加工前的顧客相關數據庫153所具備的特征數據組,按照特征相似的多個特征數據為單位,使這些特征數據的集合集群化。并且運算部11對與各集群相對應的多個特征數據進行統計處理從而對其進行統合。由此生成與特征相似的多個顧客相對應的每個虛擬顧客的特征數據。特別是,運算部11(加工處理部115)對每個集群計算屬于集群的多個特征數據所具有的各參數的統計量。每個虛擬顧客的特征數據生成為包含這些統計量作為參數值。運算部11(加工處理部115)生成具備這樣統合多個特征數據而成的每個虛擬顧客的特征數據的數據庫,作為加工后數據庫155。
加工后數據庫155中的每個特征數據包含在對加工后數據庫155之間進行合并時供參照的參照數據。參照數據表示與作為合并對象的加工后數據庫155共同種類的特征。上述實施例中的參照數據表示顧客的性別以及年齡,作為顧客的人口統計屬性。
數據合并裝置50的運算部51以將多個加工后數據庫155之間參照數據所表示的特征相似的特征數據彼此合并的方式,對加工后數據庫155之間進行合并。
即,根據該信息處理系統1,數據加工裝置10對多個顧客的特征數據進行統計處理從而對其進行統合,并生成具備每個虛擬顧客的特征數據的加工后數據庫155。例如,當統計處理前特征數據是表示一個顧客的特征的單一顧客的數據時,通過數據加工裝置10的工作將特征數據從單一顧客的數據轉換成混合有多個顧客的特征的虛擬顧客的數據。
因此,數據提供源可利用數據加工裝置10將顧客相關數據庫153轉換成對顧客的個人信息進行了保護的加工后數據庫155,可以在對個人信息進行保護的同時向數據合并裝置50提供有關顧客的數據。
由此,數據合并裝置50的管理者能夠從以前出于信息保護的觀點而消極地提供顧客相關數據庫153的企業,以加工后數據庫155的形式獲取顧客相關數據庫。數據合并裝置50可以生成對數據提供源不同的各種有關顧客的數據進行合并而成的數據庫。
作為結果,該信息處理系統1可以構建對分散在社會中的各種有關顧客的數據進行統合而成的數據庫,作為合并數據庫557。并且信息處理系統1可基于該數據庫有效利用各種有關顧客的數據,并可進行有價值的數據分析。
上述實施例中加工后數據庫155之間的共同參數(數據庫合并時的參照數據)為顧客的性別以及年齡。不過,共同參數也可以包括其他參數。例如,作為顧客的人口統計屬性,共同參數可以包括顧客的性別、年齡、職業、居住地區、收入、學歷、以及家庭構成的至少一者。
[第二實施例]
第二實施例的信息處理系統1構成為,在數據合并裝置50中使用具備單一來源數據(single-source data)的數據庫作為中心數據庫H(參照圖8A)。信息處理系統1將由數據加工裝置10提供的各加工后數據庫155合并到該中心數據庫H,從而經由中心數據庫H對多個加工后數據庫155之間進行合并。
本實施例的信息處理系統1的硬件構成與第一實施例相同。本實施例的信息處理系統1中,數據合并裝置50的儲存部55除了具有由數據加工裝置10提供的加工后數據庫155之外還具有中心數據庫H,這一點與第一實施例不同。除這一點之外,本實施例的信息處理系統1中只有數據融合處理部510的處理動作與第一實施例不同。因此,以下適當地省略對與第一實施例相同的構成的說明。
構成中心數據庫H的單一來源數據例如可以從由博報堂株式會社開展的生活者調查“HABIT(注冊商標)”獲取。HABIT通過采訪面試或問卷形式,從該調查的每個協助者處,對與生活方式(生活意識或態度)、價值觀以及品牌意識有關的各種信息,連同協助者的人口統計屬性的信息一并進行收集。由HABIT生成的每個顧客(協助者)的單一來源數據表示未在購買數據等中出現的顧客特征。
作為可以設置在中心數據庫H中的其他單一來源數據的示例,可以列舉從ID-POS獲取的包含顧客的購買數據的單一來源數據、或通過問卷形式獲取的表示接觸大眾傳媒情況的單一來源數據。附帶地說,也可以在中心數據庫H設置按照相同顧客的數據為單位對這些多種類的單一來源數據進行了合并而成的數據。
中心數據庫H所具備的單一來源數據是與表示顧客特征的特征數據相符的數據,為了與加工后數據庫155進行合并,中心數據庫H所具備的單一來源數據具有表示共同顧客的人口統計屬性的參數,作為與加工后數據庫155之間的共同參數。
如圖8A所示,數據融合處理部510通過將由數據加工裝置10提供的各加工后數據庫155合并到該中心數據庫H,而經由中心數據庫H對多個加工后數據庫155之間進行合并。合并方法如上所述。即,數據融合處理部510以使共同參數所表示的特征相似的特征數據彼此合并的方式,使中心數據庫H和每個加工后數據庫155合并。
合并數據庫557中,與上述實施例相同,例如使中心數據庫H的特征數據和與其合并的各加工后數據庫155的特征數據之間的關系通過使它們的識別號建立關聯而得以表現。圖8B所示的合并數據庫557中記載了與中心數據庫H的特征數據的識別號(H00001)相關聯的、與該特征數據合并的加工后數據庫155A、155B的特征數據的識別號(A12345,B00044)。圖8B所示的樣本數與圖6C中的說明相同。
單一來源數據充分表示顧客的特征。因此,若以具備單一來源數據作為表示顧客特征的特征數據的中心數據庫H為基準,對中心數據庫H和每個加工后數據庫155進行合并,則能夠更恰當地對加工后數據庫155之間的特征數據進行結合。
HABIT等單一來源數據中包含表示顧客特征的多種信息。當對由數據加工裝置10提供的各加工后數據庫155與具備這樣單一來源數據的中心數據庫H進行合并時,可變更用于合并的參照數據。即,能夠根據加工后數據庫155具有的表示顧客特征的參數的種類,變更在合并中心數據庫H和加工后數據庫155中利用的參照數據。
例如,當加工后數據庫155具備含有表示顧客對網絡內容的接觸行為的參數的特征數據時,在中心數據庫H與加工后數據庫155之間,作為共同參數,除表示顧客的人口統計屬性的參數之外,還包括表示顧客接觸網絡內容的行為的參數,或者作為共同參數,不包括表示顧客的人口統計屬性的參數而包括表示顧客接觸網絡內容的行為的參數。
該情形下,可以以將共同參數所表示的顧客接觸網絡內容的行為相似的特征數據彼此合并的方式,對中心數據庫H和加工后數據庫155進行合并。
[第三實施例]
第三實施例的信息處理系統1具備多個數據加工裝置10、以及數據合并裝置50。使數據加工裝置10以及數據合并裝置50為與第一實施例以及第二實施例相同的硬件構成。以下對第三實施例的信息處理系統1中與第一實施例以及第二實施例相同的構成和處理內容省略說明。
本實施例的信息處理系統1具有圖9A所示的顧客相關數據庫1531L、1531R,作為顧客相關數據庫153。在圖9A左方區域示出顧客相關數據庫1531L的一例,該顧客相關數據庫1531L具有自POS系統獲取的顧客的購買數據作為與顧客有關的特征數據。在圖9A右方區域示出顧客相關數據庫1531R的一例,該顧客相關數據庫1531R具有表示顧客所利用的設備的利用情況的特征數據作為與顧客有關的特征數據。作為設備的一例而列舉微波爐烤箱一體機。
根據圖9A,顧客相關數據庫1531L具備每項結算的特征數據。該特征數據具有表示顧客的性別、年齡、以及居住地的參數作為顧客的人口統計屬性。該特征數據還具有表示顧客購買的商品的購買地點、商品編碼、購買數量、以及單價的參數。商品編碼包括例如JAN碼。
根據圖9A,顧客相關數據庫1531R具備每個微波爐烤箱一體機的特征數據。該特征數據包括表示擁有微波爐烤箱一體機的顧客的性別以及年齡的參數、和表示波爐烤箱一體機的設置地點、微波爐烤箱一體機中各使用時間段的功能以及食譜的參數。
具有顧客相關數據庫1531L的數據加工裝置10構成為在該顧客相關數據庫1531L中對例如性別、年齡以及購買經歷相似的多個特征數據進行集群化。與第一實施例相同,該數據加工裝置10構成為,以每個集群為單位,對屬于同一集群的多個特征數據進行統計處理,由此對每個集群生成將屬于同一集群的多個特征數據進行統合而成的虛擬顧客的特征數據。
這樣,數據加工裝置10生成與顧客相關數據庫1531L相對應的、具備每個虛擬顧客的特征數據的加工后數據庫155。與顧客相關數據庫1531L相對應的加工后數據庫155所包含的特征數據具有與顧客相關數據庫1531L的特征數據基本上相同的參數。不過,加工后數據庫155的特征數據示出對應集群的統計量作為參數值。并且可在加工時刪除顧客ID。
作為另一例,數據加工裝置10可構成為,按照顯示相同顧客ID的特征數據為單位,對顧客相關數據庫1531L所具有的結算單位的特征數據進行匯集,從而將其轉換成個人單位的特征數據。數據加工裝置10可進一步構成為,基于個人單位的特征數據的集合,對購買經歷相似的多個特征數據進行集群化以及統計處理,由此生成與顧客相關數據庫1531L相對應的加工后數據庫155。
具有顧客相關數據庫1531R的其他數據加工裝置10構成為,對在顧客相關數據庫1531R中例如性別、年齡、和功能以及食譜的利用情況相似的多個特征數據進行集群化。數據加工裝置10進一步構成為,以每個集群為單位,對屬于同一集群的多個特征數據進行統計處理,由此對每個集群生成將屬于同一集群的多個特征數據進行統合而成的虛擬設備的特征數據。這樣,數據加工裝置10生成與顧客相關數據庫1531R相對應的、具備每個虛擬設備的特征數據的加工后數據庫155。
數據合并裝置50構成為,對與上述顧客相關數據庫1531L相對應的加工后數據庫155、和與顧客相關數據庫1531R相對應的加工后數據庫155進行合并,從而生成合并數據庫557。
數據合并裝置50可以利用加工后數據庫155共同具有的表示顧客的性別以及年齡的參數、以及利用有關食材的參數作為參照數據,以將作為合并對象的加工后數據庫155之間參照數據所表示的特征相似的特征數據彼此合并的方式,對作為合并對象的加工后數據庫155之間進行合并。
“有關食材的參數”在與顧客相關數據庫1531L相對應的加工后數據庫155中,對應于特征數據所具有的表示商品編碼以及購買數量的參數。在與顧客相關數據庫1531R相對應的加工后數據庫155中,“有關食材的參數”對應使用食譜。
根據這樣生成的合并數據庫557,能夠對性別、年齡、購買食材、以及食譜之間的對應關系進行分析。因此,能夠通過微波爐烤箱一體機向用戶介紹對應于用戶經常購買的食材的推薦食譜。此外,還可以在從POS收銀機輸出的收據附上與利用頻率高的食譜相對應的食材的優惠券。
以上,作為第三實施例說明了以特征相似的特征數據為單位對顧客相關數據庫1531L、1531R這兩者進行集群化并進行統計處理的示例。不過,也可以對顧客相關數據庫1531L、1531L的一方不進行統計處理。
即,合并數據庫557既可以通過對顧客相關數據庫1531L的加工后數據庫155和顧客相關數據庫1531R進行合并而生成,又可以通過對顧客相關數據庫1531L與顧客相關數據庫1531R的加工后數據庫155進行合并而生成。前者的合并數據庫557可提供給例如顧客相關數據庫1531R的數據提供源。后者的合并數據庫557可提供給例如顧客相關數據庫1531L的數據提供源。
[第四實施例]
與第三實施例相同,第四實施例的信息處理系統1為基本上只有顧客相關數據庫153的構成與第一實施例以及第二實施例不同的系統。本實施例的信息處理系統1所具備的數據加工裝置10以及數據合并裝置50為與第一實施例以及第二實施例相同的硬件構成。
以下對第四實施例的信息處理系統1中與第一實施例以及第二實施例相同的構成和處理內容省略說明。接下來要說明的第五~第八實施例的信息處理系統1的硬件構成以及處理內容也基本上與第一實施例以及第二實施例相同。
本實施例的信息處理系統1具有如圖9B所示的顧客相關數據庫1532L、1532R,作為顧客相關數據庫153。圖9B左方區域示出顧客相關數據庫1532L的一例,該顧客相關數據庫1532L具有從POS系統獲取的顧客的購買數據作為有關顧客的特征數據。圖9B右方區域示出顧客相關數據庫1532R的一例,該顧客相關數據庫1532R具有表示自動售貨機利用情況的特征數據作為有關顧客的特征數據。
近年己知有具備液晶顯示器以及攝像機的飲料用自動售貨機。該自動售貨機具備以下功能,即,根據攝像機的拍攝圖像來辨別自動售貨機使用者的性別以及年齡,并基于該辨別結果,通過液晶顯示器顯示推薦的飲料。以下說明的合并數據庫557有助于對在自動售貨機上顯示的推薦飲料進行確定。
根據圖9B,顧客相關數據庫1532L構成為與第三實施例的顧客相關數據庫1531L相同。該顧客相關數據庫1532L具備表示與飲料有關的購買經歷的特征數據。
根據圖9B,顧客相關數據庫1532R具備各自動售貨機中的每個飲料銷售的特征數據。構成該顧客相關數據庫1532R的特征數據表示自動售貨機的設置地點以及制造商。該特征數據還表示飲料銷售時的天氣以及時間、和作為購買者人口統計屬性的性別以及年齡。該特征數據進一步還對購買者所購買的飲料的商品編碼、購買數量、以及單價進行表示。除此之外,特征數據還表示銷售時的庫存信息。自動售貨機的設置地點例如通過設置有自動售貨機的地點的經度緯度來表示。
具有顧客相關數據庫1532L的數據加工裝置10構成為,例如對顧客相關數據庫1532L中的性別、年齡以及購買經歷相似的多個特征數據進行集群化,從而與第三實施例相同,生成與顧客相關數據庫1532L相對應的加工后數據庫155。
具有顧客相關數據庫1532R的數據加工裝置10例如對顧客相關數據庫1532R中的設置地點、制造商以及庫存信息等相似的多個特征數據進行集群化。并且數據加工裝置10構成為,以每個集群為單位,對屬于同一集群的多個特征數據進行統計處理,由此對每個集群生成將屬于同一集群的多個特征數據進行統合而成的虛擬設備(自動售貨機)的特征數據。
這樣,數據加工裝置10構成為,生成與顧客相關數據庫1532R相對應的、具備每個虛擬設備的特征數據的加工后數據庫155。
數據合并裝置50構成為,對與上述顧客相關數據庫1532L相對應的加工后數據庫155、和與顧客相關數據庫1532R相對應的加工后數據庫155進行合并,從而生成合并數據庫557。
例如,數據合并裝置50利用表示顧客的性別以及年齡的參數并利用有關地點的參數作為參照數據,以將作為合并對象的加工后數據庫155之間參照數據所表示的特征相似的特征數據彼此合并的方式,對作為合并對象的加工后數據庫155之間進行合并。
在此所述的“有關地點的參數”在與顧客相關數據庫1532L相對應的加工后數據庫155中,對應于特征數據所具有的表示購買地點的參數。在與顧客相關數據庫1532R相對應的加工后數據庫155中,“有關地點的參數”對應于表示自動售貨機設置地點的參數。
根據這樣生成的合并數據庫557,例如能夠對消費者于便利商店或超級市場等商店的購買行為與消費者于自動售貨機的購買行為之間的對應關系進行分析。因此,基于該合并數據庫557,自動售貨機能夠向站立于自動售貨機前的使用者推薦與該使用者的年齡以及性別相對應的購買層在同一地區的商店經常購買的飲料。并且商店能夠在從POS收銀機輸出的收據附上與購買者的年齡以及性別相對應的在同一地區的自動售貨機中的暢銷飲料的優惠券。
與第三實施例相同,可以對顧客相關數據庫1532L以及顧客相關數據庫1532R的一方不進行統計處理。即,合并數據庫557既可以是對顧客相關數據庫1532L的加工后數據庫155和顧客相關數據庫1532R進行合并而成的數據庫,又可以是對顧客相關數據庫1532L和顧客相關數據庫1532R的加工后數據庫155進行合并而成的數據庫。對后述的第五~第八實施例也可適用該技術思想。
[第五實施例]
以下對第五實施例的信息處理系統1中與第一實施例以及第二實施例相同的構成和處理內容省略說明。本實施例的信息處理系統1具有圖10A所示的顧客相關數據庫1533L、1533R作為顧客相關數據庫153。
在圖10A左方區域示出顧客相關數據庫1533L的一例,該顧客相關數據庫1533L具有表示擁有智能電話所代表的便攜式終端的用戶特征的特征數據,作為有關顧客的特征數據。在圖10A右方區域示出顧客相關數據庫1533R的一例,該顧客相關數據庫1533R具有表示車站利用情況的特征數據作為有關顧客的特征數據。
根據圖10A,顧客相關數據庫1533L以每個便攜式終端為單位而具有特征數據。作為擁有便攜式終端的用戶的人口統計屬性,該特征數據對性別、年齡以及居住地進行表示。并且該特征數據還對用戶的移動經歷、以及各移動地點的天氣進行表示。而且該特征數據還通過安裝在便攜式終端的應用程序對用戶所利用的優惠券的利用情況進行表示。
顧客相關數據庫1533R以車站、檢票口、天氣、以及時間段的每個組合為單位而具有特征數據。作為對應的車站以及檢票口的通行數據,構成該顧客相關數據庫1533R的特征數據對該檢票口的行人的性別以及年齡、并且對通行時間段和通行時的天氣進行表示。行人的性別以及年齡可通過定期車票信息獲取,或通過由攝像機拍攝的圖像獲取。
具有顧客相關數據庫1533L的數據加工裝置10例如對顧客相關數據庫1533L中性別、年齡、移動情況以及優惠券使用情況相似的多個特征數據進行集群化。然后,以每個集群為單位,對屬于同一集群的多個特征數據進行統計處理,由此對每個集群生成將屬于同一集群的多個特征數據進行統合而成的虛擬便攜式終端的特征數據。這樣,數據加工裝置10生成與顧客相關數據庫1533L相對應的、具備每個虛擬便攜式終端的特征數據的加工后數據庫155。
具有顧客相關數據庫1533R的數據加工裝置10對顧客相關數據庫1533R中特征相似的特征數據進行集群化。然后,以集群為單位進行上述統計處理,由此生成加工后數據庫155,該加工后數據庫155具備與車站、檢票口、天氣以及時間段的組合有關的每個虛擬組合的特征數據。
數據合并裝置50構成為對上述與顧客相關數據庫1533L相對應的加工后數據庫155、和與顧客相關數據庫1533R相對應的加工后數據庫155進行合并,從而生成合并數據庫557。
例如,數據合并裝置50利用加工后數據庫155共同具有的表示性別以及年齡的參數以及有關地點和天氣的參數作為參照數據,以將作為合并對象的加工后數據庫155之間參照數據所表示的特征相似的特征數據彼此合并的方式,對作為合并對象的加工后數據庫155之間進行合并。
根據這樣生成的合并數據庫557,例如可以對在車站附近的消費者行為以及優惠券的使用情況、和車站以及檢票口的行人的傾向之間的對應關系進行分析。因此,基于該合并數據庫557,可以恰當地向從檢票口通過的用戶的便攜式終端傳送以促進對車站附近的商店的利用為目的的優惠券。
[第六實施例]
以下對第六實施例的信息處理系統1中與第一實施例以及第二實施例相同的構成和處理內容省略說明。本實施例的信息處理系統1具有圖10B所示的顧客相關數據庫1534L、1534R作為顧客相關數據庫153。
在圖10B左方區域示出顧客相關數據庫1534L的一例,該顧客相關數據庫1534L具有擁有ETC卡的顧客的特征數據。ETC卡是在日本推廣的收費公路網的電子收費(ETC)系統用信用卡。在圖10B右方區域示出顧客相關數據庫1534R的一例,該顧客相關數據庫1534R具有出入口與收費站的每個組合的特征數據作為有關顧客的特征數據。
顧客相關數據庫1534L以每張ETC卡為單位而具有特征數據。該特征數據表示與ETC卡相關聯的車載裝置的ID。此外,該特征數據還表示擁有ETC卡的顧客的性別、年齡以及居住地。并且該特征數據還表示收費站的ID以及通行日期時間。
構成顧客相關數據庫1534R的特征數據表示從對應出入口的對應收費站通行的車輛的ETC卡號、車載裝置ID、以及通行日期時間。并且該特征數據還包括通行車輛的數量以及附近設施的信息。
具有顧客相關數據庫1534L的數據加工裝置10例如對顧客相關數據庫1534L中性別、年齡以及移動情況相似的多個特征數據進行集群化。然后,以每個集群為單位,對屬于同一集群的多個特征數據進行統計處理,由此對每個集群生成將屬于同一集群的多個特征數據進行統合而成的每個虛擬顧客(卡)的特征數據。這樣,數據加工裝置10生成與顧客相關數據庫1534L相對應的、具備每個虛擬顧客(卡)的特征數據的加工后數據庫155。
具有顧客相關數據庫1534R的數據加工裝置10對顧客相關數據庫1534R中特征相似的特征數據進行集群化。然后,以每個集群為單位進行上述統計處理,由此生成具備每個虛擬收費站的特征數據的加工后數據庫155。
數據合并裝置50構成為,對該與顧客相關數據庫1534L相對應的加工后數據庫155、和與顧客相關數據庫1534R相對應的加工后數據庫155進行合并,從而生成合并數據庫557。
若基于這樣生成的合并數據庫557,則可經由車輛導航裝置等車載裝置或信用卡公司,恰當地向顧客傳送以促進對收費站附近設施的利用為目的的優惠券。
[第七實施例]
以下對第七實施例的信息處理系統1中與第一實施例以及第二實施例相同的構成和處理內容省略說明。本實施例的信息處理系統1具有圖11A所示的顧客相關數據庫1535L、1535R作為顧客相關數據庫153。
在圖11A左方區域示出顧客相關數據庫1535L的一例,該顧客相關數據庫1535L以每個數字標牌為單位而具有從數字標牌前通過的每個行人的特征數據,作為有關顧客的特征數據。在圖11A右方區域示出顧客相關數據庫1535R的一例,該顧客相關數據庫1535R以各個車站的每個檢票口為單位而具有從檢票口通行的每個行人的特征數據,作為有關顧客的特征數據。
根據圖11A,顧客相關數據庫1535L所具有的特征數據表示數字標牌的設置地點。此外,該特征數據還表示行人的性別、年齡以及通行日期時間。行人的性別以及年齡可以根據由設置在數字標牌或設置在其附近的攝像機拍攝的圖像進行辨別。并且該特征數據還可以是表示數字標牌附近各時間段的行人數、各時間段的數字標牌的觀看者人數、以及各時間段的登出信息的數據。
顧客相關數據庫1535R所具有的每個行人的特征數據表示行人的性別、年齡以及通行日期時間,并表示通行檢票口ID和具有該檢票口的車站的ID。
具有顧客相關數據庫1535L的數據加工裝置10例如對顧客相關數據庫1535L中行人特征相似的特征數據進行集群化。然后,以每個集群為單位,對屬于同一集群的多個特征數據進行統計處理,由此對每個集群生成將屬于同一集群的多個特征數據進行統合而成的虛擬行人的特征數據。這樣,數據加工裝置10生成與顧客相關數據庫1535L相對應的、具備每個虛擬行人的特征數據的加工后數據庫155。
具有顧客相關數據庫1535R的數據加工裝置10例如對顧客相關數據庫1535R中行人特征相似的特征數據進行集群化。然后以每個集群為單位進行上述統計處理,由此生成具備每個虛擬行人的特征數據的加工后數據庫155。
數據合并裝置50構成為,對與顧客相關數據庫1535L相對應的加工后數據庫155、和與顧客相關數據庫1535R相對應的加工后數據庫155進行合并,從而生成合并數據庫557。
例如,數據合并裝置50利用加工后數據庫155共同具有的表示行人的性別以及年齡的參數、并利用有關地點的參數作為參照數據,以將作為合并對象的加工后數據庫155之間參照數據所表示的特征相似的特征數據彼此合并的方式,對作為合并對象的加工后數據庫155之間進行合并。
“有關地點的參數”在與顧客相關數據庫1535L相對應的加工后數據155中,對應于特征數據所具有的表示數字標牌設置地點的參數。在與顧客相關數據庫1535R相對應的加工后數據庫155中,“有關地點的參數”對應于表示車站以及檢票口的參數。
若根據這樣生成的合并數據庫557,例如能夠對檢票口的行人與數字標牌前的行人之間的對應關系進行分析。從而能夠配合檢票口行人的變化而適當地切換在數字標牌上顯示的廣告。
[第八實施例]
以下對第八實施例的信息處理系統1中與第一實施例以及第二實施例相同的構成和處理內容省略說明。本實施例的信息處理系統1具有圖11B所示的顧客相關數據庫1536L、1536R作為顧客相關數據庫153。
在圖11B左方區域示出顧客相關數據庫1536L的一例,該顧客相關數據庫1536L具有通過攝像機拍攝到的監視區域內的每個行人的特征數據,作為有關顧客的特征數據。圖11B右方區域示出顧客相關數據庫1536R的一例,該顧客相關數據庫1536R具有表示飲料用自動售貨機的利用情況的特征數據,作為有關顧客的特征數據。
根據圖11B,顧客相關數據庫1536L所具有的特征數據表示行人被拍攝到的地點(監視區域)以及時間段。此外,該特征數據還表示行人的性別以及年齡。并且特征數據還可以是表示行人的停留時間或通行時間的數據。
顧客相關數據庫1536R具備各自動售貨機中每個飲料銷售的特征數據。構成該顧客相關數據庫1536R的特征數據構成為與第四實施例的顧客相關數據庫1532R所具有的特征數據相同。
具有顧客相關數據庫1536L的數據加工裝置10對顧客相關數據庫1536L中行人特征相似的特征數據進行集群化。然后,以每個集群為單位,對屬于同一集群的多個特征數據進行統計處理,由此對每個集群生成將屬于同一集群的多個特征數據進行統合而成的虛擬行人的特征數據。這樣,數據加工裝置10生成與顧客相關數據庫1536L相對應的、具備每個虛擬行人的特征數據的加工后數據庫155。
具有顧客相關數據庫1536R的數據加工裝置10按照顧客相關數據庫1536R中購買者的特征相似的特征數據為單位而進行集群化,從而生成具備每個虛擬購買者的特征數據的加工后數據庫155。
數據合并裝置50構成為,對與顧客相關數據庫1536L相對應的加工后數據庫155、和與顧客相關數據庫1536R相對應的加工后數據庫155進行合并,從而生成合并數據庫557。
例如,數據合并裝置50利用該加工后數據庫155共同具有的表示性別以及年齡的參數、并利用有關地點的參數作為參照數據,以將作為合并對象的加工后數據庫155之間參照數據所表示特征相似的特征數據彼此合并的方式,對作為合并對象的加工后數據庫155之間進行合并。“有關地點的參數”在與顧客相關數據庫1536L相對應的加工后數據庫155中,對應于特征數據所具有的表示行人被拍攝到的地點的參數。在與顧客相關數據庫1536R相對應的加工后數據庫155中,“有關地點的參數”對應于表示自動售貨機的設置地點的參數。
若根據這樣生成的合并數據庫557,則能夠例如對行人的分布以及停留時間、和自動售貨機的購買行為之間的對應關系進行分析。該分析結果可有助于自動售貨機的庫存管理、備貨品種、以及產品推薦顯示。
[其他]
本公開不限于上述實施例,能夠采用各種方式。例如,上述實施例中對作為合并對象的數據庫(加工后數據庫155或顧客相關數據庫153)之間顧客組不一致的示例進行了說明。不過本公開的技術也可以用于對表示與相同顧客組有關的不同種類的特征的數據庫之間進行合并。例如,本公開的技術可以用于對相同顧客組在便利商店的購買數據、和在超級市場的購買數據進行合并。由記載在權利要求書中的語句確定的技術思想所包含的各種形態均為本公開的實施方式。
最后對用語之間的對應關系進行說明。數據加工裝置10所具備的運算部11(特別是聚類處理部110以及加工處理部115)對應于生成單元的一例。數據合并裝置50所具備的運算部51(特別是數據融合處理部510)對應于合并單元的一例。數據合并裝置50所具備的儲存部55對應于儲存單元的一例。構成數據庫(顧客相關數據庫153/加工后數據庫155)的特征數據的集合、或與該集合相對應的人、物(例如便攜式終端/自動售貨機/微波爐烤箱一體機/卡)、或者地點(例如檢票口/收費站)的集合對應于組的一例。該集合的元素對應于結構體的一例。