用于分析關注實體特性的設備、系統以及方法
【專利說明】
[0001] 相關申請的交叉引用
[0002] 本申請根據35U.S.C.§119(e)要求以下先前提交日期的權益:
[0003] ?在 2013年 3 月15 日提交的,名稱為"SYSTEM FOR ANALYZING AND USING LOCATION BASED BEHAVIOR" 的美國臨時申請No.61/799,986;
[0004] ?在2013年3 月 15 日提交的,名稱為 "GEOGRAPHIC LOCATION DESCRIPTOR AND LINKER"的美國臨時申請No · 61/800,036;
[0005] ?在2013年3月 15 日提交的,名稱為 "SYSTEM AND METHOD FOR CROWD SOURCING DOMAIN SPECFIC INTELLIGENCE" 的美國臨時申請No.61/799,131;
[0006] ?在2013年3月 15 日提交的,名稱為 "SYSTEM WITH BATCH AND REAL TIME DATA PROCESSING"的美國臨時申請No. 61/799,846;以及
[0007] ?在 2013年 3 月15 日提交的,名稱為"SYSTEM FOR ASSIGNING SCORES TO LOCATION ENTITIES" 的美國臨時申請No · 61/799,817。
[0008] 本申請同樣涉及:
[0009] ?在同一日期與此一道提交的,名稱為 "APPARATUS,SYSTEMS,AND METHODS FOR ANALYZING MOVEMENTS OF TARGET ENTITIES" 的美國專利申請No. 14/214,208;
[0010] ?在同一日期與此一道提交的,名稱為 "APPARATUS,SYSTEMS,AND METHODS FOR PROVIDING LOCATION INFORMATION" 的美國專利申請No. 14/214,296;
[0011] ?在同一日期與此一道提交的,名稱為 "APPARATUS,SYSTEMS,AND METHODS FOR CROWDSOURCING DOMAIN SPECIFIC INTELLIGENCE" 的美國專利申請No. 14/214,213;
[0012] ?在同一日期與此一道提交的,名稱為 "APPARATUS,SYSTEMS,AND METHODS FOR BATCH AND REALTIME DATA PROCESSING" 的美國專利申請No. 14/214,219;
[0013] ?在同一日期與此一道提交的,名稱為 "APPARATUS,SYSTEMS,AND METHODS FOR ANALYZING CHARACTERISTICS OF ENTITIES OF INTEREST" 的美國專利申請No .14/214, 309;以及
[0014] ?在同一日期與此一道提交的,名稱為 "APPARATUS,SYSTEMS,AND METHODS FOR GROUPING DATA RECORDS"的美國專利申請No.14/214,231。
[0015] 以上引用的申請(包括臨時申請和非臨時申請兩者)中的每一個申請的整體內容 通過引用并入本文。
技術領域
[0016] 所公開的主題一般涉及用于分析關注實體特性的數據處理設備、系統和方法。
【背景技術】
[0017] 在線服務提供關于關注實體的有用信息。例如,一些社交聯網服務基于用戶評論 和/或代理商的獨家評論,提供針對餐廳和咖啡館的質量和價格友好度的評級。雖然這種信 息可能是方便和有用的,但是因為從中產生評級的信息源可能不可靠,所以這種信息可能 不可靠。例如,因為某些用戶可能具有其它不可告人的動機,所以來自這些用戶的評論可能 是故意歪曲的。即使信息源是可靠的,但因為信息是從有偏見的來源或小數量的來源導出 的,所以信息可能有偏差。當僅存在很少評論者時,信息具有低統計顯著性。
【發明內容】
[0018] -般地,在一方面,所公開主題的實施例可包括設備。設備包括被配置成維護關于 關注實體的信息的存儲裝置,其中信息包括與關注實體相關聯的內部數據、外部數據以及 服務器日志。設備同樣包括處理器,其與存儲裝置通信并且被配置成運行一個或多個模塊。 一個或多個模塊可操作以使設備用于檢索關于關注實體的內部數據、外部數據以及服務器 日志;基于內部數據、外部數據以及服務器日志,生成多個特征;以及基于多個特征計算關 注實體的分數,其中分數指示關注實體的重要性。
[0019] 一般地,在一方面,所公開主題的實施例可包括用于處理與關注實體相關的信息 的方法。方法包括檢索關于關注實體的內部數據、外部數據以及服務器日志;基于內部數 據、外部數據以及服務器日志,生成針對關注實體的多個特征;以及基于多個特征計算針對 關注實體的分數,其中分數指示關注實體的重要性。
[0020] -般地,在一方面,所公開主題的實施例可包括非暫時性計算機可讀介質。非暫時 性計算機可讀介質可包括可執行指令,該可執行指令可操作以使數據處理設備檢索關于關 注實體的內部數據、外部數據以及服務器日志;基于內部數據、外部數據以及服務器日志, 生成關注實體的多個特征;以及基于多個特征計算關注實體的分數,其中分數指示關注實 體的重要性。
[0021] 本文所公開的實施例中的任何一個實施例中,設備、方法或非暫時性計算機可讀 介質可包括,用于從計算裝置接收信息請求,該信息請求包括查詢并且請求設備提供關于 與查詢相關聯的一個或多個實體的信息;基于與查詢所關聯的至少一個實體相關聯的至少 一個分數,識別至少一個實體;以及在向計算裝置提供關于至少一個實體的信息之前,使用 分選機構基于至少一個分數對至少一個實體排序的模塊、步驟或可執行指令。
[0022] 本文所公開的實施例中的任何一個實施例中,設備、方法或非暫時性計算機可讀 介質可包括,用于基于與信息請求相關聯的一個或多個上下文條件而改變至少一個實體的 一個或多個分數來修改至少一個實體的順序的模塊、步驟或可執行指令。
[0023] 本文所公開的實施例中的任何一個實施例中,與信息請求相關聯的一個或多個上 下文條件可包括如下中的一個或多個:接收信息請求時的時間,從中接收信息請求的地理 位置,從中接收信息請求的應用,從中接收信息請求的用戶的簡檔,和/或發送信息請求的 計算裝置的類型。
[0024]本文所公開的實施例中的任何一個實施例中,多個特征中的一個特征包括與Ε0Ι 的特定特性相關聯的概要屬性,并且設備、方法或非暫時性計算機可讀介質可包括,用于將 內部數據、外部數據以及服務器日志格式化成具有預定數據結構的結構化數據;確定與Ε0Ι 的特定特性相關聯的結構化數據的子集;以及基于結構化數據的子集,生成Ε0Ι的特定特性 的概要屬性的模塊、步驟或可執行指令。
[0025]本文所公開的實施例中的任何一個實施例中,多個特征中的一個特征可包括內部 數據集中與關注實體相關的數據項的聚合計數。
[0026] 本文所公開的實施例中的任何一個實施例中,多個特征中的一個特征可包括指示 由設備接收的針對與關注實體相關的信息的信息請求的總數的信息請求特征。
[0027] 本文所公開的實施例中的任何一個實施例中,信息請求可與多個信息請求類型中 的一個信息請求類型相關聯,并且信息請求特征同樣可指示與多個信息請求類型中的每個 信息請求類型相關聯的信息請求的總數。
[0028] 本文所公開的實施例中的任何一個實施例中,多個特征可歸一化成通用尺度。
[0029] 本文所公開的實施例中的任何一個實施例中,設備、方法或非暫時性計算機可讀 介質可包括,用于通過將外部數據的一個或多個屬性與內部數據相匹配,來確定在外部數 據和內部數據之間的關聯的模塊、步驟或可執行指令。
[0030] 本文所公開的實施例中的任何一個實施例中,設備、方法或非暫時性計算機可讀 介質可包括,用于通過計算與Ε0Ι相關聯的多個特征的加權組合來計算關注實體的分數的 模塊、步驟或可執行指令。
[0031] 本文所公開的實施例中的任何一個實施例中,設備、方法或非暫時性計算機可讀 介質可包括,用于基于指示多個特征中每個特征的重要性的重要性標簽,來確定用于加權 組合的權重的模塊、步驟或可執行指令。
[0032] 本文所公開的實施例中的任何一個實施例中,設備、方法或非暫時性計算機可讀 介質可包括,用于通過計算多個特征的指數,來計算關注實體的分數的模塊、步驟或可執行 指令。
【附圖說明】
[0033] 當結合以下附圖考慮時,參考以下詳細描述可更完整地理解本發明的各種目的、 特征和優點,在附圖中相同的參考標記識別相同的元件。附圖僅用于說明的目的,并且不旨 在限制本公開主題的事件,在緊隨的權利要求中陳述本公開主題的范圍。
[0034] 圖1示出根據一些實施例的排名客戶端/服務器系統。
[0035] 圖2示出根據一些實施例的用于計算關注實體(Ε0Ι)的排名值的方法。
[0036] 圖3示出根據一些實施例的用于計算Ε0Ι的排名值的流水線圖。
[0037] 圖4示出根據一些實施例示出多個餐廳的排名值的表。
[0038] 圖5示出根據一些實施例基于與Ε0Ι相關聯的排名值的客戶端和服務器之間的交 互。
【具體實施方式】
[0039] 本公開涉及用于分析關注實體特性的設備、系統和方法。特別地,本公開提供用于 分析關于關注實體的信息,并且用于基于所分析的信息來對關注實體評級或評分的機構。 關注實體的等級或分數有時可指關注實體的排名值。在一些實施例中,"關注實體"(Ε0Ι)可 包括具有物理位置的諸如餐廳、國家公園、商店、旅行社或咖啡館的任何實體,或諸如機動 車輛登記處的政府實體,或任何其它商業或非商業實體。在其它實施例中,Ε0Ι可包括例如 產品、人員、建筑物或計算機的任何其它類型的實體。
[0040] 在高層面,Ε0Ι的排名值指示鑒于預定特性或標準的Ε0Ι的重要性或相關性。例如, Ε0Ι的排名值可指示Ε0Ι的"家庭友好度"。在該示例中,高排名值可指示相關聯的Ε0Ι是家庭 友好的,然而低排名值可指示相關聯的EOI不是家庭友好的。在一些實施例中,EOI可與多個 排名值相關聯,每個排名值與諸如預定觀眾或預定場景的特定特性或標準相關聯。例如,餐 廳可與三個排名值相關聯:placerank. foodie、placerank · social 以及placerank · good_ for_singlesaplacerank. foodie可指不EOI對于美食家的受歡迎度;placerank. social可 指示EOI針對社交活動的受歡迎度;以及placerank. good_for_singles可指示EOI對于單人 的受歡迎度。
[0041]排名值在任何被配置成響應于諸如在客戶端/服務器系統中的信息請求來提供 Ε0Ι的系統中可以是有用的。例如,客戶端可向服務器提交包括例如搜索查詢:"在紐約格林 威治村附近的好的中國餐廳"的信息請求。作為對請求的響應,服務器可