本發明涉及大數據技術領域,具體涉及一種基于智能手機姿態行為大數據的用戶性別識別方法。
背景技術:
隨著移動互聯網的高速發展,智能手機的用戶畫像或者說是用戶標簽對于在龐大的移動互聯網用戶群體中對精準人群進行品牌營銷尤為關鍵。用戶畫像是將用戶信息標簽化,即企業通過收集與分析用戶的消費習慣、生活習慣和社會屬性等主要信息的數據后,抽象出用戶的商業全貌。移動互聯網企業可以通過用戶畫像尋找匹配人群,精準推送營銷廣告或服務信息,最終實現個性化營銷與服務推送。
經過20多年的發展,隨著技術的進步,手機無論從造型還是功能都發生了翻天覆地的變化,已經不再是一個簡單的通信工具,而是具有多樣化的功能。在這種情況下,各種傳感器在iphone、ipad、android系統和其它系統的智能手機中得到廣泛應用。其中,加速度/運動傳感器、陀螺儀可通過感知設備的加速度/重力和運動狀態,從而得到當前設備的姿態。
針對用戶的畫像研判,當前已經有了一些研究工作,主要集中在用戶的網絡日志和搜索內容上。對網絡日志的書寫習慣和用語習慣、以及用戶的搜索內容,通過基于文本的分類方法、統計分析和關聯預測方法,建立搜索內容、用語習慣等與用戶基本屬性之間的聯系,從而預測用戶的性別、年齡、職業等用戶畫像屬性。
但是,對于智能手機,其瀏覽器一般沒有cookie,用戶的網絡日志難以獲取。用戶的搜索一般只能由搜索引擎公司獲得,第三方公司無法得到。因此,在手機上要獲取用戶信息,建立用戶畫像是比較困難的。因此一些新的方法被提出。例如專利《一種基于智能手機加速度傳感器的用戶基礎屬性預測方法》提出通過收集用戶智能手機的流量數據,例如app流量的精確使用情況,包括app的名字、使用時間和流量等特征數據,再通過svm模型對這些數據進行分析,建立用戶分類預測模型。但是該方法的準確性不是很高。
技術實現要素:
針對上述問題,本發明的目的在于提供一種基于智能手機姿態行為大數據的用戶性別識別方法,實現通過用戶使用智能手機的姿態行為的不同精確識別智能手機用戶性別的方法。
本發明通過以下技術手段解決上述問題:
一種基于智能手機姿態行為大數據的用戶性別識別方法,包括如下步驟:
s1、使用智能手機操作系統提供的api,記錄智能手機一段時間內加速傳感器、陀螺傳感器和方向傳感器返回的數據;
s2、通過加速傳感器和陀螺傳感器返回的數據采用算法得到智能手機用戶的運動狀態,對運動狀態進行分類,記錄每個運動狀態下的加速傳感器、陀螺傳感器和方向傳感器的數據;
s3、對加速傳感器的數據進行處理,得到每個運動狀態下的加速特征值組;
s4、將每個運動狀態下的加速特征值組放到大數據分類算法模型中,首先使用已知性別的每個運動狀態下的加速特征值組作為樣本數據輸入到大數據分類算法模型中進行訓練,再用訓練好的數據預測用戶的性別;
s5、對陀螺傳感器的數據進行處理,得到每個運動狀態下的角速度特征值組;
s6、將每個運動狀態下的角速度特征值組放到大數據分類算法模型中,首先使用已知性別的每個運動狀態下的角速度特征值組作為樣本數據輸入到大數據分類算法模型中進行訓練,再用訓練好的數據預測用戶的性別;
s7、對方向傳感器的數據進行處理,得到每個運動狀態下的方向特征值組;
s8、將每個運動狀態下的方向特征值組放到大數據分類算法模型中,首先使用已知性別的每個運動狀態下的方向特征值組作為樣本數據輸入到大數據分類算法模型中進行訓練,再用訓練好的數據預測用戶的性別;
s9、將步驟s4、步驟s6和步驟s8結果加權平均得到最終的用戶的性別。
進一步地,步驟s3-s4、步驟s5-s6和步驟s7-s8是同時進行的。
進一步地,所述運動狀態包括走路、跑步、上樓、下樓、乘坐交通工具、坐和靜止。
進一步地,步驟s2中,采用android官方api文檔和iphone官方api文檔中敘述的算法得到智能手機用戶的運動狀態。
進一步地,步驟s7具體包括如下步驟:
s71、方向傳感器數據記錄三個維度數據:智能手機繞著z軸旋轉的角度、智能手機繞著x軸旋轉的角度和智能手機繞著y軸旋轉的角度;
s72、對每個運動狀態下的方向傳感器數據按時間順序進行統計,將突然上升或突然下降超過一定閥值的數據記錄為一個峰值;
s73、對相鄰兩個峰值之間的數據計算數據的平均值、最大值、最小值和標準差;
s74、所有數據的平均值、最大值、最小值和標準差按時間順序組成用戶的每個運動狀態下的方向特征值組。
進一步地,s72中,所述閥值設為90°。
進一步地,所述大數據分類算法模型為svm、adaboost或lda。
本發明通過用戶使用智能手機的姿態行為的不同,通過大數據方法統計大量人群的使用習慣,能對智能手機用戶的性別進行準確的識別,準確度更高。
附圖說明
為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本發明基于智能手機姿態行為大數據的用戶性別識別方法的步驟圖;
圖2是本發明基于智能手機姿態行為大數據的用戶性別識別方法的流程圖。
具體實施方式
為使本發明的上述目的、特征和優點能夠更加明顯易懂,下面將結合附圖和具體的實施例對本發明的技術方案進行詳細說明。需要指出的是,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例,基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
如圖1、圖2所示,本發明提供一種基于智能手機姿態行為大數據的用戶性別識別方法,包括如下步驟:
s1、使用智能手機操作系統提供的api,記錄智能手機一段時間內加速傳感器、陀螺傳感器和方向傳感器返回的數據;
s2、通過加速傳感器和陀螺傳感器返回的數據采用算法得到智能手機用戶的運動狀態,相關算法在android官方api文檔和iphone官方api文檔中都有敘述,對運動狀態進行分類,運動狀態包括走路、跑步、上樓、下樓、乘坐交通工具、坐和靜止,記錄每個運動狀態下的加速傳感器、陀螺傳感器和方向傳感器的數據;
s3、對加速傳感器的數據進行處理,得到每個運動狀態下的加速特征值組;
s4、將每個運動狀態下的加速特征值組放到大數據分類算法模型中,首先使用已知性別的每個運動狀態下的加速特征值組作為樣本數據輸入到大數據分類算法模型中進行訓練,再用訓練好的數據預測用戶的性別,大數據分類算法模型為svm(supportvectormachine)、adaboost或lda(lineardiscriminantanalysis);
s5、對陀螺傳感器的數據進行處理,得到每個運動狀態下的角速度特征值組;
s6、將每個運動狀態下的角速度特征值組放到大數據分類算法模型中,首先使用已知性別的每個運動狀態下的角速度特征值組作為樣本數據輸入到大數據分類算法模型中進行訓練,再用訓練好的數據預測用戶的性別;
s7、對方向傳感器的數據進行處理,得到每個運動狀態下的方向特征值組;
具體包括如下步驟:
s71、方向傳感器數據記錄三個維度數據:智能手機繞著z軸旋轉的角度、智能手機繞著x軸旋轉的角度和智能手機繞著y軸旋轉的角度;
s72、對每個運動狀態下的方向傳感器數據按時間順序進行統計,將突然上升或突然下降超過一定閥值(例如90°)的數據記錄為一個峰值;
s73、對相鄰兩個峰值之間的數據計算數據的平均值、最大值、最小值和標準差;
s74、所有數據的平均值、最大值、最小值和標準差按時間順序組成用戶的每個運動狀態下的方向特征值組。
s8、將每個運動狀態下的方向特征值組放到大數據分類算法模型中,首先使用已知性別的每個運動狀態下的方向特征值組作為樣本數據輸入到大數據分類算法模型中進行訓練,再用訓練好的數據預測用戶的性別;
s9、將步驟s4、步驟s6和步驟s8結果加權平均得到最終的用戶的性別。
其中,步驟s3-s4、步驟s5-s6和步驟s7-s8是同時進行的。
由于男女攜帶智能手機的習慣不同,導致手機的姿態不同。例如在走路時男子多將手機放在褲袋內,女子多將手機放在手提包中。褲袋中的手機一般接近豎立的角度,手提包中的手機一般接近側臥的角度。在坐下時,男女的手機姿態都有可能是側臥角度;但褲袋中的手機會因為腿的小幅度運動而運動,手提包中的手機會一直靜止不動。上下樓和乘坐交通工具時褲袋中的手機運動方向與手提包中的手機有著顯著差異。
由于現代智能手機內部都配置了手機重力感應技術,利用壓電效應,測量內部一片重物重力正交兩個方向的分力大小,來判定水平方向,從而能夠感受手機在變換姿勢時,重心的變化。智能手機內部的三軸陀螺儀測量手機的三維方向,能更精確地檢測手機的三維方向變化。加速度傳感器能感知手機在三維方向的加速度。這些傳感器可以用來測量手機的運動狀態和姿態。
本發明通過用戶使用智能手機的姿態行為的不同,通過大數據方法統計大量人群的使用習慣,能對智能手機用戶的性別進行準確的識別,準確度更高。
以上所述實施例僅表達了本發明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對本發明專利范圍的限制。應當指出的是,對于本領域的普通技術人員來說,在不脫離本發明構思的前提下,還可以做出若干變形和改進,這些都屬于本發明的保護范圍。因此,本發明專利的保護范圍應以所附權利要求為準。