一種大數據分析方法及其裝置的制造方法
【專利摘要】本發明實施例公開了一種大數據分析方法,包括:基于輸入的第一組數據和第二組數據,獲取滿足預設條件的至少兩個特征信息;所述第一組數據和第二組數據均為第一通信網絡中的數據;所述第一組數據滿足第一預設規則;所述第二組數據滿足第二預設規則;依據所述至少兩個特征信息,對所述第一組數據和第二組數據進行分析,確定出第一類規則和第二類規則;依據所述第一類規則和第二類規則,在輸入的第三組數據中確定出滿足所述第一預設規則的目標數據;所述第三組數據為除所述第一通信網絡以外的其他通信網絡中的數據。本發明實施例還公開了一種大數據分析裝置。
【專利說明】
一種大數據分析方法及其裝置
技術領域
[0001]本發明涉及通信技術,尤其涉及一種大數據分析方法及其裝置。
【背景技術】
[0002]隨著第四代移動通信技術(4G,the4 Generat1n mobile communicat1ntechnology)的商用,各大運營商競爭益發激烈;異網高價值用戶的回流工作和4G終端的滲透工作對于移動運營商的發展起著重要作用;所以異網高價值用戶的識別顯得至關重要。
[0003]目前業界已有對用戶行為進行分析并建模以確定用戶屬性的方法,但是,現有方法中,普遍側重于統計異網用戶的數量,并不側重于異網用戶的識別,以及異網用戶的終端類型的識別。
【發明內容】
[0004]為解決現有存在的技術問題,本發明實施例提供了一種大數據分析方法及其裝置,能夠依據本網數據規則,在異網數據中確定出滿足預設規則的目標數據。
[0005]本發明實施例的技術方案是這樣實現的:本發明實施例提供了一種大數據分析方法,所述方法包括:
[0006]基于輸入的第一組數據和第二組數據,獲取滿足預設條件的至少兩個特征信息;所述第一組數據和第二組數據均為第一通信網絡中的數據;所述第一組數據滿足第一預設規則;所述第二組數據滿足第二預設規則;
[0007]依據所述至少兩個特征信息,對所述第一組數據和第二組數據進行分析,確定出第一類規則和第二類規則;
[0008]依據所述第一類規則和第二類規則,在輸入的第三組數據中確定出滿足所述第一預設規則的目標數據;所述第三組數據為除所述第一通信網絡以外的其他通信網絡中的數據。
[0009]上述方案中,所述依據所述至少兩個特征信息,對所述第一組數據和第二組數據進行分析,確定出第一類規則和第二類規則,包括:
[0010]采用邏輯回歸算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第一類規則;
[0011]采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第二類規則。
[0012]上述方案中,所述采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第二類規則,包括:
[0013]采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出N個規則;所述N為大于等于2的正整數;
[0014]在所述N個規則中,確定出滿足第三預設規則的第二類規則。
[0015]上述方案中,所述依據所述第一類規則和第二類規則,在輸入的第三組數據中確定出滿足所述第一預設規則的目標數據,包括:
[0016]分別依據所述第一類規則和第二類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據和第二疑似目標數據;
[0017]基于所述第一疑似目標數據和第二疑似目標數據確定出滿足所述第一預設規則的目標數據。
[0018]上述方案中,所述第二類規則包括:第一類子規則;所述第一類子規則滿足所述第一預設規則;
[0019]對應地,所述分別依據所述第一類規則和第二類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據和第二疑似目標數據,包括:
[0020]依據所述第一類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據;[0021 ] 依據所述第一類子規則,對輸入的第三組數據進行分析,得到第二疑似目標數據。
[0022]上述方案中,所述第二類規則還包括:第二類子規則;所述第二類子規則滿足第二預設規則;所述方法還包括:
[0023]依據所述第二類子規則,對所述第一疑似目標數據和所述第二疑似目標數據進行分析,得到疑似非目標數據;
[0024]對應地,所述基于所述第一疑似目標數據和第二疑似目標數據確定出目標數據,包括:
[0025]基于所述第一疑似目標數據、第二疑似目標數據和疑似非目標數據,確定出目標數據。
[0026]本發明實施例還提供了一種大數據分析裝置,所述裝置包括:
[0027]獲取單元,用于基于輸入的第一組數據和第二組數據,獲取滿足預設條件的至少兩個特征信息;所述第一組數據和第二組數據均為第一通信網絡中的數據;所述第一組數據滿足第一預設規則;所述第二組數據滿足第二預設規則;
[0028]分析單元,用于依據所述至少兩個特征信息,對所述第一組數據和第二組數據進行分析,確定出第一類規則和第二類規則;
[0029]確定單元,用于依據所述第一類規則和第二類規則,在輸入的第三組數據中確定出滿足所述第一預設規則的目標數據;所述第三組數據為除所述第一通信網絡以外的其他通信網絡中的數據。
[0030]上述方案中,所述分析單元包括:
[0031]第一分析子單元,用于采用邏輯回歸算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第一類規則;
[0032]第二分析子單元,用于采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第二類規則。
[0033]上述方案中,所述第二分析子單元,還用于采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出N個規則;所述N為大于等于2的正整數;
[0034]還用于在所述N個規則中,確定出滿足第三預設規則的第二類規則。
[0035]上述方案中,所述確定單元,包括:
[0036]第一確定子單元,用于分別依據所述第一類規則和第二類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據和第二疑似目標數據;
[0037]第二確定子單元,用于基于所述第一疑似目標數據和第二疑似目標數據確定出滿足所述第一預設規則的目標數據。
[0038]上述方案中,所述第二類規則包括:第一類子規則;所述第一類子規則滿足所述第一預設規則;對應地,
[0039]所述第一確定子單元,還用于依據所述第一類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據;
[0040]還用于依據所述第一類子規則,對輸入的第三組數據進行分析,得到第二疑似目標數據。
[0041]上述方案中,所述第二類規則還包括:第二類子規則;所述第二類子規則滿足第二預設規則;
[0042]所述第一確定子單元,還用于依據所述第二類子規則,對所述第一疑似目標數據和所述第二疑似目標數據進行分析,得到疑似非目標數據;
[0043]對應地,所述第二確定子單元,還用于基于所述第一疑似目標數據、第二疑似目標數據和疑似非目標數據,確定出目標數據。
[0044]本發明實施例所提供的大數據分析方法及其裝置,能夠在第一通信網絡的第一組數據和第二組數據中確定出至少兩個特征信息,并采用兩種不同算法,基于所述至少兩個特征信息確定出針對于不同算法的第一類規則和第二類規則,如此,通過所述第一類規則和第二類規則,對除所述第一通信網絡以外的其他通信網絡中的第三組數據進行分析,以在所述第三組數據中確定出滿足預設規則的目標數據,因此,本發明實施例能夠實現依據本網數據規則,在異網數據中確定出滿足預設規則的目標數據的目的。
【附圖說明】
[0045]圖1為本發明實施例大數據分析方法的實現流程示意圖;
[0046]圖2為本發明實施例大數據分析裝置的具體結構示意圖;
[0047]圖3為本發明實施例分析單元的具體結構示意圖;
[0048]圖4為本發明實施例確定單元的具體結構示意圖;
[0049]圖5為本發明實施例大數據分析方法的具體實現的流程示意圖。
【具體實施方式】
[0050]為了能夠更加詳盡地了解本發明的特點與技術內容,下面結合附圖對本發明的實現進行詳細闡述,所附附圖僅供參考說明之用,并非用來限定本發明。
[0051]實施例一
[0052]圖1為本發明實施例大數據分析方法的實現流程示意圖;如圖1所示,所述方法包括:
[0053]步驟101:基于輸入的第一組數據和第二組數據,獲取滿足預設條件的至少兩個特征信息;所述第一組數據和第二組數據均為第一通信網絡中的數據;所述第一組數據滿足第一預設規則;所述第二組數據滿足第二預設規則;
[0054]本實施例中,所述第一預設規則可以為在第一通信網絡中數據對應的用戶的通信設備類型屬于第一類型的規則;所述第二預設規則可以為在第一通信網絡中數據對應的用戶的通信設備類型不屬于第一類型的規則;如此,在所述第一通信網絡中,所述第一組數據所對應的通信設備類型均為第一類型;所述第二組數據對應的通信設備類型均不為第一類型;由于不同通信設備類型所對應的數據的特征規則不同,因此,通過對第一組數據和第二組數據各自的特征規則進行分析,能夠確定出滿足預設條件的M個特征信息;基于所述M個特征信息對數據進行分析,能夠估算出數據對應的通信設備類型等特征;基于上述過程,本發明實施例能夠依據所述第一通信網絡中的特征信息,從異網的大量數據中確定出通信設備類型屬于第一類型的數據,為大數據分析奠定基礎;這里,所述M為大于等于2的正整數。
[0055]本實施例中,所述特征信息具體為符合預設條件的關鍵變量指標,采用不同的算法,通過關鍵變量指標對第一通信網絡中的大數據進行分析,也即對第一組數據和第二組數據進行分析,如此,為在第一通信網絡的大數據中確定出規則奠定基礎。
[0056]本實施例中,所述預設條件包括但不限于:大于等于第一用戶數量的條件、通信對象的通信設備類型為第一類型的條件等。
[0057]步驟102:依據所述至少兩個特征信息,對所述第一組數據和第二組數據進行分析,確定出第一類規則和第二類規則;
[0058]本實施例中,依據第一通信網絡中確定出的至少兩個特征信息,采用不同算法,對所述第一組數據和第二組數據進行分析,進而確定出基于所述第一通信網絡的第一類規則和第二類規則。
[0059]在實際應用中,對大數據進行數據分析時,通常選用不同的算法,如此,以提高分析結果的準確性;因此,本實施例也選用兩種不同的算法對輸入的第一組數據和第二組數據進行分析。
[0060]上述方案中,所述依據所述至少兩個特征信息,對所述第一組數據和第二組數據進行分析,確定出第一類規則和第二類規則,包括:
[0061]采用邏輯回歸算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第一類規則;
[0062]采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第二類規則。
[0063]上述方案中,所述采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第二類規則,包括:
[0064]采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出N個規則;所述N為大于等于2的正整數;
[0065]在所述N個規則中,確定出滿足第三預設規則的第二類規則。
[0066]本實施例中,由于步驟101中確定出的特征信息的個數不同,使得采用決策樹算法確定出的規則的個數不同,即N不同;因此,N的取值受限于所述特征信息的個數。
[0067]本實施例中,所述第二類規則為一統稱,是所述N個規則中、所有滿足第三預設規則的規則統稱,因此,并未指一特定規則。
[0068]步驟103:依據所述第一類規則和第二類規則,在輸入的第三組數據中確定出滿足所述第一預設規則的目標數據;所述第三組數據為除所述第一通信網絡以外的其他通信網絡中的數據。
[0069]本實施例中,能夠通過在第一通信網絡中確定出的第一類規則和第二類規則,在除所述第一通信網絡之外的其他通信網絡中的大量數據中、確定出滿足第一預設規則的目標數據,即在其他通信網絡的數據中,確定出用戶的通信設備類型屬于第一類型的目標數據,如此,實現基于本網中數據規則,在異網數據中確定出滿足預設規則的目標數據的目的。
[0070]上述方案中,所述依據所述第一類規則和第二類規則,在輸入的第三組數據中確定出滿足所述第一預設規則的目標數據,包括:
[0071]分別依據所述第一類規則和第二類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據和第二疑似目標數據;
[0072]基于所述第一疑似目標數據和第二疑似目標數據確定出滿足所述第一預設規則的目標數據。
[0073]本實施例中,所述第一疑似目標數據為與第一類規則對應的數據,即通過第一類規則,在除所述第一通信網絡之外的其他通信網絡中確定出的滿足第一預設規則的疑似目標數據;所述第二疑似目標數據為與第二類規則對應的數據,即通過第二類規則,在除所述第一通信網絡之外的其他通信網絡中確定出的滿足第一預設規則的疑似目標數據。
[0074]上述方案中,所述第二類規則包括:第一類子規則;所述第一類子規則滿足所述第一預設規則;
[0075]對應地,所述分別依據所述第一類規則和第二類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據和第二疑似目標數據,包括:
[0076]依據所述第一類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據;
[0077]依據所述第一類子規則,對輸入的第三組數據進行分析,得到第二疑似目標數據。
[0078]本實施例中,由于所述第二類規則為采用決策樹算法確定出的規則,因此,通過第二類規則能夠確定出滿足第一預設規則的第二疑似目標數據,和滿足第二預設規則的疑似非目標數據;即,所述第二類規則包括:第一類子規則和第二類子規則;通過所述第一類子規則,能夠確定出滿足第一預設規則的第二疑似目標數據;通過所述第二類子規則,能夠確定出滿足第二預設規則的疑似非目標數據;因此,本實施例還需要從第一疑似目標數據和第二疑似目標數據中剔除疑似非目標數據,以確定出最終目標數據。
[0079]本實施例中,所述第一類子規則為滿足第一預設規則的規則;所述第二類子規則為不滿足所述第一預設規則的規則;也即為滿足所述第二預設規則的規則;當所述第二類子規則為不滿足所述第一預設規則的規則時,所述疑似非目標數據為一類干擾數據;因此,所述疑似非目標數據也可以稱為干擾數據。
[0080]上述方案中,所述第二類規則還包括:第二類子規則;所述第二類子規則滿足第二預設規則;所述方法還包括:
[0081 ] 依據所述第二類子規則,對所述第一疑似目標數據和所述第二疑似目標數據進行分析,得到疑似非目標數據;
[0082]對應地,所述基于所述第一疑似目標數據和第二疑似目標數據確定出目標數據,包括:
[0083]基于所述第一疑似目標數據、第二疑似目標數據和疑似非目標數據,確定出目標數據。
[0084]為實現上述方法,本發明實施例還提供了一種大數據分析裝置,如圖2所示,所述裝置包括:
[0085]獲取單元21,用于基于輸入的第一組數據和第二組數據,獲取滿足預設條件的至少兩個特征信息;所述第一組數據和第二組數據均為第一通信網絡中的數據;所述第一組數據滿足第一預設規則;所述第二組數據滿足第二預設規則;
[0086]分析單元22,用于依據所述至少兩個特征信息,對所述第一組數據和第二組數據進行分析,確定出第一類規則和第二類規則;
[0087]確定單元23,用于依據所述第一類規則和第二類規則,在輸入的第三組數據中確定出滿足所述第一預設規則的目標數據;所述第三組數據為除所述第一通信網絡以外的其他通信網絡中的數據。
[0088]上述方案中,如圖3所示,所述分析單元22包括:
[0089]第一分析子單元221,用于采用邏輯回歸算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第一類規則;
[0090]第二分析子單元222,用于采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第二類規則。
[0091]上述方案中,所述第二分析子單元222,還用于采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出N個規則;所述N為大于等于2的正整數;
[0092]還用于在所述N個規則中,確定出滿足第三預設規則的第二類規則。
[0093]上述方案中,如圖4所示,所述確定單元23,包括:
[0094]第一確定子單元231,用于分別依據所述第一類規則和第二類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據和第二疑似目標數據;
[0095]第二確定子單元232,用于基于所述第一疑似目標數據和第二疑似目標數據確定出滿足所述第一預設規則的目標數據。
[0096]上述方案中,所述第二類規則包括:第一類子規則;所述第一類子規則滿足所述第一預設規則;對應地,
[0097]所述第一確定子單元231,還用于依據所述第一類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據;
[0098]還用于依據所述第一類子規則,對輸入的第三組數據進行分析,得到第二疑似目標數據。
[0099]上述方案中,所述第二類規則還包括:第二類子規則;所述第二類子規則滿足第二預設規則;
[0100]所述第一確定子單元231,還用于依據所述第二類子規則,所述第一疑似目標數據和所述第二疑似目標數據進行分析,得到疑似非目標數據;
[0101]對應地,所述第二確定子單元232,還用于基于所述第一疑似目標數據、第二疑似目標數據和疑似非目標數據,確定出目標數據。
[0102]所述獲取單元21、分析單元22及確定單元23均可以運行于計算機上,可由位于計算機上的中央處理器(CPU)、或微處理器(MPU)、或數字信號處理器(DSP)、或可編程門陣列(FPGA)實現。
[0103]實施例二
[0104]第一軟件,例如頂ESSAGE軟件是指第一類型終端內置的用戶間發送短信的軟件,該軟件可以使短信直接從GPRS端發送,節省了使用第一類型終端的用戶的短信費用;因此,使用第一軟件的第一類型終端用戶可能會大大減少短信的使用量,形成了短信黑洞現象,本實施例正是基于上述短信黑洞現象,在異網中確定出終端類型為第一類型的用戶。
[0105]本實施例主要利用現有經分系統的通信數據,分析本網使用第一軟件的第一類型終端用戶的交往行為、以及其交往圈的人群的特點,識別出異網具備上述交往行為、以及其交往圈人群符合上述特點的數據,也即用戶,以最終在異網中確定出終端類型為第一類型的用戶,以助力于運營商的異網高價值客戶的回流工作及營銷策略。
[0106]具體地,本實施例主要以用戶交往圈模型為基礎,通過分析本網第一類型終端中使用第一軟件的客戶語音交往圈和短信交往圈等習慣特征,在異網大量用戶中,分析出第一類型終端用戶的用戶群,進而分析出異網某一用戶是否為第一類型終端用戶的概率,以為運營商提供具有參考價值的數據信息。
[0107]圖5為本發明實施例大數據分析方法的具體實現的流程示意圖;在進行大數據分析之前,需要確定出第一組數據和第二組數據;具體地,在第一通信網絡中確定出具有第一數據量的第一組數據、以及具有第一數據量的第二組數據;其中,所述第一組數據中各數據對應的用戶設備類型為第一類型;所述第二組數據對應的用戶設備類型為非第一類型;如圖5所示,所述方法包括:
[0108]步驟501:在第一組數據和第二組數據中,結合第一組數據和第二組數據各自對應的用戶的交往圈的特征規則、交往圈中語音和短信的特征規則、交往對象是否使用第一類型終端的特征規則等選取出M個特征信息;其中,M為大于等于2的正整數;
[0109]這里,所述特征信息也稱為關鍵變量指標。
[0110]步驟502:采用邏輯回歸算法,依據所述M個特征信息,對所述第一組數據和第二組數據進行分析,模擬出滿足第一預設規則的第一類規則;
[0111]這里,所述第一類規則可以為邏輯回歸公式;所述第一預設規則為用戶終端類型為第一類型的規則。
[0112]本實施例中,所述對所述第一組數據和第二組數據進行分析,模擬出滿足第一預設規則的第一類規則,包括:
[0113]基于所述M個特征信息,采用邏輯回歸算法,對所述第一組數據和第二組數據進行分析,模擬出滿足第一預設規則的第一類規則。
[0114]步驟503:確定第三組數據,依據所述第一類規則,計算所述第三組數據中的各數據的概率,以確定出第一疑似目標數據;所述第三組數據為與所述第一通信網絡中的用戶進行通信的、其他通信網絡中的用戶所對應的數據;
[0115]這里,所述依據所述第一類規則,計算所述第三組數據中的各數據的概率,以確定出第一疑似目標數據,進一步包括:
[0116]依據所述第一類規則,計算所述第三組數據中的各數據的概率;
[0117]依據數據業務需求、邏輯回歸算法的邏輯回歸等級對應的預設用戶數,在所述第三組數據中的各數據對應的概率中,確定出概率大于等于預設閾值的數據,并將概率大于等于預設閾值的數據作為第一疑似目標數據。
[0118]步驟504:采用C5決策樹算法,依據所述M個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出ml個規則A和m2個規則B ;
[0119]步驟505:根據規則A和規則B對應的用戶數和置信度,對規則A和規則B進行篩選,以在所述規則A中確定出第一類子規則,在所述規則B中確定第二類子規則;
[0120]這里,所述第一類子規則滿足所述第一預設規則;所述第二類子規則滿足所述第二預設規則;所述ml、m2為大于等于I的正整數。
[0121]具體地,當第一組數據和第二組數據的用戶數均為1W時,從規則A中篩選出置信度大于85%、用戶數大于2W的規則,確定為第一類子規則;從規則B中篩選出置信度大于90%、用戶數大于1.8W的規則,確定為第二類子規則;
[0122]本實施例中,所述第一類子規則和第二類子規則均歸屬于第二類規則。
[0123]步驟506:依據所述第一類子規則,對所述第三組數據進行分析,確定出第二疑似目標數據;
[0124]步驟507:確定所述第一疑似目標數據和第二疑似目標數據的交集數據,作為第三疑似目標數據;
[0125]步驟508:剔除所述第三疑似目標數據中符合第二類子規則的數據,將剩余第三疑似目標數據作為目標數據。
[0126]本發明實施例,能夠在第一通信網絡中的第一組數據和第二組數據中確定出關鍵變量指標,即特征信息;并分別采用邏輯回歸算法和決策樹算法對所述第一組數據和第二組數據進行分析,確定出與所述邏輯回歸算法對應的第一類規則,和與所述決策樹算法對應的第二類規則;其中,所述第二類規則包括第一類子規則和第二類子規則;隨后,分別依據所述第一類規則和第一類子規則對異網中的第三組數據進行分析,確定出第一疑似目標數據和第二疑似目標數據;由于所述第一類規則滿足第一預設規則;所述第一類子規則也滿足所述第一預設規則;而第二類子規則滿足所述第二預設規則,因此,取所述第一疑似目標數據和第二疑似目標數據的交集確定出第三疑似目標數據后,在所述第三疑似目標數據中剔除滿足第二類子規則的數據,即在所述第三疑似目標數據中剔除疑似非目標數據以最終得到目標數據,所述目標數據即為依據本網數據規則,在異網數據中確定出滿足第一預設規則的目標數據。
[0127]本領域內的技術人員應明白,本發明的實施例可提供為方法、系統、或計算機程序產品。因此,本發明可采用硬件實施例、軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本發明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器和光學存儲器等)上實施的計算機程序產品的形式。
[0128]本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0129]這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0130]這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0131]以上所述僅是本發明實施例的實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本發明實施例原理的前提下,還可以作出若干改進和潤飾,這些改進和潤飾也應視為本發明實施例的保護范圍。
【主權項】
1.一種大數據分析方法,其特征在于,所述方法包括: 基于輸入的第一組數據和第二組數據,獲取滿足預設條件的至少兩個特征信息;所述第一組數據和第二組數據均為第一通信網絡中的數據;所述第一組數據滿足第一預設規則;所述第二組數據滿足第二預設規則; 依據所述至少兩個特征信息,對所述第一組數據和第二組數據進行分析,確定出第一類規則和第二類規則; 依據所述第一類規則和第二類規則,在輸入的第三組數據中確定出滿足所述第一預設規則的目標數據;所述第三組數據為除所述第一通信網絡以外的其他通信網絡中的數據。2.根據權利要求1所述的方法,其特征在于,所述依據所述至少兩個特征信息,對所述第一組數據和第二組數據進行分析,確定出第一類規則和第二類規則,包括: 采用邏輯回歸算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第一類規則; 采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第二類規則。3.根據權利要求2所述的方法,其特征在于,所述采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第二類規則,包括: 采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出N個規則;所述N為大于等于2的正整數; 在所述N個規則中,確定出滿足第三預設規則的第二類規則。4.根據權利要求1或3任一項所述的方法,其特征在于,所述依據所述第一類規則和第二類規則,在輸入的第三組數據中確定出滿足所述第一預設規則的目標數據,包括: 分別依據所述第一類規則和第二類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據和第二疑似目標數據; 基于所述第一疑似目標數據和第二疑似目標數據確定出滿足所述第一預設規則的目標數據。5.根據權利要求4所述的方法,其特征在于,所述第二類規則包括:第一類子規則;所述第一類子規則滿足所述第一預設規則; 對應地,所述分別依據所述第一類規則和第二類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據和第二疑似目標數據,包括: 依據所述第一類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據; 依據所述第一類子規則,對輸入的第三組數據進行分析,得到第二疑似目標數據。6.根據權利要求5所述的方法,其特征在于,所述第二類規則還包括:第二類子規則;所述第二類子規則滿足第二預設規則;所述方法還包括: 依據所述第二類子規則,對所述第一疑似目標數據和所述第二疑似目標數據進行分析,得到疑似非目標數據; 對應地,所述基于所述第一疑似目標數據和第二疑似目標數據確定出目標數據,包括: 基于所述第一疑似目標數據、第二疑似目標數據和疑似非目標數據,確定出目標數據。7.一種大數據分析裝置,其特征在于,所述裝置包括: 獲取單元,用于基于輸入的第一組數據和第二組數據,獲取滿足預設條件的至少兩個特征信息;所述第一組數據和第二組數據均為第一通信網絡中的數據;所述第一組數據滿足第一預設規則;所述第二組數據滿足第二預設規則; 分析單元,用于依據所述至少兩個特征信息,對所述第一組數據和第二組數據進行分析,確定出第一類規則和第二類規則; 確定單元,用于依據所述第一類規則和第二類規則,在輸入的第三組數據中確定出滿足所述第一預設規則的目標數據;所述第三組數據為除所述第一通信網絡以外的其他通信網絡中的數據。8.根據權利要求7所述的裝置,其特征在于,所述分析單元包括: 第一分析子單元,用于采用邏輯回歸算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第一類規則; 第二分析子單元,用于采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出第二類規則。9.根據權利要求8所述的裝置,其特征在于,所述第二分析子單元,還用于采用決策樹算法,依據所述至少兩個特征信息,對所述第一組數據和所述第二組數據進行分析,確定出N個規則;所述N為大于等于2的正整數; 還用于在所述N個規則中,確定出滿足第三預設規則的第二類規則。10.根據權利要求7至9任一項所述的裝置,其特征在于,所述確定單元,包括: 第一確定子單元,用于分別依據所述第一類規則和第二類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據和第二疑似目標數據; 第二確定子單元,用于基于所述第一疑似目標數據和第二疑似目標數據確定出滿足所述第一預設規則的目標數據。11.根據權利要求10所述的裝置,其特征在于,所述第二類規則包括:第一類子規則;所述第一類子規則滿足所述第一預設規則;對應地, 所述第一確定子單元,還用于依據所述第一類規則,對輸入的第三組數據進行分析,得到第一疑似目標數據; 還用于依據所述第一類子規則,對輸入的第三組數據進行分析,得到第二疑似目標數據。12.根據權利要求11所述的方法,其特征在于,所述第二類規則還包括:第二類子規則;所述第二類子規則滿足第二預設規則; 所述第一確定子單元,還用于依據所述第二類子規則,對所述第一疑似目標數據和所述第二疑似目標數據進行分析,得到疑似非目標數據; 對應地,所述第二確定子單元,還用于基于所述第一疑似目標數據、第二疑似目標數據和疑似非目標數據,確定出目標數據。
【文檔編號】G06F17/30GK105824811SQ201510001942
【公開日】2016年8月3日
【申請日】2015年1月4日
【發明人】黃慶榮, 謝志崇, 魏建榮, 彭家華, 鄭志歡, 林恪, 陳鈺鋮
【申請人】中國移動通信集團福建有限公司