一種數據閾值制定方法
【專利摘要】本發明提供一種數據閾值制定方法,屬于大數據分析領域,本發明包括數據分布分析、數據閾值輸出;數據分布分析需要通過大數據算法分析數據分布的特征;數據閾值輸出需要利用確定的大數據分布特征,根據閾值規則,輸出數據閾值。通過本發明可解決數據閾值制定的合理性和準確性問題,實現數據閾值的自動制定。
【專利說明】
一種數據閾值制定方法
技術領域
[0001]本發明涉及大數據分析技術,尤其涉及一種數據閾值制定方法。
【背景技術】
[0002]對于電信運營商及移動互聯網來說,數據越來越多樣化,分析場景越來越靈活多變,根據二八原則,百分之二十的數據是分析價值最高的,是數據的關注重點,目前的數據閾值制定是通過專家的經驗手工設定,一方面存在數據閾值設定的不合理性,另一方面無法應對多樣數據多樣場景的閾值設定及優化。
【發明內容】
[0003]為了解決以上技術問題,本發明提出了一種基于大數據算法的數據閾值制定方法,供了一套完備的數據分布分析、閾值制定方法,首先解決了閾值制定的合理性和準確性,其次解決了數據閾值的自動化制定。
[0004]本發明的目的是按以下方式實現的,該體系在深入研究運營商及互聯網行業數據特征的基礎上,結合大數據算法,分析數據分布特征,基于數據分布模型,提供數據閾值的自動化生成和優化,創新實現了一套完備的基于大數據算法的數據閾值制定方法。
[0005]現有技術方式下,數據閾值存在人為制定閾值不準確、閾值制定維度單一、周期變化分析手段缺乏等問題,無法提供準確合理的數據閾值,實際指導意義欠缺。
[0006]應用本發明,可解決數據閾值制定的合理性和準確性問題,實現數據閾值的自動制定。
[0007]本發明的技術方案是:
一種數據閾值制定方法,包括數據分布分析、數據閾值輸出;
數據分布分析需要通過大數據算法分析數據分布的特征;
數據閾值輸出需要利用確定的大數據分布特征,根據閾值規則,輸出數據閾值。
[0008](I)大數據分布分析功能
提供多種大數據分析算法,包括正態分布、指數分布、伽馬分布、貝塔分布、均勻分布等,基于分時間(WHEN)、客戶(WHO)、位置(WHERE )、事件(WHAT)、感知(HOW)五個維度,分析數據分布特征,生成數據最匹配的大數據分析模型。
[0009](2)數據閾值輸出功能
基于匹配的數據分析模型特征,設定閾值規則,輸出對應數據的數據閾值,并利用后續提供的數據,匹配分析模型優化調整數據閾值。
[0010]本發明在深入掌握數據特點的基礎上,尤其是電信運營商領域,利用大數據算法,對不同類數據進行數據分析,形成符合不同類數據的分布特征和分析模型,輸出數據閾值基準,形成基于大數據算法的閾值分析法,提供迭代優化的閾值自動制定方案。
本發明的有益效果是
本發明提供基于大數據算法的數據閾值制定,解決了數據閾值制定的合理性和準確性問題,實現數據閾值的自動制定,避免了數據分析對行業專家的依賴,實現對數據中重點數據的快速定位和獲取。
【附圖說明】
[0011 ]圖1是本發明的工作流程示意圖。
【具體實施方式】
[0012]下面對本發明的內容進行更加詳細的闡述:
本發明涉及一種移動通信網及移動互聯網大數據分析領域,具體地說是提供多種大數據分析算法,包括正態分布、指數分布、伽馬分布、貝塔分布、均勻分布等,對數據進行分布特征分析,獲取數據最匹配的分析模型,根據匹配的數據分析模型特征,設定閾值規則,輸出對應數據的數據閾值,實現基于大數據的數據閾值制定方法。
[0013]本發明的數據閾值制定方法,包括指標數據清洗功能、指標數據分析功能、分布類型選擇功能、閾值核查規則制定四個層面的功能群組。
[0014]指標數據清洗功能:提供指標數據清洗功能,利用數據清洗規則,對數據進行清洗及格式化,對清洗出的異常數據進行及時發現及關聯分析。
[0015]指標數據分析功能:對閾值制定指標進行基于時間、位置等維度的橫向分析,基于自身特點、關聯影響等維度的縱向分析,實現對指標的全方位、多視角分析。
[0016]分布類型選擇功能:針對不同指標特征,結合均勻分布、正態分布、指數分布、貝塔分布、伽馬分布等分布特點,構建不同指標的分布模型,實現精準的指標所屬分布類型輸出,同時實現指標首階段的閾值制定。
[0017]閾值核查規則制定:提供基于不同場景的針對性要求及整體場景的全局化要求,實現閾值核查規則制定。用來實現閾值的動態調整,實現合理閾值的精確制定。
[0018]本發明提供一種數據閾值制定方法,在深入掌握數據特點的基礎上,尤其是電信運營商領域,利用大數據算法,對不同類數據進行數據分析,形成符合不同類數據的分布特征和分析模型,輸出數據閾值基準,形成基于大數據算法的閾值分析法,提供迭代優化的閾值自動制定方案。
【主權項】
1.一種數據閾值制定方法,其特征在于,包括數據分布分析、數據閾值輸出; 數據分布分析需要通過大數據算法分析數據分布的特征; 數據閾值輸出需要利用確定的大數據分布特征,根據閾值規則,輸出數據閾值。2.根據權利要求1所述的一種數據閾值制定的方法,其特征在于,大數據分析算法,包括正態分布、指數分布、伽馬分布、貝塔分布、均勻分布,基于分時間、客戶、位置、事件、感知五個維度,分析數據分布特征,生成數據最匹配的大數據分析模型。3.根據權利要求2所述的一種數據閾值制定的方法,其特征在于,數據閾值輸出是基于匹配的數據分析模型特征,設定閾值規則,輸出對應數據的數據閾值,并利用后續提供的數據,匹配分析模型優化調整數據閾值。
【文檔編號】G06Q50/30GK105825306SQ201610167705
【公開日】2016年8月3日
【申請日】2016年3月23日
【發明人】沈林江, 張笑笑
【申請人】浪潮通信信息系統有限公司