本發明涉及計算機技術領域,尤其涉及一種對多核CPU(Central Processing Unit,中央處理器)進行檢測的方法和裝置。
背景技術:
隨著計算機技術的不斷發展,CPU中使用的內核數量不斷增加,多核CPU越來越多的被使用在服務器中。但是,目前監控多核CPU使用率的方案是監控多核CPU使用率的平均值,不能反映出多核CPU內每一個內核的真實使用情況。當多核CPU內一個內核出現死循環的情況時,無法及時被發現。例如,在一個8核CPU中,若其中某一內核的使用率已達到100%,但是所述8核CPU的使用率的平均值只有12.5%,因此,無法及時獲知到死循環的情況。
技術實現要素:
本發明的主要目的在于提出一種對多核CPU進行檢測的方法和裝置,對多核CPU中的每個內核及線程進行全面監控。
為實現上述目的,本發明提供的一種對多核CPU進行檢測的裝置,包括:
監控模塊,用于監控多核CPU中每個內核的使用率以及內核中每個線程的運行時長;
檢測模塊,用于根據所述多核CPU中每個內核的使用率以及內核中每個線程的運行時長,檢測出所述多核CPU中出現故障的內核以及線程。
進一步的,所述監控模塊,包括:
內核監控單元,用于利用Linux系統內核學習方法,得到多核CPU中每個內核的使用率;
線程監控單元,用于通過分析多核CPU的線程堆棧日志,得到內核中每個線程的運行時長。
進一步的,所述線程堆棧日志包括:各個線程的運行狀態;
所述線程監控單元,具體用于:
按照設定的分析周期時長周期性的分析多核CPU的線程堆棧日志,并計算每個線程的運行時長;
將任一線程連續處于運行狀態所占的分析周期數與所述設定的分析周期時長相乘,得到所述任一線程的運行時長。
進一步的,所述檢測模塊,具體用于:
檢測所述多核CPU中任一內核處于超負荷狀態的時長是否大于第一預設時長閾值,若是,則判定所述任一內核出現故障;所述超負荷狀態為內核的使用率大于預設的使用率閾值的狀態;
檢測內核中的任一線程的運行時長是否大于第二預設時長閾值,若是,則判定所述任一線程出現故障。
進一步的,所述裝置,還包括:
提示模塊,用于向客戶端發送提示信息,所述提示信息包括所述多核CPU中出現故障的內核以及線程。
此外,為實現上述目的,本發明還提出一種對多核CPU進行檢測的方法,包括:
監控多核CPU中每個內核的使用率以及內核中每個線程的運行時長;
根據所述多核CPU中每個內核的使用率以及內核中每個線程的運行時長,檢測出所述多核CPU中出現故障的內核以及線程。
進一步的,所述監控多核CPU中每個內核的使用率以及內核中每個線程的運行時長,包括:
利用Linux系統內核學習方法,得到多核CPU中每個內核的使用率;
通過分析多核CPU的線程堆棧日志,得到內核中每個線程的運行時長。
進一步的,所述線程堆棧日志包括:各個線程的運行狀態;
所述通過分析多核CPU的線程堆棧日志,得到內核中每個線程的運行時長,包括:
按照設定的分析周期時長周期性的分析多核CPU的線程堆棧日志,并計算每個線程的運行時長;
將任一線程連續處于運行狀態所占的分析周期數與所述設定的分析周期時長相乘,得到所述任一線程的運行時長。
進一步的,所述根據所述多核CPU中每個內核的使用率以及內核中每個線程的運行時長,檢測出所述多核CPU中出現故障的內核以及線程,包括:
檢測所述多核CPU中任一內核處于超負荷狀態的時長是否大于第一預設時長閾值,若是,則判定所述任一內核出現故障;所述超負荷狀態為內核的使用率大于預設的使用率閾值的狀態;
檢測內核中的任一線程的運行時長是否大于第二預設時長閾值,若是,則判定所述任一線程出現故障。
進一步的,所述方法還包括:
向客戶端發送提示信息,所述提示信息包括所述多核CPU中出現故障的內核以及線程。
本發明提出的對多核CPU進行檢測的方法和裝置,可以對多核CPU中的每個內核都進行獨立的監控,以反映出每個內核的真實使用情況。除此之外,還通過定期掃描服務器的線程堆棧并對線程堆棧日志進行分析,來檢測是否存在運行時間過長的線程,并結合各個內核的使用情況,對多核CPU的運行狀態做出判斷。本發明可以及時、快速的發現多核CPU中出現類似于死循環的故障,從而及時通知工作人員解決故障問題。
附圖說明
圖1為實現本發明各個實施例的一種可選的移動終端的硬件結構示意圖;
圖2為如圖1所示的移動終端的無線通信系統示意圖;
圖3為本發明第一實施例的對多核CPU進行檢測的裝置的組成結構示意圖;
圖4為本發明第二實施例的對多核CPU進行檢測的裝置的組成結構示意圖;
圖5為本發明第三實施例的對多核CPU進行檢測的方法的流程圖;
圖6為本發明第四實施例的對多核CPU進行檢測的方法的流程圖;
本發明目的的實現、功能特點及優點將結合實施例,參照附圖做進一步說明。
具體實施方式
應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并不用于限定本發明。
現在將參考附圖描述實現本發明各個實施例的移動終端。在后續的描述中,使用用于表示元件的諸如“模塊”、“部件”或“單元”的后綴僅為了有利于本發明的說明,其本身并沒有特定的意義。因此,"模塊"與"部件"可以混合地使用。
移動終端可以以各種形式來實施。例如,本發明中描述的終端可以包括諸如移動電話、智能電話、筆記本電腦、數字廣播接收器、PDA(個人數字助理)、PAD(平板電腦)、PMP(便攜式多媒體播放器)、導航裝置等等的移動終端以及諸如數字TV、臺式計算機等等的固定終端。下面,假設終端是移動終端。然而,本領域技術人員將理解的是,除了特別用于移動目的的元件之外,根據本發明的實施方式的構造也能夠應用于固定類型的終端。
圖1為實現本發明各個實施例的一種可選的移動終端的硬件結構示意。
移動終端100可以包括無線通信單元110、A/V(音頻/視頻)輸入單元120、用戶輸入單元130、感測單元140、輸出單元150、存儲器160、接口單元170、控制器180和電源單元190等等。圖1示出了具有各種組件的移動終端,但是應理解的是,并不要求實施所有示出的組件。可以替代地實施更多或更少的組件。將在下面詳細描述移動終端的元件。
無線通信單元110通常包括一個或多個組件,其允許移動終端100與無線通信系統或網絡之間的無線電通信。例如,無線通信單元可以包括廣播接收模塊111、移動通信模塊112、無線互聯網模塊113、短程通信模塊114和位置信息模塊115中的至少一個。
廣播接收模塊111經由廣播信道從外部廣播管理服務器接收廣播信號和/或廣播相關信息。廣播信道可以包括衛星信道和/或地面信道。廣播管理服務器可以是生成并發送廣播信號和/或廣播相關信息的服務器或者接收之前生成的廣播信號和/或廣播相關信息并且將其發送給終端的服務器。廣播信號可以包括TV廣播信號、無線電廣播信號、數據廣播信號等等。而且,廣播信號可以進一步包括與TV或無線電廣播信號組合的廣播信號。廣播相關信息也可以經由移動通信網絡提供,并且在該情況下,廣播相關信息可以由移動通信模塊112來接收。廣播信號可以以各種形式存在,例如,其可以以數字多媒體廣播(DMB)的電子節目指南(EPG)、數字視頻廣播手持(DVB-H)的電子服務指南(ESG)等等的形式而存在。廣播接收模塊111可以通過使用各種類型的廣播系統接收信號廣播。特別地,廣播接收模塊111可以通過使用諸如多媒體廣播-地面(DMB-T)、數字多媒體廣播-衛星(DMB-S)、數字視頻廣播-手持(DVB-H),前向鏈路媒體(MediaFLO@)的數據廣播系統、地面數字廣播綜合服務(ISDB-T)等等的數字廣播系統接收數字廣播。廣播接收模塊111可以被構造為適合提供廣播信號的各種廣播系統以及上述數字廣播系統。經由廣播接收模塊111接收的廣播信號和/或廣播相關信息可以存儲在存儲器160(或者其它類型的存儲介質)中。
移動通信模塊112將無線電信號發送到基站(例如,接入點、節點B等等)、外部終端以及服務器中的至少一個和/或從其接收無線電信號。這樣的無線電信號可以包括語音通話信號、視頻通話信號、或者根據文本和/或多媒體消息發送和/或接收的各種類型的數據。
無線互聯網模塊113支持移動終端的無線互聯網接入。該模塊可以內部或外部地耦接到終端。該模塊所涉及的無線互聯網接入技術可以包括WLAN(無線LAN)(Wi-Fi)、Wibro(無線寬帶)、Wimax(全球微波互聯接入)、HSDPA(高速下行鏈路分組接入)等等。
短程通信模塊114是用于支持短程通信的模塊。短程通信技術的一些示例包括藍牙TM、射頻識別(RFID)、紅外數據協會(IrDA)、超寬帶(UWB)、紫蜂TM等等。
位置信息模塊115是用于檢查或獲取移動終端的位置信息的模塊。位置信息模塊的典型示例是GPS(全球定位系統)。根據當前的技術,GPS模塊115計算來自三個或更多衛星的距離信息和準確的時間信息并且對于計算的信息應用三角測量法,從而根據經度、緯度和高度準確地計算三維當前位置信息。當前,用于計算位置和時間信息的方法使用三顆衛星并且通過使用另外的一顆衛星校正計算出的位置和時間信息的誤差。此外,GPS模塊115能夠通過實時地連續計算當前位置信息來計算速度信息。
A/V輸入單元120用于接收音頻或視頻信號。A/V輸入單元120可以包括相機121和麥克風122,相機121對在視頻捕獲模式或圖像捕獲模式中由圖像捕獲裝置獲得的靜態圖片或視頻的圖像數據進行處理。處理后的圖像幀可以顯示在顯示單元151上。經相機121處理后的圖像幀可以存儲在存儲器160(或其它存儲介質)中或者經由無線通信單元110進行發送,可以根據移動終端的構造提供兩個或更多相機121。麥克風122可以在電話通話模式、記錄模式、語音識別模式等等運行模式中經由麥克風接收聲音(音頻數據),并且能夠將這樣的聲音處理為音頻數據。處理后的音頻(語音)數據可以在電話通話模式的情況下轉換為可經由移動通信模塊112發送到移動通信基站的格式輸出。麥克風122可以實施各種類型的噪聲消除(或抑制)算法以消除(或抑制)在接收和發送音頻信號的過程中產生的噪聲或者干擾。
用戶輸入單元130可以根據用戶輸入的命令生成鍵輸入數據以控制移動終端的各種操作。用戶輸入單元130允許用戶輸入各種類型的信息,并且可以包括鍵盤、鍋仔片、觸摸板(例如,檢測由于被接觸而導致的電阻、壓力、電容等等的變化的觸敏組件)、滾輪、搖桿等等。特別地,當觸摸板以層的形式疊加在顯示單元151上時,可以形成觸摸屏。
感測單元140檢測移動終端100的當前狀態,(例如,移動終端100的打開或關閉狀態)、移動終端100的位置、用戶對于移動終端100的接觸(即,觸摸輸入)的有無、移動終端100的取向、移動終端100的加速或減速移動和方向等等,并且生成用于控制移動終端100的操作的命令或信號。例如,當移動終端100實施為滑動型移動電話時,感測單元140可以感測該滑動型電話是打開還是關閉。另外,感測單元140能夠檢測電源單元190是否提供電力或者接口單元170是否與外部裝置耦接。
接口單元170用作至少一個外部裝置與移動終端100連接可以通過的接口。例如,外部裝置可以包括有線或無線頭戴式耳機端口、外部電源(或電池充電器)端口、有線或無線數據端口、存儲卡端口、用于連接具有識別模塊的裝置的端口、音頻輸入/輸出(I/O)端口、視頻I/O端口、耳機端口等等。識別模塊可以是存儲用于驗證用戶使用移動終端100的各種信息并且可以包括用戶識別模塊(UIM)、客戶識別模塊(SIM)、通用客戶識別模塊(USIM)等等。另外,具有識別模塊的裝置(下面稱為"識別裝置")可以采取智能卡的形式,因此,識別裝置可以經由端口或其它連接裝置與移動終端100連接。接口單元170可以用于接收來自外部裝置的輸入(例如,數據信息、電力等等)并且將接收到的輸入傳輸到移動終端100內的一個或多個元件或者可以用于在移動終端和外部裝置之間傳輸數據。
另外,當移動終端100與外部底座連接時,接口單元170可以用作允許通過其將電力從底座提供到移動終端100的路徑或者可以用作允許從底座輸入的各種命令信號通過其傳輸到移動終端的路徑。從底座輸入的各種命令信號或電力可以用作用于識別移動終端是否準確地安裝在底座上的信號。輸出單元150被構造為以視覺、音頻和/或觸覺方式提供輸出信號(例如,音頻信號、視頻信號、警報信號、振動信號等等)。輸出單元150可以包括顯示單元151、音頻輸出模塊152、警報單元153等等。
顯示單元151可以顯示在移動終端100中處理的信息。例如,當移動終端100處于電話通話模式時,顯示單元151可以顯示與通話或其它通信(例如,文本消息收發、多媒體文件下載等等)相關的用戶界面(UI)或圖形用戶界面(GUI)。當移動終端100處于視頻通話模式或者圖像捕獲模式時,顯示單元151可以顯示捕獲的圖像和/或接收的圖像、示出視頻或圖像以及相關功能的UI或GUI等等。
同時,當顯示單元151和觸摸板以層的形式彼此疊加以形成觸摸屏時,顯示單元151可以用作輸入裝置和輸出裝置。顯示單元151可以包括液晶顯示器(LCD)、薄膜晶體管LCD(TFT-LCD)、有機發光二極管(OLED)顯示器、柔性顯示器、三維(3D)顯示器等等中的至少一種。這些顯示器中的一些可以被構造為透明狀以允許用戶從外部觀看,這可以稱為透明顯示器,典型的透明顯示器可以例如為TOLED(透明有機發光二極管)顯示器等等。根據特定想要的實施方式,移動終端100可以包括兩個或更多顯示單元(或其它顯示裝置),例如,移動終端可以包括外部顯示單元(未示出)和內部顯示單元(未示出)。觸摸屏可用于檢測觸摸輸入壓力以及觸摸輸入位置和觸摸輸入面積。
音頻輸出模塊152可以在移動終端處于呼叫信號接收模式、通話模式、記錄模式、語音識別模式、廣播接收模式等等模式下時,將無線通信單元110接收的或者在存儲器160中存儲的音頻數據轉換音頻信號并且輸出為聲音。而且,音頻輸出模塊152可以提供與移動終端100執行的特定功能相關的音頻輸出(例如,呼叫信號接收聲音、消息接收聲音等等)。音頻輸出模塊152可以包括揚聲器、蜂鳴器等等。
警報單元153可以提供輸出以將事件的發生通知給移動終端100。典型的事件可以包括呼叫接收、消息接收、鍵信號輸入、觸摸輸入等等。除了音頻或視頻輸出之外,警報單元153可以以不同的方式提供輸出以通知事件的發生。例如,警報單元153可以以振動的形式提供輸出,當接收到呼叫、消息或一些其它進入通信(incoming communication)時,警報單元153可以提供觸覺輸出(即,振動)以將其通知給用戶。通過提供這樣的觸覺輸出,即使在用戶的移動電話處于用戶的口袋中時,用戶也能夠識別出各種事件的發生。警報單元153也可以經由顯示單元151或音頻輸出模塊152提供通知事件的發生的輸出。
存儲器160可以存儲由控制器180執行的處理和控制操作的軟件程序等等,或者可以暫時地存儲己經輸出或將要輸出的數據(例如,電話簿、消息、靜態圖像、視頻等等)。而且,存儲器160可以存儲關于當觸摸施加到觸摸屏時輸出的各種方式的振動和音頻信號的數據。
存儲器160可以包括至少一種類型的存儲介質,所述存儲介質包括閃存、硬盤、多媒體卡、卡型存儲器(例如,SD或DX存儲器等等)、隨機訪問存儲器(RAM)、靜態隨機訪問存儲器(SRAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)、可編程只讀存儲器(PROM)、磁性存儲器、磁盤、光盤等等。而且,移動終端100可以與通過網絡連接執行存儲器160的存儲功能的網絡存儲裝置協作。
控制器180通常控制移動終端的總體操作。例如,控制器180執行與語音通話、數據通信、視頻通話等等相關的控制和處理。另外,控制器180可以包括用于再現(或回放)多媒體數據的多媒體模塊181,多媒體模塊181可以構造在控制器180內,或者可以構造為與控制器180分離。控制器180可以執行模式識別處理,以將在觸摸屏上執行的手寫輸入或者圖片繪制輸入識別為字符或圖像。
電源單元190在控制器180的控制下接收外部電力或內部電力并且提供操作各元件和組件所需的適當的電力。
這里描述的各種實施方式可以以使用例如計算機軟件、硬件或其任何組合的計算機可讀介質來實施。對于硬件實施,這里描述的實施方式可以通過使用特定用途集成電路(ASIC)、數字信號處理器(DSP)、數字信號處理裝置(DSPD)、可編程邏輯裝置(PLD)、現場可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、被設計為執行這里描述的功能的電子單元中的至少一種來實施,在一些情況下,這樣的實施方式可以在控制器180中實施。對于軟件實施,諸如過程或功能的實施方式可以與允許執行至少一種功能或操作的單獨的軟件模塊來實施。軟件代碼可以由以任何適當的編程語言編寫的軟件應用程序(或程序)來實施,軟件代碼可以存儲在存儲器160中并且由控制器180執行。
至此,己經按照其功能描述了移動終端。下面,為了簡要起見,將描述諸如折疊型、直板型、擺動型、滑動型移動終端等等的各種類型的移動終端中的滑動型移動終端作為示例。因此,本發明能夠應用于任何類型的移動終端,并且不限于滑動型移動終端。
如圖1中所示的移動終端100可以被構造為利用經由幀或分組發送數據的諸如有線和無線通信系統以及基于衛星的通信系統來操作。
現在將參考圖2描述其中根據本發明的移動終端能夠操作的通信系統。
這樣的通信系統可以使用不同的空中接口和/或物理層。例如,由通信系統使用的空中接口包括例如頻分多址(FDMA)、時分多址(TDMA)、碼分多址(CDMA)和通用移動通信系統(UMTS)(特別地,長期演進(LTE))、全球移動通信系統(GSM)等等。作為非限制性示例,下面的描述涉及CDMA通信系統,但是這樣的教導同樣適用于其它類型的系統。
參考圖2,CDMA無線通信系統可以包括多個移動終端100、多個基站(BS)270、基站控制器(BSC)275和移動交換中心(MSC)280。MSC280被構造為與公共電話交換網絡(PSTN)290形成接口。MSC280還被構造為與可以經由回程線路耦接到基站270的BSC275形成接口。回程線路可以根據若干己知的接口中的任一種來構造,所述接口包括例如E1/T1、ATM,IP、PPP、幀中繼、HDSL、ADSL或xDSL。將理解的是,如圖2中所示的系統可以包括多個BSC275。
每個BS270可以服務一個或多個分區(或區域),由多向天線或指向特定方向的天線覆蓋的每個分區放射狀地遠離BS270。或者,每個分區可以由用于分集接收的兩個或更多天線覆蓋。每個BS270可以被構造為支持多個頻率分配,并且每個頻率分配具有特定頻譜(例如,1.25MHz,5MHz等等)。
分區與頻率分配的交叉可以被稱為CDMA信道。BS270也可以被稱為基站收發器子系統(BTS)或者其它等效術語。在這樣的情況下,術語"基站"可以用于籠統地表示單個BSC275和至少一個BS270。基站也可以被稱為"蜂窩站"。或者,特定BS270的各分區可以被稱為多個蜂窩站。
如圖2中所示,廣播發射器(BT)295將廣播信號發送給在系統內操作的移動終端100。如圖1中所示的廣播接收模塊111被設置在移動終端100處以接收由BT295發送的廣播信號。在圖2中,示出了幾個全球定位系統(GPS)衛星300。衛星300幫助定位多個移動終端100中的至少一個。
在圖2中,描繪了多個衛星300,但是理解的是,可以利用任何數目的衛星獲得有用的定位信息。如圖1中所示的GPS模塊115通常被構造為與衛星300配合以獲得想要的定位信息。替代GPS跟蹤技術或者在GPS跟蹤技術之外,可以使用可以跟蹤移動終端的位置的其它技術。另外,至少一個GPS衛星300可以選擇性地或者額外地處理衛星DMB傳輸。
作為無線通信系統的一個典型操作,BS270接收來自各種移動終端100的反向鏈路信號。移動終端100通常參與通話、消息收發和其它類型的通信。特定基站270接收的每個反向鏈路信號被在特定BS270內進行處理。獲得的數據被轉發給相關的BSC275。BSC提供通話資源分配和包括BS270之間的軟切換過程的協調的移動管理功能。BSC275還將接收到的數據路由到MSC280,其提供用于與PSTN290形成接口的額外的路由服務。類似地,PSTN290與MSC280形成接口,MSC與BSC275形成接口,并且BSC275相應地控制BS270以將正向鏈路信號發送到移動終端100。
基于上述移動終端硬件結構以及通信系統,提出本發明方法各個實施例。
如圖3所示,本發明第一實施例提出一種對多核CPU進行檢測的裝置,應用于所述移動終端中,所述裝置具體包括以下組成部分:
監控模塊301,用于監控多核CPU中每個內核的使用率以及內核中每個線程的運行時長。
具體的,監控模塊301,包括:
內核監控單元,用于利用Linux系統內核學習方法,得到多核CPU中每個內核的使用率。
例如,在Linux系統中,使用top命令就可以監控多核CPU的使用率。Top命令除了可以顯示多核CPU的平均使用情況外,還可以在top窗口中通過輸入數字“1”,獲得到每個內核的使用情況。
線程監控單元,用于通過分析多核CPU的線程堆棧日志,得到內核中每個線程的運行時長。
進一步的,述線程堆棧日志包括:各個線程的工作狀態。
所述各個線程的工作狀體包括:就緒狀態、運行狀態和阻塞狀態。就緒狀態是指線程具備運行的所有條件,邏輯上可以運行,在等待處理機;運行狀態是指線程占有處理機正在運行;阻塞狀態是指線程在等待一個事件(如某個信號量),邏輯上不可執行。
所述線程監控單元,具體用于:
按照設定的分析周期時長周期性的分析多核CPU的線程堆棧日志,并計算每個線程的運行時長;
將任一線程連續處于運行狀態所占的分析周期數與所述設定的分析周期時長相乘,得到所述任一線程的運行時長。
例如,設定每十分鐘獲取一次所述多核CPU的線程堆棧日志。若某一線程在第一次、第二次和第三次獲取的線程堆棧日志中均出現,并且所述某一線程在第一次、第二次和第三次獲取的線程堆棧日志中的工作狀態均為運行狀態,則所述某一線程的運行時長等于30分鐘。
檢測模塊302,用于根據所述多核CPU中每個內核的使用率以及內核中每個線程的運行時長,檢測出所述多核CPU中出現故障的內核以及線程。
具體的,檢測模塊302,用于:
檢測所述多核CPU中任一內核處于超負荷狀態的時長是否大于第一預設時長閾值,若是,則判定所述任一內核出現故障;所述超負荷狀態為內核的使用率大于預設的使用率閾值的狀態。
例如,某一內核長時間處于100%的使用率狀態下,則可認為所述某一內核出現了死循環的問題。
檢測內核中的任一線程的運行時長是否大于第二預設時長閾值,若是,則判定所述任一線程出現故障。
例如,若某一線程的運行時長過長,且所述某一線程對應到的是一個系統的接口,則認為所述接口在接收客戶端的信息時出現了卡頓問題。
如圖4所示,本發明第二實施例提出一種對多核CPU進行檢測的裝置,應用于所述移動終端中,所述裝置具體包括以下組成部分:
監控模塊401,用于監控多核CPU中每個內核的使用率以及內核中每個線程的運行時長。
具體的,監控模塊401,包括:
內核監控單元,用于利用Linux系統內核學習方法,得到多核CPU中每個內核的使用率。
例如,在Linux系統中,使用top命令就可以監控多核CPU的使用率。Top命令除了可以顯示多核CPU的平均使用情況外,還可以在top窗口中通過輸入數字“1”,獲得到每個內核的使用情況。
線程監控單元,用于通過分析多核CPU的線程堆棧日志,得到內核中每個線程的運行時長。
進一步的,述線程堆棧日志包括:各個線程的PID識別號以及每個PID識別號所對應的工作狀態。
每個線程都有與之對應的PID識別號,每個線程的PID識別號都是唯一的,可根據所述PID識別號區分各個線程。
所述各個線程的工作狀體包括:就緒狀態、運行狀態和阻塞狀態。就緒狀態是指線程具備運行的所有條件,邏輯上可以運行,在等待處理機;運行狀態是指線程占有處理機正在運行;阻塞狀態是指線程在等待一個事件(如某個信號量),邏輯上不可執行。
所述線程監控單元,具體用于:
按照設定的分析周期時長周期性的分析多核CPU的線程堆棧日志,并記錄每個分析周期內所述線程堆棧日志中處于運行狀態的PID識別號;
若某一PID識別號連續出現在所述記錄中,將所述某一PID識別號連續出現在所述記錄中的次數乘以所述設定時長,得到與所述某一PID識別號相對應的線程的運行時長。
例如,設定每十分鐘獲取一次多核CPU的線程堆棧日志。若PID識別號為1的線程在第一次、第二次和第三次獲取的線程堆棧日志中均出現,并且所述PID識別號為1的線程在第一次、第二次和第三次獲取的線程堆棧日志中的工作狀態均為運行狀態,則所述PID識別號為1的線程的運行時長等于30分鐘。
檢測模塊402,用于根據所述多核CPU中每個內核的使用率以及內核中每個線程的運行時長,檢測出所述多核CPU中出現故障的內核以及線程。
具體的,檢測模塊402,用于:
檢測所述多核CPU中任一內核處于超負荷狀態的時長是否大于第一預設時長閾值,若是,則判定所述任一內核出現故障;所述超負荷狀態為內核的使用率大于預設的使用率閾值的狀態。
例如,若某一內核長時間處于100%的使用率狀態下,則可認為所述某一內核出現了死循環的問題。
檢測內核中的任一線程的運行時長是否大于第二預設時長閾值,若是,則判定所述任一線程出現故障。
例如,若某一線程的運行時長過長,且所述某一線程對應的是一個系統的接口,則認為所述接口在接收客戶端的信息時出現了卡頓問題。
提示模塊403,用于向客戶端發送提示信息,所述提示信息包括所述多核CPU中出現故障的內核以及線程。
具體的,所述提示信息包括:內核故障信息、線程故障信息和嚴重故障信息。
所述內核故障信息是指,內核出現了故障,但所述內核中沒有出現故障的線程;所述線程故障信息是指,線程出現了故障,但是所述線程所屬的內核沒有出現故障;所述嚴重故障信息是指,線程出現了故障,并且所述線程所屬的內核也出現了故障。
如圖5所示,本發明第三實施例提出一種對多核CPU進行檢測的方法,應用于所述移動終端中,所述方法具體包括以下步驟:
步驟S501:監控多核CPU中每個內核的使用率以及內核中每個線程的運行時長。
具體的,所述步驟S501,包括:
利用Linux系統內核學習方法,得到多核CPU中每個內核的使用率。
例如,在Linux系統中,使用top命令就可以監控多核CPU的使用率。Top命令除了可以顯示多核CPU的平均使用情況外,還可以在top窗口中通過輸入數字“1”,獲得到每個內核的使用情況。
通過分析多核CPU的線程堆棧日志,得到內核中每個線程的運行時長。
進一步的,述線程堆棧日志包括:各個線程的工作狀態。
所述各個線程的工作狀體包括:就緒狀態、運行狀態和阻塞狀態。就緒狀態是指線程具備運行的所有條件,邏輯上可以運行,在等待處理機;運行狀態是指線程占有處理機正在運行;阻塞狀態是指線程在等待一個事件(如某個信號量),邏輯上不可執行。
所述通過分析多核CPU的線程堆棧日志,得到內核中每個線程的運行時長,包括:
按照設定的分析周期時長周期性的分析多核CPU的線程堆棧日志,并計算每個線程的運行時長;
將任一線程連續處于運行狀態所占的分析周期數與所述設定的分析周期時長相乘,得到所述任一線程的運行時長。
例如,設定每十分鐘獲取一次所述多核CPU的線程堆棧日志。若某一線程在第一次、第二次和第三次獲取的線程堆棧日志中均出現,并且所述某一線程在第一次、第二次和第三次獲取的線程堆棧日志中的工作狀態均為運行狀態,則所述某一線程的運行時長等于30分鐘。
步驟S502:根據所述多核CPU中每個內核的使用率以及內核中每個線程的運行時長,檢測出所述多核CPU中出現故障的內核以及線程。
具體的,所述步驟S502,包括:
檢測所述多核CPU中任一內核處于超負荷狀態的時長是否大于第一預設時長閾值,若是,則判定所述任一內核出現故障;所述超負荷狀態為內核的使用率大于預設的使用率閾值的狀態。
例如,某一內核長時間處于100%的使用率狀態下,則可認為所述某一內核出現了死循環的問題。
檢測內核中的任一線程的運行時長是否大于第二預設時長閾值,若是,則判定所述任一線程出現故障。
例如,若某一線程的運行時長過長,且所述某一線程對應到的是一個系統的接口,則認為所述接口在接收客戶端的信息時出現了卡頓問題。
如圖6所示,本發明第四實施例提出一種對多核CPU進行檢測的方法,應用于所述移動終端中,所述方法具體包括以下步驟:
步驟S601:監控多核CPU中每個內核的使用率以及內核中每個線程的運行時長。
具體的,所述步驟S601,包括:
利用Linux系統內核學習方法,得到多核CPU中每個內核的使用率。
例如,在Linux系統中,使用top命令就可以監控多核CPU的使用率。Top命令除了可以顯示多核CPU的平均使用情況外,還可以在top窗口中通過輸入數字“1”,獲得到每個內核的使用情況。
通過分析多核CPU的線程堆棧日志,得到內核中每個線程的運行時長。
進一步的,述線程堆棧日志包括:各個線程的PID識別號以及每個PID識別號所對應的工作狀態;
每個線程都有與之對應的PID識別號,每個線程的PID識別號都是唯一的,可根據所述PID識別號區分各個線程。
所述各個線程的工作狀體包括:就緒狀態、運行狀態和阻塞狀態。就緒狀態是指線程具備運行的所有條件,邏輯上可以運行,在等待處理機;運行狀態是指線程占有處理機正在運行;阻塞狀態是指線程在等待一個事件(如某個信號量),邏輯上不可執行。
所述通過分析多核CPU的線程堆棧日志,得到內核中每個線程的運行時長,包括:
按照設定的分析周期時長周期性的分析多核CPU的線程堆棧日志,并記錄每個分析周期內所述線程堆棧日志中處于運行狀態的PID識別號;
若某一PID識別號連續出現在所述記錄中,將所述某一PID識別號連續出現在所述記錄中的次數乘以所述設定時長,得到與所述某一PID識別號相對應的線程的運行時長。
例如,設定每十分鐘獲取一次多核CPU的線程堆棧日志。若PID識別號為1的線程在第一次、第二次和第三次獲取的線程堆棧日志中均出現,并且所述PID識別號為1的線程在第一次、第二次和第三次獲取的線程堆棧日志中的工作狀態均為運行狀態,則所述PID識別號為1的線程的運行時長等于30分鐘。
步驟S602:根據所述多核CPU中每個內核的使用率以及內核中每個線程的運行時長,檢測出所述多核CPU中出現故障的內核以及線程。
具體的,所述步驟S602,包括:
檢測所述多核CPU中任一內核處于超負荷狀態的時長是否大于第一預設時長閾值,若是,則判定所述任一內核出現故障;所述超負荷狀態為內核的使用率大于預設的使用率閾值的狀態。
例如,若某一內核長時間處于100%的使用率狀態下,則可認為所述某一內核出現了死循環的問題。
檢測內核中的任一線程的運行時長是否大于第二預設時長閾值,若是,則判定所述任一線程出現故障。
例如,若某一線程的運行時長過長,且所述某一線程對應的是一個系統的接口,則認為所述接口在接收客戶端的信息時出現了卡頓問題。
步驟S603:向客戶端發送提示信息,所述提示信息包括所述多核CPU中出現故障的內核以及線程。
具體的,所述提示信息包括:內核故障信息、線程故障信息和嚴重故障信息。
所述內核故障信息是指,內核出現了故障,但所述內核中沒有出現故障的線程;所述線程故障信息是指,線程出現了故障,但是所述線程所屬的內核沒有出現故障;所述嚴重故障信息是指,線程出現了故障,并且所述線程所屬的內核也出現了故障。
需要說明的是,在本文中,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。
上述本發明實施例序號僅僅為了描述,不代表實施例的優劣。
通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到上述實施例方法可借助軟件加必需的通用硬件平臺的方式來實現,當然也可以通過硬件,但很多情況下前者是更佳的實施方式。基于這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品存儲在一個存儲介質(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺終端設備(可以是手機,計算機,服務器,空調器,或者網絡設備等)執行本發明各個實施例所述的方法。
以上僅為本發明的優選實施例,并非因此限制本發明的專利范圍,凡是利用本發明說明書及附圖內容所作的等效結構或等效流程變換,或直接或間接運用在其他相關的技術領域,均同理包括在本發明的專利保護范圍內。