一種小型嵌入式系統板卡監控系統的制作方法
【專利摘要】本發明公開了一種小型嵌入式系統板卡監控系統,包括:板卡監控電路A(17)、板卡監控電路B(18)、板卡監控電路C(19)、擴展板卡監控電路(20)。BMC控制器A(4)、BMC控制器B(8)、BMC控制器C(12)和BMC控制器D(16)之間通過I2C總線雙向連接。小型嵌入式系統板卡監控系統上電時,BMC控制器A(4)默認作為系統I2C測試維護總線的主設備,對系統內的電流、電壓和溫度進行監控。當主設備異常時,I2C測試維護總線的主設備將按相應順序進行主從切換。本發明實現了系統狀態監控及主叢切換,提高了系統的抗風險能力;適用于對系統穩定性、可靠性具有很高要求的場合。
【專利說明】一種小型嵌入式系統板卡監控系統
[0001]
【技術領域】
[0002]本發明涉及一種板卡監控系統,特別是一種小型嵌入式系統板卡監控系統。
【背景技術】
[0003]板卡監控系統主要用于監控系統是否正常運行,系統出現異常時能進行故障定位和主從切換。以往的板卡狀態監控系統,包括:主控板卡、擴展板卡、主控板卡狀態監測系統、溫度監測與控制模塊、電源管理模塊、I2C控制器、CPU處理器、南橋。主控板卡上的狀態監測系統采集本板卡和其他板卡上的電壓、電流和溫度信號,檢測系統運行狀態是否正常。但是以往的板卡監控系統體積較大多用于大型服務器不適用于小型嵌入式系統,而以往的小型嵌入式系統沒有相應的板卡狀態監控系統,不能有效的監控系統狀態,主控板異常時無法實現備份板卡的切換,無法保證系統的持續可靠運行,不能適用于高可靠性應用領域。
【發明內容】
[0004]本發明的目的在于提供一種小型嵌入式系統板卡監控系統,解決傳統小型嵌入式系統沒有板卡監控系統以及主控板出現異常時系統便陷入癱瘓的問題。
[0005]一種小型嵌入式系統板卡監控系統,包括:板卡監控電路A、板卡監控電路B、板卡監控電路C和擴展板卡監控電路,其中板卡監控電路A包括:CPU處理器A、溫度傳感器A、電源管理芯片A和BMC控制器A ;板卡監控電路B包括:CPU處理器B、溫度傳感器B、電源管理芯片B和BMC控制器B ;板卡監控電路C包括:CPU處理器C、溫度傳感器C、電源管理芯片C和BMC控制器C ;擴展板卡監控電路包括:DSP處理器、溫度傳感器D、電源管理芯片D和BMC控制器D。
[0006]BMC控制器A、BMC控制器B、BMC控制器C和BMC控制器D之間通過I2C總線雙向連接,測試計算機分別與CPU處理器A、CPU處理器B和CPU處理器C通過以太網雙向連接,測試計算機分別與BMC控制器A、BMC控制器B、BMC控制器C和BMC控制器D通過串口雙向連接;在板卡監控電路A中,BMC控制器A與CPU處理器A通過串口雙向連接,BMC控制器A分別與溫度傳感器A、電源管理芯片A通過I2C總線雙向連接;在板卡監控電路B中,BMC控制器B與CPU處理器B通過串口雙向連接,BMC控制器B分別與溫度傳感器B、電源管理芯片B通過I2C總線雙向連接;在板卡監控電路C中,BMC控制器C與CPU處理器C通過串口雙向連接,BMC控制器C分別與溫度傳感器C、電源管理芯片C通過I2C總線雙向連接;在擴展板卡監控電路C中,BMC控制器D與DSP處理器通過串口雙向連接,BMC控制器D分別與溫度傳感器D、電源管理芯片D通過I2C總線雙向連接。
[0007]小型嵌入式系統板卡監控系統上電后,首先確定BMC控制器A、BMC控制器B、BMC控制器C和BMC控制器D的I2C地址,由BMC控制器A掌控系統I2C測試維護總線的控制權,BMC控制器B、BMC控制器C和BMC控制器D作為I2C測試維護總線上的從設備。在板卡監控電路A中,溫度傳感器A、電源管理芯片A持續對板卡輸入電壓、板卡輸入電流和CPU處理器A的溫度信號進行監測,并上報給BMC控制器A,由BMC控制器A判斷電壓是否在O到50V、電流是否在O到50A和溫度是否在-50°C到+125°C的范圍之內,當電壓、電流或溫度信號不在范圍之內時,BMC控制器A將向電源管理模塊A發送斷電命令,使板卡斷電。板卡監控電路B、板卡監控電路C和擴展板卡監控電路對電壓、電流和溫度信號的處理過程與板卡監控電路A對電壓、電流和溫度信號的處理過程相同。
[0008]小型嵌入式系統板卡監控系統正常啟動后,在板卡監控電路A中,BMC控制器A不斷接收CPU處理器A的持續心跳信號,BMC控制器A —方面對CPU處理器A開始周期性上報電壓、電流和溫度信息,另一方面經由I2C總線每隔0.3秒持續的向BMC控制器B和BMC控制器C發送“主設備正常工作”的指示消息,消息中攜帶I2C地址,申明BMC控制器A掌控系統I2C測試維護總線的控制權,BMC控制器B和BMC控制器C收到此消息后,保存當前主設備的I2C地址。在板卡監控電路B中,BMC控制器B不斷接收CPU處理器B的持續心跳信號,當收到BMC控制器A掌控系統I2C測試維護總線控制權的信息后,BMC控制器B通過I2C總線周期性的將電壓、電流和溫度信息上報給BMC控制器A,然后再由BMC控制器A轉發給CPU處理器A。在板卡監控電路C和擴展板卡監控電路對心跳信號和上報信息的處理過程與板卡監控電路B對心跳信號和上報信息的處理過程相同。
[0009]當CPU處理器A出現異常時,需要釋放I2C總線的控制權。首先,BMC控制器B判斷是否接收到CPU處理器B發送的心跳信號和BMC控制器C是否接收到CPU處理器C發送的心跳信號,若BMC控制器B或BMC控制器C沒有收到心跳信號,則將BMC控制器B或BMC控制器C設置為I2C總線的從設備,不能掌控I2C測試維護總線的控制權;其次,BMC控制器掌控I2C測試維護總線控制權的順序,遵循BMC控制器A到BMC控制器B到BMC控制器C的次序。當BMC控制器B在I秒內未收到BMC控制器A發出的“主設備正常工作”指示消息,且BMC控制器B接收到了 CPU處理器B發送的心跳信號,則由BMC控制器B控制器掌控I2C測試維護總線的控制權,BMC控制器A釋放I2C總線的控制權,在BMC控制器B控制器掌控I2C測試維護總線的控制權后,需每隔0.3秒向BMC控制器A和BMC控制器C發送“主設備正常工作”的指示消息,BMC控制器A和BMC控制器C得知當前BMC控制器B掌控I2C測試維護總線的控制權。當CPU處理器B出現異常時,則切換I2C總線的控制權到BMC控制器C,其處理過程與I2C總線的控制權由BMC控制器A切換到BMC控制器B相同。
[0010]當CPU處理器A、CPU處理器B和CPU處理器C工作狀態都異常時,最后掌控I2C測試維護總線控制權的BMC控制器,需要完成系統重啟的任務,當前BMC控制器在復位本板卡的同時也發送重啟命令給另外兩個BMC控制器,從而完成重啟任務。重啟系統后,依然由BMC控制器A掌控系統I2C測試維護總線的控制權。
[0011]本發明實現了系統狀態監控及主叢切換,使得系統能夠應對某塊甚至某幾塊主板異常的情況,提高了系統的抗風險能力;適用于對系統穩定性、可靠性具有很高要求的場
入
口 O
【專利附圖】
【附圖說明】
[0012]圖1 一種小型嵌入式系統板卡監控系統的結構示意圖。
[0013]1.CPU處理器A 2.溫度傳感器A 3.電源管理芯片A 4.BMC控制器A 5.CPU處理器B 6.溫度傳感器B 7.電源管理芯片B 8.BMC控制器B 9.CPU處理器C 10.溫度傳感器C 11.電源管理芯片C 12.BMC控制器C 13.DSP處理器 14.溫度傳感器D 15.電源管理芯片D 16.BMC控制器D 17.板卡監控電路A 18.板卡監控電路B19.板卡監控電路C 20.擴展板卡監控電路。
【具體實施方式】
[0014]一種小型嵌入式系統板卡監控系統,包括:板卡監控電路A17、板卡監控電路B18、板卡監控電路C19和擴展板卡監控電路20,其中板卡監控電路A17包括:CPU處理器Al、溫度傳感器A2、電源管理芯片A3和BMC控制器A4 ;板卡監控電路B18包括:CPU處理器B5、溫度傳感器B6、電源管理芯片B7和BMC控制器B8 ;板卡監控電路C19包括:CPU處理器C9、溫度傳感器C10、電源管理芯片Cll和BMC控制器C12 ;擴展板卡監控電路20包括:DSP處理器13、溫度傳感器D14、電源管理芯片D15和BMC控制器D16。
[0015]BMC控制器A4、BMC控制器B8、BMC控制器C12和BMC控制器D16之間通過I2C總線雙向連接,測試計算機分別與CPU處理器Al、CPU處理器B5和CPU處理器C9通過以太網雙向連接,測試計算機分別與BMC控制器A4、BMC控制器B8、BMC控制器C12和BMC控制器D16通過串口雙向連接;在板卡監控電路A17中,BMC控制器A4與CPU處理器Al通過串口雙向連接,BMC控制器A4分別與溫度傳感器A2、電源管理芯片A3通過I2C總線雙向連接;在板卡監控電路B18中,BMC控制器B8與CPU處理器B5通過串口雙向連接,BMC控制器B8分別與溫度傳感器B6、電源管理芯片B7通過I2C總線雙向連接;在板卡監控電路C19中,BMC控制器C12與CPU處理器C9通過串口雙向連接,BMC控制器C12分別與溫度傳感器C10、電源管理芯片Cll通過I2C總線雙向連接;在擴展板卡監控電路20C19中,BMC控制器D16與DSP處理器13通過串口雙向連接,BMC控制器D16分別與溫度傳感器D14、電源管理芯片D15通過I2C總線雙向連接。
[0016]小型嵌入式系統板卡監控系統上電后,首先確定BMC控制器A4、BMC控制器B8、BMC控制器C12和BMC控制器D16的I2C地址,由BMC控制器A4掌控系統I2C測試維護總線的控制權,BMC控制器B8、BMC控制器C12和BMC控制器D16作為I2C測試維護總線上的從設備。在板卡監控電路A17中,溫度傳感器A2、電源管理芯片A3持續對板卡輸入電壓、板卡輸入電流和CPU處理器Al的溫度信號進行監測,并上報給BMC控制器A4,由BMC控制器A4判斷電壓是否在O到50V、電流是否在O到50A和溫度是否在_50°C到+125°C的范圍之內,當電壓、電流或溫度信號不在范圍之內時,BMC控制器A4將向電源管理模塊A發送斷電命令,使板卡斷電。板卡監控電路B18、板卡監控電路C19和擴展板卡監控電路20對電壓、電流和溫度信號的處理過程與板卡監控電路A17對電壓、電流和溫度信號的處理過程相同。
[0017]小型嵌入式系統板卡監控系統正常啟動后,在板卡監控電路A17中,BMC控制器A4不斷接收CPU處理器Al的持續心跳信號,BMC控制器A4—方面對CPU處理器Al開始周期性上報電壓、電流和溫度信息,另一方面經由I2C總線每隔0.3秒持續的向BMC控制器B8和BMC控制器C12發送“主設備正常工作”的指示消息,消息中攜帶I2C地址,申明BMC控制器A4掌控系統I2C測試維護總線的控制權,BMC控制器B8和BMC控制器C12收到此消息后,保存當前主設備的I2C地址。在板卡監控電路B18中,BMC控制器B8不斷接收CPU處理器B5的持續心跳信號,當收到BMC控制器A4掌控系統I2C測試維護總線控制權的信息后,BMC控制器B8通過I2C總線周期性的將電壓、電流和溫度信息上報給BMC控制器A4,然后再由BMC控制器A4轉發給CPU處理器Al。在板卡監控電路C19和擴展板卡監控電路20對心跳信號和上報信息的處理過程與板卡監控電路B18對心跳信號和上報信息的處理過程相同。
[0018]當CPU處理器Al出現異常時,需要釋放I2C總線的控制權。首先,BMC控制器B8判斷是否接收到CPU處理器B5發送的心跳信號和BMC控制器C12是否接收到CPU處理器C9發送的心跳信號,若BMC控制器B8或BMC控制器C12沒有收到心跳信號,則將BMC控制器B8或BMC控制器C12設置為I2C總線的從設備,不能掌控I2C測試維護總線的控制權;其次,BMC控制器掌控I2C測試維護總線控制權的順序,遵循BMC控制器A4到BMC控制器B8到BMC控制器C12的次序。當BMC控制器B8在I秒內未收到BMC控制器A4發出的“主設備正常工作”指示消息,且BMC控制器B8接收到了 CPU處理器B5發送的心跳信號,則由BMC控制器B8控制器掌控I2C測試維護總線的控制權,BMC控制器A4釋放I2C總線的控制權,在BMC控制器B8控制器掌控I2C測試維護總線的控制權后,需每隔0.3秒向BMC控制器A4和BMC控制器C12發送“主設備正常工作”的指示消息,BMC控制器A4和BMC控制器C12得知當前BMC控制器B8掌控I2C測試維護總線的控制權。當CPU處理器B5出現異常時,則切換I2C總線的控制權到BMC控制器C12,其處理過程與I2C總線的控制權由BMC控制器M切換到BMC控制器B8相同。
[0019]當CPU處理器Al、CPU處理器B5和CPU處理器C9工作狀態都異常時,最后掌控I2C測試維護總線控制權的BMC控制器,需要完成系統重啟的任務,當前BMC控制器在復位本板卡的同時也發送重啟命令給另外兩個BMC控制器,從而完成重啟任務。重啟系統后,依然由BMC控制器A4掌控系統I2C測試維護總線的控制權。
【權利要求】
1.一種小型嵌入式系統板卡監控系統,其特征在于包括:板卡監控電路A( 17)、板卡監控電路B (18)、板卡監控電路C (19)和擴展板卡監控電路(20),所述板卡監控電路A (17)包括:CPU處理器A (I)、溫度傳感器A (2)、電源管理芯片A (3)和BMC控制器A (4);板卡監控電路B (18)包括:CPU處理器B (5)、溫度傳感器B (6)、電源管理芯片B (7)和BMC控制器B (8);板卡監控電路C (19)包括:CPU處理器C (9)、溫度傳感器C (10)、電源管理芯片C (11)和BMC控制器C (12);擴展板卡監控電路(20)包括:DSP處理器(13)、溫度傳感器D (14)、電源管理芯片D (15)和BMC控制器D (16); BMC控制器A (4)、BMC控制器B (8)、BMC控制器C (12)和BMC控制器D (16)之間通過I2C總線雙向連接,測試計算機分別與CPU處理器A (I)、CPU處理器B (5)和CPU處理器C (9)通過以太網雙向連接,測試計算機分別與BMC控制器A (4)、BMC控制器B (8)、BMC控制器C (12)和BMC控制器D (16)通過串口雙向連接;在板卡監控電路A (17)中,BMC控制器A (4)與CPU處理器A (I)通過串口雙向連接,BMC控制器A (4)分別與溫度傳感器A (2)、電源管理芯片A (3)通過I2C總線雙向連接;在板卡監控電路B (18)中,BMC控制器B (8)與CPU處理器B (5)通過串口雙向連接,BMC控制器B (8)分別與溫度傳感器B (6)、電源管理芯片B (7)通過I2C總線雙向連接;在板卡監控電路C (19)中,BMC控制器C (12)與CPU處理器C (9)通過串口雙向連接,BMC控制器C (12)分別與溫度傳感器C(10)、電源管理芯片C (11)通過I2C總線雙向連接;在擴展板卡監控電路(20) C (19)中,BMC控制器D (16)與DSP處理器(13)通過串口雙向連接,BMC控制器D (16)分別與溫度傳感器D (14)、電源管理芯片D (15)通過I2C總線雙向連接; 小型嵌入式系統板卡監控系統上電后,首先確定BMC控制器A (4)、BMC控制器B (8)、BMC控制器C (12)和BMC控制器D (16)的I2C地址,由BMC控制器A (4)掌控系統I2C測試維護總線的控制權,BMC控制器B (8)、BMC控制器C (12)和BMC控制器D (16)作為I2C測試維護總線上的從設備;在板卡監控電路A (17)中,溫度傳感器A (2)、電源管理芯片A(3)持續對板卡輸入電.壓、板卡輸入電流和CPU處理器A(I)的溫度信號進行監測,并上報給BMC控制器A (4),由BMC控制器A (4)判斷電壓是否在O到50V、電流是否在O到50A和溫度是否在_50°C到+125°C的范圍之內,當電壓、電流或溫度信號不在范圍之內時,BMC控制器A (4)將向電源管理模塊A發送斷電命令,使板卡斷電;板卡監控電路B (18)、板卡監控電路C (19)和擴展板卡監控電路(20)對電壓、電流和溫度信號的處理過程與板卡監控電路A (17)對電壓、電流和溫度信號的處理過程相同; 小型嵌入式系統板卡監控系統正常啟動后,在板卡監控電路A (17)中,BMC控制器A(4)不斷接收CPU處理器A(I)的持續心跳信號,BMC控制器A (4) —方面對CPU處理器A(I)開始周期性上報電壓、電流和溫度信息,另一方面經由I2C總線每隔0.3秒持續的向BMC控制器B (8)和BMC控制器C (12)發送“主設備正常工作”的指示消息,消息中攜帶I2C地址,申明BMC控制器A (4)掌控系統I2C測試維護總線的控制權,BMC控制器B (8)和BMC控制器C (12)收到此消息后,保存當前主設備的I2C地址;在板卡監控電路B (18)中,BMC控制器B (8)不斷接收CPU處理器B (5)的持續心跳信號,當收到BMC控制器A (4)掌控系統I2C測試維護總線控制權的信息后,BMC控制器B (8)通過I2C總線周期性的將電壓、電流和溫度信息上報給BMC控制器A (4),然后再由BMC控制器A (4)轉發給CPU處理器A(I);在板卡監控電路C (19)和擴展板卡監控電路(20)對心跳信號和上報信息的處理過程與板卡監控電路B (18)對心跳信號和上報信息的處理過程相同; 當CPU處理器A (I)出現異常時,需要釋放I2C總線的控制權;首先,BMC控制器B (8)判斷是否接收到CPU處理器B (5)發送的心跳信號和BMC控制器C (12)是否接收到CPU處理器C (9)發送的心跳信號,若BMC控制器B (8)或BMC控制器C (12)沒有收到心跳信號,則將BMC控制器B (8)或BMC控制器C (12)設置為I2C總線的從設備,不能掌控I2C測試維護總線的控制權;其次,BMC控制器掌控I2C測試維護總線控制權的順序,遵循BMC控制器A (4)到BMC控制器B (8)到BMC控制器C (12)的次序;當BMC控制器B (8)在I秒內未收到BMC控制器A (4)發出的“主設備正常工作”指示消息,且BMC控制器B (8)接收到了 CPU處理器B (5)發送的心跳信號,則由BMC控制器B (8)控制器掌控I2C測試維護總線的控制權,BMC控制器A (4)釋放12C總線的控制權,在BMC控制器B (8)控制器掌控I2C測試維護總線的控制權后,需每隔0.3秒向BMC控制器A (4)和BMC控制器C (12)發送“主設備正常工作”的指示消息,BMC控制器A (4)和BMC控制器C (12)得知當前BMC控制器B (8)掌控I2C測試維護總線的控制權;當CPU處理器B (5)出現異常時,則切換I2C總線的控制權到BMC控制器C (12),其處理過程與I2C總線的控制權由BMC控制器A (4)切換到BMC控制器B (8)相同; 當CPU處理器A (I)、CPU處理器B (5)和CPU處理器C (9)工作狀態都異常時,最后掌控I2C測試維護總線控制權的BMC控制器,需要完成系統重啟的任務,當前BMC控制器在復位本板卡的同時也發送重啟命令給另外兩個BMC控制器,從而完成重啟任務;重啟系統后,依然由BMC控制器A ( 4)掌控系統I2C測試維護總線的控制權。
【文檔編號】G06F11/32GK103473166SQ201310377316
【公開日】2013年12月25日 申請日期:2013年8月27日 優先權日:2013年8月27日
【發明者】王寶強, 王浩, 戴捷, 楊帆, 張寧 申請人:中國航天科工集團第二研究院七〇六所