本發(fā)明涉及計(jì)算機(jī),尤其涉及一種性能計(jì)數(shù)器數(shù)據(jù)的壓縮/解壓方法、裝置及電子設(shè)備。
背景技術(shù):
1、人工智能芯片是推動(dòng)人工智能發(fā)展的關(guān)鍵技術(shù)之一,它們?yōu)槿斯ぶ悄芩惴ㄌ峁┍匾挠?jì)算能力。目前,人工智能芯片包括gpu(graphics?processing?unit,圖形處理器)、tpu(tensor?processing?unit,張量處理器)、npu(neural?network?processing?unit,神經(jīng)網(wǎng)絡(luò)處理器)、dpu(deep?learning?processing?unit,深度學(xué)習(xí)處理器)、apu(accelerated?processing?unit,加速處理器),以及gpgpu(general-purpose?computingon?graphics?processing?unit,通用圖形處理器)等。
2、人工智能芯片的性能計(jì)數(shù)器是一種硬件監(jiān)控工具,用于追蹤和測量人工智能芯片在執(zhí)行任務(wù)時(shí)的各種性能指標(biāo),如處理速度、內(nèi)存帶寬、指令執(zhí)行效率和線程活動(dòng)等。這些計(jì)數(shù)器為開發(fā)者和系統(tǒng)管理員提供了關(guān)鍵數(shù)據(jù),幫助他們分析人工智能芯片的運(yùn)行狀況,識(shí)別性能瓶頸,優(yōu)化計(jì)算密集型應(yīng)用,并確保硬件資源得到最有效的利用。
3、目前,通常直接存儲(chǔ)人工智能芯片的性能計(jì)數(shù)器中數(shù)值,或采用傳統(tǒng)的基于字節(jié)流的串行方式對人工智能芯片的性能計(jì)數(shù)器中數(shù)值的進(jìn)行壓縮,例如,采用lz77和lz78壓縮算法。但是這種方式未考慮到人工智能芯片性能計(jì)數(shù)器數(shù)據(jù)的特性,在壓縮率和計(jì)算效率方面存在局限性。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種性能計(jì)數(shù)器數(shù)據(jù)的壓縮/解壓方法、裝置及電子設(shè)備,用以解決現(xiàn)有技術(shù)中采用傳統(tǒng)的壓縮方式對人工智能芯片性能計(jì)數(shù)器數(shù)據(jù)進(jìn)行壓縮,在壓縮率和計(jì)算效率方面存在局限性。本發(fā)明基于人工智能芯片性能計(jì)數(shù)器數(shù)據(jù)的同質(zhì)性對人工智能芯片性能計(jì)數(shù)器數(shù)據(jù)進(jìn)行壓縮,提供了更高的壓縮率和更低的計(jì)算開銷,從而更有效地處理人工智能芯片性能計(jì)數(shù)器數(shù)據(jù)。
2、本發(fā)明提供一種性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法,包括:獲取人工智能芯片中至少兩個(gè)目標(biāo)執(zhí)行單元的性能計(jì)數(shù)器的數(shù)據(jù)塊;根據(jù)獲取的數(shù)據(jù)塊的相似性,確定待差分的數(shù)據(jù)塊集合;從所述待差分的數(shù)據(jù)塊集合中選取基準(zhǔn)數(shù)據(jù)塊;計(jì)算所述待差分的數(shù)據(jù)塊中除基準(zhǔn)數(shù)據(jù)塊外的數(shù)據(jù)塊中數(shù)據(jù)元素與基準(zhǔn)數(shù)據(jù)塊中對應(yīng)的數(shù)據(jù)元素的差值;基于所述基準(zhǔn)數(shù)據(jù)塊以及計(jì)算出的差值生成壓縮數(shù)據(jù)。
3、根據(jù)本發(fā)明提供的一種性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法,所述獲取人工智能芯片中至少兩個(gè)目標(biāo)執(zhí)行單元的性能計(jì)數(shù)器的數(shù)據(jù)塊,包括:響應(yīng)于目標(biāo)核函數(shù)執(zhí)行結(jié)束,獲取所述目標(biāo)核函數(shù)的至少兩個(gè)執(zhí)行單元的性能計(jì)數(shù)器的數(shù)據(jù)塊。
4、根據(jù)本發(fā)明提供的一種性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法,所述根據(jù)獲取的數(shù)據(jù)塊的相似性,確定待差分的數(shù)據(jù)塊集合,包括:計(jì)算所述至少兩個(gè)目標(biāo)執(zhí)行單元間的任務(wù)分發(fā)均衡度;判斷所述任務(wù)分發(fā)均衡度是否小于預(yù)先設(shè)置的均衡度閾值;若否,則將所述至少兩個(gè)目標(biāo)執(zhí)行單元的性能計(jì)數(shù)器的數(shù)據(jù)塊加入所述待差分的數(shù)據(jù)塊集合。
5、根據(jù)本發(fā)明提供的一種性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法,所述計(jì)算所述至少兩個(gè)目標(biāo)執(zhí)行單元間的任務(wù)分發(fā)均衡度,包括:根據(jù)所述至少兩個(gè)目標(biāo)執(zhí)行單元的任務(wù)執(zhí)行時(shí)間戳,計(jì)算所述至少兩個(gè)目標(biāo)執(zhí)行單元間的任務(wù)分發(fā)均衡度。
6、根據(jù)本發(fā)明提供的一種性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法,所述根據(jù)獲取的數(shù)據(jù)塊的相似性,確定待差分的數(shù)據(jù)塊,包括:根據(jù)所述至少兩個(gè)目標(biāo)執(zhí)行單元的任務(wù)執(zhí)行時(shí)間戳,對所述至少兩個(gè)目標(biāo)執(zhí)行單元的的性能計(jì)數(shù)器的數(shù)據(jù)塊進(jìn)行聚類,得到至少一個(gè)待差分的數(shù)據(jù)塊集合。
7、根據(jù)本發(fā)明提供的一種性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法,基于所述基準(zhǔn)數(shù)據(jù)塊以及計(jì)算出的差值生成壓縮數(shù)據(jù)之前,所述方法還包括創(chuàng)建緩沖區(qū),將所述基準(zhǔn)數(shù)據(jù)塊存儲(chǔ)至所述緩沖區(qū);所述基于所述基準(zhǔn)數(shù)據(jù)塊以及計(jì)算出的差值生成壓縮數(shù)據(jù),包括:構(gòu)建差分列表,將計(jì)算出的差值中的非零值添加到所述差分列表中;將所述差分列表追加到所述緩沖區(qū)所述基準(zhǔn)數(shù)據(jù)塊的尾部;基于串行字節(jié)流的方法對所述緩沖區(qū)中數(shù)據(jù)進(jìn)行壓縮得到壓縮數(shù)據(jù)。
8、本發(fā)明還提供一種性能計(jì)數(shù)器數(shù)據(jù)的壓縮裝置,包括:第一獲取模塊,被配置成獲取人工智能芯片中至少兩個(gè)目標(biāo)執(zhí)行單元的性能計(jì)數(shù)器的數(shù)據(jù)塊;確定模塊,被配置成根據(jù)獲取的數(shù)據(jù)塊的相似性,確定待差分的數(shù)據(jù)塊集合;選取模塊,被配置成從所述待差分的數(shù)據(jù)塊集合中選取基準(zhǔn)數(shù)據(jù)塊;計(jì)算模塊,被配置成計(jì)算所述待差分的數(shù)據(jù)塊中除基準(zhǔn)數(shù)據(jù)塊外的數(shù)據(jù)塊中數(shù)據(jù)元素與基準(zhǔn)數(shù)據(jù)塊中對應(yīng)的數(shù)據(jù)元素的差值;壓縮模塊,被配置成基于所述基準(zhǔn)數(shù)據(jù)塊以及計(jì)算出的差值生成壓縮數(shù)據(jù)。
9、本發(fā)明還提供一種性能計(jì)數(shù)器數(shù)據(jù)的解壓方法,用于對上述任一種性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法生成的壓縮數(shù)據(jù)進(jìn)行解壓,其特征在于,包括:獲取至少兩個(gè)目標(biāo)執(zhí)行單元的性能計(jì)數(shù)器的數(shù)據(jù)塊的壓縮數(shù)據(jù);從所述壓縮數(shù)據(jù)中提取基準(zhǔn)數(shù)據(jù)塊以及所述至少兩個(gè)目標(biāo)執(zhí)行單元的性能計(jì)數(shù)器的數(shù)據(jù)塊中除所述基準(zhǔn)數(shù)據(jù)塊外的其他數(shù)據(jù)塊中數(shù)據(jù)元素與所述基準(zhǔn)數(shù)據(jù)塊中對應(yīng)數(shù)據(jù)元素的差值;根據(jù)所述基準(zhǔn)數(shù)據(jù)塊以及提取出的差值,還原所述至少兩個(gè)目標(biāo)執(zhí)行單元的性能計(jì)數(shù)器的數(shù)據(jù)塊。
10、本發(fā)明還提供一種性能計(jì)數(shù)器數(shù)據(jù)的解壓裝置,用于對上述性能計(jì)數(shù)器數(shù)據(jù)的壓縮裝置生成的壓縮數(shù)據(jù)進(jìn)行解壓,其特征在于,包括:第二獲取模塊,被配置成獲取至少兩個(gè)目標(biāo)執(zhí)行單元的性能計(jì)數(shù)器的數(shù)據(jù)塊的壓縮數(shù)據(jù);提取模塊,被配置成從所述壓縮數(shù)據(jù)中提取基準(zhǔn)數(shù)據(jù)塊以及所述至少兩個(gè)目標(biāo)執(zhí)行單元的性能計(jì)數(shù)器的數(shù)據(jù)塊中除所述基準(zhǔn)數(shù)據(jù)塊外的其他數(shù)據(jù)塊中數(shù)據(jù)元素與所述基準(zhǔn)數(shù)據(jù)塊中對應(yīng)數(shù)據(jù)元素的差值;還原模塊,被配置成根據(jù)所述基準(zhǔn)數(shù)據(jù)塊以及提取出的差值,還原所述至少兩個(gè)目標(biāo)執(zhí)行單元的性能計(jì)數(shù)器的數(shù)據(jù)塊。
11、本發(fā)明還提供一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述任一種所述性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法。
12、本發(fā)明還提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法。
13、本發(fā)明還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法。
14、本發(fā)明提供的性能計(jì)數(shù)器數(shù)據(jù)的壓縮/解壓方法、裝置及電子設(shè)備,根據(jù)數(shù)據(jù)塊的相似性,確定待差分的數(shù)據(jù)塊集合;計(jì)算待差分的數(shù)據(jù)塊中除基準(zhǔn)數(shù)據(jù)塊外的數(shù)據(jù)塊中數(shù)據(jù)元素與基準(zhǔn)數(shù)據(jù)塊中對應(yīng)的數(shù)據(jù)元素的差值,基于基準(zhǔn)數(shù)據(jù)塊以及計(jì)算出的差值生成壓縮數(shù)據(jù),提高了人工智能芯片性能計(jì)數(shù)器數(shù)據(jù)的壓縮率,降低了壓縮的計(jì)算開銷。
1.一種性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法,其特征在于,所述獲取人工智能芯片中至少兩個(gè)目標(biāo)執(zhí)行單元的性能計(jì)數(shù)器的數(shù)據(jù)塊,包括:
3.根據(jù)權(quán)利要求1所述的性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法,其特征在于,所述根據(jù)獲取的數(shù)據(jù)塊的相似性,確定待差分的數(shù)據(jù)塊集合,包括:
4.根據(jù)權(quán)利要求3所述的性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法,其特征在于,所述計(jì)算所述至少兩個(gè)目標(biāo)執(zhí)行單元間的任務(wù)分發(fā)均衡度,包括:
5.根據(jù)權(quán)利要求1所述的性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法,其特征在于,所述根據(jù)獲取的數(shù)據(jù)塊的相似性,確定待差分的數(shù)據(jù)塊,包括:
6.根據(jù)權(quán)利要求1所述的性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法,其特征在于,基于所述基準(zhǔn)數(shù)據(jù)塊以及計(jì)算出的差值生成壓縮數(shù)據(jù)之前,所述方法還包括創(chuàng)建緩沖區(qū),將所述基準(zhǔn)數(shù)據(jù)塊存儲(chǔ)至所述緩沖區(qū);
7.一種性能計(jì)數(shù)器數(shù)據(jù)的壓縮裝置,其特征在于,包括:
8.一種性能計(jì)數(shù)器數(shù)據(jù)的解壓方法,用于對權(quán)利要求1至6任一項(xiàng)所述性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法生成的壓縮數(shù)據(jù)進(jìn)行解壓,其特征在于,包括:
9.一種性能計(jì)數(shù)器數(shù)據(jù)的解壓裝置,用于對權(quán)利要求7所述性能計(jì)數(shù)器數(shù)據(jù)的壓縮裝置生成的壓縮數(shù)據(jù)進(jìn)行解壓,其特征在于,包括:
10.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至6任一項(xiàng)所述性能計(jì)數(shù)器數(shù)據(jù)的壓縮方法。