本發明涉及計算機,尤其涉及一種新就業群體識別方法、系統、設備、存儲介質及產品。
背景技術:
1、隨著互聯網和信息技術的快速發展,就業群體也在不斷變化,新就業形態是伴隨著互聯網技術進步與大眾消費升級出現的就業模式。相比傳統的就業形態,新就業形態更有組織性和規范性,具有就業容量大、進出門檻低、靈活性和兼職性強等優勢。
2、為更好地了解客戶群體和雇員情況,如何快速、準確地識別新形態就業群體,成為亟待解決的重要課題。
技術實現思路
1、針對上述問題,本發明提供一種新就業群體識別方法,應用于隱私計算服務器,所述方法包括:
2、獲取運營商服務器上傳的待識別用戶的上網行為特征、通信行為特征、行業聚集點停留特征,以及政府部門服務器上傳的待識別用戶的政務行為特征;
3、將所述上網行為特征、所述通信行為特征、所述行業聚集點停留特征和所述政務行為特征輸入訓練好的新就業群體識別模型,得到所述待識別用戶的新就業群體類別。
4、根據本發明提供的一種新就業群體識別方法,所述新就業群體識別模型包括lstm層、全連接層和輸出層;所述將所述上網行為特征、所述通信行為特征、所述行業聚集點停留特征和所述政務行為特征輸入預先訓練好的新就業群體識別模型,得到所述待識別用戶的新就業群體類別,包括:
5、將所述行業聚集點停留特征轉換為初始行程序列特征;
6、將所述初始行程序列特征輸入lstm層,得到最終行程序列特征;
7、將所述上網行為特征、所述通信行為特征和所述政務行為特征輸入全連接層,得到最終行為特征;
8、對所述最終行程序列特征和所述最終行為特征進行特征融合;
9、將融合特征輸入輸出層,得到所述待識別用戶的新就業群體類別。
10、根據本發明提供的一種新就業群體識別方法,所述lstm層包括單層lstm單元、反向lstm單元和全連接單元;所述將所述初始行程序列特征輸入lstm層,得到最終行程序列特征,包括:
11、將所述初始行程序列特征輸入單層lstm單元進行特征提取,得到第一行程序列特征;
12、將所述第一行程序列特征輸入反向lstm單元進行特征提取,得到第二行程序列特征;
13、將所述第二行程序列特征輸入全連接單元進行維度轉換,得到維度數為預設數目的最終行程序列特征。
14、根據本發明提供的一種新就業群體識別方法,所述全連接層包括三層全連接單元;所述將所述上網行為特征、所述通信行為特征和所述政務行為特征輸入全連接層,得到最終行為特征,包括:
15、將所述上網行為特征、所述通信行為特征和所述政務行為特征進行關聯,生成數據寬表;
16、將所述數據寬表輸入三層全連接單元進行特征提取,得到維度數為預設數目的最終行為特征。
17、根據本發明提供的一種新就業群體識別方法,所述新就業群體識別模型通過以下方式訓練得到:
18、獲取運營商服務器上傳的第一樣本數據和政府部門服務器上傳的第二樣本數據;所述第一樣本數據包括新就業群體的樣本上網行為特征、樣本通信行為特征、樣本行業聚集點停留特征以及對應的新就業群體類別標簽;所述第二樣本數據包括新就業群體的樣本政務行為特征以及對應的新就業群體類別標簽;
19、根據所述第一樣本數據和所述第二樣本數據對待訓練的新就業群體識別模型進行訓練,得到訓練好的新就業群體識別模型。
20、本發明還提供一種新就業群體識別方法,應用于運營商服務器,所述方法包括:
21、獲取待識別用戶的行程數據,將所述行程數據輸入訓練好的特征預測模型,得到行業聚集點停留特征;
22、將所述待識別用戶的上網行為特征、通信行為特征和所述行程點停留特征上傳至隱私計算服務器,以使所述隱私計算服務器將所述上網行為特征、所述通信行為特征、所述行程點停留特征和政府部門服務器上傳的政務行為特征輸入訓練好的新就業群體識別模型,得到所述待識別用戶的新就業群體類別。
23、根據本發明提供的一種新就業群體識別方法,所述特征預測模型包括弱監督模型和應用模型;所述特征預測模型通過以下方式訓練得到:
24、獲取新就業群體的樣本行程數據,以及針對目標樣本行程數據的第一標簽標注數據集;所述標簽標注數據集包括至少一個行業聚集點的聚集點描述、聚集點位置和聚集時間;
25、采用所述第一標簽標注數據集對弱監督模型進行訓練,采用訓練后的弱監督模型對所述樣本行程數據進行特征預測,得到第二標簽標注數據集;
26、從所述第二標簽標注數據集中選取置信度大于預設閾值的標簽標注數據對應用模型進行訓練,采用訓練后的應用模型對所述樣本軌跡數據進行特征預測,得到第三標簽標注數據集;
27、獲取對所述第三標簽標注數據集進行校正后的校正數據集,合并所述校正數據集和所述標簽標注數據集,以根據合并后的數據集對待訓練的特征預測模型進行迭代優化,得到訓練好的特征預測模型。
28、本發明還提供一種新就業群體識別系統,包括:
29、運營商服務器,用于獲取待識別用戶的行程數據,將所述行程數據輸入訓練好的特征預測模型,得到行業聚集點停留特征;將所述待識別用戶的上網行為特征、通信行為特征和所述行程點停留特征上傳至隱私計算服務器;
30、政府部門服務器,用于將待識別用戶的政務行為特征上傳至隱私計算服務器;
31、隱私計算服務器,用于將所述上網行為特征、所述通信行為特征、所述行業聚集點停留特征和所述政務行為特征輸入訓練好的新就業群體識別模型,得到所述待識別用戶的新就業群體類別。
32、本發明還提供一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執行所述程序時實現如上述任一項所述的新就業群體識別方法的步驟。
33、本發明還提供一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現如上述任一項所述的新就業群體識別方法的步驟。
34、本發明還提供一種計算機程序產品,包括計算機程序,所述計算機程序被處理器執行時實現如上述任一種所述新就業群體識別方法的步驟。
35、本發明提供的新就業群體識別方法、系統、設備、存儲介質及產品,通過將運營商服務器的待識別用戶的上網行為特征、通信行為特征、行業聚集點停留特征,以及政府部門服務器的待識別用戶的政務行為特征上傳至隱私計算服務器,從而將不同服務器的多維數據要素輸入構建的新就業群體識別模型進行識別,實現基于隱私計算通過新就業群體識別模型對多方數據進行融合計算,有利于完善職業畫像,提高模型識別精度與數據流通安全性,打破傳統模型計算花費大、精度差、對異常數據抗干擾能力弱的局限性。
1.一種新就業群體識別方法,其特征在于,應用于隱私計算服務器,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述新就業群體識別模型包括lstm層、全連接層和輸出層;所述將所述上網行為特征、所述通信行為特征、所述行業聚集點停留特征和所述政務行為特征輸入預先訓練好的新就業群體識別模型,得到所述待識別用戶的新就業群體類別,包括:
3.根據權利要求2所述的方法,其特征在于,所述lstm層包括單層lstm單元、反向lstm單元和全連接單元;所述將所述初始行程序列特征輸入lstm層,得到最終行程序列特征,包括:
4.根據權利要求2所述的方法,其特征在于,所述全連接層包括三層全連接單元;所述將所述上網行為特征、所述通信行為特征和所述政務行為特征輸入全連接層,得到最終行為特征,包括:
5.根據權利要求1所述的方法,其特征在于,所述新就業群體識別模型通過以下方式訓練得到:
6.一種新就業群體識別方法,其特征在于,應用于運營商服務器,所述方法包括:
7.根據權利要求6所述的方法,其特征在于,所述特征預測模型包括弱監督模型和應用模型;所述特征預測模型通過以下方式訓練得到:
8.一種新就業群體識別系統,其特征在于,包括:
9.一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1至7任一項所述的新就業群體識別方法。
10.一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至7任一項所述的新就業群體識別方法。
11.一種計算機程序產品,包括計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至7任一項所述新就業群體識別方法。