本發明涉及一種數據分析技術領域,特別是涉及一種確定疑似裸貸學生的方法及裝置。
背景技術:
隨著教育改革的深入,在信息化日益深化的今天,智慧校園和平安校園建設將高校信息化推進到新的發展階段,各種類型的數據不斷沉淀下來,高校在面對新形勢的挑戰下,必須在教學管理手段和方法上不斷創新。
近些年以來,校園貸款是普遍存在的重大校園問題。社會信貸組織利用部分貧困學生愛慕虛榮、一時沖動的弱點,獲取學生的全面個性信息和私密照片后給學生發放貸款。校園貸款學生不僅要承擔高額的利息,在無法按時還款時,校園貸款學生的人身安全還將受到巨大的威脅。然而目前并沒有對疑似校園貸款學生進行預警的相關措施。
技術實現要素:
有鑒于此,本發明提供了一種確定疑似裸貸學生的方法及裝置,主要目的在于可以實現及時識別得到疑似裸貸的學生用戶,以便讓學工部門或者輔導員盡早采取措施幫助他們還清貸款。
依據本發明一個方面,提供了一種確定疑似裸貸學生的方法,該方法包括:
獲取預定時間段內的待分析學生數據;
從所述待分析學生數據中提取學生的消費記錄信息、和/或行動軌跡信息、和/或門禁記錄信息、和/或上網活動信息;
根據所述消費記錄信息、和/或所述行動軌跡信息、和/或所述門禁記錄信息、和/或所述上網活動信息,對所述待分析學生數據進行分析;
依據分析結果確定得到待確定裸貸的學生用戶。
優選地,所述根據所述消費記錄信息、和/或所述行動軌跡信息、和/或所述門禁記錄信息、和/或所述上網活動信息,對所述待分析學生數據進行分析,具體包括:
根據所述消費記錄信息,檢測是否存在異常消費記錄的學生用戶;和/或
根據所述行為軌跡信息,檢測是否存在異常行為軌跡的學生用戶;和/或
根據所述門禁記錄信息,檢測是否存在異常門禁記錄的學生用戶;和/或
根據所述上網活動信息,檢測是否存在上網活動異常的學生用戶;
根據檢測結果確定對所述待分析學生數據進行分析的分析結果。
優選地,所述根據所述消費記錄信息,檢測是否存在異常消費記錄的學生用戶,具體包括:
根據所述消費記錄信息,檢測貧困學生和/或普通學生中是否存在單筆消費額大于預定金額閾值的學生用戶;和/或
檢測貧困學生和/或普通學生中是否存在平均消費總額大于預定平均金額閾值的學生用戶;
將貧困學生和/或普通學生中單筆消費額大于預定金額閾值的、和/或平均消費總額大于預定平均金額閾值的學生用戶,確定為存在異常消費記錄的學生用戶。
優選地,所述根據所述行為軌跡信息,檢測是否存在異常行為軌跡的學生用戶,具體包括:
根據所述行為軌跡信息,檢測學生的平均周期停留次數大于預定次數的停留地點是否為目標地點;
將所述平均周期停留次數大于預定次數的停留地點為目標地點的學生用戶,確定為存在異常行為軌跡的學生用戶。
優選地,所述根據所述門禁記錄信息,檢測是否存在異常門禁記錄的學生用戶,具體包括:
根據所述門禁記錄信息,檢測是否存在平均校園外出時長大于預設時長閾值的學生用戶;和/或
檢測是否存在平均校園外出時間段處于預設平均時間段內的學生用戶;
將平均校園外出時長大于預設時長閾值的,和/或平均校園外出時間段處于預設平均時間段內的學生用戶,確定為存在異常門禁記錄的學生用戶。
優選地,所述根據所述上網活動信息,檢測是否存在上網活動異常的學生用戶,具體包括:
檢測學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容;
將平均上網搜索內容和/或平均社交網絡發帖內容中包含預定文本內容的學生用戶,確定存在上網活動異常的學生用戶。
優選地,所述檢測學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容,具體包括:
采集學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容;
通過機械壓縮去詞、中文分詞、停用詞過濾的方式,對所述平均上網搜索文本內容和/或平均社交網絡發帖文本內容進行預處理;
通過預定情感傾向分析模型、預定語義網絡分析模型、預定狄利克雷分配lda主題分析模型,對預處理后的文本內容進行分析,得到學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容的分析結果。
依據本發明另一個方面,提供了一種確定疑似裸貸學生的裝置,該裝置包括:
獲取單元,用于獲取預定時間段內的待分析學生數據;
提取單元,用于從所述待分析學生數據中提取學生的消費記錄信息、和/或行動軌跡信息、和/或門禁記錄信息、和/或上網活動信息;
分析單元,用于根據所述消費記錄信息、和/或所述行動軌跡信息、和/或所述門禁記錄信息、和/或所述上網活動信息,對所述待分析學生數據進行分析;
確定單元,用于依據分析結果確定得到待確定裸貸的學生用戶。
優選地,所述分析單元具體包括:
檢測模塊,用于根據所述消費記錄信息,檢測是否存在異常消費記錄的學生用戶;和/或
根據所述行為軌跡信息,檢測是否存在異常行為軌跡的學生用戶;和/或
根據所述門禁記錄信息,檢測是否存在異常門禁記錄的學生用戶;和/或
根據所述上網活動信息,檢測是否存在上網活動異常的學生用戶;
確定模塊,用于根據所述檢測模塊的檢測結果確定對所述待分析學生數據進行分析的分析結果。
優選地,所述檢測模塊,具體用于根據所述消費記錄信息,檢測貧困學生和/或普通學生中是否存在單筆消費額大于預定金額閾值的學生用戶;和/或
檢測貧困學生和/或普通學生中是否存在平均消費總額大于預定平均金額閾值的學生用戶;
將貧困學生和/或普通學生中單筆消費額大于預定金額閾值的、和/或平均消費總額大于預定平均金額閾值的學生用戶,確定為存在異常消費記錄的學生用戶。
優選地,所述檢測模塊,具體用于根據所述行為軌跡信息,檢測學生的平均周期停留次數大于預定次數的停留地點是否為目標地點;
將所述平均周期停留次數大于預定次數的停留地點為目標地點的學生用戶,確定為存在異常行為軌跡的學生用戶。
優選地,所述檢測模塊,具體用于根據所述門禁記錄信息,檢測是否存在平均校園外出時長大于預設時長閾值的學生用戶;和/或
檢測是否存在平均校園外出時間段處于預設平均時間段內的學生用戶;
將平均校園外出時長大于預設時長閾值的,和/或平均校園外出時間段處于預設平均時間段內的學生用戶,確定為存在異常門禁記錄的學生用戶。
優選地,所述檢測模塊,具體用于檢測學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容;
將平均上網搜索內容和/或平均社交網絡發帖內容中包含預定文本內容的學生用戶,確定存在上網活動異常的學生用戶。
優選地,所述檢測模塊,具體還用于采集學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容;
通過機械壓縮去詞、中文分詞、停用詞過濾的方式,對所述平均上網搜索文本內容和/或平均社交網絡發帖文本內容進行預處理;
通過預定情感傾向分析模型、預定語義網絡分析模型、預定狄利克雷分配lda主題分析模型,對預處理后的文本內容進行分析,得到學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容的分析結果。依據本發明又一個方面,提供了又一種確定疑似裸貸學生的實體裝置,該裝置包括:
處理器,被配置為:
獲取預定時間段內的待分析學生數據;
從所述待分析學生數據中提取學生的消費記錄信息、和/或行動軌跡信息、和/或門禁記錄信息、和/或上網活動信息;
根據所述消費記錄信息、和/或所述行動軌跡信息、和/或所述門禁記錄信息、和/或所述上網活動信息,對所述待分析學生數據進行分析;
依據分析結果確定得到待確定裸貸的學生用戶;
存儲器,被配置為存儲所述處理器的可執行指令;
總線,被配置為耦接所述處理器及所述存儲器。
借由上述技術方案,本發明提供的技術方案至少具有下列優點:
本發明提供的一種確定疑似裸貸學生的方法及裝置,首先獲取預定時間段內的待分析學生數據,然后根據從待分析學生數據中提取的學生消費記錄信息、和/或行動軌跡信息、和/或門禁記錄信息、和/或上網活動信息,對待分析學生數據進行分析,可以分析得到疑似裸貸的學生用戶,以便讓學工部門或輔導員及時識別疑似裸貸的學生,進而盡早采取措施幫助他們還清貸款,消除人身安全威脅,避免他們走上不歸路。
上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發明的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本發明的具體實施方式。
附圖說明
通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優選實施方式的目的,而并不認為是對本發明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
圖1示出了本發明實施例提供的一種確定疑似裸貸學生的方法流程示意圖;
圖2示出了本發明實施例提供的一種確定疑似裸貸學生的裝置的結構示意圖;
圖3示出了本發明實施例提供的另一種確定疑似裸貸學生的裝置的結構示意圖;
圖4示出了本發明實施例提供的一種確定疑似裸貸學生的實體裝置結構示意圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。
本發明實施例提供了一種確定疑似裸貸學生的方法,如圖1所示,該方法包括:
101、獲取預定時間段內的待分析學生數據。
在本發明實施例中,可以通過高校的各種信息管理系統收集各類校園學生數據,作為待分析學生數據,其中,學生數據可以包括在校學生的相關信息、學生就餐情況、學生消費情況、學生在各個場所(教學樓、宿舍樓、圖書館、游泳館等地點)的出入情況、圖書資源使用情況、網上有關學校的評論信息等。
預定時間段可以根據實際需要預先進行相應設定,例如,如果用戶需要分析2012年第一學期的校園數據,預定時間段可以為2012年第一學期開學時間至該學期結束時間的這段時間。
對于本發明實施例的執行主體可以為用于疑似裸貸學生識別的裝置,用戶可以根據實際需要,輸入相關的分析指令來觸發該裝置進行相應工作,該指令中可以包含特定學生人群目標信息及相關的預定時間段信息,該裝置在接收到該分析指令后,執行步驟101至步驟104所述的過程,進而分析得到存在的疑似裸貸學生,例如,用戶可以根據實際需要,分析a學校的b學院學生中是否存在疑似裸貸學生;對于本發明實施例,用戶還可以預先設置該裝置自動進行數據分析的規則,即按照預定時間間隔獲取預定時間段內的待分析學生數據進行疑似裸貸學生的識別,在識別出疑似裸貸學生后,主動推動給學工部門或輔導員。
102、從待分析學生數據中提取學生的消費記錄信息、和/或行動軌跡信息、和/或門禁記錄信息、和/或上網活動信息。
其中,消費記錄信息中可以包含學生在校內超市、食堂、教學樓等地點的消費情況,具體可以基于校園一卡通的消費情況進行判定;行動軌跡信息中可以包含學生在一段時間內經過的各個位置信息,具體可以基于學生用戶移動終端采集的全球定位系統(globalpositioningsystem,gps)數據、學生在校園內各個場所的門禁記錄等,計算分析得到學生的行動軌跡信息;門禁記錄信息可以包含學生在宿舍樓、教學樓、學校大門、圖書館、游泳館等地的出入情況;上網活動信息可以包含學生在校內上網的情況,包括寢室、教學樓、圖書館、實驗樓等地點的上網情況,具體可以包含學生上網搜索的內容、瀏覽的網頁內容、校內或校外社交網站發帖內容等。
在本發明實施例中,從待分析學生數據中提取哪些信息具體可以根據實際情況進行設定,需要說明的是,提取的信息越全面,最后分析得到的結果更加準確,為此還可以從待分析學生數據中提取學生成績信息、圖書借閱記錄信息、考勤記錄信息、刷卡就餐記錄信息等,以便更加綜合的分析得到疑似裸貸的學生用戶。
103、根據消費記錄信息、和/或行動軌跡信息、和/或門禁記錄信息、和/或上網活動信息,對待分析學生數據進行分析。
例如,為了識別出a學院中是否存在疑似裸貸的學生,參考裸貸學生具備的普遍特征,可以結合a學院中每個學生的消費記錄信息、行動軌跡信息、門禁記錄信息、上網活動信息等多維度進行綜合分析,具體可以檢測a學院的學生中是否存在一段時間內消費額度大于一定閾值的學生用戶,該學生用戶還經常去銀行、借貸公司等地點,該學生用戶最近這段時間內經常外出,且平均校園外出時長大于一定閾值,而且該學生用戶最近這段時間上網時經常搜索打工賺錢、如何籌錢等相關內容,統計得到符合這些條件的學生用戶,作為相應的分析結果。
104、依據分析結果確定得到待確定裸貸的學生用戶。
在本發明實施例中,依據分析結果可以找到符合相應條件的學生用戶,將這些學生用戶確定為待確定裸貸的學生用戶,即疑似裸貸的學生用戶,并可以結合學生用戶的姓名、性別、年齡、所在學院、所在班級、所在宿舍、家庭聯系方式等相關信息,一并展示給學工部門或輔導員。
需要說明的是,對于本發明實施例提供的確定疑似裸貸學生的方法,除了可以應用在識別裸貸學生的場景以外,還可以應用在其他場景,例如,識別存在貸款行為的學生、公司員工等場景,都可以應用本發明實施例提供的方法,識別得到存在貸款行為的目標人群,以便進行相應的管理,在此本發明實施例不做限定。
本發明實施例提供的一種確定疑似裸貸學生的方法,首先獲取預定時間段內的待分析學生數據,然后根據從待分析學生數據中提取的學生消費記錄信息、和/或行動軌跡信息、和/或門禁記錄信息、和/或上網活動信息,對待分析學生數據進行分析,可以分析得到疑似裸貸的學生用戶,以便讓學工部門或輔導員及時識別疑似裸貸的學生,進而盡早采取措施幫助他們還清貸款,消除人身安全威脅,避免他們走上不歸路。
進一步的,作為對上述實施例的細化和擴展,上述步驟103具體可以包括:根據學生的消費記錄信息,檢測是否存在異常消費記錄的學生用戶;和/或根據學生的行為軌跡信息,檢測是否存在異常行為軌跡的學生用戶;和/或根據學生的門禁記錄信息,檢測是否存在異常門禁記錄的學生用戶;和/或根據學生的上網活動信息,檢測是否存在上網活動異常的學生用戶;根據檢測結果確定對待分析學生數據進行分析的分析結果。
對于本發明實施例,當結合上述消費記錄信息、行為軌跡信息、門禁記錄信息、上網活動信息綜合進行分析時,得到的分析結果更加準確,但具體還需要依照能夠采集到的信息情況而定,在本發明實施例中,可以將存在異常消費記錄、和/或異常行為軌跡、和/或異常門禁記錄、和/或上網活動異常的學生用戶,確定為待確定裸貸的學生用戶,以便讓學工部門或輔導員及時識別出疑似裸貸的學生,進而盡早采取措施幫助他們還清貸款。
其中,上述根據學生的消費記錄信息,檢測是否存在異常消費記錄的學生用戶的過程可以根據實際需要配置相應的檢測規則及設定相應的確定消費異常的標準進行實施,在本發明的一個可選實施例中,該步驟具體可以包括:根據消費記錄信息,檢測貧困學生和/或普通學生中是否存在單筆消費額大于預定金額閾值的學生用戶;和/或檢測貧困學生和/或普通學生中是否存在平均消費總額大于預定平均金額閾值的學生用戶;將貧困學生和/或普通學生中單筆消費額大于預定金額閾值的、和/或平均消費總額大于預定平均金額閾值的學生用戶,確定為存在異常消費記錄的學生用戶。
預定金額閾值、預定平均金額閾值可以根據實際需求預先進行設定。例如,學生a為貧困學生,根據學生a的消費記錄信息,學生a在最近的一個月內存在至少一筆消費額大于預定金額閾值的大額消費記錄,且這個月內的消費總額也大于預定平均金額閾值,學生a在這個月已經超出了貧困學生正常的消費水平,很可能存在貸款行為,因此可以將學生a確定存在異常消費記錄的學生用戶。
上述根據學生的行為軌跡信息,檢測是否存在異常行為軌跡的學生用戶的過程可以根據實際需要配置相應的檢測規則及設定相應的確定行為軌跡異常的標準進行實施,在本發明的一個可選實施例中,該步驟具體可以包括:根據學生的行為軌跡信息,檢測學生的平均周期停留次數大于預定次數的停留地點是否為目標地點;將所述平均周期停留次數大于預定次數的停留地點為目標地點的學生用戶,確定為存在異常行為軌跡的學生用戶。
預定次數可以根據實際需求預先進行設定,具體可以用于確定學生經常停留的地點。例如,根據學生b在最近一個月內的行為軌跡記錄信息,確定學生b在這一個月內在銀行、借貸公司等地點的停留次數大于一定閾值,說明學生b經常去銀行、借貸公司等地點,進而說明學生b很可能去進行借款等相關工作,來彌補貸款缺口,因此可以將學生b確定為異常行為軌跡的學生用戶。
上述根據學生的門禁記錄信息,檢測是否存在異常門禁記錄的學生用戶的過程可以根據實際需要配置相應的檢測規則及設定相應的確定門禁記錄異常的標準進行實施,在本發明的一個可選實施例中,該步驟具體可以包括:根據學生的門禁記錄信息,檢測是否存在平均校園外出時長大于預設時長閾值的學生用戶;和/或檢測是否存在平均校園外出時間段處于預設平均時間段內的學生用戶;將平均校園外出時長大于預設時長閾值的,和/或平均校園外出時間段處于預設平均時間段內的學生用戶,確定為存在異常門禁記錄的學生用戶。
預設時長閾值、預設平均時間段可以根據實際需求預先進行設定。例如,根據學生c在最近一個月內的門禁記錄信息,確定學生c在這一個月內經常外出離開學校,且平均每次外出時長都大于一定閾值,說明學生c可能經常去校外參加打工活動,為了彌補貸款缺口,可以將學生c確定為存在異常門禁記錄的學生用戶;又例如,根據學生d在最近一個月內的門禁記錄信息,確定學生d在這一個月內經常在晚上11點到凌晨4點鐘的時間段內外出離開學校,說明學生d可能經常半夜去校外參加打工活動,來償還借款債務,因此可以將學生d確定為存在異常門禁記錄的學生用戶。
上述根據學生的上網活動信息,檢測是否存在上網活動異常的學生用戶的過程可以根據實際需要配置相應的檢測規則及設定相應的確定上網活動異常的標準進行實施,在本發明的一個可選實施例中,該步驟具體可以包括:檢測學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容;將平均上網搜索內容和/或平均社交網絡發帖內容中包含預定文本內容的學生用戶,確定存在上網活動異常的學生用戶。
預定文本內容可以為與搜索打工賺錢、如何籌錢等相關的文本內容,具體可以根據實際需求預先進行配置。例如,根據學生e的在最近一個月內的上網搜索記錄、瀏覽網頁記錄、網上發表言論、網站發帖等上網活動信息,確定學生e在這一個月內經常在網上搜索和網站發帖打工賺錢、如何籌錢等相關內容,說明學生e最近可能存在貸款債務,需要打工還清,因此可以將學生e確定為存在上網活動異常的學生用戶。
為了檢測學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容的過程更加準確,提高檢測效率,以便提高識別疑似裸貸學生的準確性和效率,在本發明的一個可選實施例中,該步驟具體可以包括:采集學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容;通過機械壓縮去詞的方式,對平均上網搜索文本內容和/或平均社交網絡發帖文本內容進行預處理,以便提高分析效率和準確性;通過預定情感傾向分析模型、預定語義網絡分析模型、預定狄利克雷分配lda主題分析模型,對預處理后的文本內容進行分析,得到學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容的分析結果。
具體地,可以基于學生用戶的上網賬號進行相關采集,首先采集與該上網賬號相關的上網記錄、瀏覽網頁內容、網站發帖內容等信息,再將采集到的信息進行預處理,包括:機械壓縮去詞、中文分詞、停用詞過濾等方式,例如,基于機械壓縮去詞處理過程的連續累贅重復的判斷及壓縮規則,將“求職家教鐘點工求職家教鐘點工求職家教鐘點工求職家教鐘點工”的文本,處理得到“求職家教鐘點工”的文本;然后通過預定情感傾向分析模型、預定語義網絡分析模型、預定狄利克雷分配lda主題分析模型對預處理后的文本內容進行分析,進而可以更加準確的檢測出學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容的分析結果,從而可以提高識別疑似裸貸學生的準確性。
進一步地,為了提高疑似裸貸學生的識別準確性,增加疑似裸貸學生的可信度,在本發明的一個可選實施例中,還可以結合學生的學生成績信息、圖書借閱記錄信息、考勤記錄信息、刷卡就餐記錄信息等進行綜合分析。例如,通過上述方法確定學生f為疑似裸貸學生,如果學生f的學習成績也在近期出現大幅下滑、圖書借閱量也較之前大幅減少、以及經常出現上課缺勤的情況,近期在校刷卡就餐次數也較少,可以進一步確定學生f為疑似裸貸學生。
進一步地,為了使得學工部門或輔導員了解分析結果的可信度,在本發明的一個可選實施例中,還可以參考學生的消費記錄信息、行動軌跡信息、門禁記錄信息、上網活動信息、學生成績信息、圖書借閱記錄信息、考勤記錄信息等,對該學生為疑似裸貸學生的概率值進行計算,例如,符合上述條件越多,其相應的概率值就越大。然后將計算得到概率值與該學生的相關信息一同展示給學工部門或輔導員。
進一步地,作為圖1所述方法的具體實現,本發明實施例提供了一種確定疑似裸貸學生的裝置,如圖2所示,所述裝置包括:獲取單元21、提取單元22、分析單元23、確定單元24。
獲取單元21,可以用于獲取預定時間段內的待分析學生數據。獲取單元21為本裝置中獲取待分析學生數據的主要功能模塊,待分析學生數據具體可以通過高校的各種信息管理系統進行采集。
提取單元22,可以用于從所述獲取單元21獲取的所述待分析學生數據中提取學生的消費記錄信息、和/或行動軌跡信息、和/或門禁記錄信息、和/或上網活動信息。提取單元22為本裝置中提取相關特征信息的主要功能模塊。
分析單元23,可以用于根據所述提取單元22提取的所述消費記錄信息、和/或所述行動軌跡信息、和/或所述門禁記錄信息、和/或所述上網活動信息,對所述待分析學生數據進行分析。分析單元23為本裝置中的核心功能模塊。
確定單元24,可以用于依據所述分析單元23的分析結果確定得到待確定裸貸的學生用戶。確定單元24為本裝置中確定疑似裸貸學生用戶的主要功能模塊。
具體地,如圖3所示,所述分析單元23具體可以包括:檢測模塊231、確定模塊232。
檢測模塊231,可以用于根據所述消費記錄信息,檢測是否存在異常消費記錄的學生用戶;和/或根據所述行為軌跡信息,檢測是否存在異常行為軌跡的學生用戶;和/或根據所述門禁記錄信息,檢測是否存在異常門禁記錄的學生用戶;和/或根據所述上網活動信息,檢測是否存在上網活動異常的學生用戶。
確定模塊232,可以用于根據所述檢測模塊231的檢測結果確定對所述待分析學生數據進行分析的分析結果。在本發明實施例中,可以將存在異常消費記錄、和/或異常行為軌跡、和/或異常門禁記錄、和/或上網活動異常的學生用戶,確定為待確定裸貸的學生用戶,以便讓學工部門或輔導員及時識別疑似裸貸的學生,進而盡早采取措施幫助他們還清貸款。
所述檢測模塊231,具體可以用于根據所述消費記錄信息,檢測貧困學生和/或普通學生中是否存在單筆消費額大于預定金額閾值的學生用戶;和/或檢測貧困學生和/或普通學生中是否存在平均消費總額大于預定平均金額閾值的學生用戶;將貧困學生和/或普通學生中單筆消費額大于預定金額閾值的、和/或平均消費總額大于預定平均金額閾值的學生用戶,確定為存在異常消費記錄的學生用戶。
所述檢測模塊231,具體還可以用于根據所述行為軌跡信息,檢測學生的平均周期停留次數大于預定次數的停留地點是否為目標地點;將所述平均周期停留次數大于預定次數的停留地點為目標地點的學生用戶,確定為存在異常行為軌跡的學生用戶。
所述檢測模塊231,具體還可以用于根據所述門禁記錄信息,檢測是否存在平均校園外出時長大于預設時長閾值的學生用戶;和/或檢測是否存在平均校園外出時間段處于預設平均時間段內的學生用戶;將平均校園外出時長大于預設時長閾值的,和/或平均校園外出時間段處于預設平均時間段內的學生用戶,確定為存在異常門禁記錄的學生用戶。
所述檢測模塊231,具體還可以用于檢測學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容;將平均上網搜索內容和/或平均社交網絡發帖內容中包含預定文本內容的學生用戶,確定存在上網活動異常的學生用戶。
為了檢測學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容的過程更加準確,提高檢測效率,以便提高識別疑似裸貸學生的準確性和效率,所述檢測模塊231,具體還可以用于采集學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容;通過機械壓縮去詞、中文分詞、停用詞過濾的方式,對所述平均上網搜索文本內容和/或平均社交網絡發帖文本內容進行預處理;通過預定情感傾向分析模型、預定語義網絡分析模型、預定狄利克雷分配lda主題分析模型,對預處理后的文本內容進行分析,得到學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容的分析結果。
需要說明的是,本發明實施例提供的一種確定疑似裸貸學生的裝置所涉及各功能單元的其他相應描述,可以參考圖1中的對應描述,在此不再贅述。
本發明實施例提供的一種確定疑似裸貸學生的裝置,包括:獲取單元、提取單元、分析單元、確定單元。首先獲取單元獲取預定時間段內的待分析學生數據,然后分析單元根據提取單元從待分析學生數據中提取的學生消費記錄信息、和/或行動軌跡信息、和/或門禁記錄信息、和/或上網活動信息,對待分析學生數據進行分析,可以分析得到疑似裸貸的學生用戶,以便讓學工部門或輔導員及時識別疑似裸貸的學生,進而盡早采取措施幫助他們還清貸款,消除人身安全威脅,避免他們走上不歸路。
基于上述如圖1所示方法和如圖2、圖3所示裝置的實施例,本發明實施例還提供了一種確定疑似裸貸學生的實體裝置,如圖4所示,該裝置包括:處理器31、存儲器32、總線33。
處理器31,可以被配置為:獲取預定時間段內的待分析學生數據;
從所述待分析學生數據中提取學生的消費記錄信息、和/或行動軌跡信息、和/或門禁記錄信息、和/或上網活動信息;
根據所述消費記錄信息、和/或所述行動軌跡信息、和/或所述門禁記錄信息、和/或所述上網活動信息,對所述待分析學生數據進行分析;
依據分析結果確定得到待確定裸貸的學生用戶。
存儲器32,可以被配置為存儲所述處理器的可執行指令。
總線33,可以被配置為耦接所述處理器及所述存儲器。
所述處理器31,具體可以被配置為:根據所述消費記錄信息,檢測是否存在異常消費記錄的學生用戶;和/或根據所述行為軌跡信息,檢測是否存在異常行為軌跡的學生用戶;和/或根據所述門禁記錄信息,檢測是否存在異常門禁記錄的學生用戶;和/或根據所述上網活動信息,檢測是否存在上網活動異常的學生用戶;根據檢測結果確定對所述待分析學生數據進行分析的分析結果。
所述處理器31,具體可以被配置為:根據所述消費記錄信息,檢測貧困學生和/或普通學生中是否存在單筆消費額大于預定金額閾值的學生用戶;和/或檢測貧困學生和/或普通學生中是否存在平均消費總額大于預定平均金額閾值的學生用戶;將貧困學生和/或普通學生中單筆消費額大于預定金額閾值的、和/或平均消費總額大于預定平均金額閾值的學生用戶,確定為存在異常消費記錄的學生用戶。
所述處理器31,具體還可以被配置為:根據所述行為軌跡信息,檢測學生的平均周期停留次數大于預定次數的停留地點是否為目標地點;將所述平均周期停留次數大于預定次數的停留地點為目標地點的學生用戶,確定為存在異常行為軌跡的學生用戶。
所述處理器31,具體還可以被配置為:根據所述門禁記錄信息,檢測是否存在平均校園外出時長大于預設時長閾值的學生用戶;和/或檢測是否存在平均校園外出時間段處于預設平均時間段內的學生用戶;將平均校園外出時長大于預設時長閾值的,和/或平均校園外出時間段處于預設平均時間段內的學生用戶,確定為存在異常門禁記錄的學生用戶。
所述處理器31,具體還可以被配置為:檢測學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容;將平均上網搜索內容和/或平均社交網絡發帖內容中包含預定文本內容的學生用戶,確定存在上網活動異常的學生用戶。
所述處理器31,具體還可以被配置為:采集學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容;通過機械壓縮去詞、中文分詞、停用詞過濾的方式,對所述平均上網搜索文本內容和/或平均社交網絡發帖文本內容進行預處理;通過預定情感傾向分析模型、預定語義網絡分析模型、預定狄利克雷分配lda主題分析模型,對預處理后的文本內容進行分析,得到學生平均上網搜索文本內容和/或平均社交網絡發帖文本內容中是否包含預定文本內容的分析結果。
本發明實施例提供的一種確定疑似裸貸學生的實體裝置,包括:處理器、存儲器、總線。通過處理器中的處理邏輯,可以分析得到疑似裸貸的學生用戶,以便讓學工部門或輔導員及時識別疑似裸貸的學生,進而盡早采取措施幫助他們還清貸款,消除人身安全威脅,避免他們走上不歸路。
在上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。
可以理解的是,上述方法及裝置中的相關特征可以相互參考。另外,上述實施例中的“第一”、“第二”等是用于區分各實施例,而并不代表各實施例的優劣。
所屬領域的技術人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統,裝置和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。
在此提供的算法和顯示不與任何特定計算機、虛擬系統或者其它設備固有相關。各種通用系統也可以與基于在此的示教一起使用。根據上面的描述,構造這類系統所要求的結構是顯而易見的。此外,本發明也不針對任何特定編程語言。應當明白,可以利用各種編程語言實現在此描述的本發明的內容,并且上面對特定語言所做的描述是為了披露本發明的最佳實施方式。
在此處所提供的說明書中,說明了大量具體細節。然而,能夠理解,本發明的實施例可以在沒有這些具體細節的情況下實踐。在一些實例中,并未詳細示出公知的方法、結構和技術,以便不模糊對本說明書的理解。
類似地,應當理解,為了精簡本公開并幫助理解各個發明方面中的一個或多個,在上面對本發明的示例性實施例的描述中,本發明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖:即所要求保護的本發明要求比在每個權利要求中所明確記載的特征更多的特征。更確切地說,如下面的權利要求書所反映的那樣,發明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式的權利要求書由此明確地并入該具體實施方式,其中每個權利要求本身都作為本發明的單獨實施例。
本領域那些技術人員可以理解,可以對實施例中的設備中的模塊進行自適應性地改變并且把它們設置在與該實施例不同的一個或多個設備中。可以把實施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
此外,本領域的技術人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發明的范圍之內并且形成不同的實施例。例如,在下面的權利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
本發明的各個部件實施例可以以硬件實現,或者以在一個或者多個處理器上運行的軟件模塊實現,或者以它們的組合實現。本領域的技術人員應當理解,可以在實踐中使用微處理器或者數字信號處理器(dsp)來實現根據本發明實施例的一種確定疑似裸貸學生的方法及裝置中的一些或者全部部件的一些或者全部功能。本發明還可以實現為用于執行這里所描述的方法的一部分或者全部的設備或者裝置程序(例如,計算機程序和計算機程序產品)。這樣的實現本發明的程序可以存儲在計算機可讀介質上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網網站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
應該注意的是上述實施例對本發明進行說明而不是對本發明進行限制,并且本領域技術人員在不脫離所附權利要求的范圍的情況下可設計出替換實施例。在權利要求中,不應將位于括號之間的任何參考符號構造成對權利要求的限制。單詞“包含”不排除存在未列在權利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現。在列舉了若干裝置的單元權利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現。單詞第一、第二、以及第三等的使用不表示任何順序。可將這些單詞解釋為名稱。