本公開涉及數據處理,尤其涉及一種商鋪選址方法及裝置、電子設備和存儲介質。
背景技術:
1、在個體商戶經營中,選址是非常重要的環節,對未知城市的全面、客觀的選址評估尤為關鍵。
2、目前,在進行選址時,主要存在兩種方法,第一種:選址專家進行現場勘測、數據采集,然后將獲得的數據整理后集中分析、討論完成選址;第二種:基于層次分析法的選址技術,綜合考慮客流熱度及客流畫像信息,進行選址。
3、上述兩種選址技術,都能夠在一定程度上解決選址的問題,但是上述兩種方法都比較容易受個人的主觀判斷的影響;在第一種方法中,選址結果收采集的數據質量和決策者的個人判斷影響,第二種方法中,客流熱度及客流畫像信息對于最終結果的影響權重也是由評估者根據經驗主觀判斷得到的,因此上述兩種選址得到的選址結果客觀性較差,導致選址結果的說服力不強。
技術實現思路
1、本公開提供了一種商鋪選址方法、裝置、電子設備和存儲介質。其主要目的在于解決選址結果客觀性較差,導致選址結果的說服力不強的問題。
2、根據本公開的第一方面,提供了一種商鋪選址方法,其中,包括:
3、基于預設降維算法,對備選區域內的數據特征進行降維;其中,所述備選區域為根據預設距離閾值對現實世界劃分得到的;一個備選區域內至少包括兩個數據特征;
4、根據數據特征對整體選址性能的影響度與不同數據特征之間的沖突性,計算分別計算每個數據特征的選址權重;
5、根據所述選址權重,與所述備選區域內降維后的數據特征,計算所述備選區域的選址得分;其中,不同選址得分對應不同建議選址數量,所述選址得分與所述建議選址數量之間的對應的關系為提前配置得到的。
6、可選的,所述備選區域內包含預設數量的數據特征,所述基于預設降維算法,對備選區域內的數據特征進行降維包括:
7、根據不同備選區域內的數據特征的空間距離,構建距離矩陣;
8、根據所述備選區域間的空間距離,確定各備選區域的鄰域個數;其中,不同備選區域的鄰域個數不同;
9、根據預設公式,提取局部結構特征,并根據提取出的局部結構特征生成對角矩陣;其中,所述對角矩陣中的對角線上的元素為所述局部結構特征;
10、根據所述對角矩陣計算與所述預設數量的矩陣特征值與矩陣向量;其中,所述矩陣特征值與所述矩陣向量一一對應;
11、根據所述矩陣特征值與所述矩陣向量,構建預設數量維度空間,并將所述備選區域內的全部數據特征映射至所述預設數量的維度空間中,將所述備選區域內的全部數據特征降維至所述預設數量維度。
12、可選的,所述根據所述備選區域間的空間距離,確定各備選區域的鄰域個數包括:
13、根據各個備選區域間的距離,計算各所述備選區域間的平均距離;
14、根據各個備選區域之間的距離與平均距離,分別確定各所述備選區域的鄰域;其中,所述鄰域為與備選區域的距離小于所述平均距離的其他備選區域;
15、根據各所述備選區域的鄰域數量,并計算各所述備選區域的平均鄰域數量;
16、根據各個備選區域的鄰域數量與所述平均鄰域數量,調整各所述備選區域的鄰域數量;其中,鄰域數量小于平均鄰域數量時,增加所述備選區域的鄰域數量;鄰域數量大于平均鄰域數量時,減少所述備選區域的鄰域數量。
17、可選的,所述根據數據特征對整體選址性能的影響度,與不同數據特征之間的沖突性,計算所述數據特征的選址權重還包括:
18、構建決策矩陣,并對所述決策矩陣進行歸一化處理;其中,所述決策矩陣的橫坐標為備選區域,縱坐標為數據特征;
19、計算所述備選區域的第一整體性能值,并計算所述備選區域去除每個數據特征后的第二整體性能值;
20、根據所述第一整體性能值與所述第二整體性能值,計算每個數據特征值的絕對偏差總和;
21、根據各數據特征間的距離相關系數,確定各所述數據特征間的指標沖突性;
22、根據每個所述數據特征的絕對偏差總和與指標沖突性,確定每個數據特征的選址權重。
23、可選的,所述根據所述選址權重,與所述備選區域內降維后的數據特征,計算所述備選區域的選址得分包括:
24、根據所述選址權重與降維后的數據特征,計算每個數據特征的選址得分;其中,不同數據特征對應不同的選址權重;
25、將每個數據特征的選址得分做和,得到所述備選區域的選址得分。
26、可選的,在根據所述選址權重,與所述備選區域內降維后的數據特征,計算所述備選區域的選址得分之后,所述方法還包括:
27、使用預設聚類算法,根據所述備選區域的選址得分與所備選區域內的數據特征的選址得分,確定所述備選區域的區域類別;其中,所述區域類別中至少包含一個備選區域;
28、根據所述區域類別內備選區域的選址得分,確定所述區域類別的得分范圍,并根據所述得分范圍,確定各個備選區域的建議選址數量;其中,所述得分范圍與建議選址數量之間的對應關系為提前配置好的。
29、根據本公開的第二方面,提供了一種商鋪選址裝置,包括:
30、降維單元,用于基于預設降維算法,對備選區域內的數據特征進行降維;其中,所述備選區域為根據預設距離閾值對現實世界劃分得到的;一個備選區域內至少包括兩個數據特征;
31、第一計算單元,用于根據數據特征對整體選址性能的影響度與不同數據特征之間的沖突性,計算分別計算每個數據特征的選址權重;
32、第二計算單元,用于根據所述選址權重,與所述備選區域內降維后的數據特征,計算所述備選區域的選址得分;其中,不同選址得分對應不同建議選址數量,所述選址得分與所述建議選址數量之間的對應的關系為提前配置得到的。
33、可選的,所述備選區域內包含預設數量的數據特征,所述降維單元還用于:
34、根據不同備選區域內的數據特征的空間距離,構建距離矩陣;
35、根據所述備選區域間的空間距離,確定各備選區域的鄰域個數;其中,不同備選區域的鄰域個數不同;
36、根據預設公式,提取局部結構特征,并根據提取出的局部結構特征生成對角矩陣;其中,所述對角矩陣中的對角線上的元素為所述局部結構特征;
37、根據所述對角矩陣計算與所述預設數量的矩陣特征值與矩陣向量;其中,所述矩陣特征值與所述矩陣向量一一對應;
38、根據所述矩陣特征值與所述矩陣向量,構建預設數量維度空間,并將所述備選區域內的全部數據特征映射至所述預設數量的維度空間中,將所述備選區域內的全部數據特征降維至所述預設數量維度。
39、可選的,所述降維單元還用于:
40、根據各個備選區域間的距離,計算各所述備選區域間的平均距離;
41、根據各個備選區域之間的距離與平均距離,分別確定各所述備選區域的鄰域;其中,所述鄰域為與備選區域的距離小于所述平均距離的其他備選區域;
42、根據各所述備選區域的鄰域數量,并計算各所述備選區域的平均鄰域數量;
43、根據各個備選區域的鄰域數量與所述平均鄰域數量,調整各所述備選區域的鄰域數量;其中,鄰域數量小于平均鄰域數量時,增加所述備選區域的鄰域數量;鄰域數量大于平均鄰域數量時,減少所述備選區域的鄰域數量。
44、可選的,所述第一計算單元還用于:
45、構建決策矩陣,并對所述決策矩陣進行歸一化處理;其中,所述決策矩陣的橫坐標為備選區域,縱坐標為數據特征;
46、計算所述備選區域的第一整體性能值,并計算所述備選區域去除每個數據特征后的第二整體性能值;
47、根據所述第一整體性能值與所述第二整體性能值,計算每個數據特征值的絕對偏差總和;
48、根據各數據特征間的距離相關系數,確定各所述數據特征間的指標沖突性;
49、根據每個所述數據特征的絕對偏差總和與指標沖突性,確定每個數據特征的選址權重。
50、可選的,所述第二計算單元還用于:
51、根據所述選址權重與降維后的數據特征,計算每個數據特征的選址得分;其中,不同數據特征對應不同的選址權重;
52、將每個數據特征的選址得分做和,得到所述備選區域的選址得分。
53、可選的,在第二計算單元之后,所述裝置還包括:
54、第一確定單元,用于使用預設聚類算法,根據所述備選區域的選址得分與所備選區域內的數據特征的選址得分,確定所述備選區域的區域類別;其中,所述區域類別中至少包含一個備選區域;
55、第二確定單元,用于根據所述區域類別內備選區域的選址得分,確定所述區域類別的得分范圍,并根據所述得分范圍,確定各個備選區域的建議選址數量;
56、其中,所述得分范圍與建議選址數量之間的對應關系為提前配置好的。
57、根據本公開的第三方面,提供了一種電子設備,包括:
58、至少一個處理器;以及
59、與所述至少一個處理器通信連接的存儲器;其中,
60、所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行前述第一方面所述的方法。
61、根據本公開的第四方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執行前述第一方面所述的方法。
62、根據本公開的第五方面,提供了一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現如前述第一方面所述的方法。
63、本公開提供的商鋪選址方法、裝置、電子設備和存儲介質,主要技術方案包括:首先,基于預設降維算法,對備選區域內的數據特征進行降維;其中,所述備選區域為根據預設距離閾值對現實世界劃分得到的;一個備選區域內至少包括兩個數據特征;其次,根據數據特征對整體選址性能的影響度與不同數據特征之間的沖突性,計算分別計算每個數據特征的選址權重;最后,根據所述選址權重,與所述備選區域內降維后的數據特征,計算所述備選區域的選址得分;其中,不同選址得分對應不同建議選址數量,所述選址得分與所述建議選址數量之間的對應的關系為提前配置得到的。與相關技術相比,本技術實施例通過引入多種機器學習算法,結合數據挖掘技術,挖掘分析不同備選區域的選址得分,代替了人工調研及簡單數據分析模型的方式,提高了選址結果的客觀性,增強了選址結果的說服力,并且減低了人力成本,提升了選址效率。
64、應當理解,本部分所描述的內容并非旨在標識本技術的實施例的關鍵或重要特征,也不用于限制本技術的范圍。本技術的其它特征將通過以下的說明書而變得容易理解。