華文網

門店選址是藝術與科學的結合 看看地理大資料專家怎麼說

IBM零售垂直領域合夥人陳果在朋友圈轉發了一篇文章,題目叫《Artificial Intelligence in Retail》,講述的是人工智慧在零售領域裡的應用。

其中的第一條就是門店選址的最優化。因為從古至今,線下店策劃最先考慮的因素就是店鋪的位置。

文章指出,採用人工智慧的方法,結合歷史銷售資料,人口經濟資料,到競爭者的距離等資料可以把選址模型推到一個新的高度。作為在這一領域打拼多年的我,覺得有必要對這一話題展開討論。

AI在選址的應用並不是一個偶然,它是隨著技術的發展和行業人才的變化,在最近這一年突然變成了一個火熱的話題。

在美國,傳統用地圖和資料做零售企業做選址和市場的人,

大多是地理系畢業的,他們有著豐富的地理資訊系統軟體操作能力和對地理模型的理解。選址的模型多半採用空間交互模型這一地理人最容易理解的模型。最經典的組成部分莫過於距離衰減模型。

此外傳統的統計學範疇的回歸模型和房地產從業者常用的近似模型,也是被市場所接受的。隨著近年來地理資訊學科的教育走向更加交叉的領域,

特別在商學院的市場行銷/財務運營管理等學科裡滲入,越來越多的非地理人進入到這一領域。

他們有著基本的概念,但是沒有很多地理資訊系統軟體操作的經驗。對他們而言,最理想的事情就是在地圖上點個點,然後系統告訴他們預測的結果就行了。其他那些複雜的操作,對他們而言是沒有意義的。

在這種情況下,選址的軟體和模型,就需要足夠的智慧。

就在這個時候,人工智慧,機器學習的概念,突然到了風口,那麼不難想像,在短短的時間裡,大家都開始談論如何能用這些時髦的名詞和選址這個其實不那麼時髦的事情結合在一起。

在美國提到選址的地理資料分析,估計大多數企業已不覺得是什麼新鮮事,那些深化到職業分層的人群資料,要拿到手也並不難。

然而,在中國,地理資料分析卻一直處於瓶頸狀態。一方面是地理資訊的獲取難度高。

作為分析建模的基礎,沒有靠譜的資料,實屬巧婦之無米之炊。另一方面是建模的難度大。海量的初始資料存在精確度問題,沒有相關的經驗,很難把大資料驅動起來。機緣巧合,我們在中國受一家受此困擾多年的國際頂級零售商委託,創新的實踐了一次利用機器學習來選址的工作,所以對這個話題有著自己的見解。

對於零售企業,一切對地理資料的分析,

都要回歸到企業所要服務的“人”身上。而人的畫像應該如何描繪?傳統零售企業的方法是靠問卷調查,街頭派發,有償回答。但這樣的方式導致的結果往往是:問卷的樣本人群大多是“有閑而無錢”的人群。隨著互聯網資料越來越豐富,還需要完全依靠那樣傳統的問卷方式嗎?我們能怎樣打破局面?

古人曰,物物以理相連。一個咖啡廳開在社區的周圍,必然因為這裡的居民離不開他,他也依靠社區的居民生存和擴大規模,這我們稱之為地物人之間“性☆禁☆感”的吸引力。應用在選址上,我們想到的解決方案是打通POI(資訊點),用每個交通社區附近的店鋪特徵來推測居住人群特徵。

附近有多少家咖啡廳?對應著怎樣消費力的人群?這些人群中有多少是零售商的目標群體?如何把地物特徵與人群特徵聯繫起來?

這些是我們方案設計重點耕耘的工作。而這種分析方法,是傳統地理資訊系統所缺的。移動互聯時代,網路上保存的資訊上千萬種,資料分析的發展空間大大提高。囿于其分析原理,傳統的模型只能加入少量的指標。而我們使用機器學習曾經同時分析兩百多個指標,完成多指標和它們之間複雜關係的分析,做到了傳統方法無法達到的事情,不僅有量的提高,還有質的飛躍。

在幫助這家大型零售商進行選址的過程中,我們使用了機器學習預測模型,聰明的演算法機制處理了十一個城市,數千萬POI地理位置資料。人口、交通、房價、消費等等,在系統螢幕上一一閃現計算。

除了從大量資料中得出現實情況的規律,我們運用隨機森林模型還能進行未知數據的預測。通過早期大量資料的訓練,我們找到了最優“方程”(廣義概念)。這樣便能基於已有資料(引數),計算出零售商感興趣的預測值,如客群規模、潛在銷量等。

我們首先從區域潛力評估入手,得出城市發展方向的趨勢判斷,在零售商給出優勢區域裡幾個選址方案後,我們再提供具體店址評估報告輔助選址決策。經過長期的研究和模型訓練,我們對地理資料的機器學習流程和自動化方案有了深刻的體會,在分析速度和精度上已達到行業內頂尖水準。

在專案進程中,合作的零售商也發現了一些讓人驚喜的結果:很多之前靠經驗積累,不明所以的判斷,也在模型中一一得以驗證。當然我們的分析也提供了之前無法洞察的大量資訊。

目前我們正努力實現標籤化地理區域,當企業有相關需求時,只需告訴我們需求和判斷因數權重,就可以快速匯出分析報告和結果。再下一步我們還考慮做成人工智慧系統提供SaaS服務,使用者輸入資料,選擇模型,便能快速到處輔助決策的結論報告。

然而,是否可以放心地說,AI在選址優化的工作中已經徹底打通關節,無所不能了嗎?我的回答是:且慢。

首先,一個門店是否成功,除了周邊的消費者特性,還取決於地產本身的品質,比如是否方便進入,門頭是否足夠醒目,房東可以提供的面積和租金,以及自身人員管理水準等。根據我的經驗,這些因素在中國要占到6成。

機器學習所訓練的,都是那些可以統一獲取,沒有主觀因素的變數。而大量含有主觀因素的變數的採集過程,都是人為篩選的,再智慧的機器,也無法預測一個新的地點的可租面積,無法預測門頭是否從四面八方都可以看見,人工智慧無能為力。

其次,選址裡面一個非常重要的故事是如何避免姐妹門店之間的相互蠶食,特別是連鎖加盟型企業,面對加盟商,如果保證每家店的利益,避免法律訴訟。也許有人會說,我在模型裡加入姐妹門店的距離,不就行了?以下面的地圖為例,這個門店的消費者明顯來自于高速公路的西北面,很少有人從東南過來。假如只考慮距離,而不知道消費者的分佈,則很難告訴零售商,假如新增加一個門店這個區域裡,開在哪裡,不會蠶食現有門店的銷售額。

這種情況,人工智慧依然無法做出判斷,因為幾乎沒有什麼可以拿來學習,就算通過歷史銷售資料找出某些有可能出現蠶食的門店配對,學習的結論對於新的門店,依然毫無意義。這裡就是體現出手機GPS定位資料的重要性了,但和AI無關,我們按下不表。

總結一下:機器學習,對於選址裡的主觀變數,樣本不足,無法用於預測等陷阱無法做到全智慧。就算是機器學習本身,對於資料的選擇也很有講究。比如我們學習的門店,是在已經成熟的社區,而我們要預測的新址,卻是在新區,那麼模型很可能會給出誤差。

這時就有必要拿出社區未成熟時的POI資料進行學習,尋找當時的規律。這一點其實是普適的:對於任何懷揣著機器學習/人工智慧夢想就進入一個全新領域,卻沒有自身完善的資料積累的公司,都是前途叵測。

總體而言,機器學習/人工智慧對零售選址帶來的革新,是積極的。特別在中國,零售從線下轟轟烈烈地走到線上,又從線上回歸到全管道發展服務客戶的商業本質。所以線下的需求肯定還會重啟,特別是社區零售/連鎖餐飲/便利店,開店的需求在持續增長。

特別是中國,在地理資料不開放,資料品質不高,資料階層不多的情況下,我們已經看到新方法可以有效地梳理出一些線索,完成從0到1的變化,這種質變比起AI在美國的模型僅僅是改進,是個飛躍。對於選址專家來說,這一代技術進步,為他們提供了一個智慧慧眼,輔助著他們處理資料,尋找規律。

無論是像IBM這樣的諮詢服務商可以集成到自己零售解決方案,和Watson沃森的結合,還是像CBRE,JLL這樣的房地產代理行,可以集成到自己的租戶管理服務中,還是直接為零售企業的房地產部門做使用,AI技術都提供了多種可能。選址終歸是一個藝術和科學的結合,結合豐富的市場經驗和多方位的方法,這個為“新零售“選址的工作一定會更加高效。

(本文作者陳少飛,為地理大資料專家,運作專業機構GeoHey。)

他也依靠社區的居民生存和擴大規模,這我們稱之為地物人之間“性☆禁☆感”的吸引力。應用在選址上,我們想到的解決方案是打通POI(資訊點),用每個交通社區附近的店鋪特徵來推測居住人群特徵。

附近有多少家咖啡廳?對應著怎樣消費力的人群?這些人群中有多少是零售商的目標群體?如何把地物特徵與人群特徵聯繫起來?

這些是我們方案設計重點耕耘的工作。而這種分析方法,是傳統地理資訊系統所缺的。移動互聯時代,網路上保存的資訊上千萬種,資料分析的發展空間大大提高。囿于其分析原理,傳統的模型只能加入少量的指標。而我們使用機器學習曾經同時分析兩百多個指標,完成多指標和它們之間複雜關係的分析,做到了傳統方法無法達到的事情,不僅有量的提高,還有質的飛躍。

在幫助這家大型零售商進行選址的過程中,我們使用了機器學習預測模型,聰明的演算法機制處理了十一個城市,數千萬POI地理位置資料。人口、交通、房價、消費等等,在系統螢幕上一一閃現計算。

除了從大量資料中得出現實情況的規律,我們運用隨機森林模型還能進行未知數據的預測。通過早期大量資料的訓練,我們找到了最優“方程”(廣義概念)。這樣便能基於已有資料(引數),計算出零售商感興趣的預測值,如客群規模、潛在銷量等。

我們首先從區域潛力評估入手,得出城市發展方向的趨勢判斷,在零售商給出優勢區域裡幾個選址方案後,我們再提供具體店址評估報告輔助選址決策。經過長期的研究和模型訓練,我們對地理資料的機器學習流程和自動化方案有了深刻的體會,在分析速度和精度上已達到行業內頂尖水準。

在專案進程中,合作的零售商也發現了一些讓人驚喜的結果:很多之前靠經驗積累,不明所以的判斷,也在模型中一一得以驗證。當然我們的分析也提供了之前無法洞察的大量資訊。

目前我們正努力實現標籤化地理區域,當企業有相關需求時,只需告訴我們需求和判斷因數權重,就可以快速匯出分析報告和結果。再下一步我們還考慮做成人工智慧系統提供SaaS服務,使用者輸入資料,選擇模型,便能快速到處輔助決策的結論報告。

然而,是否可以放心地說,AI在選址優化的工作中已經徹底打通關節,無所不能了嗎?我的回答是:且慢。

首先,一個門店是否成功,除了周邊的消費者特性,還取決於地產本身的品質,比如是否方便進入,門頭是否足夠醒目,房東可以提供的面積和租金,以及自身人員管理水準等。根據我的經驗,這些因素在中國要占到6成。

機器學習所訓練的,都是那些可以統一獲取,沒有主觀因素的變數。而大量含有主觀因素的變數的採集過程,都是人為篩選的,再智慧的機器,也無法預測一個新的地點的可租面積,無法預測門頭是否從四面八方都可以看見,人工智慧無能為力。

其次,選址裡面一個非常重要的故事是如何避免姐妹門店之間的相互蠶食,特別是連鎖加盟型企業,面對加盟商,如果保證每家店的利益,避免法律訴訟。也許有人會說,我在模型裡加入姐妹門店的距離,不就行了?以下面的地圖為例,這個門店的消費者明顯來自于高速公路的西北面,很少有人從東南過來。假如只考慮距離,而不知道消費者的分佈,則很難告訴零售商,假如新增加一個門店這個區域裡,開在哪裡,不會蠶食現有門店的銷售額。

這種情況,人工智慧依然無法做出判斷,因為幾乎沒有什麼可以拿來學習,就算通過歷史銷售資料找出某些有可能出現蠶食的門店配對,學習的結論對於新的門店,依然毫無意義。這裡就是體現出手機GPS定位資料的重要性了,但和AI無關,我們按下不表。

總結一下:機器學習,對於選址裡的主觀變數,樣本不足,無法用於預測等陷阱無法做到全智慧。就算是機器學習本身,對於資料的選擇也很有講究。比如我們學習的門店,是在已經成熟的社區,而我們要預測的新址,卻是在新區,那麼模型很可能會給出誤差。

這時就有必要拿出社區未成熟時的POI資料進行學習,尋找當時的規律。這一點其實是普適的:對於任何懷揣著機器學習/人工智慧夢想就進入一個全新領域,卻沒有自身完善的資料積累的公司,都是前途叵測。

總體而言,機器學習/人工智慧對零售選址帶來的革新,是積極的。特別在中國,零售從線下轟轟烈烈地走到線上,又從線上回歸到全管道發展服務客戶的商業本質。所以線下的需求肯定還會重啟,特別是社區零售/連鎖餐飲/便利店,開店的需求在持續增長。

特別是中國,在地理資料不開放,資料品質不高,資料階層不多的情況下,我們已經看到新方法可以有效地梳理出一些線索,完成從0到1的變化,這種質變比起AI在美國的模型僅僅是改進,是個飛躍。對於選址專家來說,這一代技術進步,為他們提供了一個智慧慧眼,輔助著他們處理資料,尋找規律。

無論是像IBM這樣的諮詢服務商可以集成到自己零售解決方案,和Watson沃森的結合,還是像CBRE,JLL這樣的房地產代理行,可以集成到自己的租戶管理服務中,還是直接為零售企業的房地產部門做使用,AI技術都提供了多種可能。選址終歸是一個藝術和科學的結合,結合豐富的市場經驗和多方位的方法,這個為“新零售“選址的工作一定會更加高效。

(本文作者陳少飛,為地理大資料專家,運作專業機構GeoHey。)