2018年6月1日 星期五

‧ 2018\06\01\3S Market Daily 智慧產業新聞


3S Market deliver Smart and Valuable information for Business


                                                                                                                                                                                                                 

.AI 行銷的下一戰場:以時間序列和空間軌跡,來探索用戶未知需求

Can AI Predict the Future?





leiphone 作者:AI金融评论


AI金融評論報導,5月26日,對岸中國阿里雲創始人王堅博士,與科技圈11位志願發起人,共同組織了年度科技創新活動2050大會。

在下午由氪信科技CEO朱明傑出品的「人工智慧重構智慧金融」專題論壇上,微軟全球執行副總裁、美國工程院院士、前微軟亞洲研究院院長沈向洋,前IDG榮譽合伙人、火山石資本創始人章蘇陽,招商局集團創投總經理呂克儉等皆受邀出席。

AI营销的下一战场:以时间序列和空间轨迹来探索用户未知需求
上海交通大學安泰經管學院助理教授李春

期間,上海交通大學安泰經管學院助理教授李春曉受邀進行了「時空序列,如何影響行銷和反欺詐」演講。她主要介紹了AI在商業中的應用。

比如AI是如何影響商家行銷的,並給出了可以如何更好地管理公司的建議。據記者瞭解,她的研究領域在於數據科學,和行為經濟學的交叉領域,聚焦於研究數位技術下的平台策略、用戶行為、財務激勵、和數據安全等。

以下是記者編撰的演講原文,經過李春曉確認:

People Analytics——探索未知需求
用三個典型的哲學問題先開始:你是誰?從哪兒來?到哪兒去?

這三個問題很難回答。我們在生活中會接觸到形形色色的人——用戶、客戶、僱員、合作夥伴,這三個問題時時刻刻地環繞在我們的心頭,這就是 People Analytics人員,分析一直孜孜不倦探討的問題。

再問幾個接地氣的問題:你知道234天以後的下午2點30分,你會在哪裡,做什麼?你知道下一次職業變換在什麼時候,是跳槽還是升職。這個問題不只你關心,你的老闆、你的下屬都非常關心。不管我們知不知道,但是AI知道。

之所以會談到這幾個問題,是因為最近做了研究:不管你自以為的行動有多少自發性,我們都能夠找出線索,並預測你的路徑。


絕大多數人都是非常可預測的,因為我們是習慣的生物。我們的行為,模式和習慣受到很大因素的影響,挑戰在於它跨越了多個學科,比如心理學、腦科學、人類學,社會學,基因學,教育學等。

所以 People Analytics 做的,就是把所有這些學科的研究成果放在一起,讓把大數據和分析結合在一起,利用這些行為和習慣,為我們創造了線索,為公司決策、行銷和品牌做出真正有趣的見解。

我們生活在數據的社會裡,我們遞交的簡歷、合作過的夥伴、就讀的大學、是誰的孩子、誰是我們的孩子,這一條條都集中地記錄在數位設備上,同時建構成了一條條,關於你、我、他的數位線索,再由people analytics將這些整合,還原出獨一無二的畫像,但看過的人卻比你的朋友更懂你,都會跟你說:對過眼神,就是你。

我們做的很多用戶分析,是根據人們的基礎數據、社交數據和歷史消費,讓公司確定用戶的已知需求和已知模式。過去十幾年來我們一直在這個戰場上,已經碩果累累。


我認為下一個戰場,是要探求用戶的未知需求,探求用戶的隱藏模式和偏好。主要是因為我們想在更合適的時機、更合適的地點、更合適的方式,跟用戶接觸、行銷,創造更大的價值。

天時地利人和不只是藝術,更是一門科學,這就是People analytics要做的,在大量的人員數據的基礎上,添加時間序列、空間軌跡,結合人工智能的技術,去觸碰用戶隱藏的認知和思維,你會意識到這是一個巨大的機會。

接下來我將用四個案例,給大家簡化一下流程,深入地分析一下,如何利用AI來增加零售界、金融界、服務界的行銷能力。

行銷的雙重維度:時間+位置
「從哪裡來,到哪裡去」這兩個問題已經強調了地點的重要性,GPS相關技術重新定義了地點,而精確的位置數據,開啓了即時行銷的大門。

大家下飛機下高鐵到杭州時,很多APP會推送「杭州歡迎您」,或者推薦吃喝玩樂的地方。但很多人都沒有去。因為訊息太有限,僅僅靠位置資訊的推送,是不夠完整不夠精確。所以關聯內容是很重要的。

當我們把時間維度,加到位置上的時候,視野裡會呈現出更清晰的上下文環境。比如說你在星期一的下午2點走在大街上,這個時候你的左手邊一個音樂酒吧,你的右手邊是星巴克咖啡,這個時候手機上推送了兩條優惠券,你打開一看發現是酒吧啤酒半價,和一杯星巴克星冰樂的半價。

這個時候,如果你不想把週一下午浪費的話,你會選擇什麼?星巴克。那換一個時間呢?如果是晚上8點半你同樣收到兩條推送的時候,很有可能你們會去兌換酒吧的優惠券,和同事們喝上幾杯。


所以在這種情況下,時間非常關鍵,它不僅僅是位置。我們的商家已經做了很多基於位置的廣告,但這不夠,用戶有不同的人格,即使同一個地點,不同時段的需求,也是不同的,你需要把時間和地點結合起來,然後看人的行為!

天普大學的Luo xueming教授,就行銷的不同時間,產生的不同效果,做了詳細的隨機實地實驗。

再比如,我們和某公司也有過研究,若先增加時間因素,行銷效果會提升,再加地點地理要素,效果也會有所提升。如果同時添加時間和地點,效果提升的幅度更明顯,這就是時間維度的行銷

基於空序的行銷
更深一層考慮,僅有位置的行銷,除了缺少時間概念,還只是靜態的、「守株待兔」式的銷模式,而我們需要更加靈活。

AI营销的下一战场:以时间序列和空间轨迹来探索用户未知需求
基於空序的行銷,購物商城實

舉個例子,在一個大型的購物中心,你站在蘋果店門口,如果沒有其他地理資訊位置,只能基於透過位置進行行銷,可能就會認為你要去逛蘋果店,會給你推送一條,蘋果店相關的訊息或者優惠券。

其實這裡有一個很大的問題——因為你站在蘋果店門口,不代表你就想進去,不代表你就是他的顧客,有可能是你和你的朋友約定好,我們在蘋果的門口見。所以我們需要有不同於地理的數據,和更多的訊息。

另外,也如Anindya Ghose教授的暢銷新書《點擊》(已譯成多國文字)裡闡述的,如果我們知道一個人,剛去了一家華為店,然後又去了小米店,之後路過了三星,繞了一圈最後到達了蘋果店。

我們會更瞭解,這個人的思維模式,會瞭解他的軌跡,更瞭解他究竟為什麼,站在蘋果店門口,以及對什麼樣的品牌,可能產生興趣。

AI营销的下一战场:以时间序列和空间轨迹来探索用户未知需求
空序銷碾壓基於地點和隨機的行

為了研究這種基於軌跡的行銷策略的有效性,來自NYU的Anindya Ghose教授、CMU的Beibei Li教授,一起做了隨機實地實驗,來觀測空序的行銷,是否會有非常好的效果。

研究發現空序行銷,直接碾壓了基於地點,和基於隨機的行銷,更加碾壓了不行銷的效果。

我們可以看到有更高的優惠券回覆率,更快的優惠券兌換率,同時增加了每一個專賣店的流量。就是說,顧客在專賣店消費更高,在店裡待的時間更短,對商場來說,整體實現了行銷的巨大飛躍。

空間軌跡數據,不止是行銷利器,與投資、房地產、實體店規劃、城市經濟行為也息息相關。

我和Missouri Tech的Yanjie Fu教授,最新的研究是用集體學習的方法,對大規模異構人口,流動性數據進行了建模,來捕捉住宅社區,城市功能,時間效應和用戶流動模式之間的關係。

我們的研究發現,人群的空間軌跡,可以用來理解城市形態,對社會經濟行為的影響,如房地產和餐廳的受歡迎程度等等,這個研究可以幫助政府,規劃適當的城市功能組合,以促進城市發展和促進本地業務發展。

基於時序的行銷
剛才的空間軌跡,是把地點延長成了一條線,我們送出優惠券以後,在現在這個小時和下一小時,用戶的需求是非常類似的,並沒有很大的改變——他可以這個小時去逛,也可以下一個小時。但是現在設想另外一個可能性,用戶在不同的時段裡,需要的推薦是不同的,會產生什麼樣的效果?

AI营销的下一战场:以时间序列和空间轨迹来探索用户未知需求
基於時序的行銷,以旅遊度假為

舉個例子,這是一個旅遊度假的上下文,假設時間單元是天,在例子裡就是5天。我們根據歷史記錄,可以看到用戶去了機場、博物館、劇院、購物中心、遊樂場和海灘,我們稱這些地點為POI也就是興趣點。

如果我們要對第四個人進行第四天和第五天的推薦,我們應該推薦什麼?傳統的推薦系統,會先在第四天和第五天推薦海灘,因為海灘和博物館一起出現的頻率更高,相關性更大。

還有一些推薦系統,會在第四天和第五天的時候,都推薦遊樂場,因為遊樂場最可能排在劇院後面。但基於用戶的需求,我們最應該在第四天推薦遊樂場,第五天推薦沙灘。但我們原始的推薦系統算法,就是這麼傻。

用戶選擇的時間序列,體現了用戶的偏好,在研究裡有兩個難點:

  • 首先,要根據POI之間的時間間隔,和時間序列來進行建模。 
  • 其次,歷史上連續check-in數據,是非常鬆散的。 鬆散的數據,極大地降低機器學習的效率和算力。

AI营销的下一战场:以时间序列和空间轨迹来探索用户未知需求
基於時序的推薦系統流程結構圖

那解決方案是怎樣呢?

Rutgers的Hui Xiong教授,研究了基於時序的推薦系統的流程結構圖。透過從用戶歷史check-in序列中,提取序列模式,來建構POI過渡立方體(立方體是用於測量時序偏好)。

接著根據用戶check in的頻率,建構用戶的興趣偏好。然後同時模擬和學習用戶的興趣,以及序列的偏好。

Low-rank graph construction model可以很好地解決,稀疏觀測來估計分布的挑戰。同時建立bi-weighted graph,來評定用戶興趣,最後對潛在興趣點,進行排名和評估建立了POI實際系統。用實際數據來檢測的成果顯示,與現有的POI推薦系統不同,推薦系統可以透過捕獲,用戶演變的順序偏好,在未來的特定時間段內,提供有效的POI推薦。


時空序列控制公司風險
事實上,時空序列還有更多的用途,比如幫助公司控制風險。公司財產損失很大程度上,來源於金融欺詐,主要有兩方面威脅——外部威脅和內部威脅。

外部的威脅包括投資欺詐、信用卡欺詐、身份盜竊等等;內部威脅諸如金融偷竊,會計造假,洗錢,抵押欺詐,內部交易和市場操縱等等。外部風控業內已經做得非常領先,那我們把注意力轉向內部欺詐。

值得注意的是,內部的金融威脅實際上佔主流,75%的欺詐來源於內部。當你的公司運轉很好,但是營收不佳的時候,你就要警惕公司是否存在異常了,典型的異常包括密報、高員工流動率、低士氣、不尋常不合理不一致的行為等等。

AI营销的下一战场:以时间序列和空间轨迹来探索用户未知需求
基於時序的報表挖

介紹兩個欺詐檢測的方法:

基於時序的報表挖掘
第一個是根據持續報表和記錄挖掘,總共分15步:

1)將支付記錄與授權供應商列表對應

2)將供應商與僱員對應

3)將機構銀行賬戶序號與僱員銀行賬戶序號對應

4)將遞送地址與僱員地址對應

5)確定與往年記錄比較有較大變化的情況

6)檢測查找重復的發票

7)檢測查找重覆的支付記錄

8)檢測可能缺失的支票

9)檢驗在break points或較低的金額數量

10)檢測被拆分的發票

11)檢測查找較大的折扣

12)檢查大額的支付記錄

13)分析支付日期+確定支付數額有較大方差的供應商

14)抽取異常的交易

15)提取授權和付款記錄

前4步將數據關聯起來,把支付記錄、供應商、僱員、機構銀行賬戶、地址對應之間做關聯,以方便進行Multi-source Joint Learning聯合學習。

第5步是籠統地用文本挖掘,篩查大的變動。第6到第10項處理髮票相關的報表記錄,挖掘,重覆、缺失、拆分等等。在這裡我們會建立一個時序的模型,控制時間上的因素比如季節性趨勢,同時用地點作為fix effect,固定變量。第11到14步,是針對大額和異常的分析,第15步是個體抽樣。


基於行為軌跡的挖掘
下面介紹基於還有對於行為軌跡的挖掘,比如說僱員出現在不該出現的位置,出現在了不該出現的時間。打比方說小張一直是非常非常守時的人,他有一個很好的時間表。

早上8點鐘上班,下午5點鐘下班,從來都是這樣。突然有一天我發現他非常努力,連續3天加班加到9點,這樣的情況就是異常情況了。我們應該用數據分析看一下他在做什麼,他是不是調用了不該調用的數據庫,或者數據庫有沒有可能被篡改了,這些都是可以用行為軌跡分析倆挖掘到的。


另外,內部風控裡的會計造假、或者人員的策略行為,是可以透過在公司內建立機制,來做預防和早期干預的

我和Arizona State University的顧彬教授,最近的研究發現,社會成本會被人員考慮再造假成本裡。當員工曝露於社會網路中,當人員越是處於社交網路相對中心位置、越是被關注、或者積極與他人進行社交互動的狀況下,策略行為會有所降低。

企業相應可以採取的辦法,是增加企業內的社交網路分析,加強員工間的溝通,報表和記錄盡量多人合作完成,並相互檢查確認,同時對於欺詐報表,也進行網路分析和追溯。
今天的Take away只是說,我們在孜孜不倦地探索,用戶已知和未知的需求,關鍵要素是時間序列和空間軌跡,把握住這兩個要點,將會很大程度地提升行銷效果,同時在內部這兩個因素,也是控制內部風險非常好的手段。