網友「廖師傅廖師傅」的不滿,幾乎「見者有份」,激起了很多人對自己經歷的講訴。
微博網友「廖師傅廖師傅」自述了被大數據「殺熟」的經歷我跟家人讀書都有個「順藤摸瓜」的毛病,經常順著一本書,能帶出一串來,難免時常會遇到稀奇古怪已經絕版的書。在搜這類稀奇古怪絕版書的過程中,網站返回給我的結果,往往售價幾十刀,而賣家不是收藏范就是文藝風;與此同時,返回給我家人的結果,售價則通常在1分到1刀之間,加上從2、3刀到8、9刀不等的郵費,明顯就是讓買家出運費把廢紙拉走,幫忙騰地方。
我們倆都是對模式(pattern)敏感的人,很快這個經濟學家嘴裡的「價格差異」,在我這裡不知不覺簡直變成了「智商差異」。顯然我被那些網站貼上了「人傻錢多快來懵」的標籤,而他則成了「又窮又精搞不定」的典範。
這就是傳說中神奇的User Profiling乾的好事。
User profiling,可以說成給用戶畫輪廓,對用戶分析,將用戶歸檔,等等,它極大地依賴數據。這個數據包括了用戶的各種網路行為:愛去的網站,愛點擊的圖標,通常是買「最新到貨」,還是直奔「換季優惠」……這些都構成我們作為用戶的輪廓。商家拿這個profiing來做什麼呢?光鮮的說法是,更好地為用戶服務,再好聽些,是提供更精準更個性化的服務。
然而從上面的例子不難看出,它更主要的用途,其實是為每個用戶私家定製獨享價格,從而在每一筆交易中實現收益最大化。
從這個意義上看,我們不久前還在沾沾自喜於如今可以滑鼠一點就貨比三家,從價格到服務,充分的信息和豐富的選擇,讓消費者真的有了上帝的感覺。一轉眼卻發現,商家已經反過來在挑選我們了。
商家之所以能夠這麼做――同樣的商品和服務面對不同客戶有不同價格――其立足點在於,每個人的心裡存在的不同上限。User profiling就用來幫商家找到每個人的這個「痛點」上限,這從本質上跟傳統市場的討價還價無異,只不過傳統市場是在討和還的交流過程中來尋求摸索彼此的「痛點」,而電商則是通過「數據」或者「大數據」這個工具來實現。
動態價格,或者說價格差異,在有些場合是雙贏的,比如紅眼航班,航空公司既減少了空座率,對價格敏感而時間靈活的旅客也省了錢。但是當人們並不知道有更好的價格存在,或者知道了卻因為種種原因而不能方便享受到更好的價格時,這樣的價格差異就是對消費者的傷害。
《華爾街日報》2012年有過一篇調查報道,調查發現各主要電商都會利用地理位置來確定不同的價格。猛的一想,這讓我升起了一種希望,以為這麼做可以讓低收入地區的人群受益,可我想錯了。恰恰相反,高收入地區調查過程中所顯示的價格,遠遠好過低收入地區,其原因是,貧困區商業不發達,沒有太多零售店與電商競爭,因此他們用不著提供低價也能讓客戶掏腰包。
但是真正讓消費者擔心的,恐怕還不是這些我們已經看見的:「廖師傅廖師傅」揭露的,和《華爾街日報》報道的。我們不安的,是背後究竟還有多少我們尚不知道的「貓膩」。
在享受互聯網的便利和「免費」服務時,可能忽略了一個古老的常識,那就是「天下沒有免費午餐」。儘管很多人可能也聽說過,互聯網經濟的商業模型是通過看似免費的服務來吸引用戶,從而收集、監測數據,最終將這些信息變現。但是接下來的問題是,那些數據拿去做什麼了?最常見的回答是,用到了精準廣告投放,以及差別定價上。
差別定價的英文,由於與各種歧視用了同一個詞,因而經常被誤讀為歧視定價,事實上按照維基的定義,它是微觀經濟學領域內的一種定價策略,同一個商家將同種商品或極其類似的商品在不同的市場上以不同價格來交易,制定的基礎一般是不同市場對價格的接受程度。所以它既無涉歧視,也不違法。
但跟「廖師傅廖師傅」所激起的反應一樣,這事自電商一開始到近年普及以來,每隔幾年就會掀起一波激烈的討論,引發媒體的跟蹤調查,甚至學界的研究課題。
筆者對比了美國東北大學和加泰羅尼亞理工大學的兩篇論文發現,地理因素是這些電商區別定價的主要參數,而地理因素中,某一用戶所處的位置(無論是由郵編,還是有IP地址來確定)周邊多少公里內,有無實體店競爭對手,又最為顯著。其次是用戶的經濟狀況――可能是實際的經濟狀況,也可能是消費習慣所表現出來的經濟狀況,比如在買一台吸塵器之前,你是否已經瀏覽了好幾個不同的電商網站,搜索過該產品的優惠券等等,其結果極有可能導致1000元出頭的商品,出現100元左右的價格差異。此外,用戶所使用的平台以及操作系統、瀏覽器等等,在加泰羅尼亞理工大學的研究結果中,表現出不影響價格;而晚了四年進行的美國東北大學的研究則顯示,用戶所使用的操作系統、瀏覽器已成為明顯影響因素。
除差別定價外,搜索結果差異,是電商獲取更大營業收入的另一手段。與差別定價不一樣,當不同用戶搜索某一類商品時,網站根據所該用戶的profile,返回給不同用戶可能接受的不同價位區間的產品,比如同樣的書,給我推薦的是「收藏品」,給我家人推薦的則是「廢品」。這樣的推薦,對用戶的最後選擇通常產生極大的影響,消費行為通常極少會發生在推薦頁面的第二頁之後。因此無論是通用搜索引擎還是電商自帶的搜索,是他們(或者說他們制定的演算法)決定了這一差異。
據統計門戶statista.com,2017年全球電商銷售額佔全球零售銷售總額的10.1%,預計這一數字到2021年將達到15.5%,如果聚焦於特定商品種類例如服裝、書籍、辦公用品等,只能更大。影響面之大,難怪互聯網巨頭對用戶數據的收集,電商定價演算法的不透明性所引發的不安和討論越來越多。
首先,設計和實現欠佳的演算法會導致意外(甚至荒唐)價格的出現。最著名的例子是2011年,加州大學伯克利分校的生物學家Michael Eisen在自己的博客上發表了一篇文章,說他讓學生去買一本1992年出版的關於果蠅的經典教科書,該書當時已絕版,亞馬遜共列出17本,其中15本是二手書,價格大約都在30多刀,另外2本是新書,一本標價170多萬,另一本標價210多萬。在教授當天的不斷「點擊」刺激下,這兩本天價書的價格繼續瘋漲,但是無論怎麼漲,他們之間的價格關係每天一次按照某兩個固定值在調整,保持著恆定。這說明一個問題,背後有演算法在維持一個恆定的競爭對手價格。直到幾個星期後,一本漲到1800多萬,另一本漲到2300多萬,才終於有人發現。當然這只是極端的程序錯誤個例,但它提醒了我們,公眾和監管部門對演算法定價之流行,而我們對其知之甚少這兩個事實。

上圖:開出天價的果蠅教科書
還是以亞馬遜為例,賣家們究竟運用了怎樣的演算法定價策略,這些策略有多普及,以及最終它們對消費者的購物怎樣產生影響,才是我們迫切想要了解的事。亞馬遜作為世界最大的電商網站,一個真正的市場平台,並且提供專門支持演算法定價的應用開發者平台API,所以理解了亞馬遜的做法,基本上也就摸到了整個電商的脈絡。但是除了依靠研究人員採集公開信息進行調查、分析,作出的推論外,公眾並無更好的途徑對其定價演算法得到明確的了解。
美國東北大學的那項為期四個月的研究,選擇了1641種最受歡迎的產品,每個產品選擇了銷量前20位的賣家,每隔25分鐘採集一次信息,信息包括價格、評分等。
首先了解的,當然是它的所謂「黃金購物車」Buy Box,這是每個賣家都想要搶佔的位置。根據統計數據顯示,有82%的亞馬遜交易都是通過這一「黃金購物車」完成。它出現在每個產品的頁面,包括產品價格、物流信息、賣家名稱,以及最誘人的:購買鍵。在大部分產品都有不止一個賣家的情況下,誰進入這個Buy Box,成為該產品的默認賣家,由亞馬遜的演算法決定。而Buy Box演算法所採用的具體特性和權重,屬於平台機密。
儘管亞馬遜也公開過一點關於哪些特性被Buy Box演算法所採用,但是這些公開的是否完整,以及每個指標的權重多少,都無從得知。各種賣家進駐指南里,宣稱自己熟諳該演算法的,基本也都是吹牛。從理論上說,如果一個產品有 n 個賣家,其價格為 P = {p1, ・ ・ ・ , pn},Buy Box演算法就是一個函數B(P) → pi, pi ∈ P,其他賣家所提供的相應商品便被降級至後續頁面。
近一兩年來,不時有通過機器學習手段來模擬的嘗試,但至目前為止,也都是嘗試。其次,了解這些賣家各自的動態定價。最後,對演算法定價的賣家和非演算法定價的賣家進行了比較,演算法定價的賣家的銷售明顯強於非演算法定價的賣家:高評分,即便價格並非最低,也有更高几率進入Buy Box。
讀完媒體的跟蹤報道,和幾個大學的研究,基本上就是兩個字:絕望。除了一大堆摸不著門道的貓膩事件,和一篇又一篇的演算法分析證明該平台機密無從一窺全貌之外,可做的事情似乎只有等待:等立法要求透明。
不過這倒讓我想起了一個故事。普林斯頓大學教授奧利・艾森菲特(Orally Ashenfelter)是一名經濟學家,但他酷愛葡萄酒,愛的不光是品酒,更讓他感興趣的,是成就一瓶(批)好酒背後的因素。在經濟學家的眼裡,買紅酒無異於投資,而如何確保投資成功是經濟學家的一種本能。他的日常工作是從大量數據中尋找出隱藏信息。於是他試圖也從大量數據中找出波爾多酒的秘密來,是哪些因素,怎樣確定了紅酒的品質(也就是日後的價格)?最終,他用1952年至1980年間這28年的數據,建立了一個統計模型,最後簡化為這樣公式:
紅酒品質 = 12.145 + 0.00117 冬季降雨量 + 0.0614 生長季平均溫度 - 0.00386 收貨季降雨量
艾森菲特對自己的模型十分自信,並據此打破了品酒界對1986年酒的神秘崇拜。他的這一做法招致了紅酒行業的公憤。一時間各權威品酒雜誌、權威品酒人紛紛對他進行取笑和攻擊。但他相信數據,相信自己的研究手段,相信農作物的品質在後期技術成熟的情況下,產品的優劣就是取決於年復一年的氣候,他更相信歷史天氣數據與酒價格之間的相關性。於是在一片嘲笑中,艾森菲特把數據代入上面的公式,勇敢斷言了1989年和1990年兩年的波爾多酒將成為「世紀之酒」,價格將會超過過去35年裡任何一年出產的酒。這一推斷在當時把他自己搞成了「世紀笑料」。如今回望,他的預測卻是驚人地準確。
他捅破了一個葡萄酒賣家以及葡萄酒品鑒作家們不願意公眾了解的秘密,威脅到了品酒界的權威和神秘和利益。但是,這世上不存在密不透風的牆,就像電商定價演算法的神秘一樣。數據是眼下電商的法寶、武器,似乎令消費者無能為力;但是艾森菲特的故事告訴我們,當年也是數據,去掉了品酒師身上裹的那一層神秘。
參考文獻:
1. Le Chen,Alan Mislove,and Christo Wilson. An Empirical Analysis of Algorithmic Pricing on Amazon Marketplace. International World Wide Web Conference Committee (IW3C2). 2016
2. Jakub Mikiansy, László Gyarmati, Vijay Erramilli, and Nikolaos Laoutaris. Detecting price and search discrimination on the Internet. 2012