深度學習改變日常生活？Netflix、雅虎這麼做

週末想在Netflix看場電影？可能，你選擇觀看的電影正受到來自Netflix複雜的AI演算法的影響。同理，由深度學習驅動的預測技術，將越來越便捷地決定你喜歡吃什麼、穿什麼。

而作為消費型科技公司， Netflix、Yelp、Yahoo、StitchFix這4家公司正在利用AI技術改變用戶體驗。

Netflix：動態個性化佈局與視頻縮略圖

從觀看傳統上來講，看電視是一個單向的通信方式——觀眾觀看到的內容是製作者單向傳遞的，但觀眾不向內容製作者提供回饋。

借助數位流媒體技術，觀眾的觀看記錄、滑鼠（手指）點擊，以及檢索詞，都可以讓Netflix瞭解觀眾的偏好設置，並提供更多相關的內容。

2009年， Netflix在公開賽中為外部的程式設計團隊授予了100萬美元的Netflix獎，以改進公司的內部評級預測系統。該獲勝隊伍打敗了原有的演算法，效果提高超過10％。

Tony Jebara

從那時起， Netflix引入了更多先進的機器學習演算法，讓Netflix在排名、佈局、目錄、會員等各個方面，實現全新的預測，並提高個性化水準。今年年初， Netflix公司董事、哥倫比亞電腦科學系教授Tony Jebara在三藩市的RE•WORK深度學習峰會（RE•WORK Deep Learning Summit in San Francisco）上曾解釋說， Netflix不僅可以給用戶推薦更好的電影，而且為每個用戶預測出更好的縮略圖圖像。

一般來說，優化網站上的圖像需要在一段時間內測試A / B兩種替代方案。這種方法的問題是，使用者必須痛苦地等待系統收集資料，之後才能完成最佳決策。在此期間，網站的部分受眾群體會經歷測試過程的非最優變數。這種體驗的喪失被稱為“regret”。

圖片作者：Tony Jebara

為了最大限度地減少regret， Netflix採用動態自我調整測試法，比如多臂老虎機（multi-arm bandit）模型。這種模型能夠在測試期間，動態地將流量轉移為展示最好的廣告素材，並在數學上減少regret。

什麼算是“更好”呢？每個人不盡相同，所以Netflix也將使用者的消費情況納入，以執行個性化的探索/開發優化。如果你經常看喜劇， Netflix將使用羅賓•威廉姆斯的電影《心靈捕手》的封面。

如果用戶喜歡浪漫的言情片， Netflix則會把電影中馬特•達蒙和明妮•德瑞弗接吻的照片推送給用戶。

Yelp使所有地點展示最美麗的照片

一張圖片勝過千言萬語。為了幫助用戶做出正確的餐廳選擇，Yelp的Alex Miller和他的團隊採用深度學習演算法，用來展示最美的用戶照片。

雖然指標（比如喜歡次數和點擊次數）可用於評估照片，但它們也可能因偶然事件出錯。更好的解決方案是，基於固有的內容和特徵（例如景深，對比度和對準）來判斷照片，但是每天有2500萬MAU（每月活躍用戶）給Yelp上傳成千上萬張照片，沒有人能幹得了這些工作。

2017年1月27日，在三藩市舉行的Startup ML會議上，Miller介紹了他的工程團隊如何使用CNN（卷積神經網路）建立一個圖像評分模型。對於照片是不是好的標準可以是，這張照片是不是用單反拍的，這只需要檢測EXIF中繼資料就行了。

Miller的團隊利用它創建出可擴展的訓練資料集，使用單反圖像作為正例，而非單反圖像作為負例。深度學習演算法從訓練資料集中學習了好的照片的品質，並且可以將這些學習應用於所有照片，無論是否是使用單反相機拍攝的。

除了照片品質得分，團隊還添加了篩檢程式和多元化邏輯，這樣，當你查看以某一菜或特色聞名的餐館時，前10張照片不會都是同一主題。

事實勝於雄辯，我們來看看圖片查看結果：

上圖是舊版本，下圖是最新版本

雅虎確保使用者在任何情況

可以選擇最好的表情符號

對於不愛打字的人來說，emoji是最簡單的方法。但是，emoji目前有超過1800種表情符號可供選擇，那麼，用戶怎麼能確定選擇最完美的那個呢？

雅虎的機器學習工程師Stacey Svetlichnaya就在解決這些問題。當使用者撰寫或回復消息時，自動填充建議中應顯示哪些表情呢？理想情況下，使用者希望可以給出前五個表情符號來選擇。

使用表情符號是高度動態的。一些用於替換圖像，還有的用於表達情感……

另一個挑戰是emoji在不同平臺的視覺風格迥然不同，容易造成誤解。

不同平臺的不同emoji表情

Svetlichnaya和雅虎視覺與機器學習團隊（Yahoo Vision & Machine Learning Team）測試了三種不同的方法：

FastText演算法，一種快速線性分類器；

LSTM演算法，一種迴圈神經網路架構；

WordCNN演算法，一種平衡性能與複雜性的卷積網路。

當然，三者之中，FastText不出意外地成為了速度的勝利者，但人們似乎更喜歡LSTM的結果。

雅虎不是唯一將機器學習應用於emoji的公司。2015年，InstagramEngineering刊發了一套由工程師Thomas Dimson撰寫的系列——Emojineering：機器學習表情符號趨勢。

系列文章位址：

https://engineering.instagram.com/emojineering-part-1-machine-learning-for-emoji-trendsmachine-learning-for-emoji-trends-7f5f9cb979ad#.wppfkra4e

StitchFix更快地找到最適合你的時尚

時尚是件很難的事，但StitchFix使造型這件事變得很輕鬆。這家個性化造型創業公司使使用者可以個性化風格，並且每月將精選的服裝和配件送上家門。

定義風格可能是模糊的。畢竟，用戶怎麼能知道一件襯衫是否復古，或者一件衣服是否“性感”但又不顯得“太放蕩”。

Christopher Moody

Moody是StitchFix的資料科學家，擁有統計學、天體物理學和電腦學的多學科學術背景。事實證明，“書呆子”的學術技能在時尚界是大有可為的。

許多深度學習模型是“黑匣子”，使用者很難理解為什麼演算法得出特定的結論。Moody的研究集中於提高模型可解釋性，使人類專家能夠對演算法的相對性能提供回饋。

一種方法是使用t-SNE（t分佈的隨機相鄰嵌入），一種有助於降低視覺化相似物件的維數的方法。許多深度學習模型使用人類不可能概念化的高維資料，維數減少方法將複雜的資料變成更易於理解的二維或三維散點圖。

Moody也是k-SVD方法的狂熱者。 k-SVD是k均值聚類方法的泛化。在高級非技術術語中，聚類分析指將具有類似屬性的物件分組在一起。一旦已經識別出不同的集群，人類專家可以檢查組合，以查看它們是否表現出任何統一的特徵，並添加適當的標籤，例如“背心”。

圖片作者：Christopher Moody