您的位置:首頁>科技>正文

深度學習改變日常生活?Netflix、雅虎這麼做

週末想在Netflix看場電影?可能, 你選擇觀看的電影正受到來自Netflix複雜的AI演算法的影響。 同理, 由深度學習驅動的預測技術, 將越來越便捷地決定你喜歡吃什麼、穿什麼。

而作為消費型科技公司, Netflix、Yelp、Yahoo、StitchFix這4家公司正在利用AI技術改變用戶體驗。

Netflix:動態個性化佈局與視頻縮略圖

從觀看傳統上來講, 看電視是一個單向的通信方式——觀眾觀看到的內容是製作者單向傳遞的, 但觀眾不向內容製作者提供回饋。

借助數位流媒體技術, 觀眾的觀看記錄、滑鼠(手指)點擊, 以及檢索詞, 都可以讓Netflix瞭解觀眾的偏好設置, 並提供更多相關的內容。

2009年, Netflix在公開賽中為外部的程式設計團隊授予了100萬美元的Netflix獎, 以改進公司的內部評級預測系統。 該獲勝隊伍打敗了原有的演算法, 效果提高超過10%。

Tony Jebara

從那時起, Netflix引入了更多先進的機器學習演算法, 讓Netflix在排名、佈局、目錄、會員等各個方面, 實現全新的預測, 並提高個性化水準。 今年年初, Netflix公司董事、哥倫比亞電腦科學系教授Tony Jebara在三藩市的RE•WORK深度學習峰會(RE•WORK Deep Learning Summit in San Francisco)上曾解釋說, Netflix不僅可以給用戶推薦更好的電影, 而且為每個用戶預測出更好的縮略圖圖像。

一般來說, 優化網站上的圖像需要在一段時間內測試A / B兩種替代方案。 這種方法的問題是, 使用者必須痛苦地等待系統收集資料, 之後才能完成最佳決策。 在此期間, 網站的部分受眾群體會經歷測試過程的非最優變數。 這種體驗的喪失被稱為“regret”。

圖片作者:Tony Jebara

為了最大限度地減少regret, Netflix採用動態自我調整測試法, 比如多臂老虎機(multi-arm bandit)模型。 這種模型能夠在測試期間, 動態地將流量轉移為展示最好的廣告素材, 並在數學上減少regret。

什麼算是“更好”呢?每個人不盡相同, 所以Netflix也將使用者的消費情況納入, 以執行個性化的探索/開發優化。 如果你經常看喜劇, Netflix將使用羅賓•威廉姆斯的電影《心靈捕手》的封面。

如果用戶喜歡浪漫的言情片, Netflix則會把電影中馬特•達蒙和明妮•德瑞弗接吻的照片推送給用戶。

Yelp使所有地點展示最美麗的照片

一張圖片勝過千言萬語。為了幫助用戶做出正確的餐廳選擇,Yelp的Alex Miller和他的團隊採用深度學習演算法,用來展示最美的用戶照片。

雖然指標(比如喜歡次數和點擊次數)可用於評估照片,但它們也可能因偶然事件出錯。更好的解決方案是,基於固有的內容和特徵(例如景深,對比度和對準)來判斷照片,但是每天有2500萬MAU(每月活躍用戶)給Yelp上傳成千上萬張照片,沒有人能幹得了這些工作。

2017年1月27日,在三藩市舉行的Startup ML會議上,Miller介紹了他的工程團隊如何使用CNN(卷積神經網路)建立一個圖像評分模型。對於照片是不是好的標準可以是,這張照片是不是用單反拍的,這只需要檢測EXIF中繼資料就行了。

Miller的團隊利用它創建出可擴展的訓練資料集,使用單反圖像作為正例,而非單反圖像作為負例。深度學習演算法從訓練資料集中學習了好的照片的品質,並且可以將這些學習應用於所有照片,無論是否是使用單反相機拍攝的。

除了照片品質得分,團隊還添加了篩檢程式和多元化邏輯,這樣,當你查看以某一菜或特色聞名的餐館時,前10張照片不會都是同一主題。

事實勝於雄辯,我們來看看圖片查看結果:

上圖是舊版本,下圖是最新版本

雅虎確保使用者在任何情況

可以選擇最好的表情符號

對於不愛打字的人來說,emoji是最簡單的方法。但是,emoji目前有超過1800種表情符號可供選擇,那麼,用戶怎麼能確定選擇最完美的那個呢?

雅虎的機器學習工程師Stacey Svetlichnaya就在解決這些問題。當使用者撰寫或回復消息時,自動填充建議中應顯示哪些表情呢?理想情況下,使用者希望可以給出前五個表情符號來選擇。

使用表情符號是高度動態的。一些用於替換圖像,還有的用於表達情感……

另一個挑戰是emoji在不同平臺的視覺風格迥然不同,容易造成誤解。

不同平臺的不同emoji表情

Svetlichnaya和雅虎視覺與機器學習團隊(Yahoo Vision & Machine Learning Team)測試了三種不同的方法:

FastText演算法,一種快速線性分類器;

LSTM演算法,一種迴圈神經網路架構;

WordCNN演算法,一種平衡性能與複雜性的卷積網路。

當然,三者之中,FastText不出意外地成為了速度的勝利者,但人們似乎更喜歡LSTM的結果。

雅虎不是唯一將機器學習應用於emoji的公司。2015年,InstagramEngineering刊發了一套由工程師Thomas Dimson撰寫的系列——Emojineering:機器學習表情符號趨勢。

系列文章位址:

https://engineering.instagram.com/emojineering-part-1-machine-learning-for-emoji-trendsmachine-learning-for-emoji-trends-7f5f9cb979ad#.wppfkra4e

StitchFix更快地找到最適合你的時尚

時尚是件很難的事,但StitchFix使造型這件事變得很輕鬆。這家個性化造型創業公司使使用者可以個性化風格,並且每月將精選的服裝和配件送上家門。

定義風格可能是模糊的。畢竟,用戶怎麼能知道一件襯衫是否復古,或者一件衣服是否“性感”但又不顯得“太放蕩”。

Christopher Moody

Moody是StitchFix的資料科學家,擁有統計學、天體物理學和電腦學的多學科學術背景。事實證明,“書呆子”的學術技能在時尚界是大有可為的。

許多深度學習模型是“黑匣子”,使用者很難理解為什麼演算法得出特定的結論。Moody的研究集中於提高模型可解釋性,使人類專家能夠對演算法的相對性能提供回饋。

一種方法是使用t-SNE(t分佈的隨機相鄰嵌入),一種有助於降低視覺化相似物件的維數的方法。許多深度學習模型使用人類不可能概念化的高維資料,維數減少方法將複雜的資料變成更易於理解的二維或三維散點圖。

Moody也是k-SVD方法的狂熱者。 k-SVD是k均值聚類方法的泛化。在高級非技術術語中,聚類分析指將具有類似屬性的物件分組在一起。一旦已經識別出不同的集群,人類專家可以檢查組合,以查看它們是否表現出任何統一的特徵,並添加適當的標籤,例如“背心”。

圖片作者:Christopher Moody

Yelp使所有地點展示最美麗的照片

一張圖片勝過千言萬語。為了幫助用戶做出正確的餐廳選擇,Yelp的Alex Miller和他的團隊採用深度學習演算法,用來展示最美的用戶照片。

雖然指標(比如喜歡次數和點擊次數)可用於評估照片,但它們也可能因偶然事件出錯。更好的解決方案是,基於固有的內容和特徵(例如景深,對比度和對準)來判斷照片,但是每天有2500萬MAU(每月活躍用戶)給Yelp上傳成千上萬張照片,沒有人能幹得了這些工作。

2017年1月27日,在三藩市舉行的Startup ML會議上,Miller介紹了他的工程團隊如何使用CNN(卷積神經網路)建立一個圖像評分模型。對於照片是不是好的標準可以是,這張照片是不是用單反拍的,這只需要檢測EXIF中繼資料就行了。

Miller的團隊利用它創建出可擴展的訓練資料集,使用單反圖像作為正例,而非單反圖像作為負例。深度學習演算法從訓練資料集中學習了好的照片的品質,並且可以將這些學習應用於所有照片,無論是否是使用單反相機拍攝的。

除了照片品質得分,團隊還添加了篩檢程式和多元化邏輯,這樣,當你查看以某一菜或特色聞名的餐館時,前10張照片不會都是同一主題。

事實勝於雄辯,我們來看看圖片查看結果:

上圖是舊版本,下圖是最新版本

雅虎確保使用者在任何情況

可以選擇最好的表情符號

對於不愛打字的人來說,emoji是最簡單的方法。但是,emoji目前有超過1800種表情符號可供選擇,那麼,用戶怎麼能確定選擇最完美的那個呢?

雅虎的機器學習工程師Stacey Svetlichnaya就在解決這些問題。當使用者撰寫或回復消息時,自動填充建議中應顯示哪些表情呢?理想情況下,使用者希望可以給出前五個表情符號來選擇。

使用表情符號是高度動態的。一些用於替換圖像,還有的用於表達情感……

另一個挑戰是emoji在不同平臺的視覺風格迥然不同,容易造成誤解。

不同平臺的不同emoji表情

Svetlichnaya和雅虎視覺與機器學習團隊(Yahoo Vision & Machine Learning Team)測試了三種不同的方法:

FastText演算法,一種快速線性分類器;

LSTM演算法,一種迴圈神經網路架構;

WordCNN演算法,一種平衡性能與複雜性的卷積網路。

當然,三者之中,FastText不出意外地成為了速度的勝利者,但人們似乎更喜歡LSTM的結果。

雅虎不是唯一將機器學習應用於emoji的公司。2015年,InstagramEngineering刊發了一套由工程師Thomas Dimson撰寫的系列——Emojineering:機器學習表情符號趨勢。

系列文章位址:

https://engineering.instagram.com/emojineering-part-1-machine-learning-for-emoji-trendsmachine-learning-for-emoji-trends-7f5f9cb979ad#.wppfkra4e

StitchFix更快地找到最適合你的時尚

時尚是件很難的事,但StitchFix使造型這件事變得很輕鬆。這家個性化造型創業公司使使用者可以個性化風格,並且每月將精選的服裝和配件送上家門。

定義風格可能是模糊的。畢竟,用戶怎麼能知道一件襯衫是否復古,或者一件衣服是否“性感”但又不顯得“太放蕩”。

Christopher Moody

Moody是StitchFix的資料科學家,擁有統計學、天體物理學和電腦學的多學科學術背景。事實證明,“書呆子”的學術技能在時尚界是大有可為的。

許多深度學習模型是“黑匣子”,使用者很難理解為什麼演算法得出特定的結論。Moody的研究集中於提高模型可解釋性,使人類專家能夠對演算法的相對性能提供回饋。

一種方法是使用t-SNE(t分佈的隨機相鄰嵌入),一種有助於降低視覺化相似物件的維數的方法。許多深度學習模型使用人類不可能概念化的高維資料,維數減少方法將複雜的資料變成更易於理解的二維或三維散點圖。

Moody也是k-SVD方法的狂熱者。 k-SVD是k均值聚類方法的泛化。在高級非技術術語中,聚類分析指將具有類似屬性的物件分組在一起。一旦已經識別出不同的集群,人類專家可以檢查組合,以查看它們是否表現出任何統一的特徵,並添加適當的標籤,例如“背心”。

圖片作者:Christopher Moody

Next Article
喜欢就按个赞吧!!!
点击关闭提示