您的位置:首頁>科技>正文

可解釋推薦系統:身懷絕技,一招擊中用戶心理

編者按:推薦系統被廣泛應用在電商網站、社交網路、生活服務網站、搜尋引擎等平臺。 一個好的推薦系統不僅需要準確地把握使用者的需求, 推薦給使用者想要的內容, 更需要學會與使用者溝通, 瞭解用戶心理, 以使用者容易接受的方式給出適當的推薦。

本文中, 微軟亞洲研究院的研究員王希廷和謝幸將為大家詳解可解釋推薦系統的分類、推薦解釋生成方法以及面臨的機遇和挑戰。

《戰國策》中有個有趣的故事:當年趙國被入侵, 只有送出質子才能求來救兵。 但是趙太后特別疼愛小兒子, 怎麼也不願意讓他當質子。

大臣們越是勸諫, 趙太后就越是憤怒。 這時候觸龍出面, 成功說服了趙太后, 讓她的愛子出質于齊, 換來救兵。 他到底是如何做到的呢?

這個故事其實跟我們最近進行的推薦系統的研究非常相關。 如果把“送出質子”當作一個推薦給太后的策略, 那麼故事的關鍵不在於推薦內容的好壞, 而在於對推薦內容的解釋。 如果要讓趙太后這樣頑固的用戶接受這個推薦, 關鍵點是什麼?

觸龍給出的答案是:溝通方式、使用者心理、合適例證。 讓我們詳細看看他是怎麼做的。

觸龍剛見到趙太后就開始話家常, 說:“我老啦, 有個小兒子年齡很小, 真是擔心他的未來啊。 ”趙太后問:“你們男人也很寵愛小兒子嗎?”觸龍說:“比女人更寵呀。

我認為趙太后更喜歡您的女兒, 而不是小兒子。 ”趙太后表示不認同。 觸龍解釋道:“您送公主出嫁的時候, 儘管傷心, 但也希望她不要被趕回來。 這還不是為她的長遠未來打算?”趙太后同意。 觸龍又說:“但是您卻沒怎麼為長安君計畫未來。 您看趙國剛建立時的諸侯王, 他們的子孫還有享受爵位的嗎?其他國家的呢?”趙太后想了想, 表示沒有。 觸龍又說:“那是因為他們榮華富貴太甚, 又沒有什麼功勞的緣故。 您現在讓長安君有如此高的地位, 卻不讓他有功于國, 一旦您駕崩了, 長安君憑什麼在趙國立足呢?”聽了這番話後, 趙太后同意了將長安君作為人質。

我們可以在這個故事裡看到兩類推薦系統。 一類是朝廷大臣這種傳統的推薦系統(下圖(a)),

將重心放在提高推薦準確性上, 與推薦對象的溝通考慮得不夠;而另一類是觸龍這種可解釋的推薦系統(下圖(b)), 能夠以使用者容易接受的方式(話家常), 充分抓住用戶心理(父母愛自己的小孩, 應該為他們長遠未來考慮), 給出適當的例子(趙太后送公主出嫁)與用戶溝通。 研究發現, 這樣的系統不僅能夠提升系統透明度, 還能夠提高使用者對系統的信任和接受程度 、使用者選擇體驗推薦產品的概率以及使用者滿意程度等等。

(a) 傳統推薦系統

(b) 可解釋推薦系統

設計一個像觸龍這樣可解釋的推薦系統是我們的終極目標。 目前, 這個方向進展如何呢?未來, 有什麼比較好的研究課題呢?下面, 我來介紹一下可解釋推薦的分類、推薦解釋生成方法以及可解釋推薦面臨的機遇和挑戰。

可解釋推薦的分類

一般來說, 可解釋的推薦分為下圖所示的三大類:以物品為媒介、以使用者為媒介、以及以特徵為媒介。

三大類推薦解釋:以物品、使用者、特徵為媒介

(圖片來自文章:Tags planations: explaining recommendations using tags)

以使用者為媒介的推薦解釋用一句話表述是“跟您相似的用戶都喜歡該推薦物品”。 在趙太后的故事中, 這個與趙太后相似的用戶就是也寵愛小兒子的觸龍。 這類推薦解釋展現形式多種多樣, 生成解釋時也往往用到社交資訊。 微軟研究員Amit Sharma等人對四種社交理由進行了用戶測試, 這四類理由是整體熱度(2,612,211位Facebook 用戶喜歡它)、朋友熱度(您的朋友中有7人喜歡它)、好朋友(張三喜歡它)、好朋友及個數(張三和其他5位您的朋友喜歡它)。 最終發現後兩種解釋方式效果對提升說服力效果最好。 使用這兩種解釋方式時, 選擇一個正確的朋友非常重要。 如果只是隨機選擇一個朋友, 說服力反而會降低。 以使用者為媒介的推薦解釋與以物品、特徵為媒介的推薦解釋相比, 最能說服用戶對推薦物品進行評估,但是對用戶實際使用物品後喜愛程度影響比較小。如果推薦的物品用戶不夠喜歡,反而會降低用戶的滿意程度。

以特徵為媒介的推薦解釋用一句話表述是“您可能喜歡推薦物品的這些特徵”。在趙太后的故事中,觸龍抓住了趙太后最關心的特徵——子孫的長遠利益——進行推薦,從而使得趙太后接受了推薦。這類推薦解釋常見的表現形式是將推薦物品中使用者感興趣的主要特徵進行列舉(如下圖)。研究表明這類推薦解釋有助於用戶準確判斷是否喜歡推薦物品,與前兩類推薦解釋相比,用戶對這類推薦的滿意度更高。這類推薦需要判斷物品特徵以及使用者對不同特徵的感興趣程度,從而找到最適合用於解釋的特徵,因此建模細微性更細,也是目前的研究熱點。

以特徵為媒介的推薦解釋

(圖片來自文章:Explicit factor models for explainable recommendation based on phrase-level sentiment analysis)

除了上述三種推薦解釋以外,還有結構化概覽式推薦以及對話式推薦等。其中,結構化概覽式推薦將推薦物品用有組織的、視覺化的形式呈現給用戶,讓用戶可以看到各個推薦物品的特性和分佈,從而在充分瞭解以後做出挑選。對話式推薦是在與用戶聊天時進行推薦、解釋、收集用戶回饋,有著較高的接受度,也可以很好地解決冷開機問題。這是一個新興的研究方向,我們也在做一些嘗試,將在後文進行討論。

推薦解釋生成方法

剛剛我們談到了幾類推薦解釋,其中以特徵為媒介的推薦解釋建模細微性較細,模型也日趨成熟。接下來重點介紹一下這類推薦解釋的生成方法。

生成基於特徵的推薦解釋時,關鍵是特徵的提取。早期的方法借助一些顯式的物品特徵,例如事先確定的物品分類、關鍵字、以及標籤資訊。在挑選特徵進行解釋時,主要是綜合兩個指標:第一是使用者對特徵的感興趣程度,第二是推薦商品與特徵的相關程度。第一點需要非常瞭解使用者心理,第二點需要對商品進行精確建模,綜合兩點考慮,才能像觸龍一樣擊中用戶內心。早期方法對這兩者分別計算之後進行合併,從而找出推薦物品以及解釋。這類方法的問題之一是特徵的可描述性(Descriptiveness)可能不夠。另外這些方法採用的推薦模型還比較簡單,一些精巧的、複雜的推薦系統難以用這樣的方法進行解釋。

EFM(Explicit Factor Model)框架

為了解決上面的問題,近期一些工作開始利用網上豐富的評論文本進行可解釋性的推薦。他們的主要思想是從評論中抽取使用者最感興趣的物品特徵,並且將這些特徵加入到目前的推薦系統中進行統一建模。其中一個較新的方法是Explicit Factor Model(EFM)。如上圖所示,這個方法首先利用詞級別的情感分析找出用戶評論中提到物品的顯式特徵(Explicit Features,如Screen、Earphone、Battery)及使用者對這些特徵的情感傾向(正面或者負面)。利用這個資訊,可以構建使用者-特徵矩陣X以及物品-特徵矩陣Y。這兩個疏鬆陣列可以用三個低維矩陣、、進行建模。這裡中每一行記錄了一個顯式特徵的隱式表達(Latent Representations)。即記錄使用者(物品)與顯式特徵隱式表達之間的關係。除了顯式特徵以外,還有一些隱含特徵(Hidden Factors)可能是評論中沒有提到的,這些特徵用額外的、矩陣表示。將、進行拼接就構成了使用者與物品所有特徵的隱式表達之間的關係,、也是類似的。該模型希望能夠通過這些矩陣擬合用戶-物品的評價矩陣A。

EFM在可解釋的推薦系統上邁進了一大步,但是他們的方法將顯式特徵的提取和使用者評價建模分為獨立的兩步,可能存在誤差累積等問題。而JMARS模型能夠對使用者評分、評價以及物品內容進行統一建模,可以有效解決上述問題。該方法的概率圖模型如下所示。這裡面可觀測量代表用戶u對電影m的評分,代表用戶u對電影m的評論中的第i個詞。可以看到,模型中,代表使用者興趣的隱變數、和以及代表電影不同特徵的隱變數、和同時決定了評分與評論中的詞,保證了評分與評論中詞的一致性。這個工作還將評論中的詞分成多類進行建模,包括在各個評論中都經常出現的Background Word()以及它對應的情感詞()、電影各個方面特徵的Aspect-specific Word()及其對應的情感詞()。除了這些之外,還有每個電影中出現的Movie-specific Word(),即電影的標題等。這些不同類的詞都可以直接由這一個圖模型學習得到。

JMARS(Jointly Modeling Aspects, Ratings and Sentiments)框架

(圖片來自文章:Jointly modeling aspects,ratings and sentiments for movie recommendation (JMARS))

可解釋推薦的機遇與挑戰

作為推薦領域被探索得較少的一個方向,可解釋推薦的很多方面值得研究與探索。目前,我們在考慮從下面三個方面進行研究。

解釋含有深度神經網路的推薦模型。目前可解釋推薦的系統往往是基於較淺層的圖模型或者矩陣分解模型,對於含有深度神經網路的複雜、混合模型的解釋能力還不夠。我們在考慮借鑒對深層卷積神經網路進行解釋、分析的技術,將複雜、高級的推薦系統升級為可解釋的推薦。

利用知識圖譜打通不同媒介之間的關聯。現有的可解釋推薦所生成的推薦解釋往往只局限於以物品為媒介、以使用者為媒介或者以特徵為媒介中的某一種,對這三類媒介之間的關聯挖掘得還不夠。我們希望能夠利用知識圖譜,打通這三類媒介之間的關聯,根據具體情況靈活選擇其中最合適的媒介對使用者進行推薦與解釋。這樣,我們還可以產生形式更豐富的推薦解釋,例如將使用者感興趣的圖片也進行展示。

結合生成模型進行對話式推薦。目前的推薦解釋往往形式是預先設定、千篇一律的(如預先設定推薦解釋是以使用者為媒介的)。這樣儘管也能根據使用者心理舉出一些例證,但是在溝通方式上還過於呆板,離觸龍那樣話家常式的推薦還有很大距離。如果能用生成模型讓推薦系統“自創”一句通順甚至高情商的話,就可以在與用戶聊天的過程中進行靈活、多變地推薦解釋了。我們團隊已經與微軟小冰合作,在這方面進行了一些嘗試,為小冰生成音樂推薦解釋。推薦過程如下圖所示:

微軟小冰的對話式音樂推薦

我們會從這幾個方向出發,不斷拓展可解釋推薦的深度和廣度。希望不久後的某一天,推薦系統都能像觸龍那樣厲害。

作者介紹

王希廷,微軟亞洲研究院副研究員。2011年於清華大學獲得工學學士學位。2017年於清華大學獲得工學博士學位。她的研究成果發表在資料採擷和視覺化的頂級會議和期刊上,包括KDD、TKDE、AAAI、IJCAI、VAST和TVCG等。她的一篇一作論文被TVCG選為2016年12月的spotlight article。她曾擔任TKDE、TVCG、InfoVis等頂級會議、期刊的審稿人。

謝幸博士于2001年7月加入微軟亞洲研究院,現任社會計算組資深研究員,並任中國科技大學兼職博士生導師。他分別於1996年和2001年在中國科技大學獲得電腦軟體專業學士和博士學位。他在國際會議和學術期刊上發表了200餘篇學術論文,並擁有50余項專利。他是ACM、IEEE高級會員和電腦學會傑出會員。他參與創立了ACM SIGSPATIAL中國分會,並曾擔任ACM UbiComp 2011大會程式委員會共同主席。

你也許還想看:

感謝你關注“微軟研究院AI頭條”,我們期待你的留言和投稿,共建交流平臺。來稿請寄:msraai@microsoft.com。

微軟小冰進駐微軟研究院微信啦!快去主頁和她聊聊天吧。

最能說服用戶對推薦物品進行評估,但是對用戶實際使用物品後喜愛程度影響比較小。如果推薦的物品用戶不夠喜歡,反而會降低用戶的滿意程度。

以特徵為媒介的推薦解釋用一句話表述是“您可能喜歡推薦物品的這些特徵”。在趙太后的故事中,觸龍抓住了趙太后最關心的特徵——子孫的長遠利益——進行推薦,從而使得趙太后接受了推薦。這類推薦解釋常見的表現形式是將推薦物品中使用者感興趣的主要特徵進行列舉(如下圖)。研究表明這類推薦解釋有助於用戶準確判斷是否喜歡推薦物品,與前兩類推薦解釋相比,用戶對這類推薦的滿意度更高。這類推薦需要判斷物品特徵以及使用者對不同特徵的感興趣程度,從而找到最適合用於解釋的特徵,因此建模細微性更細,也是目前的研究熱點。

以特徵為媒介的推薦解釋

(圖片來自文章:Explicit factor models for explainable recommendation based on phrase-level sentiment analysis)

除了上述三種推薦解釋以外,還有結構化概覽式推薦以及對話式推薦等。其中,結構化概覽式推薦將推薦物品用有組織的、視覺化的形式呈現給用戶,讓用戶可以看到各個推薦物品的特性和分佈,從而在充分瞭解以後做出挑選。對話式推薦是在與用戶聊天時進行推薦、解釋、收集用戶回饋,有著較高的接受度,也可以很好地解決冷開機問題。這是一個新興的研究方向,我們也在做一些嘗試,將在後文進行討論。

推薦解釋生成方法

剛剛我們談到了幾類推薦解釋,其中以特徵為媒介的推薦解釋建模細微性較細,模型也日趨成熟。接下來重點介紹一下這類推薦解釋的生成方法。

生成基於特徵的推薦解釋時,關鍵是特徵的提取。早期的方法借助一些顯式的物品特徵,例如事先確定的物品分類、關鍵字、以及標籤資訊。在挑選特徵進行解釋時,主要是綜合兩個指標:第一是使用者對特徵的感興趣程度,第二是推薦商品與特徵的相關程度。第一點需要非常瞭解使用者心理,第二點需要對商品進行精確建模,綜合兩點考慮,才能像觸龍一樣擊中用戶內心。早期方法對這兩者分別計算之後進行合併,從而找出推薦物品以及解釋。這類方法的問題之一是特徵的可描述性(Descriptiveness)可能不夠。另外這些方法採用的推薦模型還比較簡單,一些精巧的、複雜的推薦系統難以用這樣的方法進行解釋。

EFM(Explicit Factor Model)框架

為了解決上面的問題,近期一些工作開始利用網上豐富的評論文本進行可解釋性的推薦。他們的主要思想是從評論中抽取使用者最感興趣的物品特徵,並且將這些特徵加入到目前的推薦系統中進行統一建模。其中一個較新的方法是Explicit Factor Model(EFM)。如上圖所示,這個方法首先利用詞級別的情感分析找出用戶評論中提到物品的顯式特徵(Explicit Features,如Screen、Earphone、Battery)及使用者對這些特徵的情感傾向(正面或者負面)。利用這個資訊,可以構建使用者-特徵矩陣X以及物品-特徵矩陣Y。這兩個疏鬆陣列可以用三個低維矩陣、、進行建模。這裡中每一行記錄了一個顯式特徵的隱式表達(Latent Representations)。即記錄使用者(物品)與顯式特徵隱式表達之間的關係。除了顯式特徵以外,還有一些隱含特徵(Hidden Factors)可能是評論中沒有提到的,這些特徵用額外的、矩陣表示。將、進行拼接就構成了使用者與物品所有特徵的隱式表達之間的關係,、也是類似的。該模型希望能夠通過這些矩陣擬合用戶-物品的評價矩陣A。

EFM在可解釋的推薦系統上邁進了一大步,但是他們的方法將顯式特徵的提取和使用者評價建模分為獨立的兩步,可能存在誤差累積等問題。而JMARS模型能夠對使用者評分、評價以及物品內容進行統一建模,可以有效解決上述問題。該方法的概率圖模型如下所示。這裡面可觀測量代表用戶u對電影m的評分,代表用戶u對電影m的評論中的第i個詞。可以看到,模型中,代表使用者興趣的隱變數、和以及代表電影不同特徵的隱變數、和同時決定了評分與評論中的詞,保證了評分與評論中詞的一致性。這個工作還將評論中的詞分成多類進行建模,包括在各個評論中都經常出現的Background Word()以及它對應的情感詞()、電影各個方面特徵的Aspect-specific Word()及其對應的情感詞()。除了這些之外,還有每個電影中出現的Movie-specific Word(),即電影的標題等。這些不同類的詞都可以直接由這一個圖模型學習得到。

JMARS(Jointly Modeling Aspects, Ratings and Sentiments)框架

(圖片來自文章:Jointly modeling aspects,ratings and sentiments for movie recommendation (JMARS))

可解釋推薦的機遇與挑戰

作為推薦領域被探索得較少的一個方向,可解釋推薦的很多方面值得研究與探索。目前,我們在考慮從下面三個方面進行研究。

解釋含有深度神經網路的推薦模型。目前可解釋推薦的系統往往是基於較淺層的圖模型或者矩陣分解模型,對於含有深度神經網路的複雜、混合模型的解釋能力還不夠。我們在考慮借鑒對深層卷積神經網路進行解釋、分析的技術,將複雜、高級的推薦系統升級為可解釋的推薦。

利用知識圖譜打通不同媒介之間的關聯。現有的可解釋推薦所生成的推薦解釋往往只局限於以物品為媒介、以使用者為媒介或者以特徵為媒介中的某一種,對這三類媒介之間的關聯挖掘得還不夠。我們希望能夠利用知識圖譜,打通這三類媒介之間的關聯,根據具體情況靈活選擇其中最合適的媒介對使用者進行推薦與解釋。這樣,我們還可以產生形式更豐富的推薦解釋,例如將使用者感興趣的圖片也進行展示。

結合生成模型進行對話式推薦。目前的推薦解釋往往形式是預先設定、千篇一律的(如預先設定推薦解釋是以使用者為媒介的)。這樣儘管也能根據使用者心理舉出一些例證,但是在溝通方式上還過於呆板,離觸龍那樣話家常式的推薦還有很大距離。如果能用生成模型讓推薦系統“自創”一句通順甚至高情商的話,就可以在與用戶聊天的過程中進行靈活、多變地推薦解釋了。我們團隊已經與微軟小冰合作,在這方面進行了一些嘗試,為小冰生成音樂推薦解釋。推薦過程如下圖所示:

微軟小冰的對話式音樂推薦

我們會從這幾個方向出發,不斷拓展可解釋推薦的深度和廣度。希望不久後的某一天,推薦系統都能像觸龍那樣厲害。

作者介紹

王希廷,微軟亞洲研究院副研究員。2011年於清華大學獲得工學學士學位。2017年於清華大學獲得工學博士學位。她的研究成果發表在資料採擷和視覺化的頂級會議和期刊上,包括KDD、TKDE、AAAI、IJCAI、VAST和TVCG等。她的一篇一作論文被TVCG選為2016年12月的spotlight article。她曾擔任TKDE、TVCG、InfoVis等頂級會議、期刊的審稿人。

謝幸博士于2001年7月加入微軟亞洲研究院,現任社會計算組資深研究員,並任中國科技大學兼職博士生導師。他分別於1996年和2001年在中國科技大學獲得電腦軟體專業學士和博士學位。他在國際會議和學術期刊上發表了200餘篇學術論文,並擁有50余項專利。他是ACM、IEEE高級會員和電腦學會傑出會員。他參與創立了ACM SIGSPATIAL中國分會,並曾擔任ACM UbiComp 2011大會程式委員會共同主席。

你也許還想看:

感謝你關注“微軟研究院AI頭條”,我們期待你的留言和投稿,共建交流平臺。來稿請寄:msraai@microsoft.com。

微軟小冰進駐微軟研究院微信啦!快去主頁和她聊聊天吧。

Next Article
喜欢就按个赞吧!!!
点击关闭提示