看懂黑科技丨新聞用戶端的智慧推薦：人心怎能被AI猜透？

時間＼2017-09-19

聚焦資訊技術領域為產業發聲

導讀

近日，人民日報發了一篇文章，標題叫《新聞莫被演算法“綁架”》提出：最近一段時間，一些癡迷於技術和演算法的新聞用戶端越來越“簡單粗暴”了。

點開一篇文章，它會迅速用大量相似的內容刷屏，連拒絕的權利都沒有。有些人則將這些新聞分發的演算法上升到人工智慧的高度上，認為這是發展的大勢，代表了行業的未來。並指出：“當一些熱衷於搬運新聞、沉溺於演算法的用戶端在商業上取得成功之後，卻給新聞的未來帶來了很大的負面影響。”一貫以智慧推薦為基礎的今日頭條、一點資訊等可以說是被正中靶心，

對此，有網友評論：人心怎能被AI猜透？

新聞用戶端的智慧推薦是如何實現的？

據悉，今日頭條在短短的4年時間，就已經實現用戶累計已經達到5.5億、日活躍超過6000萬、日均閱讀量超過了18億，用戶平均使用時長更是高達76分鐘。今日頭條能在新聞資訊這樣一個競爭紅海中廝殺出來，

能根據使用者喜好進行個性化推薦，完全得益于智慧推薦系統，那智慧推薦系統到底是如何工作的呢？以下以今日頭條為例進行闡述。

先來說一下智慧推薦的核心——演算法。推薦演算法有基於內容的推薦演算法，有基於知識的推薦演算法，還有協同過濾演算法等。基於內容的推薦演算法是根據使用者喜歡的和已關注的內容，推薦相似度高、關聯性大的內容，

但是這種演算法推薦的內容極有可能是是重複的，且對於音樂圖片等很難自動提取內容特徵，因此需要人工給這些內容打上標籤。基於知識的推薦演算法通過構建領域本體，或者是建立一定的規則，進行推薦。還有一種是協同過濾演算法，假設使用者B的與A的興趣相似，那麼B喜歡的商品A 也極有可能喜歡，這一點我們在淘寶上會經常遇到。而今日頭條主要基於內容進行智慧推薦。

再接著，頭條根據使用者的使用資料和回饋資料來進行進一步“畫像”。使用資料指的是流覽內容、評論和轉發等資料，回饋資料指的是“選擇遮罩”功能，用戶可以選擇理由遮罩掉不感興趣的內容，同時頭條提取此內容的關鍵字，在下次推薦時儘量避開包含這些關鍵字的內容。長此以往，用戶每次打開今日頭條都是喜歡的內容，不僅節省了時間成本，

而且推薦內容的匹配度逐步提高，使得用戶的閱讀興趣和黏性越強，形成了一個良性迴圈。

人心怎能被AI猜透？

然而，這種智慧推薦下的“完全滿足”，不可避免的會遇到內容單一化，同質化，甚至低俗化的現象，長此以往使用者獲取的資訊面過窄，恍然回頭才發現自己錯過那麼多的資訊，變成了坐井觀天的青蛙。

有用戶回饋：“今日頭條的演算法機器會以為我們點擊的即是我們喜歡的，但實際上使用者對於資訊是處於“屏讀”的狀態，是整屏整屏的刷，很難會點擊一條新聞資訊，而我們之所以會點擊，可能會是誤點擊，可能會是美女、娛樂等資訊，所以，機器會慢慢給用戶推薦美女、娛樂等資訊，反而，真正有用的資訊被雪藏了，機器以為你並不需要它，因為你是用屏刷過去的。”

那什麼是真正有用的個資訊呢。也許是大牛寫的博客，由於沒有運營指標，閱讀體驗也許沒那麼好，但是品質可以保證；也許是科技資訊類新聞，幫助我們快速瞭解科技商業領域的一些大事；也許是少量的精品公眾號，或許沒有10萬＋，但是也是深入思考後的。出於人類的本能，人們可能喜歡輕鬆娛樂的段子，明星八卦等資訊，甚至沉迷其中，但是這些資訊對個人能力提升沒有任何作用。

這又牽扯出一個問題，今日頭條有沒有乾貨？眾所周知，今日頭條走的是親民路線，一直以來都是以符合大眾口味為要求的，想讓所有的人都喜歡、都能看懂今日頭條的內容，那由於不同人群知識文化程度、領悟能力都各不相同，要符合所有人的口味，就需要有簡單直白的資訊、內容。那在智能推薦下，即使是乾貨，恐怕也會被雪藏......

如何解決智慧推薦初期的難題？

個性化推薦在今天，還處於發展初期。對於上述的種種問題，除了要提高技術，可能還需要加入人工的干預。比如，對於時政、財經等嚴肅新聞需要人工進行強干預，彌補機器只能識別關鍵字和點擊量，無法準確判斷新聞價值的弊端。

另外，可以在個性化推薦中加入人的因素。可以在內容出現在客戶眼前之前，先由部分網友對所閱讀的內容進行篩選，將優質的內容推薦到平臺上，確認無黃賭毒等不良信息後，再通過個性化演算法推薦到其他使用者的首頁上。同時，平臺通過審核所有內容，在其中挑出大眾化的有趣的內容，推薦到所有使用者的首頁，這樣既可以避免不良資訊，又能保證使用者的活躍度。也許，以後還會出現更成熟更完善的推薦演算法，來引導我們閱讀，而不只是猜我們愛讀。

搜狐總裁張朝陽曾提到：內容消費包括板塊消費和個性化消費。板塊消費的特點基本是頭部消費，由編輯推薦的，這個板塊要由有限的人工做成。個性化消費，這是長尾消費，根據讀者的消費習慣來演算法推薦。用戶在用戶端看到的前100條新聞，由編輯人工編輯，其餘的“下拉一下”，就會呈現出根據每一個使用者平時流覽新聞喜好、習慣留下的印記而智慧推薦的個性化新聞。這樣的解決思路有一定合理性。

這樣，對於用戶零碎時間進行閱讀的人群來說，兼顧了“有態度”和“個性化”這兩個要求。但對於有主見的閱讀群體來說，實際上他們更希望閱讀掌握在自己手中，編輯推薦依舊不夠“個性化”，因為編輯雖然具有專業性，卻始終摸不透內容消費者的心，唯有把閱讀的選擇權交給讀者，這才是真正的“個性化”。

恍然回頭才發現自己錯過那麼多的資訊，變成了坐井觀天的青蛙。

如何解決智慧推薦初期的難題？