華文網

看懂黑科技丨新聞用戶端的智慧推薦:人心怎能被AI猜透?

聚焦資訊技術領域 為產業發聲

導讀

近日,人民日報發了一篇文章,標題叫《新聞莫被演算法“綁架”》提出:最近一段時間,一些癡迷於技術和演算法的新聞用戶端越來越“簡單粗暴”了。

點開一篇文章,它會迅速用大量相似的內容刷屏,連拒絕的權利都沒有。有些人則將這些新聞分發的演算法上升到人工智慧的高度上,認為這是發展的大勢,代表了行業的未來。並指出:“當一些熱衷於搬運新聞、沉溺於演算法的用戶端在商業上取得成功之後,卻給新聞的未來帶來了很大的負面影響。”一貫以智慧推薦為基礎的今日頭條、一點資訊等可以說是被正中靶心,
對此,有網友評論:人心怎能被AI猜透?

新聞用戶端的智慧推薦是如何實現的?

據悉,今日頭條在短短的4年時間,就已經實現用戶累計已經達到5.5億、日活躍超過6000萬、日均閱讀量超過了18億,用戶平均使用時長更是高達76分鐘。今日頭條能在新聞資訊這樣一個競爭紅海中廝殺出來,

能根據使用者喜好進行個性化推薦,完全得益于智慧推薦系統,那智慧推薦系統到底是如何工作的呢?以下以今日頭條為例進行闡述。

先來說一下智慧推薦的核心——演算法。推薦演算法有基於內容的推薦演算法,有基於知識的推薦演算法,還有協同過濾演算法等。基於內容的推薦演算法是根據使用者喜歡的和已關注的內容,推薦相似度高、關聯性大的內容,

但是這種演算法推薦的內容極有可能是是重複的,且對於音樂圖片等很難自動提取內容特徵,因此需要人工給這些內容打上標籤。基於知識的推薦演算法通過構建領域本體,或者是建立一定的規則,進行推薦。還有一種是協同過濾演算法,假設使用者B的與A的興趣相似,那麼B喜歡的商品A 也極有可能喜歡,這一點我們在淘寶上會經常遇到。而今日頭條主要基於內容進行智慧推薦。

再接著,頭條根據使用者的使用資料和回饋資料來進行進一步“畫像”。使用資料指的是流覽內容、評論和轉發等資料,回饋資料指的是“選擇遮罩”功能,用戶可以選擇理由遮罩掉不感興趣的內容,同時頭條提取此內容的關鍵字,在下次推薦時儘量避開包含這些關鍵字的內容。長此以往,用戶每次打開今日頭條都是喜歡的內容,不僅節省了時間成本,

而且推薦內容的匹配度逐步提高,使得用戶的閱讀興趣和黏性越強,形成了一個良性迴圈。

人心怎能被AI猜透?

然而,這種智慧推薦下的“完全滿足”,不可避免的會遇到內容單一化,同質化,甚至低俗化的現象,長此以往使用者獲取的資訊面過窄,恍然回頭才發現自己錯過那麼多的資訊,變成了坐井觀天的青蛙。

有用戶回饋:“今日頭條的演算法機器會以為我們點擊的即是我們喜歡的,但實際上使用者對於資訊是處於“屏讀”的狀態,是整屏整屏的刷,很難會點擊一條新聞資訊,而我們之所以會點擊,可能會是誤點擊,可能會是美女、娛樂等資訊,所以,機器會慢慢給用戶推薦美女、娛樂等資訊,反而,真正有用的資訊被雪藏了,機器以為你並不需要它,因為你是用屏刷過去的。”

那什麼是真正有用的個資訊呢。也許是大牛寫的博客,由於沒有運營指標,閱讀體驗也許沒那麼好,但是品質可以保證;也許是科技資訊類新聞,幫助我們快速瞭解科技商業領域的一些大事;也許是少量的精品公眾號,或許沒有10萬+,但是也是深入思考後的。出於人類的本能,人們可能喜歡輕鬆娛樂的段子,明星八卦等資訊,甚至沉迷其中,但是這些資訊對個人能力提升沒有任何作用。

這又牽扯出一個問題,今日頭條有沒有乾貨?眾所周知,今日頭條走的是親民路線,一直以來都是以符合大眾口味為要求的,想讓所有的人都喜歡、都能看懂今日頭條的內容,那由於不同人群知識文化程度、領悟能力都各不相同,要符合所有人的口味,就需要有簡單直白的資訊、內容。那在智能推薦下,即使是乾貨,恐怕也會被雪藏......

如何解決智慧推薦初期的難題?

個性化推薦在今天,還處於發展初期。對於上述的種種問題,除了要提高技術,可能還需要加入人工的干預。比如,對於時政、財經等嚴肅新聞需要人工進行強干預,彌補機器只能識別關鍵字和點擊量,無法準確判斷新聞價值的弊端。

另外,可以在個性化推薦中加入人的因素。可以在內容出現在客戶眼前之前,先由部分網友對所閱讀的內容進行篩選,將優質的內容推薦到平臺上,確認無黃賭毒等不良信息後,再通過個性化演算法推薦到其他使用者的首頁上。同時,平臺通過審核所有內容,在其中挑出大眾化的有趣的內容,推薦到所有使用者的首頁,這樣既可以避免不良資訊,又能保證使用者的活躍度。也許,以後還會出現更成熟更完善的推薦演算法,來引導我們閱讀,而不只是猜我們愛讀。

搜狐總裁張朝陽曾提到:內容消費包括板塊消費和個性化消費。板塊消費的特點基本是頭部消費,由編輯推薦的,這個板塊要由有限的人工做成。個性化消費,這是長尾消費,根據讀者的消費習慣來演算法推薦。用戶在用戶端看到的前100條新聞,由編輯人工編輯,其餘的“下拉一下”,就會呈現出根據每一個使用者平時流覽新聞喜好、習慣留下的印記而智慧推薦的個性化新聞。這樣的解決思路有一定合理性。

這樣,對於用戶零碎時間進行閱讀的人群來說,兼顧了“有態度”和“個性化”這兩個要求。但對於有主見的閱讀群體來說,實際上他們更希望閱讀掌握在自己手中,編輯推薦依舊不夠“個性化”,因為編輯雖然具有專業性,卻始終摸不透內容消費者的心,唯有把閱讀的選擇權交給讀者,這才是真正的“個性化”。

恍然回頭才發現自己錯過那麼多的資訊,變成了坐井觀天的青蛙。

有用戶回饋:“今日頭條的演算法機器會以為我們點擊的即是我們喜歡的,但實際上使用者對於資訊是處於“屏讀”的狀態,是整屏整屏的刷,很難會點擊一條新聞資訊,而我們之所以會點擊,可能會是誤點擊,可能會是美女、娛樂等資訊,所以,機器會慢慢給用戶推薦美女、娛樂等資訊,反而,真正有用的資訊被雪藏了,機器以為你並不需要它,因為你是用屏刷過去的。”

那什麼是真正有用的個資訊呢。也許是大牛寫的博客,由於沒有運營指標,閱讀體驗也許沒那麼好,但是品質可以保證;也許是科技資訊類新聞,幫助我們快速瞭解科技商業領域的一些大事;也許是少量的精品公眾號,或許沒有10萬+,但是也是深入思考後的。出於人類的本能,人們可能喜歡輕鬆娛樂的段子,明星八卦等資訊,甚至沉迷其中,但是這些資訊對個人能力提升沒有任何作用。

這又牽扯出一個問題,今日頭條有沒有乾貨?眾所周知,今日頭條走的是親民路線,一直以來都是以符合大眾口味為要求的,想讓所有的人都喜歡、都能看懂今日頭條的內容,那由於不同人群知識文化程度、領悟能力都各不相同,要符合所有人的口味,就需要有簡單直白的資訊、內容。那在智能推薦下,即使是乾貨,恐怕也會被雪藏......

如何解決智慧推薦初期的難題?

個性化推薦在今天,還處於發展初期。對於上述的種種問題,除了要提高技術,可能還需要加入人工的干預。比如,對於時政、財經等嚴肅新聞需要人工進行強干預,彌補機器只能識別關鍵字和點擊量,無法準確判斷新聞價值的弊端。

另外,可以在個性化推薦中加入人的因素。可以在內容出現在客戶眼前之前,先由部分網友對所閱讀的內容進行篩選,將優質的內容推薦到平臺上,確認無黃賭毒等不良信息後,再通過個性化演算法推薦到其他使用者的首頁上。同時,平臺通過審核所有內容,在其中挑出大眾化的有趣的內容,推薦到所有使用者的首頁,這樣既可以避免不良資訊,又能保證使用者的活躍度。也許,以後還會出現更成熟更完善的推薦演算法,來引導我們閱讀,而不只是猜我們愛讀。

搜狐總裁張朝陽曾提到:內容消費包括板塊消費和個性化消費。板塊消費的特點基本是頭部消費,由編輯推薦的,這個板塊要由有限的人工做成。個性化消費,這是長尾消費,根據讀者的消費習慣來演算法推薦。用戶在用戶端看到的前100條新聞,由編輯人工編輯,其餘的“下拉一下”,就會呈現出根據每一個使用者平時流覽新聞喜好、習慣留下的印記而智慧推薦的個性化新聞。這樣的解決思路有一定合理性。

這樣,對於用戶零碎時間進行閱讀的人群來說,兼顧了“有態度”和“個性化”這兩個要求。但對於有主見的閱讀群體來說,實際上他們更希望閱讀掌握在自己手中,編輯推薦依舊不夠“個性化”,因為編輯雖然具有專業性,卻始終摸不透內容消費者的心,唯有把閱讀的選擇權交給讀者,這才是真正的“個性化”。