華文網

演算法推薦也有分男女?知乎合夥人李大海講述演算法推薦的另一面

►母愛演算法和父愛演算法

在使用多數資訊流產品時,使用者會發現平臺推薦的內容與興趣是強相關的,以記者為例,在某短視頻平臺上,選擇了“美妝”、“王者榮耀”、“內蒙古”等標籤後,

就很少看到在此之外的內容了。而知乎的“推薦”資訊流卻顯得很任性,經常推薦讓人“出乎意料”的內容。

對此,李大海介紹稱,在內容分發領域有兩種流派,有人形象地把它們稱為,母愛演算法和父愛演算法。所謂母愛演算法就是比較寵溺的演算法,

知道你喜歡什麼,就不斷給你推這個內容,讓使用者覺得幸福,但這也會帶來資訊繭房問題。

而所謂的父愛演算法,就是不斷通過優質內容,去引導使用者去探索興趣邊界,發現更大的世界。

理想狀態是母愛演算法和父愛演算法地結合。父愛演算法對知乎和知乎的用戶來說,尤其重要。“我們在父愛演算法上花的精力尤其多,其中包括優質內容識別、排序方式優化,以及運營同學對於分發的干預。

目前,以首頁為例,整體的內容分發量提升了200%,人均時長提升了45%,CTR(Click-Through-Rate,點擊通過率)提升了26%”,李大海介紹稱。

易觀新媒體分析師馬世聰此前接受新京報記者採訪時也表達了同樣的觀點,沒有人工的編輯和運營,可能會由於用戶的劣根性,最終出現劣幣驅逐良幣的後果。

李大海坦言,在知乎的運營過程中,會更傾向于父愛演算法,但具體的演算法是在不斷動態調整的。

在他看來,推薦內容首先要瞭解內容,知乎會首先找到專業人士定義“什麼內容是好的內容”,然後再逐步把這個理解沉澱為機器的理解。

在對內容進行畫像的時,會有非常多的緯度,包括發佈內容的人是不是權威、內容的信息量怎麼樣、內容整體要表達的意圖等。但最終的出發點,還是看這個內容對使用者有沒有價值,這個是最關注的。

李大海向新京報記者透露,

未來會從自然語言理解,擴展到對音訊、對圖像、對視頻的處理上,今年會將人工智慧和演算法處理團隊擴大到數百人規模。目前這些技術還只是對內使用,未來不排除對外輸出的可能性。

目前,知乎已經上線了視頻的功能,使用者可以在提問或者回答時使用視頻。李大海稱,視頻肯定是未來重點規劃的方向。“視頻作為媒介的一種,非常適合在某些場景去分享自己的經驗和見解,

圖文是取代不了視頻的優勢的,所以我們一定會支援好視頻。”

►用人工智慧做內容管理

今年3月至4月期間,國家廣電總局、國家網信辦、國家文化與旅遊部等多部委對網路資訊環境進行了清理整頓,多家平臺被約談、整改。

3月初,亦有媒體報導稱,“知乎”平臺因管理不嚴,被要求下架七天,具體時間為3月2日15時至3月9日15時。對於“被要求下架一周”的消息,知乎在此前回應新京報稱:“我們將儘快調整上架”,但並未解釋“被下架”是基於何種原因。

面對不斷嚴峻的監管環境,知乎將如何做好內容管理,維護社區環境?

李大海稱,知乎是UGC(使用者內容提供)平臺,並且設定由所有用戶參與投票,這個機制天然就有優勝劣汰的作用,好的內容容易浮上來,不好的內容是往下沉的,這一點減小了在內容控制上的壓力。

知乎還在探索人工和演算法結合的“智慧社區”模式。“我們有兩個演算法機器人,悟空機器人是反作弊的,會抵制廣告、假貨等;瓦力機器人側重語義理解,可以對辱駡、反諷等進行控制,在部分場景中瓦力準確率最高能達到99.13%。總體的思路是,先讓人工智慧去發現可疑的東西,再根據我們對演算法的自信程度,決定要不要人工編輯介入,或者要不要其他演算法介入。”李大海說。

他同時稱,演算法也有不完美的地方,也會存在“誤傷”的情況,這就需要人工編輯進行審核。且在每個場景、每個領域,演算法的能力是不同的,需要結合具體的領域進行策略分析,但人工智慧的應用確實幫人力編輯降低了很多工作壓力。

2016年4月,知乎上線了站內“原生廣告”,即俗稱的資訊流廣告。而2018年3月底,今日頭條最先被曝光的正是資訊流廣告的非法“二次跳轉”問題。知乎怎樣做到用戶體驗和商業價值的兼顧?如何規避廣告問題?

李大海稱,知乎的商業審核可以說是整個互聯網公司裡面最嚴格的一家。“我們在內部有非常明確的運營規則,它在這個規則裡面的,我們才會接受,並且會仔細對它的廣告進行審核。”李大海說。

此外,在廣告投放的過程中,知乎會盡可能地給用戶提供,可能感興趣的廣告。“我們認為在某些情況之下,廣告不僅是廣告,對用戶來說也可能是有價值的。但這都是在我們對廣告和對用戶理解的基礎上進行的。”

“總體目標是建立一個開放、包容、理性的一個討論氛圍,讓大家好好說話,讓你發表觀點的時沒有顧忌”,李大海對新京報記者說。

但並未解釋“被下架”是基於何種原因。

面對不斷嚴峻的監管環境,知乎將如何做好內容管理,維護社區環境?

李大海稱,知乎是UGC(使用者內容提供)平臺,並且設定由所有用戶參與投票,這個機制天然就有優勝劣汰的作用,好的內容容易浮上來,不好的內容是往下沉的,這一點減小了在內容控制上的壓力。

知乎還在探索人工和演算法結合的“智慧社區”模式。“我們有兩個演算法機器人,悟空機器人是反作弊的,會抵制廣告、假貨等;瓦力機器人側重語義理解,可以對辱駡、反諷等進行控制,在部分場景中瓦力準確率最高能達到99.13%。總體的思路是,先讓人工智慧去發現可疑的東西,再根據我們對演算法的自信程度,決定要不要人工編輯介入,或者要不要其他演算法介入。”李大海說。

他同時稱,演算法也有不完美的地方,也會存在“誤傷”的情況,這就需要人工編輯進行審核。且在每個場景、每個領域,演算法的能力是不同的,需要結合具體的領域進行策略分析,但人工智慧的應用確實幫人力編輯降低了很多工作壓力。

2016年4月,知乎上線了站內“原生廣告”,即俗稱的資訊流廣告。而2018年3月底,今日頭條最先被曝光的正是資訊流廣告的非法“二次跳轉”問題。知乎怎樣做到用戶體驗和商業價值的兼顧?如何規避廣告問題?

李大海稱,知乎的商業審核可以說是整個互聯網公司裡面最嚴格的一家。“我們在內部有非常明確的運營規則,它在這個規則裡面的,我們才會接受,並且會仔細對它的廣告進行審核。”李大海說。

此外,在廣告投放的過程中,知乎會盡可能地給用戶提供,可能感興趣的廣告。“我們認為在某些情況之下,廣告不僅是廣告,對用戶來說也可能是有價值的。但這都是在我們對廣告和對用戶理解的基礎上進行的。”

“總體目標是建立一個開放、包容、理性的一個討論氛圍,讓大家好好說話,讓你發表觀點的時沒有顧忌”,李大海對新京報記者說。