華文網

iPIN CEO 楊洋:AI 還未被大規模用在工作中,缺的是認知智慧

雷鋒網按:8 月 5 日,在 Rebuild 2017 大會上,iPIN CEO 楊洋發表了題為《從認知智慧到更智慧的決策》,分享了什麼是認知智慧,以及 iPIN 在認知智慧方面做的應用。雷鋒網根據現場速記進行了整理。

以下是 iPIN CEO 楊洋的演講實錄,

雷鋒網在不改變原意的基礎上做了精編:

大家好!我叫楊洋,我這個名字比較像一個明星的名字對吧?所以很多人一聽我這個名字以為是另外一個楊洋,我們公司的一個同事為了做宣傳,就說楊洋幫你填報志願,然後吸引了大量的不知情的90後、00後進來,

然後“被騙了”。這就是我們的認知發生了偏差。我們今天談“認知智慧”。

人工智慧很火,火的一塌糊塗,甚至我都不願意把我們公司稱之為一個人工智慧公司。為什麼呢?因為任何的技術都是解決問題的,如果一個技術不能解決問題它是沒有價值的。我們公司做到現在,大家以為人工智慧很火,無所不能,但是大家仔細的回想一下,我們現在的人工智慧對你的工作影響了多少?你每天的工作方式有改變嗎?也許可能搭滴滴的時候,

或者看今日頭條的時候有一些改變。但是在我們工作中呢?我們都說人工智慧會帶來第四次工業革命,但是到現在為止人工智慧對我們工作的滲透可能還不到1%。我們不需要聊天,在工作的時候我們要的不是聊天,要的也不是圖像識別,要的也不是無人駕駛,除非你是個司機。

所以,其實現在人工智慧的發展,

距離真正顛覆我們工作的環節或者習慣,還差得好遠。為什麼是這樣子呢?就在於我們現在人工智慧發展水準還只是集中在感知智慧,距離認知智慧還比較遙遠。這就像一個5歲的小孩,你跟你5歲時候比智商其實是差不多的,5歲的時候智商基本發展到跟成人差不多,但是你能讓一個5歲的小孩去做投資嗎?不能對不對?你能夠讓一個5歲小孩去做招聘嗎?不能。

那5歲跟35歲之間的差距到底在哪裡?其實就在於,我們對於很多生活常識的各種理解和學習。我爸爸在湖北省當地是一個很有名的醫生,我在美國讀書他去美國看我,他卻發現他失去了他所有的一切能力,他在中國算是一個很有成就的人,但到美國連他自己工作和獨立生活的能力全部喪失了。為什麼?並不是他能力沒有了,而是說他的能力、認知跟當時的環境已經發生了一個巨大的不匹配。

所以,他的認知等所有的一切都顛覆了、沒有了。這就是認知智慧。

AI可否代替諮詢顧問?

現在的人工智慧技術,距離我們真正大規模應用到工作中,缺乏的就是在認知智慧的發展。

我舉一個很小的例子,就是高考志願填報。

在座的各位應該絕大多數都經過了高考志願填報環節,除非你高中就出國了,逃掉了,或者說你高中壓根兒沒畢業,我當時本來也不想讀完的。但是,一旦你經歷過這事兒就知道,這個事兒是個小事,大概只用一個禮拜就搞定它了。但是要真正把這個事兒做好,你卻需要非常多條件,而且它對你的一生影響是非常大的。比如說,我因為當年填錯了一個志願,我的人生在最美好的年華,至少浪費了6年,包括我周圍的很多人都是這樣,超過71%的人在大學畢業之後所從事的工作跟自己所學的專業是無關的。這就包括我們公司是一個人工智慧的公司,我們公司絕大多數人也是這種情況。

那填報志願需要哪些條件呢?

瞭解自我

你瞭解自我嗎?我在美國的時候很有意思,有一次受了一個刺激,問了一下我周圍的中國留學生,發現絕大多數人都不知道自己是否喜歡自己的現在,也不知道自己喜歡什麼。所以,瞭解自我是個很大的問題。

10萬+可選項

中國2500多所大學,10萬多個院系,市場上有12000多種職業,這種組合超過1億個,你如何在裡面選?

明規則+潛規則

有一些明規則,每個學校的每個專業,在每個省的填報規則都不一樣。這些規則你都瞭解嗎?還有大量潛規則。比如說,機械系女生少,這個規則學校是不會告訴你的,你自己考慮吧?女生少代表什麼?還有大量大量其它的各種潛規則,比如中華女子學院也招男生你知道嗎?不知道。真的!中華女子學院有1%是男生,在播音系,因為要男女對練。

決策方法

怎樣才會有一套科學的決策方法?我們每天都在不停的做決策,科學的決策方法依據是什麼?

可惜這一切,這麼重要的事,你的一生只有三天去決定。根本搞不定的,它遠遠超出了人能夠通過自己人的大腦的認知去解決的問題範疇。

那接下來需要怎麼辦呢?所以,就出現了一種職業,叫做高考志願填報專家,這種專家收費幾千到幾萬不等。還有很多很多事情都是這樣的,比如招聘、招新、招標、招生、招商,找投資、找工作、找專家,這些事情現在都是專家在做。這些專家在我們目前的生活中,可以說是很常見的。

就像剛剛說的問題,我們不可能讓一個5歲的小孩去做投資,因為確實裡面所包含的信息量、所認知的東西實在是太多了。

那我們怎麼辦呢?人工智慧將要引起第四次工業革命,那我們怎麼去用AI加速這個進程去真的能夠加速我們的工作效率,能夠代替我們在工作中去理解大量的這些東西,然後幫助我們做決策呢?

認知智慧如何幫人做決策

這是現在人工智慧真的要想在商業領域大展宏圖,必須要去突破的一個領域,這塊其實就是認知。

我們回顧一下人是怎麼思考問題的:

人的認知其實就分很簡單4個步驟,比如從感知資訊-認知資訊-分析-做出決策,就這麼4個環節,我們所有的事情其實就不停的在這4個環節裡迴圈。

我舉個小例子,比如說“我很帥”,聽清楚了,我很帥!三個字對不對?

感知,在這裡所起的作用是,你把這三個字寫出來,而且不寫錯。

認知,就是你聽不聽得懂,比如說,我跟我女兒說“我很帥”,她1歲的時候聽不懂,2歲的時候聽不懂,3歲突然聽得懂了,但是她可能會來一句“帥”是什麼意思?跟“美”有關係嗎?她還在一個模糊認知階段,到5歲的時候她給我來了一句“爸爸臭美”。

分析,分析是基於每個人各自掌握知識的背景和場景,你要對它做一個資訊的加工。比如我說“我很帥”,我老婆可能就會來一句“是啊,我就是覺得你很帥,所以我找了你”,可能在座很多人覺得這個人沒有自知之明,每個人會根據自己的知識背景做出一個判斷。這是分析。

決策,比如說我老婆決定找了我,在座聽了這句話就決定把我拉黑。

這就是人整個對資訊處理的全過程。認知和分析是目前人工智慧最難的,我們現在大多數的資訊技術比如說語音辨識、圖像識別都是在這一塊,但是這個認知是怎麼回事呢?就是我剛才說的。

舉個例子,我的專業背景是做人工智慧裡面的認知智慧。什麼是認知智慧?可能在座是一個模糊的概念,如果我說I am a scientist rich in collective intelligence 可能英語好的你聽得懂我說的每一個詞,但是合起來你聽不懂我在說什麼,因為 collective intelligence 是一個非常專門的領域,你的大腦會告訴你懂還是不懂。

比如我說華為手機,我女兒5歲,她太小聽不懂華為,但是她聽得懂什麼?她聽得懂小馬寶麗和小仙女的故事,但是她聽不懂華為這個詞,我們聽得懂,因為我們的大腦認知庫裡反射給你“華為”這個詞你是知道的,但是你並沒有做出下一步的分析,直到真正分析的時候你才會把相關一些資訊提取出來做決策。

這就是我們目前人去做決策資訊處理的全過程。現在要用機器來加速這個過程,就要做到機器的認知處理。難在哪裡呢?

這是三大巨頭。Yan LeCun今年年初在清華說的,現在整個人工智慧的認知智慧天花板就在於“讓機器掌握人類的常識”。就像我剛才說的,比如說華為這是一個常識,清華大學、北京大學是一個常識,常識是什麼?就是大家都知道,語言其實本身就有很多是常識,我們才能交流,如果我說的每一個詞你們都不懂,那就沒法交流了。比如說我爸爸去了美國,他沒法獨立去生活和工作,就是因為沒法跟人溝通。所以大家基於的常識都不一樣。

包括一些服裝的品牌,在美國非常知名的品牌。比如說有一個品牌叫 Anthropologie,中國的女生有幾個知道這個牌子的嗎?所以這就是認知基於環境和場景的。

所以,如何能夠讓機器去掌握人類的常識,這是目前整個認知智慧所需要突破的一個天花板。

認知智慧是一個非常複雜和交叉的學科,可以說是有非常多的領域都去做了這個,包括生物學、物理學、哲學、社會學、經濟學、市場心理學、神經科學,很不幸,做認知智慧都必須要涉獵每個學科,從不同的角度去看認知。

舉個例子,我們來做一個小實驗,我給大家兩個選擇,A 是我現在立刻給你300塊錢,B是我一年之後給你1000塊錢。請選擇 A 的立刻拿300塊錢的舉手,這個實驗總是人越多越成功,就是50%。

那就說明什麼呢?它顛覆了經濟學,傳統經濟學認為人是理性的,其實人是非理性的。如果從理性來講,1000 塊錢是更多的,但是人的非理性行為導致我們決策上其實是有很多主觀的偏差。

機器認知最大的難點就在於在認知偏差的情況下,機器還要給出一個相對讓人覺得靠譜的答案。

比如我剛才說“我很帥”,機器要能給出一個靠譜的東西,它不能跟你說這個人帥或者是不帥,它也必須要給出一個社會學裡後現代學那樣,就是一切都是相對的,沒有絕對的。

市場心理學、神經科學的人發現人是一個非常大的矛盾體,愛和不愛,愛和恨,信與不信都是同時存在於人的大腦,因為在人的大腦裡面,愛和恨,信與不信是根本截然不同的大腦反射區,所以人就是一個思維矛盾體。這種情況下如何做機器認知?這就是一個巨大的挑戰。

整個做個的邏輯,一定要做三個大的向量:真相向量、場景向量、投影向量。然後再去通過無限接近於真相,再找到具體的場景,再做投影。這是整個目前做認知分析所需要突破的三個點。

為了做好這一點,我在哈爾濱工業大學做副教授的時候承擔了一個國家項目,史上首個社會經濟圖譜,通過這個圖譜去對整個中國經濟社會建模,學習整個社會是怎麼樣的。

這是中國,其實我們現在也在借鑒美國的資料,希望在未來兩年也開始建美國的社會性圖譜。因為剛才說了,認知是基於環境的,脫離環境的認知是沒效的,同樣的一個詞在不同的場景下理解是不一樣的。

要做好這一點,還要有其它一些基礎條件:

主動學習

這是要突破這個認知很重要的事情,機器人在它不懂的時候我們要教它方法,它能夠主動學習,而不是等著我來教它,我只能教它學習的方法,而不是教它怎麼做。

教材可靠

一個小孩如果說他的父母是他最好的老師,他的父母把他教壞了就教壞了,所以說對教材的選擇我們認為是非常非常重要的。

語境認知

比如說喝酒,這個詞在不同的語境下理解是完全不一樣的,如果你在找工作的場景下你說很會喝酒,這說明什麼呢?也許你適合做公關,也許你適合做銷售,但是如果說現在在法院大官司,很可能你就撞人了,酒駕。

清晰建模

如果說要幫助人輔助、決策,定性是絕對不夠的,所以普通的知識圖譜是沒用的,這兒我們要求非常高度、精細的全量化建模,這種新的方式,這樣才能真的深入我們的工作,幫助人準確地做出判斷和決策。

iPIN 在認知智慧方面的應用

我們在這個基礎上做了三方面的應用:1.生涯規劃;2.企業招聘;3.供應鏈匹配

我在哈爾濱工業大學的時候,做一個公益項目,當時就是為了能夠幫助人做決策,看看能不能解決這樣的問題,後來發現一做就不可收拾了。

在這個領域裡面我們做了一個小的產品叫“完美志願”,我們當時做這個產品,就是説明人填報告和志願的。遇到了最大的挑戰是什麼呢?

第一,規則不清楚。

那要做人生規劃遇到的挑戰跟 AlphaGo 比的話,其實比 AlphaGo 下圍棋要困難得多,AlphaGo 裡面所有圍棋的規則是非常清楚的,也非常簡單。但是在我們這個大社會裡,絕大多數規則我們是不清楚的,甚至都是潛規則。所以,我們首先得用機器歸納各種社會的規則,而且這種規則是變化的,不停在變動,今年這個火,明年那個火。所以還是一個動態的。

第二,對手不明確。

在下圍棋的時候你的對手是非常明確的,而在人生競爭裡面,我們的競爭對手是非常不明確的,你根本就不知道是誰,是環境嗎?有人說生活就像是強☆禁☆姦,如果不能反抗就順從。所以你很多時候一定要找准自己的對手是誰,才知道採取怎樣的策略。

第三,價值觀問題

更加難辦的事情就是價值觀的問題情。在下圍棋的時候價值觀是贏就可以了,給 AlphaGo 加了一個更多的價值觀——贏,而且是最低風險的贏,不要追求勝幾子,而且以最低風險的方式贏就可以了。所以你看到 AlphaGo 並不急於勝多子,只要勝1子就可以了。

但是我們在人生規劃的時候,價值觀卻有很多樣,很多人想要錢,男生就想要儘快地迎娶白富美,登上人生巔峰。有人的價值觀是平平淡淡才是真,多少錢無所謂,只要過得開心就好。還有人是追求很巨大的社會影響力,所以就有人把美國總統給殺了。

所以人生觀是非常不一樣的,價值觀會導致各種計算跟下圍棋這種虛擬要複雜得多。

為了解決這些問題,我們花了非常長的時間做這些事情。很慶倖地是,經過四年的努力,我們在這個領域得到了廣大用戶的認可,用戶量絕對第一,而且被《中國教育報》評為全國老師最認可的一個產品。

可能這個跟大家來講關係不太大,但是說到下一步,我們現在正在做下一步的導航,就是真的人生導航儀,這是一個陪伴產品,從15歲到30歲,我們已經機器學習了上億人的成長軌跡,包括各種成功的、不成功的。如果說你沒有理想,就幫助你確定一個理想的方向。如果你已經有理想了,那就幫助你從你的現狀和理想之間找到一個最優的路徑,在人生每個關鍵的路口為你指引方向。

這是我們的產品,我們現在正在做高中和大學階段,也希望未來能夠逐步滲透到職場階段。

我們還做了一個嘗試領域是招聘。

說到做招聘,這是一個血淚史,我是2005年第二次創業的時候做了一個項目,那個專案專門做人和專案的匹配,結果發現效率非常低,我當時天真地以為這是一個關鍵字搜索的問題。所以我2007年進了美國國家旅遊與電子商務實驗室,專門做搜索。結果做了一年的搜索,發現根本不是一個搜索的問題,搜索的關鍵詞根本解決不了這個問題。

舉個例子,在座有很多美女,左邊有很多美女,那邊有很多漂亮妹子。其實這是說的一句話,一個意思,但是關鍵字不一樣,所以不是關鍵字匹配的問題,是認知搜索、認知匹配的問題,所以就這樣,我就進入到了一個認知智慧領域。

招聘領域也是一樣的,這是一個可以說是全世界所有企業、所有人都會被涉及的一個領域,但是很可惜,這一塊完全是靠HR用人工做的,平均每個HR每天要花40%的時間檢索簡歷,然後要輸入一個簡歷,你要想用什麼關鍵字,無論是51、智聯、獵聘也好,你要想你用一個什麼樣的關鍵字,然後用了這個關鍵字之後,所有的簡歷這些人怎麼樣?符不符合?都是用人工一個一個點開看去判斷,由於用的是關鍵字匹配,所以排名第一和排名第一百的根本就沒有什麼區別,並沒有說他們有品質的區別。

比如說我回國以後找工作,我太太說強生有一個崗位特別適合她,她就投了簡歷,結果不停地被淘汰,連面試的機會都沒給。我後來我通過關係就找到強生的那個負責人,我就把我老婆的簡歷給他,他說特別適合,但是問HR為什麼不給面試機會?HR說關鍵字不匹配。

所以,這就是整個影響我們全社會人才去到該被需要的地方去最大阻力,如何通過認知智慧解決這個高效匹配的問題可以說是我過去12年就一直在做這樣一個事,做了整整12年,遇到的挑戰其實就是屬於各種企業的理解。我們公司就做兩件事:用機器分析人、分析企業。

如何讓機器對企業的分析能夠達到HR的水準?甚至勝過HR,達到專家的水準?

社會是變動的,各種崗位,那天來了一個華大基因的一個朋友,他就輸了一個崗位,那個崗位是一個很罕見的崗位,新出來的崗位機器如何能夠快速學習去認知,這也是我們一個很大的挑戰。

當然更大的一個挑戰是高速計算,對於幾千萬人的簡歷在簡歷庫裡逐字、逐詞、逐句做認知分析,這個計算量是天量的,可以說我們花了很長的時間,花了兩年多的時間才突破了這個計算,達到了毫秒級,就是現在4000萬人的簡歷全量地語義認知計算算一遍下來,只需要花大概200毫秒。

綁定管道之後就會把你所有的這種崗位給拉下來,自動幫助你生成自動招聘的策略,然後上網幫助你找所有可能潛在的人,把這些人以及投簡歷的候選人拉回來之後,對他做認知分析,對每個人進行多達300多個維度的分析,然後這些分析之後給出一個諮詢學習得到的一個加權分,然後根據不同的崗位做出不同排序。所以,排在最上面的相比排到後面的人,崗位是更加適合你的需要的。

整個這個過程,它最核心的地方就是我們能夠對人進行多維度的,經過表面的語言,然後做到背後深度的像人一樣的認知分析。比如說,這裡要找一個,這是獵聘網上的一個職位,直接拉過來,他是要找一個房地產行業的銷售。找出這樣一個人來,這裡有很多大家看到好多機器輔助標藍的部分,標藍的這些部分就是機器認為從認知層面來講是符合你左邊所列的這些條件的,右邊還列出了各種各樣的緯度,這些緯度都是從量化的角度的計算。可以說,我們這方面的維度計算由於是用的全量化,而人的大腦匹配是用的模糊計算,這塊可以說是更精准的。

尤其是當招聘行業的大佬來我們公司線上體驗的時候說,誒!你們是不是請了房地產專家?原因是,這裡說要找房地產行業的銷售,結果那邊就把一些萬科這種詞都自動的篩選出來。但其實沒有,我們公司沒有任何房地產專家,甚至我們公司連買了房子的人都很少,因為我們公司在深圳,深圳房價實在是太逆天了對吧?沒有。這一切都是我們把方法教給機器,機器自動去學習、自動去標注出來的,這樣就可以大大節省人對簡歷的分析以及排序的時間。

可以說,從輸入的時間到做判斷的時間,到匹配的準確率和人才庫使用,都有一個極大的提升。這樣的話,就可以對我們有20倍的提升。可以說,這樣就可以對未來做一個不是很大膽的語言:這個行為目前來看,我們目前基本上把我們所知道的HR行業跟人比較的分析,絕大部分都已經解決了,而且絕大部分都已經做的比HR更好。當然,可能跟專家比還是有一定距離,但比HR做的更好,就是因為HR他不是專家嘛,這方面還是屬於有很大的,可以說是在五年之內有大量的招聘專業一定會被大量的解放出來,去解放做更多的。比如說騰訊的HR說,這樣的話他們就可以做更多人工的關懷事情,比如說程式師、安慰師之類的。

這個產品可以說是整整做了12年,這個項目已經做了三年,二維碼大家可以掃,可以身臨體驗一下,如果說你對這方面有興趣。我這個人因為有產品潔癖,一個東西如果不能做到特別讓人驚豔,我是不會放出來的。這個項目內測了已經有一年了,不停地在改進,應該就在最近兩個月就在全國大範圍地免費推出,能夠讓所有企業的HR得到這樣的解放。

再一個領域就是供應鏈匹配。

供應鏈匹配這個是我們當時跟兩個上市公司交流,比如說在商業地產裡如何拿地,從拿到地到開始建設,這中間整個供應鏈的流程目前有兩年,他們積累了大量的歷史資料,如何通過歷史資料學習加速這個供應鏈匹配的問題,應該是所有的傳統企業都會面臨一個很重的問題。這兒其實也是面臨同樣的,對企業業務的認知、多維度的深度認知和各種企業關係的認知,這兒在未來對傳統行業有非常大的説明,能夠加速企業的發展。一塊地在那兒放兩年,收租得收多少?所以這是一個巨大的資源浪費。

和 IBM Watson 的區別

正是由於我們做了這些業務之後,我們其實做這個東西可以通用到很多領域。比如說我們現在正在做一個大的司法項目,有些法律公司用我們這套(做招聘的這套)遷移到做法律,只花了三個月就可以拿去做法律,所以說它擁有很好的在商業領域的知識分析的開放性和通用性。

所以我們也經常被另外一家很有名的公司叫 IBM,和 IBM Watson 做對比,因為 Watson 的定位也是做商業認知分析,和我們的定位是一樣的。

今年2月份的時候在美國一個大會上,《華爾街日報》用整個版面報導我們公司,把我們公司跟 IBM Watson去對比,我們會被問起跟 Watson 的區別在哪裡,包括 Watson 海外的用戶,進入中國的時候也會想要用我們這個東西做嘗試。

這裡面的區別我覺得主要有幾個:

首先是我們切入的領域非常不一樣。這個導致我們整個知識陳列的方式非常不一樣。Watson 是從醫療領域切入,尤其是從醫療的腫瘤切入,實際上很多人以為 Watson 是一個問答系統,實際上問答系統只是它的一個模組而已,它只要是做認知分析。它是從醫療切入,而我們是從生涯規劃和招聘切入,所以我們更關心的是人和企業這方面的分析,和他們關注的是醫療方案分析。

Watson 早期是完全基於專家系統和 NLP 的方向,是2015年才開始組建這種深度學習,才往這方面走的,但是由於它他大量前期都是依賴於專家系統,所以即便是它從它的腫瘤診斷遷移到糖尿病診斷,遷移的成本都非常高,因為它是專家系統。

而我們所有的分析全部是基於深度學習,所以我們的遷移成本在我們所做的商業領域分析領域裡,我們的成本相對來說比較低。

可以說在這方面,未來認知智慧想要往商業領域滲透是大勢所趨,它將決定了整個商業有多大程度會被技術提升。現在 AI 可以說是正在進入到人工智慧的下一個時代,從感知過渡到認知智慧。希望在未來不久的將來,我們新的產品能夠説明大家在工作中讓決策更智慧,能夠更有效率。

但是,一旦你經歷過這事兒就知道,這個事兒是個小事,大概只用一個禮拜就搞定它了。但是要真正把這個事兒做好,你卻需要非常多條件,而且它對你的一生影響是非常大的。比如說,我因為當年填錯了一個志願,我的人生在最美好的年華,至少浪費了6年,包括我周圍的很多人都是這樣,超過71%的人在大學畢業之後所從事的工作跟自己所學的專業是無關的。這就包括我們公司是一個人工智慧的公司,我們公司絕大多數人也是這種情況。

那填報志願需要哪些條件呢?

瞭解自我

你瞭解自我嗎?我在美國的時候很有意思,有一次受了一個刺激,問了一下我周圍的中國留學生,發現絕大多數人都不知道自己是否喜歡自己的現在,也不知道自己喜歡什麼。所以,瞭解自我是個很大的問題。

10萬+可選項

中國2500多所大學,10萬多個院系,市場上有12000多種職業,這種組合超過1億個,你如何在裡面選?

明規則+潛規則

有一些明規則,每個學校的每個專業,在每個省的填報規則都不一樣。這些規則你都瞭解嗎?還有大量潛規則。比如說,機械系女生少,這個規則學校是不會告訴你的,你自己考慮吧?女生少代表什麼?還有大量大量其它的各種潛規則,比如中華女子學院也招男生你知道嗎?不知道。真的!中華女子學院有1%是男生,在播音系,因為要男女對練。

決策方法

怎樣才會有一套科學的決策方法?我們每天都在不停的做決策,科學的決策方法依據是什麼?

可惜這一切,這麼重要的事,你的一生只有三天去決定。根本搞不定的,它遠遠超出了人能夠通過自己人的大腦的認知去解決的問題範疇。

那接下來需要怎麼辦呢?所以,就出現了一種職業,叫做高考志願填報專家,這種專家收費幾千到幾萬不等。還有很多很多事情都是這樣的,比如招聘、招新、招標、招生、招商,找投資、找工作、找專家,這些事情現在都是專家在做。這些專家在我們目前的生活中,可以說是很常見的。

就像剛剛說的問題,我們不可能讓一個5歲的小孩去做投資,因為確實裡面所包含的信息量、所認知的東西實在是太多了。

那我們怎麼辦呢?人工智慧將要引起第四次工業革命,那我們怎麼去用AI加速這個進程去真的能夠加速我們的工作效率,能夠代替我們在工作中去理解大量的這些東西,然後幫助我們做決策呢?

認知智慧如何幫人做決策

這是現在人工智慧真的要想在商業領域大展宏圖,必須要去突破的一個領域,這塊其實就是認知。

我們回顧一下人是怎麼思考問題的:

人的認知其實就分很簡單4個步驟,比如從感知資訊-認知資訊-分析-做出決策,就這麼4個環節,我們所有的事情其實就不停的在這4個環節裡迴圈。

我舉個小例子,比如說“我很帥”,聽清楚了,我很帥!三個字對不對?

感知,在這裡所起的作用是,你把這三個字寫出來,而且不寫錯。

認知,就是你聽不聽得懂,比如說,我跟我女兒說“我很帥”,她1歲的時候聽不懂,2歲的時候聽不懂,3歲突然聽得懂了,但是她可能會來一句“帥”是什麼意思?跟“美”有關係嗎?她還在一個模糊認知階段,到5歲的時候她給我來了一句“爸爸臭美”。

分析,分析是基於每個人各自掌握知識的背景和場景,你要對它做一個資訊的加工。比如我說“我很帥”,我老婆可能就會來一句“是啊,我就是覺得你很帥,所以我找了你”,可能在座很多人覺得這個人沒有自知之明,每個人會根據自己的知識背景做出一個判斷。這是分析。

決策,比如說我老婆決定找了我,在座聽了這句話就決定把我拉黑。

這就是人整個對資訊處理的全過程。認知和分析是目前人工智慧最難的,我們現在大多數的資訊技術比如說語音辨識、圖像識別都是在這一塊,但是這個認知是怎麼回事呢?就是我剛才說的。

舉個例子,我的專業背景是做人工智慧裡面的認知智慧。什麼是認知智慧?可能在座是一個模糊的概念,如果我說I am a scientist rich in collective intelligence 可能英語好的你聽得懂我說的每一個詞,但是合起來你聽不懂我在說什麼,因為 collective intelligence 是一個非常專門的領域,你的大腦會告訴你懂還是不懂。

比如我說華為手機,我女兒5歲,她太小聽不懂華為,但是她聽得懂什麼?她聽得懂小馬寶麗和小仙女的故事,但是她聽不懂華為這個詞,我們聽得懂,因為我們的大腦認知庫裡反射給你“華為”這個詞你是知道的,但是你並沒有做出下一步的分析,直到真正分析的時候你才會把相關一些資訊提取出來做決策。

這就是我們目前人去做決策資訊處理的全過程。現在要用機器來加速這個過程,就要做到機器的認知處理。難在哪裡呢?

這是三大巨頭。Yan LeCun今年年初在清華說的,現在整個人工智慧的認知智慧天花板就在於“讓機器掌握人類的常識”。就像我剛才說的,比如說華為這是一個常識,清華大學、北京大學是一個常識,常識是什麼?就是大家都知道,語言其實本身就有很多是常識,我們才能交流,如果我說的每一個詞你們都不懂,那就沒法交流了。比如說我爸爸去了美國,他沒法獨立去生活和工作,就是因為沒法跟人溝通。所以大家基於的常識都不一樣。

包括一些服裝的品牌,在美國非常知名的品牌。比如說有一個品牌叫 Anthropologie,中國的女生有幾個知道這個牌子的嗎?所以這就是認知基於環境和場景的。

所以,如何能夠讓機器去掌握人類的常識,這是目前整個認知智慧所需要突破的一個天花板。

認知智慧是一個非常複雜和交叉的學科,可以說是有非常多的領域都去做了這個,包括生物學、物理學、哲學、社會學、經濟學、市場心理學、神經科學,很不幸,做認知智慧都必須要涉獵每個學科,從不同的角度去看認知。

舉個例子,我們來做一個小實驗,我給大家兩個選擇,A 是我現在立刻給你300塊錢,B是我一年之後給你1000塊錢。請選擇 A 的立刻拿300塊錢的舉手,這個實驗總是人越多越成功,就是50%。

那就說明什麼呢?它顛覆了經濟學,傳統經濟學認為人是理性的,其實人是非理性的。如果從理性來講,1000 塊錢是更多的,但是人的非理性行為導致我們決策上其實是有很多主觀的偏差。

機器認知最大的難點就在於在認知偏差的情況下,機器還要給出一個相對讓人覺得靠譜的答案。

比如我剛才說“我很帥”,機器要能給出一個靠譜的東西,它不能跟你說這個人帥或者是不帥,它也必須要給出一個社會學裡後現代學那樣,就是一切都是相對的,沒有絕對的。

市場心理學、神經科學的人發現人是一個非常大的矛盾體,愛和不愛,愛和恨,信與不信都是同時存在於人的大腦,因為在人的大腦裡面,愛和恨,信與不信是根本截然不同的大腦反射區,所以人就是一個思維矛盾體。這種情況下如何做機器認知?這就是一個巨大的挑戰。

整個做個的邏輯,一定要做三個大的向量:真相向量、場景向量、投影向量。然後再去通過無限接近於真相,再找到具體的場景,再做投影。這是整個目前做認知分析所需要突破的三個點。

為了做好這一點,我在哈爾濱工業大學做副教授的時候承擔了一個國家項目,史上首個社會經濟圖譜,通過這個圖譜去對整個中國經濟社會建模,學習整個社會是怎麼樣的。

這是中國,其實我們現在也在借鑒美國的資料,希望在未來兩年也開始建美國的社會性圖譜。因為剛才說了,認知是基於環境的,脫離環境的認知是沒效的,同樣的一個詞在不同的場景下理解是不一樣的。

要做好這一點,還要有其它一些基礎條件:

主動學習

這是要突破這個認知很重要的事情,機器人在它不懂的時候我們要教它方法,它能夠主動學習,而不是等著我來教它,我只能教它學習的方法,而不是教它怎麼做。

教材可靠

一個小孩如果說他的父母是他最好的老師,他的父母把他教壞了就教壞了,所以說對教材的選擇我們認為是非常非常重要的。

語境認知

比如說喝酒,這個詞在不同的語境下理解是完全不一樣的,如果你在找工作的場景下你說很會喝酒,這說明什麼呢?也許你適合做公關,也許你適合做銷售,但是如果說現在在法院大官司,很可能你就撞人了,酒駕。

清晰建模

如果說要幫助人輔助、決策,定性是絕對不夠的,所以普通的知識圖譜是沒用的,這兒我們要求非常高度、精細的全量化建模,這種新的方式,這樣才能真的深入我們的工作,幫助人準確地做出判斷和決策。

iPIN 在認知智慧方面的應用

我們在這個基礎上做了三方面的應用:1.生涯規劃;2.企業招聘;3.供應鏈匹配

我在哈爾濱工業大學的時候,做一個公益項目,當時就是為了能夠幫助人做決策,看看能不能解決這樣的問題,後來發現一做就不可收拾了。

在這個領域裡面我們做了一個小的產品叫“完美志願”,我們當時做這個產品,就是説明人填報告和志願的。遇到了最大的挑戰是什麼呢?

第一,規則不清楚。

那要做人生規劃遇到的挑戰跟 AlphaGo 比的話,其實比 AlphaGo 下圍棋要困難得多,AlphaGo 裡面所有圍棋的規則是非常清楚的,也非常簡單。但是在我們這個大社會裡,絕大多數規則我們是不清楚的,甚至都是潛規則。所以,我們首先得用機器歸納各種社會的規則,而且這種規則是變化的,不停在變動,今年這個火,明年那個火。所以還是一個動態的。

第二,對手不明確。

在下圍棋的時候你的對手是非常明確的,而在人生競爭裡面,我們的競爭對手是非常不明確的,你根本就不知道是誰,是環境嗎?有人說生活就像是強☆禁☆姦,如果不能反抗就順從。所以你很多時候一定要找准自己的對手是誰,才知道採取怎樣的策略。

第三,價值觀問題

更加難辦的事情就是價值觀的問題情。在下圍棋的時候價值觀是贏就可以了,給 AlphaGo 加了一個更多的價值觀——贏,而且是最低風險的贏,不要追求勝幾子,而且以最低風險的方式贏就可以了。所以你看到 AlphaGo 並不急於勝多子,只要勝1子就可以了。

但是我們在人生規劃的時候,價值觀卻有很多樣,很多人想要錢,男生就想要儘快地迎娶白富美,登上人生巔峰。有人的價值觀是平平淡淡才是真,多少錢無所謂,只要過得開心就好。還有人是追求很巨大的社會影響力,所以就有人把美國總統給殺了。

所以人生觀是非常不一樣的,價值觀會導致各種計算跟下圍棋這種虛擬要複雜得多。

為了解決這些問題,我們花了非常長的時間做這些事情。很慶倖地是,經過四年的努力,我們在這個領域得到了廣大用戶的認可,用戶量絕對第一,而且被《中國教育報》評為全國老師最認可的一個產品。

可能這個跟大家來講關係不太大,但是說到下一步,我們現在正在做下一步的導航,就是真的人生導航儀,這是一個陪伴產品,從15歲到30歲,我們已經機器學習了上億人的成長軌跡,包括各種成功的、不成功的。如果說你沒有理想,就幫助你確定一個理想的方向。如果你已經有理想了,那就幫助你從你的現狀和理想之間找到一個最優的路徑,在人生每個關鍵的路口為你指引方向。

這是我們的產品,我們現在正在做高中和大學階段,也希望未來能夠逐步滲透到職場階段。

我們還做了一個嘗試領域是招聘。

說到做招聘,這是一個血淚史,我是2005年第二次創業的時候做了一個項目,那個專案專門做人和專案的匹配,結果發現效率非常低,我當時天真地以為這是一個關鍵字搜索的問題。所以我2007年進了美國國家旅遊與電子商務實驗室,專門做搜索。結果做了一年的搜索,發現根本不是一個搜索的問題,搜索的關鍵詞根本解決不了這個問題。

舉個例子,在座有很多美女,左邊有很多美女,那邊有很多漂亮妹子。其實這是說的一句話,一個意思,但是關鍵字不一樣,所以不是關鍵字匹配的問題,是認知搜索、認知匹配的問題,所以就這樣,我就進入到了一個認知智慧領域。

招聘領域也是一樣的,這是一個可以說是全世界所有企業、所有人都會被涉及的一個領域,但是很可惜,這一塊完全是靠HR用人工做的,平均每個HR每天要花40%的時間檢索簡歷,然後要輸入一個簡歷,你要想用什麼關鍵字,無論是51、智聯、獵聘也好,你要想你用一個什麼樣的關鍵字,然後用了這個關鍵字之後,所有的簡歷這些人怎麼樣?符不符合?都是用人工一個一個點開看去判斷,由於用的是關鍵字匹配,所以排名第一和排名第一百的根本就沒有什麼區別,並沒有說他們有品質的區別。

比如說我回國以後找工作,我太太說強生有一個崗位特別適合她,她就投了簡歷,結果不停地被淘汰,連面試的機會都沒給。我後來我通過關係就找到強生的那個負責人,我就把我老婆的簡歷給他,他說特別適合,但是問HR為什麼不給面試機會?HR說關鍵字不匹配。

所以,這就是整個影響我們全社會人才去到該被需要的地方去最大阻力,如何通過認知智慧解決這個高效匹配的問題可以說是我過去12年就一直在做這樣一個事,做了整整12年,遇到的挑戰其實就是屬於各種企業的理解。我們公司就做兩件事:用機器分析人、分析企業。

如何讓機器對企業的分析能夠達到HR的水準?甚至勝過HR,達到專家的水準?

社會是變動的,各種崗位,那天來了一個華大基因的一個朋友,他就輸了一個崗位,那個崗位是一個很罕見的崗位,新出來的崗位機器如何能夠快速學習去認知,這也是我們一個很大的挑戰。

當然更大的一個挑戰是高速計算,對於幾千萬人的簡歷在簡歷庫裡逐字、逐詞、逐句做認知分析,這個計算量是天量的,可以說我們花了很長的時間,花了兩年多的時間才突破了這個計算,達到了毫秒級,就是現在4000萬人的簡歷全量地語義認知計算算一遍下來,只需要花大概200毫秒。

綁定管道之後就會把你所有的這種崗位給拉下來,自動幫助你生成自動招聘的策略,然後上網幫助你找所有可能潛在的人,把這些人以及投簡歷的候選人拉回來之後,對他做認知分析,對每個人進行多達300多個維度的分析,然後這些分析之後給出一個諮詢學習得到的一個加權分,然後根據不同的崗位做出不同排序。所以,排在最上面的相比排到後面的人,崗位是更加適合你的需要的。

整個這個過程,它最核心的地方就是我們能夠對人進行多維度的,經過表面的語言,然後做到背後深度的像人一樣的認知分析。比如說,這裡要找一個,這是獵聘網上的一個職位,直接拉過來,他是要找一個房地產行業的銷售。找出這樣一個人來,這裡有很多大家看到好多機器輔助標藍的部分,標藍的這些部分就是機器認為從認知層面來講是符合你左邊所列的這些條件的,右邊還列出了各種各樣的緯度,這些緯度都是從量化的角度的計算。可以說,我們這方面的維度計算由於是用的全量化,而人的大腦匹配是用的模糊計算,這塊可以說是更精准的。

尤其是當招聘行業的大佬來我們公司線上體驗的時候說,誒!你們是不是請了房地產專家?原因是,這裡說要找房地產行業的銷售,結果那邊就把一些萬科這種詞都自動的篩選出來。但其實沒有,我們公司沒有任何房地產專家,甚至我們公司連買了房子的人都很少,因為我們公司在深圳,深圳房價實在是太逆天了對吧?沒有。這一切都是我們把方法教給機器,機器自動去學習、自動去標注出來的,這樣就可以大大節省人對簡歷的分析以及排序的時間。

可以說,從輸入的時間到做判斷的時間,到匹配的準確率和人才庫使用,都有一個極大的提升。這樣的話,就可以對我們有20倍的提升。可以說,這樣就可以對未來做一個不是很大膽的語言:這個行為目前來看,我們目前基本上把我們所知道的HR行業跟人比較的分析,絕大部分都已經解決了,而且絕大部分都已經做的比HR更好。當然,可能跟專家比還是有一定距離,但比HR做的更好,就是因為HR他不是專家嘛,這方面還是屬於有很大的,可以說是在五年之內有大量的招聘專業一定會被大量的解放出來,去解放做更多的。比如說騰訊的HR說,這樣的話他們就可以做更多人工的關懷事情,比如說程式師、安慰師之類的。

這個產品可以說是整整做了12年,這個項目已經做了三年,二維碼大家可以掃,可以身臨體驗一下,如果說你對這方面有興趣。我這個人因為有產品潔癖,一個東西如果不能做到特別讓人驚豔,我是不會放出來的。這個項目內測了已經有一年了,不停地在改進,應該就在最近兩個月就在全國大範圍地免費推出,能夠讓所有企業的HR得到這樣的解放。

再一個領域就是供應鏈匹配。

供應鏈匹配這個是我們當時跟兩個上市公司交流,比如說在商業地產裡如何拿地,從拿到地到開始建設,這中間整個供應鏈的流程目前有兩年,他們積累了大量的歷史資料,如何通過歷史資料學習加速這個供應鏈匹配的問題,應該是所有的傳統企業都會面臨一個很重的問題。這兒其實也是面臨同樣的,對企業業務的認知、多維度的深度認知和各種企業關係的認知,這兒在未來對傳統行業有非常大的説明,能夠加速企業的發展。一塊地在那兒放兩年,收租得收多少?所以這是一個巨大的資源浪費。

和 IBM Watson 的區別

正是由於我們做了這些業務之後,我們其實做這個東西可以通用到很多領域。比如說我們現在正在做一個大的司法項目,有些法律公司用我們這套(做招聘的這套)遷移到做法律,只花了三個月就可以拿去做法律,所以說它擁有很好的在商業領域的知識分析的開放性和通用性。

所以我們也經常被另外一家很有名的公司叫 IBM,和 IBM Watson 做對比,因為 Watson 的定位也是做商業認知分析,和我們的定位是一樣的。

今年2月份的時候在美國一個大會上,《華爾街日報》用整個版面報導我們公司,把我們公司跟 IBM Watson去對比,我們會被問起跟 Watson 的區別在哪裡,包括 Watson 海外的用戶,進入中國的時候也會想要用我們這個東西做嘗試。

這裡面的區別我覺得主要有幾個:

首先是我們切入的領域非常不一樣。這個導致我們整個知識陳列的方式非常不一樣。Watson 是從醫療領域切入,尤其是從醫療的腫瘤切入,實際上很多人以為 Watson 是一個問答系統,實際上問答系統只是它的一個模組而已,它只要是做認知分析。它是從醫療切入,而我們是從生涯規劃和招聘切入,所以我們更關心的是人和企業這方面的分析,和他們關注的是醫療方案分析。

Watson 早期是完全基於專家系統和 NLP 的方向,是2015年才開始組建這種深度學習,才往這方面走的,但是由於它他大量前期都是依賴於專家系統,所以即便是它從它的腫瘤診斷遷移到糖尿病診斷,遷移的成本都非常高,因為它是專家系統。

而我們所有的分析全部是基於深度學習,所以我們的遷移成本在我們所做的商業領域分析領域裡,我們的成本相對來說比較低。

可以說在這方面,未來認知智慧想要往商業領域滲透是大勢所趨,它將決定了整個商業有多大程度會被技術提升。現在 AI 可以說是正在進入到人工智慧的下一個時代,從感知過渡到認知智慧。希望在未來不久的將來,我們新的產品能夠説明大家在工作中讓決策更智慧,能夠更有效率。