您的位置:首頁>科技>正文

思必馳初敏:人工智慧技術產業化的幾大要素

4月25日, 未來之旅之中美人工智慧的未來——聯想之星&矽谷銀行AI論壇在北京舉行。 論壇現場, 思必馳副總裁、北京研發院院長初敏,

做了《AI產業化的關鍵因素》的主題演講。

初敏在2017年8月加入思必馳, 在此之前, 初敏在阿裡雲任IDST智慧語音交互方向的負責人。 加入阿裡之前, 初敏在微軟亞洲研究院從事了將近10年的研究工作, 創建和領導語音合成研究小組。

在思必馳, 初敏也在致力於建立一個從基礎研究到應用落地的團隊, 為思必馳拓展新的業務路線。

初敏在演講中表示, 從企業服務的角度出發, 實現互動式的智慧服務, 以及如何實現大規模生產和定制, 是AI實現產業化的兩大要素。 她表示, 所有的交互, 目的都是要企業提供智慧的服務, AI應用在企業中落地, 要站在企業的視角上, 從服務的角度出發, 把整個服務體系變得智慧化。 思必馳目前, 也在關注主動式的交互和資訊傳播。

而要實現AI產業化, 還需要AI技術的門檻降低、複雜的東西簡單化, 才能實現規模化的生產和定制。 否則, AI技術公司, 就還是企業在做“人力外包”。

最後, 初敏也強調了人才的問題。 不僅AI技術人才目前非常緊張, 同時, 理解場景的應用型人才也是非常欠缺的。 AI產業化的鏈條非常長, 需要更多的企業、更深度的協作, 才能讓AI技術真正廣泛應用起來。

以下為初敏博士演講實錄, 經黑智整理:

初敏:今天很高興能到這跟大家做一些分享, 我這個題目講的是產業化, 是從技術視角來看的。 我早年在微軟研究院, 是做研究出身的, 後來到了阿裡巴巴, 就越來越偏應用, 偏真正做實際的東西。

現在我在思必馳, 我覺得我們更是希望把能把語言的交互技術,

真正地做到能用, 所以很關心這方面的問題。 大家看到了產業化的機會, 而不光是一個高大上的演算法、某一個很好的技術。 在技術真正走向真正應用的過程中, 過去這幾年我的確碰了很多壁, 有很多的的經驗, 所以今天主要是想跟大家分享這方面的看法。

隨著PC到移動互聯網到現在講的IoT物聯網, 其實最關鍵的是連接關係更密切。

到物聯網時代, 每一個企業和自己的每一個客戶, 都有非常高維度的關聯, 在這個情況下, 其實很多事情就和原來都不一樣了, 等於我們自己都在考慮怎麼運營, 自己怎麼把最新的資訊傳遞給客戶。

我們前一陣關心的人工智慧應用更多的是從人的視角、就是終端的人來看,

所以看的實際上是每一個個體的人。 我們在獲取生活服務的智慧化的過程中, 關注很多的不同設備。 像語音交互, 前面這兩年最關注的問題, 不管是音箱還是車載設備, 第一個要解決的就是接入問題, 還比如信號處理、抗噪等等這些, 這些是我們怎麼通過各種設備來獲取後面的服務。 在語音的問題解了以後, 下一步就是自然語言的交互, 當然後面也會提到視覺和圖像的交互。

這裡面其實語音還是最主要的一種方式。 這是前面說的以人的視角來做生活的智慧化。 比如說汽車是你出行的空間, 因為我們會花一兩個小時在路上。 那麼辦公室空間、家庭空間、酒店空間, 圍繞這些空間來想怎麼樣一個人能生活更方便。

通過各種設備來獲取的資訊, 其實今天出的智慧音箱在服務上面和之前沒有太本質的區別, 有些人接的資源多一點, 有些人接的資源少一點, 但它本質上差異並沒有那麼大。 大家關注的更多的是在設備這一層, 就是設備的接入和基礎的交互。

那再往下, 我們更多的是圍繞企業。 既然人和企業之間能有那麼豐富的關聯, 從企業的視角, 也會通過各式各樣的設備去和使用者來接觸, 這個過程包括你的客服、包括業務拓展、市場的品牌宣傳, 其實我們也還是通過這個設備, 但現在是站在企業的視角上要把自己變得智慧化。 以前這些服務是靠人來實施的, 那往後可能更多的是靠機器配合少量的人, 把整個服務體系變得智慧化。

在這個過程中,越來越多的是企業提供資料和知識服務,通過各種交互來實施。交互就包括基本的身份認證,比如說聲紋、人臉、虹膜、指紋,來減少以前的鍵盤輸入方式;服務入口還是剛才說到的各種設備,從手機擴展到IoT的設備,這裡面語音是最主要的,還包括場景、情感的感知,來實現交互。

但是所有的交互,目的是要為企業提供智慧的服務。所以我們做交互的過程也在考慮,只有交互是不夠的,一定是背後要有很多真正能服務的東西。

思必馳成立於2007年,2012年由聯想之星早期投的,致力於做語音。早期做教育,從2013-2014年做物聯網的語音交互。我們圍繞人的生活智慧化來展開,主要是不同智慧設備上,包括麥克風的解決方案,語音介入,自然語言理解對話,我們都做了整個的技術解決方案。最近幾款火爆的音箱,天貓精靈、小愛,後面都用了很多思必馳的技術。

我們試圖想通過連接萬物來幫我們溝通萬事。實際上我們今天所有看到語音對話系統,更多的是被動回應式的,機器永遠在那等著你,我來喚醒你、來跟你說一句,然後你來執行我要做的事情。

但是我們轉過來來看,你如果是銷售,去和客戶溝通的時候,不是等客戶問問題的,一定是要給客戶介紹,但是不是從頭講到尾,我一定要關注對方的反應,所以我們最近也在看,不能是我這麼強制講下去,是主動式的。比如你剛開始這麼問,根據客戶但凡會問的問題,我們就會問相關的問題,是不是你想拓展的,用戶可以這麼持續聊下去。你對我推薦的不感興趣,你可以繼續問你你關注的問題,這樣繼續談下去。

所以在交互的過程中,越來越重要的不是機器,而是從服務的角度,不是等待,而是主動的傳播。其實每個企業都知道自己有哪些關鍵資訊要傳播,我覺得這是非常重要的視角,我們現在就是想從這個角度來做一些嘗試。

我希望我們的工具,可以在每個企業中,不管你是marketing還是BD、產品,都來作為我們的知識的沉澱,聚在一起變成知識庫,通過主動的對話,根據使用者的需求,可以把資訊不斷地傳播過去。

我相信未來可能會有很多的對話趨勢,是往這個方向走的。我們今天算一個最早的嘗試者。還有一個問題,就是大規模的生產和定制。今天我們要做一個漂亮的demo是非常容易的,但是我能不能為你的所有事情,不管是大事情還是小事情,都能做到這樣?只有說我們有了一個非常簡單的應用方式,產業化才可能實施。如果每個企業都要自己去懂GPU怎麼去訓練、深度學習怎麼去做,懂得怎麼去采資料,那就太麻煩了。

所以我覺得,我們做這些的企業,要把用這個AI技術的門檻變低,變得容易,才能真正實現產業化,才能複製1千次、1萬次、10萬次,而不是像現在我們很多時候還是當項目做,把AI的落地當成一個又一個項目。

其實這樣它還是個人力外包。因為除了你之外,別人不會做,只有你派10個人、20個人的團隊駐場到企業裡給他做半年才能落地,這個模式是不夠的,不可能大規模成長的。複雜的東西簡單化,才能讓這個東西真正產業化,能真正爆發。

這裡面舉的這是只是一個例子。每一個產品得定義所有的環節,如果讓做產品的懂那麼多這是不可能。那我們要做到很多,也還是有很長的路。這塊我覺得最重要的,就是場景的定制化。比如這裡有語音的即時識別和翻譯,我認為已經做得很不錯了,但是只要我說兩個技術術語,它就識別不出來。問題在哪?就是因為今天即便是人工智慧、深度學習,任何的這樣的演算法,都不存在能訓練出個模型,通用於所有的場景。

很多公司的語音辨識號稱有的97%甚至99%的準確率,但我估計現場會議大多是90%準確率都達不到的。識別準確率其實不難,最關鍵的是什麼?其實是語音模型。真正應用裡,場景的這種快速更新、定制自我調整能力,是非常重要的。

我在很多地方都反復強調,包括我們自己都花了很多的時間來想這個事情,其實背後的路途是很長的,因為從資料訓練,到原始的大模型怎麼使用,其實有很多的技術挑戰。但是我覺得這是必須解決的問題,這樣子的問題沒有真正的解決,AI應用就其實是很難用的。就是我們永遠可以看到一個非常漂亮的demo,但是在不同的場景中跟我們期望的差距很大。

在這點上我們也是剛開始,也不是做到了多麼完美,但是在這上面我們做了很多的努力。我們做了定制的平臺,你可以定制自己的新場景、定制自己的對話流程等,還可以定制你的語言模型,根據定制和場景中的資料,也會同時來修整我們的語音模型,這樣子語音辨識的效果也會好起來。

還有一個因素,就是人才。其實今天大家所關注的,懂深度學習的、懂語音辨識的、懂圖像識別的人才是很少的,很緊張。而在真正產業化的過程中,其實更缺的是應用型人才。比如我們在去把AI用到各種場景中,想要把它交代清楚,其實就很辛苦。之前我在阿裡做客服的時候,也對接過很多廠商,一開始他說你給我個介面我調用一下,後來就說效果怎麼會那麼差,而我們後來發現,原來他們調的人不懂得採用率,什麼8K、16K這些都不懂。

我們想把AI用到任何一個行業,如果企業裡面沒有人能懂、沒有人能配合你,還是做不成的。我覺得我們想形成產業化的時候,這種應用型人才的培訓也是非常的重要。包括什麼東西系統做不到,但是通過產品的設計、應用的設計可以回避掉,這些都是應用平臺需要去考慮的。

真正做應用場景的人,不一定需要懂得深度學習,不一定要知道模型怎麼訓練,但是要知道真正人工智慧每一項技術的局限性,它的長處是什麼,短處是什麼,在這個基礎上我們去合理的設計自己的場景,去設計它。

我不希望大家把這些技術看成神話,其實它是一個工具,這個工具在我們手裡,怎麼能更好的解決我們的問題,是非常重要的。

AI整個產業化的鏈條真的是非常的長,也不是一家公司能把所有的東西做透的,在這個場景下,的確是需要很多的合作、協作和配合,一定要有很深度的協作才能把這個技術真正廣泛的應用起來。謝謝。

本文來自黑智,創業家系授權發佈,略經編輯修改,版權歸作者所有,內容僅代表作者獨立觀點。[ 下載創業家APP,讀懂中國最賺錢的7000種生意 ]

把整個服務體系變得智慧化。

在這個過程中,越來越多的是企業提供資料和知識服務,通過各種交互來實施。交互就包括基本的身份認證,比如說聲紋、人臉、虹膜、指紋,來減少以前的鍵盤輸入方式;服務入口還是剛才說到的各種設備,從手機擴展到IoT的設備,這裡面語音是最主要的,還包括場景、情感的感知,來實現交互。

但是所有的交互,目的是要為企業提供智慧的服務。所以我們做交互的過程也在考慮,只有交互是不夠的,一定是背後要有很多真正能服務的東西。

思必馳成立於2007年,2012年由聯想之星早期投的,致力於做語音。早期做教育,從2013-2014年做物聯網的語音交互。我們圍繞人的生活智慧化來展開,主要是不同智慧設備上,包括麥克風的解決方案,語音介入,自然語言理解對話,我們都做了整個的技術解決方案。最近幾款火爆的音箱,天貓精靈、小愛,後面都用了很多思必馳的技術。

我們試圖想通過連接萬物來幫我們溝通萬事。實際上我們今天所有看到語音對話系統,更多的是被動回應式的,機器永遠在那等著你,我來喚醒你、來跟你說一句,然後你來執行我要做的事情。

但是我們轉過來來看,你如果是銷售,去和客戶溝通的時候,不是等客戶問問題的,一定是要給客戶介紹,但是不是從頭講到尾,我一定要關注對方的反應,所以我們最近也在看,不能是我這麼強制講下去,是主動式的。比如你剛開始這麼問,根據客戶但凡會問的問題,我們就會問相關的問題,是不是你想拓展的,用戶可以這麼持續聊下去。你對我推薦的不感興趣,你可以繼續問你你關注的問題,這樣繼續談下去。

所以在交互的過程中,越來越重要的不是機器,而是從服務的角度,不是等待,而是主動的傳播。其實每個企業都知道自己有哪些關鍵資訊要傳播,我覺得這是非常重要的視角,我們現在就是想從這個角度來做一些嘗試。

我希望我們的工具,可以在每個企業中,不管你是marketing還是BD、產品,都來作為我們的知識的沉澱,聚在一起變成知識庫,通過主動的對話,根據使用者的需求,可以把資訊不斷地傳播過去。

我相信未來可能會有很多的對話趨勢,是往這個方向走的。我們今天算一個最早的嘗試者。還有一個問題,就是大規模的生產和定制。今天我們要做一個漂亮的demo是非常容易的,但是我能不能為你的所有事情,不管是大事情還是小事情,都能做到這樣?只有說我們有了一個非常簡單的應用方式,產業化才可能實施。如果每個企業都要自己去懂GPU怎麼去訓練、深度學習怎麼去做,懂得怎麼去采資料,那就太麻煩了。

所以我覺得,我們做這些的企業,要把用這個AI技術的門檻變低,變得容易,才能真正實現產業化,才能複製1千次、1萬次、10萬次,而不是像現在我們很多時候還是當項目做,把AI的落地當成一個又一個項目。

其實這樣它還是個人力外包。因為除了你之外,別人不會做,只有你派10個人、20個人的團隊駐場到企業裡給他做半年才能落地,這個模式是不夠的,不可能大規模成長的。複雜的東西簡單化,才能讓這個東西真正產業化,能真正爆發。

這裡面舉的這是只是一個例子。每一個產品得定義所有的環節,如果讓做產品的懂那麼多這是不可能。那我們要做到很多,也還是有很長的路。這塊我覺得最重要的,就是場景的定制化。比如這裡有語音的即時識別和翻譯,我認為已經做得很不錯了,但是只要我說兩個技術術語,它就識別不出來。問題在哪?就是因為今天即便是人工智慧、深度學習,任何的這樣的演算法,都不存在能訓練出個模型,通用於所有的場景。

很多公司的語音辨識號稱有的97%甚至99%的準確率,但我估計現場會議大多是90%準確率都達不到的。識別準確率其實不難,最關鍵的是什麼?其實是語音模型。真正應用裡,場景的這種快速更新、定制自我調整能力,是非常重要的。

我在很多地方都反復強調,包括我們自己都花了很多的時間來想這個事情,其實背後的路途是很長的,因為從資料訓練,到原始的大模型怎麼使用,其實有很多的技術挑戰。但是我覺得這是必須解決的問題,這樣子的問題沒有真正的解決,AI應用就其實是很難用的。就是我們永遠可以看到一個非常漂亮的demo,但是在不同的場景中跟我們期望的差距很大。

在這點上我們也是剛開始,也不是做到了多麼完美,但是在這上面我們做了很多的努力。我們做了定制的平臺,你可以定制自己的新場景、定制自己的對話流程等,還可以定制你的語言模型,根據定制和場景中的資料,也會同時來修整我們的語音模型,這樣子語音辨識的效果也會好起來。

還有一個因素,就是人才。其實今天大家所關注的,懂深度學習的、懂語音辨識的、懂圖像識別的人才是很少的,很緊張。而在真正產業化的過程中,其實更缺的是應用型人才。比如我們在去把AI用到各種場景中,想要把它交代清楚,其實就很辛苦。之前我在阿裡做客服的時候,也對接過很多廠商,一開始他說你給我個介面我調用一下,後來就說效果怎麼會那麼差,而我們後來發現,原來他們調的人不懂得採用率,什麼8K、16K這些都不懂。

我們想把AI用到任何一個行業,如果企業裡面沒有人能懂、沒有人能配合你,還是做不成的。我覺得我們想形成產業化的時候,這種應用型人才的培訓也是非常的重要。包括什麼東西系統做不到,但是通過產品的設計、應用的設計可以回避掉,這些都是應用平臺需要去考慮的。

真正做應用場景的人,不一定需要懂得深度學習,不一定要知道模型怎麼訓練,但是要知道真正人工智慧每一項技術的局限性,它的長處是什麼,短處是什麼,在這個基礎上我們去合理的設計自己的場景,去設計它。

我不希望大家把這些技術看成神話,其實它是一個工具,這個工具在我們手裡,怎麼能更好的解決我們的問題,是非常重要的。

AI整個產業化的鏈條真的是非常的長,也不是一家公司能把所有的東西做透的,在這個場景下,的確是需要很多的合作、協作和配合,一定要有很深度的協作才能把這個技術真正廣泛的應用起來。謝謝。

本文來自黑智,創業家系授權發佈,略經編輯修改,版權歸作者所有,內容僅代表作者獨立觀點。[ 下載創業家APP,讀懂中國最賺錢的7000種生意 ]

Next Article
喜欢就按个赞吧!!!
点击关闭提示