您的位置:首頁>科技>正文

如今人工智慧局限性很多 語音辨識並非核心

人工智慧的3個階段

從歷史進程上講, 王小川認為人工智慧是往3個階段走, “人工智慧這個話題不是新課題, 在上個世紀60年代、80年代就在做人工智慧。 那時候做這方面的教授其實很不幸, 因為當時人工智慧的水準是遠遠不夠的, 人們把對自己世界的認知變成了規則, 轉成了機器人。 60年代到80年代, 人們對規則的表達是偏離這個目標的, 就是做不好。 ”

“到了80年代, 則是基於統計方法來做的人工智慧, 不要嘗試把人對於世界的認知告訴機器, 而是讓機器學, 讓你看答案是什麼。 今天局部開始走到第三個階段了,

阿爾法狗屬於是第二階段加上一點點第三階段, 給它一些答案, 給它每一個局面下人是怎麼走的, 讓機器學, 這樣可以發現機器很難追上頂尖的人。 ”

同時, 王小川認為在工業領域我們正處於第二個階段, 一定要應用大資料。 這樣的好處是我們不需要工程師對原有的行業有特別深度的理解, 就能夠進行處理。 他也表示:“未來的兩三年裡已經有成功工作經驗得到了巨大的升級, 今年在智慧領域裡面有一個很大的發現。 ”

“今年的人工智慧還是有很多的局限性。 核心問題是有一個前提的條件, 要很安靜的環境裡。 人工智慧是對見過聲音的處理, 如果兩個人一起說話就不行了。 比較難點的是在自然語言的處理,

在翻譯系統現在有大的發展, 機器做翻譯能把中文翻譯成英文, 英文翻譯成中文。 因為現在機器人的學習, 不是基於理論方法。 人如果流暢, 機器也就可以流暢。 ”

投資視角下人工智慧的分類

“ 另外一個很好的視角, 跟投資相關的地方。 但如果從產品上分類從功能上分類, 我把人工智慧分成這麼三類。 叫級別、判斷和創造, 創造叫生成。 相信大家會看到一個語音能轉化過來, 或者是圖像裡面可以看到大象在做一個什麼事情。 今天做的第一個事情就是把物理世界的東西建模, 語音辨識、圖像識別這都叫識別, 像人臉識別, 這是一類。 還有是創造生成, 語音的合成和圖像合成是在這一類。 這樣我們就可以提升人機交互, 相對而言就是在安防領域裡面做人臉識別,

在我心中這個東西有用, 但是商業的價值不大。 ”

“現在有一個個人的觀點, 就是讓機器做判斷和決策, 這個是裡面唯一有巨大商業價值的東西, 把人的勞動取代, 讓機器產生更高的工作, 比如像金融裡面是這個例子, 阿爾法狗也是, 它是在做判斷和決策, 一旦讓機器有這樣功能了, 他就有很高的效率。 我也看一個指數, 1和3是在交互, 不能構成一個商業品牌的核心成本, 但是做判斷, 或者做決策, 這是商業判斷的核心部分。 ”

深度思考

“我看到這個是微軟的醫院, 語音辨識是不是人工智慧的核心, 或者是人工智慧未來很重要的一個部分?我跟他們的觀點是一樣的, 我說不。 語音辨識之後機器不知道你在說什麼,

未來的搜索是不是叫語音搜索, 這個東西是一個毛皮語音在裡面今天是沒有功課的事情, 語言跟這個都有關係, 因為你用語音做識別的時候就把他變成語音, 語言變語音我們也在做, 但是我們考慮的是以‘個’為核心做周邊的發展。 包括兩個語音的轉化是翻譯, 最後是語音的理解, 這是我們to C公司裡面思考的。 ”

本文為投資界原創, 作者:潘航, 原文:http://news.pedaily.cn/201703/20170327410691.shtml

Next Article
喜欢就按个赞吧!!!
点击关闭提示