您的位置:首頁>科技>正文

學習也需要監督,讓我們換種方式對待AI

今早開例會, 才發現最近說了太多的AI。 不過看看奧迪A8——L3級自動駕駛的量產車都已經出街, 而像凱迪拉克CT6等等眼見就要迎頭趕上, 說點啥也繞不過AI了吧。

而說到全自動駕駛車輛的AI學習, 還真是需要勤勉有加:得學會避讓車輛、識別紅綠燈、辯識警燈、識別行人, 甚至還要學會正確避讓跳躍的袋鼠……可無論是Waymo、Uber還是汽車大咖們到底是如何教AI看懂、聽懂、判斷和決定的呢?

當你無聊時,

都在幹點啥?農藥還是刷朋友圈?可山的那邊、海的那邊有一個寵物撰稿人安阿姨就不同了, 人家無聊的時候打開一個應用程式, 根據程式隨機給出的圖片細緻地塗塗畫畫。 在玩秘密花園之類的塗色遊戲嗎?仔細一看填塗的並不是紋飾圖案, 而是一張張街景的圖片。 她將這些圖片放大、逐圖元地用不同的顏色標記出信號燈、交通指示牌、電線杆、安全錐……並畫出一個個邊框或“盒子”。

天哪, 還有這麼無聊的遊戲?但看著安阿姨如此認真細緻地樂此不疲, 奇怪了麼?來聽聽安阿姨怎麼說吧:

“ 無聊?不, 這不僅僅是打發時間的遊戲, 我是在從事一個偉大的事業!”

“ 哈?阿姨你別逗了, 塗個顏色拉個輪廓就算偉大的話, 我那些PPT不是都能拯救地球了?”

“ 你們不是天天嚷嚷著實現全自動駕駛才能徹底讓城市不再擁堵嗎?我也不想再堵車, 再有那麼多交通事故, 而我又不像你們年輕人天天那麼忙, 有點空就可以幫你們訓練全自動駕駛的AI, 它們早點變得更聰明不就能早點上班麼!

你看到這些就是實驗原型車車載攝像機採集回來的照片, 公司把它們放到圖片庫裡, 我們閑來無事的時候就進App裡領取圖片。 你看, 不同的東西用不同的顏色進行標注, 完成以後直接上傳就好了!”

“ 不會覺得枯燥麼?”

“ 當初你的爸爸媽媽第一次帶你上街的時候一樣一樣耐心指給你看的時候, 他們也沒嫌枯燥啊!更何況去年我就這麼閑來標注幾張圖片, 還掙了300美金呢!”

和安阿姨一樣入坑這款“無聊”遊戲的居然還有20萬人,

大家都像安阿姨姨那樣:

一有閒置時間, 就打開App領取圖片, 並為目標物畫出輪廓或“沙箱”

並根據圖片上目標物的不同種類, 分別塗上不同的顏色。

除了在手機上操作以外,電腦上也可以完成任務挑戰,甚至還可以承擔更精細的邊框勾勒工作。

而且這個“遊戲”和我們平時玩的遊戲設置沒什麼不同,都是要達到一定數量與品質的累積才能進入更高等級的挑戰關卡。

每一幅圖片完成之後的樣子,是不是也特別有成就感呢?

“玩家”們把這些圖片上傳後,系統將把這些標注轉化成為電腦能夠理解的語言注釋,工程師們把這稱之為“語義分割遮罩”【semantic segmentation mask】。

讓AI流覽過足夠多標注過的圖片,一遍遍強化對目標的識別能力和記憶,只要訓練樣本足夠多,最終一天AI便能以類似人類的方式去理解標的物。

就像南加州大學資訊科學研究院【USC Information Sciences Institute】專門從事電腦視覺研究二十多年的執行總監、副院長Premkumar Natarajan所說:“這是唯一的辦法!雖然我們也對無監督學習做了一些有希望的研究,但是現在看來,人工智慧的智力取決於其監督學習的訓練資料的品質與數量。”

監督學習?無監督學習?

副院長先生你到底在說什麼?

你聽懂了麼?

我們用熟悉的吳恩達博士當年在斯坦福大學授課時的定義和案例來說明吧:

監督學習——

監督學習中,對於資料集中的每個資料都有相應的正確答案,而(訓練集) 演算法就是基於這些來做出預測。

吳博士給出的例子是,比方說你現在想要買一套房子,可這麼熱的天你肯定不願意一個樓盤一個樓盤地去蹓躂。怎麼辦呢?於是你搜集了一下你所在城市的房價資料,之後在電腦上建立了一個模型:縱軸是你所在城市各區域的單位房價(哪個區域平均多少錢/平方米),橫軸是房屋面積。

這樣你就可以躺在沙發上玩城市地圖飛鏢了:“嘿,我飛中了人民西路,那個位置120平方的房子大概得多少錢?”

說回到我們自己的領域,吳博士的意思是監督學習就是幫AI打好標籤,監督它得到正確答案。

就只拿紅綠燈來說:

只要安阿姨們標注的樣本足夠多,AI就能學會識別如上圖一般雖然長相都不一致,安裝方式也不盡相同的這些裝置都是紅綠燈,都得紅燈停綠燈行。

據這家叫做Mighty AI的AI資料訓練營所說,正在與至少10家汽車製造商合作。就拿他們近期公佈的西雅圖地區部分路線資料包來說,合作的汽車製造商可以直接用於訓練自己的全自動駕駛車輛AI做視覺識別。有可能只用不到幾天(或者更短)的時間,就能把這一地區情況摸得爛熟,而不用自己再重新勞心勞力地去實測、標記、訓練、糾錯……。

這樣想想也怪過癮的,雖然那小小的積分和獎金比起如此枯燥的遊戲來說未免太不匹配,但過幾年全自動駕駛車輛出街的時候,自己能夠站在街道邊上:“你們,可都是經過我訓練的!”

有沒有感覺像是正在創造歷史的主角?你難道不想去試試麼?

除了在手機上操作以外,電腦上也可以完成任務挑戰,甚至還可以承擔更精細的邊框勾勒工作。

而且這個“遊戲”和我們平時玩的遊戲設置沒什麼不同,都是要達到一定數量與品質的累積才能進入更高等級的挑戰關卡。

每一幅圖片完成之後的樣子,是不是也特別有成就感呢?

“玩家”們把這些圖片上傳後,系統將把這些標注轉化成為電腦能夠理解的語言注釋,工程師們把這稱之為“語義分割遮罩”【semantic segmentation mask】。

讓AI流覽過足夠多標注過的圖片,一遍遍強化對目標的識別能力和記憶,只要訓練樣本足夠多,最終一天AI便能以類似人類的方式去理解標的物。

就像南加州大學資訊科學研究院【USC Information Sciences Institute】專門從事電腦視覺研究二十多年的執行總監、副院長Premkumar Natarajan所說:“這是唯一的辦法!雖然我們也對無監督學習做了一些有希望的研究,但是現在看來,人工智慧的智力取決於其監督學習的訓練資料的品質與數量。”

監督學習?無監督學習?

副院長先生你到底在說什麼?

你聽懂了麼?

我們用熟悉的吳恩達博士當年在斯坦福大學授課時的定義和案例來說明吧:

監督學習——

監督學習中,對於資料集中的每個資料都有相應的正確答案,而(訓練集) 演算法就是基於這些來做出預測。

吳博士給出的例子是,比方說你現在想要買一套房子,可這麼熱的天你肯定不願意一個樓盤一個樓盤地去蹓躂。怎麼辦呢?於是你搜集了一下你所在城市的房價資料,之後在電腦上建立了一個模型:縱軸是你所在城市各區域的單位房價(哪個區域平均多少錢/平方米),橫軸是房屋面積。

這樣你就可以躺在沙發上玩城市地圖飛鏢了:“嘿,我飛中了人民西路,那個位置120平方的房子大概得多少錢?”

說回到我們自己的領域,吳博士的意思是監督學習就是幫AI打好標籤,監督它得到正確答案。

就只拿紅綠燈來說:

只要安阿姨們標注的樣本足夠多,AI就能學會識別如上圖一般雖然長相都不一致,安裝方式也不盡相同的這些裝置都是紅綠燈,都得紅燈停綠燈行。

據這家叫做Mighty AI的AI資料訓練營所說,正在與至少10家汽車製造商合作。就拿他們近期公佈的西雅圖地區部分路線資料包來說,合作的汽車製造商可以直接用於訓練自己的全自動駕駛車輛AI做視覺識別。有可能只用不到幾天(或者更短)的時間,就能把這一地區情況摸得爛熟,而不用自己再重新勞心勞力地去實測、標記、訓練、糾錯……。

這樣想想也怪過癮的,雖然那小小的積分和獎金比起如此枯燥的遊戲來說未免太不匹配,但過幾年全自動駕駛車輛出街的時候,自己能夠站在街道邊上:“你們,可都是經過我訓練的!”

有沒有感覺像是正在創造歷史的主角?你難道不想去試試麼?

Next Article
喜欢就按个赞吧!!!
点击关闭提示