華文網

萬萬沒想到,無人車其實是個勞動密集型產業

李杉 唐旭 編譯整理

病友們都在看雜誌、刷Instagram的時候,Shari Forrest打開了手機上的一個app,開始訓練一個將要用在無人車上的人工智慧。

54歲的Forrest並非工程師或程式師,她靠撰寫教材來謀生。儘管如此,

在平時有空時,Forrest依然會在Mighty AI上登錄,然後把自己的時間花在給行人、垃圾桶,以及任何其他你不希望無人車撞上的東西做標記上。

Mighty AI是一家人工智慧眾包服務平臺。在這裡,Forrest的“同事”們在全球範圍內還有20萬人。這家公司提供的主要服務包括電腦視覺、自動駕駛、自然語言處理等。今年1月,公司剛剛宣佈完成1400萬美元B輪融資。

“如果能趁著排隊的工夫賺幾塊錢的話,何樂而不為呢。

“Forrest說。

對於無人車產業而言,在自動駕駛時代真正到來之前,類似Forrest所做的這種資料標注工作都是不可或缺的。要對自動駕駛賴以實現的AI進行訓練,所需的資料量往往超出了想像。

穀歌和通用這種公司很少去提這件事情,但正是像Forrest一樣的人們組成的勞動力大軍,構成了那些嗡嗡作響的資料中心背後的基石。

多數開發自動駕駛技術的公司會聘用成百上千名員工,然後把這種教會無人車識別行人、騎行者和其他障礙物的工作外包到印度或中國。

這些工人需要對長達數千小時的視頻逐幀進行標記。

“機器學習是個神話,就像《綠野仙蹤》一樣。”矽谷硬體孵化器公司Lemnos Labs的投資人Jeremy Conrad說,“標記團隊對每家公司都至關重要,我們一段時間內仍然需要他們,因為戶外環境十分多變。”

人工智慧、感測器品質和計算能力的巨大進步,給無人車的革命打下了技術基礎。

然而,儘管出現了這些創新,但在未來很多年內,人類仍然需要在幕後默默奉獻,才能讓這些系統保持最好的狀態。

“在我看來,人工智慧從業人員整體都很自大,認為電腦可以解決一切。”Mighty AI創始人兼CEO Matt Bencke說。人工智慧系統也都存在同樣的問題:電腦需要通過人工添加標籤的龐大資料進行“學習”,然後利用這種‘模型’在今後看到類似的物體和形態時將其識別出來。

訓練無人車面臨的挑戰比其他人工智慧應用更大,

因為汽車所要面臨的場景和環境是開放性的。即便是針對不同時間的燈光和天氣環境進行調整後,城市環境仍會因為建築、活動或事故而在一夜之間發生變化。

“標注過程通常都是一項非常隱秘的成本,

很少被人提及。”自動駕駛創業公司Drive.ai首席執行官Sameep Tandon說,“這非常痛苦,也非常麻煩。”

無人車所需的精度也高於其他人工智慧系統。汽車之所以能夠自動駕駛,是通過將它們借助攝像頭和感測器看到的周圍環境,與車載3D地圖進行比對來實現的。安全是頭等大事:如果Google Photos的面部識別無法正確認出一張照片中的人,那也沒什麼大不了;但如果Waymo的無人車無法識別行人,就會引發致命事故。

在爭相開發無人車的過程中,企業的衡量標準都是他們的累計行駛里程。Waymo今年5月表示,他們的汽車已經在公共道路上試駕了300萬英里,而特斯拉去年表示,他們已經借助Autopilot系統,通過現有的車主收集了1000多萬英里的駕駛資料。

然而,里程越多,就意味著這些公司的後臺資料處理人員需要手工從事更多工作。短短幾英里的駕駛里程就會產生數十GB的資料,這些資料很快就會變得過於龐大,以至於無法通過車載無線網路進行傳輸。相反,必須首先保存在硬碟之中,然後再傳輸到到外包中心。

這樣一個擁有尖端技術的行業,卻採用如此陳舊的模式,的確令人感到意外。

矽谷自動駕駛系統開發公司PlusAI首席執行官David Liu表示,每駕駛一個小時,就需要花費數百個小時才能將其轉化成有用的資料。

他說,“我們需要幾十萬,甚至幾百萬小時的資料”才能讓無人車隨處行駛,並且需要“數十萬人來實現這一目標”。

但大型科技公司通常不肯披露無人車所涉及的人工程式。Waymo、Uber和特斯拉均拒絕對此置評。

“很難聽到有人談論此事。”華盛頓大學電腦科學與工程教授Dan Weld說,“他們都喜歡說,機器學習很神奇。”

曾經擔任Waymo和Uber工程師的Anthony Levandowski曾於2013年在加州大學伯克利分校的公開演講中,將穀歌的印度團隊稱作一個由“人類機器人”組成的團隊,他們負責標記街景服務採集的各種圖像。

這種勞動密集型工作的成本並不低。業內人士估計,要創建和維護每座美國城市的地圖,一年的花費約為數十億美元。

有的創業公司從中看到了機會,PlusAI、Deepmap和Drive.ai都聲稱可以使用“深度學習”來降低人工成本(關於Drive.ai完全用深度學習來做無人車的方案,戳這裡),但仍然可以維持安全駕駛所需的精度。但其他業內人士仍然懷疑,深度學習難以徹底擺脫對人類的依賴。

Mighty AI的 Bencke指出,Facebook、YouTube和Twitter面臨的挑戰,是如何在他們的社交平臺上應對欺淩和恐怖主義等各種負面內容。“如果深度學習具備這種能力,你不認為它現在就應該已經解決這個問題了嗎?”他說,“這個問題沒有無人車那麼複雜,而且市場很大。”

當下,AI的智慧在更大程度上仍然取決於它所用來訓練的資料的品質。Bencke稱自家的平臺會用自己的機器學習技術,來判定每個人最為擅長的領域,並以此來分配工作。沒人因此變得富裕,但對於Mighty AI來講,這無關緊要。

Forrest說,自己去年在這項工作上掙了300美元,大部分都用來網購了。她從沒見過無人車,更別提乘坐一次。但她知道自己正讓它們變得更為聰明,也對這項技術的未來充滿信心。

【完】

一則通知

另外,量子位大咖雲集的自動駕駛技術群,僅接納研究自動駕駛相關領域的在校學生或一線工程師。申請方式:添加qbitbot2為好友,備註“自動駕駛”申請加入~

招聘

量子位元正在招募編輯/記者

在爭相開發無人車的過程中,企業的衡量標準都是他們的累計行駛里程。Waymo今年5月表示,他們的汽車已經在公共道路上試駕了300萬英里,而特斯拉去年表示,他們已經借助Autopilot系統,通過現有的車主收集了1000多萬英里的駕駛資料。

然而,里程越多,就意味著這些公司的後臺資料處理人員需要手工從事更多工作。短短幾英里的駕駛里程就會產生數十GB的資料,這些資料很快就會變得過於龐大,以至於無法通過車載無線網路進行傳輸。相反,必須首先保存在硬碟之中,然後再傳輸到到外包中心。

這樣一個擁有尖端技術的行業,卻採用如此陳舊的模式,的確令人感到意外。

矽谷自動駕駛系統開發公司PlusAI首席執行官David Liu表示,每駕駛一個小時,就需要花費數百個小時才能將其轉化成有用的資料。

他說,“我們需要幾十萬,甚至幾百萬小時的資料”才能讓無人車隨處行駛,並且需要“數十萬人來實現這一目標”。

但大型科技公司通常不肯披露無人車所涉及的人工程式。Waymo、Uber和特斯拉均拒絕對此置評。

“很難聽到有人談論此事。”華盛頓大學電腦科學與工程教授Dan Weld說,“他們都喜歡說,機器學習很神奇。”

曾經擔任Waymo和Uber工程師的Anthony Levandowski曾於2013年在加州大學伯克利分校的公開演講中,將穀歌的印度團隊稱作一個由“人類機器人”組成的團隊,他們負責標記街景服務採集的各種圖像。

這種勞動密集型工作的成本並不低。業內人士估計,要創建和維護每座美國城市的地圖,一年的花費約為數十億美元。

有的創業公司從中看到了機會,PlusAI、Deepmap和Drive.ai都聲稱可以使用“深度學習”來降低人工成本(關於Drive.ai完全用深度學習來做無人車的方案,戳這裡),但仍然可以維持安全駕駛所需的精度。但其他業內人士仍然懷疑,深度學習難以徹底擺脫對人類的依賴。

Mighty AI的 Bencke指出,Facebook、YouTube和Twitter面臨的挑戰,是如何在他們的社交平臺上應對欺淩和恐怖主義等各種負面內容。“如果深度學習具備這種能力,你不認為它現在就應該已經解決這個問題了嗎?”他說,“這個問題沒有無人車那麼複雜,而且市場很大。”

當下,AI的智慧在更大程度上仍然取決於它所用來訓練的資料的品質。Bencke稱自家的平臺會用自己的機器學習技術,來判定每個人最為擅長的領域,並以此來分配工作。沒人因此變得富裕,但對於Mighty AI來講,這無關緊要。

Forrest說,自己去年在這項工作上掙了300美元,大部分都用來網購了。她從沒見過無人車,更別提乘坐一次。但她知道自己正讓它們變得更為聰明,也對這項技術的未來充滿信心。

【完】

一則通知

另外,量子位大咖雲集的自動駕駛技術群,僅接納研究自動駕駛相關領域的在校學生或一線工程師。申請方式:添加qbitbot2為好友,備註“自動駕駛”申請加入~

招聘

量子位元正在招募編輯/記者