華文網

谷歌街景攝像頭迎來重大升級,Waymo 亦將受益海量高清資料

谷歌街景影像採集車的新攝像頭使得圖像更高清,因此,提取到的資訊也更可信。這不僅能讓新的穀歌軟體產品更加理解這個世界,也為公司的自動駕駛技術實力再添重要籌碼。

編譯 | 高靜宜 王藝 邱陸陸

作者 | Tom Simonite

來源 | 《連線》

曾經為 NASA 的兩個火星探測漫遊者打造過攝像頭。此時,這個為 NASA 提供攝像頭技術的牛人正在一家普通的穀歌停車場裡,端詳自己的最新作品:固定在現代汽車車頂上的裝置。四根白色支架,支撐著一個搭載了八個攝像頭的黑色豎杆。有了這個稍顯笨拙的裝置,汽車高度幾乎增加了一倍。「我們為它驕傲,不過也曾考慮過把它們遮起來。

怪咖是這樣的。」Silverman 說道。

Silverman 和他的團隊打造的硬體,可供谷歌街景進行圖像採集。2007 年上線以來,谷歌街景已經積累了超過 1000 萬英里的全景圖像,包括公路、建築,甚至偶然拍攝到的隨地大小便等,這些全景資訊會放到網上共用。此次全新設計是八年來的首次重大升級。上個月,團隊開始定期上街進行圖像採集。逐漸收集回來的資料,將增強穀歌從數位角度掌控世界的能力。

考慮到 2009 年手機使用的攝像頭水準,谷歌街景圖像追求的是更高清晰度。即使坐在沙發上也可以流覽到解析度更高、也更具衝擊力的世界圖景。不過,這次新設計的硬體並不僅僅是為了提升人們視覺體驗,汽車頂部裝置內嵌的兩個攝像頭可以分別從車身兩側捕獲靜態的高清圖像,為穀歌訓練圖像識別演算法提供更清晰的近距離建築物及道路標牌圖像。

這些演算法可以不知疲倦地讀取數以百萬計的標牌和店面圖片。

吸收了海量街道視覺化資訊,包括路牌、店鋪名稱、甚至是街角小吃店視窗上的營業時間,谷歌有望提升本已強大的測繪資料庫。這家靠索引網站演算法起家的巨頭,正用相同的戰略為真實世界建立索引。

全球監測

谷歌街景這一想法幾乎與谷歌的成立一樣久遠。2001 年,也就是谷歌成立的三年後,公司 CEO Larry Page 帶著一盤錄影帶前往斯坦福大學的圖形實驗室。錄影帶錄製了他的行車情況,他希望研究人員想辦法充分利用影片中的圖片資料。當時,這個項目被命名為「crawling the physical web」。2006 年,採用了相關技術的谷歌街景車首次上路。一年後,公司正式發佈街景計畫。

十年後,谷歌街景車在 85 個國家的上千座城市,

拍攝了 800 多億張照片。常規測繪資料更為廣泛。不過,穀歌仍追尋著更好索引世界的辦法。「人們每天都會帶給我們更難、更深的問題。」公司副總裁、地圖部門負責人 Jen Fitzpatrick 表示。

第一次使用穀歌地圖或谷歌街景搜索,你可能會輸入一條街道的名字,或者你自己所處的位置。Fitzpatrick 說,現在公司遇到一些非常棘手的問題,例如,「配送範圍內,還在營業的泰國菜館子是哪家?」,我們急需一個可以即時更新的、也更為詳細的真實世界的數位模型。

她希望谷歌街景地圖能夠回答類似的問題,這需要系統對這個社會的模樣有所瞭解。「街角教堂旁邊的粉紅色店面叫什麼名字?」谷歌在大力推動用戶使用其虛擬助手的同時,也逐漸培養出用戶用口語說出其需求的習慣。「像這樣的問題,只有在我們的系統擁有更豐富、更深層次的資訊的時候,才能解答。」Fitzpatrick 說。

好在穀歌對於機器學習以及人工智慧方面的投入巨大,街景團隊才有能力獲得這些資訊。團隊目前正在進行的一項工作是,當街景地圖採集車路過某一條街,採集到長長的沿街影像時,演算法能夠通過定位以及轉寫圖片中的街道名字以及數位,自動為谷歌地圖更新位址資訊。值得一提的是,街景部門是穀歌所有產品部門中第一個使用穀歌定制晶片 TPU 的團隊。

該系統還自己學會了辨認縮寫,例如 AV. 表示大道。通過對比分析全國其它路牌上的名字,並結合穀歌地圖上已有的資料,系統學會了縮寫與全稱的對應關係。研究人員還訓練系統能夠學會是被公司名字,當遇到非常有名的公司用 Logo(商標圖案)代替名字時,系統也能輕鬆對號入座。例如當它看到星巴克的海妖 Logo 時,能夠辨認出這家店是星巴克。

谷歌街景影像採集車的新攝像頭使得圖像更高清,因此,提取到的資訊也更可信。「從機器學習的角度出發,一切都變得容易多了。」團隊中的工程師 Andrew Lookingbill 說。他們希望系統能夠自動識別店鋪的類型,並且增加例如營業時間等細細微性資訊。團隊的成果甚至能夠被轉化為新的軟體產品,這些產品具備更好地理解世界的能力。

新的領域

用演算法解碼道路、城市和商業活動高速變化、但經濟不甚發達地區的街景圖像,特別有用。這也是谷歌及其對手們爭奪「下一個十億用戶」的戰場。印度政府發佈報告稱,印度近期的道路修建速度為每天 14 英里。今年夏天,奈及利亞首都拉各斯的谷歌街景地圖正式上線,這座城市的人口達 2100 萬。Fitzpatrick 表示,穀歌的圖像索引演算法能夠説明地圖業務拓寬新的盈利管道,例如在地圖中夾雜廣告。這樣,新的城市覆蓋以及更高的準確率在吸引更多用戶使用的同時能夠帶來新的收益。

穀歌希望吸引全球人民參與其地圖專案。科技界對 VR(虛擬實境)的熱情使得 360 度全景攝像機價格有所下降。自今年夏天以來,穀歌已經賦予一些相機 Street View Ready(街景資格)認證。這意味著你可以通過街景 APP(應用程式)向穀歌上傳你自己的全景照片,隨後,和穀歌自己採集到的照片一樣,你上傳的照片將被穀歌的圖像識別軟體解析並提取最新的地圖資訊。

谷歌希望通過眾包的形式維持街景地圖資料的有效性。「穀歌已經將(互聯網)世界索引起來。」街景地圖的產品經理 Charles Armstrong 說。「但是谷歌永不滿足於現狀。」穀歌以虛擬獎品的形式回報向其地圖做貢獻的用戶,穀歌希望用戶能夠自發地參與進來。Armstrong 預測到,不久的將來,公司、旅遊景區、甚至政府將會開著他們自己的頂部裝有相機的汽車採集圖像,來確保穀歌地圖和世界同時進化。

谷歌街景的各式更新都有助於穀歌保持其在數字地圖界的領先地位。穀歌可以說是全球為數不多的地圖測繪項目中最突出的一個了。另一些重量級參與者包括:由一系列德國汽車公司持有的 HERE;以獨立 GPS 設備和手錶聞名的 Tomtom;以及協作項目 Open Street Map。「每家都以其他公司作為標準衡量自己的水準。」Open Street Map 美國分佈主席 Alyssa Wright 如是說。(蘋果進入地圖測繪圈的時間相對較晚,它的資料來自 Tomtom。)如今大多數人都隨身攜帶有 GPS 功能的智慧手機,因此地圖資料的重要程度已經遠遠超過了指引方向。「從自動駕駛車輛到約會軟體,地圖是建設數位化未來的基礎。」Wright 如是說。

街景所使用的新攝像頭和穀歌對於眾包圖像採集的推動可能會為公司引來更多隱私爭議。從街景專案開始以來,把短暫的公共場景變成了互聯網上永久的存檔的行為就時不時會遇到集中爆發的用戶擔憂。德國和奧地利的大部分地區已經有相當多年在谷歌街景上都是不可見的了,這是因為穀歌曾經陷入「街景車擅自記錄 Wi-Fi 資料」的麻煩。街景車最近剛剛得以重回這兩個國家。2012 年,瑞士最高法院勒令穀歌削減攝像頭數量以防止其越牆偷窺,並要求其模糊處理女性收容所等場景。

Fitzpatrick 表示,高品質圖像可能會帶來更多隱私問題。「我們還沒有遇到有更多隱私需求的情況,」她說。穀歌會繼續將自己獲取的街景圖片中的人臉和汽車牌照做模糊處理。但是對眾包圖像來說,這並非一個預設選項,而讓採用了讓用戶在上傳時自行選擇是否使用穀歌的模糊處理技術。

運用影像處理演算法,穀歌能夠從這些街景照片中獲取多少額外資訊呢?答案是,非常多。

今年早些時候,斯坦福大學的研究人員,包括現任穀歌雲服務的首席科學家李飛飛教授,展示了他們能通過建模,使用谷歌街景圖片中出現的汽車的型號、生產年限等資訊,來預測特定美國城市的收入水準、種族比例和政治傾向。而當記者詢問谷歌是否參與了這些專案的規劃時,谷歌的發言人回答說,穀歌只會運用潔淨資料來改善公司的平臺和產品,包括地圖,以及地圖之外的其他產品。

而對谷歌街景圖像以及其使用者的分析也可能會對其谷歌的兄弟公司,致力於自動駕駛的 Waymo 產生幫助。「我們的團隊會時不時進行合作。」Fitzpatrick 只肯說這麼多。當然,反過來,她的團隊也會從 Waymo 處受益。

回到穀歌的停車場,攝影師 Silverman 承認,在高速公路上駕駛街景車並不好玩。「開上一天,你就會不想再做『公車司機』,回歸工程工作了。」他說。就像自動駕駛會改變叫車服務的經濟歌劇一樣,「不再需要支付街景車司機工資」也會對街景工作產生重大改變。畢竟,穀歌試圖給物理世界創建演算法索引的工作,才剛剛開始。

她希望谷歌街景地圖能夠回答類似的問題,這需要系統對這個社會的模樣有所瞭解。「街角教堂旁邊的粉紅色店面叫什麼名字?」谷歌在大力推動用戶使用其虛擬助手的同時,也逐漸培養出用戶用口語說出其需求的習慣。「像這樣的問題,只有在我們的系統擁有更豐富、更深層次的資訊的時候,才能解答。」Fitzpatrick 說。

好在穀歌對於機器學習以及人工智慧方面的投入巨大,街景團隊才有能力獲得這些資訊。團隊目前正在進行的一項工作是,當街景地圖採集車路過某一條街,採集到長長的沿街影像時,演算法能夠通過定位以及轉寫圖片中的街道名字以及數位,自動為谷歌地圖更新位址資訊。值得一提的是,街景部門是穀歌所有產品部門中第一個使用穀歌定制晶片 TPU 的團隊。

該系統還自己學會了辨認縮寫,例如 AV. 表示大道。通過對比分析全國其它路牌上的名字,並結合穀歌地圖上已有的資料,系統學會了縮寫與全稱的對應關係。研究人員還訓練系統能夠學會是被公司名字,當遇到非常有名的公司用 Logo(商標圖案)代替名字時,系統也能輕鬆對號入座。例如當它看到星巴克的海妖 Logo 時,能夠辨認出這家店是星巴克。

谷歌街景影像採集車的新攝像頭使得圖像更高清,因此,提取到的資訊也更可信。「從機器學習的角度出發,一切都變得容易多了。」團隊中的工程師 Andrew Lookingbill 說。他們希望系統能夠自動識別店鋪的類型,並且增加例如營業時間等細細微性資訊。團隊的成果甚至能夠被轉化為新的軟體產品,這些產品具備更好地理解世界的能力。

新的領域

用演算法解碼道路、城市和商業活動高速變化、但經濟不甚發達地區的街景圖像,特別有用。這也是谷歌及其對手們爭奪「下一個十億用戶」的戰場。印度政府發佈報告稱,印度近期的道路修建速度為每天 14 英里。今年夏天,奈及利亞首都拉各斯的谷歌街景地圖正式上線,這座城市的人口達 2100 萬。Fitzpatrick 表示,穀歌的圖像索引演算法能夠説明地圖業務拓寬新的盈利管道,例如在地圖中夾雜廣告。這樣,新的城市覆蓋以及更高的準確率在吸引更多用戶使用的同時能夠帶來新的收益。

穀歌希望吸引全球人民參與其地圖專案。科技界對 VR(虛擬實境)的熱情使得 360 度全景攝像機價格有所下降。自今年夏天以來,穀歌已經賦予一些相機 Street View Ready(街景資格)認證。這意味著你可以通過街景 APP(應用程式)向穀歌上傳你自己的全景照片,隨後,和穀歌自己採集到的照片一樣,你上傳的照片將被穀歌的圖像識別軟體解析並提取最新的地圖資訊。

谷歌希望通過眾包的形式維持街景地圖資料的有效性。「穀歌已經將(互聯網)世界索引起來。」街景地圖的產品經理 Charles Armstrong 說。「但是谷歌永不滿足於現狀。」穀歌以虛擬獎品的形式回報向其地圖做貢獻的用戶,穀歌希望用戶能夠自發地參與進來。Armstrong 預測到,不久的將來,公司、旅遊景區、甚至政府將會開著他們自己的頂部裝有相機的汽車採集圖像,來確保穀歌地圖和世界同時進化。

谷歌街景的各式更新都有助於穀歌保持其在數字地圖界的領先地位。穀歌可以說是全球為數不多的地圖測繪項目中最突出的一個了。另一些重量級參與者包括:由一系列德國汽車公司持有的 HERE;以獨立 GPS 設備和手錶聞名的 Tomtom;以及協作項目 Open Street Map。「每家都以其他公司作為標準衡量自己的水準。」Open Street Map 美國分佈主席 Alyssa Wright 如是說。(蘋果進入地圖測繪圈的時間相對較晚,它的資料來自 Tomtom。)如今大多數人都隨身攜帶有 GPS 功能的智慧手機,因此地圖資料的重要程度已經遠遠超過了指引方向。「從自動駕駛車輛到約會軟體,地圖是建設數位化未來的基礎。」Wright 如是說。

街景所使用的新攝像頭和穀歌對於眾包圖像採集的推動可能會為公司引來更多隱私爭議。從街景專案開始以來,把短暫的公共場景變成了互聯網上永久的存檔的行為就時不時會遇到集中爆發的用戶擔憂。德國和奧地利的大部分地區已經有相當多年在谷歌街景上都是不可見的了,這是因為穀歌曾經陷入「街景車擅自記錄 Wi-Fi 資料」的麻煩。街景車最近剛剛得以重回這兩個國家。2012 年,瑞士最高法院勒令穀歌削減攝像頭數量以防止其越牆偷窺,並要求其模糊處理女性收容所等場景。

Fitzpatrick 表示,高品質圖像可能會帶來更多隱私問題。「我們還沒有遇到有更多隱私需求的情況,」她說。穀歌會繼續將自己獲取的街景圖片中的人臉和汽車牌照做模糊處理。但是對眾包圖像來說,這並非一個預設選項,而讓採用了讓用戶在上傳時自行選擇是否使用穀歌的模糊處理技術。

運用影像處理演算法,穀歌能夠從這些街景照片中獲取多少額外資訊呢?答案是,非常多。

今年早些時候,斯坦福大學的研究人員,包括現任穀歌雲服務的首席科學家李飛飛教授,展示了他們能通過建模,使用谷歌街景圖片中出現的汽車的型號、生產年限等資訊,來預測特定美國城市的收入水準、種族比例和政治傾向。而當記者詢問谷歌是否參與了這些專案的規劃時,谷歌的發言人回答說,穀歌只會運用潔淨資料來改善公司的平臺和產品,包括地圖,以及地圖之外的其他產品。

而對谷歌街景圖像以及其使用者的分析也可能會對其谷歌的兄弟公司,致力於自動駕駛的 Waymo 產生幫助。「我們的團隊會時不時進行合作。」Fitzpatrick 只肯說這麼多。當然,反過來,她的團隊也會從 Waymo 處受益。

回到穀歌的停車場,攝影師 Silverman 承認,在高速公路上駕駛街景車並不好玩。「開上一天,你就會不想再做『公車司機』,回歸工程工作了。」他說。就像自動駕駛會改變叫車服務的經濟歌劇一樣,「不再需要支付街景車司機工資」也會對街景工作產生重大改變。畢竟,穀歌試圖給物理世界創建演算法索引的工作,才剛剛開始。