您的位置:首頁>科技>正文

3D視覺成新藍海?ARM首位中國員工甘願為它出走

智東西 文 | 軒窗

“我是ARM在中國的第一名員工, 也見證了國內晶片行業起步的全過程”費浙平說這話時, 語氣裡有著驕傲, 卻又略帶辛酸。

在晶片行業摸爬滾打了十年後, 費浙平決定給自己一個轉型。 費浙平將目光轉向了3D視覺技術, 與另外兩位合夥人一起白手起家, 在2015年成立了圖漾科技。 成立三年多來, 在CEO費浙平的帶領下圖漾科技將精力全部集中在工業視覺上, 並憑藉自主研發的主動雙目視覺技術獲得了國內工業企業的認可。

說3D視覺技術可能有人覺得概念很抽象, 但如果說蘋果Face ID運用的就是3D視覺技術,

你就能明白了。 3D視覺技術目前還是新興行業, 但因2D技術發展瓶頸期的到來, 3D正成為機器視覺新的方向。

創業從來都不是容易的, 從第一員工到創業者, 從晶片到3D視覺, 費浙平和他孕育的圖漾背後還有哪些不為人知的故事?為了探尋費浙平成立圖漾背後的心路歷程, 智東西決定找費浙平一探究竟。

一、CEO出身晶片行業 圖漾三年三輪融資

18年前費浙平從復旦電子工程專業畢業, 那時國際第一波晶片公司正進入中國市場。 2002年費浙平被一眼相中, 成為了ARM在中國的第一個員工, 並一路見證了ARM在中國的成長。 在ARM的前6年, 費浙平一直負責技術研究, 之後由於公司發展需要他調度到銷售崗位。 這使費浙平接觸到了幾乎目前國內所有的晶片公司,

比如海思。 “當年國內的這些公司還沒現在這麼壯大, 我算是陪著國內晶片行業一路起來的。 ”

後來, 費浙平離開了ARM, 在MIPS公司擔任中國區的主管, 與ARM一樣, MIPS也是一家做處理器的公司, 但MIPS全球員工也就1000多人, 規模比ARM小得多。 在MIPS工作兩年後,

費浙平已經在晶片行業整整10年了。 從技術到銷售他幾乎吃透了整個晶片行業, 費浙平覺得也到了是換一個活法的時候了, 於是他毅然從晶片行業抽身, 投奔到創業大軍中。

技術出身的費浙平在技術社群裡認識了另外兩個合夥人, 三個技術宅一致看好3D視覺行業, 並決定聯手創業。 “2013年我們創業時, 最熱門的領域要數O2O和移動互聯網, 硬體形態技術領域並不火, 頭兩年的日子挺難熬的。 ”功夫不負有心人, 三位合夥人自掏腰包歷經一年時間, 終於有了產品的初步形態和demo。 憑藉出色的技術特性2015年他們拿到400萬的天使輪融資, 並在上海註冊成立了圖漾科技。

到現在圖漾已走過了3年的時間, 團隊也從最初的3人變成今天的30人。

“我們已經渡過了最初最難捱的融資階段了”。 費浙平說現在的圖漾是最具朝氣的時候, 雖然現在人不多, 但各部門的團隊都有了, 以後隨著公司的發展壯大, 將不斷完善公司的組織架構, 他也打算用兩年時間將圖漾隊伍擴充至60人。

在成立了三年的時間裡, 圖漾獲得了三次融資, 可以說一年一次了。 2015年4月份獲天使輪融資400萬, 2016年4月, 公司完成1500萬人民幣的pre-A輪融資, 2017獲千萬級A輪融資。 費浙平說, 拿到錢後將用於產品落地, 現在是3D視覺產品起飛的關鍵節點。

2018年, 他給圖漾定了兩個任務:一是擴大規模, 規模上既有人才隊伍的擴大又有產品市場佔有率的擴大, 二是產生可觀營收。

二、“雙目+結構光” 主被動模式可自動切換

人類的視覺識別水準很發達,

人的大腦皮層中有半數以上的區域用於視覺功能, 這使得人類可以在150毫秒內將看到的場景識別理解出來。 而對於機器來說, 僅憑現在簡單的攝像頭根本無法做到這一點, 難以與人類匹敵。

人的視覺系統可獲取顏色和幾何兩個維度的資訊, 但今天所有能進行拍攝的普通相機, 只能記錄顏色資訊, 而喪失物體原來的物理屬性。 如何呈現三維世界的物體形態和位置關係就成為至關重要的問題了, 而目前技術上沒有哪一款物理設備可以直接獲取幾何資訊, 但通過雷達等不同技術手段可以實現3D測量的目的, 那圖漾是如何通過技術實現幾何維度的資訊採集的呢?

圖漾的方案比較特殊,他們在雙目的基礎上加上了結構光,而這種“雙目+結構光”方案也結合了兩種技術優勢。3D視覺感測器由雙目紅外攝像頭、彩色攝像頭和光學增強系統組成。光學增強系統也就是業界所成稱的結構光,本質上就是一個鐳射投射器,雙目攝像頭相當於接收器。當投射器投出的光線打在物體表面,物體將光線反射到兩個攝像頭內,以此收集相應參數資訊,再由圖漾搭配的演算法,通過計算給出物體的長寬高、距離等物理屬性。結構光能克服純雙目在紋理單調的環境中找不到匹配點而失效的弱點。另一方面,結構光方案的多機干擾問題很大,圖漾的深度感測器通過雙目獲取資訊,即使在室外有陽光淹沒結構光的情況下,雙目相機仍能捕捉深度資訊。

正是由於這種結合方案,圖漾的深度攝像頭對場景和環境的依賴非常低。“我們的感測器可以滿足7*24小時長時間工作需求,這也是我們在行業中的優勢”。圖漾目前已申請了多項專利,包括30多項申請、4項授權、1個PCT,所以即使產品出口到海外市場也不會有侵犯智慧財產權的風險。

圖漾的這一產品可防水、防塵、防濺還支援觸發模式,可由使用者控制進行單幀拍攝,連接多台設備,並實現多設備同步拍攝功能。圖漾提供的是軟硬體組合的一整套3D視覺解決方案,按照使用者的不同需求,會相應作出調整,價格在30美元到3000美元不等,可以說高中低檔產品都很齊全了。

三、不搞娛樂場景 認定工業3D視覺

費浙平說:“我們聚焦工業,是想為客戶解決實實在在的問題”。

如今中國的人口紅利正在消失,中國的工業自動化的進程正在加快,這就對機器的視覺提出了更高的要求,如機器人對物體的精准抓取、工業檢測等自動化視覺導引系統方面都亟待提高機器的視覺功能。在工業上,視覺系統承擔著兩個重要的功能,一是做為機器人的“眼睛”存在,也就是做機器的視覺引導系統,引導機器抓取物體,“手”該到哪個位置,怎樣姿勢抓取都是需要視覺基於機器人精准的定位。二是在工業檢測方面,檢測產品的缺陷和尺寸,需要對物體進行更智慧的。

聊了這麼多後,我突然追問費浙平,3D視覺到底是不是剛需?費浙平堅定地認為,“雖然2D視覺在這些領域的普及率不低,但一些複雜的任務2D做的並不好。可以說,目前2D的雙攝像頭只是一個過渡產品只有在行業需求到了該爆發的點,3D視覺才能真正落地。“3D視覺行業肯定是一片藍海,圖漾算是提前入局了。”

說到現在人工智慧行業的場面,真可以用“禍兮福之所倚,福兮禍之所伏”來概括了。費浙平也評價說,“短期內做人工智慧的無論大公司、創企都將盈利困難,整個行業都在靠融資挨過這一艱難時期”。但他也相信“計算視覺領域無疑是人工智慧板塊中體量最大、最具商業價值的領域,其應用規模會超過深度學習和人腦晶片”。

四、國內外3D視覺行業正在起步

現在2D視覺在應用上已基本成熟,涉及到定位、尺寸測量等工作都可以完成。但隨著人們對設備智慧化要求的不斷提升,2D視覺正遭遇著三維或多維空間內資訊採集缺失這一發展瓶頸。因而一些先行者正慢慢轉向3D技術。3D攝像頭能夠即時三維資訊採集,使消費電子終端加上了物體感知功能,從而引入人機交互、人臉識別、三維建模、AR、安防和輔助駕駛等多個應用場景。

市場上機器視覺技術比較成熟的3D方案主要有:結構光、雙目視覺和TOF(Time of Flight)三大流派。三種主流方案中,比較成熟的是結構光和TOF。其中結構光方案最為成熟,但是極易受到外界光的干擾、響應速度較慢、識別精度較低;TOF則在這幾個方面比結構光方案具有一定的優勢,因此TOF成為了目前在移動端被看好的方案。基於視差原理的雙目立體成像方案抗環境光干擾強,解析度高,也是移動端可選方案之一,但技術較新還不夠成熟,目前在機器人、自動駕駛領域應用較多。

國內外研究3D視覺技術的公司為數不多,以色列有家以結構光方案做3D感測器的公司名為PrimeSense,現已被蘋果收購,不再對外輸出技術。

深度攝像頭的應用場景上主要集中在消費端和工業領域。比如,安防中的行為識別和生物特徵識別,深度攝像頭配合深度學習演算法,可以對人的行為做出識別和預警,真正體現安防的作用。在工業領域,自動化流水線上的工業機器人、無人倉儲系統內的各類機器人都需要及時獲取深度資訊。深度攝像頭在娛樂消費端的應用算是最廣泛的了。如微軟Kinect體感遊戲機,可實現手勢、身體骨骼動作的識別。此外如蘋果FaceID所需的面部識別也要基於深度攝像頭的應用。

結語:3D視覺技術–正在崛起的藍海

據Yole報告《3D成像和傳感-2017版》稱,預計3D成像和感測器件市場的複合年增長率為37.7%,2022年將達到90億美元。來自Markets and Markets的一份報告也顯示,預計到2020年全球機器視覺市場規模將達到125億美元。

而在過去的五年,蘋果、微軟、英特爾等大型公司紛紛投資或者收購深度感測器、手勢識別演算法以及上下游相關解決方案公司。尤其是蘋果公司,iPhone X的Face ID運用的就是3D深度視覺技術,它也將深度感測器市場從小眾引領走向大眾市場。正如2013年蘋果發佈採用指紋識別器的iPhone 5S引爆了指紋識別感測器市場一樣,3D深度視覺行業正在崛起。

當然,目前3D視覺技術還未大規模應用,限制因素來自硬體技術工藝的複雜、演算法的複雜性以及未找到合適的應用場景。這些問題都亟待3D視覺技術業內人士解決,不過可以肯定的是3D視覺技術這片藍海正在慢慢崛起,伺機爆發。

圖漾的方案比較特殊,他們在雙目的基礎上加上了結構光,而這種“雙目+結構光”方案也結合了兩種技術優勢。3D視覺感測器由雙目紅外攝像頭、彩色攝像頭和光學增強系統組成。光學增強系統也就是業界所成稱的結構光,本質上就是一個鐳射投射器,雙目攝像頭相當於接收器。當投射器投出的光線打在物體表面,物體將光線反射到兩個攝像頭內,以此收集相應參數資訊,再由圖漾搭配的演算法,通過計算給出物體的長寬高、距離等物理屬性。結構光能克服純雙目在紋理單調的環境中找不到匹配點而失效的弱點。另一方面,結構光方案的多機干擾問題很大,圖漾的深度感測器通過雙目獲取資訊,即使在室外有陽光淹沒結構光的情況下,雙目相機仍能捕捉深度資訊。

正是由於這種結合方案,圖漾的深度攝像頭對場景和環境的依賴非常低。“我們的感測器可以滿足7*24小時長時間工作需求,這也是我們在行業中的優勢”。圖漾目前已申請了多項專利,包括30多項申請、4項授權、1個PCT,所以即使產品出口到海外市場也不會有侵犯智慧財產權的風險。

圖漾的這一產品可防水、防塵、防濺還支援觸發模式,可由使用者控制進行單幀拍攝,連接多台設備,並實現多設備同步拍攝功能。圖漾提供的是軟硬體組合的一整套3D視覺解決方案,按照使用者的不同需求,會相應作出調整,價格在30美元到3000美元不等,可以說高中低檔產品都很齊全了。

三、不搞娛樂場景 認定工業3D視覺

費浙平說:“我們聚焦工業,是想為客戶解決實實在在的問題”。

如今中國的人口紅利正在消失,中國的工業自動化的進程正在加快,這就對機器的視覺提出了更高的要求,如機器人對物體的精准抓取、工業檢測等自動化視覺導引系統方面都亟待提高機器的視覺功能。在工業上,視覺系統承擔著兩個重要的功能,一是做為機器人的“眼睛”存在,也就是做機器的視覺引導系統,引導機器抓取物體,“手”該到哪個位置,怎樣姿勢抓取都是需要視覺基於機器人精准的定位。二是在工業檢測方面,檢測產品的缺陷和尺寸,需要對物體進行更智慧的。

聊了這麼多後,我突然追問費浙平,3D視覺到底是不是剛需?費浙平堅定地認為,“雖然2D視覺在這些領域的普及率不低,但一些複雜的任務2D做的並不好。可以說,目前2D的雙攝像頭只是一個過渡產品只有在行業需求到了該爆發的點,3D視覺才能真正落地。“3D視覺行業肯定是一片藍海,圖漾算是提前入局了。”

說到現在人工智慧行業的場面,真可以用“禍兮福之所倚,福兮禍之所伏”來概括了。費浙平也評價說,“短期內做人工智慧的無論大公司、創企都將盈利困難,整個行業都在靠融資挨過這一艱難時期”。但他也相信“計算視覺領域無疑是人工智慧板塊中體量最大、最具商業價值的領域,其應用規模會超過深度學習和人腦晶片”。

四、國內外3D視覺行業正在起步

現在2D視覺在應用上已基本成熟,涉及到定位、尺寸測量等工作都可以完成。但隨著人們對設備智慧化要求的不斷提升,2D視覺正遭遇著三維或多維空間內資訊採集缺失這一發展瓶頸。因而一些先行者正慢慢轉向3D技術。3D攝像頭能夠即時三維資訊採集,使消費電子終端加上了物體感知功能,從而引入人機交互、人臉識別、三維建模、AR、安防和輔助駕駛等多個應用場景。

市場上機器視覺技術比較成熟的3D方案主要有:結構光、雙目視覺和TOF(Time of Flight)三大流派。三種主流方案中,比較成熟的是結構光和TOF。其中結構光方案最為成熟,但是極易受到外界光的干擾、響應速度較慢、識別精度較低;TOF則在這幾個方面比結構光方案具有一定的優勢,因此TOF成為了目前在移動端被看好的方案。基於視差原理的雙目立體成像方案抗環境光干擾強,解析度高,也是移動端可選方案之一,但技術較新還不夠成熟,目前在機器人、自動駕駛領域應用較多。

國內外研究3D視覺技術的公司為數不多,以色列有家以結構光方案做3D感測器的公司名為PrimeSense,現已被蘋果收購,不再對外輸出技術。

深度攝像頭的應用場景上主要集中在消費端和工業領域。比如,安防中的行為識別和生物特徵識別,深度攝像頭配合深度學習演算法,可以對人的行為做出識別和預警,真正體現安防的作用。在工業領域,自動化流水線上的工業機器人、無人倉儲系統內的各類機器人都需要及時獲取深度資訊。深度攝像頭在娛樂消費端的應用算是最廣泛的了。如微軟Kinect體感遊戲機,可實現手勢、身體骨骼動作的識別。此外如蘋果FaceID所需的面部識別也要基於深度攝像頭的應用。

結語:3D視覺技術–正在崛起的藍海

據Yole報告《3D成像和傳感-2017版》稱,預計3D成像和感測器件市場的複合年增長率為37.7%,2022年將達到90億美元。來自Markets and Markets的一份報告也顯示,預計到2020年全球機器視覺市場規模將達到125億美元。

而在過去的五年,蘋果、微軟、英特爾等大型公司紛紛投資或者收購深度感測器、手勢識別演算法以及上下游相關解決方案公司。尤其是蘋果公司,iPhone X的Face ID運用的就是3D深度視覺技術,它也將深度感測器市場從小眾引領走向大眾市場。正如2013年蘋果發佈採用指紋識別器的iPhone 5S引爆了指紋識別感測器市場一樣,3D深度視覺行業正在崛起。

當然,目前3D視覺技術還未大規模應用,限制因素來自硬體技術工藝的複雜、演算法的複雜性以及未找到合適的應用場景。這些問題都亟待3D視覺技術業內人士解決,不過可以肯定的是3D視覺技術這片藍海正在慢慢崛起,伺機爆發。

Next Article
喜欢就按个赞吧!!!
点击关闭提示