華文網

如果機器人有雙“慧眼”的話,那……

近日,專注於電腦視覺和深度學習的AI企業商湯科技宣佈完成4.1億美元B輪融資,

創下全球人工智慧領域單輪融資最高紀錄,這條新聞引爆了行業熱點。商湯科技憑藉著“電腦視覺”這一黑科技獲得巨額融資,那麼什麼是電腦視覺呢?

近年來,為了讓機器更像人,能夠認知事物,從而進行判定和深度學習,電腦視覺技術方法與應用發展迅速。電腦視覺研究如何讓電腦可以像人類一樣去理解圖片、視頻等多媒體資源內容。例如用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等,

並進一步處理成更適合人眼觀察或進行儀器檢測的圖像。近些年在海量的圖像資料集、機器學習(深度學習)方法以及性能日益提升的電腦支援下,電腦視覺領域的技術與應用均得到迅速發展。

當下機器視覺技術已經滲入到我們的日常生活中,從手機裡的美顏APP面目識別功能、人臉相冊分類,到支付寶面部識別身份驗證、儲物櫃人臉識別,

以及工業機器人對物體準確抓取、物流機器人障礙避讓等等都是運用了電腦視覺技術。

國內外眾多知名機構在電腦視覺不同方向均有涉及,國內更是湧現出一批相關的明星創業團隊。除了耳熟能詳的Google、微軟、Facebook等工業界科技巨頭有所涉及之外,一些著名高校也設有專門的實驗室,如斯坦福、麻省理工以及伯克利等。國內則湧現出一批以依圖、商湯、曠視、雲從以及格靈深瞳等為首的創業公司,

技術團隊核心成員大多擁有前述工業界及學術界知名機構的研究經驗。

下面三寶平臺機器人就詳細梳理一下電腦視覺的應用領域:

人臉識別

“人臉識別”是人工智慧“電腦視覺”領域中最熱門的應用,今年2月,《麻省理工科技評論》發佈“2017全球十大突破性技術”榜單,來自中國的技術“刷臉支付”位列其中,今後靠臉吃飯完全不是問題。

這是該榜單創建16年來首個來自中國的技術突破。人臉識別技術目前已經廣泛應用于金融、司法、軍隊、公安、邊檢、政府、航太、電力、工廠、教育、醫療等行業。據業內人士分析,我國的人臉識別產業的需求旺盛,需求推動導致企業敢於投入資金。目前,該技術已具備大規模商用的條件,未來三到五年將高速增長。而今年,這一技術有望在金融與安防領域迎來大爆發。

視頻監控分析

人工智慧技術可以對結構化的人、車、物等視頻內容資訊進行快速檢索、查詢。這項應用使得讓公安系統在繁雜的監控視頻中搜尋到罪犯的有了可能。在大量人群流動的交通樞紐,該技術也被廣泛用於人群分析、防控預警等。

視頻監控領域盈利空間廣闊,商業模式多種多樣,既可以提供行業整體解決方案,也可以銷售集成硬體設備。將技術應用於視頻及監控領域在人工智慧公司中正在形成一種趨勢,這項技術應用將率先在安防、交通甚至零售等行業掀起應用熱潮。

工業視覺檢測

機器視覺可以快速獲取大量資訊,並進行自動處理。在自動化生產過程中,人們將機器視覺系統廣泛地用於工況監視、成品核對總和品質控制等領域。

機器視覺系統的特點是提高生產的柔性和自動化程度。運用在一些危險工作環境或人工視覺難以滿足要求的場合;此外,在大批量工業生產過程中,機器視覺檢測可以大大提高生產效率和生產的自動化程度。

醫療影像診斷

醫療資料中有超過90%的資料來自醫療影像。醫療影像領域擁有孕育深度學習的海量資料,醫療影像診斷可以輔助醫生,提升醫生的診斷的效率。

2015年4月,IBM成立了WatsonHealth部門,開始進軍醫療行業。2015年8月6日,IBM宣佈以10億美元的價格收購醫療影像公司MergeHealthcare,並將其與新成立的WatsonHealth合併。2016年2月,IBM又斥資26億美元收購醫療資料公司TruvenHealthAnalytics。今年2月份,在HIMSS17大會上WatsonHealth公佈了IBM的第一個認知影像產品WatsonClinicalImagingReview,該產品可檢查包括圖像在內的醫療資料,説明醫療服務提供者識別需要關注的最危急情況。

文字識別

電腦文字識別,俗稱光學字元辨識,它是利用光學技術和電腦技術把印在或寫在紙上的文字讀取出來,並轉換成一種電腦能夠接受、人又可以理解的格式。這是實現文字高速錄入的一項關鍵技術。

今年三月份,海康威視研究院預研團隊基於深度學習技術的OCR(OpticalCharacterRecognition,圖像中文字識別)技術,刷新了ICDARRobustReading競賽資料集的全球最好成績,並在「互聯網圖像文字」、「對焦自然場景文字」和「隨拍自然場景文字」三項挑戰的文字識別(WordRecognition)任務中取得第一。同期參賽的有來自82個國家的2367支隊伍參加,其中包括Google、微軟、百度、三星、曠視等團隊。

如今“電腦視覺”成為了小風口,大量資本湧入,而2017年可能將是人臉識別產業應用產生突破性進展的一年。人臉識別和視頻監控兩大方向最受資本青睞,同時技術也在尋找其他方向的突破。

這項技術應用將率先在安防、交通甚至零售等行業掀起應用熱潮。

工業視覺檢測

機器視覺可以快速獲取大量資訊,並進行自動處理。在自動化生產過程中,人們將機器視覺系統廣泛地用於工況監視、成品核對總和品質控制等領域。

機器視覺系統的特點是提高生產的柔性和自動化程度。運用在一些危險工作環境或人工視覺難以滿足要求的場合;此外,在大批量工業生產過程中,機器視覺檢測可以大大提高生產效率和生產的自動化程度。

醫療影像診斷

醫療資料中有超過90%的資料來自醫療影像。醫療影像領域擁有孕育深度學習的海量資料,醫療影像診斷可以輔助醫生,提升醫生的診斷的效率。

2015年4月,IBM成立了WatsonHealth部門,開始進軍醫療行業。2015年8月6日,IBM宣佈以10億美元的價格收購醫療影像公司MergeHealthcare,並將其與新成立的WatsonHealth合併。2016年2月,IBM又斥資26億美元收購醫療資料公司TruvenHealthAnalytics。今年2月份,在HIMSS17大會上WatsonHealth公佈了IBM的第一個認知影像產品WatsonClinicalImagingReview,該產品可檢查包括圖像在內的醫療資料,説明醫療服務提供者識別需要關注的最危急情況。

文字識別

電腦文字識別,俗稱光學字元辨識,它是利用光學技術和電腦技術把印在或寫在紙上的文字讀取出來,並轉換成一種電腦能夠接受、人又可以理解的格式。這是實現文字高速錄入的一項關鍵技術。

今年三月份,海康威視研究院預研團隊基於深度學習技術的OCR(OpticalCharacterRecognition,圖像中文字識別)技術,刷新了ICDARRobustReading競賽資料集的全球最好成績,並在「互聯網圖像文字」、「對焦自然場景文字」和「隨拍自然場景文字」三項挑戰的文字識別(WordRecognition)任務中取得第一。同期參賽的有來自82個國家的2367支隊伍參加,其中包括Google、微軟、百度、三星、曠視等團隊。

如今“電腦視覺”成為了小風口,大量資本湧入,而2017年可能將是人臉識別產業應用產生突破性進展的一年。人臉識別和視頻監控兩大方向最受資本青睞,同時技術也在尋找其他方向的突破。