電腦一直都很擅長視覺識別。 有時它們識別一系列圖像中某個個體的能力能夠與人類相媲美。 但相似的結果是否說明了電腦能夠類比人類的視覺系統呢?看到這個問題或許你會覺得電腦系統比不上人類, 但是下面的實例會讓你改變想法。
在Facebook升級版的AI圖像識別機制中, 可以説明使用者通過文字描述搜索查找靶心圖表片(譬如“黑色T恤的照片”, 系統可自動查找、識別圖片中包含的黑色T恤, 不論該圖片是否標注了“黑色T恤”標籤)。
這項技術目前有兩種形式的應用, 其一是用於幫助用戶更快捷高效地識別、遮罩令人不快的內容, 其二是根據使用者的偏好, 推送他們感興趣的內容。
社交媒體行銷可根據這項技術的特點,
“刀鋒戰士”是谷歌的最新人工智慧軟體, 它基於兩種神經網路和機器學習, 可挖掘隱藏於模糊圖片中的細節, 繪製出8x8圖元化的圖像, 繼而通過搜索篩選和原圖各部分細節匹配度最高的、高解析度的各種圖像, 自動彌補原圖丟失的細節。 谷歌的“刀鋒戰士”是AI圖像對基於特徵臉的人臉識別方法的成功實踐。
而繼穀歌的“刀鋒戰士”之後,
穀歌將致力於發展視頻識別和搜索。
對於穀歌而言, 識別圖片中的物件已不再是挑戰。 穀歌的下一個挑戰是識別和搜索視頻中的內容, 因為這需要處理更多的資料量。
不僅穀歌, Facebook、Snap和Twitter等也都在分析視頻內容, 它們也面臨著同樣的挑戰。 圖像識別之所以取得長足發展, 正是因為開放資料的結果。 而如今, 人工智慧(AI)系統需要資料才能變得更加智慧, 而包括穀歌在內的這些企業和機構已在致力於提供這樣的原始資料。
當然,穀歌不僅僅是想提高技術,造福全人類。穀歌也希望借此改進自己的產品,就像為Gmail增加Smart Replies智慧回復功能,為谷歌翻譯服務添加“即時視覺翻譯”功能一樣。同樣,穀歌也希望YouTube能成為人們搜索視頻的最佳去處。
谷歌高級研究員傑夫·迪恩(Jeff Dean)說:“如果能識別一頭牛跳過月亮、或一隻貓跳過籬笆的視頻,那真是太酷了。”迪恩稱,這意味著穀歌將不再需要依靠中繼資料來搜索了。同時,這種技術還能改善視頻推薦服務。
基於電腦視覺和深度學習神經網路模型,每天分析數十億圖像,升級後的Rekognition 可以判斷照片中人物的年齡,給出整數範圍,並根據這個資料和其它面部識別資訊(人物表情,是否佩戴墨鏡,是否有鬍鬚等),鎖定目標人物。
這項技術可用于比對雇員與所持證件照片是否一致,執行特殊監視任務等。
【圖像識別通過拍照 計算卡路里】一款減肥軟體Lose It在前不久宣佈增加了一項新功能,只要拿著手機對食物拍個照,這款app就會對照片進行分析。用戶會看到 “食物建議”以及它們的熱量。
Lose It表示,其圖像識別技術優於穀歌,其開發的FoodDist模型,具有此前最高的預測準確率。
【電腦識別圖像的極限在何處?】《美國科學院院刊》發表了一篇論文提到了電腦和人類視覺系統的不同。
最大的差別可以總結為電腦沒有人腦靈活,這同樣也是語言識別系統所面臨的問題:人類可以通過支離破碎的單詞推測出一句話或者一段話的意思而電腦不能。同樣在圖像識別方面:人類可以可以破碎的線索拼湊出模糊的圖像,而電腦卻不行。
總的來說,電腦在圖像識別上能做的很好,但並不是十分接近人類處理相同任務時的過程。它們無法使用圖像中的獨立部分進行資訊識別,利用最少資訊識別圖像上它們不如人類。
為了讓電腦模組更好的工作可能需要瞭解我們的大腦。人類在進行圖像識別時,可能先猜測圖像是什麼,然後再尋找特性驗證或反駁最初的想法。如果是這樣的話,這與電腦模組的工作程式完全不同。
輕搜AISaaS平臺,採用針對不同應用場景深度優化的圖像識別演算法,在安防監控、智慧終端機及智慧交通等領域提供解決方案,服務終端使用者、智慧安防集成商及攝像機製造商,幫助用戶以最低的成本使用圖像識別技術,最快只需9分鐘即可讓客戶完成遠端接入!
想要瞭解OCR及其他行業圖像識別技術,看這→→→→→→→→
輕搜索(nj_qsooo)——長按可複製
輕搜SaaS平臺—http://www.qsooo.net:利用圖像識別技術,可快速準確的提取並識別圖片主題資訊,可供商業與非商業用戶免費體驗~
當然,穀歌不僅僅是想提高技術,造福全人類。穀歌也希望借此改進自己的產品,就像為Gmail增加Smart Replies智慧回復功能,為谷歌翻譯服務添加“即時視覺翻譯”功能一樣。同樣,穀歌也希望YouTube能成為人們搜索視頻的最佳去處。
谷歌高級研究員傑夫·迪恩(Jeff Dean)說:“如果能識別一頭牛跳過月亮、或一隻貓跳過籬笆的視頻,那真是太酷了。”迪恩稱,這意味著穀歌將不再需要依靠中繼資料來搜索了。同時,這種技術還能改善視頻推薦服務。
基於電腦視覺和深度學習神經網路模型,每天分析數十億圖像,升級後的Rekognition 可以判斷照片中人物的年齡,給出整數範圍,並根據這個資料和其它面部識別資訊(人物表情,是否佩戴墨鏡,是否有鬍鬚等),鎖定目標人物。
這項技術可用于比對雇員與所持證件照片是否一致,執行特殊監視任務等。
【圖像識別通過拍照 計算卡路里】一款減肥軟體Lose It在前不久宣佈增加了一項新功能,只要拿著手機對食物拍個照,這款app就會對照片進行分析。用戶會看到 “食物建議”以及它們的熱量。
Lose It表示,其圖像識別技術優於穀歌,其開發的FoodDist模型,具有此前最高的預測準確率。
【電腦識別圖像的極限在何處?】《美國科學院院刊》發表了一篇論文提到了電腦和人類視覺系統的不同。
最大的差別可以總結為電腦沒有人腦靈活,這同樣也是語言識別系統所面臨的問題:人類可以通過支離破碎的單詞推測出一句話或者一段話的意思而電腦不能。同樣在圖像識別方面:人類可以可以破碎的線索拼湊出模糊的圖像,而電腦卻不行。
總的來說,電腦在圖像識別上能做的很好,但並不是十分接近人類處理相同任務時的過程。它們無法使用圖像中的獨立部分進行資訊識別,利用最少資訊識別圖像上它們不如人類。
為了讓電腦模組更好的工作可能需要瞭解我們的大腦。人類在進行圖像識別時,可能先猜測圖像是什麼,然後再尋找特性驗證或反駁最初的想法。如果是這樣的話,這與電腦模組的工作程式完全不同。
輕搜AISaaS平臺,採用針對不同應用場景深度優化的圖像識別演算法,在安防監控、智慧終端機及智慧交通等領域提供解決方案,服務終端使用者、智慧安防集成商及攝像機製造商,幫助用戶以最低的成本使用圖像識別技術,最快只需9分鐘即可讓客戶完成遠端接入!
想要瞭解OCR及其他行業圖像識別技術,看這→→→→→→→→
輕搜索(nj_qsooo)——長按可複製
輕搜SaaS平臺—http://www.qsooo.net:利用圖像識別技術,可快速準確的提取並識別圖片主題資訊,可供商業與非商業用戶免費體驗~