您的位置:首頁>科技>正文

從淘寶“刷鞋購物”到索引整個城市,阿裡圖像搜索技術的下一步

導讀:阿裡的“刷鞋購物”在國內外引發眾多關注, 其背後支撐的技術正是來自阿裡iDST華先勝團隊圖像搜索技術的運用。

近日, 電腦圖像視覺頂級會議CVPR 2017在美國夏威夷舉辦, 阿裡巴巴iDST副院長華先勝發表演講, 介紹了阿裡圖像搜索技術發展, 以及在淘寶商品搜索和杭州“城市大腦”中的應用, 並指出下一步通過視頻和圖片分析將可以實現整個城市的索引和搜索。

阿裡巴巴iDST副院長華先勝現場發言

圖像搜索主要分為索引和搜索兩個步驟。 圖像搜索的第一步是訓練電腦進行圖像理解, 通過電腦將圖片中的要素, 包括人像、顏色、紋理等具體特徵以及深度學習產生的圖像描述, 轉化為類似文字的“視覺詞”, 編成索引之後, 才能再進行第二步——圖像搜索。

在演講中, 華先勝提到實現精准高效的圖像搜索有四個關鍵要求:

1)相關性:這是圖像搜索系統的核心指標,

可以分解為準確率和召回率。 其中召回率在現實世界系統中有時候是非常難測量的, 因為並不知道在真實世界中有多少真正的物品和搜索物可以完美匹配。

2)覆蓋率:簡單說就是搜索系統能支援多少種物品的搜索。 比如產品搜索, 系統需要最大可能地支援更多的產品, 不僅是剛性的物品還包括非剛性(會產生形變)的產品。

3)伸縮性:是指系統處理大規模資料和大規模查詢的能力。 如系統可以多快地索引大量的機動車、人和產品, 以及快速回應大量用戶的搜索請求。

4)用戶體驗:每一種演算法都不可能完美, 所以需要設計特定的交互, 通過使用者與系統的交互來彌補演算法的缺陷。

華先勝指出, 阿裡電商平臺擁有的海量商品圖片和使用者回饋資料為電腦訓練提供了支撐,

同時電商也是“以圖搜圖”的剛需場景。 早在2015年就上線的以圖搜圖功能「拍立淘」, 當年「雙十一」期間, 就有過千萬消費者使用了「拍立淘」搜索購物, 而目前「拍立淘」搜索範疇基本上已全面覆蓋所日用商品。

引起熱議的“刷鞋購物”其實是拍立淘具體場景的運用

電商的圖像搜索技術, 延伸到城市場景裡面來, 對城市的一些基本要素, 包括車、步行人、騎行人、道路、建築物等, 進行識別、索引和搜索。 這項技術整體上可以叫做城市圖搜或者叫城市搜索, 在杭州的「城市大腦」專案中已經開始充分運用。 杭州「城市大腦」是全球唯一能夠對全城視頻進行即時分析的人工智慧系統, 依靠阿裡雲ET的視頻識別演算法, 能夠感知到複雜道路下車輛的運行情況, 準確率達99%以上。 當前, 正在逐步上線一些最新的人、車、物的搜索技術, 例如想找某特定類型特定顏色的車, 那麼改動搜索欄中顏色選項即可, 還可以通過改變車牌號碼的某一段來搜索,

或者僅通過車輛或人的一幅照片進行搜索, 專業一點的語言甚至可以叫索引整個城市。

面對前沿技術挑戰, 年初阿裡巴巴對外公佈了“NASA”計畫, 投入科研力量“為了解決10年、20年後的困難”。 前不久, 阿裡還面向全球發佈AIR(Alibaba Innovative Research)計畫, 致力於推進電腦科學領域基礎性、前瞻性、突破性的研究, 以校企深度合作的方式引領重大科技創新的實踐應用, 以此搭建學術界、工業界的合作平臺, 聯合雙方優勢共同促進前沿技術的發展。

Next Article
喜欢就按个赞吧!!!
点击关闭提示