一文看懂百度AI開發者大會到底開放了哪些新技術

中國第一次大規模AI開發者大會——百度AI開發者大會（Baidu Create2017）圓滿落幕，超過5000名開發者和行業夥伴齊聚一堂與百度一起見證AI開放時代。其中， AI技術與開放平臺分論壇被參會嘉賓稱為“最極客”的分論壇，不少開發者評價此次分論壇“全程無尿點”、“時間太短”。

那麼，在這2個半小時裡發生了什麼？百度究竟發佈了什麼“神秘武器”？下面為大家快速盤點百度AI開發者大會AI技術與開放平臺分論壇的重要內容，沒去現場也能get最全乾貨。

百度AI技術平臺架構首次詳解

大會主論壇首次公佈了百度整體AI架構及佈局。作為百度AI的核心，

百度大腦由演算法層、感知層、認知層、平臺層組成，其中演算法層是機器學習平臺，包括深度學習，作為百度大腦的底層基礎。值得一提的是，在演算法層之上，百度大腦是業界首個清晰劃分出感知層和認知層的AI架構。

在會上，還宣佈了開放14項全新能力，包括語音、視頻、增強現實、機器人視覺、自然語言處理五大類，與已開放的能力一起，共同構成具有60項核心能力的完整的、綜合的AI技術開放平臺。據悉，百度AI開放平臺在完整性、開放性、前瞻性和發展性方面均領跑業界。。

語音技術全面升級推出開放生態2.0

分論壇上，宣佈遠場識別及喚醒技術、定制化語音合成、極致語音合成音色、 Emotional CUI（ECUI）等技術全新開放，並發佈了百度語音開放生態2.0。

在現場以視頻實錄的形式展示了遠場識別技術，從距離3米到10米都可以準確識別測試者說的內容。首次提出的Emotional CUI（ECUI）是在CUI基礎上的升級，可以從對話者的音量、音域、語速、音色幾個維度發掘更多資訊，實現個性化聲音、生動對話、情緒回應等功能，增強對話感，融入更多情感的對話體驗。

發佈理解與交互技術平臺開發者可定制

視頻分析技術實現“以圖搜影”“視頻互搜”

分論壇視頻技術部分介紹了：視頻分割、視頻封面選摘、視頻分類/標籤、視頻索引/檢索、視頻細細微性物體識別、視頻審核色情識別、視頻公眾人物識別、視頻結構化分析、視頻細細微性識別等技術以及機器人視覺。

其中，視頻分割是無人駕駛/機器人的核心技術，

但對資料和精度要求很高，需要圖元級別的輸出資訊，和更多的視頻訓練資料。在這一點上，百度已經擁有世界上第一個室外語義分割RGBD視頻資料集，並將繼續開放全新資料集。

此次推出的機器人視覺開放平臺由攝像機IMU模組、SLAM、障礙物檢測、地圖重建、和語義識別幾大部分構成，並已開源開放。

發佈全新Dumix AR開放平臺將開放內測

DuMix AR開放平臺由4部分組成，包括AR SDK、內容製作工具、雲端內容平臺和內容分發服務。在今年1月份，百度宣佈正式成立增強現實實驗室（AR Lab），並在手機百度、百度地圖、百度糯米等多款百度應用上線了如AR神奇動物園、AR課程知識點、AR復原老城門及兵馬俑古建、AR步行導航等多個場景標杆案例。此次在AI開發者大會全新推出的DuMix AR開放平臺，

正式將百度強大的AR技術積累開放給開發者，可為開發者提供強大的圖像識別與觸發、魯棒的三維感知與跟蹤能力、豐富的智慧交互、超輕量AR渲染引擎等能力支援。據悉該平臺將開展三個月的內測，開發者不要錯過。

PaddlePaddle：全開放的專案組織模式、研發雲

本次開發者大會PaddlePaddle一次性宣佈了全開放的專案組織模式、重構路線圖、研發雲、開放大規模資料和應用模型庫等。

據悉， PaddlePaddle開源將在9月初推出新版：更加靈活易用，發佈PaddlePaddle應用模型庫。 12月初將再次更新升級：支持Volta16位浮點,支持TensorRT。全新推出PaddlePaddle研發雲，將採用Kubernetes平行計算管理環境，對GPU, FPGA, CPU,及眾多深度學習計算硬體持開放態度，並鼓勵最優深度學習硬體。

此外，現場還公佈了已有13年歷史的“百度之星”大賽，

今年會在傳統設計大賽的基礎上增加開發者大賽，主題是"設計和開發一個以對話式人機交互為核心的智慧產品"，為開發者提供一個展示自己AI創意和實現AI理想的平臺。