您的位置:首頁>正文

一文看懂百度AI開發者大會到底開放了哪些新技術

中國第一次大規模AI開發者大會——百度AI開發者大會(Baidu Create2017)圓滿落幕, 超過5000名開發者和行業夥伴齊聚一堂與百度一起見證AI開放時代。 其中, AI技術與開放平臺分論壇被參會嘉賓稱為“最極客”的分論壇, 不少開發者評價此次分論壇“全程無尿點”、“時間太短”。

那麼, 在這2個半小時裡發生了什麼?百度究竟發佈了什麼“神秘武器”?下面為大家快速盤點百度AI開發者大會AI技術與開放平臺分論壇的重要內容, 沒去現場也能get最全乾貨。

百度AI技術平臺架構首次詳解

大會主論壇首次公佈了百度整體AI架構及佈局。 作為百度AI的核心,

百度大腦由演算法層、感知層、認知層、平臺層組成, 其中演算法層是機器學習平臺, 包括深度學習, 作為百度大腦的底層基礎。 值得一提的是, 在演算法層之上, 百度大腦是業界首個清晰劃分出感知層和認知層的AI架構。

在會上, 還宣佈了開放14項全新能力, 包括語音、視頻、增強現實、機器人視覺、自然語言處理五大類, 與已開放的能力一起, 共同構成具有60項核心能力的完整的、綜合的AI技術開放平臺。 據悉, 百度AI開放平臺在完整性、開放性、前瞻性和發展性方面均領跑業界。 。

語音技術全面升級推出開放生態2.0

分論壇上, 宣佈遠場識別及喚醒技術、定制化語音合成、極致語音合成音色、 Emotional CUI(ECUI)等技術全新開放, 並發佈了百度語音開放生態2.0。

在現場以視頻實錄的形式展示了遠場識別技術, 從距離3米到10米都可以準確識別測試者說的內容。 首次提出的Emotional CUI(ECUI)是在CUI基礎上的升級, 可以從對話者的音量、音域、語速、音色幾個維度發掘更多資訊, 實現個性化聲音、生動對話、情緒回應等功能, 增強對話感, 融入更多情感的對話體驗。

發佈理解與交互技術平臺開發者可定制

視頻分析技術實現“以圖搜影”“視頻互搜”

分論壇視頻技術部分介紹了:視頻分割、視頻封面選摘、視頻分類/標籤、視頻索引/檢索、視頻細細微性物體識別、視頻審核色情識別、視頻公眾人物識別、視頻結構化分析、視頻細細微性識別等技術以及機器人視覺。

其中, 視頻分割是無人駕駛/機器人的核心技術,

但對資料和精度要求很高, 需要圖元級別的輸出資訊, 和更多的視頻訓練資料。 在這一點上, 百度已經擁有世界上第一個室外語義分割RGBD視頻資料集, 並將繼續開放全新資料集。

此次推出的機器人視覺開放平臺由攝像機IMU模組、SLAM、障礙物檢測、地圖重建、和語義識別幾大部分構成, 並已開源開放。

發佈全新Dumix AR開放平臺將開放內測

DuMix AR開放平臺由4部分組成, 包括AR SDK、內容製作工具、雲端內容平臺和內容分發服務。 在今年1月份, 百度宣佈正式成立增強現實實驗室(AR Lab), 並在手機百度、百度地圖、百度糯米等多款百度應用上線了如AR神奇動物園、AR課程知識點、AR復原老城門及兵馬俑古建、AR步行導航等多個場景標杆案例。 此次在AI開發者大會全新推出的DuMix AR開放平臺,

正式將百度強大的AR技術積累開放給開發者, 可為開發者提供強大的圖像識別與觸發、魯棒的三維感知與跟蹤能力、豐富的智慧交互、超輕量AR渲染引擎等能力支援。 據悉該平臺將開展三個月的內測, 開發者不要錯過。

PaddlePaddle:全開放的專案組織模式、研發雲

本次開發者大會PaddlePaddle一次性宣佈了全開放的專案組織模式、重構路線圖、研發雲、開放大規模資料和應用模型庫等。

據悉, PaddlePaddle開源將在9月初推出新版:更加靈活易用, 發佈PaddlePaddle應用模型庫。 12月初將再次更新升級:支持Volta16位浮點,支持TensorRT。 全新推出PaddlePaddle研發雲, 將採用Kubernetes平行計算管理環境, 對GPU, FPGA, CPU,及眾多深度學習計算硬體持開放態度, 並鼓勵最優深度學習硬體。

此外, 現場還公佈了已有13年歷史的“百度之星”大賽,

今年會在傳統設計大賽的基礎上增加開發者大賽, 主題是"設計和開發一個以對話式人機交互為核心的智慧產品", 為開發者提供一個展示自己AI創意和實現AI理想的平臺。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示