穀歌今天宣佈, 將擴大其語音辨識能力, 增加支援數十種新語言, 尤其是在印度和非洲新興市場。
這意味著, 世界上有更多的人可以通過穀歌的鍵盤應用Gboard,
該公司表示, 更新後, 該公司將在全球範圍內增加30種語言和地區, 使支援語言總數達到119種。
這次更新包括8種印度語言, 以及斯瓦希裡語和阿姆哈拉語, 這兩種語言是非洲最大的語言。
新的語音辨識技術將首先在Gboard上支援安卓和語音搜索。
與此同時, 美國說英語的人現在可以使用語音聽寫來表達自己使用表情符號的方式。
(例如, 你可以只說“眨眼表情”, 而不是去找它。 )
如今, 這種新的語言也在雲語音API中獲得了支援, 該API已經支援了89種語言, 並被用於許多協力廠商語音和視頻應用程式, 如轉錄服務、語音分析應用程式、IVR應用程式等。
假以時日, 這些新語言將被添加到穀歌的其他產品中, 包括谷歌翻譯應用。
然而, 這條消息的關鍵部分在於, 這對新興市場的投資者意味著什麼——在成為第一批獲得技術巨頭新技術進步的公司時, 這些地區往往被忽視。
但隨著移動設備的使用, 情況發生了改變。
隨著下一大批互聯網用戶上網, 科技公司的目標是在這些地區建立立足點。
尤其是在印度, 穀歌擴大語音辨識技術的舉措可能會產生重大影響。
截至今年6月, 印度約有4.2億移動互聯網用戶, 這使印度成為蘋果、穀歌和Facebook等公司在全球最大的市場之一。
穀歌在語音技術領域的擴張也發生在華爾街日報的一篇文章中,
例如, 穀歌告訴華爾街日報, 它看到了“一種新型的互聯網用戶”——這是一個“與第一批十億人非常不同”的網路使用者。
為了開發這些新語言的語音辨識能力, 穀歌將人工勞動與機器學習技術結合起來。
該公司表示, 它與母語為英語的人合作, 通過讓他們閱讀一些常用短語來收集語音樣本。
這反過來又幫助訓練了穀歌的機器學習模型, 以便更好地理解新語言的發音和詞彙, 以便隨著時間的推移, 更多地接觸到更多的例子, 從而提高它們的準確性。