華文網

它能讓霍金有一口倫敦腔,也在幫聾啞人重新開口說話

1月25日消息,據英國《衛報》報導,數以百萬計的人因傷病或先天性問題喪失了說話的能力。

但科學家發明的定制化數位聲音也許能讓他們重新“開口說話”。

去年11月,來自倫敦的31歲電影製片人喬·莫里斯(Joe Morris)注意到自己的舌頭上有一處傷口很疼。他覺得自己可能是在睡夢中咬了舌頭一口,到了深冬,他發現自己的痛處還沒消失。於是他在穀歌上搜索“舌頭傷口不會癒合”,在其中發現了口腔癌的相關頁面。喬沒有家族癌症史,但他還是決定打電話給自己的醫生。

醫生說,我確定你的口腔沒什麼問題。你不吸煙,才31歲。但以防萬一,還是去專家那裡看看。

專家說,我肯定沒什麼問題,你不必要作任何檢查。但以防萬一,我們會做一個活檢。

當活檢結果顯示喬的口腔癌細胞呈陽性時,專家說實驗室肯定搞錯了。

喬做了第二次活檢,結果依舊如此。專家大吃一驚。現在,喬被轉移到了蓋伊的醫院,該醫院是英國最好的口腔癌治療機構之一。

醫院的腫瘤學家再次向喬保證:癌變得部位很小,舌癌通常是從表面向內生長。相關的病變部位可能會被剔除,而對舌頭的其他部位沒有太大損害。他們會進行核磁共振檢查,以確保沒有任何嚴重的內部增生,然後安排手術。

圖像顯示出像冰山一樣存在的腫瘤。它深深地紮根在喬的舌根,向外凸起聳立,尖端已經頂破了患者舌頭的表面。“當醫生告訴我這個消息的時候,正好有一封工作郵件讓我心煩意亂”去年夏天,喬寫信給我,“當他向我解釋說我要失去我的舌頭時,我腦子裡正想著如何重新起草一個答覆。

“你會失去你三分之二的舌頭,”醫生告訴他,“這會嚴重影響吃飯和說話。“

喬想知道手術如何影響他的說話。他會口齒不清嗎?

醫生猶豫了一下,然後把視線轉向他的手,“你的家人仍然能夠理解你。”

手術前一周,喬開始恐慌:他意識到他可能再也不會說話了。即使他能夠說話,也不會像以前一樣了。喬知道他即將失去重要的身份特徵,

於是邀請一位元朋友記錄下他的聲音。

在錄影中,喬的話語已經有些不正常了:發音有些含混不清,不得不經常喝水,休息一下,以減輕說話的壓力。他穿著一件黑色針織V領毛衣,坐在靠近窗戶的地方,黃昏時分,窗外可以看到倫敦的天際線。他臉色蒼白,藍色的眼睛凹陷在眼眶中,黑黝黝的頭髮很亂,留著三天沒刮的胡茬。他看起來有點不舒服,有點傷心,有點沮喪。他一直在躲閃著鏡頭,望著遠處,或開玩笑。當被要求說出這個日期時,他笑著說:“我相信,日期是二月二十四日,2017年的一天。

對著鏡頭,喬奮力地表達了自己將要永遠失去聲音的感覺。“我的工作,也就是我的生活,全是關於溝通,關於談話。我喜歡說話,“他微微一笑,感慨地說,“我有幾件事要說。”

在拍攝這部影片之前不久,喬的朋友得到了一些消息。他在波士頓之外找到了一家名為Vocal ID的公司,它為那些通過設備來説明自己說話的人開發定制的數位化聲音。公司可以使用喬的錄音來在電腦上重現自己的聲音,讓他能夠永遠用自己的發音。

他們聯繫了Vocal ID的公司創始人,一位名叫魯帕派特爾(Rupal Patel)的語言病理學家,她解釋說,如果在手術之前他能夠錄下自己的聲音,將來就有可能數位化重建喬的聲音。這意味著Vocal ID通過分析記錄的幾千個句子發音來捕捉英語發音中的所有音素。

喬同意試一下。他錄了幾百個句子,然後,意識到這個任務的艱巨性,停了好幾天。他寫信給我說:“這是我自由的最後一周,我有很多事情要做,有很多人要見面,還要品嘗很多美食。”手術前兩天,他又開始了錄音。他的發音是緩慢而痛苦的——那時候喬說話已經極其痛苦的,他正在試圖做出最有口才的表達。在最後一天,他記錄到了深夜。

第二天早上,喬回到醫院,切掉了舌頭。

讓人們喪失言語能力的方式有很多,譬如口吃或失用症,運動神經元病和腦癱,這些都影響了參與語言表達的肌肉控制能力。此外還有創傷性腦損傷、中風、諸如喬這樣的手術、多發性硬化症以及自閉症等。在美國,超過200萬人需要用數位化的“適應性替代通信”(AAC)方法來幫助彌補言語缺陷。殘疾慈善機構2008年的一份研究報告估計,英國有1%的人使用或需要AAC。

現代的自我調整替代通信往往涉及斯蒂芬·霍金(Stephen Hawking)所使用的設備類型——一種小型的電腦或平板電腦,可以播放大量的文字。在1969年發明第一台現代文本語音通訊設備之前,肌肉發達或聲音障礙的人不得不使用通過吸管吸氣和呼氣操作的“吸吮”式打字機。到1986年,當霍金開始使用語音設備時,AAC技術有了顯著的提高。他使用的程式(稱為等化器)起初允許他通過按動開關在臺式電腦上選擇單詞或短語,然後可以通過安裝在輪椅上的小型電腦來發音。

2014年上映的霍金傳記片《萬物理論》 (The Theory of Everything)有一個鮮明的提示,即這項技術試圖修正存在的缺陷。當霍金和他的第一任妻子簡第一次聽到霍金的新聲音時,他們驚呆了。在片刻無語之後,簡怯懦地提出了一個反對意見:“這是美國口音”。一時間大家都笑了,但它說明了AAC存在的一個硬傷。我們的聲音是其他人瞭解我們的重要管道:你的年齡,性別,國籍,家鄉,性格,情緒,同時也是自己認識自己的途徑。當你的發音不再是本地口音後,你是否失去了自己的一部分?

霍金的案例是用一個人的聲音塑造他們身份的最具代表性例子之一。雖然他機器人般的數位化語音(和美國口音)一開始讓人感覺不舒服,但它卻成了他的身份特徵。霍金鍾情於自己的新聲音,幾年後,當他有機會採用一種更流暢,更有人情味和英語口語的新聲音時,他拒絕了。現在感覺聽聞其聲,如見其人。

“霍金的聲音”並不僅僅屬於霍金。自問世以來,小女孩,老年人以及各種種族和背景的人也使用了同樣的聲音。這是依賴AAC的使用者世界中的一個奇特的特徵:數以百萬計的人擁有的聲音類型卻相當有限。雖然現在比以前有更多的變化,但能夠應用的只有幾十種選擇,其中大部分還是成年人和男性口音。

“如果你走進一個坐滿語音障礙孩子的教室裡,你會聽到周圍的聲音完全一樣,”派特爾告訴我說。十年前,她在一次語言障礙會議上遇到一個小女孩和一個50多歲的男人正在使用他們的設備進行對話。他們在用同一個成年男性的聲音說話。派特爾驚恐萬分,她告訴我說:“這只會讓喪失言語功能的人失去尊嚴。”

電影評論家羅傑·亞伯特(Roger Ebert)的下巴因癌症被移除,他在2009年發表的一篇文章中描述了這種聲音多麼令人沮喪:“我聽起來像機器人羅比。想要有口才和語調是不可能的。“他厭倦了在談話中被忽略,“我們能把人送上月球,為什麼卻不能擁有自己的發聲器?“

這是派特爾已經在著手解決的問題。2007年,她開始研究一種技術,從而能夠製作出更像使用者發音的定制化數位聲音。到2014年,該技術已經足夠成熟,派特爾和她的團隊成立了世界上第一個“語音銀行”。這是一個線上平臺,任何有互聯網連接的人都可以通過錄音朗讀自己的聲音,建立關於聲音的語音庫(Voice Voicebank)。相關程式是用一個故事來編寫的,用來捕捉英語中所有的音素。 (早期的語音捐獻者需要上傳3487個句子;現在,Vocal ID的研究總監Geoff Meltzner可以開發少於1000個句子的聲音,儘管更多的錄音會使得人聲更加自然逼真。)

每位捐獻者的錄音都被編入一個聲音庫,可以在為客戶製作新的聲音時使用。該公司為客戶提供“BeSpoke”聲音,這種定制化的聲音能夠將客戶自己的聲音與捐獻者所提供的詞彙結合在一起。這樣,一個十幾歲的青少年就可以用他哥哥的捐贈聲音,或者是一個來自語音庫Voicebank的陌生人聲音,從而打造出高品質的定制化發音。 (像Joe這樣的客戶為了某種目的而將他們的聲音儲存起來,Vocal ID稱之為“聲音遺產”:他們記錄下自己的聲音,等需要的時候會收到一個關於自己聲音的數字檔。)

創建一個新的數位化語音通常需要兩個要素:聲源和篩檢程式。“聲源”是聲帶,喉和喉部肌肉等器官的結合,當我們笑,叫喊或說話時,聲源會發出聲音。正如Vocal ID的研究副總裁Geoff Meltzner所解釋的那樣,你的聲源就像你的指紋,”每個聲源中都有獨一無二的標識”。而“篩檢程式”則是將這些聲源發出的聲音塑造成不連續的,人耳可辨別的單詞,其包括了舌頭,嘴唇,咽等等。

Vocal ID的工作原理是從接受者那裡捕捉幾秒鐘的母音(聲源),並將其應用於捐贈者所提供的篩檢程式。這種組合產生的主要是“接收者”的聲音。通過調整演算法,Meltzner可以提供“柔和”(鼻音更重)或更“權威”(低音)或“更亮”(充滿高音)的聲音。

當一個新的聲音完成後,它會作為外掛程式添加到其擁有者已經使用的任何語音設備中。最近,Vocal ID在自己的應用程式中添加了一個功能,允許客戶自行調整他們的聲音,以獲得他們想要的音色和音調。系統的設計很方便,但偶爾也會出現故障。有一次,一個十幾歲的客戶驚慌地呼喚派特爾,因為她更新了iPhone上的軟體,失去了自己的聲音。

捐贈你的聲音通常需要幾天時間,這和捐腎完全不同。除了筆記型電腦和互聯網連接之外,沒有篩選過程,也沒有設備參與。去年冬天的一個慵懶日子裡,我決定在床上捐獻我的聲音,我把筆記型電腦向前傾斜,嘴巴向內置麥克風堅持重複:“提拉米蘇好極了!提拉米蘇好極了!“

流覽器上顯示的Vocal ID人類語音庫在看起來有點像一個視頻遊戲:靛藍色的背景畫出了一個卡通形象站在一行文字旁邊,大聲朗讀。一旦你滿意你的發音,點擊上傳句子到語音庫,隨後會出現現一行新的文字。螢幕底部的一欄會即時跟蹤您的進度。

作為捐獻者,需要閱讀的句子很多,人們通常會在幾天或幾周的時間內完成捐贈,一次只做幾個小時。為了讓漫長的練習變得有趣,Vocal ID會根據捐獻者的興趣選擇閱讀材料:詩歌,科幻小說或科幻小說。這種捐獻行為觸發了我們內心深處的東西:我們都是獨一無二的。這個聲音也許是一個獨特的個人禮物——既是物質的,也是精神上的。

在完成語音捐獻後不久,我到波士頓西郊的Vocal ID公司辦公室拜訪了派特爾。派特爾非常熱衷於為那些喪失言語功能的人創造一種個性化的聲音。她解釋說,當殘疾人出現溝通障礙時,這會增加他們的工作和社交障礙。

人類常常會對同類的聲音給予特別的關注和同情,並且無意識地會將說話能力與思想的存在等同起來。?2010年,醫學人類學家Mary Wickenden為青少年AAC用戶發表了一篇題為《青少年世界,不同的聲音》的論文,她指出:“如果你不能說話,可能很難證明你的想法。”

對於那些不能說話的人來說,在社會中會不斷被提醒自己的“不真實”。在第一年創造的七個聲音中,有六位用戶是腦癱的兒童或青少年,他們中的許多人抱怨說,陌生人往往完全忽視他們,總是直接和他們的父母交流,或者像對待嬰幼兒一樣對待他們。

不同的對話技術根據個人使用者的需求而變化很大:手指肌肉發達的人可以通過傳統的鍵盤輸入文字,並通過揚聲器聽到單詞發音。更常見的是用戶使用自己最習慣控制的操縱杆或開關,從螢幕上選擇單詞,短語或符號。對於那些不能使用操縱杆的人來說,可以通過跟蹤眼球運動的螢幕來選擇短語和符號。

即使對於那些經常使用類似技術的人來說,這些設備也可能令人沮喪。通常,在你選到需要的字元或符號之前,你必須等待游標跳過十幾個字母或符號——如果錯過了,則必須等待游標再次迴圈。很多設備並沒有關於性方面的文字或符號,也沒有一個簡單的方法可以讓使用者坦率地與朋友或伴侶談論性,或者提醒照顧者關於尿路感染等問題。

預程式設計的聲音往往不會考慮用戶的年齡。派特爾告訴我,她有一個客戶是名叫薩拉揚(Sara Young)的青少年。當時,薩拉所使用的設備發音與很多ATM機的機械化聲音非常類似。薩拉在學校會使用Heather的聲音,這意味著在小組討論時,除非你仔細觀察,否則幾乎不可能區分誰在說什麼。和許多同齡人一樣,莎拉經常在自己的設備上播放預先設定的不同聲音但她仍然感到沮喪。當我走訪辦公室時,派特爾和梅爾茨納正在對薩拉的BeSpoke聲音進行最後的修改,他們用薩拉錄製的幾個“ahhh”聲音和一個捐獻者的聲音來定制聲音。他們希望在耶誕節前能夠完成。

在與派特爾的第二天,我陪同她到麻塞諸塞州列克星敦的科廷學院舉辦了一個技術交易會,這是一所面向特殊學生的私立學校,其中有幾個是Vocal ID公司的客戶。該公司經常在學校進行外聯活動,向使用AAC的兒童提供他們的產品,並招募新的語音捐獻者——他們總是缺少年輕捐獻者的聲音。展會上充滿了包括薩拉在內的腦癱家長和孩子。像許多腦癱孩子一樣,薩拉看上去比他的實際年齡要小,因為進食也需要肌肉控制,而腦癱患兒在這方面的能力欠缺。她的頭髮是黑色的波浪狀,染著深青色的條紋。當我們見面時,她穿著一件淺粉色的長袖襯衫,掛在輪椅上的包是粉紅色的,而她用來控制輪椅電機的那只腳穿著粉紅色的運動鞋。

作為一個運動和肌肉障礙患者,薩拉的身體常常會痙攣。她的舌頭會不自主地伸進嘴裡,脖子會從一邊到另一邊扭曲。她的手臂捲曲,像葉子一樣展開。她不能在沒有説明的情況下吃飯或者淋浴。她用矽膠的吸管喝水,因為她吮吸時會不受控制地咬吸管。她用左腳在iPad上做家庭作業,並在膠帶和標記的説明下畫畫。當她說話的時候,就是通過安裝在輪椅上的AAC設備,感知她的眼球運動,作為打字的替代輸入法。

乍看起來像孩子般的身體狀態掩蓋了薩拉作為十幾歲青少年的個性。她會保持輪椅靜止不動,偶爾晃動一下。當她覺得無聊的時候,她會操縱輪椅轉個圈。她有一個藍色和粉紅色的鼻環,她還不喜歡一個過時的手機。她有著濃厚的眉毛和不停轉動的眼睛。

因為她是一個強大的溝通者,薩拉已經成為AAC社區其他孩子的偶像。在這個技術交易會上,薩拉和她的母親艾米·楊(Emmy Young)登臺發表主題演講。薩拉首先說了幾句已經事先寫在自己設備上的話。她的聲音聽起來像一台自動取款機:“大家好,我的名字叫薩拉。我今年16歲了。當我沒有(發音裝置)時,人們大部分時候只和我的媽媽說話。有時我說的很慢,所以他們只是對我說而不會聽我的。他們不知道如何等待我的回答。“

當天晚些時候,艾米和薩拉共同進行提問環節時,事實變得很清楚。當薩拉被問到她用iPad做什麼時,她開始專注地扭頭盯著自己的設備螢幕。三十秒過去了,六十秒過去了。大家靜靜地坐著,看著她。九十秒後,電腦流暢地說:“HWFACEBOOKIGSNAPCHATMUSIC”。

艾米翻譯,“家庭作業,Facebook,Instagram,Snapchat和音樂”。

在一小時的問答中,薩拉說了不到30個字。按照他們的溝通習慣,艾米做了大部分的發言,部分是因為時間的緣故,部分原因是薩拉經常依靠母親來理解和翻譯她的非言語性暗示。“這對她來說是需要消耗巨大的體力,”艾米後來向我解釋道,“雖然我們鼓勵人們直接和她說話,但是有時她會通過看我來回應”。

薩拉想要表達的思想與設備之間的脫節令人不安。艾米說:“數位語音有點讓人失望。當我們聽到Vocal ID的時候,我們想:‘能夠創造一些更自然的聲音就好了’,莎拉還沒有隨著年齡增長而改變聲音的體驗,所以這對她來說也是一樣的。如果這個聲音更自然,我覺得薩拉能接受這種改變。”

當我告訴派特爾這段對話時,她的眼睛閃閃發光。“我真的希望人們不僅能夠聽薩拉說話,而且真正聽到她,看到她,體驗她。當她說出‘是啊!’,或者‘不!’,或者她用自己的聲音說出任何東西,然後過渡到她的設備時,如果這兩種轉換感覺流暢,和別人的溝通就會很好。”

對於喬而言,從身體健康的正常人變成不能言語的殘疾人非常痛苦。當他從手術中醒來的時候,感覺到自己真的不能說話了。醫生切除了他的大部分舌頭。“你必須記住,你的舌頭有很大一部分是你看不見的,因為它在你的喉嚨裡,”喬提醒我。醫生希望喬能夠及時控制新的肌肉,並形成言語。

在最初的十天裡,即使他試圖說話也不會有聲音。“我感到完全被困住了,被關在自己身體裡的一個囚犯,”他通過電子郵件告訴我。他可以寫下來,讓醫務人員知道他是餓了還是感到痛苦。“但是沒有什麼有意義的溝通。”他的朋友們來看他。第一次,他不能參加對話,不能插嘴。他坐在那裡,相當沉默。他對我說:“我喜歡爭論,喋喋不休和被傾聽。”

當你置身於談話之外,就失去了很重要的東西。另一方面,正如喬所認為的那樣,少了平等的權利。喬寫道:“人們對待你的方式完全不同。他們不是故意的,但他們只是會照顧你,把你當小孩子。”

喬可能不會每天都使用AAC設備,但是他堅持認為這對他來說重要的是,無論如何,他的聲音都存在於某個地方。“我的妻子是哈利波特的粉絲,所以我開玩笑說這是我的魂器。”他認為這是一種自我保護的行為。“我擔心隨著年齡的增長,隨著事情越來越多,我可能會開始忘記自己的聲音。”

人們經常以這種方式使用語音資料庫,派特爾說。她注意到,一些處於變性階段的跨性別人群通常在一開始就是這樣。對於他們來說,對喬來說,語音資料庫是一個可以保存自我的保險庫,記錄在那裡,以防萬一。

對於其他人來說,數字聲音並不是他們身份的殘餘,而是他們將成為誰的承諾。在耶誕節之前,薩拉在Vocal ID得到了她的新聲音。當派特爾和Meltzner站到薩拉和艾爾面前的時候,薩拉緊張地站了起來,派特爾提示Meltzner展示為薩拉設計的兩個聲音。Meltzner用他預先編好的一個句子播放了第一個。“嗨,我的名字是SARA。我16歲,我很驚訝。”

這聽起來像是原來聲音Heather的妹妹一樣,而在原有基礎上卻帶著一絲人性的東西。

薩拉高興地笑了起來。“好的,”派特爾說。“現在我們會聽到第二個。”

“嗨,我的名字是SARA。我16歲,而且我很棒。“第二個聲音聽起來更清晰,而且更有活力。”

“好吧,你喜歡哪一個?”派特爾問薩拉。

經過長時間的停頓,薩拉說了第二個。

“哦,嘿!”派特爾笑了起來。“那也是我們最喜歡的。你感覺怎麼樣?“

長時間的停頓之後,薩拉說:“這是純潔的聲音。”

他們把它下載到她的設備上。派特爾後來向我指出,一個人有了新聲音時可能會有些低落,因為他們不太清楚如何回應。她說,真正有趣的是會發生在幾天和幾周後,薩拉們會注意到自己如何受到不同的對待,或者對於新聲音有一個全新的體驗。

隨著聲音的載入,派特爾問艾米她有什麼感覺。“太好了,只要莎拉感覺好就行!”她頓了一下。“這將需要一些習慣。另一個聲音是用了12年的Heather。這在某種程度上是就像我孩子的聲音隨著發育改變了一樣。”

當薩拉的聲音完成轉移後,團隊聚集在一起,聽到她用新聲音講的第一句話是什麼。

“謝謝,謝謝你們的一切工作,”她說。“我知道你們能夠做到。”

派特爾笑了起來。“謝謝你給我們這個機會!”大人站在一旁,漫無目的地看著薩拉。“你想說點其他的嗎?”

她想了一下,然後凝視著她的螢幕。

“喲。”

望著遠處,或開玩笑。當被要求說出這個日期時,他笑著說:“我相信,日期是二月二十四日,2017年的一天。

對著鏡頭,喬奮力地表達了自己將要永遠失去聲音的感覺。“我的工作,也就是我的生活,全是關於溝通,關於談話。我喜歡說話,“他微微一笑,感慨地說,“我有幾件事要說。”

在拍攝這部影片之前不久,喬的朋友得到了一些消息。他在波士頓之外找到了一家名為Vocal ID的公司,它為那些通過設備來説明自己說話的人開發定制的數位化聲音。公司可以使用喬的錄音來在電腦上重現自己的聲音,讓他能夠永遠用自己的發音。

他們聯繫了Vocal ID的公司創始人,一位名叫魯帕派特爾(Rupal Patel)的語言病理學家,她解釋說,如果在手術之前他能夠錄下自己的聲音,將來就有可能數位化重建喬的聲音。這意味著Vocal ID通過分析記錄的幾千個句子發音來捕捉英語發音中的所有音素。

喬同意試一下。他錄了幾百個句子,然後,意識到這個任務的艱巨性,停了好幾天。他寫信給我說:“這是我自由的最後一周,我有很多事情要做,有很多人要見面,還要品嘗很多美食。”手術前兩天,他又開始了錄音。他的發音是緩慢而痛苦的——那時候喬說話已經極其痛苦的,他正在試圖做出最有口才的表達。在最後一天,他記錄到了深夜。

第二天早上,喬回到醫院,切掉了舌頭。

讓人們喪失言語能力的方式有很多,譬如口吃或失用症,運動神經元病和腦癱,這些都影響了參與語言表達的肌肉控制能力。此外還有創傷性腦損傷、中風、諸如喬這樣的手術、多發性硬化症以及自閉症等。在美國,超過200萬人需要用數位化的“適應性替代通信”(AAC)方法來幫助彌補言語缺陷。殘疾慈善機構2008年的一份研究報告估計,英國有1%的人使用或需要AAC。

現代的自我調整替代通信往往涉及斯蒂芬·霍金(Stephen Hawking)所使用的設備類型——一種小型的電腦或平板電腦,可以播放大量的文字。在1969年發明第一台現代文本語音通訊設備之前,肌肉發達或聲音障礙的人不得不使用通過吸管吸氣和呼氣操作的“吸吮”式打字機。到1986年,當霍金開始使用語音設備時,AAC技術有了顯著的提高。他使用的程式(稱為等化器)起初允許他通過按動開關在臺式電腦上選擇單詞或短語,然後可以通過安裝在輪椅上的小型電腦來發音。

2014年上映的霍金傳記片《萬物理論》 (The Theory of Everything)有一個鮮明的提示,即這項技術試圖修正存在的缺陷。當霍金和他的第一任妻子簡第一次聽到霍金的新聲音時,他們驚呆了。在片刻無語之後,簡怯懦地提出了一個反對意見:“這是美國口音”。一時間大家都笑了,但它說明了AAC存在的一個硬傷。我們的聲音是其他人瞭解我們的重要管道:你的年齡,性別,國籍,家鄉,性格,情緒,同時也是自己認識自己的途徑。當你的發音不再是本地口音後,你是否失去了自己的一部分?

霍金的案例是用一個人的聲音塑造他們身份的最具代表性例子之一。雖然他機器人般的數位化語音(和美國口音)一開始讓人感覺不舒服,但它卻成了他的身份特徵。霍金鍾情於自己的新聲音,幾年後,當他有機會採用一種更流暢,更有人情味和英語口語的新聲音時,他拒絕了。現在感覺聽聞其聲,如見其人。

“霍金的聲音”並不僅僅屬於霍金。自問世以來,小女孩,老年人以及各種種族和背景的人也使用了同樣的聲音。這是依賴AAC的使用者世界中的一個奇特的特徵:數以百萬計的人擁有的聲音類型卻相當有限。雖然現在比以前有更多的變化,但能夠應用的只有幾十種選擇,其中大部分還是成年人和男性口音。

“如果你走進一個坐滿語音障礙孩子的教室裡,你會聽到周圍的聲音完全一樣,”派特爾告訴我說。十年前,她在一次語言障礙會議上遇到一個小女孩和一個50多歲的男人正在使用他們的設備進行對話。他們在用同一個成年男性的聲音說話。派特爾驚恐萬分,她告訴我說:“這只會讓喪失言語功能的人失去尊嚴。”

電影評論家羅傑·亞伯特(Roger Ebert)的下巴因癌症被移除,他在2009年發表的一篇文章中描述了這種聲音多麼令人沮喪:“我聽起來像機器人羅比。想要有口才和語調是不可能的。“他厭倦了在談話中被忽略,“我們能把人送上月球,為什麼卻不能擁有自己的發聲器?“

這是派特爾已經在著手解決的問題。2007年,她開始研究一種技術,從而能夠製作出更像使用者發音的定制化數位聲音。到2014年,該技術已經足夠成熟,派特爾和她的團隊成立了世界上第一個“語音銀行”。這是一個線上平臺,任何有互聯網連接的人都可以通過錄音朗讀自己的聲音,建立關於聲音的語音庫(Voice Voicebank)。相關程式是用一個故事來編寫的,用來捕捉英語中所有的音素。 (早期的語音捐獻者需要上傳3487個句子;現在,Vocal ID的研究總監Geoff Meltzner可以開發少於1000個句子的聲音,儘管更多的錄音會使得人聲更加自然逼真。)

每位捐獻者的錄音都被編入一個聲音庫,可以在為客戶製作新的聲音時使用。該公司為客戶提供“BeSpoke”聲音,這種定制化的聲音能夠將客戶自己的聲音與捐獻者所提供的詞彙結合在一起。這樣,一個十幾歲的青少年就可以用他哥哥的捐贈聲音,或者是一個來自語音庫Voicebank的陌生人聲音,從而打造出高品質的定制化發音。 (像Joe這樣的客戶為了某種目的而將他們的聲音儲存起來,Vocal ID稱之為“聲音遺產”:他們記錄下自己的聲音,等需要的時候會收到一個關於自己聲音的數字檔。)

創建一個新的數位化語音通常需要兩個要素:聲源和篩檢程式。“聲源”是聲帶,喉和喉部肌肉等器官的結合,當我們笑,叫喊或說話時,聲源會發出聲音。正如Vocal ID的研究副總裁Geoff Meltzner所解釋的那樣,你的聲源就像你的指紋,”每個聲源中都有獨一無二的標識”。而“篩檢程式”則是將這些聲源發出的聲音塑造成不連續的,人耳可辨別的單詞,其包括了舌頭,嘴唇,咽等等。

Vocal ID的工作原理是從接受者那裡捕捉幾秒鐘的母音(聲源),並將其應用於捐贈者所提供的篩檢程式。這種組合產生的主要是“接收者”的聲音。通過調整演算法,Meltzner可以提供“柔和”(鼻音更重)或更“權威”(低音)或“更亮”(充滿高音)的聲音。

當一個新的聲音完成後,它會作為外掛程式添加到其擁有者已經使用的任何語音設備中。最近,Vocal ID在自己的應用程式中添加了一個功能,允許客戶自行調整他們的聲音,以獲得他們想要的音色和音調。系統的設計很方便,但偶爾也會出現故障。有一次,一個十幾歲的客戶驚慌地呼喚派特爾,因為她更新了iPhone上的軟體,失去了自己的聲音。

捐贈你的聲音通常需要幾天時間,這和捐腎完全不同。除了筆記型電腦和互聯網連接之外,沒有篩選過程,也沒有設備參與。去年冬天的一個慵懶日子裡,我決定在床上捐獻我的聲音,我把筆記型電腦向前傾斜,嘴巴向內置麥克風堅持重複:“提拉米蘇好極了!提拉米蘇好極了!“

流覽器上顯示的Vocal ID人類語音庫在看起來有點像一個視頻遊戲:靛藍色的背景畫出了一個卡通形象站在一行文字旁邊,大聲朗讀。一旦你滿意你的發音,點擊上傳句子到語音庫,隨後會出現現一行新的文字。螢幕底部的一欄會即時跟蹤您的進度。

作為捐獻者,需要閱讀的句子很多,人們通常會在幾天或幾周的時間內完成捐贈,一次只做幾個小時。為了讓漫長的練習變得有趣,Vocal ID會根據捐獻者的興趣選擇閱讀材料:詩歌,科幻小說或科幻小說。這種捐獻行為觸發了我們內心深處的東西:我們都是獨一無二的。這個聲音也許是一個獨特的個人禮物——既是物質的,也是精神上的。

在完成語音捐獻後不久,我到波士頓西郊的Vocal ID公司辦公室拜訪了派特爾。派特爾非常熱衷於為那些喪失言語功能的人創造一種個性化的聲音。她解釋說,當殘疾人出現溝通障礙時,這會增加他們的工作和社交障礙。

人類常常會對同類的聲音給予特別的關注和同情,並且無意識地會將說話能力與思想的存在等同起來。?2010年,醫學人類學家Mary Wickenden為青少年AAC用戶發表了一篇題為《青少年世界,不同的聲音》的論文,她指出:“如果你不能說話,可能很難證明你的想法。”

對於那些不能說話的人來說,在社會中會不斷被提醒自己的“不真實”。在第一年創造的七個聲音中,有六位用戶是腦癱的兒童或青少年,他們中的許多人抱怨說,陌生人往往完全忽視他們,總是直接和他們的父母交流,或者像對待嬰幼兒一樣對待他們。

不同的對話技術根據個人使用者的需求而變化很大:手指肌肉發達的人可以通過傳統的鍵盤輸入文字,並通過揚聲器聽到單詞發音。更常見的是用戶使用自己最習慣控制的操縱杆或開關,從螢幕上選擇單詞,短語或符號。對於那些不能使用操縱杆的人來說,可以通過跟蹤眼球運動的螢幕來選擇短語和符號。

即使對於那些經常使用類似技術的人來說,這些設備也可能令人沮喪。通常,在你選到需要的字元或符號之前,你必須等待游標跳過十幾個字母或符號——如果錯過了,則必須等待游標再次迴圈。很多設備並沒有關於性方面的文字或符號,也沒有一個簡單的方法可以讓使用者坦率地與朋友或伴侶談論性,或者提醒照顧者關於尿路感染等問題。

預程式設計的聲音往往不會考慮用戶的年齡。派特爾告訴我,她有一個客戶是名叫薩拉揚(Sara Young)的青少年。當時,薩拉所使用的設備發音與很多ATM機的機械化聲音非常類似。薩拉在學校會使用Heather的聲音,這意味著在小組討論時,除非你仔細觀察,否則幾乎不可能區分誰在說什麼。和許多同齡人一樣,莎拉經常在自己的設備上播放預先設定的不同聲音但她仍然感到沮喪。當我走訪辦公室時,派特爾和梅爾茨納正在對薩拉的BeSpoke聲音進行最後的修改,他們用薩拉錄製的幾個“ahhh”聲音和一個捐獻者的聲音來定制聲音。他們希望在耶誕節前能夠完成。

在與派特爾的第二天,我陪同她到麻塞諸塞州列克星敦的科廷學院舉辦了一個技術交易會,這是一所面向特殊學生的私立學校,其中有幾個是Vocal ID公司的客戶。該公司經常在學校進行外聯活動,向使用AAC的兒童提供他們的產品,並招募新的語音捐獻者——他們總是缺少年輕捐獻者的聲音。展會上充滿了包括薩拉在內的腦癱家長和孩子。像許多腦癱孩子一樣,薩拉看上去比他的實際年齡要小,因為進食也需要肌肉控制,而腦癱患兒在這方面的能力欠缺。她的頭髮是黑色的波浪狀,染著深青色的條紋。當我們見面時,她穿著一件淺粉色的長袖襯衫,掛在輪椅上的包是粉紅色的,而她用來控制輪椅電機的那只腳穿著粉紅色的運動鞋。

作為一個運動和肌肉障礙患者,薩拉的身體常常會痙攣。她的舌頭會不自主地伸進嘴裡,脖子會從一邊到另一邊扭曲。她的手臂捲曲,像葉子一樣展開。她不能在沒有説明的情況下吃飯或者淋浴。她用矽膠的吸管喝水,因為她吮吸時會不受控制地咬吸管。她用左腳在iPad上做家庭作業,並在膠帶和標記的説明下畫畫。當她說話的時候,就是通過安裝在輪椅上的AAC設備,感知她的眼球運動,作為打字的替代輸入法。

乍看起來像孩子般的身體狀態掩蓋了薩拉作為十幾歲青少年的個性。她會保持輪椅靜止不動,偶爾晃動一下。當她覺得無聊的時候,她會操縱輪椅轉個圈。她有一個藍色和粉紅色的鼻環,她還不喜歡一個過時的手機。她有著濃厚的眉毛和不停轉動的眼睛。

因為她是一個強大的溝通者,薩拉已經成為AAC社區其他孩子的偶像。在這個技術交易會上,薩拉和她的母親艾米·楊(Emmy Young)登臺發表主題演講。薩拉首先說了幾句已經事先寫在自己設備上的話。她的聲音聽起來像一台自動取款機:“大家好,我的名字叫薩拉。我今年16歲了。當我沒有(發音裝置)時,人們大部分時候只和我的媽媽說話。有時我說的很慢,所以他們只是對我說而不會聽我的。他們不知道如何等待我的回答。“

當天晚些時候,艾米和薩拉共同進行提問環節時,事實變得很清楚。當薩拉被問到她用iPad做什麼時,她開始專注地扭頭盯著自己的設備螢幕。三十秒過去了,六十秒過去了。大家靜靜地坐著,看著她。九十秒後,電腦流暢地說:“HWFACEBOOKIGSNAPCHATMUSIC”。

艾米翻譯,“家庭作業,Facebook,Instagram,Snapchat和音樂”。

在一小時的問答中,薩拉說了不到30個字。按照他們的溝通習慣,艾米做了大部分的發言,部分是因為時間的緣故,部分原因是薩拉經常依靠母親來理解和翻譯她的非言語性暗示。“這對她來說是需要消耗巨大的體力,”艾米後來向我解釋道,“雖然我們鼓勵人們直接和她說話,但是有時她會通過看我來回應”。

薩拉想要表達的思想與設備之間的脫節令人不安。艾米說:“數位語音有點讓人失望。當我們聽到Vocal ID的時候,我們想:‘能夠創造一些更自然的聲音就好了’,莎拉還沒有隨著年齡增長而改變聲音的體驗,所以這對她來說也是一樣的。如果這個聲音更自然,我覺得薩拉能接受這種改變。”

當我告訴派特爾這段對話時,她的眼睛閃閃發光。“我真的希望人們不僅能夠聽薩拉說話,而且真正聽到她,看到她,體驗她。當她說出‘是啊!’,或者‘不!’,或者她用自己的聲音說出任何東西,然後過渡到她的設備時,如果這兩種轉換感覺流暢,和別人的溝通就會很好。”

對於喬而言,從身體健康的正常人變成不能言語的殘疾人非常痛苦。當他從手術中醒來的時候,感覺到自己真的不能說話了。醫生切除了他的大部分舌頭。“你必須記住,你的舌頭有很大一部分是你看不見的,因為它在你的喉嚨裡,”喬提醒我。醫生希望喬能夠及時控制新的肌肉,並形成言語。

在最初的十天裡,即使他試圖說話也不會有聲音。“我感到完全被困住了,被關在自己身體裡的一個囚犯,”他通過電子郵件告訴我。他可以寫下來,讓醫務人員知道他是餓了還是感到痛苦。“但是沒有什麼有意義的溝通。”他的朋友們來看他。第一次,他不能參加對話,不能插嘴。他坐在那裡,相當沉默。他對我說:“我喜歡爭論,喋喋不休和被傾聽。”

當你置身於談話之外,就失去了很重要的東西。另一方面,正如喬所認為的那樣,少了平等的權利。喬寫道:“人們對待你的方式完全不同。他們不是故意的,但他們只是會照顧你,把你當小孩子。”

喬可能不會每天都使用AAC設備,但是他堅持認為這對他來說重要的是,無論如何,他的聲音都存在於某個地方。“我的妻子是哈利波特的粉絲,所以我開玩笑說這是我的魂器。”他認為這是一種自我保護的行為。“我擔心隨著年齡的增長,隨著事情越來越多,我可能會開始忘記自己的聲音。”

人們經常以這種方式使用語音資料庫,派特爾說。她注意到,一些處於變性階段的跨性別人群通常在一開始就是這樣。對於他們來說,對喬來說,語音資料庫是一個可以保存自我的保險庫,記錄在那裡,以防萬一。

對於其他人來說,數字聲音並不是他們身份的殘餘,而是他們將成為誰的承諾。在耶誕節之前,薩拉在Vocal ID得到了她的新聲音。當派特爾和Meltzner站到薩拉和艾爾面前的時候,薩拉緊張地站了起來,派特爾提示Meltzner展示為薩拉設計的兩個聲音。Meltzner用他預先編好的一個句子播放了第一個。“嗨,我的名字是SARA。我16歲,我很驚訝。”

這聽起來像是原來聲音Heather的妹妹一樣,而在原有基礎上卻帶著一絲人性的東西。

薩拉高興地笑了起來。“好的,”派特爾說。“現在我們會聽到第二個。”

“嗨,我的名字是SARA。我16歲,而且我很棒。“第二個聲音聽起來更清晰,而且更有活力。”

“好吧,你喜歡哪一個?”派特爾問薩拉。

經過長時間的停頓,薩拉說了第二個。

“哦,嘿!”派特爾笑了起來。“那也是我們最喜歡的。你感覺怎麼樣?“

長時間的停頓之後,薩拉說:“這是純潔的聲音。”

他們把它下載到她的設備上。派特爾後來向我指出,一個人有了新聲音時可能會有些低落,因為他們不太清楚如何回應。她說,真正有趣的是會發生在幾天和幾周後,薩拉們會注意到自己如何受到不同的對待,或者對於新聲音有一個全新的體驗。

隨著聲音的載入,派特爾問艾米她有什麼感覺。“太好了,只要莎拉感覺好就行!”她頓了一下。“這將需要一些習慣。另一個聲音是用了12年的Heather。這在某種程度上是就像我孩子的聲音隨著發育改變了一樣。”

當薩拉的聲音完成轉移後,團隊聚集在一起,聽到她用新聲音講的第一句話是什麼。

“謝謝,謝謝你們的一切工作,”她說。“我知道你們能夠做到。”

派特爾笑了起來。“謝謝你給我們這個機會!”大人站在一旁,漫無目的地看著薩拉。“你想說點其他的嗎?”

她想了一下,然後凝視著她的螢幕。

“喲。”