您的位置:首頁>正文

人類學習語言尚且困難無比,電腦是如何輕鬆理解的?

為什麼影視劇裡會有那麼多的星際物種, 恰好都會說一口流利的英語呢?原因很簡單, 因為沒人希望為了看一部星際艦隊, 還得花上好幾年時間去編譯一本外星字典, 但為了保證一致性, 星際迷航和其他科幻小說的編導們就想出了萬能翻譯機這個點子, 一個能夠立馬能在各種語言間進行翻譯的手持設備, 你們覺得萬能翻譯機在現實生活中可行嗎?

現在已經很多程式聲稱, 他們能在各種語言間進行翻譯, 不管是一個字, 一句話, 一本書, 也不管是現代英語還是古梵語, 如果翻譯僅僅只是在字典上查找字意的話, 這些程式完全能比人類做得更好, 但實際上沒那麼簡單, 一個基於規則的翻譯系統所用的詞義資料, 包括你能在字典上找到的所有單詞, 和所有能夠使用的語法形態並且得有一套規則, 能夠區分輸入語言的基本語言成分。

舉個看起來比較簡單的例子, 孩子們在吃松餅, 翻譯程式會先解析這句話的句法和語法結構, 通過將孩子定為主語剩下的部分作為謂語並且包含動詞吃或者直接賓語松餅, 或者這段話怎麼才能夠拆分成幾個小片語。

就比如說松餅這個詞尾碼s通常是表示複數,

最後一步還需要理解其中的語義學, 需要理解這段話中的每個部分都各自表示什麼意思, 為了恰當的翻譯這句話, 翻譯程式會將翻譯的文本, 參照其語言的各個要素詞彙和使用規則, 但這才是麻煩的地方, 在一些語言的句法結構中, 文字並沒有特定的順序, 而且在有些語言中這句話看起來就像松餅在吃小孩。

詞態學也是個問題, 斯洛維尼亞語中區別通過使用雙重尾碼缺失, 來區分這句話中孩子的數量兩個、三個或者更多, 然後俄羅斯人不使用定冠詞會讓你覺得, 這些孩子到底是在吃一些特定的松餅呢?還是一般含義上的松餅。 結果是就算程式翻譯出來的含義是正確的, 它可能還是會忽略一些細節,

就比如說這些孩子到底是在吃松餅, 還是在吞松餅?

另一個研究方法是統計翻譯法, 這個方法是去分析那些已經被前人翻譯過的書籍, 文章和檔的資料庫, 翻譯系統可以通過找到那些不是偶然和譯文恰好匹配的資源, 辨識相關的短語和句型,

並存以備用, 然而這種方式的翻譯品質但根據某些語言或寫作風格的初始資料庫和語庫可用性而定。

有一些困難, 就像一些特例, 非常規的事物, 和人類本能上的細微區別這樣的困難, 導致了一些研究人員覺得我們對於語言的理解是我們大腦生物結構的單一產物, 但事實上最著名的科幻小說通用翻譯器, 巴別塔是從銀河系漫遊指南中逐漸分離出來的, 這個翻譯器不完全, 只是一個機器, 而是一個能以心電感應形式從有意識生物那翻譯他們的腦電波和神經信號的小生物。

目前為止用老辦法去學一門新的語言, 仍然比用目前可用的電腦程式的效果更好, 但這也絕非易事, 世界上語言的絕對數量, 和其使用者間的相互作用會刺激自動翻譯系統不斷進步,也許等到我們遇到星際生命形態的物種時,我們就能夠通過一個小發明與他們交流,又或許我們終究得編譯一那樣一套字典。

和其使用者間的相互作用會刺激自動翻譯系統不斷進步,也許等到我們遇到星際生命形態的物種時,我們就能夠通過一個小發明與他們交流,又或許我們終究得編譯一那樣一套字典。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示