国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

毀譽參半的AI重建瀕危語言之路

譯文 精選
人工智能
目前,人工智能(AI)正在被用于研究手稿、音頻檔案和銘文,以重建失傳的語法、詞匯和發(fā)音。其支持者一致認為這是一條復興之路,能夠為人類社區(qū)提供一種與語言遺產(chǎn)重新連接,也可能會產(chǎn)生看似準確,實則不實用、甚至無意義的語言。甚至有人認為,這種機械的靜態(tài)記錄,會讓語言的消失不可逆轉(zhuǎn)。

譯者 | 陳峻

審校 | 重樓

眾所周知,過去那些曾經(jīng)定義和描述了燦爛文化的語言,如今可能只能留存于書面記錄、片段影像、以及少數(shù)傳頌者的記憶中。而人類歷史的每一次更迭,都會導致語言信息的此消彼長,文化知識的重塑。

目前,人工智能(AI)正在被用于研究手稿、音頻檔案和銘文,以重建失傳的語法、詞匯和發(fā)音。其支持者一致認為這是一條復興之路,能夠為人類社區(qū)提供一種與語言遺產(chǎn)重新連接,也可能會產(chǎn)生看似準確,實則不實用、甚至無意義的語言。甚至有人認為,這種機械的靜態(tài)記錄,會讓語言的消失不可逆轉(zhuǎn)。

全球化時代的語言消失

現(xiàn)如今,語言多樣性的下降速度比歷史上任何其他時刻都要快。聯(lián)合國教科文組織曾估算:世界上的7000種語言中,有近40%已瀕臨滅絕。算下來,大約每兩周就有一種語言消失。這種消失不僅僅是系統(tǒng)性、交流層面的消失,也伴隨著與之相關(guān)的觀點、歷史和專業(yè)知識的消失。誠然,傳統(tǒng)的文檔、錄音、口語故事、以及語法解說圖本都可以延續(xù)語言,但是這往往比較慢,也就導致了許多語言在被完全記錄下來之前就消失了。

然而,AI正在改變這種速度。由其加持的高級工具可以比傳統(tǒng)的方法,更快地處理稀有的音頻,識別內(nèi)在的模式,進而重建那些不完整的語言系統(tǒng)。雖然這為留存語言提供了新的方法,但是如果只關(guān)注那些沒有社區(qū)參與、或文化基礎(chǔ)的數(shù)據(jù)保存,結(jié)果很可能只是一個雖然精確、但與日常使用完全脫節(jié)的語言檔案。因此,在現(xiàn)代化世界中,保留語言遺產(chǎn)需要研究人員、技術(shù)專家和人群社區(qū)之間的通力合作,以確保語言的重建既準確又具有文化內(nèi)涵。

AI重建和復興語言

近年來,AI已經(jīng)從一種研究工具演變成為了語言重建的核心驅(qū)動力。機器學習模型,特別是深度神經(jīng)網(wǎng)絡,可以處理那些曾經(jīng)需要付出幾十年學術(shù)努力的任務。此類系統(tǒng)可以分析大量手稿、銘文和音頻記錄的存儲庫,發(fā)現(xiàn)人類研究人員可能無法注意到的模式。

其中,失傳語言重建的技術(shù)通常會結(jié)合兩個互補的階段:第1階段是使用模式識別模型,來檢測留存記錄中的語法、句法和詞匯中的重復結(jié)構(gòu)。第2階段是使用應用生成系統(tǒng),如大語言模型(LLM),來補足第1階段。同時,第1階段的發(fā)現(xiàn)也可以指導第2階段,并允許神經(jīng)模型提出缺失的單詞、短語甚至語音模式。通過利用相關(guān)語言和部分文檔的培訓,這些系統(tǒng)可以生成對應語言和詞句的合理版本。

目前,已有若干真實項目展示了此類方法在實踐中是如何運作的。例如:由AI輔助的研究,以更高的統(tǒng)計準確性模擬了原始印歐語的詞根,從不完整的手稿中重建了古希臘語音,并為瀕危語言創(chuàng)造了現(xiàn)實的語音合成,讓其對應的人群社區(qū)聽到幾十年來從未聽過的發(fā)音。

然而,語言重建也面臨著技術(shù)和文化方面的挑戰(zhàn)。比如,有限的或質(zhì)量差的數(shù)據(jù),可能會導致模型產(chǎn)生幻想,從而生成從未存在過的模式。當然,即使統(tǒng)計準確率很高,這些項目也并不總能反映文化真實性。這就是為什么許多項目需要將算法的輸出,與語言學家、人類學家、以及最重要的是與母語人士的專業(yè)知識相結(jié)合的原因。

同時,自我監(jiān)督學習等新技術(shù)進一步增加了此方面的能力。它們使用的模型可以在不依賴并行翻譯的情況下,從單一語言數(shù)據(jù)中學習到結(jié)構(gòu)規(guī)則,使其更適合那些資源較少的語言。它們在協(xié)作環(huán)境中被使用時,既能保證速度,又能提供規(guī)模,同時還可以保持文化背景的完整性。

可見,只有當技術(shù)與人類合作時,基于AI的重建才會取得成功。也就是說,AI只有與人類社區(qū)專家相輔相成,而非單純?nèi)〈鷷r,才能產(chǎn)生更好的結(jié)果。無聲的記錄才可以再次變成鮮活的口語。

數(shù)字語言保護從靜態(tài)檔案到互動復興的演變

AI之前,保護瀕危和滅絕語言的努力主要依賴于靜態(tài)的數(shù)字檔案。Rosetta項目瀕危語言檔案等項目已收集了大量字典、手稿、錄音和文化文物。這些收藏品為學者和社區(qū)提供了寶貴的語言遺產(chǎn)。然而,這些資源在絕大程度上是一種被動式的。學習者只能主動查找單詞或聽錄音,但積極使用或互動練習語言的機會十分有限。這也就限制了他們作為活體形式的語言復興。

相反,AI通過引入互動性和動態(tài)參與的形式,改變了這種情況。現(xiàn)代AI工具,包括聊天機器人、語音助手和翻譯應用,可以使用瀕危或已滅絕的語言與學習者進行說話、傾聽和回應。這些方式使得語言能夠超越被動的參考材料,通過互動體驗成為語言使用者日常生活、教育和文化表達的一部分。

所以說,AI的主要優(yōu)勢在于翻譯和重建。而且,在缺少完整的字典或文本時,AI模型會主動分析相關(guān)語言來填補空缺。例如,如果一種語言的詞匯量損失了30%AI則可以使用類似的語言或歷史記錄的信息,來建議可能的詞匯。當然,AI也可以重建丟失語言的聲音。通過將古代文本的語音細節(jié)與現(xiàn)代語言知識相結(jié)合,那些由AI生成的聲音,如今已能“說出”蘇美爾語、梵語和古北歐語等語言。這使得學習者和研究人員有機會能夠聽到幾個世紀以來一直沉寂與失傳的語言。

AI驅(qū)動的語言復興面臨的挑戰(zhàn)和道德考慮

AI為復興瀕危和已滅絕的語言提供了新的方法。盡管如此,整個過程中仍然充滿了各種挑戰(zhàn)。有時,AI只能輸出最可能的近似表達,而無法被母語人士所驗證。有時,由AI模型產(chǎn)生的發(fā)音或用法雖然似乎合理,但很可能在真實的歷史或文化上并不準確。這都凸顯了技術(shù)專家、語言學家和語言社區(qū)成員之間密切合作的必要性。這樣的協(xié)作關(guān)系必須確保語言復興的過程既尊重文化遺產(chǎn)又保留歷史真相。下面,我們來具體討論幾類挑戰(zhàn):

  • AI驅(qū)動的復興可能會創(chuàng)造一種僅存在于數(shù)字世界的語言。畢竟語言不僅僅是詞匯和語法,它也存在于日常使用、社交習慣、以及文化實踐中。如果一種語言是由AI所重建,但沒有人會經(jīng)常使用的話,它就會成為一件靜態(tài)的博物館文物。也就是說,它僅僅在技術(shù)上得到了保留,但在社會上并不活躍。
  • 偏見是另一個問題。訓練數(shù)據(jù)通常來自殖民時代的檔案或外部來源。這些可能反映了與真實人群社區(qū)截然不同的觀點。而如果AI從這種有偏見的數(shù)據(jù)中學習,那么很可能會重現(xiàn)那些扭曲的語言版本,進而可能歪曲人群社區(qū)的真實遺產(chǎn)和認同。
  • 過度依賴AI工具也可能是一個問題。如果人群社區(qū)完全依賴AI來進行語言教學和維護,那么他們可能會失去通過人與人之間的互動,來傳遞語言意圖的動力。畢竟,口頭傳播和社區(qū)參與對于語言的生存都是至關(guān)重要的。AI應該輔助與支持這樣的流程,而不是取代它們。
  • 圍繞所有權(quán)和控制權(quán)的道德問題也不容忽視。許多土著和少數(shù)民族群體將語言視為其文化傳承的核心部分。他們擔心大型科技公司可能會通過AI生成語言的內(nèi)容與方式獲取所有權(quán),特別是如果其語言訓練本身就是基于他們長輩的錄制。因此,為了保護社區(qū)的權(quán)利,語言復興的努力必須從一開始就讓當?shù)厝藚⑴c進來。項目開展的過程中也應該征得群體的明確同意、數(shù)據(jù)主權(quán)、以及文化敏感性。AI應充當合作伙伴與協(xié)助角色,而絕不可取代人類做決定。

讓我們來看兩個例子:在新西蘭,AI工具正在幫助為毛利語創(chuàng)建語言資源。所有的內(nèi)容都需要經(jīng)過毛利語言學家和教育工作者的審查和批準。同樣,在加拿大,AI也在支持因紐特語和克里語等土著語言。他們的社區(qū)使用AI來開發(fā)自己的數(shù)字學習工具,畢竟語言復興的核心仍然是人類教學和文化實踐。

可見,綜合利用AI的處理能力,以及母語人士的文化知識和智慧,將有助于保持語言社區(qū)日常生活中的活力。

小結(jié)

復興瀕危或已滅絕的語言是一項復雜的任務。AI通過提供強大的工具,來加快重建和創(chuàng)建交互式的資源。然而,僅靠技術(shù)并不能完全復興一種語言。真正的復興取決于母語人士、人類社區(qū)和文化習俗。而這些習俗恰恰能每天保持語言的活力。

同時,AI必須作為一個支持性的合作伙伴,而非替代者,以確保語言的復興具有真正的意義和文化價值。可以說正是因為有了技術(shù)專家、語言學家和社區(qū)之間的合作,語言復興過程的準確性、真實性和對遺產(chǎn)的尊重才得以平衡。也正是因為這樣,我們才能突破靜態(tài)檔案的文字保存形式,恢復出鮮活的口語,將我們與過去相聯(lián)系,也豐富我們的未來。

譯者介紹

陳峻(Julian Chen),51CTO社區(qū)編輯,具有十多年的IT項目實施經(jīng)驗,善于對內(nèi)外部資源與風險實施管控,專注傳播網(wǎng)絡與信息安全知識與經(jīng)驗。

原文標題:AIs Linguistic Ghosts: Can Machines Revive Dead Languages or Bury Them Forever?,作者:Dr. Assad Abbas

責任編輯:姜華 來源: 51CTO
相關(guān)推薦

2009-03-18 17:37:34

虛擬化Vmwareesx

2021-05-06 09:52:27

語言開源AI

2018-11-26 12:24:52

AI 語言 人工智能

2021-04-07 10:07:48

人臉識別技術(shù)隱私

2018-08-08 09:20:52

Windows 10Windows 7Windows

2024-06-17 08:49:00

模型語言

2013-09-03 11:08:20

科技產(chǎn)品產(chǎn)品

2009-03-27 17:50:47

Linux經(jīng)濟衰退開源

2012-08-13 14:13:46

2012-02-13 10:03:31

編程開發(fā)

2013-01-06 10:51:56

2021-12-21 11:57:57

人工智能語言深度學習

2020-12-31 09:06:44

Go語言Reflect

2018-08-01 15:10:02

GolangPython語言

2017-06-14 09:37:05

R語言Apriori算法

2021-10-03 22:18:14

Go語言整數(shù)

2021-10-23 06:42:14

Go語言接口

2015-12-21 10:05:33

2019-12-12 10:08:57

AI 數(shù)據(jù)人工智能

2011-01-14 14:15:11

Linux匯編語言
點贊
收藏

51CTO技術(shù)棧公眾號

无码内射中文字幕岛国片| 国产精品播放| 国产精品秘入口| 国内精品伊人久久久久影院对白| 97婷婷涩涩精品一区| 粉嫩一区二区| 欧美一区二区视频在线观看2020 | 精品国产91乱码一区二区三区四区 | 日本电影一区二区| 久久精彩免费视频| 国产第一页在线| 色婷婷av一区二区三区软件| 五月婷婷六月合| eeuss国产一区二区三区| 欧美在线播放一区二区| 天天揉久久久久亚洲精品| 91国在线精品国内播放| www999久久| 亚洲香蕉伊综合在人在线视看| 亚洲奶水xxxx哺乳期| 欧美日韩在线亚洲一区蜜芽| 日韩毛片在线一区二区毛片| 亚洲福中文字幕伊人影院| 国产一级二级在线| 亚洲欧美日韩国产另类专区| 在线免费观看av的网站| 26uuu亚洲综合色欧美| 激情成人开心网| 国产美女一区二区| 伊人久久大香线蕉精品| 青青青爽久久午夜综合久久午夜 | 亚洲图片欧美色图| 五月亚洲综合| 国产欧美一区二区精品性色超碰 | 任我爽在线视频精品一| 在线观看亚洲| av一区二区三区四区电影| 亚洲中无吗在线| 91精品国自产在线观看| 国产精品地址| 久久99蜜桃综合影院免费观看| 亚洲区第一页| 日韩欧美精品在线不卡| 免费观看成人av| 久久久久久久久久久久久国产| 久久er精品视频| 天天在线免费视频| 国产成人av福利| 玩弄japan白嫩少妇hd| 中文字幕av不卡| 在线免费观看高清视频色| 亚洲大片在线观看| 在线观看美女网站大全免费| 欧美精品一区视频| 成人亚洲视频| 日本高清不卡的在线| 香蕉综合视频| 神马影院午夜我不卡影院| 高清不卡在线观看av| 午夜免费看视频| 动漫精品一区二区| 日本久久久久久久久久久| 天堂精品久久久久| 热99精品里视频精品| 亚洲www色| 51精品秘密在线观看| 亚洲欧美久久久久| 亚洲国产日韩一级| www.亚洲资源| 日韩黄色高清视频| 国产精品亚洲四区在线观看| 国产99视频精品免视看7| 午夜视频一区| 亚洲小视频在线播放| 日本一区二区动态图| 亚洲欧美日本免费| 亚洲国产精久久久久久久| 日本一区二区乱| 2019国产精品视频| 国产成人精品免费| bdsm精品捆绑chinese女| 777午夜精品视频在线播放| 四虎成人在线| 国产精品成人一区二区三区吃奶 | 五月婷婷综合色| 不卡av在线免费观看| 欧美aaa大片| 亚洲第一偷拍网| 999在线精品| 久久久一本精品99久久精品66| 99久久99久久综合| 日本五码在线| 久久亚洲影音av资源网| 2023国产精品久久久精品双| 在线观看成人免费| 亚洲成人免费影院| 国产精品迅雷| 91久久精品国产| 不卡的av中国片| 成人免费高清在线播放| 精品国产网站地址| 国产精品亚洲综合久久| 久久撸在线视频| 亚洲电影免费观看高清完整版在线观看 | 久久久精品久久久久久96| 伊人久久青草| 亚洲一级二级三级| 欧美中文字幕精在线不卡| 国产成人精品亚洲精品| 国产经典欧美精品| 永久免费av在线| 69**夜色精品国产69乱| 肉丝袜脚交视频一区二区| 超碰在线一区二区三区| 久久天天躁狠狠躁夜夜躁| 日韩精品一二区| 午夜影院在线| 久久久精品视频成人| 久草中文综合在线| seseavlu视频在线| 国产精品久久9| 国产精品日日摸夜夜摸av| 午夜dj在线观看高清视频完整版 | 高清不卡亚洲| 99中文视频在线| 亚洲精品亚洲人成人网在线播放| 欧美××××黑人××性爽 | 欧美性猛交xxx高清大费中文| 91亚洲国产精品| 亚洲免费观看高清完整版在线观看 | 精品欧美乱码久久久久久 | 最新国产精品拍自在线播放| 亚洲在线日韩| 免费福利在线视频| 国产精品露脸自拍| 国产精品久久久久久久久晋中 | 在线最新版中文在线| 国产经品一区二区| 亚洲一区二区四区蜜桃| 爱爱精品视频| www.xxx亚洲| 日韩中文在线不卡| 国产福利一区二区| 蜜桃视频m3u8在线观看| 久久久久久国产精品mv| 欧美调教femdomvk| 亚洲高清毛片| 无遮挡动作视频在线观看免费入口 | 少妇高潮久久77777| 国产精品99久久久| 97成人资源| 亚洲国产精品影视| 精品中文视频在线| 国产精品一区二区91| 二区三区不卡| 国产免费观看高清视频| 日韩在线播放一区| 久久综合九色综合久久久精品综合 | 自拍视频在线免费观看| 91久久精品一区二区别| 色综合天天综合给合国产| 性欧美69xoxoxoxo| 粉嫩av在线播放| 久久久7777| 亚洲精品久久在线| 99久久伊人精品| 一区二区三区在线免费看 | 欧美国产偷国产精品三区| 久久精品一区二| 久久99亚洲精品| 日本一二三不卡| 亚洲综合专区| 99九九热只有国产精品| 久久久久久久av| 国产精品污www在线观看| 深夜激情久久| 69国产精品| 92福利视频午夜1000合集在线观看| 91福利精品视频| 奶水喷射视频一区| av在线资源| 国产偷人视频免费| 国产成人综合精品在线| 欧美亚洲丝袜传媒另类| 久久资源在线| 韩日精品一区| 日本中文字幕电影| 国产九区一区在线| 日韩国产精品视频| 国产精品看片你懂得| 亚洲欧美网站在线观看| 人人澡人人添人人爽一区二区| 97中文字幕在线| 日韩av色在线| 欧美日韩国产精品成人| 粉嫩一区二区三区性色av| 香蕉久久精品日日躁夜夜躁| 国产大学生校花援交在线播放| 国产精品88久久久久久妇女| 欧美亚洲视频一区二区|