CIO分享：企業(yè)IT應(yīng)謹(jǐn)慎使用生成式AI向前發(fā)展

2023-03-15 10:37:21

OpenAI的文本生成技術(shù)ChatGPT以及圖像生成技術(shù)DALL-E在一系列吸引了公眾想象力的大型語(yǔ)言模型（也稱為生成語(yǔ)言模型或者生成式AI）中是最突出的，這些模型響應(yīng)書(shū)面請(qǐng)求以生成從文本文檔和圖像到編程代碼的各種回答內(nèi)容。

Vince Kellen是美國(guó)加州大學(xué)圣地亞哥分校（UCSD）的首席信息官，他深知ChatGPT、DALL-E和其他生成式AI技術(shù)有據(jù)可查的局限性：生成的答案可能并不真實(shí)，生成的圖像也可能缺乏完整性，輸出可能存在偏差。但無(wú)論如何他都在向前推進(jìn)，他表示，員工們已經(jīng)在使用ChatGPT來(lái)編寫(xiě)代碼和工作內(nèi)容描述了。

Kellen認(rèn)為，由ChatGPT生成的代碼是一種提高生產(chǎn)力的工具，就像編譯器是對(duì)匯編語(yǔ)言的改進(jìn)一樣。他說(shuō)：“生成庫(kù)和軟件的東西和搜索GitHub沒(méi)有什么不同，我們還使用它來(lái)編寫(xiě)對(duì)內(nèi)容和格式敏感的職位內(nèi)容描述。然后你可以非常快速地繼續(xù)編輯，尋找錯(cuò)誤和存在混淆的地方。”雖然這項(xiàng)技術(shù)還處于早期階段，但對(duì)于某些企業(yè)應(yīng)用（例如那些內(nèi)容和工作流密集型的應(yīng)用）來(lái)說(shuō)，不可否認(rèn)的是它已經(jīng)帶來(lái)了一定的影響，但是你要謹(jǐn)慎行事。

為恰當(dāng)?shù)膽?yīng)用做好準(zhǔn)備

DB SYSTEL公司的首席信息官兼產(chǎn)品負(fù)責(zé)人Oliver Wittmaier表示，生成式AI已經(jīng)準(zhǔn)備好可以用于編碼、管理工作流、數(shù)據(jù)細(xì)化和簡(jiǎn)單用例（例如預(yù)填表格），DB SYSTEL是DB AG的全資子公司，也是所有集團(tuán)公司的數(shù)字化合作伙伴。他說(shuō)，在運(yùn)輸行業(yè)，“人工智能可以直接地或者間接地影響運(yùn)輸過(guò)程中的擁塞避免、轉(zhuǎn)向和管理。”

內(nèi)容生成也是Mitre公司創(chuàng)新和實(shí)驗(yàn)總監(jiān)Michal Cenkl特別感興趣的領(lǐng)域。目前，他的團(tuán)隊(duì)正在研究該技術(shù)在知識(shí)和專業(yè)領(lǐng)域的兩個(gè)用途。“首先，是如果我想給我們的一位贊助商寫(xiě)一封電子郵件，總結(jié)我們所做的工作以及和他們相關(guān)的工作，而且這是在我們已經(jīng)與他們進(jìn)行過(guò)溝通的背景下寫(xiě)這封郵件的。這項(xiàng)技術(shù)展現(xiàn)出難以置信的強(qiáng)大。”

其次是項(xiàng)目人員配備。通常，Cenkl會(huì)查看簡(jiǎn)歷并根據(jù)技能標(biāo)簽進(jìn)行搜索，找到和項(xiàng)目匹配的人選。生成式AI可以幫助做到這一點(diǎn)。“例如，我可能想問(wèn)，‘Michael在這個(gè)項(xiàng)目上能做什么’，根據(jù)他現(xiàn)在正在做的事情，總結(jié)出他能做什么工作，這樣就不需要我從簡(jiǎn)歷中進(jìn)行搜索了。”

二手車零售商CarMax一年多來(lái)一直在使用生成式AI，利用OpenAI的API將客戶評(píng)論文本整合為更易于管理和閱讀的摘要。但該公司首席信息官Shamim Mohammad表示，他的團(tuán)隊(duì)也已經(jīng)把這項(xiàng)技術(shù)應(yīng)用到其他領(lǐng)域了。

其中，車輛成像可有助于改善客戶體驗(yàn)。他說(shuō)，AI可以優(yōu)化他們添加到庫(kù)存中的每輛車的圖像，在任何給定時(shí)間內(nèi)，庫(kù)存車輛在50000輛到60000輛。“我們讓每一幅圖像都盡可能逼真，同時(shí)又不失有效性。”例如，他們的數(shù)據(jù)科學(xué)家創(chuàng)建了一個(gè)“數(shù)字清掃器”模型，模型用一張顯示了汽車停在干凈地板上的圖像，替換了一張汽車停在臟地板上的照片。“雖然還是同一輛車，但是照片看起來(lái)更好了，這對(duì)客戶來(lái)說(shuō)也是更好的體驗(yàn)。”

同樣地，F(xiàn)orrester分析師Rowan Curran表示，耐克一直在使用生成式AI來(lái)生成產(chǎn)品原型圖像。他說(shuō)：“你可以使用從文本到3D的建模器，在3D空間中進(jìn)行測(cè)試，更直觀地了解它在現(xiàn)實(shí)世界中的外觀——所有這些都是輕而易舉的。”

潛在回報(bào)最大的應(yīng)用

Mohammad說(shuō)，創(chuàng)建代碼和改善客戶體驗(yàn)是當(dāng)今企業(yè)使用生成式AI的主要領(lǐng)域，在提高效率方面具有最大的潛在回報(bào)。

TruStone Financial Credit Union執(zhí)行副總裁、首席信息官Gary Jeter表示，這也正是他的開(kāi)發(fā)人員通過(guò)GitHub實(shí)施OpenAI Codex希望做到的。而且，使用生成式AI編碼的效果很好。Cenkl說(shuō)，生成式AI模型在編碼方面的效果要好于人類語(yǔ)言，因?yàn)榫幊陶Z(yǔ)言更加結(jié)構(gòu)化。“它可以梳理出這種結(jié)構(gòu)，因此效果更好。”

CarMax正在測(cè)試GitHub的Copilot，他說(shuō)，工程師在某些情況下可能會(huì)生成高達(dá)40%的代碼。“進(jìn)化發(fā)展的速度很快，但如果你使用它來(lái)創(chuàng)建軟件的話，就必須要確保沒(méi)有侵犯版權(quán)、生成虛假內(nèi)容或者是嵌入了惡意軟件。”你不能在沒(méi)有監(jiān)督的情況下插入這些代碼。

Curran說(shuō)，其他領(lǐng)域也已經(jīng)發(fā)展成熟到可以運(yùn)用企業(yè)應(yīng)用了，例如生成營(yíng)銷文案、圖像、設(shè)計(jì)、以及創(chuàng)建更好的數(shù)據(jù)摘要以便人們更有效地使用數(shù)據(jù)。他說(shuō)：“有些人甚至使用這些大型語(yǔ)言模型來(lái)清理非結(jié)構(gòu)化數(shù)據(jù)。”他說(shuō)，接下來(lái)生成AI功能可能會(huì)開(kāi)始出現(xiàn)在一些企業(yè)軟件中，例如技術(shù)支持軟件以及微軟Office應(yīng)用。

不輕易信任，先進(jìn)行驗(yàn)證

CarMax的Mohammad警告說(shuō)，除了能帶來(lái)好處之外，部署這種技術(shù)的CIO們還需要了解與生成的內(nèi)容輸出有關(guān)的潛在知識(shí)產(chǎn)權(quán)問(wèn)題。生成式模型（例如基于互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行訓(xùn)練的DALL-E）會(huì)生成可能侵犯版權(quán)的內(nèi)容，這就是為什么Getty Images最近就AI驅(qū)動(dòng)的藝術(shù)生成工具Stable Diffusion起訴了Stability AI。

這項(xiàng)技術(shù)還需要人類的監(jiān)督。Cenkl說(shuō)：“像ChatGPT這樣的系統(tǒng)并不知道他們創(chuàng)作的是什么，而且這些系統(tǒng)非常擅長(zhǎng)讓你相信他們所說(shuō)的是準(zhǔn)確的，即使事實(shí)并非如此。”沒(méi)有哪個(gè)AI可以保證——沒(méi)有屬性或者參考信息讓你知道它是如何得出響應(yīng)的，也沒(méi)有AI可解釋性，表明為什么某些東西是這樣寫(xiě)出來(lái)的。“你不知道底層基礎(chǔ)是什么，也不知道訓(xùn)練集的哪些部分正在影響著模型，你得到的純粹是基于現(xiàn)有數(shù)據(jù)集的分析，因此你不僅有可能出現(xiàn)偏見(jiàn)，還有可能出現(xiàn)事實(shí)上的錯(cuò)誤。”

Wittmaier很看好這項(xiàng)技術(shù)，但仍然認(rèn)為這是一項(xiàng)早期技術(shù)，可以用于面向客戶的部署。他說(shuō)，在這一點(diǎn)上，辦公套件環(huán)境、客戶聯(lián)系聊天機(jī)器人、技術(shù)支持功能和一般文件都有短期潛力，但就運(yùn)輸公司業(yè)務(wù)中與安全相關(guān)的領(lǐng)域而言，答案顯然是否定的。他說(shuō)：“我們還有很多東西需要學(xué)習(xí)和改進(jìn)，才能將生成式AI納入這些敏感的領(lǐng)域。”

Jeter也有類似的擔(dān)憂。雖然他的團(tuán)隊(duì)使用了ChatGPT來(lái)識(shí)別代碼修復(fù)，并在30分鐘內(nèi)將其部署到網(wǎng)站，“如果沒(méi)有 ChatGPT，這將花費(fèi)更長(zhǎng)的時(shí)間”，而且他認(rèn)為ChatGPT對(duì)于起草合同條款和條件也很有用，但這些都尚未得到完全的驗(yàn)證。“我們不會(huì)向外部成員公開(kāi)任何生成式AI，在這個(gè)領(lǐng)域TruStone不會(huì)沖在最前面。”

他補(bǔ)充說(shuō)，當(dāng)TruStone最終開(kāi)始使用該技術(shù)為其成員帶來(lái)利益的時(shí)候，將是通過(guò)人工和自動(dòng)審查來(lái)監(jiān)控對(duì)話以保護(hù)成員和品牌的。

美國(guó)加州大學(xué)圣地亞哥分校的Kellen表示，如今，成功部署的關(guān)鍵仍然是有人類在循環(huán)中對(duì)生成內(nèi)容的準(zhǔn)確性和合規(guī)性進(jìn)行審查。“確保機(jī)器做出正確的決定，這將成為一個(gè)重要的訴訟點(diǎn)，企業(yè)組織使用該技術(shù)進(jìn)行任何高風(fēng)險(xiǎn)的事情——例如醫(yī)療診斷——都還需要很長(zhǎng)一段時(shí)間。但是生成式AI可以很好地生成評(píng)論摘要之類的東西，前提是有人類監(jiān)督。這讓我們放慢了一點(diǎn)速度，但這么做是正確的。最終，我們將找到自動(dòng)化的方法來(lái)確保質(zhì)量。但現(xiàn)在，你必須有一個(gè)審查程序來(lái)確保生成的內(nèi)容是準(zhǔn)確的。”

除了準(zhǔn)確性之外，另一個(gè)有據(jù)可查的風(fēng)險(xiǎn)是從訓(xùn)練數(shù)據(jù)中心引入的模型可能存在偏見(jiàn)。Kellen說(shuō)，當(dāng)生成式AI使用來(lái)自互聯(lián)網(wǎng)的內(nèi)容時(shí)，這一點(diǎn)尤其成問(wèn)題——就像ChatGPT所做的那樣。但是當(dāng)你是根據(jù)自己私有公司的數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練的話，你就可以檢查潛在的偏見(jiàn)，這可能就不成問(wèn)題了。他說(shuō)：“你越是深入企業(yè)，那里的數(shù)據(jù)類別越受限制、越普通，生成式AI就越有用。”

Cenkl說(shuō)，關(guān)于大型語(yǔ)言模型你要知道的一點(diǎn)是，這些機(jī)器在某種程度上就是專家。“他們不懂，但他們非常擅長(zhǎng)計(jì)算。”

工作職責(zé)和角色的變化

“技術(shù)能讓事情變得更好，但也為我們帶來(lái)了很多額外的工作。”不過(guò)，他認(rèn)為生成式AI是不同的。“這一點(diǎn)很令人興奮，因?yàn)樗鼤?huì)帶走一些我們不喜歡做的事情，讓我們變得更聰明，它能讓人類變得更強(qiáng)大。”

但Curran指出，生成式AI不會(huì)在短期內(nèi)完全取代任何角色。他說(shuō)：“它可能會(huì)減少執(zhí)行某個(gè)角色所需的人數(shù)，例如內(nèi)容開(kāi)發(fā)、產(chǎn)品信息管理或者是軟件開(kāi)發(fā)，但總是需要有人類參與其中的。”Mohammad補(bǔ)充說(shuō)，生成式AI技術(shù)可以編寫(xiě)和總結(jié)，也始終需要人類的智能來(lái)確保內(nèi)容質(zhì)量，并控制生成的內(nèi)容以使其變得更好。

開(kāi)始起步吧

Kellen說(shuō)，現(xiàn)在是加快生成式AI技術(shù)并開(kāi)始試驗(yàn)的時(shí)候了。他說(shuō)：“CIO們必須在被那些將技術(shù)嵌入到他們企業(yè)軟件產(chǎn)品中的廠商迷惑之前先解決這個(gè)難題，如果你在明年繼續(xù)拖延下去的話，你在整個(gè)曲線中就處于落后狀態(tài)了。”

Curran說(shuō)，重要的是去了解這種技術(shù)，深入探索而非圍繞ChatGPT展開(kāi)公眾熱議，從而了解這項(xiàng)技術(shù)比應(yīng)用要復(fù)雜得多。然后開(kāi)始考慮生成式AI對(duì)可能提高現(xiàn)有流程效率或者質(zhì)量有哪些用途。最后，問(wèn)問(wèn)你自己，你需要什么類型的功能，你是從廠商那里獲得還是自己構(gòu)建。

接下來(lái)，就是測(cè)試技術(shù)和考慮潛在的用例。Cenkl說(shuō)：“你的很多系統(tǒng)，無(wú)論使用的是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù)，都將至少具有自然語(yǔ)言和對(duì)話界面的某些組件。想想你擁有的數(shù)據(jù)，想想這些技術(shù)可以增強(qiáng)其中的哪些部分，”然后展示其潛力。例如，Jeter說(shuō)他生成了一個(gè)條款和條件模板，并將其發(fā)送給合規(guī)部門，以展示他們是如何使用該技術(shù)的。

Curran說(shuō)，生成式AI模型很大，從頭開(kāi)始訓(xùn)練模型成本極高，因此最好的入門方法是使用其中一種云服務(wù)。例如，CarMax使用帶有GPT 3.5的微軟Azure OpenAI服務(wù)。Mohammad表示：“我們加載的數(shù)據(jù)是我們自己的——不會(huì)與他人共享，我們可以擁有大量數(shù)據(jù)并快速處理這些數(shù)據(jù)以運(yùn)行我們的模型。如果你有一個(gè)小團(tuán)隊(duì)，或者有業(yè)務(wù)問(wèn)題可能用得上生成式AI技術(shù)，那就試一試吧。”

責(zé)任編輯：姜華來(lái)源：至頂網(wǎng)CIO與CTO頻道