CIO分享:企業(yè)IT應(yīng)謹(jǐn)慎使用生成式AI向前發(fā)展

Vince Kellen是美國(guó)加州大學(xué)圣地亞哥分校(UCSD)的首席信息官,他深知ChatGPT、DALL-E和其他生成式AI技術(shù)有據(jù)可查的局限性:生成的答案可能并不真實(shí),生成的圖像也可能缺乏完整性,輸出可能存在偏差。但無(wú)論如何他都在向前推進(jìn),他表示,員工們已經(jīng)在使用ChatGPT來(lái)編寫(xiě)代碼和工作內(nèi)容描述了。
OpenAI的文本生成技術(shù)ChatGPT以及圖像生成技術(shù)DALL-E在一系列吸引了公眾想象力的大型語(yǔ)言模型(也稱為生成語(yǔ)言模型或者生成式AI)中是最突出的,這些模型響應(yīng)書(shū)面請(qǐng)求以生成從文本文檔和圖像到編程代碼的各種回答內(nèi)容。
Kellen認(rèn)為,由ChatGPT生成的代碼是一種提高生產(chǎn)力的工具,就像編譯器是對(duì)匯編語(yǔ)言的改進(jìn)一樣。他說(shuō):“生成庫(kù)和軟件的東西和搜索GitHub沒(méi)有什么不同,我們還使用它來(lái)編寫(xiě)對(duì)內(nèi)容和格式敏感的職位內(nèi)容描述。然后你可以非常快速地繼續(xù)編輯,尋找錯(cuò)誤和存在混淆的地方。”雖然這項(xiàng)技術(shù)還處于早期階段,但對(duì)于某些企業(yè)應(yīng)用(例如那些內(nèi)容和工作流密集型的應(yīng)用)來(lái)說(shuō),不可否認(rèn)的是它已經(jīng)帶來(lái)了一定的影響,但是你要謹(jǐn)慎行事。
為恰當(dāng)?shù)膽?yīng)用做好準(zhǔn)備
DB SYSTEL公司的首席信息官兼產(chǎn)品負(fù)責(zé)人Oliver Wittmaier表示,生成式AI已經(jīng)準(zhǔn)備好可以用于編碼、管理工作流、數(shù)據(jù)細(xì)化和簡(jiǎn)單用例(例如預(yù)填表格),DB SYSTEL是DB AG的全資子公司,也是所有集團(tuán)公司的數(shù)字化合作伙伴。他說(shuō),在運(yùn)輸行業(yè),“人工智能可以直接地或者間接地影響運(yùn)輸過(guò)程中的擁塞避免、轉(zhuǎn)向和管理。”
內(nèi)容生成也是Mitre公司創(chuàng)新和實(shí)驗(yàn)總監(jiān)Michal Cenkl特別感興趣的領(lǐng)域。目前,他的團(tuán)隊(duì)正在研究該技術(shù)在知識(shí)和專業(yè)領(lǐng)域的兩個(gè)用途。“首先,是如果我想給我們的一位贊助商寫(xiě)一封電子郵件,總結(jié)我們所做的工作以及和他們相關(guān)的工作,而且這是在我們已經(jīng)與他們進(jìn)行過(guò)溝通的背景下寫(xiě)這封郵件的。這項(xiàng)技術(shù)展現(xiàn)出難以置信的強(qiáng)大。”
其次是項(xiàng)目人員配備。通常,Cenkl會(huì)查看簡(jiǎn)歷并根據(jù)技能標(biāo)簽進(jìn)行搜索,找到和項(xiàng)目匹配的人選。生成式AI可以幫助做到這一點(diǎn)。“例如,我可能想問(wèn),‘Michael在這個(gè)項(xiàng)目上能做什么’,根據(jù)他現(xiàn)在正在做的事情,總結(jié)出他能做什么工作,這樣就不需要我從簡(jiǎn)歷中進(jìn)行搜索了。”
二手車零售商CarMax一年多來(lái)一直在使用生成式AI,利用OpenAI的API將客戶評(píng)論文本整合為更易于管理和閱讀的摘要。但該公司首席信息官Shamim Mohammad表示,他的團(tuán)隊(duì)也已經(jīng)把這項(xiàng)技術(shù)應(yīng)用到其他領(lǐng)域了。
其中,車輛成像可有助于改善客戶體驗(yàn)。他說(shuō),AI可以優(yōu)化他們添加到庫(kù)存中的每輛車的圖像,在任何給定時(shí)間內(nèi),庫(kù)存車輛在50000輛到60000輛。“我們讓每一幅圖像都盡可能逼真,同時(shí)又不失有效性。”例如,他們的數(shù)據(jù)科學(xué)家創(chuàng)建了一個(gè)“數(shù)字清掃器”模型,模型用一張顯示了汽車停在干凈地板上的圖像,替換了一張汽車停在臟地板上的照片。“雖然還是同一輛車,但是照片看起來(lái)更好了,這對(duì)客戶來(lái)說(shuō)也是更好的體驗(yàn)。”
同樣地,F(xiàn)orrester分析師Rowan Curran表示,耐克一直在使用生成式AI來(lái)生成產(chǎn)品原型圖像。他說(shuō):“你可以使用從文本到3D的建模器,在3D空間中進(jìn)行測(cè)試,更直觀地了解它在現(xiàn)實(shí)世界中的外觀——所有這些都是輕而易舉的。”
潛在回報(bào)最大的應(yīng)用
Mohammad說(shuō),創(chuàng)建代碼和改善客戶體驗(yàn)是當(dāng)今企業(yè)使用生成式AI的主要領(lǐng)域,在提高效率方面具有最大的潛在回報(bào)。
TruStone Financial Credit Union執(zhí)行副總裁、首席信息官Gary Jeter表示,這也正是他的開(kāi)發(fā)人員通過(guò)GitHub實(shí)施OpenAI Codex希望做到的。而且,使用生成式AI編碼的效果很好。Cenkl說(shuō),生成式AI模型在編碼方面的效果要好于人類語(yǔ)言,因?yàn)榫幊陶Z(yǔ)言更加結(jié)構(gòu)化。“它可以梳理出這種結(jié)構(gòu),因此效果更好。”
CarMax正在測(cè)試GitHub的Copilot,他說(shuō),工程師在某些情況下可能會(huì)生成高達(dá)40%的代碼。“進(jìn)化發(fā)展的速度很快,但如果你使用它來(lái)創(chuàng)建軟件的話,就必須要確保沒(méi)有侵犯版權(quán)、生成虛假內(nèi)容或者是嵌入了惡意軟件。”你不能在沒(méi)有監(jiān)督的情況下插入這些代碼。
Curran說(shuō),其他領(lǐng)域也已經(jīng)發(fā)展成熟到可以運(yùn)用企業(yè)應(yīng)用了,例如生成營(yíng)銷文案、圖像、設(shè)計(jì)、以及創(chuàng)建更好的數(shù)據(jù)摘要以便人們更有效地使用數(shù)據(jù)。他說(shuō):“有些人甚至使用這些大型語(yǔ)言模型來(lái)清理非結(jié)構(gòu)化數(shù)據(jù)。”他說(shuō),接下來(lái)生成AI功能可能會(huì)開(kāi)始出現(xiàn)在一些企業(yè)軟件中,例如技術(shù)支持軟件以及微軟Office應(yīng)用。
不輕易信任,先進(jìn)行驗(yàn)證
CarMax的Mohammad警告說(shuō),除了能帶來(lái)好處之外,部署這種技術(shù)的CIO們還需要了解與生成的內(nèi)容輸出有關(guān)的潛在知識(shí)產(chǎn)權(quán)問(wèn)題。生成式模型(例如基于互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行訓(xùn)練的DALL-E)會(huì)生成可能侵犯版權(quán)的內(nèi)容,這就是為什么Getty Images最近就AI驅(qū)動(dòng)的藝術(shù)生成工具Stable Diffusion起訴了Stability AI。
這項(xiàng)技術(shù)還需要人類的監(jiān)督。Cenkl說(shuō):“像ChatGPT這樣的系統(tǒng)并不知道他們創(chuàng)作的是什么,而且這些系統(tǒng)非常擅長(zhǎng)讓你相信他們所說(shuō)的是準(zhǔn)確的,即使事實(shí)并非如此。”沒(méi)有哪個(gè)AI可以保證——沒(méi)有屬性或者參考信息讓你知道它是如何得出響應(yīng)的,也沒(méi)有AI可解釋性,表明為什么某些東西是這樣寫(xiě)出來(lái)的。“你不知道底層基礎(chǔ)是什么,也不知道訓(xùn)練集的哪些部分正在影響著模型,你得到的純粹是基于現(xiàn)有數(shù)據(jù)集的分析,因此你不僅有可能出現(xiàn)偏見(jiàn),還有可能出現(xiàn)事實(shí)上的錯(cuò)誤。”
Wittmaier很看好這項(xiàng)技術(shù),但仍然認(rèn)為這是一項(xiàng)早期技術(shù),可以用于面向客戶的部署。他說(shuō),在這一點(diǎn)上,辦公套件環(huán)境、客戶聯(lián)系聊天機(jī)器人、技術(shù)支持功能和一般文件都有短期潛力,但就運(yùn)輸公司業(yè)務(wù)中與安全相關(guān)的領(lǐng)域而言,答案顯然是否定的。他說(shuō):“我們還有很多東西需要學(xué)習(xí)和改進(jìn),才能將生成式AI納入這些敏感的領(lǐng)域。”
Jeter也有類似的擔(dān)憂。雖然他的團(tuán)隊(duì)使用了ChatGPT來(lái)識(shí)別代碼修復(fù),并在30分鐘內(nèi)將其部署到網(wǎng)站,“如果沒(méi)有 ChatGPT,這將花費(fèi)更長(zhǎng)的時(shí)間”,而且他認(rèn)為ChatGPT對(duì)于起草合同條款和條件也很有用,但這些都尚未得到完全的驗(yàn)證。“我們不會(huì)向外部成員公開(kāi)任何生成式AI,在這個(gè)領(lǐng)域TruStone不會(huì)沖在最前面。”
他補(bǔ)充說(shuō),當(dāng)TruStone最終開(kāi)始使用該技術(shù)為其成員帶來(lái)利益的時(shí)候,將是通過(guò)人工和自動(dòng)審查來(lái)監(jiān)控對(duì)話以保護(hù)成員和品牌的。
美國(guó)加州大學(xué)圣地亞哥分校的Kellen表示,如今,成功部署的關(guān)鍵仍然是有人類在循環(huán)中對(duì)生成內(nèi)容的準(zhǔn)確性和合規(guī)性進(jìn)行審查。“確保機(jī)器做出正確的決定,這將成為一個(gè)重要的訴訟點(diǎn),企業(yè)組織使用該技術(shù)進(jìn)行任何高風(fēng)險(xiǎn)的事情——例如醫(yī)療診斷——都還需要很長(zhǎng)一段時(shí)間。但是生成式AI可以很好地生成評(píng)論摘要之類的東西,前提是有人類監(jiān)督。這讓我們放慢了一點(diǎn)速度,但這么做是正確的。最終,我們將找到自動(dòng)化的方法來(lái)確保質(zhì)量。但現(xiàn)在,你必須有一個(gè)審查程序來(lái)確保生成的內(nèi)容是準(zhǔn)確的。”
除了準(zhǔn)確性之外,另一個(gè)有據(jù)可查的風(fēng)險(xiǎn)是從訓(xùn)練數(shù)據(jù)中心引入的模型可能存在偏見(jiàn)。Kellen說(shuō),當(dāng)生成式AI使用來(lái)自互聯(lián)網(wǎng)的內(nèi)容時(shí),這一點(diǎn)尤其成問(wèn)題——就像ChatGPT所做的那樣。但是當(dāng)你是根據(jù)自己私有公司的數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練的話,你就可以檢查潛在的偏見(jiàn),這可能就不成問(wèn)題了。他說(shuō):“你越是深入企業(yè),那里的數(shù)據(jù)類別越受限制、越普通,生成式AI就越有用。”
Cenkl說(shuō),關(guān)于大型語(yǔ)言模型你要知道的一點(diǎn)是,這些機(jī)器在某種程度上就是專家。“他們不懂,但他們非常擅長(zhǎng)計(jì)算。”
工作職責(zé)和角色的變化
“技術(shù)能讓事情變得更好,但也為我們帶來(lái)了很多額外的工作。”不過(guò),他認(rèn)為生成式AI是不同的。“這一點(diǎn)很令人興奮,因?yàn)樗鼤?huì)帶走一些我們不喜歡做的事情,讓我們變得更聰明,它能讓人類變得更強(qiáng)大。”
但Curran指出,生成式AI不會(huì)在短期內(nèi)完全取代任何角色。他說(shuō):“它可能會(huì)減少執(zhí)行某個(gè)角色所需的人數(shù),例如內(nèi)容開(kāi)發(fā)、產(chǎn)品信息管理或者是軟件開(kāi)發(fā),但總是需要有人類參與其中的。”Mohammad補(bǔ)充說(shuō),生成式AI技術(shù)可以編寫(xiě)和總結(jié),也始終需要人類的智能來(lái)確保內(nèi)容質(zhì)量,并控制生成的內(nèi)容以使其變得更好。
開(kāi)始起步吧
Kellen說(shuō),現(xiàn)在是加快生成式AI技術(shù)并開(kāi)始試驗(yàn)的時(shí)候了。他說(shuō):“CIO們必須在被那些將技術(shù)嵌入到他們企業(yè)軟件產(chǎn)品中的廠商迷惑之前先解決這個(gè)難題,如果你在明年繼續(xù)拖延下去的話,你在整個(gè)曲線中就處于落后狀態(tài)了。”
Curran說(shuō),重要的是去了解這種技術(shù),深入探索而非圍繞ChatGPT展開(kāi)公眾熱議,從而了解這項(xiàng)技術(shù)比應(yīng)用要復(fù)雜得多。然后開(kāi)始考慮生成式AI對(duì)可能提高現(xiàn)有流程效率或者質(zhì)量有哪些用途。最后,問(wèn)問(wèn)你自己,你需要什么類型的功能,你是從廠商那里獲得還是自己構(gòu)建。
接下來(lái),就是測(cè)試技術(shù)和考慮潛在的用例。Cenkl說(shuō):“你的很多系統(tǒng),無(wú)論使用的是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù),都將至少具有自然語(yǔ)言和對(duì)話界面的某些組件。想想你擁有的數(shù)據(jù),想想這些技術(shù)可以增強(qiáng)其中的哪些部分,”然后展示其潛力。例如,Jeter說(shuō)他生成了一個(gè)條款和條件模板,并將其發(fā)送給合規(guī)部門,以展示他們是如何使用該技術(shù)的。
Curran說(shuō),生成式AI模型很大,從頭開(kāi)始訓(xùn)練模型成本極高,因此最好的入門方法是使用其中一種云服務(wù)。例如,CarMax使用帶有GPT 3.5的微軟Azure OpenAI服務(wù)。Mohammad表示:“我們加載的數(shù)據(jù)是我們自己的——不會(huì)與他人共享,我們可以擁有大量數(shù)據(jù)并快速處理這些數(shù)據(jù)以運(yùn)行我們的模型。如果你有一個(gè)小團(tuán)隊(duì),或者有業(yè)務(wù)問(wèn)題可能用得上生成式AI技術(shù),那就試一試吧。”






























