只要交錢,高中生也能發(fā)NeurIPS?港大教授怒批頂會(huì)變味
只要交錢就能發(fā)NeurIPS?
當(dāng)頂級(jí)學(xué)術(shù)會(huì)議論文錄取率被一些輔導(dǎo)班刷到70%,所謂的「學(xué)術(shù)頂會(huì)」便被「運(yùn)營(yíng)」為「學(xué)術(shù)產(chǎn)業(yè)鏈條」的一環(huán),變成一個(gè)明碼標(biāo)價(jià)的「學(xué)術(shù)游戲」。
近日, 香港大學(xué)計(jì)算與數(shù)據(jù)科學(xué)學(xué)院院長(zhǎng)馬毅(網(wǎng)名「毅馬當(dāng)閑」)在微博中揭露了這一學(xué)術(shù)圈亂象:
「頂會(huì)規(guī)模化后,已基本失去了學(xué)術(shù)會(huì)議的屬性」
「向來(lái)物以稀為貴,何來(lái)論文以多為頂級(jí)?」

據(jù)這家名為Algoverse的科研輔導(dǎo)機(jī)構(gòu)官網(wǎng)公布數(shù)據(jù),其指導(dǎo)的團(tuán)隊(duì)在NeurIPS、EMNLP和ACL等AI頂級(jí)會(huì)議上的錄用率高達(dá)68%-70%。
這樣的錄用率,可以碾壓許多知名學(xué)術(shù)機(jī)構(gòu)的平均水平(30%-50%)。

不僅是在錄用比率上「遙遙領(lǐng)先」,更令人驚訝的是高中生也有機(jī)會(huì)在頂會(huì)上發(fā)文。
當(dāng)然頂會(huì)上確實(shí)也有少部分高中生特別優(yōu)秀,他們不一定全部來(lái)自機(jī)構(gòu)包裝,但往往機(jī)構(gòu)會(huì)利用這種罕見(jiàn)案例作為營(yíng)銷噱頭。
Algoverse特意「提醒」高中生:在NeurIPS論文的作者中,高中生占比不到0.2%,以此暗示可以幫助高中生突破這一極高門(mén)檻。
而頂會(huì)通常是博士生和Google DeepMind等行業(yè)巨頭競(jìng)技的舞臺(tái)。
有需求就會(huì)有服務(wù)。
不少網(wǎng)友在留言中戳破其中的門(mén)道:
「辦會(huì)還挺賺錢的」
「有很多機(jī)構(gòu)推銷這種活動(dòng)的,價(jià)格很貴,跟家長(zhǎng)說(shuō)有了論文或者會(huì)議研討經(jīng)歷好申請(qǐng)大學(xué)」
「自古以來(lái)就是這樣子的:假大空」……



付費(fèi)論文
正在收割家長(zhǎng)的「焦慮稅」
據(jù)公開(kāi)資料顯示,Algoverse是一個(gè)付費(fèi)的AI研究項(xiàng)目,主要面向全球本科生、高中生和行業(yè)專業(yè)人士開(kāi)放。
Algoverse致力于「賦能學(xué)生開(kāi)展真實(shí)且具有影響力的AI研究」,使他們能夠產(chǎn)生卓越成果并發(fā)表于全球AI頂會(huì)。
Algoverse宣稱,其博士導(dǎo)師均在全球頂尖的人工智能機(jī)構(gòu)和研究實(shí)驗(yàn)室擁有豐富的研究經(jīng)驗(yàn)。
這些導(dǎo)師會(huì)深度參與到學(xué)生的項(xiàng)目中為其提供關(guān)鍵指導(dǎo),以確保學(xué)生可以撰寫(xiě)出高質(zhì)量研究論文,并在頂會(huì)上成功發(fā)表。

在Algoverse的服務(wù)條款中,學(xué)生在項(xiàng)目中完成的研究論文版權(quán)歸機(jī)構(gòu),學(xué)生不能自行發(fā)表或出售論文,機(jī)構(gòu)保留用于學(xué)術(shù)或宣傳等各種用途的權(quán)利。

根據(jù)Algoverse官網(wǎng)對(duì)AI研究項(xiàng)目的介紹,這是一個(gè)為期12周的在線項(xiàng)目,每周舉行兩次會(huì)議。
項(xiàng)目小組是一個(gè)由3到4名學(xué)生組成的團(tuán)隊(duì),并配備一位與該團(tuán)隊(duì)緊密協(xié)作的專屬導(dǎo)師。
學(xué)生在導(dǎo)師的指導(dǎo)下,制定出一項(xiàng)新穎、可行且具有影響力的科研提案。
導(dǎo)師則會(huì)在稿件的創(chuàng)意構(gòu)思、代碼實(shí)現(xiàn)與模型訓(xùn)練、稿件撰寫(xiě)、會(huì)議投稿等整個(gè)過(guò)程提供幫助。
Algoverse官網(wǎng)上展示了學(xué)生近期在NeurIPS、EMNLP、ACL等AI頂會(huì)上被接收的論文。
在多數(shù)學(xué)術(shù)場(chǎng)景中,「接收」也可被視作成果,可以寫(xiě)進(jìn)簡(jiǎn)歷。

在Algoverse官網(wǎng)動(dòng)態(tài)中,還展示了學(xué)生論文被頂會(huì)接收、研究合作等相關(guān)報(bào)道。
其中一項(xiàng)報(bào)道中,四名Algoverse學(xué)生Tim、Ryan、Ayush和Kaylee的論文《語(yǔ)義自洽性》(Semantic Self-Consistency)入選OpenAI的PaperBench項(xiàng)目。
報(bào)道還特別提到:學(xué)生作者Tim獲得了OpenAI的合作邀請(qǐng),在NeurIPS會(huì)議發(fā)表演講后,四名研究人員中有兩人被斯坦福大學(xué)錄取。
學(xué)生參與Algoverse的有形收獲,是可能在頂會(huì)上發(fā)表論文,為他們申請(qǐng)大學(xué)增加籌碼。
對(duì)許多家庭而言,僅此一點(diǎn)就足以構(gòu)成較強(qiáng)的吸引力。
與Algoverse項(xiàng)目類似的,還有很多留學(xué)機(jī)構(gòu)的服務(wù)。
它們打出「名校導(dǎo)師科研項(xiàng)目」「頂會(huì)背景提升」的旗號(hào),一個(gè)科研項(xiàng)目收費(fèi)數(shù)十萬(wàn)人民幣,將「論文、頂會(huì)、科研經(jīng)歷」打包成收費(fèi)產(chǎn)品賣給學(xué)生及家長(zhǎng)。
明碼標(biāo)價(jià)的國(guó)際競(jìng)賽評(píng)委席位、頂刊論文作者署名、付費(fèi)就能參加并獲獎(jiǎng)的項(xiàng)目,甚至還可以量身定制「?jìng)€(gè)人品牌」故事……
這些經(jīng)過(guò)「流水線」批量生產(chǎn)出來(lái)的留學(xué)生申請(qǐng)簡(jiǎn)歷由于太過(guò)模式化,以至于招生官不用看學(xué)生基本資料,就能大概推測(cè)出來(lái)申請(qǐng)者有沒(méi)有經(jīng)過(guò)「特別包裝」。
物以稀為貴,「注水」包裝太多,就會(huì)顯得廉價(jià)甚至「掉價(jià)」。
更多情況下,家長(zhǎng)付錢并不能為子女買到更光明的未來(lái),更像是為自己交「焦慮稅」,使得「付費(fèi)掛名-付費(fèi)發(fā)文」鏈條可以運(yùn)轉(zhuǎn)起來(lái)。
唯一的受益者,是那些可以在這個(gè)鏈條上賺到錢的服務(wù)機(jī)構(gòu)。
當(dāng)學(xué)術(shù)聲譽(yù)打包出售
透支的是學(xué)術(shù)圈「信任」
交錢就可以進(jìn)入一個(gè)「項(xiàng)目」,然后獲得論文署名或一段研究經(jīng)歷。
這種付費(fèi)科研、掛名、頂會(huì)營(yíng)……實(shí)際上是把學(xué)術(shù)聲譽(yù)(論文、會(huì)議、導(dǎo)師背書(shū))貨幣化。
參與只需要「鈔能力」,就算你只是高中生,甚至連基本的科研能力都沒(méi)有,仍然可以被硬塞進(jìn)大學(xué)實(shí)驗(yàn)室「做科研」。
這將帶來(lái)如下一系列問(wèn)題:
- 損害教育和科研公平:導(dǎo)師和項(xiàng)目的時(shí)間按「市場(chǎng)需求」分配,科研資源向「有錢有關(guān)系的人」傾斜;而不是按照科研需求分配,分配給學(xué)術(shù)能力和興趣更匹配的學(xué)生。
- 學(xué)術(shù)交易代替科研探索:對(duì)很多參與者來(lái)說(shuō),「發(fā)一篇論文」不再是學(xué)術(shù)探索的結(jié)果,而是「服務(wù)交付物」,學(xué)術(shù)動(dòng)機(jī)被扭曲。
- 講師、導(dǎo)師、甚至部分實(shí)驗(yàn)室,會(huì)設(shè)計(jì)「可量產(chǎn)的項(xiàng)目」,以保證在有限時(shí)間內(nèi)產(chǎn)出可寫(xiě)進(jìn)簡(jiǎn)歷的「成果」。
- 論文越多,含金量越低:這可能帶來(lái)「學(xué)術(shù)通貨膨脹」「學(xué)歷貶值」等一系列現(xiàn)象。
當(dāng)論文數(shù)量、頂會(huì)頭銜成了高校職稱、項(xiàng)目評(píng)審、名校申請(qǐng)的重要指標(biāo),就有可能成為可買賣的稀缺資源,形成機(jī)構(gòu)賣論文→論文數(shù)量暴漲→論文價(jià)值被稀釋的惡性循環(huán)。
這將導(dǎo)致真正有價(jià)值的研究被淹沒(méi),期刊/會(huì)議版面和審稿資源被擠占,還將引發(fā)科研功利化,帶來(lái)學(xué)術(shù)「通脹」,最終透支社會(huì)公眾對(duì)「學(xué)術(shù)圈」的信任。
AI+論文工廠
膨脹的學(xué)術(shù)「泡沫」
前不久,在悉尼大學(xué)、美國(guó)科羅拉多大學(xué)等機(jī)構(gòu)的一項(xiàng)關(guān)于「論文工廠」的一項(xiàng)研究中指出:
「論文工廠借助AI工具生產(chǎn)低質(zhì)量、偽造或重復(fù)性強(qiáng)的論文,并使其更難被檢測(cè)。」

https://www.sciencedirect.com/science/article/pii/S0895435624003056?utm_source=chatgpt.com
所謂「論文工廠」,是指一些商業(yè)實(shí)體,它們專為希望在學(xué)術(shù)期刊上發(fā)表文章的人撰寫(xiě)并出售大量虛假學(xué)術(shù)論文。
這些「論文工廠」專門(mén)制造虛假或低質(zhì)量的研究論文,并出售作者署名權(quán)。
論文提到這樣一個(gè)案例:
2023年Hindawi期刊撤回了8000多篇論文,這些論文被證實(shí)是由「論文工廠」制造的欺詐性成果。
研究人員將此定性為一起大規(guī)模學(xué)術(shù)欺詐行為,認(rèn)為其危害遠(yuǎn)超單個(gè)不誠(chéng)實(shí)研究者所能造成的影響。
學(xué)術(shù)研究量產(chǎn)化,催生了「論文工廠」現(xiàn)象,再疊加AI技術(shù),導(dǎo)致學(xué)術(shù)圈「通脹」越來(lái)越嚴(yán)重。
而AI技術(shù)的發(fā)展,似乎也在為這種「論文工廠」的「學(xué)術(shù)造假」行為推波助瀾。
以ChatGPT、Gemini等為代表的生成式AI工具能夠輕松生成模仿學(xué)術(shù)風(fēng)格、結(jié)構(gòu)和語(yǔ)氣的文本。
尤其是在一些無(wú)需同行評(píng)審或機(jī)構(gòu)認(rèn)證的平臺(tái)上,這些AI生成的論文極易被誤認(rèn)為是真正的學(xué)術(shù)成果。
據(jù)《Nature》的一篇文章報(bào)道,癌癥研究領(lǐng)域有超過(guò)25萬(wàn)篇文章被AI 工具定性為與「論文工廠」模式相似。

當(dāng)一部分人在用AI技術(shù)制造虛假或低質(zhì)量論文的同時(shí),也有人在利用AI來(lái)「打假」。
澳大利亞布里斯班昆士蘭科技大學(xué)的統(tǒng)計(jì)學(xué)家Adrian Barnett就是其中一位。
他認(rèn)為,「論文工廠」可能依賴標(biāo)準(zhǔn)化模板來(lái)批量生產(chǎn)論文,于是他就和同事訓(xùn)練了一個(gè)名為BERT的大模型。
該模型會(huì)通過(guò)掃描論文標(biāo)題和摘要,尋找其與論文工廠活動(dòng)相關(guān)聯(lián)的特定詞語(yǔ)和短語(yǔ),這一過(guò)程類似于過(guò)濾垃圾郵件。
BERT模型從生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)PubMed中識(shí)別出260萬(wàn)篇癌癥研究論文(這些論文發(fā)表于1999年至2024年間共計(jì)11632種期刊),并將其中261245篇論文標(biāo)記為疑似由論文工廠產(chǎn)出的文章,其中大多數(shù)為基礎(chǔ)研究論文。
Barnett等人發(fā)現(xiàn),過(guò)去20年間論文工廠的活動(dòng)急劇增加:
在21世紀(jì)初,僅有1%的癌癥論文被BERT模型標(biāo)記為可能由論文工廠產(chǎn)出,但這一比例在2020年代初已上升至超過(guò)15%,并在2022年達(dá)到16.6%的峰值。隨后在2023、2024年有一定回落。
以上研究證明,「論文工廠」長(zhǎng)期以來(lái)存在,而且還在學(xué)術(shù)市場(chǎng)占據(jù)了一定的「市場(chǎng)份額」。
AI技術(shù)對(duì)于「論文工廠」是一把雙刃劍。
「論文工廠」可用它來(lái)加速「學(xué)術(shù)造假」,但像Barnett等人也可以用AI進(jìn)行「學(xué)術(shù)打假」,關(guān)鍵取決于我們?nèi)绾卫盟?/span>
近期,頂會(huì)投稿量瘋狂增長(zhǎng),NeurIPS的投稿量已經(jīng)從2020年的9467篇增長(zhǎng)到2025年的21575篇,ICLR也達(dá)到了過(guò)萬(wàn)的投稿量。
與論文掛鉤的評(píng)價(jià)體系、AI的使用等因素疊加在快速推高投稿量,擠壓頂會(huì)資源。

為了杜絕人們利用AI技術(shù)制造虛假或低質(zhì)量論文的現(xiàn)象,ICLR在新近出臺(tái)的新規(guī)中推出了兩項(xiàng)有關(guān)大模型使用的兩項(xiàng)主要政策:
政策一:任何對(duì)大模型的使用都必須明確聲明。
政策二:ICLR 的作者與審稿人需為其貢獻(xiàn)負(fù)最終責(zé)任。
違背這些政策將可能導(dǎo)致直接拒稿的后果。
無(wú)論是「頂會(huì)變味」現(xiàn)象,還是ICLR新規(guī)的推出,都是為了捍衛(wèi)學(xué)術(shù)研究的純粹性,守護(hù)社會(huì)創(chuàng)新的根基和動(dòng)力。



























