国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

AI論文激增,出現(xiàn)引用10萬+的ResNet是好是壞?這研究有結(jié)論了

新聞 人工智能
當(dāng)一個領(lǐng)域的規(guī)模越來越大,每年發(fā)表的論文越多越多時,對于該領(lǐng)域來說,是好事還是壞事呢?

[[442368]]

 一周前,計算機視覺領(lǐng)域經(jīng)典之作、何愷明的 ResNet 論文的被引次數(shù)突破了 10 萬 +,而這距離他提交這篇論文僅過去六年。這一工作的熱度如此之高,既顯示出了 ResNet 本身的久經(jīng)考驗,也印證了 AI 領(lǐng)域,特別是計算機視覺如今的火熱程度。

然而,ResNet 高被引的背后也讓我們看到了一個問題,那就是計算機視覺領(lǐng)域每年產(chǎn)出那么多的新論文,為何研究者往往還是選擇它作為引文呢?對高被引經(jīng)典論文的趨向性究竟會給領(lǐng)域帶來進步還是停滯呢?新發(fā)表的論文是否還有可能成為下一個經(jīng)典之作呢?

在近日發(fā)表在 SCI 期刊 PNAS 上的一篇論文《Slowed Canonical Progress in Large Fields of Science》中,來自美國西北大學(xué)和芝加哥大學(xué)的兩位研究者對上述問題進行了解答,并深入探討了科學(xué)領(lǐng)域發(fā)表論文的數(shù)量、質(zhì)量以及被引情況之間的錯綜復(fù)雜的關(guān)聯(lián)。

論文地址:https://www.pnas.org/content/pnas/118/41/e2021636118.full.pdf

對科學(xué)進步有種很直接的觀點,那就是多多益善。一個領(lǐng)域發(fā)表的論文越多,科學(xué)進步的速度就越快;研究者數(shù)量越多,覆蓋的面就越廣。即使并非每篇論文都產(chǎn)生重大的影響,但它們都成為了聚成沙堆的沙粒,增加了出現(xiàn)質(zhì)變的可能性。在這一過程中,科學(xué)景觀得到了重新配置,結(jié)構(gòu)性探究中出現(xiàn)了新的范式。

更多論文的發(fā)表也增加了「它們之中至少有一篇包含重要創(chuàng)新」的可能性。一個顛覆性的全新想法可以動搖現(xiàn)狀,將人們的注意力從以往工作中吸引過來,并獲得大量的新引用。

領(lǐng)域內(nèi)流行的政策很好地反映了這種多多益善的觀點。人們會根據(jù)學(xué)者的生產(chǎn)力對他們進行評估和獎勵,一段時間內(nèi)發(fā)表更多的論文是他們獲得終身教職和職位晉升的最可靠途徑。數(shù)量仍是大學(xué)和公司展開比較的標桿,其中發(fā)表作品、專利、科學(xué)家和經(jīng)費的總量仍是重中之重。

質(zhì)量也主要通過數(shù)量進行判斷。被引次數(shù)用來衡量一個領(lǐng)域內(nèi)個人、團隊和學(xué)術(shù)期刊的重要性。在論文層面,人們往往假定最好和最優(yōu)價值的論文會吸引更多的關(guān)注,從而塑造了該領(lǐng)域的研究軌跡。

在文中,他們預(yù)測,當(dāng)每年發(fā)表論文的數(shù)量非常大時,新論文的快速流動會迫使學(xué)界關(guān)注那些被廣泛引用的論文,由此減少了對不太成熟的論文的關(guān)注,即使它們當(dāng)中有些提出了新穎、有用和具有潛在變革性的想法。大量新發(fā)表論文的出現(xiàn)并沒有引起領(lǐng)域范式的更快更迭,反而鞏固了那些高引用量的論文,阻止新工作成為被引用最多且廣為人知的領(lǐng)域經(jīng)典之作。

研究者通過實驗分析驗證了這些觀點,表明了科研單位對數(shù)量的關(guān)注可能阻礙基礎(chǔ)性進步。隨著每個領(lǐng)域每年所發(fā)表作品的持續(xù)增長,這種不利影響將加劇。并且,考慮到推動「發(fā)表數(shù)量至上」領(lǐng)域認知的根深蒂固、錯綜復(fù)雜的結(jié)構(gòu),這種情況將不可避免。重構(gòu)科學(xué)生產(chǎn)力價值鏈的政策措施需要進行調(diào)整,以使大眾重新聚焦于那些有潛力的新想法。

這篇文章主要講了啥?

本文重點研究了領(lǐng)域大小,即給定的一年內(nèi)某個領(lǐng)域發(fā)表論文數(shù)量的多少產(chǎn)生的影響。以往的研究發(fā)現(xiàn),很多學(xué)科的引用不平等現(xiàn)象正在加劇,至少部分受到了偏好的影響。然而,一篇論文往往無法在過去幾年保持它們的引用水平和排名。顛覆性論文能夠取代以往的工作,被引次數(shù)的自然波動也會影響論文排名。

因而,研究者預(yù)測,當(dāng)領(lǐng)域足夠大時,變革動力會出現(xiàn)變化。引用最多的論文將根深蒂固,在未來獲得不成比例的引用量。新論文無法通過偏好依附積累引用數(shù),也就不可能成為經(jīng)典。新發(fā)表的論文很少能夠?qū)σ殉尚偷膶W(xué)術(shù)桎梏產(chǎn)生影響。

他們給出了支撐以上預(yù)測的兩個機制。一方面,當(dāng)一個領(lǐng)域短時間內(nèi)發(fā)表了很多論文時,學(xué)者不得不訴諸于啟發(fā)式方法來對該領(lǐng)域進行持續(xù)性的理解。認知超載的評審人和讀者在讀新論文時不考慮里面的新想法,只會將它們與現(xiàn)有的范例論文聯(lián)系起來。不符合現(xiàn)有模式的新想法有極大可能不會被發(fā)表、閱讀或引用。

面對這種變革動力,論文作者不得不牢牢地將他們的工作與知名論文聯(lián)系起來。這些知名論文充當(dāng)起了「知識徽章」,界定了如何理解新工作,不鼓勵他們研究太過新穎且不易于與現(xiàn)有經(jīng)典之作聯(lián)系起來的想法。這樣一來,突破性新想法的產(chǎn)生以及被發(fā)表和廣泛閱讀的概率下降,并且每一篇新論文的發(fā)表也將不成比例地增加高被引論文的引用量。

另一方面,如果新想法的到來速度太快,它們之間的競爭可能會阻礙任何新想法在領(lǐng)域內(nèi)廣為人知和廣泛接受。至于為什么會這樣呢?研究者以某個領(lǐng)域中傳播想法的沙堆模型為例進行解讀。

當(dāng)沙子慢慢落在沙堆上時,一次一粒,等到沙堆運動停止時再落下一粒。隨著時間推移,沙堆達到了無標度臨界狀態(tài),其中一粒沙子都能夠引起整個沙堆區(qū)域的崩塌。但當(dāng)沙子以極快的速度落下時,相鄰的小型崩塌會相互干擾,導(dǎo)致任何一粒沙子都無法觸發(fā)沙堆范圍內(nèi)的位移。這意味著,沙子掉落的速度越快,每個新沙粒能夠影響的區(qū)域就越小。論文也一樣,如果論文出現(xiàn)的速度太快,則任何一篇新論文都無法通過局部擴散和偏好依附成為經(jīng)典。

這兩方面的論點衍生出了六個預(yù)測,其中兩個分別是最高引的論文將長期處于主導(dǎo)地位以及新發(fā)表論文的徒勞無功和它們自身顛覆性的降低。

總之,相較于一個領(lǐng)域每年發(fā)表的論文很少,當(dāng)該領(lǐng)域每年產(chǎn)出的論文很多時,則將面臨以下六種情況:

  • 新論文將更有可能引用最高引的論文而不是低引用的論文;
  • 每年最高引的論文列表幾乎不會出現(xiàn)變化,導(dǎo)致經(jīng)典論文始終是那些;
  • 一篇新論文成為經(jīng)典之作的概率將下降;
  • 進入高引用論文列表的新論文不會通過循序累積的傳播方式實現(xiàn);
  • 新發(fā)表論文中發(fā)展現(xiàn)有科研想法的比例增加,而顛覆現(xiàn)有想法的比例下降;
  • 一篇新論文成為顛覆性工作的概率降低。

用到了哪些數(shù)據(jù)與方法?

研究者使用 Web of Science 數(shù)據(jù)集,分析了1960 至 2014 年間發(fā)表的論文,共計 90,637,277 篇論文和 1,821,810,360 個引用。Web of Science 將學(xué)術(shù)領(lǐng)域,或者某些情況下大的子領(lǐng)域,劃分為不同的學(xué)科。因此,研究者的分類中共有 241 個學(xué)科,并將它們作為領(lǐng)域級分析的基礎(chǔ)。其中,一篇焦點論文每年從同一主題新發(fā)表論文中收到的被引次數(shù)構(gòu)成了研究者主要的興趣變量。

為了計算 10 個最大的非綜合學(xué)科(non-multidisciplinary)學(xué)科的 1-decay rate(λ),對于每個學(xué)科,研究者以發(fā)表論文數(shù)量的 10 log 劃分年份,截點分別為 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5 和 5.5,并以 field-year 中被引最多的百分位劃分論文年份,截點分別為 1, 2, 3, …, 100。對于每個(發(fā)表論文的記錄數(shù)量)×(引用數(shù)百分位),他們將第二年一篇論文的被引次數(shù)回歸到焦點年份論文的被引次數(shù)。這一回歸的系數(shù)產(chǎn)生 1-λ。

此外,為了計算所有學(xué)科的 1-λ(圖下圖 2D 所示),研究者選取了第 1、2、5、10 和 25 個百分位數(shù)中被引最多的前 100 篇論文。他們通過發(fā)表論文數(shù)量的 base 10 log(截點分別為 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5 和 5.5)對 subject-years 進行分類。對于每個 bin× 選取的百分位,研究者將第二年一篇論文的被引次數(shù)回歸到焦點年份論文的被引次數(shù)。這一回歸的系數(shù)產(chǎn)生 1–λ。

這些預(yù)測得到證實了嗎?

研究者的所有預(yù)測都在 Web of Science 數(shù)據(jù)集的引用模式中得到了證實,具體如下圖 1 至 4 所示。隨著領(lǐng)域變得越來越多,被引次數(shù)最多的論文始終成為主導(dǎo),在引用分布上占據(jù)絕對優(yōu)勢。相比之下,新論文成為高引的可能性降低,并且無法隨時間推移而逐漸累積關(guān)注度。發(fā)表論文往往在發(fā)展現(xiàn)有想法,而不具備顛覆性,也很少能夠產(chǎn)生具有開拓性的新的研究潮流。

具體而言,被引次數(shù)最多的論文在更大的領(lǐng)域獲得了不成比例的更高的引用份額。最大領(lǐng)域引用份額的基尼系數(shù)約為 0.5,如下圖 1A 所示。高引論文不成比例的被引次數(shù)又導(dǎo)致不平等關(guān)注的加劇。

例如,當(dāng)電氣與電子工程領(lǐng)域每年發(fā)表 10,000 篇論文左右時,前 0.1% 和前 1% 高被引論文占了總被引次數(shù)的 1.5% 和 8.6%。當(dāng)該領(lǐng)域每年發(fā)表 50,000 篇論文時,前 0.1% 和前 1% 高被引論文占了總被引次數(shù)的 3.5% 和 11.9%。當(dāng)該領(lǐng)域規(guī)模更大,每年發(fā)表 100,000 篇論文時,前 0.1% 和前 1% 高被引論文占了總被引次數(shù)的 5.7% 和 16.7%。

相比之下,排名最后 50% 的被引最少論文在總被引次數(shù)中所占份額下降,每年發(fā)表 10,000 篇論文時的占比為 43.7%,每年發(fā)表論文達到 50,000 和 100,000 時,這一比例僅略高于 20%。

當(dāng)跨越時間查看領(lǐng)域數(shù)據(jù)時,我們會發(fā)現(xiàn)存在這樣的模式:當(dāng)每年發(fā)表的論文數(shù)量較多時,被引用最多的 top-50 論文之間的排名相關(guān)性增加(圖. 1B)。在隨后幾年斯皮爾曼排名相關(guān)性中,在一個領(lǐng)域中被引用最多的 top-50 列表從發(fā)表 1,000 篇論文時的 0.25 增加到 100,000 篇論文時的 0.74。

圖 1

當(dāng)領(lǐng)域范圍很廣時,被引用最多的論文的被引次數(shù)保持逐年增長,而所有其他論文的被引次數(shù)都會下降。下圖 2 為論文當(dāng)年與上一年被被引次數(shù)的預(yù)測比率。在論文發(fā)表很少的年份,被被引次數(shù)最多的論文的比率明顯低于 1,與被被引次數(shù)較少的論文的比率沒有太大區(qū)別。然而,在發(fā)表論文數(shù)量較多的年份,被被引次數(shù)最多的論文的比率接近 1,明顯高于被被引次數(shù)少的論文。

在非常大的領(lǐng)域年中,發(fā)表了大約 100,000 篇論文,平均而言,被引用最多的論文的被引次數(shù)沒有逐年下降。相比之下,排名在 top 1% 之外的論文,平均每年損失約 17% 的被引次數(shù),而處于 top 5% 及以下的論文則趨向于每年損失 25% 的被引次數(shù)。

圖 2

當(dāng)同一領(lǐng)域同時發(fā)表許多論文時,單篇論文的引用量達到 top 0.1% 的可能性會減少,這種現(xiàn)象在同一年的不同領(lǐng)域或不同年的同一領(lǐng)域都適用,如圖 3A 所示。一般來說,較大領(lǐng)域論文被引用最多,很少是通過局部擴散等過程完成。

圖 3B 顯示了一篇文章進入相關(guān)領(lǐng)域的平均時間(以年為單位),條件是該論文成為該領(lǐng)域中被引次數(shù)最多的論文之一。當(dāng)一個領(lǐng)域很小時,論文會隨著時間的推移緩慢上升到被被引次數(shù)最多的 top 0.1%。我們以 1980 年在小領(lǐng)域(回歸預(yù)測)發(fā)表的論文為例,假如同一領(lǐng)域發(fā)表了 1000 篇論文,想要成為被引用最多的論文,平均需要 9 年時間。相比之下,在最大領(lǐng)域經(jīng)典論文會迅速登上引用榜首,這與學(xué)者通過閱讀他人著作中引用的參考資料發(fā)現(xiàn)新著作的累積過程不一致。同樣的回歸預(yù)測,在每年發(fā)表 100,000 篇論文的大領(lǐng)域中,論文達到引用量 top 0.1% 的時間平均不到一年。

圖 3

同一年發(fā)表的大多數(shù)論文都建立在現(xiàn)有文獻的基礎(chǔ)上,而不是中斷(disrupt)現(xiàn)有文獻(圖 4A)。邏輯擬合預(yù)測顯示,當(dāng)該領(lǐng)域一年發(fā)表 1,000 篇論文時,49% 的論文具有中斷度量(disruption measure) D > 0(相反,51% D < 0)。當(dāng)發(fā)表 10,000 篇論文時,中斷度量比例下降到 27%,發(fā)表 100,000 篇論文時下降到 13%。即使當(dāng) D > 0 時,新發(fā)表論文的中斷度量在更大的領(lǐng)域中也會減弱。圖 4B 顯示了按領(lǐng)域年排列的新論文比例,這些論文在中斷度量的 top-5 百分位中排名。Lowess 估計顯示,具有 top-5 百分位中斷度量的新論文比例從該領(lǐng)域年發(fā)表的 1,000 篇論文時的 8.8% 減少到每年 10,000 篇論文時的 3.6% 和 100,000 篇論文時的 0.6%。

圖 4

 

責(zé)任編輯:張燕妮 來源: 機器之心Pro
相關(guān)推薦

2011-09-30 09:51:04

VXLANLAN虛擬網(wǎng)

2015-03-24 09:17:33

無線傳輸2.5GbE5GbE交換機

2015-01-23 13:28:11

OfficeWindows Pho

2015-11-09 14:04:28

2017-12-21 10:57:09

云服務(wù)云計算碎片化

2023-10-09 22:18:28

Python強制縮進

2018-07-04 10:28:23

審查代碼領(lǐng)導(dǎo)

2021-03-12 10:28:36

996職場數(shù)據(jù)

2023-09-27 15:18:06

人工智能智能建筑

2013-03-29 10:11:59

微軟IDCIT

2022-01-10 08:41:35

Windows 11Windows微軟

2021-09-02 09:07:47

機器人人工智能AI

2018-03-06 06:59:17

2012-05-04 09:54:23

Linux服務(wù)器

2018-02-24 23:19:31

iOSbug蘋果

2019-01-17 09:14:34

2021-06-29 11:49:54

Windows 11AndroidAIoT

2009-05-31 09:17:19

AzurePHPGoogle App

2025-10-15 01:55:00

系統(tǒng)架構(gòu)多屬性

2022-08-19 15:17:44

人工智能大數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號

亚洲成人中文字幕| 国精品产品一区| 久久九九久久九九| 免费看啪啪网站| 91蝌蚪porny九色| 美女日批免费视频| 成+人+亚洲+综合天堂| 亚洲乱码一区二区三区三上悠亚| 激情久久久久| 性做爰过程免费播放| 国产一区二区三区成人欧美日韩在线观看 | 亚洲亚洲人成综合网络| 日av中文字幕| 中文字幕二三区不卡| 黄色一级片视频| 欧美视频一二三区| 亚洲精品中文字幕| 国产不卡精品视男人的天堂| 一区二区三区在线| 一区二区冒白浆视频| 精品大片一区二区| 久久久精品电影| 日本美女一区| 精品视频中文字幕| 天天综合网天天| 91福利在线播放| 成人免费在线观看| 欧美日韩www| 50度灰在线| 在线播放亚洲激情| 国产精品一区二区美女视频免费看| 亚洲最新中文字幕| 国产一区二区三区不卡av| 欧美刺激性大交免费视频| 精品国产乱码一区二区三区 | 成人xvideos免费视频| 日韩欧美自拍| 国产一区精品视频| 免费高清在线一区| 好男人www社区| 亚洲国产aⅴ成人精品无吗| 精品av中文字幕在线毛片| 精品国产乱码久久久久久闺蜜| 污香蕉视频在线观看| 亚洲高清在线观看| 综合欧美精品| 成人av在线亚洲| 国产一区二区美女诱惑| 在线免费av播放| 欧美写真视频网站| 四虎4545www精品视频| 亚洲aⅴ日韩av电影在线观看| 久久九九国产| 91精品无人成人www| 在线不卡一区二区| 高清日韩欧美| 亚洲不卡1区| 午夜视频一区二区三区| 色天使综合视频| 91久久爱成人| 国产精品久久久久久久久搜平片 | 亚洲欧美日韩人成在线播放| 国产在线xxx| 亚洲va码欧洲m码| 中文字幕在线不卡| 中文字幕在线看片| 国产在线播放一区二区| 亚洲欧美日韩综合aⅴ视频| 国产精品13p| 国内精品久久国产| 亚洲天堂免费看| www.综合网.com| 日韩美女一区| 欧美一级欧美一级在线播放| 久久亚洲黄色| 九色91popny| 欧美激情手机在线视频 | 欧美人动与zoxxxx乱| 九色丨蝌蚪丨成人| 成年人免费在线播放| 久久精品在线视频| 高清在线不卡av| 日本国产欧美| 国产www免费| 久久艳片www.17c.com| 激情深爱一区二区| 亚洲免费资源| 深夜福利成人| 亚洲欧美日韩精品久久奇米色影视| 韩国精品久久久| 韩日精品一区| 免费大片在线观看| 国产女精品视频网站免费| 精品一区二区三区中文字幕 | 国产一区二区看久久| 国产传媒在线观看| 人妻av无码专区| 欧美日韩国产二区| 亚洲成人av一区二区| 国产日本精品| 亚洲成人高清| 深夜影院在线观看| 亚洲ai欧洲av| 久久久精品亚洲| 精品国产电影一区| 久久99蜜桃精品| japanese国产精品| 亚洲永久av| 日本一二区视频| 国产成人亚洲综合无码| 国内精品久久久久久影视8| 91麻豆精品国产91久久久久 | 国产在线精品一区免费香蕉| 69堂成人精品免费视频| 2024国产精品| 亚洲黄色高清| 欧美一级全黄| 韩国久久久久久| 青青操在线视频| 亚洲色图 在线视频| 一区二区精品国产| 97久久天天综合色天天综合色hd| 国产亚洲人成a一在线v站| 欧美性大战久久| 亚洲乱码中文字幕综合| 国产69精品一区二区亚洲孕妇| 欧美淫片网站| 欧美18免费视频| 99久久免费精品国产72精品九九| gogo高清在线播放免费| 免费超碰在线| 麻豆传媒在线观看| 国产日韩在线亚洲字幕中文| 日韩小视频网址| 精品久久久av| 欧美激情2020午夜免费观看| 日韩精品免费在线视频| 91精品欧美久久久久久动漫 | 国产二区视频在线观看| 美女被人操视频在线观看| av黄色免费在线| 成全视频全集| 四虎精品成人免费网站| 黄色在线播放| av免费在线一区二区三区| 国产youjizz在线| 欧美成人三区| 亚洲人成在线网站| 欧美高清你懂的| 精品国产导航| 欧美一二区在线观看| 999精品在线| 久久经典综合| aaa国产一区| 亚洲一区二区在线观看视频 | 亚洲欧美日韩一级| 亚洲精品97久久久babes| 亚洲视频tv| 欧美特大特白屁股xxxx| 看亚洲a级一级毛片| 日韩激情一区| 日本午夜一本久久久综合| 久久天天做天天爱综合色| 亚洲成人激情av| 精品国产免费人成电影在线观看四季 | 国产大陆a不卡| 亚洲人成伊人成综合网小说| 在线观看亚洲成人| 亚洲欧美一区二区精品久久久| 久久久久久久影院| 亚洲精品电影在线一区| 成人影院在线观看视频| 18+激情视频在线| 2020最新国产精品| 久久一区二区三区四区五区| 国产欧美综合色| 欧美一区二区大片| 国产精品激情自拍| 免费成人在线视频网站| 成人av黄色| 第一sis亚洲原创| 久久综合网色—综合色88| 欧美伊人久久大香线蕉综合69| 免费不卡在线观看av| 色噜噜一区二区| 岛国最新视频免费在线观看| 国产一区二区| 美腿丝袜在线亚洲一区| 色综合久久综合| 2025国产精品视频| aa在线观看视频| 蜜桃麻豆影像在线观看| 日韩成人精品视频| 91国偷自产一区二区开放时间 | 在线日本中文字幕| 黑丝一区二区| 欧美一区二区精品在线| 欧美日韩在线高清| 免费一二一二在线视频| 免费高清在线视频一区·|