国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Qwen3真香!通義App滿血接入,一手實測在此

人工智能
官方強調(diào)了新模型在Agent、編碼方面的能力提升,還增強了對MCP的支持。具體表現(xiàn)如何,我們直接在通義App里全方位實測。

開源大模型新王者,正在受到空前關(guān)注。

Qwen3預(yù)告一出,直接開啟不眠夜模式。

△來自編輯部本部△來自編輯部本部

等到深夜正式上線并宣布登頂全球最強開源模型,更是瞬間引爆全網(wǎng)熱議。

圖片圖片

網(wǎng)友們的反應(yīng)在meme中盡數(shù)體現(xiàn)(doge)。

圖片圖片

畢竟,單看紙面參數(shù),Qwen3就是個妥妥的大工程:

  • 8款混合推理模型全部開源,參數(shù)量從0.6B235B全面覆蓋;
  • 32B模型就有超越OpenAI o1、DeepSeek R1的性能表現(xiàn),在編程基準(zhǔn)測評中還超過了風(fēng)頭正盛的Gemini 2.5 Pro;
  • 支持思考和非思考模式,支持119種語言和方言、加強對MCP支持……

還有網(wǎng)友認為,這是“又一個DeepSeek時刻”。

圖片圖片

這一次模型開源,通義App和網(wǎng)頁版也趕在第一時間滿血上線Qwen3,并且有專屬智能體體驗。

圖片圖片

新王究竟表現(xiàn)如何,我們第一時間深度實測,以見真章。

Qwen3住進App,還能這樣玩兒

打開通義App/通義網(wǎng)頁版首頁,目前有兩種方式可以體驗到Qwen3模型:

  • 直接用輸入框?qū)υ挘ùa/數(shù)學(xué)/翻譯類問題默認調(diào)用Qwen3-235B,其它問題不調(diào)用Qwen3)
  • 選用“千問大模型”智能體(默認使用旗艦版Qwen3-235B-A22B)

BTW,通義網(wǎng)頁版近期上線了新域名tongyi.com,不要走錯。

OK,接下來進入正題。

官方強調(diào)了新模型在Agent、編碼方面的能力提升,還增強了對MCP的支持。具體表現(xiàn)如何,我們直接在通義App里全方位實測。

第一關(guān):代碼生成

先來個新模型“入門挑戰(zhàn)”——空間內(nèi)彈小球。

這個經(jīng)典測試在考驗?zāi)P痛a能力的同時,還重點關(guān)注了它對物理世界的理解,幾乎每一個新模型都會被拉出來遛一遛。

提示詞如下(p5.js腳本、25個粒子、圓柱形容器):

圖片圖片

而第一次接受挑戰(zhàn)的旗艦版Qwen3模型,用時1分鐘,唰唰唰就生成了一百多行代碼:


將上述代碼實際運行一下,結(jié)果be like:

圖片圖片

雖然一眼看去沒有“小球直接沖出圓圈”這樣明顯的錯誤,但也確實缺少3D空間感。

作為對比,我們拉出官方測評圖中,和滿血Qwen3代碼實力最相近的Grok 3模型。

圖片圖片

重復(fù)相同操作,讓Grok 3基于同一提示詞生成代碼,并實際運行:

圖片圖片

二者的區(qū)別相當(dāng)明顯,后者(Grok 3)的空間感肉眼可見更強。

為了進一步探究兩段代碼的差別,我們又直接讓Qwen3“自己找找差距”(doge)。

結(jié)果,它真的很認真地進行了全方位對比,包括渲染模式、容器結(jié)構(gòu)、粒子運動與碰撞測試等等。

最終結(jié)論也用表格進行了呈現(xiàn),一目了然:

圖片圖片

甚至,基于它提出的改進意見,我們繼續(xù)讓它出了一個新版本。

圖片圖片

實際運行后,這次的結(jié)果已經(jīng)非常符合我們的要求了。

圖片圖片

事實上,深扒Qwen3的思考過程,我們才發(fā)現(xiàn)原來第一版的2D效果是它“深思熟慮”后的選擇。

這里主要考慮到了兼容性問題,所以簡化成了俯視圖來呈現(xiàn)。

圖片圖片

從上面這個簡單測試,我們已經(jīng)能夠窺見Qwen3的程序員素養(yǎng)確實不錯。

接下來難度升級,直接讓它幫打工人設(shè)計一個提醒喝水的電腦端App

注意,為了能快速在瀏覽器端預(yù)覽生成效果,這里我們采用了“極簡模式”,僅保留最基礎(chǔ)的功能,不涉及使用任何第三方庫。

結(jié)果生成的App有模有樣,還能真實點擊交互。

一旦讓具備工程能力的童鞋們上手,估計能實現(xiàn)更多復(fù)雜效果。

第二關(guān):邏輯推理

接下來我們考查一下Qwen3的邏輯推理能力。

老規(guī)矩,先上一道經(jīng)典邏輯陷阱題:

農(nóng)夫要把一頭狼、一只羊和一盆菜帶過一條河。河邊只有一艘小船,農(nóng)夫每次只能帶一樣?xùn)|西過河。如果農(nóng)夫不在場時,狼會吃羊,羊會吃菜。如何安排農(nóng)夫的安全過河方案?

故意關(guān)閉聯(lián)網(wǎng)模式后,Qwen3經(jīng)過一步步推理最終給出了正確答案。

農(nóng)夫應(yīng)按照以下順序操作:

  1. 帶羊過河,返回。
  2. 帶狼過河,帶回羊。
  3. 帶白菜過河,返回。
  4. 帶羊過河。

此方案通過7次移動(4次過河,3次返回),確保所有物品安全抵達對岸。

而且從Qwen3的思考過程能夠看到,其思維方式和人類一樣,是通過不斷推翻各種方案來找出可行路徑。

圖片圖片

再來一道超高難度專業(yè)數(shù)學(xué)題。

原題來自今年的普特南數(shù)學(xué)競賽,該競賽號稱最難本科數(shù)學(xué)考試,人類要考6小時,并且所選取的題目據(jù)稱前500名選手均未能完整作答。

而扔給Qwen3后,可以看到整體的思考時間確實明顯變長,最終用時5分38秒給出了正確答案。

p.s. 千問智能體無法直接上傳圖片,最終選擇從App首頁上傳圖片,提取文字后繼續(xù)使用千問智能體作答。

更有趣的是,扒一扒其思考過程,還能看到模型在線表演“崩潰”:

圖片圖片

當(dāng)然,雖然AI的解讀速度和正確率明顯勝于人類,但還是要和同類來比。

在國外網(wǎng)友的測試中,同一道題Grok 3(Think)在約8分鐘內(nèi)找到了解決方案。

所以對比下來,這一局算Qwen3略勝一籌。

圖片圖片

第三關(guān):多語言能力

另外據(jù)介紹,Qwen3的一大亮點是支持119種語言和方言,被網(wǎng)友戲稱“AI屆多鄰國”(doge)。

別的不說,直接讓它來挑戰(zhàn)一把國內(nèi)專業(yè)譯者的地位試試。

將莎士比亞《哈姆雷特》的經(jīng)典選段丟給它,讓它按照“信達雅”翻譯成中文。

它還知道參考優(yōu)秀譯本,并且注意避免直接抄襲造成侵權(quán)。

圖片圖片

最終生成的結(jié)果如下(左側(cè)),對比我們熟知的朱生豪經(jīng)典譯本(右側(cè)),你覺得AI味兒濃度如何?

圖片圖片

第四關(guān):賽博閨蜜、shopping比價、寫歌一網(wǎng)打盡

除了以上更側(cè)重模型基礎(chǔ)能力的考查,當(dāng)Qwen3被塞進App后,我們還解鎖了更多玩法。

做旅游規(guī)劃這種就不必多說了,關(guān)鍵還能充當(dāng)“賽博閨蜜”,幫忙選擇更適合發(fā)朋友圈的游客照。

圖片圖片

日常也能用來購物比價,比如分析出當(dāng)下最值得入手的3000元預(yù)算內(nèi)平板。

不僅用表格清晰列出了各品牌的核心參數(shù),還按照不同需求進行了推薦,一整個造福伸手黨。

此外,最近火上熱搜的“AI寫歌”,我們也用Qwen3嘗試了一把。

五一版·大張偉嗨歌這就新鮮出爐,光看歌詞確實有內(nèi)味兒了:

Okk,以上為我們的全部實測。

小結(jié)一下,通過在通義App使用Qwen3專屬智能體,我們能明顯感受到以下幾點:

  • Qwen3旗艦?zāi)P偷纳伤俣确浅?欤w驗很絲滑;
  • 模型擅長推理,能夠解決經(jīng)典邏輯陷阱和復(fù)雜數(shù)學(xué)題;
  • 代碼能力方面,已經(jīng)能夠快速實現(xiàn)一些簡單需求;
  • 由于載體是App,可拓展的玩法很多。

而且,通義App自上個月頁面改版后,整體設(shè)計更簡潔,交互也更加完善了。

更多網(wǎng)友實測

與此同時,隨著Qwen3模型的爆火,更多網(wǎng)友也第一時間進行了試玩。

有和“空間內(nèi)彈小球”類似效果的頁面設(shè)計:

圖片圖片

還有用阿拉伯語、法語和印地語解釋愛因斯坦相對論的玩法,該博主聲稱:

簡單到連十歲的小孩都能理解。

圖片圖片

當(dāng)然,大家一直尤為鐘愛的小游戲開發(fā)也安排上了:

圖片圖片

開源界的新王者

Qwen3引發(fā)熱議背后,可以看到的是,在開源影響力上,以Qwen為代表的國產(chǎn)大模型,已經(jīng)有超越Llama之勢。

這一點,從reddit LocalLLaMA等開發(fā)者聚集的板塊的最新話題中,亦可見一斑。

圖片圖片

不僅是基準(zhǔn)評測數(shù)據(jù)的紙面超越,實測越多,模型實力究竟幾何就越能被客觀公允地認知。

而如今的開源格局之變,并非一蹴而就。前有DeepSeek,今有Qwen3,背后體現(xiàn)的是來自中國的開源力量一以貫之的努力,和一如既往的“中國速度”

以Qwen為例:

2024年11月底,開源推理模型QwQ;

2025年春節(jié)檔,連發(fā)Qwen2.5百萬上下文版本、視覺理解模型Qwen2.5-VL,還有超大規(guī)模MoE模型Qwen-2.5 Max;

2025年3月,QwQ-32B以1/10成本比肩DeepSeek-R1;

多模態(tài)方面,還有萬相Wan的持續(xù)開源和迭代……

這還只是短短5個月內(nèi)的進展。

再加上更加開放和商用友好的Apache 2.0協(xié)議,開發(fā)者們的轉(zhuǎn)向,自然在情理之中。

圖片圖片

圖片圖片

作為普通用戶,一方面,可以在通義App這樣的官方應(yīng)用上更快感知到滿血模型的能力。

另一方面,也可以期待開源,帶來更多衍生應(yīng)用的可能性。

那么,再次打開傳送門:tongyi.com

如果你探索到了什么新鮮玩法,也歡迎在評論區(qū)跟大家分享~

參考鏈接:
[1]https://x.com/YUEXINWANG61157/status/1917059240360919318
[2]https://x.com/kis/status/1917090589931409750
[3]https://x.com/godofprompt/status/1917147674438255021

責(zé)任編輯:武曉燕 來源: 量子位
相關(guān)推薦

2025-02-19 12:23:52

2025-02-14 09:12:00

2025-05-14 01:00:00

2025-05-21 09:04:38

2023-08-24 21:49:54

人工智能高端算法工程師

2025-11-13 18:35:43

2025-10-16 09:37:11

2025-04-24 09:27:00

2025-03-07 09:02:00

生成AI視頻

2010-09-09 15:21:17

丁磊

2025-05-29 09:07:37

2025-05-08 09:22:14

2024-08-21 13:09:53

2025-08-12 09:18:00

2020-05-22 08:24:21

SQLMySQL數(shù)據(jù)庫

2023-11-10 16:08:23

SQL數(shù)據(jù)庫

2019-12-16 14:04:48

MySQL數(shù)據(jù)庫SQL

2019-10-24 15:23:04

SQL優(yōu)化數(shù)據(jù)庫
點贊
收藏

51CTO技術(shù)棧公眾號

久久久久久com| 国产农村妇女毛片精品久久麻豆| 福利在线导航136| 女女百合国产免费网站| 九九久久精品一区| 亚洲第一福利一区| 免费永久网站黄欧美| 电影亚洲一区| 91黑丝在线| 久久久福利视频| 精品国内自产拍在线观看| 一区二区不卡在线视频 午夜欧美不卡在 | 午夜激情久久久| 日韩黄色小视频| 欧美一区在线观看视频| 四虎在线免费看| 中文字幕色呦呦| 日本视频久久久| 日韩欧美亚洲一区二区| 91免费看视频| 欧美精品aa| 精品美女一区| 伊人中文在线| 可以看毛片的网址| 成人黄色在线免费| 亚洲欧美日本另类| 亚洲一区二区精品3399| 久久精品国产99国产| 国产一区二区精品久| av人人综合网| 99re在线观看视频| 亚洲高清视频一区| 5g国产欧美日韩视频| 99久久精品无码一区二区毛片| 777777777亚洲妇女| 欧美一区二区三区系列电影| 91官网在线观看| 国产精品久久久久久久久免费看| 一本久久综合亚洲鲁鲁五月天 | 国产成人在线一区| 成人三级在线| 欧美天堂一区二区| 91精品国产色综合久久不卡蜜臀 | 秋霞一区二区三区| 性色一区二区三区| 亚洲成人一区在线| 韩国国内大量揄拍精品视频| 国产成人精品视频免费看| av日韩精品| 香蕉视频成人在线观看| 亚洲欧美日韩中文播放| 97欧美精品一区二区三区| 黄色在线免费观看网站| 免费观看日韩av| 精品一区二区电影| 在线看的黄色网址| 午夜精品婷婷| 日韩精品极品在线观看| 一级理论片在线观看| 中文一区在线播放| 亚洲综合免费观看高清完整版| 国产精品爱久久久久久久| 午夜视频国产| 亚洲国产国产亚洲一二三| 亚洲欧美变态国产另类| 99久re热视频精品98| 亚洲黄页在线观看| 日韩av在线免费观看| 91看片淫黄大片91| 黄色片免费在线观看| 一区二区激情| 日韩欧美精品网址| 在线免费观看一区二区三区| 精品女同一区二区三区在线观看| www国产成人| 久久亚洲精品中文字幕冲田杏梨| 少妇免费视频| 日本道精品一区二区三区| 懂色一区二区三区| 激情欧美一区二区三区在线观看| www.日韩系列| 美女少妇一区二区| 久久av一区| 91国内免费在线视频| 成人软件网18免费视频| 国产一区美女| 久久高清视频免费| 久久香蕉视频网站| 欧美激情亚洲| 26uuu精品一区二区在线观看| 国产视频自拍一区| 亚洲国产精品毛片av不卡在线| 久久性色av| 亚洲成av人影院| 亚洲免费在线精品一区| 欧洲grand老妇人| 欧美午夜在线观看| 欧美日韩电影一区二区三区| 精品久久久中文字幕| 成人久久精品视频| 在线欧美亚洲| 亚州成人av在线| 无遮挡爽大片在线观看视频| 五月综合激情日本mⅴ| 在线观看免费网站| 91亚洲国产成人精品一区二三| 91在线在线观看| 91精品秘密在线观看| 久久综合伊人77777| 国产99久久久久久免费看农村| 开心九九激情九九欧美日韩精美视频电影 | 久久成人精品视频| 久久精品成人欧美大片古装| 日韩在线小视频| 成人激情黄色小说| 国产极品尤物在线| 日韩中文字幕91| 欧美大片在线观看一区| 成人网免费看| 在线亚洲自拍| 久久精品小视频| 1024亚洲| 综合亚洲视频| 欧美人狂配大交3d怪物一区| 国产精品最新在线观看| 欧美激情二区| 婷婷丁香激情综合| 中文一区一区三区免费| 一二区成人影院电影网| 97精品久久久午夜一区二区三区| 国产精品视频网| 欧美人xxx| 国产欧美一区二区精品性色| 亚洲激情一区二区三区| 亚洲澳门在线| 欧美大奶子在线| 欧美a级在线观看| 精品成人av一区| 妞干网这里只有精品| blacked蜜桃精品一区| 91 com成人网| 伊人中文字幕在线| 97国产精品videossex| 中文字幕在线乱| 人禽交欧美网站| 亚洲精品久久区二区三区蜜桃臀| 国产精品永久免费| 国内精品视频在线播放| 丰满女人性猛交| 美女少妇一区二区| 日韩动漫在线观看| 日本一区二区黄色| 美国成人av| 激情网站在线| 99热这里有精品| 九一国产精品| 亚洲欧美清纯在线制服| kk眼镜猥琐国模调教系列一区二区 | 久久综合久久综合久久综合| 依依成人综合视频| 51午夜精品国产| 色噜噜久久综合伊人一本| 国产成人a亚洲精品| 欧美裸体网站| 国内外成人免费激情视频| 日韩电影免费| 欧洲一级精品| 日韩精品dvd| 精品在线观看免费| 国产精品三级在线观看| 欧美男人的天堂一二区| 久久视频中文字幕| 91久久精品www人人做人人爽| 亚洲一区三区| av二区三区| 国内小视频在线看| 亚洲精品一区二区三区在线| 伊人蜜桃色噜噜激情综合| 91免费国产视频网站| 在线亚洲一区二区| 久久色免费在线视频| 国产高清精品一区二区| 欧美亚洲国产成人| 日韩三级影院| 精品国产导航| 久久国产精品第一页| 性感美女久久精品| 中文国产亚洲喷潮| 国产91免费视频| 色综合手机在线| 中文字幕在线播放网址| 婷婷亚洲精品| 国产一区二区三区黄视频 | 成人动态视频| 日韩精品一二三四| 亚洲午夜精品一区二区三区他趣| 亚洲人在线视频| 高清国产一区| jizzzz日本| 成人亚洲欧美|