Qwen3真香！通義App滿血接入，一手實測在此

作者：量子位 2025-04-30 14:12:36

人工智能

官方強調(diào)了新模型在Agent、編碼方面的能力提升，還增強了對MCP的支持。具體表現(xiàn)如何，我們直接在通義App里全方位實測。

開源大模型新王者，正在受到空前關(guān)注。

Qwen3預(yù)告一出，直接開啟不眠夜模式。

△來自編輯部本部

等到深夜正式上線并宣布登頂全球最強開源模型，更是瞬間引爆全網(wǎng)熱議。

圖片

網(wǎng)友們的反應(yīng)在meme中盡數(shù)體現(xiàn)（doge）。

圖片

畢竟，單看紙面參數(shù)，Qwen3就是個妥妥的大工程：

8款混合推理模型全部開源，參數(shù)量從0.6B到235B全面覆蓋；
32B模型就有超越OpenAI o1、DeepSeek R1的性能表現(xiàn)，在編程基準(zhǔn)測評中還超過了風(fēng)頭正盛的Gemini 2.5 Pro；
支持思考和非思考模式，支持119種語言和方言、加強對MCP支持……

還有網(wǎng)友認為，這是“又一個DeepSeek時刻”。

圖片

這一次模型開源，通義App和網(wǎng)頁版也趕在第一時間滿血上線Qwen3，并且有專屬智能體體驗。

圖片

新王究竟表現(xiàn)如何，我們第一時間深度實測，以見真章。

Qwen3住進App，還能這樣玩兒

打開通義App/通義網(wǎng)頁版首頁，目前有兩種方式可以體驗到Qwen3模型：

直接用輸入框?qū)υ挘ùa/數(shù)學(xué)/翻譯類問題默認調(diào)用Qwen3-235B，其它問題不調(diào)用Qwen3）
選用“千問大模型”智能體（默認使用旗艦版Qwen3-235B-A22B）

BTW，通義網(wǎng)頁版近期上線了新域名tongyi.com，不要走錯。

OK，接下來進入正題。

官方強調(diào)了新模型在Agent、編碼方面的能力提升，還增強了對MCP的支持。具體表現(xiàn)如何，我們直接在通義App里全方位實測。

第一關(guān)：代碼生成

先來個新模型“入門挑戰(zhàn)”——空間內(nèi)彈小球。

這個經(jīng)典測試在考驗?zāi)Ｐ痛a能力的同時，還重點關(guān)注了它對物理世界的理解，幾乎每一個新模型都會被拉出來遛一遛。

提示詞如下（p5.js腳本、25個粒子、圓柱形容器）：

圖片

而第一次接受挑戰(zhàn)的旗艦版Qwen3模型，用時1分鐘，唰唰唰就生成了一百多行代碼：

將上述代碼實際運行一下，結(jié)果be like：

圖片

雖然一眼看去沒有“小球直接沖出圓圈”這樣明顯的錯誤，但也確實缺少3D空間感。

作為對比，我們拉出官方測評圖中，和滿血Qwen3代碼實力最相近的Grok 3模型。

圖片

重復(fù)相同操作，讓Grok 3基于同一提示詞生成代碼，并實際運行：

圖片

二者的區(qū)別相當(dāng)明顯，后者（Grok 3）的空間感肉眼可見更強。

為了進一步探究兩段代碼的差別，我們又直接讓Qwen3“自己找找差距”（doge）。

結(jié)果，它真的很認真地進行了全方位對比，包括渲染模式、容器結(jié)構(gòu)、粒子運動與碰撞測試等等。

最終結(jié)論也用表格進行了呈現(xiàn)，一目了然：

圖片

甚至，基于它提出的改進意見，我們繼續(xù)讓它出了一個新版本。

圖片

實際運行后，這次的結(jié)果已經(jīng)非常符合我們的要求了。

圖片

事實上，深扒Qwen3的思考過程，我們才發(fā)現(xiàn)原來第一版的2D效果是它“深思熟慮”后的選擇。

這里主要考慮到了兼容性問題，所以簡化成了俯視圖來呈現(xiàn)。

圖片

從上面這個簡單測試，我們已經(jīng)能夠窺見Qwen3的程序員素養(yǎng)確實不錯。

接下來難度升級，直接讓它幫打工人設(shè)計一個提醒喝水的電腦端App。

注意，為了能快速在瀏覽器端預(yù)覽生成效果，這里我們采用了“極簡模式”，僅保留最基礎(chǔ)的功能，不涉及使用任何第三方庫。

結(jié)果生成的App有模有樣，還能真實點擊交互。

一旦讓具備工程能力的童鞋們上手，估計能實現(xiàn)更多復(fù)雜效果。

第二關(guān)：邏輯推理

接下來我們考查一下Qwen3的邏輯推理能力。

老規(guī)矩，先上一道經(jīng)典邏輯陷阱題：

農(nóng)夫要把一頭狼、一只羊和一盆菜帶過一條河。河邊只有一艘小船，農(nóng)夫每次只能帶一樣?xùn)|西過河。如果農(nóng)夫不在場時，狼會吃羊，羊會吃菜。如何安排農(nóng)夫的安全過河方案？

在故意關(guān)閉聯(lián)網(wǎng)模式后，Qwen3經(jīng)過一步步推理最終給出了正確答案。

農(nóng)夫應(yīng)按照以下順序操作：
帶羊過河，返回。
帶狼過河，帶回羊。
帶白菜過河，返回。
帶羊過河。
此方案通過7次移動（4次過河，3次返回），確保所有物品安全抵達對岸。

而且從Qwen3的思考過程能夠看到，其思維方式和人類一樣，是通過不斷推翻各種方案來找出可行路徑。

圖片

再來一道超高難度專業(yè)數(shù)學(xué)題。

原題來自今年的普特南數(shù)學(xué)競賽，該競賽號稱最難本科數(shù)學(xué)考試，人類要考6小時，并且所選取的題目據(jù)稱前500名選手均未能完整作答。

而扔給Qwen3后，可以看到整體的思考時間確實明顯變長，最終用時5分38秒給出了正確答案。

p.s. 千問智能體無法直接上傳圖片，最終選擇從App首頁上傳圖片，提取文字后繼續(xù)使用千問智能體作答。

更有趣的是，扒一扒其思考過程，還能看到模型在線表演“崩潰”：

圖片

當(dāng)然，雖然AI的解讀速度和正確率明顯勝于人類，但還是要和同類來比。

在國外網(wǎng)友的測試中，同一道題Grok 3（Think）在約8分鐘內(nèi)找到了解決方案。

所以對比下來，這一局算Qwen3略勝一籌。

圖片

第三關(guān)：多語言能力

另外據(jù)介紹，Qwen3的一大亮點是支持119種語言和方言，被網(wǎng)友戲稱“AI屆多鄰國”（doge）。

別的不說，直接讓它來挑戰(zhàn)一把國內(nèi)專業(yè)譯者的地位試試。

將莎士比亞《哈姆雷特》的經(jīng)典選段丟給它，讓它按照“信達雅”翻譯成中文。

它還知道參考優(yōu)秀譯本，并且注意避免直接抄襲造成侵權(quán)。

圖片

最終生成的結(jié)果如下（左側(cè)），對比我們熟知的朱生豪經(jīng)典譯本（右側(cè)），你覺得AI味兒濃度如何？

圖片

第四關(guān)：賽博閨蜜、shopping比價、寫歌一網(wǎng)打盡

除了以上更側(cè)重模型基礎(chǔ)能力的考查，當(dāng)Qwen3被塞進App后，我們還解鎖了更多玩法。

做旅游規(guī)劃這種就不必多說了，關(guān)鍵還能充當(dāng)“賽博閨蜜”，幫忙選擇更適合發(fā)朋友圈的游客照。

圖片

日常也能用來購物比價，比如分析出當(dāng)下最值得入手的3000元預(yù)算內(nèi)平板。

不僅用表格清晰列出了各品牌的核心參數(shù)，還按照不同需求進行了推薦，一整個造福伸手黨。

此外，最近火上熱搜的“AI寫歌”，我們也用Qwen3嘗試了一把。

五一版·大張偉嗨歌這就新鮮出爐，光看歌詞確實有內(nèi)味兒了：

Okk，以上為我們的全部實測。

小結(jié)一下，通過在通義App使用Qwen3專屬智能體，我們能明顯感受到以下幾點：

Qwen3旗艦?zāi)Ｐ偷纳伤俣确浅？欤w驗很絲滑；
模型擅長推理，能夠解決經(jīng)典邏輯陷阱和復(fù)雜數(shù)學(xué)題；
代碼能力方面，已經(jīng)能夠快速實現(xiàn)一些簡單需求；
由于載體是App，可拓展的玩法很多。

而且，通義App自上個月頁面改版后，整體設(shè)計更簡潔，交互也更加完善了。

開源界的新王者

Qwen3引發(fā)熱議背后，可以看到的是，在開源影響力上，以Qwen為代表的國產(chǎn)大模型，已經(jīng)有超越Llama之勢。

這一點，從reddit LocalLLaMA等開發(fā)者聚集的板塊的最新話題中，亦可見一斑。

圖片

不僅是基準(zhǔn)評測數(shù)據(jù)的紙面超越，實測越多，模型實力究竟幾何就越能被客觀公允地認知。

而如今的開源格局之變，并非一蹴而就。前有DeepSeek，今有Qwen3，背后體現(xiàn)的是來自中國的開源力量一以貫之的努力，和一如既往的“中國速度”。

以Qwen為例：

2024年11月底，開源推理模型QwQ；

2025年春節(jié)檔，連發(fā)Qwen2.5百萬上下文版本、視覺理解模型Qwen2.5-VL，還有超大規(guī)模MoE模型Qwen-2.5 Max；

2025年3月，QwQ-32B以1/10成本比肩DeepSeek-R1；

多模態(tài)方面，還有萬相Wan的持續(xù)開源和迭代……

這還只是短短5個月內(nèi)的進展。

再加上更加開放和商用友好的Apache 2.0協(xié)議，開發(fā)者們的轉(zhuǎn)向，自然在情理之中。

圖片

作為普通用戶，一方面，可以在通義App這樣的官方應(yīng)用上更快感知到滿血模型的能力。

另一方面，也可以期待開源，帶來更多衍生應(yīng)用的可能性。

那么，再次打開傳送門：tongyi.com

如果你探索到了什么新鮮玩法，也歡迎在評論區(qū)跟大家分享~

參考鏈接：
[1]https://x.com/YUEXINWANG61157/status/1917059240360919318
[2]https://x.com/kis/status/1917090589931409750
[3]https://x.com/godofprompt/status/1917147674438255021

責(zé)任編輯：武曉燕來源：量子位

国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看