国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

DeepSeek 入駐 Cursor —— 表現能否超越 Claude?

人工智能
Cursor 平臺不斷引入新模型,總能給開發者帶來新的驚喜。盡管這兩項測試任務較為簡單,但足以展示 DeepSeek 模型在實際場景中的表現,與 Claude 3.5 Sonnet 相比,各有優劣。

DeepSeek 剛剛在 Cursor 平臺上線了它的兩款模型:DeepSeek V3 和 R1。目前,許多開發者(包括我們在內)主要依賴 Claude 3.5 Sonnet(最新版本 claude-3-5-sonnet-20241022)作為主要語言模型,因此我們決定對這幾款新模型進行實戰對比。

關于 DeepSeek

DeepSeek 最近因開源了其備受矚目的 R1 模型而登上新聞頭條,該模型的各項性能指標與 OpenAI 的 o1 相比毫不遜色,絕非易事。官方公布的編程相關基準測試數據也顯示,大多數情況下它的表現有望超越 Claude 3.5 Sonnet 和 GPT-4o。Cursor 一貫動作迅速,新模型上架后,大家就迫不及待地開展了實際應用測試。

對比基準
DeepSeek R1 與 V3 的性能數據(由 DeepSeek 發布)與 OpenAI 的 o1 和 o1-mini 進行對比。

測試任務概述

此次測試分為兩個主要部分:

  1. 聊天模式 —— 討論如何在 Next.js 應用中為對話框添加服務端操作;
  2. 代碼生成模式 —— 修改一個 CircleCI 配置文件,移除前端部署相關內容以及不再需要的 E2E 測試步驟。

需要說明的是,目前代理模式只對 Anthropic 模型和 GPT-4o 開放,因此這里不涉及該部分測試。

聊天模式

任務描述

問題要求說明如何在 Next.js 應用中,為一個對話框組件正確添加服務端操作。具體提示如下:

“如何實現一個服務端操作,并將其正確傳遞給這個對話框?”

同時,我們還附上了包含對話框組件的相關文件作為上下文。

DeepSeek R1 的表現

從媒體關注度來看,R1 自然成為首選測試對象。使用 R1 時,很快發現兩個問題:

  1. 輸出流式傳輸速度較慢
    R1 在輸出時顯得不夠敏捷,等待時間較長。
  2. 回答開頭帶有較大的 <think>
    雖然這個預處理塊如果能提升最終答案的質量,我們并不介意,但它與緩慢的流式輸出疊加,明顯延遲了實際回答的呈現。例如,它在回答一開始就輸出了一大段 <think> 內容,再加上緩慢的流式傳輸,整個過程耗時較長。理論上,通過設置 Cursor 規則來跳過這部分內容是可以解決的,但此處我們測試的是默認狀態。

此外,R1 的回答中提到需要安裝 next-safe-action/hooks 來解決問題,但實際上并未在后續的回答中展示如何使用這個方案。對于這樣簡單的問題來說,僅僅建議安裝額外的包顯得有些大材小用。

DeepSeek V3 的表現

V3 的表現也不俗,甚至推薦使用 React 19 的新特性 useFormStatus,這表明它對較新的代碼庫有一定的學習。不過,它在實現上有一個致命問題:直接在客戶端組件中調用了創建的服務端操作,而在 Next.js 中,這種寫法是不可行的。比如,如果直接在客戶端調用服務端代碼,可能會導致頁面報錯或無法正常運行。
另外,V3 同樣在輸出流式傳輸上顯得較慢,但由于它沒有 R1 那樣的冗長 <think> 塊,總體體驗稍微好一些。

Claude 3.5 Sonnet 的表現

Claude 3.5 Sonnet 的響應速度最快,即便在“慢請求模式”下(例如當每月超過 500 次付費請求時)。雖然它沒有采用最新的 React 特性(例如 useFormStatus),并且同樣直接在客戶端組件中調用服務端操作,但它給出的解決方案更接近實際可用的答案。只需在服務端操作中加上 use server 聲明,就能滿足 Next.js 的要求。

代碼生成模式

任務描述

在這部分測試中,我們提供了一個用于部署全棧應用的 CircleCI 配置文件。該應用擁有一個純 React 前端和一個 Node.js 后端。部署流程中包含多個步驟,需要同時完成以下兩點:

  1. 移除所有與前端部署相關的部分;
  2. 識別出既然只有后端存在,E2E 測試(使用 Cypress)也不再必要,并將其相關步驟一并去除。

提示內容明確指出“移除所有與前端部署相關的部分”,同時配置文件作為上下文也一并提供。

DeepSeek R1 的表現

對于 Composer 任務,我們原本期待帶有 <think> 塊的 R1 能在處理多個部分變動時表現更為出色。然而實際情況并不理想:

  • R1 遺漏了幾處明顯與前端部署相關的內容(例如提及構建 webapp 的引用),但它正確識別出不再需要 deploy-netlify 這一步驟,這部分表現值得肯定;
  • 同時,R1 移除了標記為 deploy_production_api 的后端部署步驟,但未能發現 E2E 測試已無意義這一問題。

DeepSeek V3 的表現

V3 在 Composer 任務上比 R1稍有優勢,它修正了一些 R1 遺漏的問題,但同時也暴露出自己的不足——例如保留了 deploy-netlify 的步驟。值得一提的是,V3 在保持后端部署步驟完整方面表現不錯,但同樣未能判斷出 E2E 測試部分可以刪除。

Claude 3.5 Sonnet 的表現

老牌的 Sonnet 在這項任務中表現最佳:

  • 它成功移除了大部分與前端部署相關的命令,雖然也未能刪除 deploy-netlify 步驟;
  • 在后端部署步驟方面,Sonnet 同樣保持了完整;
  • 最關鍵的是,Sonnet 精準識別出由于只剩后端,E2E 測試完全沒必要,并將包括 Cypress 二進制緩存等所有相關部分一并移除。這一點無疑是最佳解決方案的體現。

總結

Cursor 平臺不斷引入新模型,總能給開發者帶來新的驚喜。盡管這兩項測試任務較為簡單,但足以展示 DeepSeek 模型在實際場景中的表現,與 Claude 3.5 Sonnet 相比,各有優劣。

綜合來看,無論是在響應速度還是輸出質量上,Claude 3.5 Sonnet 均顯著領先于 DeepSeek 的兩款模型。雖然未來響應速度方面可能會因服務器分布等因素得到改善,但就目前的實際測試結果來看,Sonnet 在實用性上依然穩居首位。

責任編輯:武曉燕 來源: 大遷世界
相關推薦

2025-04-01 07:00:00

DeepSeekAI人工智能

2025-07-01 09:08:00

2024-11-25 12:50:14

2024-12-26 14:42:23

2025-06-17 17:14:01

DeepSeekSOTA開源

2025-05-30 07:40:56

2015-04-03 09:07:10

JavaScriptWindows

2024-12-27 09:50:00

模型數據測試

2012-01-10 10:24:24

UbuntuLinux 3.2

2011-07-14 10:15:42

MozillaFirefox蘋果

2023-04-28 17:24:02

2024-12-26 17:13:17

AI模型訓練

2011-11-18 15:01:32

筆記本評測

2011-12-19 09:13:59

斐訊百聯E城

2025-01-27 12:04:37

2016-07-05 14:32:55

IT

2011-12-13 09:52:41

Windows 8開源軟件

2025-10-30 16:23:47

Cursor 2.0人工智能智能體

2025-01-03 09:27:14

點贊
收藏

51CTO技術棧公眾號

国产成人精品一区二区免费看京| 久久综合成人| av免费不卡| 国产中文在线| 一区二区三区不卡在线视频| 97在线观看| 午夜dv内射一区二区| 一区二区三区四区免费观看| 日韩三级电影网站| 精品无人区一区二区三区竹菊| 91视频88av| 国产精品网站大全| 国产精品久久久久久久av大片| 26uuu国产精品视频| 97免费视频在线| 久久久女人电视剧免费播放下载| 国产一区二区三区直播精品电影| 精品国精品国产尤物美女| 日韩午夜在线观看视频| 欧美一级在线观看| 日韩欧美一级二级| 欧美一级一级性生活免费录像| 欧美美女激情18p| 欧美日韩激情一区二区| 欧美精品在线一区二区三区| 欧美午夜精品一区二区蜜桃| 欧美日韩在线一区二区| 欧美浪妇xxxx高跟鞋交| 7777精品伊人久久久大香线蕉超级流畅 | 色综合久久av| 视频在线观看成人| 亚洲高清视频在线观看| 久久精品国产精品亚洲精品色| 影音先锋亚洲视频| 日韩一级特黄毛片| 97视频久久久| 男女无套免费视频网站动漫| 成人天堂av| 午夜成在线www| 黄视频在线观看免费| 久操视频在线免费播放| av人人综合网| 韩国精品视频在线观看 | 黄色一级片在线看| 国产一区二区四区| 欧美私人情侣网站| 国产精品99久久99久久久| 在线视频99| 99reav在线| 成年女人在线看片| 外国成人毛片| 亚洲三级精品| 欧美+日本+国产+在线a∨观看| 99国内精品| 国产尤物一区二区| 久久婷婷综合激情| 一区二区不卡在线播放 | 日本成人7777| 欧美另类极品videosbest最新版本 | 丝瓜av网站精品一区二区| 欧美亚洲一区二区三区四区| 国产精品久久一区主播| 神马久久高清| 欧美成人69av| 精品国产在天天线2019| 国产乱人伦精品一区二区三区| 亚洲精品tv| 一区二区三区在线高清| 91久久爱成人| 蜜桃av在线免费观看| 性8sex亚洲区入口| 亚洲加勒比久久88色综合| 欧美精品久久96人妻无码| 亚洲妇女成熟| 不卡的av电影| 国产精品吊钟奶在线| 久草在线青青草| 99久久国产综合精品成人影院| 欧美mv和日韩mv国产网站| 99热都是精品| 日韩理论电影中文字幕| 中文字幕日韩一区| 国产成人精品在线观看| 日本aⅴ写真网站免费| 国产一区亚洲| 亚洲第一av网| 免费在线观看视频a| 欧美一区二区三区红桃小说| 亚洲国产视频在线| 国产乱子伦精品| 欧美黄页免费| 亚洲欧洲国产专区| 欧美性天天影院| 99综合久久| 欧美视频二区36p| 超碰免费在线公开| 99国产精品免费网站| 欧美一区二区三级| 中文字幕乱码人妻综合二区三区| 国产欧美日韩精品一区二区免费| 欧美日韩亚洲丝袜制服| 欧美日韩成人免费视频| 欧美 日韩 国产精品免费观看| 欧美裸体xxxx极品少妇| 日本免费视频在线观看| 一区二区三区在线免费观看| 日韩免费电影一区二区| 国产免费av一区二区三区| 亚洲图片欧洲图片av| 在线视频尤物| 国产精品乱人伦一区二区| 欧美精品七区| 日韩欧美精品一区| 久久精品这里热有精品| 黑人极品ⅴideos精品欧美棵| 日本韩国精品在线| 欧美黑人经典片免费观看| 欧美日本不卡高清| 欧美国产亚洲精品久久久8v| 黄色漫画在线免费看| 欧美一卡二卡在线观看| 亚在线播放中文视频| 中文字幕精品一区| 欧美中日韩在线| 羞羞答答国产精品www一本| 国产成人一区三区| 亚洲欧美在线成人| 亚洲精品不卡在线| 亚洲第一图区| 欧美一区二区三区性视频| bl视频在线免费观看| 欧美性一区二区| 三级在线视频| 亚洲成av人片一区二区三区| xx免费视频| 一区二区不卡在线播放| 99爱免费视频| 中文字幕中文字幕在线一区| 亚洲资源在线网| 国产一区二区女| 免费国产成人看片在线| 久久精品国产色蜜蜜麻豆| 91麻豆国产福利在线观看宅福利| 777午夜精品电影免费看| 国产精品hd| 日韩精品久久久久久| 男女猛烈激情xx00免费视频| 亚洲激情男女视频| 亚洲国产欧美在线观看| 亚洲综合大片69999| 99精品久久99久久久久| 成人在线播放视频| 亚洲偷欧美偷国内偷| 一本色道久久综合亚洲精品不卡 | 国产淫片在线观看| 日本精品va在线观看| 成人自拍视频在线| 免费资源在线观看| 亚洲人成亚洲人成在线观看| 久久国产成人午夜av影院| 日韩精品卡一| 夜夜爽99久久国产综合精品女不卡 | 777午夜精品免费视频| 九色porny视频在线观看| 久久精品2019中文字幕| 成人知道污网站| 日韩中文字幕一区| 国产亚洲欧美日韩日本| 中国大陆高清aⅴ毛片| 欧美va亚洲va在线观看蝴蝶网| 久久国产小视频| 色哟哟精品视频| 亚洲电影免费观看高清| 日韩有码一区| 无码aⅴ精品一区二区三区浪潮 | 欧美日韩国产成人| 国产精品日韩精品欧美精品| 新片速递亚洲合集欧美合集| 97福利网站在线观看视频| 国产另类第一区| 亚洲黄色免费三级| 国产精品色一区二区三区| 国产99精品一区| 久久午夜夜伦鲁鲁一区二区| 这里只有精品在线播放| 成人黄色a**站在线观看| 亚洲成人看片| 超碰97在线人人| 欧美影院一区二区三区| 午夜电影一区| 女人和拘做爰正片视频| 日韩欧美不卡在线观看视频| 怡红院精品视频在线观看极品| 亚洲免费av一区二区| 欧美激情一区二区三区久久久 | 激情小说 在线视频| 国产91久久婷婷一区二区| 26uuu国产日韩综合| 中文字幕资源网在线观看免费 | 亚洲狼人在线|