国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大模型推理成本排行榜來(lái)了:賈揚(yáng)清公司效率領(lǐng)跑

人工智能 新聞
風(fēng)投燒完之后,哪些大模型創(chuàng)業(yè)公司會(huì)開(kāi)始盈利?

「大模型的 API 是個(gè)虧本買(mǎi)賣(mài)嗎?」

圖片

隨著大語(yǔ)言模型技術(shù)的逐漸實(shí)用化,越來(lái)越多的科技公司提出了大模型 API 供開(kāi)發(fā)者們使用。但前有 OpenAI「每天燒掉 70 萬(wàn)美元」,我們也有理由懷疑以大模型為基礎(chǔ)的業(yè)務(wù)到底能不能持續(xù)。

本周四,AI 創(chuàng)業(yè)公司 Martian 為我們仔細(xì)盤(pán)算了一下。

圖片

排行榜鏈接:https://leaderboard.withmartian.com/

The LLM Inference Provider Leaderboard 是一個(gè)開(kāi)源的大模型 API 推理產(chǎn)品排行榜。對(duì)于每個(gè)供應(yīng)商的 Mixtral-8x7B 和 Llama-2-70B-Chat 公共端點(diǎn),該榜單對(duì)成本、速率限制、吞吐量和 TTFT 的 P50 和 P90 進(jìn)行了基準(zhǔn)測(cè)試。

雖然互為競(jìng)爭(zhēng)關(guān)系,但 Martian 發(fā)現(xiàn)各家公司提供的大模型服務(wù)之間存在大于 5 倍的成本差異,大于 6 倍的吞吐量,甚至還存在更大的速率限制差異。雖然在不同性能的大模型之間進(jìn)行選擇只是業(yè)務(wù)開(kāi)展的一部分,但選擇不同的 API 對(duì)于獲得最佳性能顯然至關(guān)重要。

在目前的榜單上可見(jiàn),Anyscale 提供的服務(wù)對(duì)于 Llama-2-70B 的中等服務(wù)負(fù)載具有最佳的吞吐量。Together AI 對(duì)于 Llama-2-70B 和 Mixtral-8x7B 的大型服務(wù)負(fù)載具有最佳的 P50 和 P90 吞吐量。

此外,賈揚(yáng)清的 LeptonAI 在短輸入 + 長(zhǎng)輸出提示的小服務(wù)負(fù)載上能夠提供最佳的吞吐量。130 tks/s 的 P50 是所有廠商提供的所有模型產(chǎn)品中可以觀察到的最快吞吐量。

知名 AI 學(xué)者、Lepton AI 創(chuàng)始人賈揚(yáng)清在排行榜放出后第一時(shí)間進(jìn)行了點(diǎn)評(píng),讓我們看看他是如何說(shuō)的。

賈揚(yáng)清首先闡述了人工智能領(lǐng)域行業(yè)現(xiàn)狀,然后肯定了基準(zhǔn)測(cè)試的意義,最后指出 LeptonAI 將幫用戶找到最好的 AI 基礎(chǔ)策略。

1. 大模型 API 正在「燒錢(qián)」

如果模型在高工作負(fù)載基準(zhǔn)測(cè)試中處于領(lǐng)先地位,那么恭喜,它正在「燒錢(qián)」。 

LLM 推理公共 API 的容量就像是經(jīng)營(yíng)一家餐館:有廚師,需要估算客流量。聘請(qǐng)廚師是要花錢(qián)的。延遲和吞吐量可以理解為「你為顧客做飯的速度有多快」。對(duì)于一個(gè)合理的生意,你需要有「合理」數(shù)量的廚師。換句話說(shuō),你希望擁有能夠承載正常流量的容量,而不是在幾秒鐘內(nèi)突然爆發(fā)的流量。流量激增意味著需要等待;反之,「廚師」則會(huì)無(wú)所事事。

在人工智能世界中,GPU 扮演著「廚師」的角色。基準(zhǔn)負(fù)載是突發(fā)的。在低工作負(fù)載下,基準(zhǔn)負(fù)載會(huì)混合到正常的流量中,并且測(cè)量結(jié)果可以準(zhǔn)確表示服務(wù)在當(dāng)前工作負(fù)載下的情況。

高服務(wù)負(fù)載場(chǎng)景則很有趣,因?yàn)闀?huì)帶來(lái)中斷。基準(zhǔn)測(cè)試每天 / 每周僅運(yùn)行幾次,因此不是人們應(yīng)該期望的常規(guī)流量。想象一下,讓 100 個(gè)人涌入當(dāng)?shù)氐牟宛^來(lái)檢查廚師做菜的速度,結(jié)果會(huì)很不錯(cuò)。借用量子物理學(xué)的術(shù)語(yǔ),這被稱為「觀察者效應(yīng)」。干擾越強(qiáng)(即突發(fā)負(fù)載越大),其精度就越低。換句話說(shuō):如果您給某個(gè)服務(wù)突然提供高負(fù)載,并發(fā)現(xiàn)該服務(wù)響應(yīng)速度非常快,那么您就知道該服務(wù)有相當(dāng)多的閑置容量。作為投資者,看到這種情況,你應(yīng)該質(zhì)問(wèn):這種燒錢(qián)的方式負(fù)責(zé)任嗎?

2. 模型最終會(huì)達(dá)到相似的表現(xiàn)

人工智能領(lǐng)域很喜歡競(jìng)爭(zhēng)比賽,這的確很有趣。大家都會(huì)很快收斂到相同的解決方案,并且,由于 GPU 的原因,英偉達(dá)總是最終的贏家。這要?dú)w功于偉大的開(kāi)源項(xiàng)目,vLLM 就是一個(gè)很好的例子。這意味著,作為提供商,如果您的模型性能比其他模型差很多,您可以通過(guò)查看開(kāi)源解決方案并應(yīng)用良好的工程來(lái)輕松趕上。

3.「作為客戶,我不關(guān)心提供商的成本」

對(duì)于人工智能應(yīng)用程序構(gòu)建者來(lái)說(shuō),我們很幸運(yùn):總是有 API 提供商愿意「燒錢(qián)」。AI 行業(yè)正在燒錢(qián)來(lái)獲得流量,下一步才是擔(dān)心利潤(rùn)。

基準(zhǔn)測(cè)試是一項(xiàng)乏味且容易出錯(cuò)的工作。無(wú)論好壞,通常都會(huì)發(fā)生成功者贊揚(yáng)你而失敗者指責(zé)你的情況。上一輪卷積神經(jīng)網(wǎng)絡(luò)基準(zhǔn)測(cè)試就是如此。這不是一件容易的事,但基準(zhǔn)測(cè)試將幫助我們?cè)谌斯ぶ悄芑A(chǔ)設(shè)施方面獲得下一個(gè) 10 倍的收益。

基于人工智能框架和云基礎(chǔ)設(shè)施,LeptonAI 將幫用戶找到最好的 AI 基礎(chǔ)策略。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2024-01-24 13:11:00

AI模型

2024-07-19 09:59:31

2020-03-07 22:01:58

編程語(yǔ)言JavaPython

2024-06-19 11:45:34

2024-08-01 14:32:26

2025-10-11 09:06:52

2013-08-23 09:41:19

2014-11-26 09:40:02

編程語(yǔ)言Ruby

2014-11-26 10:49:32

編程語(yǔ)言

2022-07-05 14:36:48

算法人工智能

2009-04-10 09:06:45

福布斯硬件企業(yè)排行榜

2014-07-30 12:56:56

2025-05-07 08:21:01

2025-02-12 09:20:12

2009-04-10 08:56:42

福布斯軟件企業(yè)排行榜

2025-11-18 09:13:55

2023-09-21 10:30:05

AI開(kāi)源

2023-03-22 13:58:59

離職阿里巴巴

2023-06-02 13:55:57

開(kāi)源AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

91啪亚洲精品| 欧美国产激情二区三区| 中文字幕av一区二区| 国产一级做a爰片久久| 91久久综合| 国内精品久久久久久| 国产丝袜在线观看视频| 99久久精品国产一区| 精品1区2区| 国产调教精品| 色播五月激情综合网| 久久69国产一区二区蜜臀| 欧美另类第一页| 色婷婷在线播放| 亚洲一区在线观看免费| av7777777| 久久精品一区二区三区中文字幕| 2023亚洲男人天堂| 久久免费资源| 精品乱人伦一区二区三区| 神马久久久久| 亚洲欧美电影一区二区| 欧美变态另类刺激| 麻豆91在线观看| 欧美久久久久久一卡四| 欧美日韩亚洲一区三区| 国产精品美女主播在线观看纯欲| 风间由美性色一区二区三区四区 | av小次郎在线| 亚洲va在线va天堂| av五月婷婷| 欧美极品少妇xxxxⅹ高跟鞋 | 蜜桃av噜噜一区二区三区| 久久精品亚洲人成影院| 欧美怡春院一区二区三区| 啊啊啊啊啊啊啊视频在线播放| 男人插女人欧美| 成人全视频在线观看在线播放高清 | 黄色成人美女网站| 精品国产1区二区| 9色在线视频| 欧美午夜影院在线视频| а√最新版在线天堂| 精品久久一二三区| 成人mm视频在线观看| 久久久久久久久久国产精品| 国产一二区在线| 国产精品久久久久99| 日韩福利电影在线观看| 亚洲图片都市激情| 久久久久久一区二区| 国产免费色视频| 中文成人av在线| 成视频在线免费观看| 精品播放一区二区| 91成人精品观看| 精品国偷自产国产一区| 免费精品一区| 欧美激情综合色| 亚洲男女自偷自拍| 91人成网站www| 在线看片一区| 最近中文视频在线| 99在线国产| 国产精品―色哟哟| 玖玖精品在线| 男女爽爽爽视频| 国产美女久久久久| 欧美性理论片在线观看片免费| 欧美成人亚洲成人日韩成人| 国产精品亚洲一区二区三区在线| 日本色护士高潮视频在线观看| 欧美区在线播放| re久久精品视频| 日本女优爱爱视频| 国a精品视频大全| 西瓜成人精品人成网站| 日韩av高清| 欧美日韩色一区| 久久精品欧美日韩| 色老头在线一区二区三区| 精品一区二区不卡| 综合久久五月天| 亚洲午夜精品| av三级影院| 国产精品吴梦梦| 日韩国产在线一| 日本一区不卡| 成人午夜av电影| 交换国产精品视频一区| 色婷婷综合久色| www.综合| 欧美激情视频在线| 91精品电影| 国产一区二区三区播放| 国产午夜精品一区二区三区嫩草| 日本性视频网| 日韩欧美电影一二三| 国产乱码精品一区二区三区亚洲人| 国产69精品久久久久99| 欧美成人tv| 色欲色香天天天综合网www| 一区二区在线看| 美女精品导航| 欧美整片在线观看| 日韩和的一区二区| 开心丁香婷婷深爱五月| 精品伦理精品一区| 免费看久久久| 亚洲精品视频一二三| 亚洲视频小说图片| h片在线观看视频免费免费| 青草热久免费精品视频| 午夜一级在线看亚洲| 四虎4hu新地址入口2023| 欧美卡1卡2卡| 免费看成人人体视频| 欧美日韩一区在线观看视频| 日本一区二区成人在线| a级在线观看| 国产精品盗摄久久久| 国产成人精品网址| 国产精品视频一区二区久久| 欧美成人激情图片网| 日日骚欧美日韩| 一二三区在线视频| 色综合久久悠悠| 国产一区二区免费视频| 黄色免费在线播放| 久久久久中文字幕| 国产麻豆成人传媒免费观看| 成人精品福利| 国产精品欧美风情| 日本一区二区三区在线不卡| 麻豆理论在线观看| 精品综合久久久| 黄色91在线观看| 色愁久久久久久| 男女午夜激情视频| 亚洲欧美在线第一页| 亚洲国产一区二区三区a毛片| 97秋霞电影网| 久久影院中文字幕| 国内精品免费**视频| 成人福利在线观看视频| 91免费视频国产| 亚洲美女区一区| 另类在线视频| 天天操天天爽天天射| 日韩有码片在线观看| 国内久久婷婷综合| 少妇av在线| 欧美日韩无遮挡| 欧美人妇做爰xxxⅹ性高电影| 99久久精品网站| 中文官网资源新版中文第二页在线观看| 美日韩精品免费观看视频| 麻豆精品国产传媒mv男同| 操你啦在线视频| 明星裸体视频一区二区| 日韩一区二区三区在线观看| 亚洲三级国产| 成人区精品一区二区不卡| 久久视频在线观看中文字幕| 欧美色网一区二区| 在线看片欧美| 国产激情小视频在线| 欧美aaaaa喷水| 亚洲精品一区二区精华| 蜜桃av一区二区三区| 手机在线观看av| 国产91视频一区| 国产午夜精品视频免费不卡69堂| 国产一区999| 自拍偷拍亚洲| 成人免费视频77777| 日本一区二区三区四区视频| 一区二区三区在线影院| 日韩精品影视| 国产免费永久在线观看| 国产日韩欧美一区二区三区四区 | 久久草在线视频| 激情综合色综合啪啪开心| 黄在线观看网站| 欧美韩国理论所午夜片917电影| 99riav一区二区三区| 午夜日韩影院| 国产剧情演绎av| 不卡一区二区三区四区五区| 欧美精品粉嫩高潮一区二区| 日韩精品成人一区二区三区| 色老太综合网| 缴情综合网五月天| 国产情人节一区| 欧美三级日韩三级| 蜜桃一区二区三区四区| www.久久久.com| 中文字幕一二三区在线观看| 麻豆av一区二区三区久久| 综合欧美国产视频二区|