研究機構:DeepSeek 硬體 GPU 支出逾 5 億美元

https://finance.technews.tw/2025/02/01/deepseek-gpu-cost-over-500000000-usd/


不是只有600萬美元而已。
另外,根據別的文章,很多國已經開始調查或限制deepseek了
https://www.cna.com.tw/news/aopl/202501310160.aspx
4
分享 2025-02-01

22 个评论

应该没有五万块H100(五億元只夠幾千塊)

一些媒体的报道应该是有错误

他们训练很早的模型可能用了老的设备, 现在吹的V3和R1是用更多更新的设备

忽悠中国人的扯蛋想撤也来不及了
开源的啊…………自己试试用多少块不就知道了?
>> 应该没有五万块H100 一些媒体的报道应该是有错误他们训练很早的模型可能用了老的设备, 现在吹...


有没有已经不重要了 关键是美国人认定他家有 而且很有可能是通过皮包公司从新加坡买的
既然都是吹牛 那美国任也将计就计倒打一耙 继续严厉制裁就对了
>> 应该没有五万块H100 一些媒体的报道应该是有错误他们训练很早的模型可能用了老的设备, 现在吹...


用多少晶片沒人知道,因為他們不會承認。
>> 开源的啊…………自己试试用多少块不就知道了?


開放的和官方網站的不確定是不是同一個模型
最烦傻逼说deepseek开源了,人家只是开源模型,又不开源训练及数据,怎么验证?
>> 有没有已经不重要了 关键是美国人认定他家有 而且很有可能是通过皮包公司从新加坡买的 既然都是吹...


之前有報導說新加坡走私很多
>> 最烦傻逼说deepseek开源了,人家只是开源模型,又不开源训练及数据,怎么验证?


之前有定義開原必須包含訓練數據,只有模型的例如臉書這種不符合條件。
>> 開放的和官方網站的不確定是不是同一個模型


肯定不完全一样,没有人会把最新版本开源。只要用开源的代码跑起来,然后看看效果就行了。如果效果也很烂,那么就算少用了GPU也没啥意义。
>> 之前有報導說新加坡走私很多


这两天还有阿里巴巴也宣布了比Deepseek 更强大的AI模型 阿里可是购买Nvda 芯片的大户 虽然都不是被禁运的高端芯片 这5万片的故事有可能也是宣传战 反正你中国人自己不可能辟谣也不能明说 继续严厉制裁才是美国人真目的 小道消息这轮可能连H800 H20都要禁了 这波春节AI模型大跃进不知道是谁搬了石头砸自己的脚了
>> 这两天还有阿里巴巴也宣布了比Deepseek 更强大的AI模型 阿里可是购买Nvda 芯片的大...


是的, 很像是假消息

不过几千块是可以做到的

阿里巴巴刚公布那个有>200B的参数, 几乎没啥人会去测试
好似吉利的那些劳斯莱斯复制品, 怎么吹别人没开过也没法评价
倒不如deepseek这么容易就被找出漏洞
>> 这两天还有阿里巴巴也宣布了比Deepseek 更强大的AI模型 阿里可是购买Nvda 芯片的大...


具體買多少我們都不知道,繼續觀察。阿里巴巴的模型目前不知道如何,繼續觀察,之前他們模型我印象最深刻的也是言論審查。
>> 肯定不完全一样,没有人会把最新版本开源。只要用开源的代码跑起来,然后看看效果就行了。如果效果也...


我的電腦配置不高,很難實驗,7b的qwen蒸餾版本沒有這麼滿意。
>> 是的, 很像是假消息不过几千块是可以做到的阿里巴巴刚公布那个有>200B的参数, 几乎没啥人会...


阿里巴巴的不是72b嗎?
>> 阿里巴巴的不是72b嗎?

Qwen 2.5 max
>> Qwen 2.5 max


max有多少b?然後之前好像也有max不開原,後來這次的不知道有沒有。
>> 我的電腦配置不高,很難實驗,7b的qwen蒸餾版本沒有這麼滿意。


全球很多机构应该都测试过,你可以去搜搜
>> 全球很多机构应该都测试过,你可以去搜搜


我常常參考lmsys的排行榜
>> 我常常參考lmsys的排行榜


LMSYS很久没更新了吧?
>> LMSYS很久没更新了吧?


有推薦的嗎?
>> 有推薦的嗎?


没有。我从各种信息综合起来自己判断
>> 没有。我从各种信息综合起来自己判断


最近不同的ai愈來愈多,平均每星期都會有驚喜,而且是那種超越一個上星期我覺得不錯的模型的那種。

要发言请先登录注册

要发言请先登录注册