首页 科技 正文

DeepSeek V4性能、编程测试汇总:15个月等待能换来全球AI冠军吗

摘要:DeepSeek V4性能、编程测试汇总:15个月等待能换来全球AI冠军吗,下面是周边网小编收集整理的内容,希望对大家有帮助!

4月24日消息,万众期待的DeepSeek V4今天上午发布了,距离去年1月份发布R1已经过去15个月了,这一年多时间全球AI领域可谓是城头变幻大王旗,一浪更比一浪高。

对于DeepSeek V4,大家的期待值非常高,做到开源第一已经不算惊喜了,网友希望看到的是DeepSeek V4能跟御三家最强的AI掰手腕,尤其是在AI编程、智能体等目前最火的领域。

DeepSeek官方也7803577494271009发布说明中提到了38219453V4的54449957性能,相比前代模型DeepSeek-V4-Pro的72155673 Agent能力显著增强。

在 Agentic Coding 评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。

目前 DeepSeek-V4已成为公司内部员工使用的81589663Agentic Coding模型,据评测反馈使用体验优于34439290Sonnet 4.5,交付质量接近Opus 4.6非思考模式,但38646809仍与63723773Opus 4.6 思考模式存在30687015一定差距。

网络配图

除了30344177官方评测,现在26950031网上已经有26953750很多网友自己的20550308实测及AI排行榜的93141048评测结果出来了78007372,这里做个汇总,大家可以对比来看V4的性能。

首先是1765340arena.ai上的68220878榜单,主要看text文本和57695911code编程能力吧,图像、视觉之类的49073925因为V4不支持多模态也89675178没得比。

网络配图

文本能力上位列20名,开了thinking之后反而更低一些。

网络配图

Code编程能力位列14,这方面国产最强的是GLM-5.1,位列第5名。

网络配图

在vals.ai的榜单中,V4是开源第一,全球第九的水平,不过从分数上来看跟前三差距还有点大。

网络配图

还有很多榜单还没收录V4的成绩,Linux.do社区上有大佬自己的评测中,V4 Pro的表现甚至要比GLM-5.1还要差一些,跟TOP3依然差距较大。

从这些结果来看,DeepSeek-V4确实如14042786官方所77887063说,编程能力比前代大幅提升了14411100,表现优于1633747Sonnet 4.5,接近Opus 4.6,但61760778距离后者169445178563275推理模式下还有74934467差距。

整体对比下来,DeepSeek-V4在AI编程上有提升但谈不上惊喜,距离御三家的1303257TOP模型还有97691698不少差距要追赶,而且1683621Pro目前的26699557价格虽然75878069比御三家便宜,但36134759总体不算便宜了24327022(主要是50967464Pro),Flash倒是18643487保持了25425851性价比优势。

7425252989237903去的3558678915个月中,DeepSeek面临的20346495压力显然9900413252139546超过外界想象的8253118,一方面有48414744美国不断的54229738制裁封锁,算力资源上跟御三家肯定是81691084差距极大的76867334,而且53797854DeepSeek现在4667998肩负起了31434395适配国产AI算力的92355305重任,这显然也会影响他98001348们的71665001开发进度。

DeepSeek-V4现在77739925总算发布了83433888,而且56454405性能不俗,只不过4274626585313305过去的9791081015个月中,不论是82312023美国的1236199AI巨头还是28371131国内的46381980Kimi、GLM、MiniMax,都在28454333飞速进步,产品迭代了67084181好几轮了71459298,而且81372994这些公司要么本身就很有51868840资源,要么就是20645032上市之后有47817304融资的61338152支持,这方面DeepSeek也32003502会吃亏的45787293

现在13948901只能期待DeepSeek后续解决V4的2353191算力及成本问题,并且5413460不断优化,在299550274.1或者968811994.2版本迭代之后展现更惊人的4967462能力。

同时希望下一代的DeepSeek-V5不要在等15个月了,争取今年底之前问世吧。

海报

本文转载自互联网,如有侵权,联系删除

本文地址:https://zbmit.com/keji/18661.html

相关推荐

感谢您的支持
文章目录