当前位置:首页 > Deepseek最新资讯 > 正文内容

最新的DeepSeek更新了 有网友对新版R1模型进行了测试

5个月前 (05-29)Deepseek最新资讯565

5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528)。

有网友对新版R1模型进行了测试,并表示Deepseek-R1-0528在竞赛级编程的难度基准LiveCodeBench中的表现几乎与OpenAI的o3模型相当。

社交网络和信息网站City-data.com创始人Lech Mazur在社交媒体上表示,Deepseek-R1-0528在Extended NYT Connections基准测试中比原先的DeepSeek R1有了显著改进,分数从38.6上升到49.8。在Thematic Generation基准测试中,Deepseek-R1-0528也优于DeepSeek R1,分数从1.80变为1.74,该分数越低越好。Thematic Generation基准测试衡量各种大模型如何有效地从一小组正例和反例中推断出一个细分或特定的“主题”(类别/规则),然后在一组具有误导性的候选项中检测出哪一项真正符合该主题。

DeepSeek今年春节期间大火。3月份,DeepSeek V3模型完成小版本升级。新版V3模型借鉴DeepSeek R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任务方面,新版V3模型基于R1的写作水平进行优化,同时提升中长篇文本创作的内容质量。


“最新的DeepSeek更新了 有网友对新版R1模型进行了测试” 的相关文章

脉脉宣布接入DeepSeek-R1,用户数达1.2亿

脉脉宣布接入DeepSeek-R1,用户数达1.2亿

 职场社区平台脉脉宣布已接入DeepSeek-R1模型,旨在进一步优化人岗匹配,提升招聘效率。据悉,今年2月初,脉脉便已经接入DeepSeek-R1模型,并安排了测试部署工作。据悉,目前脉脉已拥有1....

青青们快看过来,“青春来宾”携手DeepSeek让你的青春搭子24小时在线!

青青们快看过来,“青春来宾”携手DeepSeek让你的青春搭子24小时在线!

你的青春小助手来啦!“青春来宾” × DeepSeek亲爱的“青春来宾”粉丝们,重磅消息来啦!从今天开始,团团正式宣布共青团来宾市委员会官方新媒体平台“青春来宾”微信公众号平台正式接入DeepSeek...

DeepSeek定制“春日赏花攻略”,懂的人都在偷偷收藏

DeepSeek定制“春日赏花攻略”,懂的人都在偷偷收藏

“春来正是踏青时,莫负芳菲绰约姿。”眼下,各式春花竞相绽放步入最佳观赏佳期我们请DeepSeek当导游生成了一份3月中旬到5月的春日赏花攻略看看有没有你心仪的目的地华东地区南京梅花山,梅花正盛开,香飘...

DeepSeek-R1使用指南(简版)+1000个DeepSeek神级提示词+3个DeepSeek隐藏玩法等10几份教程指南

DeepSeek-R1使用指南(简版)+1000个DeepSeek神级提示词+3个DeepSeek隐藏玩法等10几份教程指南

 在人工智能飞速发展的当下,DeepSeek 成为不少人工作、学习和生活的得力助手。但对新手来说,初次接触可能会有些摸不着头脑。别担心,今天就为大家带来超详细的 DeepSeek 使用入门攻...

DeepSeek横扫家电圈!暴走三万步,带你看尽AWE最火AI黑科技

DeepSeek横扫家电圈!暴走三万步,带你看尽AWE最火AI黑科技

智东西3月21日报道,昨天,一年一度的中国家电盛会——AWE中国家电及消费电子博览会正式在上海开幕,各路科技巨头纷纷亮出最新家电及消费科技产品,展会现场十分火爆,人头攒动。  从C...

DeepSeek助力数禾科技,探索金融服务新边界

DeepSeek助力数禾科技,探索金融服务新边界

在当今科技飞速发展的时代,人工智能技术正以前所未有的态势重塑着各个行业,金融领域也不例外。从传统的柜台服务到线上便捷的金融交易,从人工审核信贷到智能风控体系,金融服务的模式与效率在AI科技的驱动下不断...