当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网

3个月前 (08-20)Deepseek最新资讯347

  :V3.1在Aider编程基准测试中取得71.6%高分,超越Claude Opus 4,同时推理和响应速度更快。

  这次最明显的变化是,DeepSeek在官方APP和网页端上,把深度思考(R1)中的「R1」去掉了。

  在MMLU多任务语言理解方面,DeepSeek V3.1毫不逊色于GPT-5。不过在,编程、研究生级基准问答、软件工程上,V3.1与之有一定的差距。

  一位网友实测,模拟六边形中小球自由落体的物理测试,DeepSeek V3.1理解力明显提升。

  相当于整本《红楼梦》正文(约80–100万字)的1/6–1/8deepseek,或者一篇超长博士论文/大部头学术专著。

  在128K上下文测试中,DeepSeek-V3.1输出速度相比以往获得较大提升,并且在工程上做了一些优化。

  整个活,给DeepSeek-V3.1上点压力,让它根据「梦」这个字,输出尽可能多的内容,尽量达到上下文极限。原文出处:DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网” 的相关文章

DeepSeek预测:热那亚vs尤文图斯!斑马军团火力全开,伊尔迪兹助攻王领衔屠

DeepSeek预测:热那亚vs尤文图斯!斑马军团火力全开,伊尔迪兹助攻王领衔屠

  作为意甲历史最悠久的俱乐部,热那亚新赛季首轮0-0闷平莱切,目前以1分暂列第11位。而尤文图斯则在图多尔带领下2-0轻取帕尔马,与国米、那不勒斯并列榜首deepseek。这场对决不仅是...

英媒:印度为什么诞生不了Nvidia或DeepSeek?

英媒:印度为什么诞生不了Nvidia或DeepSeek?

  今年,DeepSeek 从默默无闻中崭露头角,其大型语言模型被誉为中国的“斯普尼克号时刻”。它彰显了中国在硬件和软件领域的雄心。   然而,在印度,这一突破既令人沮丧...

AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美

AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美

  IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含...

阿联酋推出低成本AI模型K2 Think,挑战OpenAI与DeepSeek

阿联酋推出低成本AI模型K2 Think,挑战OpenAI与DeepSeek

  一场新的技术竞赛正在上演——阿联酋正式加入人工智能竞赛阵营。阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)6月25日发布了一款低成本推理模型,旨在与DeepSeek和Open...

11月1日DeepSeek预测:掘金vs开拓者,约基奇三双率队客胜

11月1日DeepSeek预测:掘金vs开拓者,约基奇三双率队客胜

  北京时间11月1日上午10点,NBA常规赛将迎来西部焦点战,目前西部第三的丹佛掘金(3胜1负)客场挑战第五的波特兰开拓者(3胜2负)。两支胜率超过60%的球队相遇,胜负将直接影响西部上...

平安证券:DeepSeek-V3.1发布,推动国产大模型应用普及

平安证券:DeepSeek-V3.1发布,推动国产大模型应用普及

  行业要闻及简评:1)DeepSeek-V3.1正式发布,采用全新的UE8M0 FP8 Scale参数精度。8月21日,DeepSeek-V3.1正式发布。通过Post-Training...