当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

9小时前Deepseek应用场景25

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

DeepSeek爆火之后,“卖铲人” 赚得盆满钵满

DeepSeek爆火之后,“卖铲人” 赚得盆满钵满

国产大模型DeepSeek在2024年底的爆红盛况就不再阐述了,彼时市场目光都聚焦在这家新兴AI公司身上。随着大模型私有化部署需求激增,“卖铲人”们(在热门产业或风潮中,通过为相关产业提供设备、工具或...

中公教育携手DeepSeek大模型加速就业服务数字化升级

中公教育携手DeepSeek大模型加速就业服务数字化升级

2025年初,DeepSeek-R1大模型的发布为教育行业带来重大技术革新。中公教育敏锐把握这一机遇,于是完成旗下"云信"垂直大模型与DeepSeek的私有化部署,显著提升了AI在...

中国AI企业崛起挑战美国主导地位,DeepSeek模型全球部署

中国AI企业崛起挑战美国主导地位,DeepSeek模型全球部署

随着中国人工智能企业快速崛起、拓展全球市场,美国在AI领域的主导地位正受到实质性挑战。多家跨国银行与高校开始采用中国初创企业DeepSeek和阿里巴巴等开发的大语言模型作为美国产品的低价替代方案。包括...

青浦“为老服务一键通”融合DeepSeek智能升级,政策查询更快速、更便捷

青浦“为老服务一键通”融合DeepSeek智能升级,政策查询更快速、更便捷

家住青浦区盈浦街道的96岁蔡阿婆腿脚不便,日常行动成了难题。她的女儿李新妹抱着试试看的想法,通过青浦区民政局打造的“为老服务一键通”平台咨询居家照护资源。令她没想到的是,这次求助得到了快速响应——接线...

腾讯元宝更新,接入DeepSeek R1最新版

腾讯元宝更新,接入DeepSeek R1最新版

腾讯元宝再次迎来升级,接入深度思考模型DeepSeek R1-0528最新版,用户可以在电脑版、网页版优先体验,选择DeepSeek模型并开启深度思考,即可免费不限量使用。...

DeepSeek在法律领域有哪些重要应用场景?

DeepSeek在法律领域有哪些重要应用场景?

DeepSeek在法律领域有哪些重要应用场景?<think> 嗯,用户之前问过DeepSeek在科技领域的应用场景,特别是自动驾驶和智能视频方面的应用。现在用户又补充了“法律领域”,让我...