当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

12小时前Deepseek应用场景34

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

嘉环科技:推出易嘉云™DeepSeek训推一体机

嘉环科技:推出易嘉云™DeepSeek训推一体机

证券之星消息,嘉环科技(603206)07月09日在投资者关系平台上答复投资者关心的问题。投资者提问:董秘,你好!贵司有服务器硬件产品来适配deepseek吗?嘉环科技回复:尊敬的投资者您好,公司推出...

深耕DeepSeek领域 引领行业智能化变革

深耕DeepSeek领域 引领行业智能化变革

在“东数西算”工程与东北全面振兴战略的交汇点上,辽宁电信以DeepSeek人工智能技术为支点,构建起“智算筑基—场景突破—生态聚合”的创新发展体系,成为东北地区AI产业升级的关键推动者。生态辐射构建东...

第十一届上交会推出 “上交会智慧体”,全面接入 deepseek,将于6月11日至13日举办

第十一届上交会推出 “上交会智慧体”,全面接入 deepseek,将于6月11日至13日举办

推出全面接入deepseek的“上交会智慧体”、首次设立消费与商业科技展区、3场主题日活动和近60场配套活动……6月5日上午,市政府新闻办举行新闻发布会,介绍第十一届中国(上海)国际技术进出口交易会的...

腾讯宣布多业务全面接入更新版DeepSeek R1

腾讯宣布多业务全面接入更新版DeepSeek R1

新京报贝壳财经讯(记者罗亦丹)5月29日,腾讯旗下腾讯元宝、ima、搜狗输入法、QQ浏览器、腾讯文档、腾讯地图、腾讯乐享等多款AI应用宣布接入DeepSeek R1-0528,用户在不同产品中,选择D...

独家对话IBM陈旭东:DeepSeek很热,但影响尚未全面到来!丨 科创100人

独家对话IBM陈旭东:DeepSeek很热,但影响尚未全面到来!丨 科创100人

 文 丨 新浪科技 周文猛  “DeepSeek很热,但它对企业的大影响还没全面到来。”  “许多企业拥抱AI,还要补数字化的课。”  “智能体归根结底是一个软件,规模化应用要有信息化基础”  “所有...

福建省闽侯县市场监管局用DeepSeek升级智能政务助力企业开办“零跑动”

福建省闽侯县市场监管局用DeepSeek升级智能政务助力企业开办“零跑动”

中国质量新闻网讯 在数字化浪潮奔涌向前的当下,福建省福州市闽侯县市场监管局积极作为,携手闽侯县政务服务中心与中国电信闽侯公司,借助DeepSeek人工智能大模型,为政务服务装上“智慧引擎”,全力推动政...