当前位置:首页 > Deepseek最新资讯 > 正文内容

AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美

4周前 (10-10)Deepseek最新资讯145

  IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。

  该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。

  其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正deepseek,每一步都纠正前一步的潜在错误,直至答案收敛稳定。

  TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。

  然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。

  TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。

  TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。原文出处:AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型,感谢原作者,侵权必删!

标签: deepseek

“AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美” 的相关文章

重磅的要来了!斯基拉:利物浦准备1.2亿-1.25亿向纽卡报价伊萨克

重磅的要来了!斯基拉:利物浦准备1.2亿-1.25亿向纽卡报价伊萨克

  斯基拉表示,按照自己昨天的独家消息,伊萨克和利物浦已经达成个人条款。(昨日斯基拉报道利物浦已与纽卡前锋伊萨克就个人条款达成原则性协议,合同期限到2030年,还有延长至2031年的选项,...

国元证券-传媒行业周报:可灵Q2营收超2.5亿,DeepSeek~V3.1 发布

国元证券-传媒行业周报:可灵Q2营收超2.5亿,DeepSeek~V3.1 发布

  周度涨跌情况(2025.8.16-2025.8.22,下同):传媒行业(申万)上涨5.17%,排名行业第6名,同期沪深300涨4.18%,上证指数涨3.49%,深证成指涨4.57%,创...

2025车网互动与信息通信融合发展专题研讨会成功召开

2025车网互动与信息通信融合发展专题研讨会成功召开

  7月25日,由中国能源研究会信息通信专业委员会主办的“2025车网互动与信息通信融合发展专题研讨会”在江苏无锡成功召开。会议通过现场参观、专题报告、专家研讨等形式,围绕车网互动政策支持...

涨停揭秘:浙大网新尾盘直线涨停,AI算力+DeepSeek概念叠加,上轮DS行情

涨停揭秘:浙大网新尾盘直线涨停,AI算力+DeepSeek概念叠加,上轮DS行情

  8月22日,浙大网新尾盘直线涨停,股价报11.95元,涨幅10.04%,成交额突破20亿元,换手率高达17.64%。该股开盘价11.05元,盘中最高触及11.95元,全天振幅9.21%...

DeepSeek预测:罗马VS都灵!红狼主场碾压公牛,苏莱领衔火力全开!

DeepSeek预测:罗马VS都灵!红狼主场碾压公牛,苏莱领衔火力全开!

  2025赛季意甲第3轮即将迎来一场焦点战,罗马坐镇奥林匹克球场迎战都灵。目前罗马以两连胜积6分排名第4,而都灵仅积1分深陷降级区。这场看似实力悬殊的对决,却因意甲特有的保级压力增添悬念...

刚刚,阿里首个超万亿参数新王登基!Qwen3-Max屠榜全SOTA,碾压Deep

刚刚,阿里首个超万亿参数新王登基!Qwen3-Max屠榜全SOTA,碾压Deep

  总的来说,Qwen3-Max-Preview有以下几大亮点:性能更强、知识更广、更擅长对话deepseek、任务处理、指令遵循。   比如,在一个杯子流体模拟中,Ge...