当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek完成7亿美元C轮融资?多位投资人称是假消息

4小时前Deepseek最新资讯11

  8月15日,有消息称,“据企查查消息,DeepSeek已于8月14日完成超过7亿美元的C轮融资,由国家产业投资基金领投,多家顶级风险资本、科技巨头投资部门以及主权财富基金等共同参与。本轮融资后,DeepSeek估值突破80亿美元。”

  消息传出后快速在圈内发酵,搜狐科技随即向企查查方面求证,相关负责人表示,“消息来源不明,官方网页中相关资讯消息为机器自动抓取,已做删除处理。”

  另有多位投资人向搜狐科技表示“投资圈普遍认为是假消息,投资参与者信息模糊。且DeepSeek此前并未有融资,直接进入C轮很蹊跷。”

  其中,一名业内人士向搜狐科技展示了一则对话,对话中一名疑似DeepSeek人士调侃道,“(是)企查查帮我们融的,不是我们融的。”

  另有业内人士向搜狐科技直言,“他们(DeepSeek)这个身位,肯定是不会要财务投资人钱的。国家给了非常多资助和支持。像王坚院士领导的之江实验室,提供了几十亿的算力支持,基本是倾囊相助。”

  搜狐科技向DeepSeek致电求证,DeepSeek相关工作人员表示来电提问已登记,暂不知情。截止发稿,搜狐科技尚未收到回复。

  两年前,梁文锋决定下场做大模型后接受媒体采访时表示,当时有找不同出资方谈融资,但接触下来,感觉很多VC对做研究有顾虑,他们有退出需求,希望尽快做出产品商业化。

  “按照我们优先做研究的思路,很难从VC那里获得融资。”梁文锋表示,幻方作为出资人之一,有充足的研发预算,另外每年有几个亿的捐款预算,如果需要也可以进行调整。

  今年春节,DeepSeek爆火后,整个投资圈传出VC错过DeepSeek的说法,和DeepSeek北京公司同在一栋楼的百度风投曾就因此面临过质疑。

  随后不少投资人都尝试和梁文锋进行接触,希望参与融资。此前表态坚决不投大模型的金沙江创投管理合伙人朱啸虎甚至也转变态度称,“我肯定会投,价格已经不太重要了,关键是参与在这里面”deepseek

  当时有媒体报道称,腾讯和阿里等科技公司高管与梁文锋会面,探讨潜在的合作机会,但梁文锋表示现在并不急于融资,因为担心外部投资者会干预公司决策。

  后来,市场有消息传出阿里将以100亿美元的估值注资DeepSeek,从而获取其10%的股份。但随后,阿里副总裁颜乔对此进行了否认,阿里公关团队也同步发表了否认声明。但当时有消息称,DeepSeek正与投资人接触,估值是80亿美元。

  此前,DeepSeek还放出了多个财务相关岗位,涉及CFO、COO、财务副总裁、财务总监等,引发市场对DeepSeek开放融资的猜测。不过,有业内知名投资人对此表示不清楚。

  《新财富》杂志发布的创富榜显示,梁文锋以1846亿元财富首次上榜即闯入前十,而彭博调研给予DeepSeek约300亿美元估值预期。

  自DeepSeek成为国产“AI黑马”,凭低成本比肩海外顶尖模型以来,AI圈始终对其保持高度关注。

  然而,DeepSeek新模型发布一再“跳票”,相较于外媒《路透社》最早披露的5月初发布计划,R2的亮相迄今已推迟近百天。

  究竟是什么原因,在海外OpenAI、Google等一众大厂发起猛攻时,DeepSeek却保持了“沉默”?

  有媒体报道援引三位知情人士的话称,“DeepSeek-R2的训练遭遇了故障,导致模型发布延迟。”据报道,DeepSeek被迫改回使用英伟达芯片进行训练。

  报道表示,“DeepSeek开始的选择是依赖于国产芯片进行模型训练。但这一举措很快遇到了问题,包括性能不稳定、芯片间连接速度较慢,以及软件工具包的局限性。”

  据知情人士介绍,“对接的芯片公司已派遣一个工程师团队前往DeepSeek的数据中心,试图解决训练问题。”

  从业内普遍讨论来看,DeepSeek选择国产芯片,一方面原因是力争实现国产芯片加入大模型实战的重要突破,而另一方面与美国对英伟达H20芯片出口的新一轮升级管制脱不开关系。

  据SemiAnalysis公开信息显示,R1使用芯片量包括3万张H20,1万张H800,以及1万张H100。R2若进行全面部署,对算力的需求只增不减。然而受限于美国芯片的出口管制,让DeepSeek“巧妇难为无米之炊”。

  浙江大学计算机学院智能所和人工智能协同创新中心的百人计划研究员王则可认为,“H20主要针对推理场景优化。虽然大模型训练和部署主要依赖于H100等高端卡,但H20的短缺会对大模型的推理能力造成直接影响。”

  据知名投行摩根士丹利近期发布的研报透露,新模型R2将采用混合MoE架构,主打编程、多语言推理、及多模态能力。总参数量从R1的6710亿直接飙升到了1.2万亿,活跃参数也从之前的370亿涨至780亿。

  这意味着,R2每次思考时,会调用多一倍数量的“脑细胞”来处理问题,思考的深度和质量都会发生质的变化。同时按DeepSeek风格,依然在追求低成本实现。

  该研报分析,R2的输入成本,将达到每百万Token仅需0.07美元(R1是0.15美元);输出成本,将达到每百万Token仅需0.27美元(R1是2.19美元)。

  据The Tech Basic报道,“R2在内部基准测试中的表现并未对R1形成全面碾压,尤其在编程、推理等关键指标项上能力提升有限。”CEO梁文锋坚称,“达不到标准,就不发布。”

  美国杜克大学电气与计算机工程专业的杰出教授陈怡然向搜狐科技表示,“不清楚梁文锋具体为什么不满意,但R2肯定是要与这些顶尖模型进行对标的,不说超越但至少不能差太远,可以理解DeepSeek会对发布比较谨慎。”

  据私募排排网数据,2018年之前,幻方量化的规模只有几十亿,此后逐步形成“北九坤、南幻方”的市场格局,2019年成长为百亿私募,2021年更是成为首家突破千亿资产规模的量化投资机构,但随后因业绩回撤缩水至2024年的约450亿元。

  这背后则主要是幻方量化的盈利波动导致。公开数据显示,在2024年百亿私募业绩排名中,幻方以12.18%的收益率均值和13.02%的中位数位列第19名,勉强跻身TOP20,远落后于头部机构,如东方港湾高达60.59%的收益。

  同时,幻方旗下基金盈利差距显著。据同花顺数据显示,该公司截至去年底共有65只基金公开披露净值,其中有29只基金年内涨幅超过10%,其余基金年内下跌,最大跌幅超6%。

  今年上半年,幻方旗下11只产品平均收益为24.75%,继续稳居百亿量化前列。来自量化投资与机器学习的数据显示,目前幻方和衍复、明汯、九坤以600亿元至700亿元区间的管理规模成为新的量化四大天王。

  SemiAnalysis早期发布的一份报告估计,DeepSeek总服务器资本支出约为13亿美元,其中仅集群运营成本就高达7.15亿美元。

  同时,该机构提到,DeepSeek的团队规模超百人,且扩张速度极快,而薪资水平也远超中国其他科技公司,为顶尖研究人员开出了超过百万美元的年薪。

  随着对R2等大模型的持续投入,包括算力等基础设施、人才招揽等,DeepSeek的资金需求恐也将持续增长。原文出处:DeepSeek完成7亿美元C轮融资?多位投资人称是假消息,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek完成7亿美元C轮融资?多位投资人称是假消息” 的相关文章

数字赋能 智绘普法 ——以“3C工作法”打造汕头烟草普法数字人项目

数字赋能 智绘普法 ——以“3C工作法”打造汕头烟草普法数字人项目

  汕头市烟草专卖局创新 “3C 普法工作法”,以数字人技术为核心,融合多模态 AI、法律知识图谱及 AR/VR 技术,打造潮汕文化特色普法体系。全场景覆盖(Comprehensive)形...

美的空调新品发布:以科技之力,打造理想的全屋空气

美的空调新品发布:以科技之力,打造理想的全屋空气

  盛夏酷暑,高温天气持续,当人们回到家中,迎接他们的往往是如同蒸笼般的闷热环境。传统制冷方式在应对现代家庭对舒适度日益增长的需求时,已显得力不从心。如何让夏天更舒适,成为了亟待解决的难题...

海能达:“情指行一体化实战平台”已深度融合国产大模型DeepSeek

海能达:“情指行一体化实战平台”已深度融合国产大模型DeepSeek

  证券日报网讯 海能达8月8日在互动平台回答投资者提问时表示,公司“情指行一体化实战平台”已深度融合国产大模型DeepSeekdeepseek,进一步强化平台的智能决策能力,为公安实战指...

即将截止!最新版《清单计价标准》解读与Deepseek新技术在造价全流程应用实务

即将截止!最新版《清单计价标准》解读与Deepseek新技术在造价全流程应用实务

  2024年12月30日住建部正式发布《建设工程工程量清单计价标准》GB/T50500-2024,新版《清单计价标准》的出台将为工程造价精细化管理带来一场新的革命,同时也给各单位相关管理...

海因克斯:期待一名客观、公平、判罚准确的裁判,让球员决定比赛而不是裁判

海因克斯:期待一名客观、公平、判罚准确的裁判,让球员决定比赛而不是裁判

  在皇马论坛App说皇马的底裤历史,必被删,整个就一暗黑团队,能做到一直靠裁判拿成绩还垄断话语权   在皇马论坛App说皇马的底裤历史,必被删,整个就一暗黑团队,能做到...

deepseek公布大语言模型部署方法专利

deepseek公布大语言模型部署方法专利

  天眼查App显示,近日,deepseek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种大语言模型的部署方法及系统”专利公布。   摘要显示,该发明涉及人...