当前位置:首页 > DeepSeek技术交流 > 正文内容

“像DeepSeek这样的团队,中国至少还有18个”

5个月前 (04-30)DeepSeek技术交流339

2025年,以DeepSeek为代表的人工智能技术掀起热潮,令国产大模型格局发生巨变。未来人工智能如何进一步发展?中国的人工智能发展之路如何走?

在第八届数字中国建设峰会期间举办的“院士专家行”活动上,中国工程院院士吴志强、陈军、刘韵洁,中国科学院院士童庆禧等围绕上述话题,各抒己见。

生态蓬勃发展

类似DeepSeek的团队还有18个

主持人:DeepSeek对创新发展带来什么启示?

吴志强:我们一直在关注全球的人工智能发展。无论是DeepSeek,还是海外的ChatGPT,都不是一日成长起来的。实际上,像DeepSeek这样的团队,在中国至少有18个和它水平差不多的,只是DeepSeek冒出来了。现在人工智能已经形成蓬勃发展的生态,我们要清楚整个生态体系才能真正引领或者把控局面。

我们在用人工智能技术做城市规划时是“两手推进”。一方面是用通用人工智能大模型,但有两个缺点:一是模型训练时“吃进去”的原料粗糙,二是算力消耗巨大。

另一方面是采用精细的数据来训练模型,吃的都是“精粮”。我们发现,在这种训练模式下,仅用5%-10%的算力,就能完成更加精准的内容输出。这意味着,“精准”和“普遍”两条道路都要走。

陈军:今年DeepSeek出来的时候,大家对中国技术有这样的突破,感到振奋。

DeepSeek确实不错,但你让它作首诗还可以,如果让它做一个专业的“东西”就差很多。所以我认为:

第一,每个领域、每个专业都有很多知识。首先要把知识汇集起来、提炼出来,建成知识库。我们要利用人工智能技术把我们行业的知识好好梳理、总结、应用。

其次,现在的大模型仍是语言大模型,它讲究的是上下文关系、推理关系。但如果要涉及地理信息、城市规划等领域,涉及很多空间信息,比如前后左右、地上地下、室内室外等,所需要的关系结构就变成了三维时空关系。所以要发展“时空大模型”,大模型要从语言模型走向“时空大模型”。

最后,我认为,现在要积极拥抱人工智能,但不要完全单纯地使用人工智能,要把我们的专业智能和机器智能有机结合起来。

刘韵洁:我想谈两点启发:第一,“六小龙”不光只有DeepSeek。各地政府去寻找与“六小龙”一样的人才或者团队,这是不太可能成功的。好的创新环境,对创新宽容的支持度是最重要的。“六小龙”出现在杭州不是偶然,是有必然性的。

第二,DeepSeek的成功说明,任何一个创新的团队,都要勇敢挑战自己从事的领域中最困难的问题。

我判断DeepSeek的成功就是基于问题导向的。只有大算力才能出现大智能?还是可能少用一些算力也能出现更高的智能?我认为它就解决了这个问题。这些给了我启发:哪怕我们现在还处在劣势的一些领域,完全有创新、赶超的机会和可能。

将有AI营养师等新职业

让青年“冒头”

主持人:未来数字中国的建设应该怎么做?我们应该关注些什么、部署些什么、推进些什么?

童庆禧:每天中国大概有将近四五百个遥感卫星在天上转,这意味着,传输下来的数据量甚至能到EB级。对于这些数据而言,如果人工智能大模型不能和遥感空间多维的信息相结合,仅仅聚焦国际上或者国内通用的模型,可能解决不了实际问题。所以,应该针对时空多维信息来发展我们的大模型。

吴志强:我认为要关注两点。一是新的职业训练师。我们在训练人工智能的过程中,越来越深地感受到,怎么训练各行各业特别需要的大模型,以及训练的时候给它什么“料”训练很重要。就像比赛一样,除了运动员,教练团同样重要,这事关最后出的效果好不好。这就意味着未来专门的AI训练师和AI营养师会成为新的职业。

第二点是青年涌现。发展人工智能不是只有国家战略、总体布局、自上而下的,有时候是自下而上的。比如刚才说有一群类似DeepSeek的团队,有很多只是暂时没冒出来而已。

要允许青年冒头。我团队的学生在三年前送给我一个“AI吴志强”,是他们自己“玩”出来的——把我所有写过的、发表的书全部训练后做出来的,非常优秀。这个产品是完全在计划外的,只是一帮学生觉得好玩做的。

在中国人工智能领域的未来发展中,这种“青年涌现”是我们要非常注意的现象。我们的眼睛要看到他们,要鼓励他们,要给他们营养。他们可能“玩”出世界级题目来。

陈军:一方面,还是要打造人工智能的公共产品。比如日常生活中,我们并不知道使用的电是核电、火电,还是水电,只要连上就能用。未来,人工智能也要像这样,并不是形成寡头,或者谁都去做;应该提供一些通用的工具,让各家在这个平台上去完善应用场景。

另一方面,要打造良好的生态。如果我们搞人工智能,搞到最后把我们所做的专业消灭了,把我们的行业消灭了,就是一种罪过,我们不应该走这条路。

我的理解是,人工智能出来后,将来会把很多费力的、危险的工作交给机器去做,人去做知识工程师,总结知识、凝练知识。

当年汽车发明出来的时候,国外有一些人很恐慌,觉得马车夫都没事干,要失业了。最后发现有了加油站、4S店、修理厂、出租车等行业,孵化了一批新职业。

我觉得我们要致力于打造良好的生态,让这个社会更好地发展。要把各行各业的人变成那个行业的知识工程师,让他们去创造知识、加工知识,然后把知识“喂”给机器,让机器帮我们干那些人不愿意干的工作,这样才是一个良好的生态。

原标题:《“像DeepSeek这样的团队,中国至少还有18个”》


““像DeepSeek这样的团队,中国至少还有18个”” 的相关文章

梁文锋署名DeepSeek新论文:公开V3大模型降本方法

梁文锋署名DeepSeek新论文:公开V3大模型降本方法

还有对下一代AI的期待梁文锋亲自参与的DeepSeek最新论文,来了!这一次,团队把DeepSeek-V3在训练和推理过程中,如何解决“硬件瓶颈”的方法公布了出来。具体而言,DeepSeek-V3之所...

DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

【新智元导读】DeepSeek开源周第一天就放大招!FlashMLA强势登场,这是专为英伟达Hopper GPU打造MLA解码内核。注意,DeepSeek训练成本极低的两大关键,一个是MoE,另一个就...

DeepSeek API 的返回值格式是什么?

DeepSeek API 的返回值格式是什么?

DeepSeek API 的返回值格式是什么?DeepSeek API的返回值格式通常是JSON格式。这种格式返回的数据包括生成的文本内容、状态码(用于判断请求是否成功)、错误信息(若请求失败时)等。...

DeepSeek赋能潮起

DeepSeek赋能潮起

新华社北京3月21日电 3月21日,《新华每日电讯》发表题为《DeepSeek赋能潮起》的报道。2025年开年,DeepSeek彻底突破技术圈层,直抵社会大众,成为热议高频词。刚刚结束的全国两会上,人...

山东外国语职业技术大学上线“满血版”DeepSeek

山东外国语职业技术大学上线“满血版”DeepSeek

为主动应对数智时代的教育挑战,深入贯彻落实国家教育数字化战略,积极响应教育部关于人工智能赋能教育的号召,山东外国语职业技术大学成功部署Deepseek大模型。教职员工可通过钉钉-智慧校园-山外Deep...

DeepSeek 使用率暴跌超50%,从爆发转向质变才是正道

DeepSeek 使用率暴跌超50%,从爆发转向质变才是正道

DeepSeek 自春节以来虽快速蹿红,一度被称为中国版 ChatGPT,它的爆发代表着一种行业信号——国产开源大模型驶入实用赛道,但目前其市占率从2月中旬的高峰7%下降至4月底的3%,使用率下降超5...