当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek等大模型在证券行业应用及影响研究

15小时前DeepSeek技术交流24

李宁 谢琪 王钟菱1

华福证券有限责任公司

一、前言

在国家战略和行业监管鼓励下,证券行业已在多个业务场景运用大模型技术,但受制于大模型高昂的应用成本、对英伟达算力GPU和研发生态的依赖、算法结果不可解释和较多幻觉问题,证券行业大模型应用暂未大面积推广。随着DeepSeek系列大模型的面世,上述问题得到显著改善DeepSeek大模型计算效能更高、算力开销更小、适配国产算力设备、展示推理思维链和计算性能媲美国际知名大模型同时,DeepSeek大模型的核心技术和开源生态,打破了多项国外封锁和限制。证券行业迎来了深挖大模型价值的历史机遇,也激发了资本市场助力实体经济发展践行金融“五篇大文章的时代担当。

深入调研和挖掘证券行业大模型应用前景、辩证分析DeepSeek等大模型带来的影响,是证券行业把握大模型发展机遇的核心所在。

二、大模型技术发展及商业成熟度现状

(一)大模型技术发展趋势

大模型技术是人工智能技术的重要分支,随着大模型的出现人工智能进入快速发展阶段,见图1。近年来,大模型技术的快速发展主要得益于算法、算力和数据三方面的协同进步。2017年6月谷歌发表的《Attention Is All You Need》首次提出Transformer架构,成为大模型领域的主流算法基础。2018年6月OpenAI推出GPT-1,开启AI大模型的训练热潮。2022年7月清华大学和智谱AI联合推出GLM-130B。同年11月OpenAI发布ChatGPT,引爆社交网络,标志着大模型进入加速发展阶段。2023年3月OpenAI发布GPT-4多模态大模型,在准确性、常识和问题解决能力上显著提升。同年以百度、阿里为首的中国科技公司纷纷推出各自的国产大模型。2024年2月OpenAI发布Sora,标志着大模型视频生成领域的重大突破。2024年12月深度求索发布DeepSeekV3大模型,在多个基准测试中性能超越其他开源模型。2025年1月深度求索发布DeepSeekR1大模型,其在数学、代码和推理任务上与OpenAI的o1模型媲美。大模型技术为各行各业带来了新的发展机遇,各国加快AI领域布局。

图片1.png图1.人工智能技术发展历程

(二)DeepSeek大模型带来的变化

2022年10月美国出台《对向中国出口的先进计算和半导体制造物项实施新的出口管制》,企图通过标准和技术管制,以减缓中国人工智能产业的发展进程。2022年至今,美国出台多项法案和规定,限制向中国出口先进人工智能芯片,并将多家中国芯片设计公司列入实体清单。2025年1月美国意图通过“星际之门计划”(Stargate Project)加强美国在AI领域的全球领先地位,并以国家安全为由进一步限制人工智能芯片和技术的出口。

中国科技公司依托人民群众智慧,努力攻克AI领域的“卡脖子”问题。在算力设施方面,中国算力生产企业不断推出性能比肩国外GPU的产品,追赶式积累知识产权;在算法研究方面,中国科技公司持续开源国产大模型,吸引大量开发者参与算法优化;在应用兼容方面,国家鼓励各行业加强对国产算力和国产大模型的应用兼容。

深度求索公司发布的DeepSeek系列大模型打破了由美国科技巨头建立的“唯规模和算力论”的刻板范式,论证了“优化模型效率提高模型效能”的可行性。2024年5月深度求索发布DeepSeek V2大模型,采用混合专家系统(MoE)和多头潜在注意力机制(MLA),显著降低了推理成本。年12月深度求索发布DeepSeek V3,进一步优化了推理性能,支持多模态输入。2025年1深度求索发布并开源DeepSeek R1,推理能力与OpenAI的o1相当,但训练成本仅为前者的几十分之一

DeepSeek系列大模型的发布,对国内人工智能产业发展和商业应用影响深远。

一是知名产品开源促进研究繁荣。DeepSeek R1性能优越且代码开源,直接引发了国外大模型巨头的开源潮,促进大模型研究的进一步繁荣。

二是低成本高性能推动应用普及。DeepSeek的API定价约为行业均价1/10且支持本地化部署,极大降低了技术应用成本,催生更多基于大模型技术的产品。

三是适配国产GPU携手信创发展。DeepSeek系列大模型已与华为昇腾、天数智芯、壁仞科技等国产GPU完成适配,便利信息技术创新应用的生态发展。

四是挑战垄断开辟崭新技术路线。一方面DeepSeek促使行业从“唯规模和算力论”扩展到“重视算法效能”;另一方面DeepSeek团队在PTX层的优化尝试,将鼓舞国内外开源组织加速挑战英伟达的CUDA闭源生态。

五是思维链增强大模型可信度。DeepSeek R1推出了深度思考功能,首创大模型思维链模式,向用户展示了大模型的思考推理过程,显著增强了大模型生成结果的可信度,进一步推动大模型应用到更多业务场景。

(三)大模型行业的商业成熟度

一方面大模型商业应用处于期望膨胀期,正在各行各业快速涌现。Gartner2预测,到2026年超过80%的企业将使用生成式AI的API或模型,或在生产环境中部署支持生成式AI的应用,见图2。大模型在医疗、教育、金融、工业等领域的应用前景广阔。例如,谷歌的AlphaFold 3可以帮助科学家识别药物靶点、优化药物分子,加速临床治疗方案的制定。2024年10月在Google Cloud Next '24活动中谷歌公布了全球数百个大模型商业化应用案例。

图片2.png图2.新兴技术成熟度曲线(Gartner发表于2023年8月)

另一方面大模型行业投资回报率堪忧,生成式AI的技术要素风险尚在。2023年9月红杉资本发表《AI的2000亿美元问题》,红杉合伙人兼首席运营官David Cahn认为,美国AI应用整体收入和投资缺口高达1250亿美元,泡沫风险初现;2024年7月,这一缺口数字攀升到5000亿美元,大模型行业GPU算力等基础设施存在过剩的情况。2025年1月7日英伟达创始人兼CEO黄仁勋指出,杰文斯悖论3适用于人工智能的发展,认为市场将需要越来越多的GPU算力。DeepSeek系列大模型的横空出世,大幅降低了训练和应用成本,进一步激化了“过剩”矛盾。借鉴互联网泡沫事件,如果未来2—3年内没有出现大规模、商业化、现象级的大模型应用,那么越来越多的大模型科技公司将面临泡沫破灭的风险。除此之外,多项生成式AI的技术要素风险仍然存在。在基础路径方面,图灵奖得主兼Meta首席科学家杨立昆认为“大模型不是研究人类级AI的合理选择”,科学界更有联合嵌入、具身智能等多种技术路线争论。在大模型完善方面,DeepSeek提倡的“算法效能论”与西方科技公司的“唯规模和算力论”形成鲜明对比。在数据资产方面,2025年1月XAI创始人埃隆·马斯克指出现实世界的数据即将被大模型训练完毕,未来将更多依靠合成数据来训练大模型。在能源效率方面,人脑的功率约为20瓦特,而训练ChatGPT-4消耗的能量是人脑的数万倍。

三、DeepSeek等大模型对证券行业的影响洞察

(一)国内证券行业大模型应用现状

截至2024年12月30日,根据各地网信部门发布的生成式人工智能服务(大模型)备案信息公告,已备案的大模型有341个,其中北京117个,上海105个,广东40个,分列前三。IDC4数据统计显示,2024年中国大模型应用整体市场规模达47.9亿元人民币(此处不包含算力类基础设施规模),云厂商、大模型初创企业、运营商、传统解决方案商各占有一席之地,较2023年增长约170%。国内大模型行业呈现出快速发展的态势,形成了“百模大战”的局面。早在2023年,国内证券行业已陆续出现大模型应用,市场参与主体的应用情况各有千秋。

一是行业监管高度关注并积极探索大模型应用。行业监管已在单个业务场景探索人工智能应用,如行业监管探索的“面向私募基金智能监管”和“资产管理领域债务违约风险监测”。同时,大模型技术出现伊始,行业监管就参与证券行业机构的大模型算法备案和应用备案的工作,不定期收集证券行业大模型应用情况,关注应用成效和风险规避。近期,南方某证券监管机构已完成DeepSeek大模型本地部署,将进一步推动大模型赋能监管业务。

二是行业核心机构、自律组织正逐步扩展大模型应用范围。在基础设施探索方面,上交所基于云计算技术探索为行业机构提供DeepSeek等大模型API服务;深交所基于自主可控通用大模型探索行业大模型、行业语料数据建设。在降本增效执行方面,已有单位利用大模型技术赋能制度问答、合同审核、文档摘要、运维告警、运维分析、代码辅助等业务场景。

三是证券公司大模型应用业务场景较多但扩展空间依然巨大。在对客服务方面,截至2025年3月四家证券公司完成大模型生成合成类算法备案5,具备资格向客户提供基于大模型技术的服务和产品。预计2025年通过该项备案的证券公司数量将迅猛增长。在场景覆盖方面,证券公司大模型应用案例已涉及前中后台多个业务,典型应用场景见图3。在运用深度方面,从点状式向企业级转变,如华福证券企业级大模型能力中心可以为全司信息系统提供大模型内容生成、智能体能力编织的服务。在技术变革方面,“大模型+小模型+智能体”逐步成为行业建设大模型应用的最佳范式,对传统的中台系统架构形成冲击。

图片3.png图3.证券行业大模型应用调研

(二)DeepSeek等大模型引发的机遇与挑战

诺贝奖得主、深度学习之父杰弗里·辛顿教授认为“工业革命解放了人类的体力,而AI革命则可能解放人类的智力”;同时,杰弗里·辛顿教授也曾对“高级人工智能的潜在风险及当前缺乏对人工智能公司的监管”表示担忧6。大模型技术在证券行业应用的持续深化,一方面大模型促进了证券行业整体的降本增效、增强了监管机构和自律核心机构的精准施策、激活了证券公司的业务模式创新和经营管理优化、开创了证券公司的大模型产业链投融资业务机会、提高了投资者的用户体验;另一方面大模型衍生了数据安全、隐私保护、合成谬误、幻觉黑盒、权责伦理等问题。7

DeepSeek等国产大模型的出现改善了上述部分情况,但也为证券行业带来了新的影响,相关影响存在对立统一的两面性。

一是低成本高效能特性进一步推动了证券行业大模型的普及,也激化了短期资源争抢。DeepSeek系列模型发布后,中国证监会及其派出机构已完成了多轮关于DeepSeek技术和监管应用的调研论证。春节开工第一周,已有华福证券、国金证券、国元证券、兴业证券先后宣布接入DeepSeek服务,赋能公司数智化转型。越来越多的证券公司APP团队认为“大模型+证券交易APP”是2025年核心工作任务。相对的,更多的证券公司加入大模型技术应用和探索,导致大模型算力GPU资源的短期紧张。截至2025年3月已有多家证券公司启动GPU算力设备采购或租赁项目。以英伟达H20、华为910B为代表的GPU算力设备的采购价格和租赁价格约有10%左右的上涨。

二是训练成本下降、深度开源代码等激发了证券行业微调训练大模型的热情,也衍生了各类新型风险。DeepSeek官方宣称DeepSeek系列大模型训练成本为OpenAI同性能大模型的几十分之一,下降后的成本使得更多证券公司有机会参与到大模型的微调训练工作中。2024年2月24日至28日,DeepSeek陆续开源了FlashMLA、DeepEP、DeepGEMM等核心技术的源代码,使得更多AI算法工程师有机会探索大模型算法的深度优化。据调查,截至目前已超过十家证券公司计划扩充AI算法工程师团队,部分证券公司2025年AI团队规模预计增长超过100%,大量的AI算法工程师将投身算法研究、算法微调和算法开发工作。证券公司扩充AI算法工程师的主要路径有社会成熟人才招聘、校园招聘培养和开发人员转化。另一方面由于AI算法研究需要使用更多新型的研究环境和开发工具,且AI算法工程师的软件工程化能力普遍不强,从而引发了各类新型风险。奇安信公司董事长齐向东表示,国内几千家单位接入了DeepSeek,但是90%都存在风险,通过简单攻击语句就能控制大模型,甚至通过大模型拿到后台数据。2025年2月网信部门和各地证监局下发了有关大模型部署环境的安全漏洞的提示,为证券行业安全使用大模型技术敲响警钟。

三是思维链技术提高了大模型应用的可信度,幻觉出现更加隐蔽、识别难度大幅提高。DeepSeek R1推出思维链功能后国内外大模型科技公司纷纷效仿。大模型思考过程对人类更加透明、友好,提高了大模型生成内容的可信度。例如,华福证券智慧制度项目使用DeepSeek大模型能力后,为员工提供制度知识问答服务时将详细展示大模型的思考过程、回答内容的生成过程和内容引用的规章制度条款,显著提高了生成内容的可信度、减少了员工多轮核对的工作量。华福证券智慧制度项目底座改用DeepSeek大模型后用户访问量提升了300%。随着大模型技术发展,幻觉问题显著改善,但是大模型幻觉现象仍然存在。当前,多款主流大模型在统计分析存在较多相似词的专业资料时,仍然偶有出现幻觉现象。例如,用国内某顶尖大模型产品执行“统计国外证券行业监管机构使用大模型赋能监管业务的场景数量”这类任务时,偶有发现大模型错误地将证券公司业务场景纳入统计的情况。如果不进一步追问“请列出被统计的具体场景”,该类幻觉问题极难被甄别。

四、证券行业把握DeepSeek等大模型机遇的建议

(一)运用大模型技术增强资本市场整体效能,实现对国外资本市场的弯道超车

国外金融行业的大模型尚未运用在监管机构、自律组织的业务中,国外应用集中在证券公司和金融服务三方公司的独立业务场景,典型案例有“摩根大通利用大模型技术帮助员工提高工作邮件和汇报材料协作水平、监控异常交易行为”“高盛运用大模型技术帮助员工提高软件研发效率和质量”。国内金融业较国外有一定先发优势,国内证券行业各参与主体已经全面加速DeepSeek等国产大模型运用。DeepSeek大模型将帮助国内证券行业进一步降低运算成本和减少算力依赖,拓宽大模型应用场景,增强投资者权益保护和投资体验,引发业务模式变革和经营效率升级,促进国内证券业全面智能化转型。

(二)发挥中国资本市场特色优势,推动中国大模型产业高速、健康、安全发展

Gartner认为,2025年十大战略技术趋势包括:代理型AI、AI治理平台、虚假信息安全、后量子密码学、环境隐形智能、节能计算、混合计算、空间计算、多功能机器人、神经增强,其中7项技术趋势与大模型技术关系密切。DeepSeek等国产大模型不但引发了科学界大讨论促进产业提效,更在中国引发了社会性全民大讨论、激发了人民群众创新创业激情。国内证券行业可以把握这一机遇:一方面发挥制度优势,动态调节大模型相关产业的发展节奏,引导社会资本长期投资,增强大模型相关的实体经济抗风险能力;另一方面鼓励行业创设大模型相关主题金融产品、创新金融服务,引导全社会广泛关注和运用大模型技术,助力培育现象级商业化大模型应用,完成大模型产业的商业价值闭环。以DeepSeek等国内大模型带来的数字金融机遇,促进科技金融、绿色金融、养老金融、普惠金融发展,成为当下做好“五篇大文章”的新路径。

(三)鼓励和引导行业机构协作合力、共同克服证券行业应用大模型技术的痛点和难点

证券行业监管机构、自律机构和核心机构可以通过共研课题、揭榜挂帅、案例评选等模式,引导行业各机构在“大模型信息技术创新应用”“大模型信息和数据安全”“大模型业技融合示范”“大模型技术标准”“大模型数据治理”“大模型隐私安全”“大模型虚假信息甄别”“大模型隐性数据跨境甄别”“大模型内幕交易甄别”等领域进行共同研究和技术攻关。同时,推出针对大模型创新应用场景的监管沙盒机制,鼓励行业各机构先行先试,稳步扩大证券行业大模型的应用生态。

(四)证券公司体系化推进大模型应用的科学路径

证券公司推进大模型应用,是一项企业级体系化工程。以华福证券实施全面智能化转型为例,推进证券公司大模型应用的战略体系涉及规划、算力、算法、数据、场景、人员、文化和安全八个方面,见图4。


图片4.png图4.华福证券大模型战略体系

一是规划,明确证券公司推进大模型应用的目标愿景、总体思想、核心任务和关键路径。同时,向公司全体员工宣讲、培训大模型规划。

二是算力,制定证券公司GPU算力建设计划,结合业务场景合理统筹建设方案,如公有云、自建算力、租赁算力等。

三是算法,增强公司层面算法部署验证、算法迭代优化、算法微调训练等能力沉淀,制定相应的管理机制和工作流程。

四是数据,数据治理成效是证券公司推进大模型应用的胜负手。数据团队应加强各业务领域的数据治理工作,可以通过引入DCMM标准增强企业数据治理能力。

五是场景,建立大模型应用场景评价体系,应当遵循“业务价值优先”“规模效益优先”“风险回避优先”三大原则,见图5。


图片5.png图5.华福证券大模型应用场景评价体系

六是人员,有依据、有计划扩充AI团队,尤其是AI算法工程师团队。同时,鼓励大模型解放员工工作精力,引导人员的岗位结构、工作职责、精力投放转变。

七是文化,自上而下建立“重视大模型运用”“鼓励大模型创新”的文化氛围,可以通过以赛促用、榜样学习等形式进一步强化文化认同。

八是安全,公司层面建立“大模型安全管理组织”,负责大模型备案、大模型安全评估、大模型安全应对、AI伦理评判等事务。

六、结语

DeepSeek等国产大模型引发的涟漪仍在持续发酵,将继续激励我国大模型领域科技工作者自强不息、攻坚克难。中国证券行业既要把握机遇进一步深化大模型应用,提高行业运营效能,提升中国资本市场国际竞争力;也要防微杜渐,甄别大模型适用领域,前瞻防范大模型可能引发的社会性、市场性风险;又要充分发挥资本市场功能,鼓励更多长期资金投资大模型产业链,为中国大模型行业保驾护航。证券行业监管机构、核心机构、自律组织、证券公司和投资者需要共同努力,鼓励创新敢于创新,推动大模型技术在证券行业的健康发展,夯实中国大模型产业发展的社会基础,培育中国大模型产业的商业体系。

拥抱但不盲目,依托但不依赖。只有深入调研和辩证分析由DeepSeek等国产大模型引发的证券行业变革浪潮,才能精准识别其中蕴含的机遇和风险,从而构建证券行业高效、安全、循环的大模型生态体系,进一步推动中国证券行业高质量发展。

参考文献

[1] DeepSeek团队.DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model[J]. arXiv, 2024, 2405.04434.

[2] DeepSeek团队.DeepSeek-V3 Technical Report[J]. arXiv, 2024, 2412.19437.

[3] DeepSeek团队.DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning[J]. arXiv, 2025, 2501.12948.

[4] DeepSeek团队.DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models[J]. arXiv, 2024, 2401.06066.

[5]范内·瓦布什. 科学:无尽的前沿[M]. 华盛顿特区: 政府印刷局, 1945.

[6]托马斯·库恩. 科学革命的结构[M]. 芝加哥: 芝加哥大学出版社, 1962.

[7]夏永红.人工智能伦理治理范式:从价值对齐到价值共生[J].自然辩证法通讯,2025(01):1-8.

[8] Ashish Vaswani, Noam Shazeer, Niki Parmar, et al. Attention Is All You Need[J]. Advances in Neural Information Processing Systems, 2017.

------------------------------------------------------

1.作者简介:李宁,华福证券有限责任公司首席信息官、数智赋能部总经理;谢琪,华福证券有限责任公司数智赋能部副总经理;王钟菱,华福证券有限责任公司数智赋能部研发中心创新研究处副处长。

2.国际知名咨询机构,美国的一家信息技术研究分析公司。

3.杰文斯悖论是1865年经济学家威廉·斯坦利·杰文斯提出的一悖论:当技术进步提高了效率,资源消耗不仅没有减少,反而激增。

4.美国国际数据集团(International Data Group)是全世界最大的信息技术出版、研究、会展与风险投资公司。

5.据互联网信息服务算法备案系统数据统计。

6.2024年6月5日,OpenAI和谷歌DeepMind的数名重要员工联名发出公开信,对高级人工智能的潜在风险及当前缺乏对人工智能公司的监管表示担忧。为公开信背书的业内AI大佬则有深度学习之父Geoffrey Hinton、图灵奖得主Yoshua Bengio以及AI安全顶级学者Stuart Russell。

7.引用作者在《中国证券》2024年第5期发表的《做好数字金融大文章 把握证券行业AI技术发展机遇》文章中的观点。


“DeepSeek等大模型在证券行业应用及影响研究” 的相关文章

DeepSeek常见问题: 个人实名认证与企业实名认证有什么区别?

DeepSeek常见问题: 个人实名认证与企业实名认证有什么区别?

DeepSeek常见问题: 个人实名认证与企业实名认证有什么区别?个人实名认证账号与企业实名认证账号在用户权益和产品功能上目前没有区别,但认证方式和所需材料有所不同。根据合规要求,请以您账号的实际使用...

腾讯搭上DeepSeek快车发力C端,字节、阿里、百度还坐得住?

腾讯搭上DeepSeek快车发力C端,字节、阿里、百度还坐得住?

文|萧俊然 编|张弘一出品|商业秀2月15日晚,科技圈又抛出一颗重磅炸弹:微信正在灰度测试接入DeepSeek-R1模型 。不少已经获得测试资格的用户,纷纷晒出体验。16日上午,腾讯方面回应称,确认正...

如何在1分钟内无需DeepSeek就能生成8张海报?

如何在1分钟内无需DeepSeek就能生成8张海报?

随着技术的不断发展,AI已逐渐渗透到各个行业,其中,海报设计作为一个视觉创意领域,也迎来了AI的革新。秒出设计便是一款利用人工智能技术,能够帮助用户快速生成高质量海报的工具。这款产品的核心优势在于其智...

文心一言:请详细介绍Deepseek在业务流程自动化中的应用

文心一言:请详细介绍Deepseek在业务流程自动化中的应用

文心一言:请详细介绍Deepseek在业务流程自动化中的应用DeepSeek在业务流程自动化中的应用主要体现在以下几个方面:一、自动化任务处理DeepSeek能够识别并自动化处理一些重复性的业务流程任...

DeepSeek 到底是什么?DeepSeek的七大提问技巧,小白快速上手全攻略

DeepSeek 到底是什么?DeepSeek的七大提问技巧,小白快速上手全攻略

DeepSeek 到底是什么?DeepSeek 是一家 2023 年成立的杭州初创公司,它推出的大语言模型 DeepSeek-V3 和 DeepSeek-R1,堪称 “王炸” 组合。DeepSeek-...

深度解析:DeepSeek揭示7大时间浪费行为,助你高效管理时间

深度解析:DeepSeek揭示7大时间浪费行为,助你高效管理时间

时间是人生最宝贵的资源,浪费时间等同于慢性自杀。DeepSeek通过大数据分析,揭示了生活中最严重的7大时间杀手,帮助我们深刻反思,重新掌控生活节奏。第一,垃圾娱乐如游戏和短视频虽然短暂放松,但长期沉...