当前位置:首页 > 汽车 > 正文

DeepSeek之后 金融大模型将迎哪些变化?

  • 汽车
  • 2025-02-11 13:09:06
  • 17

界面新闻记者 | 何柳颖

DeepSeek之后 金融大模型将迎哪些变化?

界面新闻编辑 | 王姝

DeepSeek热潮正快速蔓延。

金融机构中,券商动作最为迅速。目前国泰君安、国金证券、广发证券、华安证券等多家券商均表示已完成本地化部署。

银行方面,江苏银行率先宣布已部署Deepseek,该行称,依托“智慧小苏”大语言模型服务平台,成功本地化部署微调DeepSeek-VL2多模态模型、轻量DeepSeek-R1推理模型,分别运用于智能合同质检和自动化估值对账场景中。

苏商银行方面表示,2024年,在国产大模型兴起之初,苏商银行积极关注并先后引入DeepSeek系列技术,结合原有大模型技术能力,在模型轻量化与高效推理方面取得显著突破,并大幅降低了算力消耗。

整体而言,目前正式官宣接入、应用Deepseek的银行不算多,不过有银行人士告诉界面新闻记者,“已在行内部署DeepSeek大模型”。

无论快慢,Deepseek带来的“低成本、高性能”路线显然已为金融机构的大模型布局带来了新的思考。另一方面,这一路线是否有望缩小金融机构之间的大模型技术鸿沟?

大大降低深度思考模型的应用门槛

桂林银行方面告诉界面新闻记者,该行已在行内部署Deepseek大模型,计划结合各业务条线将其用于业务知识问答助手、客服助手、培训助手、培训对练、智能出题等场景,拓展大模型技术在金融服务场景的应用,赋能金融服务高质量发展。

另有股份行人士告诉界面新闻记者,“目前还在研究中,没那么快落地”。

“DeepSeek-R1的优势可以用‘更聪明、更便宜、更开放’来概括。更聪明在于自主学习能力更强,能够通过自动推理得出正确的结果;更便宜在于借助算法优势,可以占用更少的算力资源,以更低的成本完成同样的任务;更开放在于其选择了开源,允许任何人免费试用和改进算法。”中国科学院科技战略咨询研究院研究中心副主任周城雄向界面新闻记者表示。

“2023年OpenAI推出O1系列模型时,强大的推理思考能力为很多复杂场景的深入应用带来了可能;而此次DeepSeek-R1系列模型开源,不仅带来了完整好用的COT(思维链推理)能力,同时其通过大模型蒸馏小模型的实践方式也大大降低了深度思考模型的应用门槛。”招联消费首席信息官王耀南告诉界面新闻记者。

王耀南表示,DeepSeek-R1模型的开源带来了更多应用机会,对于招联消费的大模型应用策略来说,强化的深度思考能力可以大大拓宽智能体的应用范围。

比如,“在风险管理领域,深度思考能力可以让智能体应用完全结合宏观、微观经济运行情况,详细、完整地评估客户的风险水平;在服务与营销领域,通过对客户信息及过往服务交互记录的深入分析,我们可以通过AI技术为每个客户打造专属客户经理。”王耀南介绍。

帮助搭建金融大模型

根据周城雄的观察,目前金融机构大模型研发路径主要有以下三类:一是利用已经开源的模型进行处理,二是聚焦金融场景针对性地开发小模型,三是直接采购服务商的AI服务。

从受访金融机构的情况看,第一种方式更为普遍。王耀南介绍,招联主要基于一系列开源的基座大模型(包括llama、qwen等),结合招联对于业务的深入洞察和数据积累,通过强化学习、SFT微调等方式打造并开源了两代智鹿大模型,在此基础上构建了包括消保智能体、审批智能体、运营智能体等一系列智能体应用。

桂林银行方面亦告诉界面新闻记者,该行大模型研发与应用主要通过引入开源的通义千问大模型结合采购行业垂直领域大模型,构建大模型中台,集中统一管理大模型资源,目前已上线30余个大模型应用。

目前DeepSeek-R1已开源,这不仅意味着各大金融机构多了一个成本更低的开源模型选择,更重要的是,DeepSeek正搅动起一轮闭源开源之争,这实际上有助于推动人工智能的整体开发和应用进程。

从应用层面划分,大模型大致可以分为两类,一类是通用大模型,另一类是垂类大模型。在知识门槛技术较高的金融领域,业内普遍认为垂类大模型的性能匹配度会更高。

BloombergGPT是垂类大模型的典型之一。2023年3月30日,Bloomberg(彭博)正式发布金融行业大模型BloombergGPT,该机构彼时表示,基于LLM(Large language Model,大型语言模型)的人工智能最新进展已经为许多领域展示了令人兴奋的新应用,然而,金融领域的复杂性和独特术语需要特定领域的模型。

据官方介绍,彭博的数据分析师在四十年时间里收集并维护了金融语言文件,该团队从庞大的金融数据档案中提取数据,创建了一个由英文金融文档组成的全面的3630亿个token数据集。然后使用3450亿个token的公共数据进行扩充,从而创建了一个包含超过7000亿个token的大型训练语料库。

该模型将帮助彭博改进现有的金融NLP(Natural Language Processing, 自然语言处理)任务,例如情绪分析、实体识别、新闻分类和问答等。

招商银行信息技术部副总经理俞吴杰亦曾表示,招行重点不在搭建通用模型,而是搭建金融行业的领域模型。

俞吴杰表示,招商银行不会在通用大语言模型上花费更多精力,因为通用大语言模型在银行业的运用有其弱点——对专业知识理解有限,在专业领域数据处理能力较弱。囿于此,招行会在比较好的通用模型基础之上,将足够的专业领域知识给到大模型,“最起码是银行业,未来还可能扩展到证券、保险等与银行关联性大的行业”。

如何“喂料”是其中的关键问题之一,而Deepseek-R1有望在这方面帮助银行“提质增效”。

“Deepseek-R1是通用大模型,知识量很广,包括信贷业务等金融领域的知识,这可以作为语料支持。将金融内部数据与外部数据结合优化,亦可以降低训练成本。”周城雄表示。

“大模型对于业务模式的重构是一个循序渐进的过程,R1深度思考模式的引入,不仅有利于复杂推理场景下的AI技术应用;同时也可以作为招联自研模型‘自构建数据’的引擎,结合足够多且高质量的数据,带来更优异的推理效果。”王耀南亦强调。

缩小大模型技术鸿沟?

金融领域是AI应用最具潜力的领域之一。

“因为金融领域的数据结构化程度比较高,并且金融机构对数据的管理相对合规完善,这对于生成式AI训练而言是比较好的数据基础。但是因为金融数据涉及到用户隐私以及跨地域、跨部门的监管问题,如果要对这些数据进行训练,其实也存在一定的壁垒。”周城雄表示。

而在金融机构之间,实际上存在着明显的技术鸿沟。

此前有业内人士表示,从行业角度看,大语言模型是一项持续的、规模大的投资,包括建集群、招聘人才等,且资源都比较稀缺,并非所有银行都适合大规模投入其中。银行业之间的交流非常多,中小银行机构可以复用一些业内经验。对于中小银行,并不建议盲目跟风,尤其是一次性的大投入,目前大模型的发展还有很多变数,包括通用大模型哪个更优,怎么部署等,都还在变化过程当中。建议中小银行机构更多地做好行业交流学习,针对自身实际情况量力而为才是更合适的。

Deepseek-R1有望带来新的竞争路径。

桂林银行方面告诉记者,Deepseek-R1是一款优秀的国产大模型,对该行大模型策略产生了比较重要的影响。尤其是Deepseek-R1显著降低了研发成本,使得中小型城商行能够以更低的成本投入大模型的研发与应用。

“以往研发金融大模型需要购买大量的GPU卡来搭建高算力的基础设施,成本高昂。而Deepseek-R1低操作成本特点,让我行在金融大模型应用研发方面的投入产出比有望进一步上升。Deepseek-R1在基础设施方面带来的降本增效,有助于我们投入更多资源到大模型应用方面,能够更好地专注于自身业务特点,开发有针对性的垂直应用。”该负责人称。

桂林银行方面认为,Deepseek-R1的出现有望缩小中小型城商行与大型银行在大模型应用研发方面的差距。中小型城商行由于资源有限,在大模型研发上的投入相对较少,而Deepseek-R1的低数据训练成本和高性能,为中小型城商行提供了一个新的突破口。

“原来各机构的技术差异可能比较大,有的土壤肥沃,有的贫瘠,投入产出比差异明显;如今Deepseek-R1实现了通过较低的成本来获得比较好的产出,相当于大家在同一片肥沃的土壤上种植,整体拉高了投入产出比,技术差异有望缩小。”周城雄亦表示。

但对于中小型机构而言,困难依然重重。“包括数据量相对有限,能承担多少算力,人才问题,等等。”周城雄补充称。

另一方面,技术门槛的降低也并不意味着消弭差距,甚至可能拉大差距。“如果机构懂得如何借力低成本的技术平台,相信能产生更好的效益,而对于不会利用的机构而言,则会带来负面影响。”周城雄谈及。

在周城雄看来,中小金融机构需要在自主开发和外部力量之间寻找一个平衡:如果完全用外部的大模型,可能不是那么好用,并不适合自身业务;如果完全自主开发,成本也会太高。

展望未来,周城雄认为竞争格局将取决于AI与业务的深度融合能力,而非仅仅成本的高低问题。“就像信息化浪潮的时候,信息化与业务的融合水平也拉开了机构之间的竞争差距。”

但无论如何,在各个领域,大模型成本降低都是喜闻乐见的事情。

王耀南谈及,以消费金融为例,作为与人们日常消费联系紧密的金融业态,消费金融具有量大、小额、分散等鲜明特点,业务风险和运营成本较高,实现“普”与“惠”的平衡存在公认难度。大模型技术的发展将进一步推动金融服务的颠覆式创新,在高效解决风控、运营、服务等领域存在巨大应用空间和显著优势。   

着眼生态发展,“DeepSeek在Nvidia CUDA技术体系之外,以其良好的原生生态支撑了包括华为昇腾在内的一系列国产GPU技术栈,DeepSeek的‘破圈’及优异的性能让更多人认识到国内人工智能信创生态将会快速完善。未来,充分的市场竞争一定会带来投入产出比的上升。”王耀南表示。

有话要说...