收藏文章 楼主

腾讯首个金融行业大模型标准,大模型金融行业的应用

版块:科技头条   类型:普通   作者:科技资讯   查看:41   回复:0   获赞:0   时间:2023-08-27 04:29:40

投资者网侯淑青

2023年8月23日,北京大学光华-杜小曼金融大模型技术与应用论坛(以下简称论坛)在北京举行。清华大学人工智能研究院常务副院长孙茂松、北京大学光华管理学院商业统计与计量经济学系教授王汉生、光大信托数据中心总经理朱世虎、度小满CTO徐栋良、度小满数据智能部总经理杨青等嘉宾出席了研讨会。

腾讯首个金融行业大模型标准,大模型金融行业的应用

(杜小曼CTO徐栋良)万能大模问世已近一年,车身周围的光环逐渐褪去,人们对它的认知也逐渐趋于理性:比万能大模更强,但也力不从心。行业要想依靠大模型产生新的变革,首先要解决通用大模型在行业中的应用——发展行业大模型,成为AI技术实际应用的新风向。

2023年5月,杜小曼率先发布国内首个金融开源模型“轩辕”,国内金融行业从此进入大模型时代。如何以大模式重塑产业生态,如何应用大金融模式,成为产学研共同关注的问题。

这个行业需要一个大的金融模型

AI技术经过几十年的发展,逐渐从一个概念很强,主要为C端提供新鲜感的“玩物”,变成了一个在B端和C端都能找到应用场景的工具。ChatGPT正式发布后商业潜力显现:无数资金进场,很多有技术实力的大企业不愿意透露自己在大型号领域的技术潜力。

这背后是市场对于AI时代的尴尬。当科幻照进现实,概念成为初具规模的工具,现有的通用大模型的能力能否满足各界的期待?

腾讯高级执行副总裁唐道生曾说:“一般的大模型可以解决100个场景中70%到80%的问题,但不一定能100%满足企业某个场景的需求。”一般的大模型在专业问题上有自己的局限性。在2023全球数字经济大会上,度小满CTO徐栋良表示:“相比一般大模型的能力,金融行业非常需要垂直行业大模型。”

徐栋良在论坛上说:“大模型让机器有了常识,懂得了逻辑,学会了创造,让人们以更自然的方式与机器互动。通过与外围工具的结合,大模型已经具备了通用人工智能的雏形。金融行业是高价值行业,数字化基础好,对数据和技术依赖度高。是大模型应用的高潜力场景。对于中小金融机构来说,在大模式的浪潮中,也有机会通过应用创新,加速其数字化、智能化进程,跨越数字鸿沟。”

对于更专业、更细分的应用场景,大模型需要有自己的“社会分工”,以垂直能力适应垂直市场需求。金融行业寻求自己的垂直大模式,是因为对专业性的需求,也是因为金融行业的头部企业有足够的基础条件。

大模型的三大支柱:算法、算力、数据。其中,数据决定了大模型的智能化范围,很多金融行业的公司在多年的经营中掌握了大量的历史数据和文字资料,为行业大模型的发展提供了天然的便利。而且训练垂直大模型所需的数据量比一般大模型少很多,在成本上更有优势。

杜小曼等互联网金融和金融科技公司,经过多年的运营,在算法和算力方面已经形成了自己的解决方案。另外,金融企业在使用通用大模型解决专业问题时,如果大模型没有部署在本地,则需要将数据上传到对方服务器。这个过程中存在数据泄露的风险,这对金融行业来说尤其致命。

2023年上半年,已经有公司率先发布了自己的财务模型。

2023年3月,全球领先的商业和金融信息提供商彭博发布了BloombergGPT。模型构建了3630亿个数据集,总训练数据约5300亿字,其中金融行业数据约占54.2%。但出于数据安全考虑,该模型并未以任何形式向公众开放。

就在彭博发布BloombergGPT两个月后,国内领先的金融科技公司杜小曼发布了国内首个开源金融行业垂直模型“轩辕”。据杜晓曼介绍,“轩辕”在金融术语理解、市场评论、数据分析、新闻理解等方面优势明显。与基座模型相比,在任务测试中效果提高了70%。

小满CTO徐栋良表示,轩辕已经开放给数百家金融机构试用。

除了“轩辕”,星环科技还发布了面向金融量化领域的生成式大语言模型“Infinity”。恒生电子也有望在9月开放自研金融模型LightGPT的试用界面。

大产业模式有什么优势?

OpenAI发布的ChatGPT率先在全球掀起AI热潮,GPT-4的问世显示了其在通用大型模型领域的前沿性。作为国外老牌咨询提供商,训练BloombergGPT的大部分数据都来自于彭博数据分析师40年来不断收集和维护的金融语言文档。能够先发布财务模型,也是其实力和积累的一种体现。

那么,国内的行业模式与上述两者相比是否有优势?

首先,相对于主流开源模式,杜小曼发布的《轩辕》在金融相关专业问题上已经表现出明显的优势。

公开资料显示,“轩辕”在财务任务评估上已经全面超越了目前主流的通用模型。在150个回答中获得了63.33%的胜率。在一般能力测评中,轩辕的任务有10.2%表现优于ChatGPT3.5,61.22%与之持平。题目涉及数学计算、情景写作、逻辑推理、文本概括等13个主要维度。

金融任务的测评结果意味着轩辕对金融相关领域问题的回答将比目前主流的通用模式更加专业;而通用能力评估中超过71.42%的任务等于甚至超过主流通用模型,说明轩辕在面对金融领域之外的普通问题时接近通用模型,轩辕也能实现通用模型的大部分功能。

从参数丰富度来看,轩辕是基于Bloom训练的,有1760亿个参数,比彭博发布的大模型丰富。除此之外,杜小曼还将自己实际业务中积累的、规模在千亿级的中文预训练数据集tokens加入到“轩辕”大模型的研发中。

为此,Investor.com根据合作伙伴平台对“轩辕”大模型的提问结果,向冰爱提出了同样的问题,以此来简单测试“轩辕”大模型与主流通用大模型的区别。

结果显示,如果一家公司的总资产是500亿美元,总负债是300亿美元,股东权益是多少?这类问题涉及简单计算和概念解释,都给出正确答案和计算步骤。不同的是,在轩辕模式的回答中,额外解释了“净资产不等于股东权益”的概念。

腾讯首个金融行业大模型标准,大模型金融行业的应用

(前者是冰艾的回答,后者是轩辕的回答。)至于“能解释一下抵押贷款和信用贷款的区别吗?”对于这个问题,冰爱和轩辕给出的答案基本一致,不同的是前者的答案比较笼统分散,后者的答案比较清晰,方便提问者快速找到自己需要的内容。

通过一系列问题的比较,可以清楚地发现,在通常的名词解释问题中,两者的表现是对等的。在回答专业的金融问题时,轩辕的回答不仅能让用户了解答案本身,还能引出一些容易混淆的概念,并根据问题给出具体的解释。

2023年全球数字经济大会人工智能高峰论坛上,“小全轩辕模型在金融领域的应用”入选“北京人工智能产业(大模型)赋能典型案例(2023)”。

轩辕发布一个月后,恒生电子也发布了自研金融模型LightGPT,国内行业模型再次传来好消息。恒生电子首席科学家白说表示,LightGPT使用了超过4000亿令牌的金融数据,辅以超过400亿令牌的语言增强数据,可以满足各类金融企业的业务需求。

与海外企业发布的大金融模型相比,国内企业在培训阶段发布的大金融模型所采用的数据会更符合国内金融实际,得出的结论也会更适合国内金融业发展的实际情况。与BloombergGPT不同,轩辕现在可以在Huggingface中申请下载,并开放给数百家金融机构试用。恒生电子发布的LightGPT也将于9月开放试用界面。

国内行业模式的逐渐普及会给国内金融行业带来哪些变化?是值得业界关注的重要趋势。

大模特时代的前夜

目前国内金融行业已经到了大模式时代的前夜,地平线上已经出现了一抹鱼肚白。当这缕被称为“大模型”的曙光真正发挥作用时,我们眼前会看到一个怎样的世界?

首先,大模型将大大增强金融机构收集和整理信息的能力。

以杜晓曼为例。最新数据显示,杜小满累计为1800多万小微企业主和个体工商户授信。整个2022年,杜小曼向小微企业发放信用贷款超过5200亿元。在长期的业务实践中,杜小曼在大数据技术的支持下,建立了较为完善的征信中心。

小微企业在面临资金短缺时,往往因为规模小、抵押物不足而找不到合适的融资渠道。然而,传统的解读信用报告的方式也可能误判企业的质量:信用报告干净的客户可能与黑产有关,一些优质客户有时可能因为最近的资金紧张而无法通过信用评估。

而大数据作为大模型的前置技术,其海量的专业数据可以保证大模型的专业性和准确性。如今,杜小曼征信中心结合大语言模型,可以从征信报告中解读出超过40万个风险相关指标,将银行风控模型的风险区分度提高了26%。

相对于传统评估方法涉及的上百个指标,在大模型的支持下,杜小曼可以全面评估贷款人的基本情况,降低信用风险,有效解决优质小微企业的融资问题。

杜小曼表示,经过清洗和标注后,高质量的数据集不仅可以在普适性上与ChatGPT持平,还可以显著提升模型在金融垂直领域的性能。轩辕模型的数据集涵盖了金融研究、股票、基金、银行、保险中最常见的应用场景。

恒生电子发布的LightGPT功能与轩辕相似,可为投资、客服、投研、运营、风控、合规、研发等金融业务场景提供底层AI能力支持。

随着大模型技术在金融行业各个领域的参与逐渐深入,金融机构的业务也将朝着更加科学高效的方向发展。大模式时代的金融行业,值得大家期待。(思维财经出品)■

 
回复列表
默认   热门   正序   倒序

回复:腾讯首个金融行业大模型标准,大模型金融行业的应用

Powered by 7.12.10

©2015 - 2025 90Link

90link品牌推广 网站地图

您的IP:10.8.251.137,2025-12-18 03:03:06,Processed in 0.20006 second(s).

豫ICP备2023005541号

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
免责声明
  • 1、本网站所刊载的文章,不代表本网站赞同其观点和对其真实性负责,仅供参考和借鉴。
  • 2、文章中的图片和文字版权归原作者所有,如有侵权请及时联系我们,我们将尽快处理。
  • 3、文章中提到的任何产品或服务,本网站不对其性能、质量、适用性、可靠性、安全性、法律合规性等方面做出任何保证或承诺,仅供读者参考,使用者自行承担风险。
  • 4、本网站不承担任何因使用本站提供的信息、服务或产品而产生的直接、间接、附带或衍生的损失或责任,使用者应自行承担一切风险。

侵权删除请致信 E-Mail:3454251265@qq.com