彭博社构建迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型——BloombergGPT。该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。该模型在金融任务上的表现远超过现有模型,且在通用场景上的表现与现有模型也能一较高下。
从测试来看BloombergGPT在以下五项任务中的四项(ConvFinQA,FiQASA,FPB和Headline)表现最佳;而对于测试一ConvFinQA来说,这个差距尤为显著,因为它需要使用对话式输入来对表格进行推理并生成答案,具有一定挑战性。
(1)测试一:ConvFinQA数据集是一个针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。
【资料图】
(2)测试二:FiQASA,第二个情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。
(3)测试三:标题,数据集包括关于黄金商品领域的英文新闻标题,任务是判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。
(4)测试四:FPB,金融短语库数据集包括来自金融新闻的句子情绪分类任务。
(5)测试五:NER,命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。
投资建议:本次彭博社发布为金融界打造的大型语言模型在部分金融垂直场景表现出强于通用大模型的能力,我们认为金融领域的GPT革命或刚刚开始,因此我们继续关注。
建议关注GPT行业应用相关标的:
金融:同花顺、恒生电子、东方财富(海外&传媒组覆盖)、长亮科技、顶点软件等。
教育:科大讯飞、视源股份(与电子组联合覆盖)、鸿合科技(轻纺组覆盖)、捷安高科
风险提示:AI应用落地不及预期、技术发展不及预期、国内大模型进展不及预期