下一个环节,是永恒智能特地为华瑞银行准备的。
林浩在台上说道:“也许有些朋友没听过‘国际金融数据服务组织(ifdso)’。它是由全球主要金融监管机构和科技界巨头支持的国际组织,专门提供权威的金融交易测试数据,用以帮助金融科技产品尤其是人工智能大模型,进行测试和评估。
“接下来我们将进行一次特殊的对比演示。通过‘ifdso’的专有数据源接口,我们将即时随机获取一批由十万条转账记录组成的测试样本。当然,这些测试样本都是经过严格的匿名化脱敏处理的,不存在隐私安全问题。在这十万条记录中,既有正常的转账行为,也有涉及到诈骗、洗钱等高风险的转账记录。
“我们会将这批样本数据分别输入‘萤火虫’模型,以及永恒智能为华瑞银行开发的专属大模型。让模型来辨别区分是否属于正常的转账行为,通过直接的结果对比,向大家展示各个模型在金融领域应用中的准确性。”
说到这里,林浩微笑着转头看向星光科技的朱迅,继续说道:“如果在场有其他公司的大模型产品愿意加入这场对比‘竞赛’来展示实力的,我们也非常欢迎。”
朱迅却随即将眼神转向其他地方,他此刻并无接招的兴致。
林浩给坐在大屏幕侧边的沈蔚一个眼神,示意测试开始。沈蔚的笔记本电脑正在将操作投影到屏幕上。观众紧跟着屏幕上的界面,看着他轻盈地敲击键盘输入命令。
林浩则走下台,径直来到运维组这边,和王明、刘洋轻声交谈着什么。
不一会儿,大屏幕上显示了一个绿色的成功提示。“我们通过‘ifdso’的数据源获取了十万条转账记录。现在,请大家稍作等待,模型需要一些时间来分析这些数据。”沈蔚告诉在场的观众。与此同时,大屏幕上出现了两条进度条,分别代表两个模型的运行状态,开始逐渐填充。
不到一分钟,“萤火虫”率先跑完了进度,它的成绩随即显示在大屏幕上:
样本总数:100000笔。其中,正常交易:92115笔,高风险交易:7885笔。
“萤火虫”模型报告,正常交易:58224笔,高风险交易:3186笔,无法判定:38590笔。正确识别正常交易:56289笔(正确率:61.11%),高风险交易:3066笔(正确率:38.90%)。总体正确率:59.355%。
尽管“萤火虫”的表现并不算出色,但完成速度令人印象深刻。
另一边,华瑞银行专属大模型的进度条则慢吞吞地走着,三分钟后,台下观众忍不住开始窃窃私语。经过足足十五分钟考验耐心的等待,进度条才终于被完全填满。随后,其成绩也展现在屏幕上:
华瑞银行专属大模型报告,正常交易:92118笔,高风险交易:7882笔,无法判定:0笔。正确识别正常交易:92115笔(正确率:100%),高风险交易:7882笔(正确率:99.96%)。总体正确率:99.997%。
在这十万笔转账记录中,仅有三笔真实的高风险交易被误判为正常。一瞬间,观众们的窃窃私语戛然而止,整个会场出奇的安静。接着,王思涵无法抑制自己内心的激动,顾及不上身旁哥哥的心情,带头鼓起了掌。就连坐在第一排的赵明轩,也被这成绩震撼到了。
林浩重新走到台上,脸上洋溢着微笑。很显然,他对模型的表现极为满意。等到掌声逐渐减弱后,他向观众说道:“我们永恒智能为华瑞银行开发的大模型的表现,现场的反应已经说明了一切,谢谢大家。现在我们进入问答环节,如果有任何问题,请举手。”
话音刚落,宋志明便率先举手。林浩点了点头,示意他提问。宋志明接过话筒说:“据我了解,华瑞银行和永恒智能之间的合同约定,项目的交付日期原定为今天。那么,为何我们今天在这里只看到一个新闻发布会,而没有见到实际的项目交付呢?”
林浩并不认识这个提问者,只是有些好奇他是如何获知合同详情的,但并不妨碍他诚恳地回答:“确实,今天原本是项目的交付日期。正如在座各位刚才看到的模型的表现,该项目其实已经开发完成。只是,最近监管层对金融领域的人工智能模型发布了新的合规要求。为了确保我们的模型完全符合这些更新的规定,我们需要进行额外的开发工作,因此项目的交付时间有所推迟。另外,刚才大家可能也注意到,华瑞银行专属模型分析数据花费的时间相比‘萤火虫’多了很多。今天,我们在这里承诺,在正式交付项目时,性能将比现在,提升五十倍。”