7月4日,可信大模型公司无限光年(INF)在2024年世界人工智能大会(WAIC)上发布可信光语大模型及其技能陈述。可信光语大模型结合大言语模型与符号推理,有用处理错觉问题,大幅增强模型可信度,赋能金融服务、医疗确诊等笔直范畴,让生成式AI真实成为新质生产力东西。
据雷峰网(大众号:雷峰网)了解,在金融和医疗笔直范畴评测中,可信光语大模型逾越OpenAI的万亿参数大模型GPT4-Turbo,一起作为“精专”的百亿规划大模型,有用进步推理精度,下降服务本钱。经过处理模型错觉问题对企业级运用的严重应战,无限光年深化金融、医疗场景,现在已服务多家头部公司和组织。
在“人工智能:科研范式革新与工业高质量开展”主题论坛上,无限光年联合创始人徐盈辉博士表明,错觉问题是大模型被用作生产力东西的中心应战之一:假如大模型生成的内容不可控、难以解说,就很难满意专业范畴对准确性、可靠性、严谨性的要求。
针对该应战,无限光年致力于研制神经符号核算等多种立异技能,并在此基础上打造新一代可信大模型。
徐盈辉博士介绍,AI在多年开展长河中形成了符号学派和联合学派两种不同的途径和理念。神经符号技能将符号学派的推理才能与联接学派的学习才能有机结合,大幅度的进步生成式AI在职业运用中的可信生成才能,下降错误率、进步可靠性。正如诺贝尔经济学奖得主丹尼尔·卡尼曼提出的“人类思想有快与慢两个体系”的理论,符号核算与大模型的结合不只能用神经网络完结快速的“黑盒”概率猜测,更能进行慢考虑的“白盒“逻辑推理。这两个体系的交融代表着通往未来通用AI(AGI)的重要技能方向,也正是无限光年一起的“灰盒“可信道路。
无限光年联合创始人徐盈辉博士在2024年WAIC上发布光语笔直范畴大模型
在金融范畴,特许金融剖析师(Chartered Financial Analyst,CFA)考试是全球出资业最严厉、含金量最高的资历认证,分为三级考试,包含丰厚的金融类常识问题和核算推理问题。根据CFA数据集,无限光年金融大模型在一级和二级考试中准确率均超越GPT4-Turbo和Llama3。在一级和二级考试准确率的体现上,无限光年金融大模型得分分别为0.7772和0.5518,GPT4-Turbo分别为0.7177和0. 5259,Llama3分别为0.6723和0.4812。
一起,在揭露数据集FinanceIQ和Fin-Eval上,无限光年金融大模型的体现也均超越GPT4-Turbo和Llama3。徐盈辉博士一起宣告,无限光年将光语金融大模型API试用,助力大模型在金融职业的开展和运用。
在医疗范畴,无限光年医疗大模型在威望医疗数据集MedBench上,API和自测榜双榜榜首,是首家双榜超越90分的医疗大模型。API榜归纳得分90.4。
自成立以来,根据可信大模型技能,无限光年已在大模型工业运用中获得多方面效果。在金融范畴,无限光年与头部证券公司协作推出AI投研帮手。凭借新一代可信技能,这一投研帮手在国内首先完结了用大模型精准、高效、深度解读企业财报,为剖析师等专业技能人员供给包含信息总结剖析、范式写作和精准查找在内的一站式功用。到现在为止,该产品已被多家证券公司和资管组织运用。
在医疗范畴,无限光年与国内头部三甲医院协作,一起根据可信技能立异打造医疗职业大模型,在体检陈述解读方面有用帮忙医师进步陈述功率和准确度。
徐盈辉博士以为,在阅历“百模大战”后,模型的职业运用已成为大模型的开展重心。但在深化专业化场景时,当时通用大模型的体现并不抱负。无限光年团队将继续探究新一代可信的灰盒大模型技能,让笔直范畴大模型更精准、更可信,成为“金融参谋”、“专业医师”和更多范畴的专家,让AI技能人人可用、行行获益。
据了解,无限光年团队既有来自阿里巴巴、蚂蚁集团、字节跳动、微软的世界顶尖AI人才,也有来自摩根大通等金融组织、协和医院等医疗组织的资深职业专家。根据对职业需求的深化了解,无限光年开发AI原生产品与处理方案,为职业供给多元化的专业服务,推进“灰盒大模型”和生成式AI技能在职业场景的继续落地。此前,无限光年已完结多轮融资,出资人包含阿里云、启明创投等头部出资组织。