开局惊艳,加速进化。
如果用一句话概括讯飞星火大模型5月6日发布以来的表现,那便是如上这句。
尽管星火大模型“出场”不算早,但开局即惊艳,现场真机实测大模型七大核心能力,落地四个行业,还抛出年内三次升级里程碑和时间点,10月赶超ChatGPT。这也是国内唯一一家给出明确赶超时间点的大模型厂商。
(资料图)
一个月过后,科大讯飞如期兑现flag,6月9日发布星火大模型V1.5,不仅各项能力持续提升,且在综合能力上实现三大升级:开放式知识问答取得突破,多轮对话、逻辑和数学能力再升级,并进一步推出星火APP,面向生活、工作等用户高频使用场景上线200多个小助手,使用体验也在快速迭代。
大模型加持之下,近期讯飞C端产品也表现出众。如讯飞AI学习机搭载大模型后激活的数量比去年同期增长了214%;618大促期间,讯飞AI硬件销售额同比增长125%,实现高增长。
短短30多天,科大讯飞不仅发布会上敢于真机实测,敢于看似激进的今年赶超ChatGPT,给出明确的里程碑和时间表,又一步步快速迭代兑现目标。科大讯飞为何能有如此清晰的目标,又凭什么做到?
透过近期对科大讯飞及星火大模型的观察,科大讯飞做大模型有五重确定性,这五个确定性或将在国内率先实现“智慧涌现”。
01 技术上的确定性:长期主义与科学评估体系
在星火认知大模型立项之初,科大讯飞和中国科学技术大学共同承建的认知智能全国重点实验室就牵头设计了一整套科学的评估方法。5月6日的发布会上,根据这套测试方法,星火大模型在中文文本生成和数学能力上就超过了ChatGPT的水平。
也是基于科学体系,科大讯飞制定了看似激进的年内三次升级目标,到10月赶超ChatGPT,也被一些网友吐槽吹牛。
而6月9日的星火大模型V1.5如期发布,算是对这一目标的有力回应。科大讯飞董事长刘庆峰当时说,“星火认知大模型的最新成果再次如期发布,是因为我们所有的技术都是完全自主研发的,我们对每一个阶段的技术都是可控的,也非常有信心。”这句话无疑表明,星火大模型的每一步都是建立在科学体系上的,之前的“套壳”ChatGPT传言也不攻自破。
下面这张图尤为值得关注,可以看到每项能力的进展都有明确数据,开放式问答取得突破背后是知识问答能力提升了24%,除了兑现三项能力升级外,文本生成、语言理解、代码能力均有7%-8%的升级。
可以看到,科大讯飞之所以敢说10月赶超ChatGPT,以及给出年内明确升级时间点,是因对大模型建立了清晰的评估体系,将关键功能拆解成模块逐一攻克,最终攻下“桥头堡”。它既有客观的目标指明迭代愿景,也有客观的坐标衡量迭代效果。这种科学体系的指引,是科大讯飞的第一重确定性。
没有一个大模型是天生完美的,因此,比起跑线更重要的,是技术迭代速率,而这有赖于技术积淀,和对长期主义的坚持,这正是科大讯飞第二重确定性。
在刘庆峰近期对员工的一封信中提到,“这一次我们在数据不占优势、算力不占优势的前提下,为什么能走到国内最前面?”一个关键因素就是长期主义的技术积淀。
科大讯飞在认知智能领域已经有十几年的积累。2011年科大讯飞就承建了语音及语言信息处理国家工程研究中心,语音和语言的核心能力是实现通用智能的基础条件。2014年科大讯飞推出讯飞超脑计划,明确提出要让机器像人一样具备能理解会思考的能力,2022年初进一步宣布了讯飞超脑2030计划,让机器懂知识、善学习、能进化,让机器人走进每个家庭。此外,讯飞还承建了全国唯一一个认知智能全国重点实验室,仅过去一年就在认知智能领域取得十几项世界大赛冠军。
专注人工智能的沉淀与发展,科大讯飞积累足够的技术人才厚度与数据数量。所以,从去年12月立项,科大讯飞在很短的时间内拉起了一支上百人的团队做大模型。另一方面,公司在多年认知智能系统研发推广中,积累了超过50TB的行业语料,和每天超10亿人次用户交互的活跃应用,这是孕育大模型的重要基础。
而数据质量与数量,对大模型同样重要。数据数量与大模型质量并非一直成正比,积累到一定量之后,数据不一定能推动模型进化。优质的数据在哪儿?有专家称,在国内,大部分高质量中文语料都在行业内,而不在公域的互联网内。像科大讯飞这样很早就深耕各行业的公司,拥有领先行业的成熟的数据清洗和标注团队。掌握的数据质量是占优的。
作为一款中国企业推出的大模型产品,核心是要把AI能力建在自主可控的平台上。正如刘庆峰所言,“星火大模型每一个关键的技术模块都是完全自主研发的,科大讯飞对每一个阶段的技术都是可控的,软硬件平台都是国产自主可控的。”值得一提的事,科大讯飞与华为、中科曙光、寒武纪等国产硬件企业深度合作,在算力领域足以支持算力不被卡脖子。自主、可控,构成了科大讯飞第三重确定性。
以上的三个确定性,塑造了科大讯飞在数据、算力和算法的确定性,是星火大模型当下国内领先的主要原因。再叠加其AI国家队的属性,近期也被任命为工信部下设大模型工作组的副组长单位,则有希望率先在中国实现“智慧涌现”。
02、应用落地才是大模型未来争夺的关键
但技术和市场之间往往有巨大的鸿沟。AI 领域发展起起伏伏,从 1950 年代到现在,每隔 10-20 年,就会重大变革一次,引发资本争相押注。最近一轮,则是因AlphaGo引发的深度学习潮流。
正如《连线》杂志创始人Louis Rossetto所言,“只有少部分玩家才能穿越时间,绝大部分公司只能抓住一次浪潮,并日夜祈祷产品的生命周期足够长”。
经过市场大浪淘沙,活下来的企业少之又少。科大讯飞穿越多个周期,抓住几轮AI变革,并在上市后的连续10年年增长超25%,这与其“以终为始”的应用化路径不无关系。
如今科大讯飞在教育、医疗、城市、消费者等赛道已取得规模化落地,其在商业化中沉淀了大量经验,如今成为其AI技术商业化落地的壁垒。反观其他AI上市公司,利润连年亏损,且营收业务不稳定。而科大讯飞在24年中积累的如何做技术,技术如何商业化,如何在商业化中取得胜利,这是其宝贵的经验和方法论财富,使得这一次大模型从一开始他就站在商业化的头部。
科大讯飞做大模型从第一天起就为应用服务。其布局大模型的结构是“1+N”,“1”就是通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。
5月6日,讯飞星火大模型发布同时,就宣布落地教育、办公等领域,并现场展示大模型在AI学习机、讯飞办公本等产品中的应用,利用大模型来提升产品的使用体验。在星火大模型的加持之下,AI学习机为消费者提供了新颖的交互体验,如口语陪练、写作助手、作文批改等个性化学习功能。从结果来看,近期搭载大模型的AI学习机的激活的数量比去年同期增长了214%;618大促期间,讯飞AI硬件销售额同比增长125%,AI学习机、办公本、翻译机、录音笔等多个品类获得京东&天猫双平台销量冠军,实现高增长。
在6月9日的发布会中,讯飞更进一步落地医疗、工业等领域。尤其是医疗场景的讯飞诊后康复管理平台,将专业的诊后管理和康复指导延伸到院外,改善国内绝大部分患者“出院即脱管”的现状。可实现人机耦合保障患者安全,保证7*24小时全天候应答。并且这一平台已在和北京协和医院、四川华西医院、武汉同济医院等医院合作,覆盖20多个科室的主要病种。这是对老百姓实实在在的价值。
如今业务上,科大讯飞GBC三端深度联动,在这一模式下,技术、商业彼此赋能,既可以促进业绩持续稳健增长,还可以增加用户粘性,推动技术持续进化,这就是第四重确定性。在大模型加持之下,科大讯飞的业务赛道也或将迎来一次新生。
“针对大模型的技术投入,我们该投的投,绝不手软,应投尽投,饱和投入。我们不需要那么多的人力和资金,现在讯飞的团队和资金完全靠得住。这些投入是自主可控的,我们可以保证它不被国外卡脖子,从长期发展上来说,可以一步一个脚印地持续往前走。”刘庆峰的底气,就来自第四重确定性。
此外,第五个确定性是13年汇聚而成的461万的开发者生态。科大讯飞从2010年就开始将AI能力开放出来,搭建开放平台。截至2023年5月底,讯飞开放平台已开放587项AI产品及能力,聚集超过461万开发者团队,总应用数超过169.9万,链接超过500万生态伙伴。即使在过去三年疫情中,讯飞的开发者生态依然保持蓬勃的增长。
既有的开发者生态正是科大讯飞打造星火生态最大的确定性,开发者直接调用大模型的API,开发自己的应用,相关数据的回流进一步迭代星火大模型。因此,星火大模型一经发布,科大讯飞就宣布通过能力开放、插件开放、行业共创,与千行百业共建生态,并表明已有36个行业、超3000家企业达成了合作的明确意向,并且还在源源不断地增加之中。6月9日科大讯飞进一步宣布开放星火认知大模型开发接口,将七大维度能力、200+小助手对应能力全面开放给开发者。
面向高校,科大讯飞还联合全国首批22所全国重点高校,启动星火大模型场景创新赛,打造讯飞高校AI星火营,此举既培养了面向未来的AI人才,也可以借助大学生的创新创业,为星火大模型形成更多创新场景应用。
科大讯飞具有庞大的生态潜能,也懂得如何打造生态,这一点随着大模型的完全开放,星火大模型的落地实力将得到进一步展现。
03、超级入口争夺战即将到来
为了打造“杀手级”应用,科大讯飞还推出了星火APP及小程序,支持多模态输入,以及全程语音对话,随时随地使用星火的能力。为了满足用户在各个场景的使用需求,星火APP还推出了200+场景小助手,涵盖了人们职场、学习、生活、出行、写作等各场景的应用需求。借此次升级,星火进一步实现了大模型的易用、高效和全面。当星火让大模型更好用时,带来更多用户的高频使用和高质量的数据反馈,这无疑加快星火的迭代速度,进而形成一个正向循环。
今天的星火等大模型产品和昨日AI,差别就是DOS系统和Windows系统差别,体验和可用性是飞跃般提升。难怪比尔盖茨会说自己有幸亲历了人类可能最重要的两场革命的开端:第一次发生在Windows萌芽、PC市场刚刚兴起的80年代,而第二次正是去年——大模型刚刚开始涌现的时候。
更进一步说,星火的逐渐成熟,也将是科大讯飞新的转折点——成为超级应用的确定性,这是后话。
关键词: