深潜|AI大模型厂商“华山论剑”,谁将独占鳌头?

今年的WAIC或许能让大模型关注者们一饱眼福,绕场一圈便能直观各厂商的领先技术,却可能很难再给人带来惊喜。

图片来源:视觉中国

蓝鲸新闻7月9日讯(记者 朱俊熹)7月7日,持续4日的2024年世界人工智能大会(WAIC)展览落下帷幕。这一科技盛会已连续举办了7年,但随着AI热潮的涌现,全球掀起大模型军备竞赛,本届大会更是风头无二,成为各大AI大模型厂商“秀肌肉”的绝佳场合。

如果找出去年的参展名单,不难发现除了百度、腾讯、阿里巴巴、蚂蚁集团等大厂依然占据着显眼位置,今年的展区还支起了智谱AI、百川智能、MiniMax等大模型初创企业的展位。这几家公司都在过去一年完成了多轮融资,跃升为AI领域独角兽。除了未到场的月之暗面、零一万物等,WAIC集合了国内领先的多数大模型厂商。

经过过去一年多对OpenAI等国外选手的奋起直追,中国AI领域的发展也进入到了新的阶段。在会场外,国内已看不到新增的大模型独角兽。而在会场内,企业们对展台的布置也说明了一点:比起单纯地以大模型性能、参数、跑分论优劣,他们已转向展示更多AI大模型的应用落地场景。

以WAIC官方评选出的八大“镇馆之宝”为例,模型层成果仅占四分之一,包括智谱AI基座大模型、商汤科技可控人物视频生成大模型Vimi。其他成果则包括阿里云AI编程助手通义灵码、支付宝智能助理等应用层产品,和机器人阵列、YOGA笔记本、特斯拉Cybertruck和智能飞行器展示区。

眼花缭乱,却难出惊喜的AI应用

今年的WAIC或许能让大模型关注者们一饱眼福,绕场一圈便能直观各厂商的领先技术,却可能很难再给人带来惊喜。因为各大公司陈设出的大部分应用并不新鲜,在WAIC之前就已上线。

其中最为同质化的莫过于各家的AI对话助手。阿里云在展会上设置了“通义十二时辰”区域,让观众体验有AI助手陪伴的一天;腾讯展出AI助手App腾讯元宝;百川智能带来5月新发布的AI助手“百小应”。这些应用让人眼花缭乱,有参观者在展位上发出疑问:你的这款和百度的文心一言有什么不同?

因此工作人员们在介绍时也试图更突出自家AI助手的产品差异。MiniMax的展台负责人告诉蓝鲸新闻记者,旗下的AI对话工具“海螺AI”支持语音通话,还能在几秒钟内复刻用户的声音。在办公场景方面,这款产品则接入了金融行业的一些专业内容库,能够帮助用户更好地分析财报。

另一家AI创企阶跃星辰的展台负责人介绍称,虽然多家企业都提供了AI助手类App,但在设置和体验上还是存在差距。阶跃星辰面向C端用户推出了“跃问”智能助手,支持实时联网进行问答搜索,“很多同类产品的信息来源截止到2023年,无法做到搜索今天的新闻。”

除了拿出已成为标配的通用AI助手,各家大模型公司也希望能在WAIC上展示自己的特色赛道。

百川智能展出了一款医疗应用AI健康顾问,能够像全科医生一样了解用户的症状,并给出诊断结果和用药建议。百川智能展台负责人告诉蓝鲸新闻,因为创始人兼CEO王小川热衷于医疗领域,“这一垂直场景是我们今年下半年会重点关注的方向,也是现在行业内大多数公司没有涉及的。”这款应用目前仍处于内测阶段,在展会上属首次亮相。

百川智能方面表示,AI健康顾问未来在To B和To C方面都具备可能性。不仅能用来满足个人用户对日常病症的咨询,还希望能推广到三四线城市或乡镇级医院,为基层医生提供参考,降低误诊率。

智能体则为智谱AI的展区立起了一块招牌。展馆里,罗永浩智能体出现在大屏幕上,吸引不少路过的人驻足与“AI老罗”互动。一些观众还聚集到电脑前,体验智谱清言的智能体中心,选用不同的智能体,一键生成小红书爆款文案或某一行业的汇报PPT。

据智谱AI工作人员介绍,站内目前已有超过30万个活跃的智能体,来试用的个人用户更在意其是否能在办公中起到辅助提效的作用。智能体能够更集中于特定的代码或文档等需求上,而一般的AI助手有时会在对话中偏离主题。

在WAIC的论坛上,百度创始人、董事长兼首席执行官李彦宏也宣称,其最看好的AI应用方向就是智能体。百度开发了智能体平台,将基于文心大模型生成的智能体投放到百度搜索、文心一言App等平台,能够向用户提供高考志愿咨询等服务。字节跳动、腾讯等其他大厂同样推出过智能体产品。

相较于其他几家独角兽,MiniMax的展位并不算大,现场负责人解释称“公司的风格一直都比较低调”。而这家主推To C业务的公司把大部分展位都留给了C端应用,其创始人兼CEO闫俊杰还在现场透露,将于下个月发布AI视频生成产品。

对于MiniMax旗下用户黏性较强的To C沉浸式社交应用星野,参观者无法直接在展区直接体验与虚拟角色聊天互动、抽卡等玩法,仍需在自己的设备上下载应用。运营人员告诉蓝鲸新闻记者,虽然来参观的个人用户不少,但大多数此前并没有使用过这款应用,也不符合其用户画像。比起通过WAIC实现对星野的推广,他们更寄望于7月底同样在上海举办的ChinaJoy展会,“那一场的娱乐性会更高,我们也请了很多coser(角色扮演者)”。

本届WAIC展览首次实行付费制,面向所有观众开放。来参观的既有企业、投资者等,也有普通市民。像Minimax一样,一些大模型公司的展台负责人向蓝鲸新闻坦言,对To C业务而言,参加这个展会的推广作用并没有那么明显。

阶跃星辰的负责人表示,现有产品以C端为主,会有一些附近的居民带孩子来见识人工智能,但线下的流量毕竟有限,虽然在拉动客源上能起到一定效果,还是不如线上营销的方式。

也有一家AI初创公司的负责人表示,大模型的落地产品仍处于初期阶段,企业来参展并没有过高地期待宣传的效果。更多地是想要展示公司的软实力,让外界了解模型效果以及商业化落地的场景。

华山论剑,激辩卷模型还是卷应用

2024年被业界称作大模型应用落地元年,如今时间已过半,“应用落地”仍是本次WAIC上被屡屡提及的高频词。找到落地场景,AI企业才能覆盖高昂的研发成本,取得市场竞争优势。

在7月5日举办的WAIC腾讯论坛上,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声表示,“要让技术服务更多产业或行业,仅仅靠几百号人肯定是不行的,需要有更加广大的产业链加入进来,更多的人加入进来。这时候,降低门槛是非常重要的事情。”

在世博展览馆内,大模型公司的展位大多是这样的:一部分用来秀自家AI大模型的性能指标,放出与OpenAI、Anthropic等国内外厂商模型同台比拼的分数榜单,直观地感受公司的技术实力。另一部分,则用来展示各种To B、To C的应用落地场景。

图片来源:智谱AI

以智谱AI为例,参观者可以在展区中了解其大模型全家桶,包括具备视觉和智能体能力的GLM-4/4V、推理极速且高性价比的GLM-4-Air、基于文本描述创作图像的CogView-3等。同时,智谱还展出了一个“智谱小镇”,涵盖在消费、文旅、医疗等多行业场景中应用其大模型的案例,例如智能驾驶、智能问诊、旅行智能体等。

展会期间,成立一年多的阶跃星辰也推出了三款全新大模型:Step-2万亿参数语言大模型正式版、Step-1.5V多模态大模型、Step-1X图像生成大模型。除了向观众展示大模型能够准确识别视频内容等能力,阶跃星辰还摆出了几款自研或合作的应用,覆盖金融财经、内容创作、消费娱乐等领域。

AI行业日新月异,目前业界在许多方面的观点都尚未统一,其中便包括大模型应用落地。虽然AI企业认可这一大方向,但在实现时机和路径上的见解并不完全一致,而本届WAIC也为国内的领军人物们提供了华山论剑的场合。

在一众企业领导者中,李彦宏的态度最为鲜明。去年以来的许多场合中,李彦宏曾多次表示应该“卷应用,而不要卷模型”,希望开发者能在百度文心一言大模型上开发各类应用产品。在WAIC首日的产业发展主论坛上,他再度重申这一观点,并表示没有应用,光有一个基础模型,是一文不值的。李彦宏指出,经过2023年的“百模大战”,虽然中国建立了追赶世界上最先进基础模型的能力,却造成了社会资源尤其是算力的巨大浪费。

同样身为科技大厂,腾讯在WAIC上也表达了以“模型落地、实用为先”的观点。但吴运声强调,如果对AI落地这一方向进行拆解,就会发现仍然需要不断研究最先进的技术,包括多模态、小样本甚至零样本学习等技术。腾讯在实际落地过程中发现,投入技术研发才能更好地解决问题。

初创企业们也持有相似的稳健态度。面壁智能CEO李大海在WAIC上表示,当前阶段对大模型公司的技术要求依然很高,技术还没有完全收敛、达到成熟时,完全聚焦到应用端是危险的。而目前在推动基础模型迭代和应用落地这两方面,面壁智能投入的人力各占一半。

智谱AI首席执行官张鹏在WAIC论坛现场表示,模型和应用并非二选一,而是“一个串联的问题”。他提到,技术创新本身就具有意义,科研人员不断探索着人的智能为何产生、怎样让机器接近人类智能。在另一层面上,如果能将探索的结果给工程化、产品化,变为更有价值的生产力,它的意义会更大。“不要走向任何一个极端,它们是互相促进的关系。”

张鹏指出,要让大模型能够解决现实世界中的许多常见问题,突破点在于其多模态能力。因为人类在解决问题时,输入的信息是多模态的,包括自然语言、视觉、听觉、触觉等。而大模型的下一步就是“脱虚向实”,不再局限于充当一个“缸中大脑”。

在MiniMax创始人、首席执行官闫俊杰看来,当前大模型用户数量有限的主要原因在于其错误率较高,这也是短期内急需解决的问题。“把大模型错误率从30%—40%降低到3%—4%。这个量级的错误率是让AI从辅助人类到独立完成工作的核心标志。”

对外界来说,2024年的WAIC是汇集了中国头部大模型公司的盛会,无疑是个极佳的观察窗口,可以一睹AI浪潮发展至今,国内AI行业行进到了什么阶段,同时也让人们看到当下的现实与分歧。展会落幕,但拉不开差异的应用场景、还在起步的商业市场,仍是大大小小的AI厂商们需要持续面对的难题。

#蓝鲸深潜