实测4款头部PPT生成大模型:配图错误频发、数据可视化集体翻车

大模型从图文、图片、视频卷到了PPT生成,但距离“一键生成”的终极目标还有明显距离。

文|科技新知 余寐

编丨赛柯

继聊天机器人、文本创作、图像生成、视频生成之后,大模型高调“卷”入PPT生成中。

入局者既包括传统办公软件开发商,如金山办公推出WPS AI、iSlide推出iSlide AI;也包括互联网巨头百度、阿里等携百度文库、夸克AI PPT出场;还有科大讯飞、天工AI、月之暗面Kimi等AI领域的重量级选手。各家纷纷拿出看家本领,争相在PPT赛道上赢得先机。

比如,国产大模型Kimi联合AiPPT推出PPT助手,而科大讯飞也不甘示弱,发布了讯飞智文2.0版本的智能文档AI助理,一键生成PPT升级版。这些工具不仅能提炼文档核心生成大纲,还能一键切换主题模板,甚至支持多文档到PPT的转换……每一个功能都写着“省时省力”,每一个营销点都体现着“卷”的决心。

毕竟“天下苦PPT久矣”,PPT制作一直是职场人士的一大痛点,技术的较量若能推动办公生产力的革新,用户自然喜闻乐见。但是,面对如此硬核的用户真需求,如若企业只是打着AI的幌子交一份伪答卷,无疑将达到反效果,伤了用户的心。

因此,「科技新知」本次将在国产大模型中挑选四名选手进行实测,包括Kimi、讯飞智文、百度文库、WPS,以观察大模型企业对打工人的诚意几何。

为确保测评结果的客观性和参考价值,我们采用以下设定:

1.使用统一的中文提示词,包括简易提示词和复合提示词;

2.每个大模型的测试项目都包括:输入主题生成PPT、上传文档生成PPT;

3.统一使用电脑网页版及其默认设置;

4.统一呈现一次生成结果,不进行二次调整优化。

以下是各个模型表现情况:

生成方式1: 输入主题生成PPT

指令:你是一名经验丰富的影视产业观察者,被邀请至高校的课堂做分享,主题是2024年国内五一档电影及其票房分析,现在需要你据此做一份PPT,要求要有清晰的结构和逻辑,精准的数据支持,精美的视觉设计,须包含图表,总页数不超过20页。

指令说明:作为一个信息沟通工具,PPT应有效地在繁杂的信息中提炼要点、归纳总结,并将多数据部分做可视化呈现。因此,为测试这几款AI PPT的基本能力,本轮测试专门选用具备多主体、多数据主题。

 

 

WPS AI

WPS AI:近900字的PPT大纲,层级分明、内容全面,不禁让人对这个汇报充满期待,但最终生成的PPT却只是把大纲填充进用户所挑选的模板中,具体内容仍需用户自行检索、归纳、分析。

如“背景介绍”部分,WPS AI非常直白地留下一句“分析2024年国内五一档电影市场,了解电影产业发展趋势”,相当于只给用户提供一个思考思路,但相信不少读者跟「科技新知」一样,希望AI能完成到分析这一步;对于“影视产业现状概览的市场规模”也仅有一句“高度概括”的表述:国内影视产业持续增长,市场规模不断扩大——水得太明显了。

Kimi

Kimi:1分钟的时间里,Kimi生成了近2000字的大纲,试图用20页PPT完成背景介绍、情况简介、票房数据分析、受众分析、成败因素分析、营销策略分析、政策环境与市场监管、未来市场展望……只能说全面,十分全面。但问题也在于此——主题不突出,未能聚焦“2024年国内五一档电影及其票房分析”。

和WPS AI一样,在“一键生成PPT”上,Kimi给到的也是一个思路框架、分析模板,如在“2024年票房数据分析”中,Kimi给出的回答是“详细列出2024年五一档期间各部影片的票房数据,包括总票房、单日票房、观影人次等关键指标。分析票房数据背后的市场因素,如影片质量、宣传力度、观众口碑等。”不得不承认,这是一个相当完整的分析思路,相较于WPS AI也更为详细。

百度文库

百度文库:如图所示,百度文库所生成的PPT目录页即其大纲的全部,看起来是位惜字如金的选手。意料之外的是,低期待等来了小惊喜,在前三个产品的测试中,百度文库几乎是最符合「科技新知」对“一键生成PPT”所设想的,包括结构完整、详略得当、主题突出、能引用官方数据并做分析。

但在生成大纲环节上,百度文库出现两段100%重复的内容,由此生成出来的PPT也同样发生重复。但基于其在内容上的优异表现,这点不足倒也影响不大,只增加了后期手动删除的步骤。

 

讯飞智文

讯飞智文:出现多处排版叠字现象,但瑕不掩瑜,有别于WPS AI和Kimi的笼统和全面,讯飞智文对主题的把握更为准确,能够合理分配各部分内容的比例,并能围绕主题对相关维度做有效分析,如不同影片类型分布及特点、购票渠道与观影模式、重点城市票房数据等;信息抓取和文本生成能力较为突出,符合主题且有足够的丰富度。

生成方式2: 上传文档生成PPT

指令:你是一名大学生,要做一个课程期末汇报,文档名称为“电影《傲慢与偏见》人物形象分析汇报”,字数1500,包含电影简介与创作者简介、故事梗概、主要角色人物形象分析、人物刻画手法及小结,请你根据这份汇报讲稿生成一份PPT。

指令说明:这项测试是为根据文档生成一份汇报演讲稿。按一般人平均语速约240字/分钟计算,整个汇报约6分半。主要评估AI的语言和场景理解能力、文本阅读能力、概括提炼能力等。

 

WPS AI

WPS AI:整体而言,是名简约派选手,包含封面及尾图,成品仅6页。排版合理,但配图毫无关联;对文档内容的处理中规中矩,只做了基于文档本身的处理,没有做文档外的内容补充。

Kimi

Kimi:尽管上传的文档已经是完成的一篇汇报演讲稿,但Kimi似乎有自己另外的想法,它基于演讲稿的框架和模板做排篇布局,提炼要点,但没有展开分析,而是提供给用户思考的方向,更像是一份“半成品”。用户需再根据其指示自行填充内容。此外,Kimi在本轮表现中竟存在内容与小标题颠倒(混淆?倒置?还是说正文与小标题识别错误,位置颠倒之类的会清晰一点?)的低级错误。

百度文库

百度文库:根据其提供的选项,我们在“原文一致”和“适当扩写”中选择了后者,成稿确实有基于文档内容补充有效信息和完善,并且扩充内容能够围绕“人物形象”这个关键词展开,逻辑合理。排版无太大问题,较为致命的是配图出现错误,用成《小妇人》的电影截图。

讯飞智文

讯飞智文:排版依旧没有将模板和文字内容进行合理编排,出现多处叠字现象,且PPT页面字数过多,不仅影响观感,也不利于观众对信息的快速获取。但通过联网扩写,成品能基于演讲稿对汇报内容进行有效地完善。此外,其提供的AI配图是个亮点,虽然图文相关性还有待加强,但已比前几家的图片表现要好。

生成方式3:其余相关维度测评

除整体成稿呈现外,我们还从以下几个相关维度进行测评:响应速度与效率、使用成本和价格、模板与样式、用户体验与交互、安全与隐私保护。

四款AI大模型PPT生成时间

“一键生成”无疑是被PPT硬控的打工人和学生党梦寐以求的功能。毕竟,一份精美的PPT从挑选模板开始,就要耗费大量的时间和精力。再到梳理结构、确定文本、斟酌用词、排版布局、设计优化等,可称为繁琐的集合。总体来看,本期测试的四款产品无论是通过输入主题生成还是上传文档生成,成品时间都控制在2.5分钟内。其背后考验的是高效的数据管理机制及算法系统等。

看起来,速度与质量有时难兼得。在输入主题生成中,讯飞智文以整体时间1分钟的优异成绩胜出,且内容质量高。在上传文档时,WPS AI仅用了29s,但内容在四家中垫底。

四款AI PPT测评对象对比表

在使用成本方面,AI新秀Kimi出手相当阔绰,目前,其PPT助手功能均可免费使用。其余三家均采用付费会员权益。但在当前拉新阶段,三家也都设有免费或低价限时体验包。

挑模板往往是PPT人艰难的第一步。整体来看,四款产品的PPT模板库均以教育、职场办公、科技、商务场景为主,适用场景及主题还有待进一步丰富。Kimi的大手笔贯穿全程,免费模板量居榜一,而百度文库多数模板均为VIP权益,即使是免费模板,生成后下载到本地电脑也需付费。

从样式上来看,各家生成的PPT在字体、动画效果和幻灯片切换上都以“基础款”打底,支持在线编辑或下载后编辑。

WPS AI界面

Kimi界面

百度文档界面

讯飞智文界面

从交互体验来看,四款产品注册登录方式便捷,均可通过手机验证码注册登录;支持网页操作;从界面上看,WPS AI、Kimi和讯飞智能走的是极简风,用户能快速找到所需功能,百度文库页面则较为复杂,“AI生成PPT”则位于页面最右的智能助手,操作界面只有整个首页的五分之一。

在安全与隐私保护方面,四家均无明显的隐私政策,未就如何收集、使用和保护用户数据在显眼处做相关说明。

测评观察:技术进步与用户期待的较量

不得不承认,在对四款AI PPT产品的测评中,我们见证了人工智能在内容创作领域的重要进步。仅需简单输入指令、点击生成,一双无形的手便以惊人的速度开始编排并“立即生成”,这对于被PPT绑架的用户无疑是一种解脱。

速度固然重要,但质量才是核心。对话、文本生成是大部分企业切入赛道的第一个发力点,在日复一日的数据训练中,大模型的自然语言处理能力得到显著提升,这也为其往多模态发展打下了坚实的基础。基于此,在本次测评中,四款产品在逻辑分析上都有相当不错的表现。

但在文本内容生成上,各家大部分还停留于“提供思路”的层次,在提取有效信息,生成准确且有深度的文本上还有待加强,如WPS AI和Kimi。相比较而言,百度文库和讯飞智文在本次测试中表现出另一梯队的水准。如果说WPS AI和Kimi可以一键生成一份合格率为50%的PPT,那百度文库和讯飞智文基本是80%的水平,这或许也得益于其背后百度、百度文库和科大讯飞在知识引擎和内容数据上的积累。

欣喜有之,遗憾亦有之。在「科技新知」最期待的数据可视化部分,四名选手则无一例外地选择“视而不见”。数据——悬在大厂人头上的“达摩克利斯之剑”,同样是PPT里的灵魂担当,通常包含数据比对,并以图表、图形等形式呈现,使其更直观、易懂。这也是当代打工人做PPT的共识。为此,在“输入主题生成”测试中,我们专门挑选了有数据信息的主题,并下达具体指令,要求成稿“须包含图表”,结果却没有看到相应内容的生成。遗漏用户需求,也反映出对PPT使用痛点和场景理解的不够深刻。

另一个不容忽视的问题是,PPT常见应用场景既包括学校,也有科研机构、政府及企业等,也意味着大量的数据隐私、商业秘密等。而当前AI PPT大模型产品在数据隐私保护上还显得标准不足、底气不足,也都默契地在宣传营销层面避而不谈。

这么看来,PPT离“一键生成”的终极目标还有距离。各路玩家赶路之余,还需继续练好内功。

大模型综合能力的提升,很大程度上依赖于海量数据的喂养,其开发与训练是一项需要全方位资源投入的复杂工程。它不仅依赖顶尖人才团队和前沿技术,也离不开丰富的高质量语料库,这要求开发者具备持续的数据采集和处理能力。同时,还需投资大量硬件资源以提供必要的算力资源。

简而言之,大模型的开发是一场对技术深度、数据广度和算力强度的综合考验,而每一项技术进步的背后都是“烧钱”。

“百模大战”是过去式了,已经到了求生的阶段。解锁新应用场景,是大模型逐步走向商业化的必经之路。据月狐数据测算,2024年6月智能PPT行业用户规模已达到920万,行业近3月用户规模复合增速达21%。面对“PPT”这一需求庞大的内容生成领域,谁又甘心在这场争夺赛中掉队?

抢占刚需的市场,企业务必要拿出实实在在的真本领了。除此之外,针对用户的培育模式也值得考究,它关乎企业能否长远地赢得市场与人心。回顾这几年全球流行的在线办公软件发展历程,从一开始的免费送福利造福上班族,到后来设置使用限制,逐步按功能收费“割韭菜”,引来一片骂声。至今为止,关于这些企业的实际产出回报率及用户留存率的具体数据仍显匮乏,使得外界难以全面评估其经营成效。

面对你我日益被AI重塑的生活,不管拷问得多细致都不为过。毕竟每一个为科技买单的用户,都还要再付诸时间、隐私及信任。承载着打工人与学生党厚望的PPT“帮手”,可别把好牌打得稀巴烂。

声明:本文内容仅代表该投稿文章作者观点,不代表蓝鲸号立场。 未经授权不得随意转载,蓝鲸号保留追究相应责任的权利