工作路演PPT处理,交给Workbuddy
本文最后更新于:2026年7月4日 下午
Agent
想当年,2022年,ChatGPT能实现聊天就已经很了不起了,近几年的AI,依旧是聊天框的形式,打开各家AI,除了聊天框,就是历史记录,总感觉除了说话啥也不会了。
要是我想让他帮整理文件夹,就没办法了。2023开始,生图、生视频这些多模态功能开始成为主流AI标配,一个聊天框就能做到文字、图片、视频生成,后来MCP的出现,AI逐步能帮我们执行一些东西,我印象最深的是Blender MCP,能够直接用AI建模,曾经是生成bpy代码,手动在blender里面执行,有了MCP,AI可以直接调用工具了。
但是但是但是,MCP的实现有些复杂,上下文占用也大,再加上不是所有工具都有办法直接调用的,很多时候命令行更方便,就比如上面的blender,没有开放太多CLI,只能写一个py然后blender命令行执行。所以一个很神奇的东西Agent来了。MCP是标准化接口,Skills是教会AI做事的操作手册,而且可以像积木那样拼装。
Workbuddy
为什么选择它,上一篇有答案:Workbuddy+FFMpeg,帮你搞定媒体处理-腾讯云开发者社区-腾讯云
除了前面提到的Agent特性和个性化定制外,还有最重要也是AI最适合的一点,就是繁杂、重复而且标准化的流水线做法。AI就擅长这些,按程序运行。
路演PPT难题
在大学的时候,参加过一大堆竞赛,有些路演的需要准备PPT,而那些PPT各种字体各种图片什么的,如果直接给.pptx格式,嵌入字体直接达到了900M,不仅不方便存储,也不方便不同设备预览,而有一种方法可以轻松解决,那就是转为PDF。
出题:主办方为了保障效率,不希望几个软件切来切去,而且没有pdf播放软件,edge播放会有一段加载模糊,所以要求文件统一使用pptx格式,再加上这次参赛的人特别多,所以ppt被限制在了50M以内。你作为选手,带着900M精美大作,怎么解决这个问题?当然我是主办方我不会为难选手,可以交PDF,但是文件依然不要超过50M,面对上千份作品,我有一招。
用到的DEMO Keynote是CNB成都Meetup的,在这:3-21/CNB 成都.key · main · arsrna/meetup-present/chengdu

PDF转换
可惜秦始皇没有统一PDF不同版本的标准,在不同设备、不同预览器上PDF都不能完全一样,比如mac的预览app和edge浏览器看同一个pdf,因为渲染的差异导致了一些问题
mac预览app查看,背景图片消失了
而Edge就完全正常
请教一下D老师
问题比较少见,但是总会出现格式错误的问题,我也不想上台的时候才发现少了点什么东西。而且PDF现在文字什么的都可以直接复制,人家可以直接逆向转换为可编辑的PPT,为了保护我的杰作,这时候需要转换为图片的PDF,图片你总没招了吧,图片不可能乱码,上面的文字不可能被复制,而且兼容性最强,即便现场放不了PDF,一张一张图片放都没问题。
keynote导出不了图片PDF,Powerpoint导出的图片PDF大小非常恐怖,WPS导出图片PDF需要¥¥¥;keynote和PowerPoint可以导出纯图片,但WPS依旧收钱,两头堵呀……
如果是pptx,问题更复杂了,keynote不行,PowerPoint导出的图片ppt又大又糊还不支持mac,wps收费,如果导出图片再手动一张一张插入PPT,要是有91张那不就炸了么。
转图片PDF
不过,办法还是有的,PDF到图片PDF,无非就是PDF转图片,或者PPT转图片,再从图片转为PDF,本质上我们要的就是图片,那人工开个word,一张一张插入PDF肯定不行,这时候,AI上场了
将我们的keynote导出为PDF
@CNB 成都.pdf 帮我把这个PDF转为图片的PDF,保持原来的顺序,输出为 图片_源文件名称
tips:文件直接拖进聊天框即可

然后他就写了py脚本,直接调用,不到两分钟,就完成转换了,而且大小葱90M干到了30M

这时候你想复制文字,想干啥都不行了,就是纯图片的pdf,基本上所有电脑都能够正常播放。
转图片
同理,你还可以让他把pdf转为一张张的图片,当然转为png图片有手就行,我们希望转为avif图片,指定文件名
转为图片,avif格式,文件名:成都_{序号}.avif @CNB 成都.pdf

很快就出来了,不过过程调用到了ffmpeg,所以电脑会非常烫
预览一下可以看到画质非常地清晰
转图片PPT
既然都有图片了,我们可以让他转为PPT,这里我想发挥AI最大价值,直接让它从最开始的pdf转为图片pptx。
@CNB 成都.pdf 转为图片PPT,一页一张PPT,保持原比例


可以看到,已经是一张一个图片了,而且非常清晰,当然大小也非常恐怖,来到了300M
也可以把上一步的图片丢进去,让他按照顺序转为PPT,这里就不赘述了,自己尝试。
压缩
前面转换了PPT,但是大小超标了,因为图片太大。当年没有这么先进的AI的时候,我们是去tinypng还有格式工厂,一张张调分辨率压缩的,而且压缩平台还有每日限制,压完了还要自己一张张换掉每页PPT,一次就得搞10分钟,电脑一大堆窗口。
一句话压缩到位
还记得上一期做了啥吗,音视频处理,图片也可以使用ffmpeg处理,最理想的压缩就是avif,我的README图大部分都是由Workbuddy来完成压缩的
README.md · main · arsrna/arsrna
上一期说过的就不说了,这里主要体现批量处理,AI直接帮你生成批处理的代码,直接一次性几百张唰唰唰地干
原图的尺寸实在是太大了,我希望把刚才38页的PDF图片,统一压缩到宽度2000,avif格式,这里我不像一步一步做了,直接善于利用Agent的ReAct思维,让他自己计划
@CNB 成都.pdf 把这个pdf转为图片的PPT,图片为avif格式压缩,宽度不超过2000px
他要做的就是PDF转图片,图片压缩分辨率转avif,图片插入ppt

看了一下,他没用ffmpeg,而是magick
不过好像为难他了,我的电脑没有magick以及sharp,给他提示提示
还有个小细节,毕竟越用越懂我的Agent才是Agent,它知道曾经我开发node使用bun运行时,多次打断他npm install,所以这会使用了bun i
处理完成,可以看到文件仅有7MB,而且画质依旧在线,这份文件可以直接交给主办方了
合并
合并PDF
现在要求计划书和PPT合并为一份pdf,或者我希望在某些场景下,需要合并PDF,或者图片、ppt、pdf不同格式的合并,Workbuddy都可以轻松实现
我想把这几样文件,合并为一个PDF
文件拖入Workbuddy,可以拖拽来改变顺序(图中顺序标错了,别管)
@截屏2025-07-02 19.27.01.png @12304177_144229795100_2.jpg @TDP_0128_0-arsrna.pdf 把图片和pdf按顺序合并为同一个pdf,保持原比例
经过91秒的处理,已经输出完毕了,看了下底层原理,实际上是使用Python的pdftool来做转换的,Workbuddy调用了pdf skill,而pdf skill里面就是这么实现的,调用Python脚本。关于Skills的知识不再赘述,上一篇有提到,如果没有提到,大家也提过,可以搜一搜。

合并长图
PDF转长图,这个是我上个月遇到的麻烦,财务系统开单附件只允许一张图片,而有时候内容不止一个,再然后附件又包括发票、申请单,夹杂着PDF、PNG等等等等格式,以前我想到的只有用ps,做一个超长画布然后丢进去。现在你可以叫出Workbuddy了
多图合并长图,多页PDF合并长图,交给Workbuddy

@截屏2025-07-02 19.58.55.png @截屏2025-07-02 22.02.04.png @截屏2025-07-11 21.52.55.png 把这三张图片合成为一张长图
同理,也可以丢个PDF进去
@图1 @图2 @图3 @pdf.pdf 把几个文件合成并转换为一张长图

非常神奇地就完成了合并

小技巧:你可以在转换完毕后,点开技能,使用skills-creator,这个制作skills的skill来制作skill,把这个合并长图做成一个skill,下次不用这么多描述了,叫出你的skill,直接拖入多个文件即可
批量处理
如果你是主办方,又或者你很会CNB,有两百多份作品要处理,有些是PPT,有些是PDF,还有些.zip的图片压缩包,还有.html,.jsx,.tsx,.vue。毕竟一万人里总有几个学生捣蛋,作为主办方也不想为难学生,不一定非得PPT,于是就钻空子了。本着尊重每一位选手的原则,忍一忍吧
然后为了方便管理,我希望文件名是顺序-作品名-修改时间.pptx,例如1-和炫酷的标题-20260703.pptx
一样的,我演示的三个Keynote和PDF均可以在 arsrna/meetup-present 找到并下载使用,但请遵循文件里写的CC BY-NC-SA协议
一顿拖入,然后
@CNB 成都.pdf @CNB 广州.pdf @CNB 上海.pdf 分别把这三个PDF转换为图片PPT,图片要求最宽不超过2000px,avif压缩,最终PPT大小不超过50M,输出文件名格式如下:
顺序-原文件名-修改日期.pptx

这里忘记指定修改日期的格式了,让他重新命名
文件名的修改日期的格式是YYYYMMDD,例如 “1-文件标题-20260703.pptx”

总结
不用总结了,该总结的上一篇都有了
以前这些处理都要各种窗口各种工具切换,如果赶上DDL,作品都做好了,就差这一步提交,没赶上就功亏一篑了,有了Workbuddy,这些重复批量标准的工作,直接效率翻900倍,你只需往上面一丢,描述几句话,Workbuddy帮你自动选择工具来完成处理,整个过程不到10分钟,你还可以在这期间刷刷视频啥的,完全不影响。