快讯

browser-use开源video-use技能，模型可以自动完成视频剪辑

browser-use团队在GitHub开源video-use项目，这是一个专为Claude Code设计的开源技能。用户只需将原始视频素材放入文件夹，与Claude Code对话指示“把这些剪成一个发布视频”，模型即可自动完成剪辑：去除口头语和空白段、调色、添加字幕，并使用Manim或Remotion生成动画叠加，最终输出final.mp4文件。

该技能的核心在于高效文本驱动流程：Claude Code不直接处理视频帧，而是读取ElevenLabs转写的带时间戳文本（压缩至约12KB），仅在关键判断节点调用少量时间轴合成图决策。这种方法大幅降低token消耗，相比直接输入视频帧可节省大量计算资源。项目还内置多轮自检机制，在每个剪切点重新验证画面跳变、音频和字幕，通过后才生成预览。安装需ffmpeg和Python依赖，并配置ElevenLabs API密钥，可通过软链接集成到Claude Code技能目录。

来源：公开信息

ABAB AI 解读

video-use的文本优先架构延续了browser-use在网页代理上的结构化输入思路，将视频处理从重计算的像素级分析转向轻量的时间戳文本决策。这直接降低了长视频任务的成本门槛，让Claude Code这类大模型能在本地或低资源环境下处理内容生产流程，体现了AI代理从单一模态向多工具链组合的演进。

这一开源技能针对内容创作者的痛点，自动化传统剪辑软件中的重复劳动，尤其在录屏教程、vlog和教学视频场景中。它加速了从原始素材到成品的端到端自动化，反映出知识工作生产率提升正从代码领域向多媒体内容迁移，同时也凸显了外部API（如ElevenLabs转写）和本地渲染工具（如ffmpeg、Remotion）在AI代理生态中的互补角色。

在更大结构变化中，此类技能降低了个体创作者对专业剪辑工具和团队的依赖，推动内容生产向分布式、低门槛方向迁移。这对应了技术替代在创意产业中的扩散：大模型通过结构化中介层扩展能力边界，而开源模式进一步加快了工具在开发者社区的传播与迭代，影响财富在内容基础设施、AI技能插件与传统媒体服务间的重新分配。

来源

2026/04/16 20:18·

1 分钟阅读

·11 天前