OpenClaw v2026.4.5 重大版本发布：多媒体生成入核心、/dreaming 记忆系统落地、任务进度透明化

日期： 2026年4月11日 来源： OpenClaw 官方发布 / 腾讯新闻 / CSDN / 今日头条综合报道 标签： #OpenClaw #版本更新 #AI Agent #多媒体生成 #长期记忆

二、最亮眼的更新：视频与音乐生成原生化

本次更新中最引人注目的变化，是 OpenClaw 将 video_generate 和 music_generate 直接纳入了原生工具体系。Agent 在对话中可以直接调用这两项能力，生成完成后将媒体文件原样返回聊天流，无需依赖外部插件或跳转第三方服务。

官方提供的提供商支持矩阵非常丰富：

图像生成：ComfyUI、fal、Google、MiniMax、OpenAI 等
音乐生成：ComfyUI、Google Lyria、MiniMax
视频生成：Alibaba Model Studio Wan、BytePlus、ComfyUI、fal、Google、MiniMax、OpenAI、Qwen、Runway、Together AI、xAI 等

这一步的意义不在于”能不能生成”——以前靠外挂也能做——而在于生成这件事终于被纳入了日常工作流。Agent 不再只是给你一段文字解释，它还能顺手产出封面图、配图、短视频、背景音乐，甚至把整条内容生产链路串起来。对内容创作、宣传素材制作、社媒分发、品牌资产生产而言，这是一个实质性的拐点。

本次更新引入了实验性的 Structured Task Progress（结构化任务进度）功能。此前 Agent 执行复杂任务时，用户往往只能看到两种状态——没反应，或者突然回一大段。中间拆了几步、卡在哪里，完全不可知。

现在 OpenClaw 开始支持结构化的计划更新和执行事件，UI 中可以明确显示任务的分步进度。对多步工作流（自动化网页操作、多文件生成与修改、长链路调研、多节点协作、复杂代码任务等）而言，这种透明度比”再多一个花哨功能”更有价值。

Control UI 和官方文档同步补齐了12种语言支持：简体中文、繁体中文、巴西葡萄牙语、德语、西班牙语、日语、韩语、法语、土耳其语、印度尼西亚语、波兰语、乌克兰语。

对中文用户来说，这波更新的实际价值很大——上手门槛明显往下掉了。

如果你已经在使用 OpenClaw，建议升级后立刻做三件事：

本文基于 OpenClaw 官方发布公告及腾讯新闻、CSDN、今日头条等多源报道整理。

#Agent #Claude #GPT #MiniMax #OpenClaw #插件 #自动化