当开源AI助手开始批量「觉醒」:OpenClaw 2026.4.5 版带来实质性跨越
当开源AI助手开始批量「觉醒」:OpenClaw 2026.4.5 版带来实质性跨越
如果你一直在关注开源 AI 助手领域的发展,OpenClaw 的这次更新值得多看几眼。这家以小龙虾为吉祥物的开源项目,在最新版本中一次性释出了大量实质性功能更新,覆盖了模型集成、媒体生成、本地化、安全控制等多个维度。
模型阵容继续扩容
2026.4.5 版本新增了对多个模型平台的支持。Qwen、Fireworks AI 和 StepFun 三家提供商被纳入捆绑列表,开发者现在可以直接在 OpenClaw 中调用这些模型而无需额外配置。MiniMax TTS 和 Ollama Web Search 也被整合进语音和搜索工作流。更值得注意的是,Amazon Bedrock 现在支持 Mantle,并且增加了推理profile发现和自动请求区域注入功能,这意味着在 AWS 上部署 Claude、GPT-OSS、Qwen、Kimi、GLM 等模型变得更加简单,一次配置即可适配多个模型路由。
音视频生成进入实用阶段
这可能是最值得关注的变化。OpenClaw 终于把视频生成和音乐生成做成了内置工具。video_generate 工具已捆绑进 Agents,开发者可以直接调用配置的提供商生成视频并获取结果返回。music_generate 工具同样内置,支持 Google Lyria 和 MiniMax 两家提供商,还支持通过 ComfyUI 工作流进行音乐生成。这意味着 OpenClaw 从一个单纯的对话助手,实质性扩展为了一个可以完成多媒体内容创作的完整 Agent 框架。
ComfyUI 的整合也更加深入。捆绑的 comfy 工作流媒体插件支持本地 ComfyUI 和 Comfy Cloud 两种部署模式,涵盖 image_generate、video_generate 和 music_generate 三类任务,支持提示词注入、可选的参考图像上传、实时测试和输出下载。
控制界面全面本地化
对于中文用户来说,这次更新的一个实打实的改进是 Control UI 的多语言支持。简体中文、繁体中文、巴西葡萄牙语、德语、西班牙语、日语、韩语、法语、土耳其语、印尼语、波兰语和乌克兰语全部加入。这意味着开发者或者普通用户可以完全使用母语来配置和管理自己的 AI 助手,门槛显著降低。
记忆系统迈向「自主思考」
Memory/dreaming 功能在这次更新中得到了大幅强化。系统现在支持加权短记忆召回 promotion、/dreaming 命令、Dreams UI、多语言概念标签和 doctor/status 修复。更关键的是,dreaming 机制从之前的竞争模式重构为三个协作阶段:light、deep 和 REM,每个阶段有独立的时间表和恢复行为。开发者可以配置 aging 控制参数,包括 recencyHalfLifeDays 和 maxAgeDays,来精细调整记忆衰减和 promotion 行为。REM 预览工具、可能持久化 truths 的展示、深度 promotion 的 replay-safe 机制,这些改动让 AI 的记忆系统真正开始接近人类「睡眠中整理记忆」的机制。
执行审批和安全管控继续收紧
iOS 端增加了通用的 APNs 审批通知机制,点击通知会直接打开应用内的执行审批弹窗。Matrix 频道也获得了原生执行审批提示,支持账户级别的审批人和频道或 DM 投递。安全方面有几个值得注意的改进:保留 restrictive plugin-only tool allowlists、/allowlist add 和 /allowlist remove 操作现在需要 owner 权限、before_tool_call hooks 崩溃时会 fail closed、阻止浏览器 SSRF 绕过、非交互式 auth-choice 推断现在被限定在已信任的插件范围内。
一次超过百人贡献的迭代
这个版本吸引了超过一百名贡献者参与,包括 vincentkoc、jlapenna、steipete、davemorin、wirjo、mylukin 等核心维护者。从提交历史看,steipete 在 4 月 7 日当天仍有多个测试相关的提交,说明开发活跃度维持在高位。
对于已经在使用 OpenClaw 的开发者,这些更新大多可以通过 openclaw doctor 自动迁移或直接生效。对于观望者而言,视频音乐生成能力的加入、记忆系统的实质性进化、以及多语言控制的完善,让这个开源项目的实用性和成熟度都往前迈了一步。