我在Mac mini使用OpenClaw接上本地Gemma4后,确认了一件事:AI成本正在归零

张开发
2026/5/17 9:26:19 15 分钟阅读
我在Mac mini使用OpenClaw接上本地Gemma4后,确认了一件事:AI成本正在归零
Google 全新发布的 Gemma4 堪称 2026 年本地 AI 最优解260 亿参数开源免费普通笔记本就能离线全速运行。今天我在折腾一件事用 Mac mini 跑 Gemma 4 接入 OpenClaw跑通之后我的第一反应不是“AI更强了”而是AI 的使用成本正在被打到接近 0。一、我是在 Mac mini 上跑起来的 Gemma 4先说结论Gemma 4 是可以在 Mac mini 上跑的我用的是轻量版本E4B本地直接跑完全离线。没有云没有API没有费用。两分钟搞定12 curl -fsSL ollama.com/install.sh | sh ollama pull gemma4:e4b跑起来之后你会有一种感觉AI第一次真正属于你自己的硬件了二、Gemma 4 发布我把架构扒了一遍我专门对比了 Gemma 4 和 Gemma 3。结论很有意思✅ 架构几乎没变还是那一套• Pre/Post-norm• 5:1 hybrid attention• GQA说白了不是靠架构创新赢的✅ 但性能直接起飞• 基准测试全面超 Gemma 3✅ 26B MoE 是最大惊喜 总参数 26B 实际激活只有 4B什么意思用小模型的成本打大模型的效果✅ 最关键Apache 2.0这一点很多人没意识到有多重要 可以商用 可以改 可以私有部署一句话总结 Gemma 4架构没变数据和训练方法才是真王道所以我现在的判断是架构党可以先歇歇了三、很多人没看懂 Gemma 4 真正的价值大部分人看到的是 开源 免费 本地能跑但这些都不是重点。真正的重点只有一个它原生支持 Function Calling函数调用这意味着什么 它可以自己调用工具 可以执行代码 可以访问API 可以连数据库 可以浏览网页说白了它不是聊天模型是一个“能干活的本地智能体”四、为什么我一定要接 OpenClaw因为Gemma4 OpenClaw 本地AI系统OpenClaw 是什么你可以理解为AI的操作系统Agent OS它负责• 多Agent协作• 任务执行• 工具调用MCP• 长时间运行但很多人卡在这里 OpenClaw 根本没用到你的大模型比如你看到1 gateway-injected那说明你还在用内置小模型五、正确接入姿势关键1️⃣ 拉对模型123 ollama pull gemma4:26b # 或 ollama pull gemma4:31b⚠️ 不能写gemma4必须写完整gemma4:26b2️⃣ 配置 OpenClaw123456 { id: gemma4:26b, name: Gemma4 Local, contextWindow: 262144, maxTokens: 8192 }3️⃣ 强制切换模型1 /model ollama/gemma4:26b当你看到1 agent main | ollama/gemma4:26b那一刻开始你就拥有了一个真正的本地 AI Agent六、今天的测试 本地Gemma 4负责• 写文章• 代码审查• 数据处理• 日常分析 工具MCP OpenClaw负责• 调接口• 浏览网页• 数据库操作• 自动执行任务☁️ 云端Claude Code备用只在以下情况用• 高复杂推理• 架构设计• 超大项目七、这套组合带来的变化非常关键以前 每个月 AI 成本 几百美金现在 90% 本地解决 只为 10% 付费一句话总结AI从“按token收费”变成“按电费收费”八、我有一个老设备也能跑我现在甚至在试 老显卡 gemma4:e4b结果是 轻松跑 稳定 可用随便用只耗电

更多文章