文章总结: 文档介绍在16GB内存MacMiniM4上使用Ollama搭配OpenClaw搭建零成本本地AI助理的方法。针对内存不足导致的崩溃问题,提出关闭FlashAttention、调整KVcache类型、限制GPU层数等优化措施。推荐qwen3.5:3b、llama3.2:3b、phi4:mini等低内存模型,并提供一键启动脚本实现稳定运行,兼顾隐私保护与快速响应。 综合评分: 85 文章分类: AI安全,安全工具,实战经验,应用安全,安全运营
在 Mac 上用 Ollama + OpenClaw 实现零成本本地 AI 助理:16GB 内存 Mac Mini M4 硬件配置运行
原创
糖果LUA 糖果LUA
AI安全运营
2026年3月6日 16:28 北京
OpenClaw 需要调用大语言模型完成各类功能,使用商用大语言模型 API 需要支付一定费用。某些特殊场景可以使用 Mac 上的本地大语言模型,通过 Ollama 启动 OpenClaw,让本地 Ollama 大语言模型为 OpenClaw 提供模型服务。这样不仅零成本,还能保护隐私、响应更快。
已关注
关注
重播 分享 赞
关闭
观看更多
更多
退出全屏
切换到竖屏全屏退出全屏
AI安全运营已关注
分享视频
,时长00:06
0/0
00:00/00:06
切换到横屏模式
继续播放
[ ]
进度条,百分之0
播放
00:00
/
00:06
00:06
倍速
全屏
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
继续观看
在 Mac 上用 Ollama + OpenClaw 实现零成本本地 AI 助理:16GB 内存 Mac Mini M4 硬件配置运行
观看更多
转载
,
在 Mac 上用 Ollama + OpenClaw 实现零成本本地 AI 助理:16GB 内存 Mac Mini M4 硬件配置运行
AI安全运营已关注
分享点赞在看
已同步到看一看写下你的评论
视频详情
第一步:安装 Ollama(Mac 用户最简单方式)
- 打开浏览器,访问 Ollama 官方网站:https://ollama.com
- 点击 “Download for Mac” 下载 Ollama.dmg 文件。
- 双击 .dmg,将 Ollama.app 拖到 应用程序 文件夹。
- 打开 Ollama.app,菜单栏出现小鲸鱼图标即启动成功。
- 验证:终端输入
ollama --version - 测试:
ollama run phi4:mini输入“你好”试试。
如果你 Mac 主机是 24GB 或 32GB 内存配置,通过 Ollama 在本地运行 8B 规模大语言模型完全没问题。但在 16GB 内存的 Mac Mini M4 上直接跑较大的模型容易崩溃(API error 500,model runner stopped)。
为什么 16GB Mac Mini M4 容易崩溃?
- 统一内存压力大(KV cache + OpenClaw 长上下文)
- Metal 后端 + Flash Attention 不稳定
- OpenClaw 高频工具调用放大问题
完美解决:调整 Ollama 启动参数
步骤 1:重启 Ollama
pkill-f ollama
open-a Ollama
步骤 2:带参数启动 serve
OLLAMA_FLASH_ATTENTION=false \
OLLAMA_KV_CACHE_TYPE=q8_0 \
OLLAMA_NUM_GPU=10\
ollama serve &
步骤 3:启动 OpenClaw 并选小模型
ollama launch openclaw --model qwen3.5:3b
OpenClaw 配置(ollama launch openclaw --config):
-
max context / max tokens 设为 8192 或 12288
16GB 内存 Mac 的推荐低内存模型(适合 OpenClaw)
以下是社区实测(Reddit、Ollama 论坛、OpenClaw 用户群)在 16GB Mac Mini M4 上稳定跑 OpenClaw 的小模型推荐。优先选择 tool calling(函数调用)能力强的 instruct 版,内存占用控制在 ~3–8GB(Q4/Q5 量化 + 调整后 KV cache),响应速度 30–80 t/s 左右,能处理日常工具循环而不崩:
- qwen3.5:3b 或 qwen3:4b(Alibaba Qwen 系列) 命令:ollama pull qwen3.5:3b 优点:中文极强、tool calling 保守不乱调用、内存 ~3GB,OpenClaw 最稳入门款。 缺点:推理深度一般,适合简单任务。
- llama3.2:3b(Meta Llama 系列) 命令:ollama pull llama3.2:3b 优点:多语言好、tool calling 准确率高(尤其 parallel/nested calls)、上下文 128K 支持。 缺点:有时太“积极”调用工具(hammer 倾向),需调 prompt 约束。
- phi4:mini 或 phi-4-mini-instruct(Microsoft Phi 系列,~3.8B) 命令:ollama pull phi4:mini 优点:英文/代码/逻辑极强、tool calling 可靠、内存 ~3GB,速度快。 缺点:中文稍弱,但 OpenClaw 英文工具场景完美。
- gemma3:4b 或 gemma-3-4b-it(Google Gemma 系列) 命令:ollama pull gemma3:4b 优点:多语言、多模态潜力、tool calling 平衡,内存 ~3–4GB。 缺点:偶尔重复,需小上下文。
- qwen2.5:7b-instruct(如果机器留余量) 命令:ollama pull qwen2.5:7b-instruct 优点:综合最强小模型、tool calling 优秀、推理质量跳跃式提升。 缺点:内存 ~6–8GB,需严格调参数,否则易 OOM。
- 其他备选(如果上面不稳):smollm2:1.7b / ministra:3b(极小但 tool 能力已可接受),或 nanbeige4.1-3b(预算极致)。
推荐使用顺序:qwen3.5:3b(中文首选)→ llama3.2:3b → phi4:mini → qwen2.5:7b(如果余量足)。
一键启动脚本(推荐写入 ~/.zshrc)
以下脚本包含:
- 设置优化环境变量(关闭 Flash Attention、省内存 KV cache、限制 GPU 层数)
- 自动拉取 3 款最常用 16GB 友好模型(可自行修改)
- 一键启动 Ollama serve(后台)
- 一键启动 OpenClaw(默认用 qwen3.5:3b,可改)
打开终端,编辑 ~/.zshrc:
- “` nano ~/.zshrc # 或用 vim、code 等编辑器
2. 在文件末尾粘贴以下内容并保存(Ctrl+O → Enter → Ctrl+X):
# ——————- Ollama + OpenClaw 一键优化脚本(16GB Mac 专用) ——————-
“`
`
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:AI安全运营 糖果LUA 糖果LUA《在 Mac 上用 Ollama + OpenClaw 实现零成本本地 AI 助理:16GB 内存 Mac Mini M4 硬件配置运行》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。




![成果分享|[NDSS2026]跨设备认证研究:以三大用户权利筑牢登录安全防线](/images/random/titlepic/14.jpg)





评论