2026-03-09 02:55:17 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 文档介绍在16GB内存MacMiniM4上使用Ollama搭配OpenClaw搭建零成本本地AI助理的方法。针对内存不足导致的崩溃问题，提出关闭FlashAttention、调整KVcache类型、限制GPU层数等优化措施。推荐qwen3.5:3b、llama3.2:3b、phi4:mini等低内存模型，并提供一键启动脚本实现稳定运行，兼顾隐私保护与快速响应。 综合评分： 85 文章分类： AI安全,安全工具,实战经验,应用安全,安全运营

cover_image

在 Mac 上用 Ollama + OpenClaw 实现零成本本地 AI 助理：16GB 内存 Mac Mini M4 硬件配置运行

原创

糖果LUA 糖果LUA

AI安全运营

2026年3月6日 16:28 北京

OpenClaw 需要调用大语言模型完成各类功能，使用商用大语言模型 API 需要支付一定费用。某些特殊场景可以使用 Mac 上的本地大语言模型，通过 Ollama 启动 OpenClaw，让本地 Ollama 大语言模型为 OpenClaw 提供模型服务。这样不仅零成本，还能保护隐私、响应更快。

已关注

关注

重播分享赞

关闭

观看更多

退出全屏

切换到竖屏全屏退出全屏

AI安全运营已关注

分享视频

，时长00:06

0/0

00:00/00:06

切换到横屏模式

继续播放

[ ]

进度条，百分之0

播放

00:00

00:06

倍速

全屏

倍速播放中

0.5倍 0.75倍 1.0倍 1.5倍 2.0倍

超清流畅

您的浏览器不支持 video 标签

继续观看

在 Mac 上用 Ollama + OpenClaw 实现零成本本地 AI 助理：16GB 内存 Mac Mini M4 硬件配置运行

观看更多

转载

在 Mac 上用 Ollama + OpenClaw 实现零成本本地 AI 助理：16GB 内存 Mac Mini M4 硬件配置运行

AI安全运营已关注

分享点赞在看

已同步到看一看写下你的评论

视频详情

第一步：安装 Ollama（Mac 用户最简单方式）

打开浏览器，访问 Ollama 官方网站：https://ollama.com
点击 “Download for Mac” 下载 Ollama.dmg 文件。
双击 .dmg，将 Ollama.app 拖到 应用程序 文件夹。
打开 Ollama.app，菜单栏出现小鲸鱼图标即启动成功。
验证：终端输入 ollama --version
测试：ollama run phi4:mini 输入“你好”试试。

如果你 Mac 主机是 24GB 或 32GB 内存配置，通过 Ollama 在本地运行 8B 规模大语言模型完全没问题。但在 16GB 内存的 Mac Mini M4 上直接跑较大的模型容易崩溃（API error 500，model runner stopped）。

为什么 16GB Mac Mini M4 容易崩溃？

统一内存压力大（KV cache + OpenClaw 长上下文）
Metal 后端 + Flash Attention 不稳定
OpenClaw 高频工具调用放大问题

完美解决：调整 Ollama 启动参数

步骤 1：重启 Ollama

pkill-f&nbsp;ollama
open-a&nbsp;Ollama

步骤 2：带参数启动 serve

OLLAMA_FLASH_ATTENTION=false&nbsp;\
OLLAMA_KV_CACHE_TYPE=q8_0&nbsp;\
OLLAMA_NUM_GPU=10\
ollama serve&nbsp;&

步骤 3：启动 OpenClaw 并选小模型

ollama launch openclaw&nbsp;--model&nbsp;qwen3.5:3b

OpenClaw 配置（ollama launch openclaw --config）：

max context / max tokens 设为 8192 或 12288

16GB 内存 Mac 的推荐低内存模型（适合 OpenClaw）

以下是社区实测（Reddit、Ollama 论坛、OpenClaw 用户群）在 16GB Mac Mini M4 上稳定跑 OpenClaw 的小模型推荐。优先选择 tool calling（函数调用）能力强的 instruct 版，内存占用控制在 ~3–8GB（Q4/Q5 量化 + 调整后 KV cache），响应速度 30–80 t/s 左右，能处理日常工具循环而不崩：

qwen3.5:3b 或 qwen3:4b（Alibaba Qwen 系列）命令：ollama pull qwen3.5:3b 优点：中文极强、tool calling 保守不乱调用、内存 ~3GB，OpenClaw 最稳入门款。缺点：推理深度一般，适合简单任务。
llama3.2:3b（Meta Llama 系列）命令：ollama pull llama3.2:3b 优点：多语言好、tool calling 准确率高（尤其 parallel/nested calls）、上下文 128K 支持。缺点：有时太“积极”调用工具（hammer 倾向），需调 prompt 约束。
phi4:mini 或 phi-4-mini-instruct（Microsoft Phi 系列，~3.8B）命令：ollama pull phi4:mini 优点：英文/代码/逻辑极强、tool calling 可靠、内存 ~3GB，速度快。缺点：中文稍弱，但 OpenClaw 英文工具场景完美。
gemma3:4b 或 gemma-3-4b-it（Google Gemma 系列）命令：ollama pull gemma3:4b 优点：多语言、多模态潜力、tool calling 平衡，内存 ~3–4GB。缺点：偶尔重复，需小上下文。
qwen2.5:7b-instruct（如果机器留余量）命令：ollama pull qwen2.5:7b-instruct 优点：综合最强小模型、tool calling 优秀、推理质量跳跃式提升。缺点：内存 ~6–8GB，需严格调参数，否则易 OOM。
其他备选（如果上面不稳）：smollm2:1.7b / ministra:3b（极小但 tool 能力已可接受），或 nanbeige4.1-3b（预算极致）。

推荐使用顺序：qwen3.5:3b（中文首选）→ llama3.2:3b → phi4:mini → qwen2.5:7b（如果余量足）。

一键启动脚本（推荐写入 ~/.zshrc）

以下脚本包含：

设置优化环境变量（关闭 Flash Attention、省内存 KV cache、限制 GPU 层数）
自动拉取 3 款最常用 16GB 友好模型（可自行修改）
一键启动 Ollama serve（后台）
一键启动 OpenClaw（默认用 qwen3.5:3b，可改）

打开终端，编辑 ~/.zshrc：

“` nano ~/.zshrc # 或用 vim、code 等编辑器

2. 在文件末尾粘贴以下内容并保存（Ctrl+O → Enter → Ctrl+X）：

# ——————- Ollama + OpenClaw 一键优化脚本（16GB Mac 专用） ——————-

“`

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：AI安全运营糖果LUA 糖果LUA《在 Mac 上用 Ollama + OpenClaw 实现零成本本地 AI 助理：16GB 内存 Mac Mini M4 硬件配置运行》