文章总结: 本教程详细介绍了使用Ollama3.2和OpenWebUI在本地部署运行DeepSeekV3模型的完整流程。内容涵盖Ollama的优势特性、硬件需求分析、具体安装步骤、模型下载方法及可视化界面配置,并提供了常见问题解决方案。教程强调该方案无需编程基础和环境配置,可实现完全本地化的安全部署。 综合评分: 85 文章分类: 安全工具,解决方案,应用安全,技术标准,其他
Ollama跑DeepSeek零基础
原创
ladon ladon
306Safe
2026年6月22日 08:55 北京
在小说阅读器读本章
去阅读
本教程从零开始,手把手带你用 Ollama 3.2 + Open WebUI 在本地跑起 DeepSeek V3,全程不过 20 分钟。不需要懂 Python,不需要配 CUDA,下载即用。
一、先搞清楚:为什么选 Ollama?
Ollama 是目前最简单的本地大模型运行工具,没有之一。2026年6月发布的 3.2 版本带来三大革命性更新:
-
全系列 GPU 自动识别
:NVIDIA、AMD、Intel 核显全部开箱即用,不再需要手动装 CUDA
-
模型并行加载
:可以同时跑多个模型,切换零等待
-
Open WebUI 一键集成
:浏览器里直接用,界面比 ChatGPT 还好看
对普通用户来说,以前本地部署大模型劝退 90% 的痛点——环境配置、依赖调试、驱动兼容——Ollama 3.2 全解决了。
二、硬件门槛:你电脑够不够?
先看显存要求(不同量化版本的 DeepSeek V3):
| 量化版本 | 显存需求 | 推荐显卡 | | — | — | — | | Q4_K_M(推荐) | 约 20GB | RTX 3090/4090 | | Q2_K(入门) | 约 10GB | RTX 3080/4070 | | DeepSeek-R1:7b | 约 4.7GB | RTX 3060 以上 |
没独显也能跑! Ollama 3.2 支持 CPU 推理,8GB 以上内存的电脑跑 7B 模型没问题,只是速度慢一些。Mac 用户 M1/M2/M3 芯片原生支持,体验丝滑。
三、Step 1:安装 Ollama
Windows:
- 打开官网 ollama.com,点击 Download
- 下载 OllamaSetup.exe(约 80MB),双击安装
- 安装完成后,打开终端验证:
ollama --version # 输出: ollama version is 3.2.x
macOS:
- 官网下载 Ollama-darwin.zip
- 解压后拖入 Applications,双击启动
- 终端验证同上
Linux:
curl -fsSL https://ollama.com/install.sh | sh
四、Step 2:下载并运行 DeepSeek
跑 DeepSeek-R1:7b(4.7GB,入门首选):
ollama run deepseek-r1:7b
首次运行会自动下载模型,7b 版本约 4.7GB,网速正常 2-3 分钟下完。下载完成后直接进入对话模式,输入问题即可。
跑 DeepSeek-V3(完整版,Q4量化):
ollama run deepseek-v3
V3 完整版约 20GB,下载需要 10-15 分钟,耐心等待。
查看已下载的模型:
ollama list # 输出类似: # NAME ID SIZE MODIFIED # deepseek-r1:7b xxxxx 4.7 GB 2 minutes ago
五、Step 3:装 Open WebUI(可视化界面)
终端里聊天不够直观?装个 Web 界面,体验媲美 ChatGPT。
方法A:Docker 一键部署(推荐)
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
打开浏览器访问 http://localhost:3000,首次需要注册一个管理员账号(纯本地,不上传任何数据)。
方法B:pip 安装(无 Docker 时)
pip install open-webui open-webui serve
访问 http://localhost:8080
六、Step 4:在 WebUI 中选择模型对话
Open WebUI 会自动检测 Ollama 中已下载的模型。在左上角模型选择器中:
- 点击模型下拉框
- 选择 deepseek-r1:7b 或 deepseek-v3
- 开始对话!
实用技巧:
- 在设置中开启联网搜索,DeepSeek 会自动判断是否需要搜索
- 开启深度思考模式,DeepSeek-R1 会展示完整推理链
- 上传文档/PDF 可直接让模型基于文档内容回答
七、常见问题
Q:下载速度慢/连接超时?
A:设置代理:终端执行 set HTTPS_PROXY=http://127.0.0.1:7890(换成你自己的代理地址)
Q:显存不够报错 CUDA out of memory?
A:换小量化版本,或强制用 CPU:OLLAMA_NUM_GPU=0 ollama run deepseek-r1:7b
Q:模型回复速度慢?
A:7b 模型在 CPU 上约 5-10 token/s,GPU 上 30-50 token/s。V3 在 RTX 4090 上约 20-30 token/s。速度正常,耐心等。
总结:4步搞定——安装Ollama -> 下载DeepSeek -> 装Open WebUI -> 开始对话。你的数据全程留在本地,不上传任何云端,这就是本地部署最大的意义。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:306Safe ladon ladon《Ollama跑DeepSeek零基础》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。









评论