2026-06-23 06:11:59 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本教程详细介绍了使用Ollama3.2和OpenWebUI在本地部署运行DeepSeekV3模型的完整流程。内容涵盖Ollama的优势特性、硬件需求分析、具体安装步骤、模型下载方法及可视化界面配置，并提供了常见问题解决方案。教程强调该方案无需编程基础和环境配置，可实现完全本地化的安全部署。 综合评分： 85 文章分类： 安全工具,解决方案,应用安全,技术标准,其他

cover_image

Ollama跑DeepSeek零基础

原创

ladon ladon

306Safe

2026年6月22日 08:55 北京

在小说阅读器读本章

去阅读

本教程从零开始，手把手带你用 Ollama 3.2 + Open WebUI 在本地跑起 DeepSeek V3，全程不过 20 分钟。不需要懂 Python，不需要配 CUDA，下载即用。

一、先搞清楚：为什么选 Ollama？

Ollama 是目前最简单的本地大模型运行工具，没有之一。2026年6月发布的 3.2 版本带来三大革命性更新：

全系列 GPU 自动识别

：NVIDIA、AMD、Intel 核显全部开箱即用，不再需要手动装 CUDA
模型并行加载

：可以同时跑多个模型，切换零等待
Open WebUI 一键集成

：浏览器里直接用，界面比 ChatGPT 还好看

对普通用户来说，以前本地部署大模型劝退 90% 的痛点——环境配置、依赖调试、驱动兼容——Ollama 3.2 全解决了。

二、硬件门槛：你电脑够不够？

先看显存要求（不同量化版本的 DeepSeek V3）：

| 量化版本 | 显存需求 | 推荐显卡 | | — | — | — | | Q4_K_M（推荐） | 约 20GB | RTX 3090/4090 | | Q2_K（入门） | 约 10GB | RTX 3080/4070 | | DeepSeek-R1:7b | 约 4.7GB | RTX 3060 以上 |

没独显也能跑！ Ollama 3.2 支持 CPU 推理，8GB 以上内存的电脑跑 7B 模型没问题，只是速度慢一些。Mac 用户 M1/M2/M3 芯片原生支持，体验丝滑。

三、Step 1：安装 Ollama

Windows：

打开官网 ollama.com，点击 Download
下载 OllamaSetup.exe（约 80MB），双击安装
安装完成后，打开终端验证：

   ollama --version # 输出: ollama version is 3.2.x

macOS：

官网下载 Ollama-darwin.zip
解压后拖入 Applications，双击启动
终端验证同上

Linux：

curl -fsSL https://ollama.com/install.sh | sh

四、Step 2：下载并运行 DeepSeek

跑 DeepSeek-R1:7b（4.7GB，入门首选）：

ollama run deepseek-r1:7b

首次运行会自动下载模型，7b 版本约 4.7GB，网速正常 2-3 分钟下完。下载完成后直接进入对话模式，输入问题即可。

跑 DeepSeek-V3（完整版，Q4量化）：

ollama run deepseek-v3

V3 完整版约 20GB，下载需要 10-15 分钟，耐心等待。

查看已下载的模型：

ollama list # 输出类似: # NAME &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;ID &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;SIZE &nbsp; &nbsp;MODIFIED # deepseek-r1:7b &nbsp; &nbsp; &nbsp;xxxxx &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;4.7 GB &nbsp;2 minutes ago

五、Step 3：装 Open WebUI（可视化界面）

终端里聊天不够直观？装个 Web 界面，体验媲美 ChatGPT。

方法A：Docker 一键部署（推荐）

docker run -d -p 3000:8080 &nbsp; --add-host=host.docker.internal:host-gateway &nbsp; -v open-webui:/app/backend/data &nbsp; --name open-webui &nbsp; --restart always &nbsp; ghcr.io/open-webui/open-webui:main

打开浏览器访问 http://localhost:3000，首次需要注册一个管理员账号（纯本地，不上传任何数据）。

方法B：pip 安装（无 Docker 时）

pip install open-webui open-webui serve

访问 http://localhost:8080

六、Step 4：在 WebUI 中选择模型对话

Open WebUI 会自动检测 Ollama 中已下载的模型。在左上角模型选择器中：

点击模型下拉框
选择 deepseek-r1:7b 或 deepseek-v3
开始对话！

实用技巧：

在设置中开启联网搜索，DeepSeek 会自动判断是否需要搜索
开启深度思考模式，DeepSeek-R1 会展示完整推理链
上传文档/PDF 可直接让模型基于文档内容回答

七、常见问题

Q：下载速度慢/连接超时？

A：设置代理：终端执行 set HTTPS_PROXY=http://127.0.0.1:7890（换成你自己的代理地址）

Q：显存不够报错 CUDA out of memory？

A：换小量化版本，或强制用 CPU：OLLAMA_NUM_GPU=0 ollama run deepseek-r1:7b

Q：模型回复速度慢？

A：7b 模型在 CPU 上约 5-10 token/s，GPU 上 30-50 token/s。V3 在 RTX 4090 上约 20-30 token/s。速度正常，耐心等。

总结：4步搞定——安装Ollama -> 下载DeepSeek -> 装Open WebUI -> 开始对话。你的数据全程留在本地，不上传任何云端，这就是本地部署最大的意义。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：306Safe ladon ladon《Ollama跑DeepSeek零基础》