2026-03-04 10:47:02 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 文档记录了利用RTX5060Ti显卡本地微调DeepSeek-R17B模型的实战过程。内容详述了Anaconda环境配置、PyTorch与CUDA的手动安装排错、LLaMA-Factory项目部署及HuggingFace镜像设置等关键步骤。作者提供了具体的命令行操作与JSON训练集格式示例，解决了依赖下载超时等问题，为本地大模型训练提供了可操作性强的技术参考。 综合评分： 83 文章分类： AI安全,实战经验,安全开发

cover_image

5060ti显卡本地AI训练部署

原创

LRT凌日 LRT凌日

凌日网络与信息安全团队

2026年3月2日 23:12 重庆

前言

1. 前面配置的时候找了很多文章来看，都有着各种奇奇怪怪的问题，本文将记录我配置成功的一次案例供大家参考。2025年11月24日记这是我第一次实现大模型的微调训练，电脑的配置是显卡NVIDIA&nbsp;GeForce&nbsp;RTX&nbsp;5060Ti&nbsp;GPU，训练的是DeepSeek-r1&nbsp;的7B模型如果大家有更好的显卡，可以尝试一下14B。在此非常感谢CSDN的大佬，在他们的基础上，我的博客进一步完善一些细节，文末会附上大佬的原文链接。那么废话不多说，直接开始！（默认大家有一定的基础）

#

1.前置条件

1.1 基础配置

（具体的安装和使用教程网上有很多，在这里就不做过多的赘述了）

使用Anaconda （Python的环境管理工具），这样就不需要一个一个单独下载python的版本，并且使用起来很方便。

Anaconda官网(https://www.anaconda.com/download/success)

使用PyCharm （Python的集成开发环境），可以在这里面编辑、运行.py文件等操作。

PyCharm官网(https://www.jetbrains.com/zh-cn/pycharm/)

使用Git（分布式版本控制系统），用于克隆 GitHub上的优秀项目，不用也没事，可以直接下载.zip文件。

Git官网(https://git-scm.com/?hl=zh-cn)

使用CUDA 和cuDNN（用于GPU训练加速），需要注意这里面的版本关系，别下错了。

CUDA 官网(https://developer.nvidia.com/cuda/toolkit) cuDNN官网(https://developer.nvidia.com/cudnn) 5.使用PyTorch（深度学习框架），这个版本要与你自己电脑的CUDA版本对应。

PyTorch官网(https://pytorch.org/) 以上就是环境配置需要的全部内容，接下来我们就进行项目复刻。

1.2安装anaconda3

这个没什么说的，直接官网上面下载安装包，拉到本地后一直点下一步，注意：选择较大的磁盘放置，不建议放系统盘

1.3初始化环境

打开Anaconda Prompt（从Windows开始菜单找到），执行

创建新的虚拟环境

1. conda create&nbsp;-n llama python=3.10

激活虚拟环境

1. conda activate llama

安装支持 sm_120 的 PyTorch（5060ti的CUDA是12.8/12.9，选择支持你们自己电脑的CUDA的版本

1. # 先安装PyTorch CUDA版本（官方源），再安装其他依赖（清华源）
2. pip install torch==2.8.0--index-url https://download.pytorch.org/whl/cu128
3. pip install torchvision==0.23.0&nbsp;torchaudio==2.8.0-i https://pypi.tuna.tsinghua.edu.cn/simple

这个地方我没有跑动，所以采取了下述方法

1. 手动下载&nbsp;CUDA&nbsp;12.8版的PyTorch&nbsp;whl&nbsp;包

3. pip&nbsp;直接下载官方源容易超时，手动下载是最稳定的方式，步骤如下：

5. 打开浏览器，访问PyTorch官方&nbsp;cu128&nbsp;源的索引页：https://download.pytorch.org/whl/cu128/torch/
6. 在页面中找到适配你环境的&nbsp;whl&nbsp;包：我的环境是Python3.10+Windows&nbsp;AMD64，对应包名是：torch-2.8.0%2Bcu128-cp310-cp310-win_amd64.whl（%2B是+的&nbsp;URL&nbsp;编码，下载后文件名会自动还原）。
7. 点击该链接开始下载（文件大小约3.2GB），若浏览器下载慢，可复制链接到迅雷/&nbsp;IDM等下载工具，利用多线程加速。
8. 记住下载的保存路径（比如G:\AI\downloads\或C:\Users\Administrator\Downloads\）。![](https://mmbiz.qpic.cn/mmbiz_png/oltLnnib9JXSwNa8bVSI0gCib4EwFYFT1CvKTprOdgmgn75SomQdh7okRAwef52RgwALokgQ6UQicAHA4KQtbl6aW5tGRaN9icYzDIL3icIWLVA4/640?wx_fmt=png&from=appmsg&watermark=1#imgIndex=4)

10. 本地安装&nbsp;CUDA&nbsp;版PyTorch

12. 打开命令行（确保已激活llama环境），切换到&nbsp;whl&nbsp;包的下载目录，执行本地安装命令：
13. # 示例：假设包下载到了Downloads文件夹，替换为你的实际路径
14. cd C:\Users\Administrator\Downloads
15. # 执行安装（包名根据实际下载的文件名调整）
16. pip install torch-2.8.0+cu128-cp310-cp310-win_amd64.whl

验证脚本

1. import&nbsp;torch
2. print("PyTorch版本：",&nbsp;torch.__version__)
3. print("CUDA是否可用：",&nbsp;torch.cuda.is_available())
4. print("CUDA版本：",&nbsp;torch.version.cuda&nbsp;if&nbsp;torch.cuda.is_available()else"None")
5. if&nbsp;torch.cuda.is_available():
6. print("GPU设备：",&nbsp;torch.cuda.get_device_name(0))
7. print("GPU数量：",&nbsp;torch.cuda.device_count())

预期输出：

接下来就是:克隆GitHub 项目

1. #git拉取
2. pip install&nbsp;-e&nbsp;".[torch,metrics]"-i https://pypi.tuna.tsinghua.edu.cn/simple/

4. #或者镜像源直接下
5. pip install&nbsp;-e&nbsp;".[torch,metrics]"-i https://pypi.tuna.tsinghua.edu.cn/simple/

下载下来后直接pycharm打开

验证（出现版本号就成功了）

1. llamafactory-cli version

1.4下载大模型

在终端输入如下指令，修改大模型存放位置（选择一个合适足够大的存储位置

1. echo $env:HF_HOME&nbsp;="G:\AI\Hugging-Face"

修改大模型下载位置（这个一般不需要修改）

1. echo $env:HF_ENDPOINT="https://hf-mirror.com"

安装huggingface_hub（如果第一个下载爆红，可以试试第二个镜像源）

1. pip install&nbsp;-U huggingface_hub

3. #或者

5. pip install&nbsp;-U huggingface_hub&nbsp;-i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

下载训练模型

1. huggingface-cli download&nbsp;--resume-download deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

3. 如果上述有问题可采用这个办法解决：

6. 右键「此电脑」→「属性」→「高级系统设置」→「环境变量」。
7. 在用户变量或系统变量中，点击「新建」：
8. 变量名：HF_ENDPOINT
9. 变量值：https://hf-mirror.com
10. 点击「确定」保存，重启命令行窗口（环境变量生效）。
11. 直接执行简化的下载命令即可：
12. #直接使用
13. python&nbsp;-c&nbsp;"from huggingface_hub import snapshot_download; snapshot_download(repo_id='deepseek-ai/DeepSeek-R1-Distill-Qwen-7B')"

15. # 或者临时配置镜像后，指定保存路径到G盘的AI目录
16. set&nbsp;HF_ENDPOINT=https://hf-mirror.com
17. python&nbsp;-c&nbsp;"from huggingface_hub import snapshot_download; snapshot_download(repo_id='deepseek-ai/DeepSeek-R1-Distill-Qwen-7B', local_dir='G:/AI/DeepSeek-R1-Distill-Qwen-7B')"

1.5制作训练集（json格式）

1. {
2. "messages":[
3. {
4. "role":"user",
5. "content":[{"type":"text","value":"hi"}],
6. "loss_weight":0.0
7. },
8. {
9. "role":"assistant",
10. "content":[{"type":"text","value":"Hello! I am LAP酱, an AI assistant developed by BINGCHN. How can I assist you today with your CTF challenges?"}],
11. "loss_weight":1.0
12. }
13. ]
14. }

配置训练集

1.6启动LLama-Factory 的可视化微调界面（http://localhost:7860/）

1. llamafactory-cli webui

如果报错可以检查一下huggingface-hub版本，建议使用0.34.0

最后就是看后面的东西了

注：文章涉及内容仅供安全研究与学习之用，若将文章相关内容做其他用途，由使用者承担全部法律及连带责任，作者及发布者不承担任何法律及连带责任。信息及工具收集于互联网，真实性及安全性自测！！

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：凌日网络与信息安全团队 LRT凌日 LRT凌日《5060ti显卡本地AI训练部署》