大模型

Llama3:8b大模型微调：手把手教你如何在本地部署自己私有化大模型

优质文章学习记录

07 Feb 2025 — 11 min read

一、为什么需要本地部署属于自己的大模型？

趋势：我们正处于AI人工智能时代，各行各业的公司和产品都在向AI靠拢。打造垂直领域的AI模型将成为每个公司未来的发展趋势。
数据安全：在无法掌握核心算法的情况下，许多公司选择使用大公司的成熟方案。然而，这涉及到数据安全的问题。训练垂直定制化的大模型需要大量数据，而数据是公司的核心资产和基石。没有公司愿意将这些关键数据上传到外部服务器，这是公司的命脉所在。
本地部署的重要性：因此，本地部署和训练自有或定制化的大模型显得尤为重要。这不仅是未来的发展趋势，也是程序员必须掌握的关键流程和解决方案。

二、如何拥有属于自己的本地大模型呢？

经过博主深入评估和多次测试，为您推荐以下解决方案：

使用 Llama3:8b 作为模型
通过 Ollama 部署
利用 Llama.cpp 进行量化优化
采用 Unsloth 进行模型训练和微调

三、为什么要选择这个方案？

1、Llama3:8b

低算力需求和成本：Llama3:8b 对计算资源的需求较小，运营成本低。
卓越的上下文记忆能力：模型能够有效记住上下文，满足业务需求。
灵活的微调能力：适应不同的业务场景和需求。
开源：社区支持强大，开发者资源丰富。

2、Ollama

活跃的生态和开发者社区：提供丰富的资源和支持。
高效的部署和运行：确保模型的稳定性和性能。
灵活的 API 接口：满足业务对训练模型的多样化需求。
开源且易于使用：降低了上手难度，适合快速开发和迭代。

3、Llama.cpp

广泛支持 Llama3:8b 的量化工具：目前市面上对 Llama3:8b 支持最好的量化工具之一。
丰富的教程资源：学习和使用成本低。
开源：开发者可以自由使用和修改，社区贡献积极。

4、Unsloth

多样化的数据集支持：能够处理不同类型的数据，适应性强。
优异的性能：训练效果显著，能够提高模型的精度。
本地训练支持：对数据隐私有更好的保护。
开源：开发者可以自由访问和修改，提升了灵活性和可控性。

四、话不多说，让我们开始吧！

1、安装 Ubuntu 【NVIDIA GPU驱动安装】

为什么需要使用 GPU 去跑我们的大模型呢？

训练时间：使用GPU可以显著缩短模型的训练时间。例如，一个复杂的深度学习模型在GPU上可能只需要几小时，而在CPU上可能需要几天甚至几周。
模型推理：在推理阶段，尤其是需要处理大量实时数据时，GPU的高并行处理能力可以提供更快的响应时间和更高的吞吐量。

虽然CPU也可以用于运行大模型，但在处理深度学习任务时，GPU的并行计算能力、计算性能和专用硬件支持使其更为适合。GPU能够显著提升大模型的训练和推理效率，降低时间和功耗成本。

一、官方方案

参考文档：

二、方案二（经实践，简单好用）

1、安装 CUDA:

官网脚本：

shell
复制代码
# 脚本文件命令（根据上述网站）
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda-repo-ubuntu2204-12-1-local_12.1.0-530.30.02-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-12-1-local_12.1.0-530.30.02-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-12-1-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt search cuda-toolkit
sudo apt-get -y install cuda

2、安装驱动： shell

csharp
复制代码
# 系统会推荐安装驱动的版本区间
sudo ubuntu-drivers devices

# 安装合适版本驱动
sudo apt-get install -y cuda-drivers-550

# 验证
nvidia-smi
watch -n 5 nvidia-smi

www.zeeklog.com - Llama3:8b大模型微调：手把手教你如何在本地部署自己私有化大模型

2、首先我们需要安装 Ollama

参考官方文档:

方案一：快速安装，只能安装最新版本，经检测最新版有Bug。

arduino
复制代码
curl -fsSL https://ollama.com/install.sh | sh

方案二：手动安装，自由灵活。

1、二进制文件下载。

ruby
复制代码
sudo curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama

历史版本下载：

2、给文件添加执行权限

bash
复制代码
sudo chmod +x /usr/bin/ollama

3、创建 ollama 用户

bash
复制代码
sudo useradd -r -s /bin/false -m -d /usr/share/ollama ollama

4、创建配置文件

bash
复制代码
vi /etc/systemd/system/ollama.service

配置文件参考

ini
复制代码
[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3

# 监听端口
Environment="OLLAMA_HOST=0.0.0.0:11434"
# 模型下载位置 （需要给 ollama用户文件夹权限： sudo chown ollama:ollama ollama/）
Environment="OLLAMA_MODELS=/home/ek-p/ollama"
# 单模型并发数量
Environment="OLLAMA_NUM_PARALLEL=100"
# Gpu选择 （如有GPU，需要在硬件安装GPU去驱动，安装文档参考下文。）
Environment="CUDA_VISIBLE_DEVICES=0,1"
# 多模型并发数量
Environment="OLLAMA_MAX_LOADED_MODELS=3"

[Install]
WantedBy=default.target

5、启动 Ollama

bash
复制代码
sudo systemctl daemon-reload
sudo systemctl enable ollama

6、查看日志

复制代码
journalctl -u ollama -r

7、问题：文件夹权限不够

ini
复制代码
May 16 16:24:25 ek-s systemd[1]: ollama.service: Failed with result 'exit-code'.
May 16 16:24:25 ek-s systemd[1]: ollama.service: Main process exited, code=exited, status=1/FAILURE
May 16 16:24:25 ek-s ollama[10780]: Error: mkdir /home/ekw-p: permission denied

bash
复制代码
sudo chown ollama:ollama ollama/

8、运行成功

继续查看日志

ini
复制代码
May 16 16:39:47 ek-s ollama[4183]: time=2024-05-16T16:39:47.384+08:00 level=INFO source=cpu_common.go:11 msg="CPU has AVX2"
May 16 16:39:47 ek-s ollama[4183]: time=2024-05-16T16:39:47.383+08:00 level=INFO source=gpu.go:127 msg="detected GPUs" count=1 library=/usr/lib/x86_64-li>
May 16 16:39:47 ek-s ollama[4183]: time=2024-05-16T16:39:47.125+08:00 level=INFO source=gpu.go:122 msg="Detecting GPUs"
May 16 16:39:47 ek-s ollama[4183]: time=2024-05-16T16:39:47.125+08:00 level=INFO source=payload.go:44 msg="Dynamic LLM libraries [cpu cpu_avx cpu_avx2 cu>
May 16 16:39:44 ek-s ollama[4183]: time=2024-05-16T16:39:44.222+08:00 level=INFO source=payload.go:30 msg="extracting embedded files" dir=/tmp/ollama1963>
May 16 16:39:44 ek-s ollama[4183]: time=2024-05-16T16:39:44.221+08:00 level=INFO source=routes.go:1034 msg="Listening on [::]:11434 (version 0.1.34)"
May 16 16:39:44 ek-s ollama[4183]: time=2024-05-16T16:39:44.220+08:00 level=INFO source=images.go:904 msg="total unused blobs removed: 0"
May 16 16:39:44 ek-s ollama[4183]: time=2024-05-16T16:39:44.220+08:00 level=INFO source=images.go:897 msg="total blobs: 0"

3、接着我们需要使用 Ollama 运行我们的大模型 Llama3:8b

1、使用 ollama 查看模型列表

复制代码
ollama list

2、下载大模型

ollama Model 库：

经检测目前比较适用的大模型为：llama3:8b

复制代码
ollama pull llama3:8b

3、运行大模型

arduino
复制代码
ollama run llama3:8b

4、测试我们的大模型

成功。

如何系统的去学习大模型LLM ？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

事实上，抢你饭碗的不是AI，而是会利用AI的人。

继科大讯飞、阿里、华为等巨头公司发布AI产品后，很多中小企业也陆续进场！超高年薪，挖掘AI大模型人才！ 如今大厂老板们，也更倾向于会AI的人，普通程序员，还有应对的机会吗？

与其焦虑……

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高。

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

二、640套LLM大模型报告合集

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

三、LLM大模型系列视频教程

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。

内容：

L1.1 人工智能简述与大模型起源
L1.2 大模型与通用人工智能
L1.3 GPT模型的发展历程
L1.4 模型工程
L1.4.1 知识大模型
L1.4.2 生产大模型
L1.4.3 模型工程方法论
L1.4.4 模型工程实践
L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。

内容：

L2.1 API接口
L2.1.1 OpenAI API接口
L2.1.2 Python接口接入
L2.1.3 BOT工具类框架
L2.1.4 代码示例
L2.2 Prompt框架
L2.3 流水线工程
L2.4 总结与展望

阶段3：AI大模型应用架构实践

目标：深入理解AI大模型的应用架构，并能够进行私有化部署。

内容：

L3.1 Agent模型框架
L3.2 MetaGPT
L3.3 ChatGLM
L3.4 LLAMA
L3.5 其他大模型介绍

阶段4：AI大模型私有化部署

目标：掌握多种AI大模型的私有化部署，包括多模态和特定领域模型。

内容：

L4.1 模型私有化部署概述
L4.2 模型私有化部署的关键技术
L4.3 模型私有化部署的实施步骤
L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉👈

Llama3:8b大模型微调：手把手教你如何在本地部署自己私有化大模型

优质文章学习记录

一、为什么需要本地部署属于自己的大模型？

二、如何拥有属于自己的本地大模型呢？

三、为什么要选择这个方案？

1、Llama3:8b

2、Ollama

3、Llama.cpp

4、Unsloth

四、话不多说，让我们开始吧！

1、安装 Ubuntu 【NVIDIA GPU驱动安装】

2、首先我们需要安装 Ollama

3、接着我们需要使用 Ollama 运行我们的大模型 Llama3:8b

4、测试我们的大模型

如何系统的去学习大模型LLM ？

与其焦虑……

一、LLM大模型经典书籍

二、640套LLM大模型报告合集

三、LLM大模型系列视频教程

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

阶段2：AI大模型API应用开发工程

阶段3：AI大模型应用架构实践

阶段4：AI大模型私有化部署

Read more

前端防范 XSS（跨站脚本攻击）

详细教程：如何从前端查看调用接口、传参及返回结果（附带图片案例）

Cursor+Codex隐藏技巧：用截图秒修前端Bug的保姆级教程（React/Chakra UI案例）

Ubuntu 搭建前端环境&Vue实战

一、为什么需要本地部署属于自己的大模型？

二、如何拥有属于自己的本地大模型呢？

三、为什么要选择这个方案？

1、Llama3:8b

2、Ollama

3、Llama.cpp

4、Unsloth

四、话不多说，让我们开始吧！

1、安装 Ubuntu 【NVIDIA GPU驱动安装】

2、首先我们需要安装 Ollama

3、 接着我们需要使用 Ollama 运行我们的 大模型 Llama3:8b

4、测试我们的大模型

如何系统的去学习大模型LLM ？

与其焦虑……

一、LLM大模型经典书籍

二、640套LLM大模型报告合集

三、LLM大模型系列视频教程

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

阶段2：AI大模型API应用开发工程

阶段3：AI大模型应用架构实践

阶段4：AI大模型私有化部署

Read more

前端防范 XSS（跨站脚本攻击）

详细教程：如何从前端查看调用接口、传参及返回结果（附带图片案例）

Cursor+Codex隐藏技巧：用截图秒修前端Bug的保姆级教程（React/Chakra UI案例）

Ubuntu 搭建前端环境&Vue实战

3、接着我们需要使用 Ollama 运行我们的大模型 Llama3:8b