本地运行Llama3极简傻瓜教程

本地运行Llama3极简傻瓜教程
meta 4.19号放出了最新的开源模型,啪啪啪打某度的脸,甚至有网友调侃:“水一百度会开,人一百度会死”(暗讽某莆田xx西事件)!

废话不多说,开始我们的极简傻瓜教程。

Ollama 在本地简单的运行llama

Ollama 是一个简化的工具,用于在本地运行开源 LLM,包括 Mistral 和 Llama 2。Ollama 将模型权重、配置和数据集捆绑到一个由 Modelfile 管理的统一包中。Ollama 支持各种 LLM,支持的模型如下:

ModelParametersSize
Llama 38B4.7GB
Llama 370B40GB
Mistral7B4.1GB
Dolphin Phi2.7B1.6GB
Phi-22.7B1.7GB
Neural Chat7B4.1GB
Starling7B4.1GB
Code Llama7B3.8GB
Llama 2 Uncensored7B3.8GB
Llama 2 13B13B7.3GB
Llama 2 70B70B39GB
Orca Mini3B1.9GB
LLaVA7B4.5GB
Gemma2B1.4GB
Gemma7B4.8GB
Solar10.7B6.1GB

**地址:**https://ollama.com/

安装

网址:https://ollama.com/download

www.zeeklog.com  - 本地运行Llama3极简傻瓜教程

从官方网站下载 Ollama。

下载后,安装过程简单明了,与其他软件安装类似。对于 MacOS 和 Linux 用户,您可以使用一个命令安装 Ollama:

curl -fsSL https://ollama.com/install.sh | sh   

windows 也支持预览版了,但是本博主在安装过程中失败,然后放弃采用了windows wsl 在ubuntu上运行,这个在后文介绍。

运行llama3

输入命令

ollama run llama3   

界面显示如下,程序会把权重文件下载下来,默认下载的是llama3:8b。

www.zeeklog.com  - 本地运行Llama3极简傻瓜教程

下载完成,提示send a message ? 然后我们测试一个问题。

www.zeeklog.com  - 本地运行Llama3极简傻瓜教程

加个web ui来运行,更直观!

这里我采用了开源项目 open-webui,网址:https://github.com/open-webui/open-webui 。该项目的ui和chatgpt非常类似,截图如下:

www.zeeklog.com  - 本地运行Llama3极简傻瓜教程

我打算直接采用该项目的docker镜像来运行,简单快捷,假设你的电脑已经安装了docker.

下载open-webui docker镜像

docker pull ghcr.io/ollama-webui/ollama-webui:main   

启动镜像

docker run -d --network=host -v open-webui:/app/backend/data -e OLLAMA_BASE_URL=http://127.0.0.1:11434 --name open-webui --restart always ghcr.io/open-webui/open-webui:main   
如果你遇到了连接问题,通常是因为 WebUI docker 容器无法访问容器内的 127.0.0.1:11434 (host.docker.internal:11434) 的 Ollama 服务器,使用 docker 命令中的 --network=host 标志来解决这个问题,注意端口从 3000 改为 8080,导致链接:http://localhost:8080 。

访问

输入地址 http://localhost:8080 进行访问,初次访问需要注册。

配置

你需要配置Ollama 访问url(配置成http://127.0.0.1:11434) 和 选择模型,录屏如下:

测试效果

将 Ollama 与 Python 结合使用

您也可以将 Ollama 与 Python 一起使用。LiteLLM 是一个 Python 库,它提供了一个统一的接口来与各种 LLM 进行交互,包括 Ollama 运行的 LLM。要将 Ollama 与 LiteLLM 一起使用,您首先需要确保您的 Ollama 服务器正在运行。然后,您可以使用该函数向服务器发出请求。下面是如何执行此操作的示例:litellm.completion

from litellm import completion      response = completion(   model="ollama/llama3",   messages=[{ "content": "respond in 20 words. who are you?", "role": "user"}],   api_base="http://localhost:11434"   )      print(response)   

和LlamaIndex、LangChain整合使用

LangChain

from langchain_community.llms import Ollama   llm = Ollama(model="llama3")   llm.invoke("Why is the sky blue?")   

Llamaindex

from llama_index.llms.ollama import Ollama   llm = Ollama(model="llama3")   llm.complete("Why is the sky blue?")   

补充资料

什么是WSL

不知道各位小伙伴是否有听说过wsl呢?wsl的全程是Windows Subsystem for Linux,也就是windows的linux子系统,也就是我们用再安装虚拟机或者双系统,可以在windows上顺畅的运行linux。

安装指南如下:https://learn.microsoft.com/zh-cn/windows/wsl/install

在WSL中安装cuda来加速模型

前提是你的显卡是英伟达的,可以安装用来加速模型的推理,否则就要靠cpu,回答的速度会降低很多!

安装指南参考:https://github.com/ashishpatel26/Cuda-installation-on-WSL2-Ubuntu-20.04-and-Windows11

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

www.zeeklog.com  - 本地运行Llama3极简傻瓜教程

Read more

前端防范 XSS(跨站脚本攻击)

目录 一、防范措施 1.layui util  核心转义的特殊字符 示例 2.js-xss.js库 安装 1. Node.js 环境(npm/yarn) 2. 浏览器环境 核心 API 基础使用 1. 基础过滤(默认规则) 2. 自定义过滤规则 (1)允许特定标签 (2)允许特定属性 (3)自定义标签处理 (4)自定义属性处理 (5)转义特定字符 常见场景示例 1. 过滤用户输入的评论内容 2. 允许特定富文本标签(如富文本编辑器内容) 注意事项 更多配置 XSS(跨站脚本攻击)是一种常见的网络攻击手段,它允许攻击者将恶意脚本注入到其他用户的浏览器中。

详细教程:如何从前端查看调用接口、传参及返回结果(附带图片案例)

详细教程:如何从前端查看调用接口、传参及返回结果(附带图片案例)

目录 1. 打开浏览器开发者工具 2. 使用 Network 面板 3. 查看具体的API请求 a. Headers b. Payload c. Response d. Preview e. Timing 4. 实际操作步骤 5. 常见问题及解决方法 a. 无法看到API请求 b. 请求失败 c. 跨域问题(CORS) 作为一名后端工程师,理解前端如何调用接口、传递参数以及接收返回值是非常重要的。下面将详细介绍如何通过浏览器开发者工具(F12)查看和分析这些信息,并附带图片案例帮助你更好地理解。 1. 打开浏览器开发者工具 按下 F12 或右键点击页面选择“检查”可以打开浏览器的开发者工具。常用的浏览器如Chrome、Firefox等都内置了开发者工具。下面是我选择我的一篇文章,打开开发者工具进行演示。 2. 使用

Cursor+Codex隐藏技巧:用截图秒修前端Bug的保姆级教程(React/Chakra UI案例)

Cursor+Codex隐藏技巧:用截图秒修前端Bug的保姆级教程(React/Chakra UI案例) 前端开发中最令人头疼的莫过于那些难以定位的UI问题——元素错位、样式冲突、响应式失效...传统调试方式往往需要反复修改代码、刷新页面、检查元素。现在,通过Cursor编辑器集成的Codex功能,你可以直接用截图交互快速定位和修复这些问题。本文将带你从零开始,掌握这套革命性的调试工作流。 1. 环境准备与基础配置 在开始之前,确保你已经具备以下环境: * Cursor编辑器最新版(v2.5+) * Node.js 18.x及以上版本 * React 18项目(本文以Chakra UI 2.x为例) 首先在Cursor中安装Codex插件: 1. 点击左侧扩展图标 2. 搜索"Codex"并安装 3. 登录你的OpenAI账户(需要ChatGPT Plus订阅) 关键配置项: // 在项目根目录创建.