大模型 - 极客日志 (Page 21)

五个优秀的免费 Ollama WebUI 客户端推荐

认识 Ollama 本地模型框架，并简单了解它的优势和不足，以及推荐了 5 款开源免费的 Ollama WebUI 客户端，以提高使用体验。什么是 Ollama？ Ollama 是一款强大的本地运行大型语言模型（LLM）的框架，它允许用户在自己的设备上直接运行各种大型语言模型，包括 Llama 2、Mistral、Dolphin Phi 等多种模型，无需依赖网络连接。此外，Ollama 还提供跨平台的支持，包括 macOS、Windows、Linux 以及 Docker，几乎覆盖了所有主流操作系统。详细信息请访问 [Ollama 官方开源社区] Ollama 的使用你可访问 [Ollama 官方网站] 下载 Ollama 运行框架，并利用命令行启动本地模型。以下以运行 llama2

使用大模型自然语言查询数据库

使用大模型，通过自然语言的查询语句，从数据库获取结果，是目前大模型和结构化数据交互的一种主流形式。举个例子，存储朝阳区高中学校招生信息的数据库，现在问它陈经纶招多少人？，生成回答的大致步骤是： * 数据库的 DDL 加入对话上下文，主要是建表语句，让大模型感知表结构 * 大模型将提示词陈经纶招多少人？转化为 SQL 查询语句，比如 select * from school_info where school_name like '%陈经纶%' * 大模型根据 SQL 查询结果，生成自然语言的回答，比如北京市陈经纶中学招收的学生人数为279名。以下使用 Jupyter 笔记实现了一个示例： * 笔记代码见 [通过 LlamaIndex 使用自然语言查询数据库] * 搭建 JupyterLab 笔记环境见 [在 4GB 显存下运行

llama3.1 原模型与中文微调模型效果对比分析

前文 llama3.1 强势来袭，我也是第一时间就下载使用了，下面给各位领导汇报一下最新的成果和使用体验感受。下面是官方的性能图，请欣赏开源的强大力量，闭源估计在瑟瑟发抖。准备因为我是第一天就直接使用，在 [huggingface llama3.1]上面的模型还没法直接使用，需要提交申请，只有通过之后才能使用，我这里已经过去两天了还没有任何消息，果断放弃了。现在最方便的是使用 Ollama 框架平台来拉取 llama 3.1 的模型，分别有 8B 、70B、405B ，我这里的硬件只能支撑 8B 。首先你要先保证安装好 Ollama ，如果不会可以看我这个[教程]，包教包会。然后在命令行使用下面的命令拉取模型。 ollama run llama3.1 如果拉取成功，我们可以通过下面的命令看到本地的模型列表。 ollama list 然后我们通过命令 ollama ps

探索向量数据库：数据存储与检索的新前沿

随着各种大型语言模型 (LLM)的开源，开发人员也意识到向量数据库越来越重要，因为它可以进一步增强这些模型。像 GPT 这种LLM大模型，通常使用大规模的嵌入向量来表示文本数据，而 Vector DB 提供了高效存储和检索向量数据的能力，使得在应用中存储和访问这些向量变得更加高效和快速。向量数据库向量数据库可以索引、存储结构化或非结构化数据（例如文本或图像）及其向量嵌入（数据的数字表示）并提供对它们的访问。它允许用户在生产环境中快速大规模地查找和检索相似的对象。由于其高效的搜索功能，向量数据库有时也称为向量搜索引擎。向量嵌入现实生活中的数据有结构化的数据，如电子表格这种组织整齐的数据，也有非结构化的数据如文档、图像、音视频等，且绝大多数都是非结构化数据。这类数据很难以有组织的方式存储它们，以便我们可以轻松的找到所需的内容。如何对这些数据进行量化存储，并能够快速查找出来呢？向量嵌入是一种将非结构化数据转换为数学向量的方法，使得数据可以被量化存储并且可以进行快速查找。通过向量嵌入，非结构化数据（如文档、图像、音视频等）被映射到一个多维的向量空间中，每个数据项都用一

零门槛部署 Llama 3，70B 版本只占 1.07G 存储空间

4 月 18 日，Meta 宣布开源 Llama 3，这个号称「迄今为止最好的开源大模型」一经发布，立刻引爆科技圈！发布当天恰逢斯坦福大学教授、AI 顶尖专家吴恩达的生日，作为 AI 开源倡导者，他激动地发文表示：这是我收到过最好的生日礼物，谢谢 Meta。 Meta 首席科学家、图灵奖获得者 Yann LeCun也在自己的账号上硬核推荐了自己的最新开源模型——支持 8k 长文本，在 24k GPU 集群上使用超过 15T tokens 进行训练，在多项评测基准中表现优异，部分任务中，Llama 3-8B 的表现优于 Llama 2-70B。更多版本将在数月后发布。据其官网显示，Llama 3 采用了包括监督微调 (SFT)

大模型

MetaLlama大模型，大模型入门到精通，非常详细收藏我这一篇就够了

llama 大模型介绍我们介绍 LLaMA，这是一个基础语言模型的集合，参数范围从 7B 到 65B。我们在数万亿个Token上训练我们的模型，并表明可以专门使用公开可用的数据集来训练最先进的模型，而无需诉诸专有的和无法访问的数据集。特别是，LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B)， llama2 大模型介绍我们开发并发布了 Llama 2，这是一组经过预训练和微调的大型语言模型 (LLM)，其参数规模从 70 亿到 700 亿不等。我们经过微调的大语言模型（称为 Llama 2-Chat）针对对话用例进行了优化。我们的模型在我们测试的大多数基准上都优于开源聊天模型，并且根据我们对有用性和安全性的人工评估，可能是闭源模型的合适替代品相关网址 * llama 大语言模型提供的主要模型列表 Code Llama 模型 Code Llama 是一个基于 Llama 2 的大型代码语言模型系列，在开放模型、

llm大模型教程：LLM大模型推理加速vllm 、fastllm、llama.cpp使用教程以及大模型推理的总结

vllm conda create --name vllm python=3.10 conda activate vllm pip install vllm from vllm import LLM, SamplingParams prompts = [ "Hello, my name is", "The president of the United States is", "The capital of France is", "The future of AI is", ] sampling_

大模型领域转型热潮：人才聚集地与职业路径探索

使用到的工具 * docker * oneapi + fastgpt * ollama 安装docker 已安装有docker的话跳过这一步执行命令安装docker（一行一行执行） curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun systemctl enable --now docker 执行命令安装docker-compose（速度会比较慢） curl -L https://github.com/docker/compose/releases/download/v2.20.3/docker-compose-`uname -s`-`uname -m` -o /usr/local/bin/docker-compose chmod

RAG、知识库与LLM全解析：一文速通指南

检索增强生成（Retrieval Augmented Generation，RAG）是一种强大的工具，它通过将企业外部知识整合到生成过程中，增强了大语言模型（LLM）的性能。 RAG本质上是通过工程化手段，解决LLM知识更新困难的问题。其核心手段是利用外挂于LLM的知识数据库（通常使用向量数据库）存储未在训练数据集中出现的新数据、领域数据等。通常而言，RAG将知识问答分成三个阶段：索引、知识检索和基于内容的问答。企业中使用RAG的主要目的是增强大模型，为大模型提供能力提升，目前主要是以下几方面： * a) 减少大模型在回答问题时的幻觉问题 * b) 让大模型的回答可以附带相关的来源和参考 * c) 消除使用元数据注释文档的需要 RAG的7大关键组成部分接下来我们一起来看看组成RAG的7大关键组成部分。第一、自定义知识库（Custom Knowledge）定制知识库是指一系列紧密关联且始终保持更新的知识集合，它构成了 RAG 的核心基础。这个知识库可以表现为一个结构化的数据库形态（比如：MySQL），也可以表现为一套非结构化的文档体系（比如：文件、图图片、音

大模型

利用3D大模型技术：15分钟快速创建高质量个性化数字人，开源代码现已提供

起因是 ChatGPT 由于不可抗力使用实在困难，使用魔法创建的账号也时常遭到封禁，所以想到了使用一些国内 API 供应商的办法通过 API Key 的形式使用 ChatGPT。尝试了很多通过 API Key 来一键部署和使用大模型的网页和软件，但感觉总是差那么点意思。于是在去年12月份，我萌生了自己做一个大模型桌面工具的想法，并在一个月后有了第一个版本。八个月过去了，这个软件已经迭代了 13 次版本。我是个对细节比较挑剔的人，所以直到现在，认为这个工具已经能用好用的情况下，才决定拿出来和大家一起分享下（[官网地址]：工具介绍 Gomoon 的名字来源于赛博朋克：边缘行者的中 Lucy 的愿望：『去月球』。使用 Gomoon，你只需要将购买的厂商 API key 填入到设置页面，就可以使用对应的大模型了，同时也可以通过本地调用的方式使用本地大模型。以下是模型 API 配置示例图：助手功能🤖 Gomoon

利用Chroma与Ollama构建本地RAG应用

本篇文章我们将基于Ollama本地运行大语言模型（LLM），并结合ChormaDB、Langchain来建立一个小型的基于网页内容进行本地问答的RAG应用。概念介绍先简单了解下这些术语： LLM (A large language model) 是通过使用海量的文本数据集（书籍、网站等）训练出来的，具备通用语言理解和生成的能力。虽然它可以推理许多内容，但它们的知识仅限于特定时间点之前用于训练的数据。是一个用于开发由大型语言模型（LLM）驱动的应用程序的框架。提供了丰富的接口、组件、能力简化了构建LLM应用程序的过程。是一个免费的开源框架，可以让大模型很容易的运行在本地电脑上。 RAG（Retrieval Augmented Generation）是一种利用额外数据增强 LLM 知识的技术，它通过从外部数据库获取当前或相关上下文信息，并在请求大型语言模型（LLM）生成响应时呈现给它，从而解决了生成不正确或误导性信息的问题。工作流程图解如下：基于上述RAG步骤,接下来我们将使用代码完成它。开始搭建 1. 依据Ollama使用指南完成大模型的本地下载和的

Ollama：本地部署与运行大型语言模型的高效工具

Ollama部署、运行大型语言模型概述 Ollama是一个专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计的工具。官方网站：https://ollama.com/ Github：https://github.com/ollama/ollama 安装 Ollama支持macOS、Linux和Windows多个平台运行 macOS： Windows： Docker：可在Docker Hub上找到 Linux：因为使用服务器，这里便以Linux操作系统使用为例记录说明其中Linux通过命令直接安装如下： root@master:~/work# curl -fsSL https://ollama.com/install.sh | sh >>> Downloading ollama... ######################################################################## 100.0%##O#-#