大模型 - 极客日志 (Page 19)

AI机器人本地免费部署（部署Llama 3.1详细教程）

昨日，Meta公司发布了人工智能模型——Llama 3.1。那么Llama 3.1 405B的效果怎么样？我们来对比一张图，横向对比一下GPT-4。可以看出，Llama 3.1 405B在各类任务中的表现可以与GPT-4等顶级的模型相差无几。那么，我们怎样才能用到这款强大的Llama 3.1 405B模型呢？最直接的方式是通过Meta.ai平台，但目前这一途径仅对美丽国的用户开放。那有无适合平民用的大模型嘞。接下来我们将在本地部署Llama 3.1 8B（环境所迫） 1.环境准备（1）Windows10系统及以上的计算机（2）内存要求：8GB内存可运行7B模型，16GB可运行13B模型，32GB运行可33B模型（3）网络环境:不需要科学上网（翻墙）（4）小谢此次搭建的电脑环境如图，又无GPU，这配置只能搭个入门级别的大模型。若有GPU，响应速度则更快。 2.

无需专业技能，快速上手本地部署Llama3：让你的个人电脑也能高效运行

大家好，我是斜杠君。今天手把手教大家如何在本地部署Llama3，打造一个属于自己的本地大模型助手。在教大家部署Llama3之前，先要带大家了解一个概念：Ollama。 Ollama是什么？ Ollama是一个用于在本地计算机上运行大型语言模型（LLMs）的命令行工具。它允许用户下载并本地运行像Llama 3、Code Llama等模型，并支持自定义和创建自己的模型。 Ollama是免费开源的项目，支持macOS和Linux操作系统和Windows系统。它还提供了官方的Docker镜像，使用户可以通过Docker容器部署大型语言模型，确保所有与模型的交互都在本地进行，无需将私有数据发送到第三方服务。安装理解了Ollama是什么之后，让我们到官网下载Ollama程序吧~ **官网下载页面：** 因为我的电脑是windows，所以这里我下载Windows这个版本。下载好了，程序大小一共是212M。下载好后，双击点开始安装：默认安装到C盘。PS：很奇怪为什么没给个自定义安装目录的选项：（安装完成后，Win+R键调出运行窗口：在窗口中键入cmd调出控

零基础也能搞定！手把手教你打造个人专属的AI大模型，拢共分三步！

众所周知，我们已经有很多免费的大模型工具可以用，比如：文心一言：https://yiyan.baidu.com/ 通义千问：https://tongyi.aliyun.com/qianwen/ kimi：https://kimi.moonshot.cn/ 以及众多手机APP：豆包、腾讯元宝、kimi、文心一言… 但那些都是别人的，我还想要自己的，因为—— 🚀 数据隐私：在自己个人电脑上安装和使用大模型，数据不离开自己电脑，保护个人隐私； 🌐 离线访问：随时随地使用，不联网也可以正常使用； 📚 学习研究：深入理解大模型运行机制，体验新技术，满足好奇心； 💰 永久免费：部署好了就是自己的，以后都不用花钱，也不用看广告。下边是我今天在自己电脑上装的大模型，问答结果还不错。所以，我们开始吧！过程很简单，总共分三步，耗时取决于网速。 **🔧 第一步：

拥有14.3K星标的即用型AI知识库问答系统

之前三金介绍了很多 AI 大模型以及如何编写 AI Prompt 的文章，但从实际应用的维度来看，我们在使用这些 AI 产品时一般都是将它作为一个搜索引擎来使用的，并没有发挥出它应有的价值。为什么这么说呢？首先，大多数情况下我们只是通过和 AI 对话来获取自己想要的答案，一个标准的、符合预期的回答往往需要多轮对话才会产生；其次，对于一些实时信息、企业内部资料等数据，无法从此类 AI 应用上获取；最后，单纯通过和 AI 对话来完成一些任务的效率太低，无法很好地发挥 AI 的能力。而 FastGPT——一款基于 LLM 大语言模型的知识库问答系统，可以完美地解决上述问题。它提供了开箱即用的数据处理、模型调用、RAG 检索、可视化 AI 工作流编排等能力，帮助我们轻松构建复杂的 AI 应用。目前该项目在 Github 上已经拥有

To B领域最易实现的Agent应用场景（一）：DataAgent

引言随着AI浪潮的奔涌而来，企业之间（B2B）的竞争越来越激烈，企业也在不断寻求利用先进的技术来提升效率、降低成本并增强竞争优势。其中，Agent技术以其灵活性和智能化成为2B市场的一大亮点。Agent技术，尤其是数据分析Agent，正在重新定义企业如何处理和分析大量数据，以便更好地理解市场动态、客户需求和业务运营。数据分析与商业智能(BI)在中大型企业的日常运营中的重要性毋庸置疑，无论是基本的财务数据分析，还是涵盖了对复杂的客户和运营数据进行深入洞察的需求，都需要借助专业的工具。传统BI工具使用门槛高、过度依赖技术部门、结果产出周期长的问题在AI时代可以借助大模型的能力得以缓解。基于大模型的数据分析助手(Data Agent)，可以以自然语言处理的方式进行数据分析任务，无需深入了解复杂的查询语言或编程技巧。这些Data Agents能够将自然语言指令转换为具体的数据操作，如API调用、数据库查询，甚至编写专门的数据分析脚本，实现数据的提取、分析和结果的可视化。这种方法的底层架构和工作原理将AI的先进能力与数据分析需求进行结合，可以降低BI工具的使用门槛，加快洞察的获取速度

大模型

手把手教你创造你的本地私人 ChatGPT（上）：本地大模型 Ollama

如何快速安装和使用本地大模型 Ollama Ollama 是什么？近年来，人工智能技术发展迅猛，其中大型语言模型（LLM）的进步尤为引人注目。LLM 拥有海量的参数和强大的学习能力，能够执行各种复杂任务，例如生成文本、翻译语言、编写不同类型的创意内容等等。以往，想要体验 LLM，通常需要将模型部署到云端，这对于个人用户来说门槛较高，且成本不菲。现在，Ollama 的出现打破了这一限制。 Ollama 是一款开源工具，旨在将 LLM 的强大功能带到你的本地机器。通过 Ollama，可以轻松下载和运行各种 LLM 模型，而无需将数据上传到云端。 Ollama 有哪些优势？ * 1. 本地部署，数据安全：Ollama 将 LLM 模型部署在你的本地机器上，无需将数据上传到云端，数据安全更有保障。 * 1. 降低成本：与云端部署相比，使用

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow等

MaxKB = Max Knowledge Base，是一款基于 LLM 大语言模型的开源知识库问答系统，旨在成为企业的最强大脑。它能够帮助企业高效地管理知识，并提供智能问答功能。想象一下，你有一个虚拟助手，可以回答各种关于公司内部知识的问题，无论是政策、流程，还是技术文档，MaxKB 都能快速准确地给出答案:比如公司内网如何访问、如何提交视觉设计需求等等官方网址：https://maxkb.cn/ 1.1 简介 1. 开箱即用：支持直接上传文档、自动爬取在线文档，支持文本自动拆分、向量化、RAG（检索增强生成），智能问答交互体验好； 2. 无缝嵌入：支持零编码快速嵌入到第三方业务系统，让已有系统快速拥有智能问答能力，提高用户满意度； 1. 灵活编排：内置强大的工作流引擎，支持编排 AI 工作流程，满足复杂业务场景下的需求； 1. 模型中立：

RAG+Agent人工智能平台：RAGflow实现GraphRA知识库问答，打造极致多模态问答与AI编排流体验

1.RAGflow简介 * * 全面优化的 RAG 工作流可以支持从个人应用乃至超大型企业的各类生态系统。 * 大语言模型 LLM 以及向量模型均支持配置。 * 基于多路召回、融合重排序。 * 提供易用的 API，可以轻松集成到各类企业系统。 * 支持丰富的文件类型，包括 Word 文档、PPT、excel 表格、txt 文件、图片、PDF、影印件、复印件、结构化数据、网页等。 * 文本切片过程可视化，支持手动调整。 * 有理有据：答案提供关键引用的快照并支持追根溯源。 * 不仅仅是智能，更重要的是可控可解释。 * 多种文本模板可供选择 * 基于深度文档理解，能够从各类复杂格式的非结构化数据中提取真知灼见。 * 真正在无限上下文（token）的场景下快速完成大海捞针测试。 * “Quality in, quality out” * 基于模板的文本切片 * 有理有据、最大程度降低幻觉（hallucination） * 兼容各类异构数据源 * 自动化的

Ollama 本地运行大模型(LLM)完全指南

文章介绍了 Ollama 本地运行大模型（LLM）的方方面面，包括安装运行、对话、自定义模型、系统提示配置、调试、开发、存储、如何作为服务、OpenAI 的兼容等。这一年来，我已经习惯了使用线上大模型 API 来工作，只要网络在，就可以很方便地使用，同时还能享受比较好的性能。不过前两周的时候和一个客户聊系统，他们虽然现在没有应用大模型相关的能力，也没有计划安排 GPU 算力，不过他们还是执着地要在本地进行大模型的部署。我想这也是很多企业不可改变的现状。对于这部分需求，社区自然是已经有了很好而且很多的解决方案，比如 Ollama，这个 Github 已经 80.3K 星标的项目。本来这类工具做的易用性非常好（简单），一般是拿来看官网文档直接用就好，不过我在使用的时候发现，他的官网是没有专门的文档页面，只有连接到 Github 的 Markdown，搞得我连运行起来之后的默认端口都要问一下 AI。

Meilisearch 和 Ollama 实现文本向量搜索

Meilisearch 是一个开源、快速、简洁的全文搜索引擎，专为构建高性能、实时的搜索功能而设计。其主要特点如下： 1. 极速搜索：Meilisearch 使用反向索引来加速搜索查询，因此能够在海量数据中提供毫秒级的响应时间，尤其适合实时搜索需求。 1. 智能搜索：Meilisearch 支持模糊搜索、拼写纠错、同义词匹配、结果排序等功能，使得用户在搜索时无需提供完全准确的关键词。 1. 即时更新：它支持对数据的实时更新，任何数据变动都会立即反映在搜索结果中，适合频繁变动的数据集。 1. 轻量级：Meilisearch 采用 Rust 编写，内存占用较低，部署和使用都非常简单。通过一个简单的 RESTful API 即可操作，无需复杂的配置和维护。 1. 多语言支持：Meilisearch 支持多种语言的文本处理和分析，包括词形还原、停用词处理等。对于不同语言，它可以自适应提供准确的搜索结果。 1. 搜索体验优化：它不仅支持传统的精确匹配，

无需网络，手机上轻松部署本地大模型

目前支持的移动端布署方式 1. Termux 安装法优点：可以在手机上安装 Termux，然后通过该工具安装 Linux 系统，并下载和运行大模型（如 Ollama、Llama 3和Phi-3等）。缺点：安装过程复杂，涉及大量命令行操作，需要在终端中进行设置和使用，使用体验差，适合技术专家或开发者。具体安装过程参考： https://www.53ai.com/news/qianyanjishu/1795.html 总结：比较适合有一定技术背景的用户，体验不如其他方法友好。 2. MLC 优点：支持 GPU 调用，可能提升计算速度，较为推荐的方案。 AppStore可下载，安卓上使用方法参考：在手机上运行大模型（使用MLC-LLM） · Valdanitooooo/knowledge-hub · Discussion #66 · GitHub[

大模型

【免费部署】本地运行Google最强开源AI大模型Gemma：一分钱不花的完整教程

谷歌发布了轻量级开源系列模型Gemma，其性能强大，可与主流开源模型竞争。通过Ollama可轻松部署Gemma模型，并使用JANAI美化UI界面。显卡在AIGC应用中至关重要，推荐选择性能强、显存大的NVIDIA系列显卡。半个月前，谷歌搞了一波突然袭击，毫无预兆地发布了新一代AI模型Gemma，并宣称这是全球性能最强大的轻量级开源系列模型。根据Google介绍，开源模型Gemma使用了和Gemini同源的技术，总共有20亿参数和70亿参数两种规模，每个规模又分预训练和指令微调两个版本。在Gemma官方页面上，Google给出了Gemma在语言理解、推理、数学等各项标准测试中的得分，其中70亿参数模型击败了主流开源模型Llama-2和Mistral，直接登顶Hugging Face开源大模型排行榜，成为目前全球最火热的开源大模型之一。与Gemini的全家桶路线不同，Gemma这次主打轻量高性能，拥有2b、2b全量版、7b、7b全量版4种版本。其中最基础的2b模型即便是在没有独显的笔记本电脑上都能尝试运行，而规模更大的7b、7b全量版分别需要8GB和16GB显存。经