10分钟读懂AI大模型,通俗易懂,小白也能轻松读懂!AI大模型看这一篇就够了

10分钟读懂AI大模型,通俗易懂,小白也能轻松读懂!AI大模型看这一篇就够了
因为产品经理可以不懂技术,这就导致在了解新技术特别困难,下面我会用极简的方式介绍什么是AI大模型。
不懂代码、不懂数学、不懂数据库,也能了解大模型。
www.zeeklog.com  - 10分钟读懂AI大模型,通俗易懂,小白也能轻松读懂!AI大模型看这一篇就够了

一、名词解释

无论是配置模型还是使用,都会遇到一些大模型相关的特有名词,所以需要先了解这些名词是什么意思才能更好的运用它。

1.1 参数

参数是指模型的大小,一般来说参数越大,模型的能力越强。大模型的参数单位一般用“B”来表示,1B代表10亿参数。

以下面的两张图为例,第一张图是阿里百炼平台的模型广场,另一张图是欧拉玛的模型广场,这里面的模型基本都会按照“名称”+“版本”+“参数”的形式分类。

参数的单位基本都是“B”,但是因为有些模型不是通用大模型,而只是适用于某些领域的小模型,所以参数量会比较小,单位为“K”或“M”。

单位包括:K(千)、M(百万)、B(十亿)、T(万亿)。

www.zeeklog.com  - 10分钟读懂AI大模型,通俗易懂,小白也能轻松读懂!AI大模型看这一篇就够了

阿里云百炼

www.zeeklog.com  - 10分钟读懂AI大模型,通俗易懂,小白也能轻松读懂!AI大模型看这一篇就够了

欧拉玛(Ollama)

参数越大那么模型就可能会占用越多的存储空间,但因为不同模型对于权重、精度、压缩技术的处理方式不同,所以参数与存储空间并不是线性关系。

你如果问7B参数大小的模型占用多少内存空间,我只能说不知道,这要看具体的模型.每家模型训练的不一样,那么相同参数的情况下所占用的存储空间也是不一样的。就好像同样是6年纪的小学生,有的身高一米五、有的身高一米七一样。

1.2 token

token是大模型处理数据的最小单位,比如一个字、一个词、一个像素、一段音轨等。

我们试着将下面的句子拆分成最小单位:

–“你好!”–,这一段话,可以将其拆分为:“你”、“好”、“!”,这三个最小单位。
–“我想吃虾丸。”–,这一段话,可以将其拆分为:“我”、“想”、“吃”、“虾丸”、“。”,这五个最小单位。

这两句话在拆分时有一点不一样,第二句话的“虾丸 ”并没有拆分成两个字,而是以词的形式做了拆分,原因是“虾丸”作为名词,已经无法在进行拆分了,如果拆分为“虾”、“丸”两个字,那就导致句子失去了原有的含义。

代码是怎么进行拆分的呢?基本逻辑就是将一句话中的词挑出来,剩下的就可以作为字来处理。

中文分词工具包括:THULAC (Tsinghua University Language Analysis and Computing、HanLP (Han Language Processing)、LTP (Language Technology Platform)等。

另外对于大模型的提供方已经内置分词功能了,或者说大模型本身就有分词能力,不需要我们在做额外工作。

1.3 上下文

一段话的周围信息就是上下文,例如连续问大模型两个问题,这两个问题及回答互为上下文。

www.zeeklog.com  - 10分钟读懂AI大模型,通俗易懂,小白也能轻松读懂!AI大模型看这一篇就够了

日常在沟通过程中,相同的问题我们会因为场景不同得出不同的结论。

开需求评审会时,我们会问技术同学、测试同学对需求有什么问题?技术同学会从技术的角度回答需求有什么问题、测试同学会从测试的角度回答测试的问题。假如此时我们冲着门外的设计同学询问他们有什么问题,设计同学会一脸懵,因为他们不知道你是因为什么原因问的这个问题。

回到图片示例的大模型问答上,当我问“包含哪些部分”时,大模型会基于第一句话理解我的意图,再做出对应的回答。

1.4 多模态

是指可以处理多种类型的数据,比如纯文字、图片、文档等,而单一模态的模型是指只能处理文字或图片或声音的模型。

下面的通义模型,可以上传图片、文字、文档数据,就是多模态大模型。

www.zeeklog.com  - 10分钟读懂AI大模型,通俗易懂,小白也能轻松读懂!AI大模型看这一篇就够了

下图的openai提供的一系列模型皆为多模态模型,可以上传图片、文字。GPT3只能输入输出文字,所以是单一模态的模型,但是目前openAI已经不提供GPT-3及以前的模型了。

www.zeeklog.com  - 10分钟读懂AI大模型,通俗易懂,小白也能轻松读懂!AI大模型看这一篇就够了

Read more

前端防范 XSS(跨站脚本攻击)

目录 一、防范措施 1.layui util  核心转义的特殊字符 示例 2.js-xss.js库 安装 1. Node.js 环境(npm/yarn) 2. 浏览器环境 核心 API 基础使用 1. 基础过滤(默认规则) 2. 自定义过滤规则 (1)允许特定标签 (2)允许特定属性 (3)自定义标签处理 (4)自定义属性处理 (5)转义特定字符 常见场景示例 1. 过滤用户输入的评论内容 2. 允许特定富文本标签(如富文本编辑器内容) 注意事项 更多配置 XSS(跨站脚本攻击)是一种常见的网络攻击手段,它允许攻击者将恶意脚本注入到其他用户的浏览器中。

详细教程:如何从前端查看调用接口、传参及返回结果(附带图片案例)

详细教程:如何从前端查看调用接口、传参及返回结果(附带图片案例)

目录 1. 打开浏览器开发者工具 2. 使用 Network 面板 3. 查看具体的API请求 a. Headers b. Payload c. Response d. Preview e. Timing 4. 实际操作步骤 5. 常见问题及解决方法 a. 无法看到API请求 b. 请求失败 c. 跨域问题(CORS) 作为一名后端工程师,理解前端如何调用接口、传递参数以及接收返回值是非常重要的。下面将详细介绍如何通过浏览器开发者工具(F12)查看和分析这些信息,并附带图片案例帮助你更好地理解。 1. 打开浏览器开发者工具 按下 F12 或右键点击页面选择“检查”可以打开浏览器的开发者工具。常用的浏览器如Chrome、Firefox等都内置了开发者工具。下面是我选择我的一篇文章,打开开发者工具进行演示。 2. 使用

Cursor+Codex隐藏技巧:用截图秒修前端Bug的保姆级教程(React/Chakra UI案例)

Cursor+Codex隐藏技巧:用截图秒修前端Bug的保姆级教程(React/Chakra UI案例) 前端开发中最令人头疼的莫过于那些难以定位的UI问题——元素错位、样式冲突、响应式失效...传统调试方式往往需要反复修改代码、刷新页面、检查元素。现在,通过Cursor编辑器集成的Codex功能,你可以直接用截图交互快速定位和修复这些问题。本文将带你从零开始,掌握这套革命性的调试工作流。 1. 环境准备与基础配置 在开始之前,确保你已经具备以下环境: * Cursor编辑器最新版(v2.5+) * Node.js 18.x及以上版本 * React 18项目(本文以Chakra UI 2.x为例) 首先在Cursor中安装Codex插件: 1. 点击左侧扩展图标 2. 搜索"Codex"并安装 3. 登录你的OpenAI账户(需要ChatGPT Plus订阅) 关键配置项: // 在项目根目录创建.