Llama 3.1 405B:4050亿参数史上最强开源大模型
01 。 概述 Meta公司推出了其最大的开源人工智能模型——Llama 3.1 405B,拥有4050亿个参数,与GPT-4o和Claude 3.5 Sonnet相媲美。该模型在16000个Nvidia H100 GPU上训练而成,现已在云平台上可用,并被应用于WhatsApp和Meta.ai中。它能够处理包括编码和摘要在内的八种语言任务,但仅限于文本。Llama 3.1模型拥有128000个token的上下文窗口,同时Meta还发布了更小规模的模型版本,即Llama 3.1 8B和70B。 02 。 关键信息 Meta公司推出了迄今为止最大的开源人工智能模型——Llama 3.1 405B,该模型包含4050亿个参数。虽然它并非史上最大的模型,但确实是近年来规模最大的模型之一,与OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet等领先的专有模型形成竞争。该模型使用了16000个Nvidia H100 GPU进行训练,得益于先进的训练技术,现已可在AWS、Azure和Google Cloud等云平台上下载或使用。此外,