看看它如何改变 AI 游戏。 要点 注重事实。Meta 设计了 Llama 3.1 来减少 AI 幻觉,从而增强模型的可靠性。 可操纵性升级。Llama 3.1 为开发人员提供更多控制,确保 AI 模型满足特定需求。 令牌容量提升。Llama 3.1 中扩展的 128k 令牌提高了文档处理和响应精度。 Meta 一直致力于让人工智能关注其人工智能模型 Llama。
我之前报道过Llama 2。我也关注了 LLama 的故事,因为 Meta 在 4 月发布了LLama 3 ,有两种型号,即 8B 和 70B 型号。 好吧,每个人都喜欢电影三部曲。Meta 的“第三部电影”以Llama 3.1的形式出现,这是一个后续的 AI 模型,提供 Llama 2 开发测试中承诺的功能和特性。
故事包括 Llama 中最重要的升级,即 405B 的推出。Lllama 3.1 405B 是有史 以来发布的最 亚美尼亚 whatsapp 数据 大模型,使 Meta 在与谷歌的 Gemini和OpenAI 的 ChatGPT 的竞争中处于独特的领先地位。 Meta 为 Llama 3 的开发带来了什么 可以将 405B 类比为小型紧凑型汽车中的大型 V-8 发动机。
Meta 的博客宣称 Llama 3.1 405B 是“独一无二的,具有无与伦比的灵活性、控制力和可与最佳闭源模型相媲美的先进功能。我们的新模型将使社区能够解锁新的工作流程,例如合成数据生成和模型提炼。” 所有 LLama 3.1 模型都增加了性能改进,以便开发人员无论选择何种尺寸都能体验到类似的模型质量。
Meta 发布了一份白皮书,解释了如何在 Llama 3.1 中进行改进并针对其他基础模型进行测试。 所有 Llama 3.1 模型都采用相同的训练方法。 LLama 3.1 是在网络数据集上进行训练的,在重复数据删除和个人身份信息 (PII) 删除方面非常谨慎。我们付出了特别的努力来确保数学和推理、代码创建和多语言等性能特征的稳健性。