本文提供从头开始构建 Llama 3 模型的完整架构并对自定义数据集执行训练和推理的分步指南。 读完这篇文章后您将获得什么成果? 先决条件 现在我们知道了我们想要实现的目标,让我们开始一步一步构建一切。 步骤 1:输入块 如上图的 Llama 3 架构图所示,输入块有 3 个组件:文本/提示、标记器和嵌入。 输入块内的组件如何工作?有一句流行的说法“一图胜千言”,让我们查看下面的流程图来了解输入块内的工作流程。 让我们对输入块进行编码: 步骤 2:解码器块 如果您查看上面的架构图,解码器块由以下子组件组成。 让我们…