跳到主要内容

2 篇文档带有标签「模型」

查看所有标签

LLM (大型语言模型): 解读驱动 AI 时代的“超级大脑”

LLM (大型语言模型) 是什么?本词条用通俗易懂的比喻和深入的解析,为你揭示 ChatGPT 等 AI 背后的核心技术。内容涵盖 LLM 的工作原理、与人类思考的本质区别,以及微调、上下文窗口、多模态等决定其能力的关键概念。

Transformer: 引爆 AI 革命的底层架构

Transformer 架构是什么?本词条为你深度解析驱动所有现代 LLM(如 ChatGPT)的底层技术。内容涵盖其核心思想“注意力机制”、Encoder-Decoder 结构,以及多头注意力、位置编码等关键组件,并附有清晰的工作原理解析和结构图。