大白话解释交叉熵损失

本篇从 LLM 训练过程概述开始,通过"教学徒写文章"的生动比喻,帮助读者理解交叉熵损失在机器学习中的核心作用,以及如何用它来评估和优化模型的预测能力。

大模型

大白话解释 GPT 架构中的权重共享

本篇用外语学习的比喻,深入浅出地解释 GPT 架构中的权重共享技术,从听写记忆到表达记忆,帮助你理解这个提升大模型效率的核心优化策略

大模型

大白话解释反向传播算法

本篇用 CEO 追责分锅的比喻,深入浅出地解释反向传播算法的工作原理,从流水线管理到神经网络训练,帮助你理解这个深度学习的核心算法

大模型