这不是一个教科书目录。我们按照五大篇章把强化学习拆成循序渐进的故事, 每一章都配套20 格以上的漫画、可交互动画和逐步讲解。 即使你从未读过任何强化学习教材,也可以跟着走完全程。
点击任意篇章可跳转到对应章节。推荐从第一篇开始顺序阅读,每两篇之间标注了过渡逻辑。
每章右上角有 🎨 漫画讲解 按钮,用 14-20 格连环画告诉你算法"为什么这样设计"。
所有关键算法都有可调参数+实时动画。每个动画都附带"读懂动画"说明面板。
页面顶部的"训练目标卡"会告诉你:这个环境在干嘛、什么叫做成功、应该观察哪些指标。
每篇承前启后,形成完整的强化学习知识图谱
每个算法配 14-20 格专属连环画,层层递进讲原理、公式和直觉。完全自包含,不需要先读原书。
所有动画都有"训练目标卡"和"读懂动画"面板。多个算法支持切换不同可视化场景(如 CartPole / 寻宝 / 追踪)。
训练曲线、Q 值热力图、策略分布同步绘制,动画速度放慢便于观察细节,每个元素都有注释说明。