这不是一个教科书目录。我们按照五大篇章把强化学习拆成循序渐进的故事, 每一章都配套20 格以上的漫画、可交互动画和逐步讲解。 即使你从未读过任何强化学习教材,也可以跟着走完全程。
点击任意篇章可跳转到对应章节。推荐从第一篇开始顺序阅读,每两篇之间标注了过渡逻辑。
从第一篇顺序读到第五篇,每页底部都有"上一章 / 下一章"导航和过渡文案,循序渐进建立完整知识图谱。
每章都配一篇零公式散文,像和朋友聊天一样讲清算法"为什么这样设计"。打开算法页点顶部「🍵 通俗理解」即可阅读。
想看公式推导、伪代码和工程坑点?切到「📐 深入学习」版本,结构化章节 + LaTeX 公式 + 对比表一次到位。
算法页内置可调参数 + 实时动画,多个算法还支持切换可视化场景(CartPole / 寻宝 / 追踪…)。"训练目标卡"和"读懂动画"面板帮你看懂每个元素。
每篇承前启后,形成完整的强化学习知识图谱
每个算法配 14-20 格专属连环画,层层递进讲原理、公式和直觉。完全自包含,不需要先读原书。
所有动画都有"训练目标卡"和"读懂动画"面板。多个算法支持切换不同可视化场景(如 CartPole / 寻宝 / 追踪)。
训练曲线、Q 值热力图、策略分布同步绘制,动画速度放慢便于观察细节,每个元素都有注释说明。