Commit Graph

1 Commits

Author SHA1 Message Date
KMnO4-zx
d49819cd9d docs(chapter4): 修正奖励模型公式中的数学符号和格式错误
修复公式中的数学符号显示问题,包括 KL 散度计算和奖励函数中的点乘符号
2025-06-17 12:16:06 +08:00