Files
happy-llm/.gitignore
KMnO4-zx d49819cd9d docs(chapter4): 修正奖励模型公式中的数学符号和格式错误
修复公式中的数学符号显示问题,包括 KL 散度计算和奖励函数中的点乘符号
2025-06-17 12:16:06 +08:00

3.0 KiB