Tags
2 pages
后训练
LLM 学习日志 #5 后训练框架:veRL、OpenRLHF、TRL和NeMo
LLM 学习日志 #3 训练、预训练和后训练基础