Avatar 🍥

Fain的Blog

博士生在读,AI infra/LLM算法绝赞学习中,目标是成为世一码

  1. 首页
  2. 文章
  3. 关于
  4. 项目仓库
    1. Dark Mode

Categories

开发日志 学习日志

Tags

VLLM 推理引擎 训练框架 Megatron 预训练 后训练 高性能网络 VeRL 算法 运维
开发日志

Femtotron开发日志 #11 监督微调 Supervised Fine-Tuning, SFT

Tuesday, May 19, 2026 3 minutes read
开发日志

Femtotron开发日志 #10 ZeRO-3、SAC和PP:一个简单的显存节省收益数据测试和分析

Monday, May 18, 2026 3 minutes read
开发日志

Femtotron开发日志 #9 流水线并行 Pipeline Parallelism

Sunday, May 17, 2026 12 minutes read
开发日志

Femtotron开发日志 #8 选择性激活检查点 Selective Activation Checkpointing

Friday, May 15, 2026 7 minutes read
开发日志

Femtotron开发日志 #7 ZeRO-3模式:抽象设计、Bug排查和教训总结

Wednesday, May 13, 2026 9 minutes read
开发日志

Femtotron开发日志 #6 ZeRO-1和ZeRO-2模式:抽象设计、工程实现和占位符

Monday, May 11, 2026 9 minutes read
开发日志

Femtotron开发日志 #5 数据并行 Data Parallelism

Saturday, May 9, 2026 12 minutes read
开发日志

Femtotron开发日志 #4 混合精度训练

Friday, May 8, 2026 4 minutes read
开发日志

Femtotron开发日志 #3 逸闻:记一次掉卡故障的排查和分析

Monday, April 27, 2026 1 minute read
开发日志

Femtotron开发日志 #2 训练框架中的TP并行模式,工厂模式、注册表模式和函数修饰器

Monday, April 27, 2026 8 minutes read
1 2 3 4
© 2026 Fain的Blog
Built with Hugo
Theme Stack designed by Jimmy