LLM、AGI、多模态AI 篇五：基于LoRA微调ChatGLM3

12个月前发布

00

文章目录

- - 系列
  - LLaMA-Factory简介
  - 推荐硬件要求
  - 环境搭建
  - 数据准备
  - - 指令微调数据集
    - 偏好数据集
    - 自定义数据集
  - 指令监督微调
  - 合并 LoRA 权重并导出模型
  - 其他（训练全流程）
  - - 预训练
    - 奖励模型训练
    - PPO 强化学习训练
    - DPO 强化学习训练
  - 通过一站式网页界面快速上手

© 版权声明

文章版权归作者所有，未经允许请勿转载。

THE END

喜欢就支持一下吧

相关推荐