【人工智能】LLM 大型语言模型发展历史

文章目录

  • 【人工智能】LLM 大型语言模型发展历史
  • 前言
  • 一、发展历史
    • 通过编写一系列的规则
    • 尝试使用神经网络模型
    • 深度学习: 基于递归神经网络
    • GPT.x —— 基于Transformer 模型
  • 二、技术原理
    • 编码器和解码器
    • 自注意力机制
    • 最大似然估计
    • 什么是“所有样本的联合概率分布”?
  • 三、应用场景