【人工智能】LLM 大型语言模型发展历史

【人工智能】LLM 大型语言模型发展历史

文章目录

【人工智能】LLM 大型语言模型发展历史
前言
一、发展历史
- 通过编写一系列的规则
- 尝试使用神经网络模型
- 深度学习: 基于递归神经网络
- GPT.x —— 基于Transformer 模型
二、技术原理
- 编码器和解码器
- 自注意力机制
- 最大似然估计
- 什么是“所有样本的联合概率分布”？
三、应用场景