人工智能大模型中token的理解

“token”是当前语言类模型的数据单位。当前的自回归语言模型是根据 token 来作为单位进行数据处理和计算，分词（tokenization）就是将句子、段落、文章这类型的长文本分解为以 token 为单位的数据结构，把文本分词后每个词表示成向量进行模型计算。例如在英文语境下，“happy”可能被分解为“hap”、“-py”两个 token，中文语境下，“我很开心”可以分成“我”，“很”，“开心”三个 token。

转载：ChatGPT算力计算更正——更准确的参数和计算方法

在与GPT-3参数相当的开源LLM——1760亿参数的BLOOM上，4张墨芯S30计算卡在仅采用中低倍稀疏率的情况下，就能实现25 tokens/s的内容生成速度，超过8张A100。

转载：MLPref放榜！大模型时代算力领域“潜力股”浮出水面：梅开二度拿下世界第一，今年获双料冠军

ps:tokens/s表征了大模型内容生成速度。

人工智能大模型中token的理解

最新关注

热文推荐

【云原生&微服务＞SCG网关篇十二】Spring Cloud Gateway集成Sentinel API实现多种限流方式

Moment.js的基本使用

Linux系统Docker部署DbGate并结合内网穿透实现公网管理本地数据库

【洁洁送书第一期】Python高并发与高性能编程: 原理与实践

队列的基本操作(数据结构)

使用antv/G6在vue项目中开发较复杂样式流程图

人工智能大模型中token的理解

相关文章

最新关注

热文推荐