基于Transformer 的编码器和解码器结构 - 前瞻产业研究院

登录/注册购买服务

数据图表行业分析研究报告免费报告产业周报企业数据大屏产业链产业热力图

搜索

基于Transformer 的编码器和解码器结构

发布时间：2024-10-28

随着基于Transformer各类语言模型的发展以及预训练微调范式在自然语言处理各类任务中取得突破性进展，从2020年OpenAI发布GPT-3开始，大语言模型研究也逐渐深入。虽然大语言模型的参数量巨大，通过有监督微调和强化学习能够完成非常多的任务，但是其基础理论也仍然离不开对语言的建模。Transformer结构完全通过注意力机制完成对源语言序列和目标语言序列全局依赖的建模，当前几乎全部大语言模型都是基于Transformer结构。基于Transformer结构的编码器和解码器结构如下图所示，左侧和右侧分别对应着编码器(Encoder)和解码器(Decoder)结构。它们均由若干个基本的Transformer块(Block)组成(对应着图中的灰色框)。这里N×表示进行了N次堆叠。

下载原图

相关报告：《2024-2029年中国大模型产业发展前景与投资战略规划分析报告》

相关图表推荐

2024-07-17

2022-2023年中国大语言模型市场规模及测算
2024-07-17

中国代表性大语言模型产品商业化进程
2024-07-17

大语言模型技术分类总结
2024-07-17

截至2023年中国大型语言模型国家层面发展政策汇总(三)
2024-07-17

截至2023年中国大型语言模型国家层面发展政策汇总(二)
2024-07-17

截至2023年中国大型语言模型国家层面发展政策汇总(一)
2024-07-17

全球大语言模型发展时间线
2024-07-17

中国大语言模型产业生态图谱
2024-07-17

中国大语言模型产业链
2024-07-17

OpenAI 使用的大规模语言模型构建流程