Skip to content

Main Navigation首页博客

杂项笔记&记录

跑步页面柚记友链

外观

Sidebar Navigation

前言

Attention-based Models

Bert

GPT

Self-attention

transformer

CNN

cnn

概论

DL_Note

ML_Note

此页内容

首页
深度学习笔记
GPT

GPT

约 71 字小于 1 分钟

2026-01-27

GPT 是一个 decoder-only 的 Transformer，自回归语言模型，用来“生成下一个 token”。

GPT 和 BERT 的根本区别

BERT：encoder-only，双向，看全文，做理解
GPT：decoder-only，单向，看左边，做生成

模型

贡献者

下一页Self-attention

Power by VuePress & vuepress-theme-plume

Copyright © 2025-present yyx235 | 苏ICP备2025228922号-1