一只肥羊
首页时间线分类标签关于
  • 标签
  • 旋转位置编码
2024-02-06发表2024-03-06更新内容模态 / 自然语言处理40 分钟读完 (大约5985个字)

Transformer 中的 position embedding 的设计

前言

Transformer 使用 Attention 结构来进行建模,在 NLP 和 CV 领域都有比较好的效果,其主要结构如下:

Transformer architecure

如果只取左边的部分,则退化为 BERT 类结构。 如果只取右边部分,则变成 GPT 类结构。

阅读更多
mmmwhy

mmmwhy

Algorithm Engineer

beijing

文章

148

分类

22

标签

55

分类

  • 代码能力37
    • leetcode25
    • 总结12
  • 任务类型2
    • 对比学习2
  • 内容模态12
    • 图网络1
    • 多模态4
    • 自然语言处理5
    • 视觉2
  • 基础能力86
    • python26
      • python_basic16
      • python_camp10
    • pytorch5
    • tensorflow8
    • 基础工具12
    • 相关技能2
    • 相关课程16
    • 算法概念17
  • 算法项目3
  • 随笔8

From now on, bravely dream and run toward that dream.
陕ICP备17001447号-3·苏公网安备 32059002001895号

×