一只肥羊
首页时间线分类标签关于
  • 标签
  • 深度学习(Deep Learning)
2021-04-09发表2022-10-08更新内容模态 / 多模态11 分钟读完 (大约1630个字)

ERNIE-ViL:Knowledge Enhanced Vision-Language Representations Through Scene Graph

背景

论文来自于百度在2020年AAAI上提出的知识增强视觉-语言预训练模型 《ERNIE-ViL: Knowledge Enhanced Vision-Language Representations Through Scene Graph》,在多个比赛上获得了 SOTA 的结果。

阅读更多
2021-03-09发表2022-10-30更新内容模态 / 多模态11 分钟读完 (大约1639个字)

CLIP :Contrastive Language-Image Pre-Training

背景

论文来自 opai 2021 年提出的一个成果,相关可参考信息: github 、 paper 。 之前其实并不太了解多模态预训练领域的成果,最近看到了这篇质量很高的成果。

阅读更多
mmmwhy

mmmwhy

Algorithm Engineer

beijing

文章

148

分类

22

标签

55

分类

  • 代码能力37
    • leetcode25
    • 总结12
  • 任务类型2
    • 对比学习2
  • 内容模态12
    • 图网络1
    • 多模态4
    • 自然语言处理5
    • 视觉2
  • 基础能力86
    • python26
      • python_basic16
      • python_camp10
    • pytorch5
    • tensorflow8
    • 基础工具12
    • 相关技能2
    • 相关课程16
    • 算法概念17
  • 算法项目3
  • 随笔8

From now on, bravely dream and run toward that dream.
陕ICP备17001447号-3·苏公网安备 32059002001895号

×