智能感知与计算系列讲座
Lecture Series in Intelligent Perception and Computing
题 目 (TITLE):Swin Transformer和拥抱Transformer的五个理由
讲 座 人 (SPEAKER): 胡瀚 研究员,微软亚洲研究院
主 持 人 (CHAIR):张兆翔 研究员
时 间 (TIME):2021年7月16日(周五),10:00
地 点 (VENUE): 腾讯会议ID: 470 558 207 Password: 2021
报告摘要(ABSTRACT):
本次报告将介绍一种新的视觉骨干网络Swin Transformer,相比于谷歌主要为图像分类问题设计的ViT网络,Swin Transformer对于各种视觉任务都广泛有效,包括图像分类、检测和分割等等。本次报告还将梳理4年来视觉领域逐渐挖掘Transformer优点的发展脉络,并展开讲述拥抱Transformer的5个理由,希望通过这个报告让听众对于Transformer在视觉中的应用有一个整体的了解。
报告人简介(BIOGRAPHY):
胡瀚,目前是微软亚洲研究院视觉计算组研究员,于2014年和2008年在清华大学自动化系分别获得博士和本科学位,博士论文获得中国人工智能学会优博奖,博士期间曾在宾夕法尼亚大学访学,毕业后曾在百度研究院深度学习实验室工作。担任CVPR 2021/2022领域主席。目前主要研究兴趣是基本视觉建模,视觉自监督学习,以及视觉-语言联合表征学习,是Swin Transformer,关系网络系列和可变形卷积系列的作者。
|