Image
Image
Image
Image
Image
Image
Image
Image
Image
Image



Search
»

Seminar abstract

视觉识别中的高分辨率深度表示学习

王井东
首席研究员
微软亚洲研究院


Abstract: 高分辨率的表示学习对于位置敏感的视觉问题而言是非常必要的,例如人体姿态估计、语义分割和物体检测等。当今性能较为领先的算法框架普遍都是先将输入图像通过由一系列高分辨到低分辨的卷积模块构成的子网络(例如ResNetVGGNet等),得到一个空间分 辦率很低的特征表达,然后从这个低分辨的表达去恢复高分辨率表达。与之不同,本次报告介绍的框架HRNet,可以在算法处理的整个流程中都保持高分辨率,其中有两个关键的要素: 1)将高分辨到低分辨的卷积模块平行化处理; 2)在网络中间不同分辨率的表达之间不断重复地交换信息。通过HRNet得到的特征表达在语义上更加丰富,在空间上也更加准确。HRNet在人体姿态估计、语义分割和问题检测等视觉问题上都取到了显著的性能提升,代码已在GitHub开源https://github.com/HRNet.

Bio: 王井东,微软亚洲研究院首席研究员,国际模式识别学会会士。担任或曾担任过CVPR、ICCV、ECCV、AAAI、 CAI、ACM MM等人工智能会议的领域主席或高级程序委员会委员。现为IEEE汇刊IEEE TPAMI, IEEE TCSVT和IEEE TMM的编委会成员曾获得ACM MM 2015最佳论文提名。其研究成果10多次转化到微软的关键产品和服务中。主要从事计算机视觉、深度学习及多媒体等领域的研究,包括神经网络结构的设计、行人姿势估计、图像分割、目标检测以及多媒体搜索等。
  Name Size

Image
PoweredBy © LAMDA, 2022