18 天前 / 我爱计算机视觉
本篇是对图像质量相关论文的总结。包含去噪、去模糊、去雾、去马赛克、图像 inpainting 和outpainting、图像恢复、图像着色。 共计 11 篇。如有遗漏,欢迎补充。下载包含这些论文的 WACV 2021 所有论文:『WACV 2021 开幕,更偏重技术应用,附论文下载』 图像、视频去噪 [1].Self-Supervised training for blind multi-frame video denoising 解决盲视频去噪问题 作者 |Valéry Dewil,Jérémy Anger,Axel Davy,Thibaud Ehret,Pablo Arias,Gabriele Facciolo 单位 |巴黎 - 萨克雷大学 论文 |https://arxiv.org/abs/2004.06957 代码 |https://github.com/c...
22 天前 / 我爱计算机视觉
本篇总结检索相关论文,包含视觉搜索、图像视频检索、跨域检索等。 值得关注的是由 Andrés Mafla 为一作的两篇检索类文章都入选了该会议,一篇是场景文本感知跨模态检索(StacMR)任务;一篇是融合多模态推理模块,结合文字和视觉特征对场景文本进行图像分类与检索,都取得了不错的成绩。 共计 9 篇。如有遗漏,欢迎补充。 下载包含这些论文的 WACV 2021 所有论文:『WACV 2021 开幕,更偏重技术应用,附论文下载』 视觉搜索 Structured Visual Search via Composition-aware Learning 引入 composition-aware 学习概念,用于结构化图像搜索。
29 天前 / 我爱计算机视觉
分享一篇 CVPR 2020 录用论文:PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models,作者提出了一种新的图像超分辨率方法,区别于有监督的 PSNR-based 和 GANs-based 方法,该方法是一种无监督的方法,即只需要低分辨率的图片就可以恢复高质量、高分辨率的图片。 目前代码已经开源: https://github.com/adamian98/pulse 论文信息: 作者均来自于杜克大学。 1. Motivation 图像超分辨率任务的基本目标就是把一张低分辨率的图像超分成其对应的高分辨率图像。
31 天前 / 我爱计算机视觉
本篇内容是2021 年第一篇整理类文章,也是今年 CV 领域第一个较有影响力的学术会议—— WACV 2021 的人脸相关论文,涉及到人脸重建、人脸识别、人脸表情识别、人脸热成像、人脸属性编辑以及人脸活体检测。其中还有 4 个大规模的人脸数据集值得关注。 共计 11 篇,如有遗漏,欢迎补充。 下载包含这些论文的 WACV 2021 所有论文,请点击:『WACV 2021 开幕,更偏重技术应用,附论文下载』 人脸重建 Identity Unbiased Deception Detection by 2D-to-3D Face Reconstruction 作者 |Le Minh Ng, Wei Wang,Burak Mandira,Sezer Karaoglu,Henri Bouma...
34 天前 / 我爱计算机视觉
分享一篇 2020CVPR 录用论文:Deep Face Super-Resolution with Iterative Collaboration between Attentive Recovery and Landmark Estimation,其提出了一种基于迭代合作的人脸超分辨算法。 该方法将 16x16 的低分辨率图片超分辨率为 128x128,在 CelebA 和 Helen 数据集上的 PSNR 指标分别达到了 27.37 和 26.69,超过了当前已有的人脸超分辨率算法。 目前代码已经开源:https://github.com/Maclory/Deep-Iterative-Collaboration( 目前已有 72 星标) 论文作者信息: 作者来自清华大学自动化学院、智能技术与系统国家重点实验室、北京信息科学与技术国...
35 天前 / 我爱计算机视觉
本文是对『Intra-Camera Supervised Person Re-Identification』一文的详细解读,IJCV 接收论文。 作者信息:论文链接:https://arxiv.org/abs/2002.05046 01 前言 行人重识别(person re-id, person re-identification)考虑的是一个跨摄像头关联目标人物的问题。对于传统的全监督行人重识别,为了训练得到一个性能较好的模型,大量标注好的行人数据是必不可少的。 标注行人重识别数据是一个耗时又耗力的工作。
44 天前 / 我爱计算机视觉
作者 |叶茫 武汉大学 编辑 | CV 君 报道 |我爱计算机视觉(微信 id:aicvml) 摘要:行人重识别(Person Re-Identification,简称 Re-ID),是一种利用计算机视觉技术来检索图像或者视频序列中是否存在特定行人的 AI 技术,在智慧城市等监控场景中具有重要的应用意义和前景。本文介绍我们最新的 IEEE TPAMI 综述论文 《Deep Learning for Person Re-identification: A Survey and Outlook》,该文作者来自武汉大学、起源人工智能研究院(IIAI)、北理工、英国萨里大学、Salesforce 亚洲研究院。
47 天前 / 我爱计算机视觉
2020 年顶会论文中,很多都会将关系加入到注意力机制的获取中。 除了该文,还有 2020 年 CVPR 的基于视频的 Multi-Granularity Reference-Aided Attentive Feature Aggregation for Video-based Person Re-identification、基于图像的 Relation-Aware Global Attention 等。 该方法都会在这些论文中有着很好的效果,可见这是在行人重识别领域一大发展。 论文名称:Relation-Guided Spatial Attention and Temporal Refinement for Video-Based Person Re-Identification( 基于关系引导的空间注意力和时间特征提取的基于视频的行人再识别) 第一作者:Xingz...
49 天前 / 我爱计算机视觉
今天,香港中文大学多媒体实验室(MMLab)旗下开源组织 OpenMMLab 发布新成员:MMTracking,旨在促进目标跟踪领域的研究开发。 OpenMMlab 旗下众多开源库如:MMCV, MMDetection,MMAction2 等已经拥有众多用户,成为复现顶会论文、实现项目应用的重要工具。 MMTracking 地址: https://github.com/open-mmlab/mmtracking 演示效果: 此次 OpenMMLab 开源的 MMTracking涵盖方向包括单目标跟踪、多目标跟踪、视频目标检测(Single Object Tracking (SOT), Multiple Object Tracking (MOT), Video Object Detection (VID)),既包含前沿算法的实现...
50 天前 / 我爱计算机视觉
题目:Sparse Adversarial Attack to Object Detection 论文:https://arxiv.org/pdf/2012.13692v1.pdf 代码:https://github.com/THUrssq/Tianchi04. 引言 该论文的出处是阿里天池大赛中安全 AI 挑战者计划第四期的通用目标检测对抗攻击。阿里的安全 AI 挑战者计划是一系列关于 AI 安全的竞赛,到目前为止球 200 多所高校 100 多家企业的近 4000 支队伍参加,主要目的是抵御未来 AI 面临的各种安全问题。阿里天池论坛的学习氛围很好,很多优秀的战队很详细的分享了在本次比赛的方法和代码,感兴趣的可以学习一下。
55 天前 / 我爱计算机视觉
Transformer 技术最开始起源于自然语言处理领域,但今年 5 月份 Facebook 的一篇文章将其应用于计算机视觉中的目标检测 (DETR 算法,目前已有 78 次引用)使其大放异彩,并迅速得到 CV 研究社区的关注。 已有研究表明,Transformer 在计算机视觉领域不仅适用于高级任务如图像分类、目标检测、车道线检测等,在低级任务如图像增强中也取得了突破性进展,毫无疑问,Transformer 是目前计算机视觉领域最值得关注的方向之一。 一时间,在各种视觉任务 + Transformer 的论文正如雨后春笋般涌出。
62 天前 / 我爱计算机视觉
本文转载自机器之心。 机器之心报道 作者:杜伟、小舟这是一种为 3D 点云提出的无监督胶囊架构,并且在 3D 点云重构、配准和无监督分类方面优于 SOTA 方法。 理解对象是计算机视觉的核心问题之一。传统方法而言,理解对象任务可以依赖于大型带注释的数据集,而无监督方法已经消除了对标签的需求。近来,研究人员试图将这些方法扩展到 3D 点云问题上,但无监督 3D 学习领域却进展寥寥。 近日,包括 Weiwei Sun、Andrea Tagliasacchi、Geoffrey Hinton 等来自英属哥伦比亚大学、谷歌研究院、多伦多大学的研究者提出了用于 3D 点云的无监督胶囊网络。
68 天前 / 我爱计算机视觉
近日,谷歌、UC 伯克利与康奈尔大学的研究人员公布了一篇论文 Simple Copy-Paste is a Strong Data Augmentation Method for Instance Segmentation ,使用简单粗暴的“复制 - 粘贴”术,再次刷新 COCO 数据集上目标检测与实例分割的新高度。 该论文全文无公式,也无算法流程图,介绍方法只用了 3 句话,如下: 其余全是实验,但结果异常好,其最好模型在 COCO 数据集上实例分割和目标检测任务中分别达到 49.1 mask AP 和 57.3 box AP...
71 天前 / 我爱计算机视觉
多视图立体视觉 (MVS)一直是计算机视觉研究的一个热点。它的目的是从多个已知相机姿态的图像中建立密集的对应关系,从而产生稠密的三维点云重建结果。在过去的几年里,人们在提高稠密三维重建的质量上付出了很大的努力,一些算法如 PMVS、GIPUMA 以及 COLMAP 等取得了令人印象深刻的效果。 然而,在三维重建任务中,由于数据量大、弱纹理、遮挡、反射等问题,如何高效准确地实现多视图立体视觉仍然是一个具有挑战性的问题。
82 天前 / ZEGO即构
11 月 24 日,由即构科技主办的 2020GET 大会教育科技分论坛在北京成功召开,来自叮咚课堂、小冰、360OS、蕃茄田艺术、即构科技的 6 位资深教育 / 科技大咖,在论坛上进行深度分享。 以下为 360OSAI 影像事业部总经理张焰带来的主题为《AI 视觉在教育中的应用》的演讲,我们整理了分享的核心内容,错过活动的小伙伴可以继续回看学习。 扫描下方二维码,可下载演讲 PPT 资料 张焰认为: 360AI 视觉针对在线教育痛点开发了 4 大场景解决方案,包括代替督学、量化检测、智能互动以及智能工具。他相信科技改变未来,AI 可以为教育行业起到降本增效的作用。