分类: 博客

「无中生有」计算机视觉探奇 (上)

作者魏秀参, 南大Lamda实验室在读博士。研究兴趣是计算机视觉和机器学习。

计算机视觉 (Computer Vision, CV) 是一门研究如何使机器“看”的科学。1963年来自MIT的Larry Roberts发表的该领域第一篇博士论文Machine Perception of Three-Dimensional Solids”,标志着CV作为一门新兴人工智能方向研究的开始。在发展了50多年后的今天,我们就来聊聊最近让计算机视觉拥有「无中生有」能力的几个有趣尝试:1)超分辨率重建;2)图像着色;3)看图说话;4)人像复原;5)图像自动生成。可以看出,这五个尝试层层递进,难度和趣味程度也逐步提升。(注:本文在此只谈视觉问题,不提太过具体的技术细节,若大家对某部分感兴趣,以后再来单独写文章讨论 :)

声明:本文为上半部分,先介绍...

阅读全文

如何做一流的研究

作者简介:朱文武,微软亚洲研究院多媒体计算组高级研究员。1999年至2004年在微软亚洲研究院分别担任网络多媒体组项目负责人及无线网络组主任研究员。2004年至2008年任英特尔中国通信技术实验室总监...

阅读全文

CMU 酸甜苦辣 - 在路上

作者:@小土刀,CMU 研究生在读,16 年 5 月毕业回国。

导读:本文是作者在 CMU 学习生活一年的感悟。

像音符一样苏醒,整片天空做背景,背起行囊的这个剪影,旅程孤独而坚定。


写在前面

大梦初醒,睁开...

阅读全文