分类: 计算机视觉

「无中生有」计算机视觉探奇 (上)

作者魏秀参, 南大Lamda实验室在读博士。研究兴趣是计算机视觉和机器学习。

计算机视觉 (Computer Vision, CV) 是一门研究如何使机器“看”的科学。1963年来自MIT的Larry Roberts发表的该领域第一篇博士论文Machine Perception of Three-Dimensional Solids”,标志着CV作为一门新兴人工智能方向研究的开始。在发展了50多年后的今天,我们就来聊聊最近让计算机视觉拥有「无中生有」能力的几个有趣尝试:1)超分辨率重建;2)图像着色;3)看图说话;4)人像复原;5)图像自动生成。可以看出,这五个尝试层层递进,难度和趣味程度也逐步提升。(注:本文在此只谈视觉问题,不提太过具体的技术细节,若大家对某部分感兴趣,以后再来单独写文章讨论 :)

声明:本文为上半部分,先介绍...

阅读全文

如何做一流的研究

作者简介:朱文武,微软亚洲研究院多媒体计算组高级研究员。1999年至2004年在微软亚洲研究院分别担任网络多媒体组项目负责人及无线网络组主任研究员。2004年至2008年任英特尔中国通信技术实验室总监...

阅读全文

用MXnet实战深度学习之二:Neura...

作者:@phunter_la

题注:本来这是第三集的内容,但是Eric Xie勤劳又机智的修复了mxnet和cuDNN的协作问题,我就把这篇当作一个卷积网络ConvNet(CNN)神奇而有趣的例子,寓教于乐给大家提起学习兴趣,原计划的CNN教学顺延到下一集。

Neural art:用机器模仿梵高

Neural art是个让机器模仿已有画作的绘画风格来把一张照片重新绘画的算法,比如给一张猫的照片和一...

阅读全文

美丽的Lenna

来源:http://www.guokr.com/post/38131

看到这姑娘有木有会心一笑哇?对了,对于每一个学习过图像处理或者压缩技术的人来讲,这是一张标准测试图片,可是,有木有人想过,她是谁呢...

阅读全文