图为参会公司招聘墙 CVPR(IEEE Conference on Computer Vision and Pattern Recognition)即IEEE国际计算机视觉与模式识别会议。该会议是计算机视觉和模式识别领域的顶级会议,在中国计算机学会推荐国际学术会议的排名中,CVPR为人工智能领域的A类会议。 |
“趴踢”现场
赌城里的计算机视觉会议
美国西部时间6月26日到7月1日, CVPR(IEEE国际计算机视觉与模式识别会议)2016在美国内华达州“天堂市”拉斯维加斯召开。连开会场所名字都显得那么纸醉金迷——凯撒皇宫酒店。
赌城是座年轻的城市,计算机视觉是更为年轻的学科。当顶级学术会议碰上世界娱乐之都,依然不可免俗地成为了世界“格子衬衫”聚会。
无论来自国际名校还是国内985高校,无论是顶级互联网公司研究员还是初创科技公司科学家,格子衬衫似乎都是这些人最为钟爱的“时尚单品”。短裤+格子衬衫+双肩包,看到这样的装束,你就找到了组织,可以快步上前,并且毫不费力地找到开场白:兄弟,今年你的paper(论文)讲的是啥?
当然,某些成功人士的穿着在格子衬衫聚会中就显得更为霸气侧漏。英伟达创始人黄仁勋着一袭标志性黑色皮衣,给学术会议的时尚感刷出新高度。
会议时间从早8点至晚7点,会议论文被分为12分钟长演讲、4分钟短演讲、现场概要讲解三个部分,“赶场”也就成为了常态。
今年的CVPR大会与往届不同,增设了企业展示环节。各大公司、高校、研究机构们的首要任务就是——招人!招人!招人!这个任务简单粗暴,完成方式也是多、快、好、省。就连苹果、谷歌、索尼等大公司的招聘广告都仅仅只有一页A4纸。大概他们觉得,彪悍的公司不需要解释。
既然是在CVPR大会招人,招聘主题自然也和大会完美贴合:机器学习、计算机视觉、深度学习、人工智能……
在这样的会议上,华人面孔不少。你还常能看到几位来自不同海外高校的中国研究者在激烈讨论时,一言不合开始飚汉语。会议现场,还有4家中国公司带来了数量较多的论文。百度研究院、腾讯研究院、滴滴研究院和商汤科技,他们或独立发表,或与高校合作研究,在这类顶尖学术会议上发出了中国企业的声音。
论文猛料
只有想不到,没有“看”不到
当然,既然是开会,分享论文和观点是正经事。
全球最优秀的计算机视觉学者、研究机构、公司在CVPR2016上进行思想展示和观点交锋,干货满满。由于篇幅所限,只能在这里浮光掠影地看几个有意思的研究。
迪士尼研究院
字认多了,也就会认图了
对,你没看错,那个出产米老鼠和唐老鸭的迪士尼,他们严肃起来也是很有科技范儿。
传统的深度学习,是向计算机“投喂”成百上千幅图片。在反复“训练”之后,让计算机识别出图片中的物体究竟是什么。是的,在识别图片这件事上,计算机确实不够聪明。
迪士尼研究院的科学家正在训练计算机通过“认字”来识别物体。这种方式“更有文化”。比如,计算机宝宝已经成功认识了“苹果”,接下来,就让它学习阅读材料,了解“梨子”和“苹果”有什么相同和不同;最后,不需要再给它灌输成千上万张梨子的图片,它也能认出“梨子”了!
迪士尼研究院的工作人员介绍,他们家的系统此前学习了包括全部维基百科在内的多达30亿英文词汇量的文章,成功掌握了超过30万个物体种类和物体之间的逻辑关系。现在,系统不单能够区分小汽车和公共汽车,还掌握了一些基础的汽车分类,比如货车、小货车、越野车等。
嗯,这系统简直堪称计算机界的学霸。
商汤科技
服饰识别,帮你买买买
托AlphaGo的福,大家都知道了DeepMind。而中国公司商汤科技给自家技术命名为“DeepFashion”,要给时尚加码科技含量。
“服饰识别与搜索”是计算机视觉最贴近日常生活的应用场景之一。免去开口询问“姑娘你这裙子在哪里买”的尴尬,高冷地掏出手机偷偷一拍,你就能收获众多同款。
但识别服装并不简单。衣物容易变形,人摆出千奇百怪的姿势,衣服的样子也会随之改变;“买家秀”和“卖家秀”的差距也常让人眼也不敢相信这是同一件衣服;另外,衣服的设计包含了领型、版型、衣长、装饰等大量细节特征,用算法区分难度颇高。
于是,研究人员用带有成百上千细节标签的图片来训练模型,将同一件服装多名拍摄者提供的图片作为计算机的学习素材;同时,在服装的若干关键点处提取特征点,以抵消衣服严重变形带来的影响。
对了,要特别感谢发展迅猛的电商网站,研究人员可以获取大量图片、大量结构化的文本信息,还有许多用户上传的同一件衣服的不同公开图片。
贴出买家秀也为科技进步做了贡献,以后“买买买”的时候,你是不是更加豪情万丈了?
麻省理工学院
别拦我,我要给黑洞拍照
这个研究真是充满着“想飞上天,和太阳肩并肩”的野心。
探索黑洞的奥秘通常是天文学家的任务,但计算机视觉科学家表示,他们也要“插一杠子”了。来自麻省理工学院、哈佛大学、谷歌公司的研究人员正在通过图像处理的手段实现一个宏伟目标——一睹黑洞的真容。
该研究小组首席研究员凯蒂在CVPR 现场解释道,黑洞距离我们非常遥远,而且质量密集。人类如果想在地球上拍摄,需要搭建一个比地球还要大的望远镜。为了获取更多图像信息,该小组计划将全球不同地点的射电望远镜收集到的信息整合在一起,已经有6个天文台加入了这个雄心勃勃的计划。
数据到手后,研究人员会通过“补丁优先连续高分辨率图像重建”算法对获取的数据进行处理,并对缺失的部分进行“估计”,进而重建完整的黑洞影像。研究者估计,预计在一年之内,人类能看到黑洞长啥样。
不知道天文学家对这一想法,是报以“呵呵”,还是点个赞呢?