当前位置: 首页 » 人物专访 » 行业精英 » 正文

从图像识别转战视频编码 他的研究视角不太一样

记北京智源人工智能研究院院长、国家人工智能标准化总体组副组长黄铁军


  来源: 科技日报 时间:2019-07-15 编辑:伊敏
分享到:



比如,黄铁军巧妙地捕捉到,监控视频具有背景相对不变的特点,提出了基于场景建模的视频编码方法。仅靠这项技术,就把视频编码的效率提高了1倍。“采用现行标准,全国3千万个摄像头采集的视频,若保质保量存储3个月的内容就需要2千亿元。用上这项技术后,等量的内容存储成本可降至500亿元。”他说。

云计算改变了信息的应用和服务模式,但大量摄像头拍摄的视频很难传至云端,于是黄铁军又“脑洞大开”。

“传到‘云’里的视频不是给人看,而是给机器‘看’(进行分析识别),所以只要传回机器识别所需的视觉特征就可以了。”他说,采用这个技术思路,视频传输流量可减少90%以上,大大减轻了传输压力。

基于上述两项创新成果,由黄铁军牵头的团队获得了2017年度国家技术发明奖二等奖。

在新领域屡创佳绩的黄铁军,却一直没忘了自己的“老本行”——图像识别。在该研究领域,他依旧体现出了与众不同的研究视角。

长久以来,一些科学家习惯以人类自身为标准思考机器如何“看”,以为机器视觉和人类视觉一样,但黄铁军却不这么认为。

“人总喜欢把自己的感受强加于别人,现在又强加于机器。一些人单纯地以为,把视频给机器看,机器就能识别,这种思路有些局限。”黄铁军说,其实机器能比人“看”得更准、更快。

于是,跳出人类思维局限,打造真正的机器视觉,即类脑视觉,成了黄铁军当下的目标。

做真正有价值的东西

由黄铁军牵头研制的超速全时仿视网膜芯片,便是他们向类脑视觉走出的探索一步。黄铁军把这款芯片,比作新一代人工智能的“电眼”。

它能干什么?“举例来说,在高速旋转的电风扇叶片上写2个字,电风扇转起来后,人眼看到的是模糊一片,‘电眼’却能把字看得清清楚楚。”他说,“电眼”可用在人工智能界的“网红”无人驾驶汽车、无人机和智能机器人上。

该芯片的研制团队中,有计算机科学、神经科学、医学等众多领域的专家,形成了一个强大的跨学科队伍,他们从生物和信息两个角度进行探索,最终才研制成功。

因为设计这只“电眼”,让黄铁军有机会将视频编码与“老本行”图像识别结合起来,运用上这两种不同领域的技术。“以前,我们实验室里的学生分两拨搞研究,一拨做图像识别,一拨做视频编码,就像两条并行的铁轨。现在,他们可以一起做项目,按照全新的技术体系,创造新的可能。”他说。

实验室的学生对科技日报记者说,开放性思维是黄铁军的标志性特点。“黄老师善于从全局角度看问题,常会把两种看似没有关系的事物联系在一起,让它们碰撞出火花。”

在生活中,黄铁军也依旧如此。他喜欢跟性格各异、领域不同的人打交道,他说这样能通过别人的视角来发现新问题。

对科研,黄铁军表示自己喜欢另辟蹊径,反对跟随和模仿。“以前,一些科研人员十分注重成果的数量,现在则更重视开拓科研‘无人区’。科研人员应该珍视自己的学术生命,做真正有价值的东西,否则你所做的事情就会像沙滩上的脚印,一阵浪打过来就会无影无踪。”他说。


关键词:智能 芯片 机器    浏览量:6553

声明:凡本网注明"来源:仪商网"的所有作品,版权均属于仪商网,未经本网授权不得转载、摘编使用。
经本网授权使用,并注明"来源:仪商网"。违反上述声明者,本网将追究其相关法律责任。
本网转载并注明自其它来源的作品,归原版权所有人所有。目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。如有作品的内容、版权以及其它问题的,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。
本网转载自其它媒体或授权刊载,如有作品内容、版权以及其它问题的,请联系我们。相关合作、投稿、转载授权等事宜,请联系本网。
QQ:2268148259、3050252122。


让制造业不缺测试测量工程师

最新发布
行业动态
人物专访
国际资讯
仪商专题
按分类浏览
Copyright © 2023- 861718.com All rights reserved 版权所有 ©广州德禄讯信息科技有限公司
本站转载或引用文章涉及版权问题请与我们联系。电话:020-34224268 传真: 020-34113782

粤公网安备 44010502000033号

粤ICP备16022018号-4