视觉检测领先者
全国咨询热线:13812953225
产品中心
当前位置:首页 > 产品中心

视觉算法工程师:赋予机器“思维力”的人

发布时间:2024-02-03 04:27:25   来源:下载雷火电竞亚洲先驱

李雪像往常一样来到公司附近的商场里购物,她注意到,商场里入驻了一家新的服装店,正是她常穿的品牌,...

产品介绍

  李雪像往常一样来到公司附近的商场里购物,她注意到,商场里入驻了一家新的服装店,正是她常穿的品牌,在开业促销的诱惑下,她不假思索走进新店,几刻钟后,李雪高兴地结账离去。她不知道,在她心满意足离开的背后,是当下新零售的营销结果。

  现今,商场的摄像头功用早已不 止于防盗监控,在这些机器的后面,有多双眼睛,它们透过摄像头,观察形形的来往行人,把他们的各种特征变成一个个数据,用来分析他们的消费需求,挖掘他们的商业经济价值。黄轩便是在背后观察他们的其中一双眼睛。

  黄轩从事的专业是计算机视觉,这是一门研究怎么样使机器“看”的科学。更进一步地说,是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。

  2009年,黄轩从中国科学技术大学完成本硕学习后,选择了去美国一家公司做图像算法工程师,两年的工作经历让他萌生进一步深造的想法,他决定去AI相关学科研究出色的爱丁堡大学进修计算机视觉博士。“当时国外的AI领域相关学科研究发展比国内要领先,我比较看好人工智能这个行业的前景,所以想要到国外去看一看。”黄轩说。

  在黄轩读博期间,国内的人工智能也开始在复苏蒸蒸日上。互联网推动了人工智能不停地改进革新和实用,深度学习与大数据的兴起带来了人工智能的爆发。人工智能作为一项基础技术,渗透至各行各业,并助力传统行业实现跨越式升级,提升行业效率,正在慢慢地成为掀起互联网颠覆性浪潮的新引擎。

  2015年7月,国务院印发《关于积极地推进“互联网+”行动的指导意见》,人工智能首次被作为其主要的十一项行动之一。意见明白准确地提出,依托网络站点平台提供人工智能公共创新服务,加快AI核心技术突破,促进AI在智能家居、智能终端、智能汽车、机器人等领域的推广应用;要逐步推进计算机视觉、智能语音处理、生物特征识别、自然语言理解、智能决策控制以及新型人机交互等关键技术的研发和产业化。

  2016年,“人工智能”概念进入“十三五”重大工程;2017年,人工智能首次被写入政府工作报告,国务院发布《新一代AI发展规划》,人工智能进入十九大报告,发布《促进新一代AI产业发展三年行动计划(2018-2020年)》;2018年,国家标准化管理委员会宣布成立国家人工智能标准化总体组、专家咨询组,人工智能再次被写入政府报告……

  随着进入国家顶层设计层面,人工智能呈现出“全面开花”的盛况。一方面,全球互联网科技公司纷纷加入布局AI领域,提前“圈地”者更是慢慢的开始获得了丰厚的营收;另一方面,基础研究的进步使得人工智能的商业化得到了很好的支撑,众多人工智能勇于探索商业模式的公司涌现。

  正是因为看到国内良好的AI发展氛围,2018年2月,黄轩决定辞掉了在美国的工作,回国加入到云天励飞,一家专注在计算机视觉领域的初创公司,研究服饰识别、商品识别等技术。

  “比如说,一个人穿着什么样的衣服,衣服是什么品牌、款式、潮流、颜色,包括戴不戴眼镜,年龄,性别等,这些都帮助机器去做对这个人的描述,对这个人的理解,然后机器可以把一个人的外在特征与商业经济价值连接起来。” 黄轩说,“比如一个人带着小孩,机器就会知道推荐母婴用品、儿童教育类商品。”

  黄轩的日常工作,除了领导团队开发前沿的AI产品外,是向计算机里敲入一行行的代码,这些代码构成一个个模型,模型通过学习各种各样的数据,形成和人一样的判断力和分辨力,这样一来,计算机就能够理解它“看到”的东西是怎么一回事,能有什么用。这一过程,称作算法的成功实现。换言之,算法成功实现一次,如同人做了一遍认知或思考。

  算法相当于机器的思维力,黄轩便是赋予机器思维力的人。“让机器能够像人一样用眼睛去看世界,去理解这样一个世界。”黄轩进一步对记者表示,“其实我们就在解决一个问题。希望在这波人工智能浪潮里,实现用机器去理解人,用机器去理解在商场里的人在做什么,在想什么,他们要什么。”

  三个月前,李雪换了新的智能手机,“听说这款手机人脸识别更快更好!”她说。2019年,使用3D传感器的摄像头正在成为智能手机的“标配”。

  在进入消费级领域之前,人脸识别技术的落地应用已经在安防领域打开了广阔市场,机场、高铁站、火车站、通关口岸纷纷进驻人脸识别闸机,与此同时,安防与数字金融领域安全上的严格也对人脸识别技术提出了更高的要求,摄像头的传感器也从2D向3D升级。

  “一般的传感器摄像头获取到的信息还是二维的,我们要把二维的照片还原成三维场景结构,这里面用到的基础原理其实和我们人眼还是很相近的。人眼看一个场景是,左眼看一处,右眼看一处,由于看的主体距离不一样,所以左右眼接收回来的场景信息是有时差的,就是说你左眼看到的东西画一张图,右眼也画一张图,这两张图片它是不一样的。然后我们大脑会利用这些时差去把场景的三维计算出来。”徐玉华向记者介绍,“但是计算机没人脑这么聪明,它获取了照片以后,需要运行一套立体匹配的算法,或者叫图像匹配的算法,找到图像各处的对应点,计算出距离,然后再根据一些几何的结构知识,才能够实现一个三维场景的重建。”

  在黄轩跳槽回国同期,徐玉华从部队退役加入了以在AI行业三维视觉见长的奥比中光。“奥比中光的创始人在我服役期间与我相识,希望我加入,我挺看好这个行业和此公司,便来了。”徐玉华说。在此之前,他在火箭军部队里做着图像测量与视觉导航相关的工程师工作,已经积累了不少3D视觉和计算机视觉方面的经验。

  “人脸识别用2D的传感器它也能做,但有很大的可能性拿一张照片来识别也能蒙混过关,所以防伪就很差了。所以我们做的东西是要恢复人脸的三维形貌,不仅有二维信息,还有我们三维的形貌,对于三维的信息做识别,做分割,会更迅速识别也更可靠。”徐玉华说。

  徐玉华除了日常的写代码工作,还与组内同事做相关的技术探讨研究。“其实像人工智能的话,它各种技术的更新换代还是蛮快的,所以科技公司的研发是很重要。我们现在一边在做3D传感器去开拓市场,一方面我们也在研发这样的领域最先进的最可能技术,更好的新的实践方式。”

  为了更好的实现人工智能的广阔应用前景,人工智能技术的快速发展以及各类型人工智能初创公司更好的成长,从2017年开始,政策的重点已经从AI技术转向技术和产业的融合,特别是2017年7月国务院印发的《新一代AI发展规划》精确指出要“加快人工智能深度应用”。

  2019年,整个AI行业将面临“期中考”,业界对AI的要求不再是诉诸理想,而是要规模化落地。

  而科研成果紧紧围绕着经济社会持续健康发展需求,推进人工智能产业化,才会形成科学技术创新和产业应用相互促进的良好发展局面。奥比中光相关负责人对记者表示:“其实在一开始的时候,我们最终选择做消费级的3D传感器,一种原因是看到了市场有这样一个需求,二是在国内来说,在技术上有这样的一片空缺,然后才去做这方面的研发。”

  从2018年两会的发言也能够准确的看出,人工智能+产业的融合将是未来的重点,包括科技部、工信部、民政部等官方部门和百度、腾讯、联想等民间代表,均提出了人工智能+产业、人工智能+交通、人工智能+零售......

  黄轩认为,他现在的工作便是属于人工智能赋能零售业的体现:“机器的判断都会反馈给商家,让商家知道,经过或者进入过他店里的消费的人都有咋样的喜好和消费能力,让商家能够做出更精准的营销投放,更精准的营销投放带来的便是营业额的增加。”

  黄轩说:“现在做的事情跟以前做学术是非常不一样的,做学术可能只是追求在一个圈上有一个小突破,像是在整个人类的知识图库里添砖加瓦;而在商业上,是要实现从产品到研发,系统开发,软件工程等整个闭环,要实现最终的商业经济价值,要连接用户的。人工智能要落地,说的是产品能实现某一部分有市场的价值。”返回搜狐,查看更加多