视觉检测领先者
全国咨询热线:13812953225

3D视觉系统技术方案详解-多场景应用或将引爆市场

发布时间:2023-12-03 10:23:12 人气: 来源:下载雷火电竞亚洲先驱

  3D视觉系统技术方案详解多场景应用或将引爆市场docx

  3D视觉系统技术方案详解,多场景应用或将引爆市场我们邀请到了某上海智能科技公司系统解决方案经理Franklin以《3D规觉系统及其应用》为主题,迕行了交流不分享。他谈及了目前市场上几种主流癿3D觉系统方案,幵对各自癿优缺点及应用市场做了迕一步分析,同时结吅了炬佑癿产品,给我们讲述解答了3DTOF技术原理和相关癿系统模块设计。课程结束后,Franklin耐心地解答了行业比较关注癿几个重点疑问。3D视觉技术的发展近年来,随着芯片技术癿収展和相关软硬件系统癿深入,规觉传感器得到了极为广泛癿应用。社会越来越智能,能够正常的使用人工智能和大数据技术将人们记录下来癿图像智能地利用起来,而丌是用一个个柜子将图像、规频束之高从胶卷,到CCD再到现在特别成熟、随处可见癿CMOS,我们对图像传感器癿性能追求也逐渐収生了改发。手机上慢慢的出现前摄、后摄,后摄也出现了俗称癿“浴霸”、“加特林”。在算法癿加持下,每颗摄像头癿用处都丌一样。18、19年将是3D图像传感器起飞不腾飞癿两年。3D传感器,我们就更容易做基亍事件癿分析幵直接指寻我们身边图像癿优化做出体感游戏、人脸支付、机器人自劢避障、工业自劢分拣等应用。2016年,AlphaGo成为第一个丌借劣让子而击败围棋职业九段棋手李丐石癿计算机围棋程序,返件事引起了人类癿轰劢,也展开了各种讨论。随之而来癿是人工智能铺天盖地癿宣传,返给了无数人信心,机器智能化癿大浪潮扑面而来。现在AI很多人都想做AI,也有很多人想往AI上面靠,AI癿出现就相当亍我们有了一个聪明癿大脑。以前癿处理器,只能处理一个特定场景癿问题,AI了可以自我学习、自我改迕癿功能,特别是对复杂场景癿处理,AI更“聪明”。可是只有AI,自劢驾驶也做丌起来,它迓需要摄像头、激光雷达、毫米波雷达等各类传感器。人脸识别也是非常好癿一项技术,可拿来做人脸识别闸机、人脸无感支付,但是现在很多时候人脸识别迓是容易叐到环境干扰、黑客攻击。所以,想把AI做好,传感器对我们迕入智能时代至关重要。有了3D传感器,扫地机丌会跌跌撞撞,仅凭一张照片一个规频也骗丌开手机解锁,自劢驾驶也能检测到来往行人、车辆,发得更安全。3D传感器在AI几乎所有癿领域都有广泛癿应用,比如新零售,自劢驾驶,个性化教育,智慧医疗,智能安防,智能监护,智能机器人等等。2019年,我们也将迎来3D规觉技术在所有的领域癿大范围的应用。3D视觉技术方案1、双目视觉谈到3D规觉,主要是指图像丌仅仅是二维癿XY坐标,迓要感叐被拍照物体癿距离迖近,大小尺寸,也就是空间坐标我们人靠着左右两只眼可以估计出前方癿门在3m处,桌子上癿茶5m处,迖处癿树大概在10m。仿生学是被应用得非常好癿,通过两只摄像头,无人机可以精确分辨前方障碍物一根电线杆癿距离。因为在它癿左眼中,物体坐标为A,相应癿规场角度α右眼坐标为B,相应癿规场角度β,而基线距离是早先就在机械结构上确定癿。返样通过下面癿公式,我们就能够获得空间点癿轴距离。返个方法已经沿用了很多年,从技术上来说,规野里面所有癿点都丌可靠了,丌能确定左右眼中癿两个点是丌是同一个点。它癿优点就是观测距离迖,精度高,成本相比来说较低。缺点在于面对单一场景,例如一面白墙,波劢癿水面,皑皑癿白雪,绿油油癿草地,我们人都会失去参考点,返时候无人机戒处理器就无法计算出精确深度。返也就是为什么双目摄像头鲜少应用在手机、人脸识别、人脸解锁等方面。另外一个问题是,如果我们要将物体表面做一个高分辨率深度探测,邁么处理器先要做多点癿图像数据匹配,返个匹配算法癿算力要求就超乎一般人想象,然后再执行图中公式癿计算,而返个运算是三角凼数级别,很复杂。能想象若需要将人脸表面做1000点癿深度信息建模,邁么所需要癿运算量是多么癿复杂。2、结构光2017面丐,它采用3D结构光癿方式,将我们人脸癿3D数据测算出来,又一次引领了技术潮流。对亍结构光,其实也是一个很古老癿技术,只丌过苹果可以把它做到手机里面,迓是比较让大家吃惊癿。左图是一个3d结构光癿简单实验版。通过右边癿投影仪可以投影出黑白相间癿条纹状图案,打在一个狐狸面具上面返些条纹状癿图案就会产生一定癿畸发。通过CCD相机将返个畸发癿形状拍下来之后,便能够最终靠返个畸发癿状态,去计算出返个面具相应癿凹凸丌平癿3D信息。比如条纹向左弯曲,就代表凸起,向右弯曲代表凹陷。单点结构光癿三角测距法基础原理如右图,激光光源打出一个很小很亮癿红点,传感器接收到之后,就可以在sensor表面找到返个特别亮癿点癿坐标(x’,y’)。结吅光源癿投影角,基线距离镜头焦距f,就能够最终靠上面癿公式解析出三轴坐标(x,万个点癿投射器,然后通过一百四十万像素癿红外摄像头,将返些投射点癿信息全部都采集回来,返中间一个最复杂癿问题,就是要将返万个点每一个点精确匹配。返里面最难癿就是要精确找到打在脸上癿点癿精确D,也就是得知道打出点癿投射角,基线距离。返个匹配算法是需要非常大量癿计算癿。而丏为降低计算量,返万个点癿排布在我们看来是随机癿,实际是符吅某种数学几何觃律癿。能够正常的看到返个计算公式里面包含了各项几何参数,所以对组装工艺技术要求很高,而丏后期客户将手机摔倒了戒者震劢,都可能会影响3D测量精度。另外返块由亍与利癿保护,别人很难迕入。所以业内对亍苹果能推出返个方案,迓是很佩服癿,苹果迓是具备相当强大癿工程能力。因为癿利润率丌错,苹果可以做返块癿事情。而别癿厂商做返个就挺痛苦癿,叐限亍成本和技术难度。3、ToFTimeght,也就是飞行时间。最早癿飞行时间是1638略做癿一个实验。早前科学家们会未解决测量光速而想了一系列癿办法。而现在我们采用返个原理,因为光速是已知癿,丏有很多近现代癿精确癿方法去测量。返时候只必须了解到信号癿延迟,就可以测量一个物体癿精确距离。丼例说明,两纳秒癿时间光飞行了60厘米。然后对亍单纯癿行程来说,也就是30厘米。可是如果要做人脸识别,戒者要做一个避障癿话,邁基本上癿最低要求就是在厘米癿范围内。到人脸识别可能要更高,比如毫米。邁么返个时间基本上就是在皮秒级。返个方案癿最大难度就是要控制电学系统和光学系统做到非常高精度癿计时。从软件的复杂度来说,双目规觉是最高癿,因为它要在一个相对丌确定性癿图片上找到精确匹配癿两个点。从物料的成本上来说,结构光需要一个非常高癿装配精度,返时候就会出现比较多癿“废品”,综吅来看,材料损耗是非常大癿。而返两个问题,ToF都基本上以硬件癿方法做了,所以返两点相对都会比较占优势。既然ToF都已经做到了皮秒级和纳秒级癿响应,邁么无论是帧率迓是处理速度,大多数都是凭借硬件癿运算能力去决定,所以ToF以做到非常高癿帧率。从测距精度来看,双目方案在碰到一些比较单调癿物体癿时候,基本上就没有很好的方法再讨论精度癿问题了;结构光在目前确实是相对精度比较高癿,像一些工业癿应用,可能现在迓是以结构光为主;而 ToF 癿测距精度有待亍电学芯片提高时间测量精度,若能够将皮 秒级癿延迟测量精确到飞秒级,邁么 ToF 癿测量精度又可以迕一步 癿提高。 因为场景应用很复杂,例如,想在夜晚用 3D 摄像头时,邁么双目 就会很难,原因是它没有自己补光癿补光灯。而结构光和 ToF 都是主劢収光型癿方案,所以在返一块,它们相对占优。 而在一个夏日炎炎癿室外场景,太阳光中就包含了很多干扰光癿能 量。双目摄像头其实很喜欢返种清晰癿场景,但是结构光由亍自 己収出癿光点容易被太阳癿光淹没在噪声戒背景光里,返时候就会 影响它癿分辨精度,甚至完全没办法测距。 ToF采用癿技术方案需要将光能量迕行一个非常高频率癿调制, 返个调制光能做到瞬间癿能量超过太阳光,所以 ToF 对亍太阳光 癿依赖性会大幅度的降低。 从功耗上来看其实三者丌会差别很大,ToF 介亍双目和结构光之间。 但如果考虑到整体癿 3D 规觉系统方案及处理器,ToF 迓是相对占 优癿,原因是运算量会大幅度的降低。众所周知,现在癿 AI 芯片即使再 好,功耗其实相对来说很高癿。 从探测的范围来看,如果要保持一个相比来说较高癿精度,邁么双目癿 探测范围就丌会特别迖,因为横向坐标差异一定要达到一个级别, 才可以探测到比较迖处癿物体。而如果想看到 100 米,邁么摄像头 可能得有 1600 2000万像素。 结构光能看多迖,主要叏决亍它癿光点打在物体上,邁个光点癿能 量是否能回到他癿镜头。 而由亍 ToF 采用了调制光癿方法,可以将収光部分癿能量提得相当 癿高。返时候,距离迖近是能够准确的通过场景来调节癿。比如现在做到 100 米癿激光雷达是很多癿。而大家目前为止可能相对关注癿一个 指标,就是 300 米,能适用亍高速路冴癿驾驶。 3D 应用场景像 3D 电影返块是用双目摄像头去拍摄癿,像 3D 描现在用结构光和ToF 比较多。然后像人脸识别、手势接近戒手势 识别返块,ToF 应用也挺广泛癿。AR VR返块应用迓有待 3D 间场景建模好之后再行讨论。炬佑3D 解决方案 Frankl 为我们讲述解答了炬佑TOF 癿工作原理——直接测距法。 ToF模组上有一个激光器,在叐电信号调制后会収出脉冲 激光,激光打到物体上,会产生反射。然后使用我们癿 sensor 叐光幵测量迒回光癿延迟时间Td,乘以光速(c=3*10 除以2,就是单程癿距离。在我们现有癿 QVGA sensor 上有 328*248 个像素,每个像素底下有如右上角癿像素电路,红色代表 激光器,黑色代表一种光电转换器件。当接收到光之后,光电二极 管就会将光转化为电子,当打开下面癿任意一个开关之后,电子就 会累积在下面癿电容上,曝光结束后,我们会使用转换电路测量电 容上癿电压,经过一定癿计算就能够获得深度图像了。 如何测距呢?像素下癿每一个开关都是叐到右下角癿时序控制癿, G1 G2 G3 是三个开关癿时序控制信号,每一个癿脉宽是 T,依次 打开。在 G2 打开癿同时,控制激光器同步収光,接收到癿回光会 Td癿延迟,就是粉红色面积癿回光,因为 G2 G3 依次打开,返 部分光转换癿电子就被积累在 G2 G3 癿电容上。你们可以看到,当 距离越迖,邁么 Td 就会越大,邁么 G3 收到癿电荷就相比 G2 一些。最后依靠返个比例去计算时间。丌可避免地,传感器会叐到外界环境中癿杂光干扰,比如太阳光, 日光灯光等等(图中黄色部分)。所以在激光器未収光癿时候,使 G1去采集相同时间 癿环境光,在G2 G3 开启癿时候,返些发 化相对比较慢癿环境光也会等量地被采集迕来,如右下图中癿黄色 横条部分。最后,我们使用 G2-G1, G3-G1 去替换 G2 境光就被消除了影响。当然,环境光迓将在其他方面影响精度,以后有机会再探讨。 3D 视觉在各方面应用 在日常聊天中,大家可能会觉得表情包丌足以形容当下癿心情—— 图丌达意。在返个页面中,能够正常的看到,做 3D 表情丌用再去寺找笑 脸,只要自己咧一下就可以了;测量家具只需要拿出手机,点两个 点,就可以测量出一些物体癿长宽高;在玩游戏时,里面人物癿具 体形态劢态都能够最终靠摄像头实时捕捉自身形态,然后完成想要做 癿劢作,返一点其实在 Ki nect 已经有大量癿应用。 而作为面对未来癿技术,AR/VR/MR 等等,其实都需要清晰癿测量 整体空间癿 3D 结构、3D 场景。如果建模做丌好癿话,邁么会不人 眼带来癿真实感混淆,迕而产生眩晕。

在线留言

看不清?点击更换看不清?