【深度相机术语与概念】

作者:是刘彦宏吖日期:2025/10/5

获取相机输出的 深度图、灰度图、彩色图 和 点云图,用于导航、避障、三维建模、手势识别等应用。

【深度相机术语与概念】

相机类型

3D 相机

3D 相机是一种能够捕捉三维图像的相机。它通过各种技术手段(如立体视觉、飞行时间、结构光等)获取物体的三维形状和深度信息。3D 相机可以生成具有 3D 空间坐标信息的点云数据,使得计算机能够理解和处理三维空间中的物体。

  • 主动双目立体相机

主动双目立体相机是一种结合了双目立体视觉和主动光源(如结构光)的相机系统。它通过投射已知的光图案到场景中,并使用双目相机捕捉这些图案的变形,从而提高深度测量的精度和鲁棒性。主动双目立体相机在低光照条件下表现尤为出色,适用于各种复杂环境中的3D成像。

  • 飞行时间相机

ToF(Time of Flight)飞行时间相机是一种通过测量光信号从相机发射到物体并反射回来的时间差来计算距离的 3D 相机,可以广泛应用于机器人导航、手势识别、3D扫描等领域。根据工作原理和应用场景的不同,ToF 相机可以分为以下几种类型:

  • 直接 ToF 相机(dToF)

直接 ToF 相机通过测量光脉冲从发射到接收的时间来计算距离。这种相机通常使用激光或LED作为光源,具有高精度和快速响应的特点。直接ToF相机适用于需要高精度深度测量的应用,如工业自动化、机器人导航和3D扫描。

  • 间接 ToF 相机(iToF)

间接 ToF 相机通过测量连续调制光信号的相位差来计算距离。这种相机通常使用调制的红外光源,具有较高的抗干扰能力和较低的功耗。间接ToF相机广泛应用于消费电子产品,如智能手机、平板电脑和游戏设备中的手势识别和人脸识别。

  • 立体匹配

立体匹配是一种计算机视觉技术,用于从双目立体相机拍摄的两幅图像中找到对应的像素点。通过比较左右图像中的像素,计算它们之间的视差,从而推算出物体的深度信息。立体匹配是双目立体视觉系统中的关键步骤,影响深度图的精度和质量。

  • 结构光

结构光是一种通过投射已知的光图案(如条纹、网格、点阵)到场景中,并分析这些图案在物体表面的变形来计算深度信息的技术。结构光系统通常包括一个投影仪和一个相机,通过捕捉和处理变形后的图案,可以生成高精度的三维图像。结构光广泛应用于3D扫描、工业检测、手势识别等领域。

相机部件

  • 彩色图像传感器

一种能够捕捉和记录彩色图像的传感器,通过光电二极管和滤光片阵列将光信号转换为电信号,并经过图像处理生成彩色图像。

  • 透镜组

镜头,透镜组。通常由一块或者多块光学玻璃组成的透镜组,一般由凹透镜、凸透镜,或其组合组成。用于汇聚,折射光线,将光线投射到图像传感器上。

  • ISP

Image Signal Processor,图像信号处理器。用于对彩色图像进行后处理。

  • 单色图像传感器

一种能够检测和捕捉光线的传感器,通过光电二极管和滤光片阵列将光信号转换为电信号,并经过图像处理生成灰度图。

  • 激光投射器

用于发射结构光图案的部件。

  • FPGA

Field-Programmable Gate Array,现场可编程门阵列,一种信号处理芯片。FPGA具有高度并行的处理能力,可以同时执行大量的逻辑运算。在图像处理任务中,例如图像预处理、特征提取和图像识别等,需要大量的计算任务。FPGA可以通过并行处理技术,将这些任务同时执行,从而大大提高图像处理的效率。

  • SoC

System on Chip,芯片级系统,也有称片上系统。一个将处理器或其他电子系统集成到单一芯片的集成电路。SoC 系统可以处理数字信号、模拟信号、混合信号甚至更高频率的信号。SoC 系统常常应用在嵌入式系统中。

  • 红外泛光灯

使用红外光照亮环境,用于给红外成像补光。

相机基础

  • 基线

基线是指立体相机系统中两个相机之间的距离。基线越长,立体相机的深度测量精度越高,但也会增加系统的复杂性。

  • 视差

视差是指立体相机系统中,同一物体在左右图像中的位置差异。视差越大,物体离相机越近;视差越小,物体离相机越远。

  • 视场角

视场角是相机能够捕捉到的场景的角度范围,通常以水平和垂直角度表示。视场角越大,相机能够覆盖的区域越广。

  • 深度测量范围&安装净距离

深度测量范围是指深度相机能够准确测量的距离范围。超出此范围的深度测量可能不准确或无法测量。

安装净距离是指相机前端面与近端视野范围的最短垂直距离。

  • 图像分辨率

图像分辨率是指相机捕捉图像的像素数量,通常以宽度×高度表示。分辨率越高,图像越清晰。

  • 快门

快门是控制相机曝光时间的装置。快门速度越快,曝光时间越短,适用于捕捉快速运动的物体。

  • 景深

景深是指在图像中能够清晰成像的前后距离范围。景深越大,更多的物体在不同距离上都能清晰成像。

  • 相机坐标系

相机坐标系是以相机为参考点的三维坐标系,用于描述物体在相机视野中的位置和方向。

内参
内参是描述相机内部光学特性的参数,包括焦距、主点位置、畸变系数等,用于将三维点投影到二维图像平面。

外参
外参是描述相机在世界坐标系中的位置和方向的参数,包括旋转矩阵和平移向量,用于将世界坐标系中的点转换到相机坐标系。

畸变系数
畸变系数是描述相机镜头畸变程度的参数,包括径向畸变和切向畸变,用于校正图像中的几何失真。

标定
标定是通过特定的算法和标定板,确定相机的内参和外参,以提高相机的测量精度和图像质量。

焦距
焦距是指相机镜头的光学中心到图像传感器的距离,影响视场角和图像放大倍率。

光圈
光圈是控制进入相机镜头的光量的装置,光圈越大(f值越小),进入的光量越多,适用于低光环境。

相机性能

  • Z轴距离精度

Z 方向上,测得的距离值与距离真值之间的平均偏差。

  • 平面度

视野内中心区域所有像素点相对于理想平面的离散程度。

  • 重复精度

视野内中心区域所有像素点深度值在时域上的离散程度。

  • 点间距

深度图上像素点间距对应的真实物理距离(单位:mm)。

图像基础

  • 深度图

深度图(Depth 图)是深度相机视野内所有点的深度数据构成的一个 16bit 位深的单通道矩阵。为直观地体现不同距离值,在 SDK 示例程序中,输出的深度图均被映射到了 RGB 色彩空间,所以显示出来的结果为 RGB 三通道 8bit 位深的位图。

深度图中的单个像素值是空间中物体的某个点到垂直于左单色镜头光轴并通过镜头光心(深度相机光学零点)平面的垂直距离。深度数据单位为毫米,没有深度数据的点值为 0。深度数据无外参,只提供用于转换点云数据的内参。主动双目相机输出的深度数据无畸变,ToF 相机输出的深度数据有畸变。

在这里插入图片描述

  • 深度图数据格式

在这里插入图片描述

  • 点云图

点云图(Point Cloud 图)是深度相机视野内所有点的点云信息构成的数据矩阵。每个点的点云信息为三维坐标(x,y,z)。没有三维空间信息的点为(x,y,0)。

在这里插入图片描述

  • 灰度图

灰度图(mono 图)是单色图像传感器输出的图像。在输出深度图的时候,部分型号的 Percipio 深度相机输出的灰度图是被系统处理过的图像,如果需要看原始的灰度图,需要关闭深度图输出。灰度图分为左灰度图和右灰度图,二者均包含内参和畸变参数,但是因为左灰度图和深度图是同一个空间坐标系,所以左灰度图无外参。主动双目相机输出左右灰度图,ToF 相机输出左灰度图。

  • 彩色图

彩色图(RGB 图)是彩色图像传感器输出的图像。彩色图像传感器组件提供了内参,外参,畸变参数。不同型号的 Percipio 深度相机会输出不同数据类型的彩色图。

含有硬件 ISP 模块的彩色图像传感器输出为正常的 YUYV422/JPEG 图像,经 OpenCV 处理即可显示为正常色彩空间的彩色图。

不含硬件 ISP 模块的彩色图像传感器输出为 RAW BAYER 图像,图像画面可能存在偏色现象,经过 SDK 的软件 ISP 处理(如白平衡),才可以显示为正常色彩空间的彩色图。没有硬件 ISP 模块的彩色图像传感器可以确保输出的图像数据与灰度图像数据同步。

  • 飞点

由于噪音、反光等原因导致深度图数值(或点云图连续表面)突然出现的异常离群点。

在 ToF 相机的深度图或点云中,飞点一般是由于多路径干扰引起的;ToF 多路径干扰指多条发射端光线经过不同的反射路线或一条光线多次反射进入TOF sensor 同一个像素点,从而引起了TOF 深度图的异常。

  • 噪点

相机输出图像中的粗糙部分或者图像信息(灰度、亮度等)的随机变化。

  • 信噪比

信号(即图像的有用信息)与噪声(即图像中的随机干扰或不需要的信息)之间的比率。SNR 通常用分贝(dB)表示,数值越高,表示图像质量越好,噪声越少。

  • RGBD 同步

相机的彩色图和深度图像数据在时间上同步输出。

  • 对比度

图像中最亮部分和最暗部分之间的亮度差异。对比度是图像质量的重要指标之一,它影响图像的清晰度、细节表现和视觉效果。

高对比度:图像中亮部和暗部的差异较大,图像看起来更加鲜明和锐利。高对比度的图像通常具有更强的视觉冲击力,但可能会丢失一些细节,尤其是在亮部和暗部。

低对比度:图像中亮部和暗部的差异较小,图像看起来更加柔和和平淡。低对比度的图像可能显得灰暗和模糊,但能够保留更多的细节。

  • 亮度

亮度是图像中光的强度和明暗程度的度量,是影响图像视觉效果的重要因素。亮度不仅仅是灰度值,还可以受到图像对比度和色彩的影响。

在数字图像处理中,亮度通常用灰度值来表示。以8bit图像为例,灰度值是一个从0到255的整数,其中,0 表示完全黑色(无光);255 表示完全白色(最大光强);中间的值表示不同程度的灰色。

对于彩色图像,亮度可以通过将RGB(红、绿、蓝)三种颜色的值进行加权平均来计算。例如,常用的亮度计算公式是:亮度= 0.299 * R + 0.587 * G + 0.114 * B 这个公式反映了人眼对不同颜色的敏感度,其中绿色对亮度的贡献最大,红色次之,蓝色最小。

  • 灰度

灰度是图像处理中一种表示图像亮度信息的方式。灰度图像是一种没有颜色信息的图像,每个像素只有一个强度值,表示从黑到白的亮度。灰度值通常在 0 到 255 之间,其中 0 表示黑色,255 表示白色。

图像处理

  • RGBD 对齐

D2C(Depth To Color)是指根据深度相机和彩色相机的内外参数将深度图上每个像素点映射到彩色图的对应位置,从而得到 RGBD 图。

C2D(Color To Depth)是指根据深度相机和彩色相机的内外参数将彩色图上每个像素点映射到深度图的对应位置,从而得到 RGBD 图。

  • 数字增益

放大来自图像传感器的数字信号。增加数字增益,图像整体亮度会随之提高,但也会引入更多的噪声,导致图像质量下降,表现为颗粒感增加。

  • 模拟增益

放大来自图像传感器的模拟信号。增加模拟增益,图像整体亮度会随之提高。调整模拟增益有助于在保持一定图像质量的前提下,优化传感器对低照度环境的适应能力。

  • 曝光时间

图像传感器接光信号的时间。曝光时间越长,图像越亮。

  • 自动曝光

自动调整相机的曝光设置(如快门速度、光圈大小和ISO感光度),以确保拍摄的彩色图具有适当的亮度和对比度。

  • 自动白平衡

环境光的色温会影响彩色图像的外观,自动白平衡是通过自动调整Blue(蓝色)、Green(绿色) 和Red(红色)色彩比例,对环境色温所造成的颜色偏差和相机固有的色彩偏差进行一定的补偿,从而让获得的图像能正确反映物体的真实色彩。

  • 自动曝光 ROI

根据彩色图 ROI 区域内的亮度值自动调整曝光时间,使 ROI 区域内的亮度值达到正常水平。

  • 畸变校正

修正由于镜头光学特性引起的图像畸变,使图像更加接近真实场景的过程。

  • 高动态范围

高动态范围(HDR)通过组合多张不同曝光时间的图像,从而保留亮部和暗部细节,主要适用于高对比度的拍摄场景。

软件类
  • SDK

Software Development Kit,软件开发工具包。SDK 是一组工具、库、文档和示例代码的集合,旨在帮助开发者创建应用程序或软件系统。

  • API

Application Programming Interface,应用程序编程接口。API 是一组定义和协议,用于构建和集成软件应用程序。它可以实现不同的软件系统之间进行通信和数据交换。

可靠性

激光安全等级
激光安全等级是根据国际标准(如IEC 60825-1)对激光设备的潜在危害进行分类的系统。不同等级表示激光对人眼和皮肤的潜在风险,从Class 1(安全)到Class 4(高危险)。在3D相机中,激光安全等级决定了设备在使用时对用户的安全性要求。

温度漂移
温度漂移是指由于环境温度变化导致3D相机性能参数(如焦距、深度测量精度等)发生变化的现象。温度漂移可能影响相机的测量精度和稳定性,因此在设计和使用3D相机时需要考虑温度补偿和校准。


【深度相机术语与概念】》 是转载文章,点击查看原文


相关推荐


HTTP为什么不安全?
你的人类朋友2025/10/4

🌐 前言 你好呀,我是你的人类朋友! 本文主要讲讲 HTTP 为什么不安全,以及 HTTPS 如何解决这些问题。 ❗❗ 核心问题速览 HTTP(超文本传输协议):互联网上应用最广泛的网络协议,但数据以明文形式传输。注意,是明文,谁都能看!! HTTPS(安全超文本传输协议):HTTP 的安全版本,= HTTP + SSL/TLS 加密,就像把明信片放进防拆信封里寄送,别人无法看到信息的内容。 补充知识 1:SSL/TLS在【传输层】对 HTTP 数据进行加密,确保隐私和完整性。 补充知识 2


SIMD编程入门:让性能飞起来的实践指南
oioihoii2025/10/3

在现代计算中,单指令多数据流(SIMD)技术就像是一把性能优化的瑞士军刀,能让你的程序速度提升数倍甚至数十倍。本文将带你从零开始,掌握这把利器的使用之道。 什么是SIMD?从汽车生产线说起 想象一下汽车生产线:传统方式是一个工人依次安装每个轮胎,而SIMD就像是培训了一个专门团队,能够同时安装四个轮胎。这就是单指令多数据流的核心思想——一条指令,多个数据。 // 传统标量计算 - 依次处理每个元素 for (int i = 0; i < 4; i++) { result[i] = a[


释放模型潜能:ONNX Runtime 如何进行优化与加速?
Cosolar2025/10/2

在机器学习从实验室走向真实世界的过程中,模型的部署与运行效率往往是决定项目成败的“最后一公里”。一个在离线环境中表现优异的模型,如果无法满足生产环境对低延迟、高吞吐和低资源消耗的要求,其商业价值将大打折扣。 ONNX Runtime (ORT) 作为由微软主导的开源跨平台推理引擎,凭借其出色的性能、广泛的硬件支持和活跃的社区,已成为业界部署模型的事实标准之一。然而,仅仅将模型转换为 ONNX 格式并使用 ORT 运行,只是拿到了“入场券”。要真正释放其潜能,我们需要从模型优化、推理引擎配置、硬


AR/VR赋能工业巡检:开启智能化运维新时代
Teamhelper_AR2025/10/2

在工业 4.0 时代浪潮的推动下,增强现实(AR www.teamhelper.cn )与虚拟现实(VR)技术加速从理论概念迈向工业应用前沿,尤其在工业设备巡检这一关键领域,正展现出前所未有的变革潜力,有望彻底颠覆传统依赖人工经验、效率低下、风险高且数据不连贯的巡检模式。 AR技术:重塑工业巡检核心优势 AR技术通过巧妙地将虚拟信息与真实环境相融合,为工业巡检人员带来了革新性的工作体验。借助AR智能眼镜,巡检人员能够实时获取设备参数、操作指南以及历史数据等关键信息,无需再频繁翻阅纸质


《WebAssembly指南》第六章:读懂 WebAssembly 文本格式
锋通科技10/2/2025

本文介绍了WebAssembly文本格式的基本概念和使用方法。主要内容包括:1. WebAssembly文本格式采用S表达式表示模块结构,比二进制格式更易读易修改。2. 详细讲解了函数定义、参数传递、栈机器运行机制等核心概念,并通过加法函数示例演示了模块的创建和调用过程。3. 介绍了内存管理机制,包括内存共享、字符串处理和多内存使用场景。4. 深入讲解了表格(Table)的概念及其在动态链接中的应用,展示了如何通过表格实现函数指针功能。5. 概述了WebAssembly支持的各种类型和特性,包括数值类型、引


【SpringAI中Chat-Client用法】
明志学编程-9/30/2025

这篇文章介绍了如何使用SpringAI框架中的ChatClient进行大模型交互开发。主要内容包括:1. 对比ChatClient与底层ChatModel的区别,建议优先使用更易用的ChatClient;2. 详细展示如何创建子工程、添加依赖(以阿里云百炼平台为例)和配置;3. 提供同步和流式两种调用方式的代码示例;4. 解决多模型依赖冲突问题,通过直接注入具体ChatModel实现动态选择;5. 最后提到多平台多模型动态配置的实战应用。文章配有CSDN博客链接和示例图片,适合开发者学习SpringAI框架


数电基础--电平规范_TTL与CMOS
逐步前行9/30/2025

高电平输出大于2.4V,如果落在2.4V至3.5V之间,CMOS电路不能检测到高电平,需要进行电平输换。(3)、3.3V的TTL驱动5V的CMOS,考虑可以存在电压钳位,比如单片机的GPIO,不适合上拉电阻。(1)、3.3V的TTL驱动3.3V的CMOS,可以通过简单的上拉电阻实现电平匹配。(2)、5V的TTL驱动5V的CMOS,可以通过简单的上拉电阻实现电平匹配。高电平输出3.3V,CMOS电路不能检测到高电平,需要进行电平转换。Tx输出5V,Q2截止,Rx端为3.3V;


Python 的 TCP 编程
hubenchang05152025/10/6

#Python 的 TCP 编程 传输控制协议(Transmission Control Protocol) 是一种 面向连接、可靠传输 的网络通信协议,是现代互联网最核心的协议之一。 #客户端程序 TCP 客户端程序通常只需要连接到服务器然后收发数据即可。下面是一个示例,它向 tcpbin.com 的 4242 端口发送 hello\n,对方会原样返回。 import socket # 创建 TCP socket sock = socket.socket(socket.AF_INET, so


第7章:数据库与持久化存储
芝麻开门-新起点2025/10/8

7.1 为何需要数据库:记忆与状态管理 内容讲解 默认情况下,AI Bot 是**“无状态”的。这意味着除了短暂的当前对话上下文,它不记得任何过去的事情。每次对话都是一次全新的开始。然而,在许多真实场景中,我们需要 Bot 拥有记忆**,能够持久化地存储和检索信息。这就是**数据库(Database)**的作用。 数据库为 Bot 提供了以下关键能力: 长期记忆:记住用户的偏好、历史订单、个人信息等。例如,一个订餐 Bot 应该记住你常去的地址和喜欢的口味。状态跟踪:在复杂的多轮任务中,跟踪当前


【SCI一区】【电动车】基于ADMM双层凸优化的燃料电池混合动力汽车研究(Matlab代码实现)
荔枝科研社2025/10/9

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭:行百里者,半于九十。 💥1 概述 基于ADMM双层凸优化的燃料电池混合动力汽车研究 随着车辆互联性的出现,互联汽车 (CVs) 在增强道路安全、改善乘坐舒适性、提高交通效率和提高能源效率方面提供了巨大的潜力。通过从车对车 (V2V) 和车对基础设施 (V2I) 通信中获取交通信息,CV 能够更准确、更广泛地感知

首页编辑器站点地图

Copyright © 2025 聚合阅读

License: CC BY-SA 4.0