计算机图形学专业术语
- 计算机图形学(Computer Graphics):研究如何利用计算机技术生成、处理和显示图形图像的学科,包括二维和三维图形的创建、渲染和交互。
- 计算机视觉(Computer Vision):通过计算机模拟人类视觉系统,从图像或视频中提取、分析和理解信息的科学,目标是使计算机能够像人类一样“看”和“理解”世界。
- 机器视觉(Machine Vision):计算机视觉的一个分支,主要应用于工业自动化领域,用于检测、测量和识别物体,以实现质量控制、机器人导航等功能。
- 虚拟现实(Virtual Reality,缩写为 VR):通过计算机生成的虚拟环境,让用户通过头盔显示器、传感器等设备沉浸其中,获得身临其境的体验。
- 增强现实(Augmented Reality,缩写为 AR):将虚拟信息叠加到现实世界中,通过设备(如手机、AR 眼镜)让用户同时看到现实场景和虚拟元素,增强对现实的感知。
- 三维建模(3D Modeling):通过数学方法构建三维物体的数字表示,常用多边形或曲面描述。常见的三维建模软件包括 Blender、Maya、3ds Max、Clinema 等。
- CAD(Computer Aided Design):计算机辅助设计,是利用计算机技术进行设计的过程,也就是我们常说的制图。
- CAM(Computer Aided Manufacturing):计算机辅助制造,是指利用计算机和计算机软件来控制机器进行制造,通常适用于大批量生产的零件。
- OCR(Optical Character Recognition):光学字符识别,一种将图像中的文本转换为机器可读格式 的技术。
- 像素(Pixel):数字图像的最小组成单元,代表图像中的一个点,通常包含颜色(RGB)和亮度等信息。
- 分辨率(Resolution):图像中像素的总量,通常表示为宽度×高度。
- 色彩深度(Color Depth):又称“色深”或“位深”,是指用于表示单个像素颜色的位数,单位是位/像素(bpp)。典型的色深是 8、16、24 和 32,色深越高,能够显示的颜色数量越多,图像的色彩过渡越平滑。
- 景深(Depth of Field):是指在图像中,从前景到背景的清晰对焦范围。景深的大小受光圈大小、焦距和拍摄距离的影响。
- 位图(Bitmap):标量图,使用像素点来描述图像,也称为点阵图像。位图适合表示照片和复杂图像,常见格式如 bmp、jpg、png。
- 矢量图(Vector Graphics):通过数学方程定义的图形,由点、线和曲线组成。矢量图可以无损地放大或缩小,常用于字体、标志和需要高分辨率的图形,常见格式如 svg、dwg、cdr。
- Alpha 通道:存储像素透明度的额外通道,用于合成叠加图像。
- 帧率(Frame Per Second,缩写为 FPS):相机每秒采集的图像帧数。是相机采集速度指标,全局快门(Global Shutter)相机适合高速运动,卷帘快门(Rolling Shutter)可能产生果冻效应。
- ROI(Region of Interest):感兴趣区域,图像处理的重点分析区域。
- 直方图(Histogram):统计图像中像素亮度或颜色分布的二维图表,常用于图像分析和调整对比度。
- 二值化(Binarization):将图像转换为黑白两色的处理过程,这是图像分割的一种最简单的方法。包含全局阈值和自适应阈值,常用于文档扫描或物体分割。
- 归一化(Normalization):一种数据处理方式,能将数据经过处理后限制在某个固定范围内(比如
[0,1]
或者 [-1,1]
),从而消除奇异样本数据导致的不良影响。
- 几何变换(Geometric transformation):对图形对象进行平移、旋转、缩放等操作的数学方法。
- 多边形网格(Polygon Mesh):由顶点、边和面构成的三维模型表示方式。
- 贝塞尔曲线(Bézier Curve):用于描述平滑曲线的数学模型,通过控制点定义的参数曲线,用于建模与动画路径。
- B 样条(B-Spline):局部可控的样条曲线,比贝塞尔曲线更灵活。
- UV 展开(UV Unwrapping):将三维模型的表面展开为二维纹理坐标的过程。
- 细分曲面(Subdivision Surfaces):通过细分多边形网格生成平滑曲面的技术。
- 投影(Projection):将三维空间中的物体映射到二维平面上的过程。在计算机图形学中,投影包括平行投影和透视投影,用于生成二维图像。
- 法线:垂直于物体表面的向量,用于计算光照效果和表面方向。
- 光照(Illumination):模拟光源对物体的影响,包括光的强度、方向、颜色等,是渲染真实感图像的关键因素之一。
- 阴影(Shadow):物体在光照下形成的遮挡区域,阴影的生成可以增强图像的真实感和立体感。
- 纹理(Texture):用于定义物体表面细节的图像或图案(如木纹、金属质感等),可以增加物体的真实感和视觉丰富性。
- 映射(Mapping):将纹理或其他属性应用到物体表面的过程,如纹理映射 、环境映射等。
- 色彩空间(Color space):用于定义颜色的数学模型,如 RGB、HSV、CMYK 等。
- 伽马校正(Gamma correction):又称伽马非线性化,是调整图像亮度和对比度的技术,用于补偿显示设备的非线性特性。
- 图像配准(Image Registration):将多幅图像对齐到同一坐标系中的过程,常用于图像融合和分析。
- 图像压缩(Image compression):减少图像文件大小的技术,如 JPEG、PNG、WEBP 等压缩算法。
- 特征提取(Feature extraction):从图像中提取有用信息(如边缘、角点、纹理)的过程,用于图像分析和识别。
- 边缘检测(Edge Detection):图像处理中的一种技术,用于识别图像中物体的边界,常用于图像分析和特征提取,常用算法如 Sobel、Canny 算子。
- 图像分割(Image segmentation):将图像划分为多个区域或对象的过程,以便对每个区域进行单独分析或处理。
- 形态学操作(Morphological Operations):基于形状的图像处理技术,包括膨胀、腐蚀等。
- 膨胀(Dilation):扩大图像中亮区域以填充空隙/空洞或连接断裂部分。
- 腐蚀(Erosion):缩小图像中亮区域以去除噪声或分离粘连物体。
- 开运算(Opening):先腐蚀后膨胀,去除小物体。
- 闭运算(Closing):先膨胀后腐蚀,连接断裂区域。
- 特征提取(Feature Extraction):从图像中提取关键信息的处理过程。
- 模板匹配(Template Matching):通过预定义模板在图像中寻找相似区域。
- 霍夫变换(Hough Transform):一种 用于图像中检测直线、圆等几何形状的算法,通过将图像空间中的点映射到参数空间中进行投票。
- 光流(Optical Flow):用于量化连续帧之间物体运动的算法,通过估计图像中亮度模式的表观运动来实现。
- 立体视觉(Stereo Vision):通过两个或多个视角的图像来重建三维场景的深度信息,类似于人类双眼视觉。
- 点云(Point Cloud):由大量三维点组成的集合,用于表示物体或场景的几何形状,常用于三维重建和测量。
- 标定(Calibration):对传感器(如相机)进行参数调整的过程,以确保其输出数据的准确性和一致性。
- 畸变校正(Distortion Correction):对图像中的几何畸变(如镜头畸变)进行校正,以恢复图像的真实形状。
- 亚像素(Subpixel):指图像处理中精度高于单个像素的技术,用于提高特征检测或图像对齐的精度。
- SLAM(Simultaneous Localization and Mapping):同时定位与建图技术,用于机器人或自动驾驶车辆在未知环境中实时创建地图并确定自身位置。
- CNN(Convolutional Neural Network):卷积神经网络,一种深度学习架构,广泛应用于图像识别和处理。
- 超分辨率(Super-Resolution):通过算法将低分辨率图像提升为高分辨率图像的技术。
- 深度图(Depth Map):记录图像中每个像素深度信息的图像,用于表示物体的三维位置关系。
- 光栅化(Rasterization):又称“栅格化”,是将矢量图形转换为像素矩阵的过程,用于实时渲染。
- 光线追踪(Ray Tracing):一种渲染技术,通过模拟光线在场景中的传播和反射来生成高质量的图像,能够实现真实的光照和反射效果。
- 抗锯齿(Anti-aliasing):减少图像边缘锯齿状走样的技术,如 MSAA、TAA。
- 着色器(Shader):用于定义图形渲染过程中如何对像素或顶点进行处理的程序代码。
- 全局光照(Global Illumination):模拟光线多次反弹的间接光照效果,提升真实感。
- 体素(Voxel):三维空间中的像素(体积像素),用于表示三维数据体的基本单元。常用于医学成像或体渲染。
- 蒙皮(Skinning):在动画中,将模型的网格绑定到骨骼上,使模型能够跟随骨骼运动。
- 渲染管线(Rendering Pipeline):从三维模型到二维图像的处理流程,包括顶点处理、光栅化、像素处理等阶段。
- 视锥体(View Frustum):三维图形渲染中,定义可见区域的三维空间范围。
- 深度缓冲(Z-Buffer):一种用于解决隐藏面消除问题的技术,通过记录每个像素的深度值来确定可见性。
- HDR(High Dynamic Range):高动态范围成像技术,用于捕捉超出普通相机范围的亮度信息。
- BRDF(Bidirectional Reflectance Distribution Function):双向反射分布函数,用于描述表面反射光的特性。
- CUDA(Compute Unified Device Architecture):英伟达推出的并行计算架构,用于加速 GPU 上的计算。
- OpenCL(Open Computing Language):一个开源的并行计算框架,用于异构计算。
- OpenGL(Open Graphics Library):一个跨语言、跨平台的图形 API,用于渲染二维和三维矢量图形。
- OpenCV(Open Source Computer Vision Library):一个开源的计算机视觉库,提供了大量的图像和视频处理功能。