针对该部分笔记,现在 08/19/2025 其主要内容与 Image 相关。
认识
在计算机科学中,数字图像(Digital Image)是指由像素(Pixel)组成的二维矩阵,用于表示视觉信息。它在计算机视觉、图形学、医学影像、人工智能等领域有广泛应用。数字图像在计算机科学中涉及表示、存储、处理、分析等多个层面,是计算机视觉、图形学和人工智能的基础。随着深度学习的发展,图像处理能力(如生成式 AI)正在快速进步。
Image Photo Picture 之间的区别?—— DeepSeek
在英语中,Image、Photo、Picture 都可以表示“图像”,但用法和侧重点有所不同:
- Image(图像、形象)| 广义:可指任何形式的视觉呈现,包括数字图像、图形、符号、脑海中的印象等。技术领域:常用于计算机图形学。
- Photo(照片)| 狭义:专指通过相机拍摄的照片(photograph 的缩写)。必须是真实拍摄的,不能是手绘或计算机生成的。
- Picture(图片、图画)| 可以指任何形式的视觉呈现,包括照片、绘画、插图等。口语中常用:在日常对话中,picture 与 photo/image 可以替代。
组成
数字图像的基本概念
- 像素 Pixel
- 分辨率 Resolution
- 每英寸像素数 PPI Pixels Per Inch
- 每英寸点数 DPI Dots Per Inch
色彩模型(Color Model)
- RGB(Red, Green, Blue):计算机显示标准,每个像素由红、绿、蓝三通道组成(如 `(255,0,0)` 表示纯红)。
- CMYK(Cyan, Magenta, Yellow, Key/Black):用于印刷,基于减色混合。
- 灰度(Grayscale):仅亮度信息(0=黑,255=白)。
- HSV/HSL(Hue, Saturation, Value/Lightness):更符合人类感知的颜色表示方式。
图像深度(Bit Depth)
- 每个像素的存储位数,决定颜色精度:
- 8-bit(256 色,常见于 JPEG/PNG)
- 16-bit(65,536 色,用于医学 / 专业摄影)
- 24-bit(真彩色,RGB 各 8 位,约 1677 万色)
- 32-bit(RGBA,含透明度 Alpha 通道)
数字图像的表示方式
位图(Bitmap)vs. 矢量图(Vector Graphics)
| 特性 | 位图(Raster Image) | 矢量图(Vector Image) |
|---|---|---|
| 组成 | 像素矩阵 | 数学公式(点、线、曲线) |
| 缩放 | 放大后模糊 | 无限缩放不失真 |
| 格式 | JPEG, PNG, BMP | SVG, AI, EPS |
| 用途 | 照片、复杂图像 | 图标、Logo、插图 |
常见图像文件格式
| 格式 | 特点 | 适用场景 |
|---|---|---|
| JPEG | 有损压缩,文件小 | 网页、照片 |
| PNG | 无损压缩,支持透明 | 图标、透明背景图 |
| GIF | 支持动画,256 色 | 简单动画、表情包 |
| BMP | 无压缩,文件大 | Windows 原始图像 |
| TIFF | 高质量,支持多层 | 印刷、医学影像 |
| WebP | 现代压缩,优于 JPEG/PNG | 网页优化 |
构建
数字图像处理(Digital Image Processing)
### (1) 基本操作
- 滤波(Filtering):平滑(去噪)、锐化(增强边缘)。
- 几何变换:旋转、缩放、平移。
- 直方图均衡化:增强对比度。
### (2) 计算机视觉(Computer Vision)
- 特征提取:边缘检测(Canny、Sobel)、角点检测(Harris)。
- 目标检测:YOLO、Faster R-CNN。
- 图像分割:语义分割(U-Net)、实例分割(Mask R-CNN)。
### (3) 深度学习与图像
- 卷积神经网络(CNN):用于图像分类(ResNet)、生成(GAN)。
- 超分辨率(Super-Resolution):如 ESRGAN 提升图像清晰度。
- 风格迁移(Style Transfer):将艺术风格应用到照片。
工具与库
- OpenCV(图像处理)
- PIL/Pillow(图像操作)
- scikit-image(高级算法)
- TensorFlow/PyTorch(深度学习)
图像编辑 | 图形处理软件
图像编辑,其是指改变图像的过程,图像包括数码照片,传统的模拟照片和插图。对模拟图像的编辑通常也称为照片修饰,使用工具为喷枪等。
数码照片的编辑采用图形处理软件,可大致分为:
- 矢量图形编辑器(Vector graphics editors)
- 光栅图形编辑器(Raster Graphics Editor)
- 三维计算机图形软件
Photoshop
Blender(3D 图像生成)
GIMP | GNU Image Manipulation Program(开源替代)
Krita | Digital Painting. Creative Freedom. | for Windows, Linux and macOS
esrille-paint | A GTK 3 application for drawing bitmap images
esrille/paint: A GTK 3 application for drawing bitmap images
https://esrille.github.io/paint/
Gthumb | Gthumb is a nice image viewing/editing tool with simple editing tools like cropping.
Apps/Gthumb – GNOME Wiki!
sudo apt install gthumb
基于 AI 的工具
应用
- 医学影像:MRI、X 光分析(如肿瘤检测)。
- 自动驾驶:车道识别、行人检测。
- 增强现实(AR):实时图像叠加虚拟物体。
- 卫星遥感:地表监测、气象预测。
- 数字艺术:AI 绘画(如 Stable Diffusion)。
改进
WIP
参考
Comparison of raster graphics editors – Wikipedia
DeepSeek / 介绍计算机科学中,数字图像 Image 的相关概念