Bootstrap

医疗影像基础概念

一、医学影像图像格式

1.1 DICOM 格式

  • DICOM(Digital Imaging and Communication in Medical) 是医学影像领域最常见的标准之一,主要用于存储、交换和检索医学图像。如 X光片、CT扫描、MRI等。
  • 每个DICOM文件通常包含基本的病人信息(病人ID、姓名、检查日期等)以及图像信息(像素数据、图像纬度等)

1.2 NifTI(Neuroimaging Infomatics Technology Initiative)

  • 每个 NifTi 文件包含一个头文件(.hdr)和一个图像文件(.img)
  • NifTi 主要是为了克服以前数据格式问题而引入的,它以3D图像建模,更适合那些应用在 DICOM 上的机器学习的方法
  • 每个 NifTi 文件包含一个头文件(.hdr)和一个图像文件(.img)
    • 头文件包含了有关图像的一些元信息,如维度、像素大小等
    • 图像文件存储了实际的像素数据

2.3 TIFF(Tagged Image File Format)

  • TIFF 是一种用于存储和交换光栅图像的标准格式,广泛应用于桌面出版、扫描和其他领域
  • TIFF 文件可以包含多页图像、多通道(如 RGB)、压缩数据等
  • TIFF 文件支持无损压缩和有损压缩

2.4 几种图像格式的区别

  • DICOM 主要用于医学影像的存储和交换
  • NifiTI 主要用于神经影像学数据的存储和交换
  • TIFF 广泛用于光栅图像的存储和交换

2.5 几种不常用的医疗影像图像格式

2.5.1 PAR / REC

  • 这是核磁共振呈像(MRI)的一种常见格式,由宾夕法尼亚大学开发
  • 包含了病人信息和图像数据
  • 通常应用于医疗影像学领域进行研究和诊断

2.5.2 ANALYZE

  • 这是由美国 Analyze 网站开发的格式
  • 用于存储医学影像数据,如 CT,MRI 图像
  • 在神经影像学领域得到广泛应用

2.5.3 NRRD (N-Dimensional Raster Data)

  • 这是神经影像学领域常用的格式
  • 支持多维图像的存储和交换

2.5.4 MINC(Minium Interval Encoding of Connected Raster Data)

  • 最初是为心脏影像学研究开发的
  • 支持多维图像的存储和交换, 并包含了一些元数据

JPEG

  • 一种广泛使用的压缩图像格式
  • 适用于在医疗设备(内窥镜、显微镜等) 中获取的图像
  • 由于压缩比高,存储空间小、非常适用于医疗影像领域

PNG

  • 一种无损压缩的位图图像格式
  • 设计的目的是为了取代 GIF、TIFF 格式
  • PNG 支持透明度, 可以更好的混合在图像中,适合在网页中使用
  • 在医疗领域,PNG 格式的图像主要用于存储 数字还 X 光片和CT扫描图像

BMP

  • 微软公司开发的一种图像格式,通常用于 windows 操作系统的标准图像文件格式
  • BMP 支持无损压缩和有损压缩
  • 可以存储多种颜色模式、包括单色、灰度、索引色和真彩色
  • 在医疗领域,BMP 通常用于存储数字化 X 光片 和CT 扫描图像

二、 DICOM

  1. DICOM 基本概念
    DICOM 是医学图像和相关信息的国际标准。定义了满足临床需要的用于数据交换的医学图像格式,被广泛应用于放射、成像的诊疗诊断设备。
    在医院放射科使用的设备上读取的影像基本格式都是DICOM格式,包括CT、MRI、超声等。

  2. DICOM 的组成

    • PixelData: 存储图像的像素信息
    • Patient: 病人信息
    • Study: 诊疗信息
    • Series: 序列号、图像坐标信息
      • SliceThickness: 层厚, 每张切片之间的间距
      • ImagePositionPatient: 该张切片坐标原点(图像左上角,二维图向下为y轴,向右为x轴),在空间中的坐标(x, y, z)
      • ImageOritentationPosition: 六元组,当前切片的X,Y轴与解刨学坐标系间的关系
    • Image: 图像信息
      • PixelSpacing: 二元组,用来表示当前二维图像坐标上,xy轴的单位长度,在世界坐标系中所占据的长度
      • Rows、Columns: 行列信息
      • Bits Allocated、Bits Stored: 每个像素分配的位数、存储位数
      • Window Center、 Window Width: 窗位、窗宽
      • Rescale Slop、Rescale Intercept: 斜距、截距(图像可视化)
  3. 六元组

    • 六元组表示的是切片平面与矢状面、冠状面、横断面之间夹角的余弦值

    • 通六元组可以判断图像区域是否为矩形,以及解刨学坐标的关系
      在这里插入图片描述

    • 六元组用(x1, x2, x3, y1, y2, y3)表示,其中x1, x2, x3分别表示x轴与L、P、S间夹角的余弦, y1, y2, y3表示y轴与L、P、S间夹角的余弦

  4. 处理DICOM的库

    • PyDicom:处理DICOM格式文件的Python包,支持dicom文件的读取,修改操作;
    • SimpleITK: 支持多格式的文件,提供了一些处理图像内容的操作;
    • itk,vtk: 前者提供处理,后者提供显示,是医学医学影像处理中常用的库
    • dicom2nifti: dicom文件转nifit文件等操作
  5. 为什么需要将dicom格式的文件转化为Nifit格式的文件

    • Python 中,有一个库nibabel专门用于处理.nii的文件,因此当数据格式为.nii时,可以简化代码
    • NIFIT的文件是三维的图像,而dicom的文件为二维的多张图像,所以相对于DICOM文件,NIFIT文件更加易用雨进行及其学习,训练的张数减少。

描述DICOM的相关变换 - 平移、旋转、缩放

  1. 坐标系变换
    极坐标系、圆柱坐标系、球坐标系、齐次坐标系 之间的转换

  2. 方向余弦

    • 方向余弦是一个向量,vector

    • 方向余弦用于描述人意空间向量V与坐标系坐标轴间夹角的余弦

    • 其中 vx,vy,vz 分别表示向量 v在坐标系x,y,z三轴中的坐标,那么该向量与三个坐标轴之间的夹角的方向余弦是:

      在这里插入图片描述

在这里插入图片描述

  1. 欧拉角 Euler Angles
    • 欧拉角是通过描述三个坐标轴的旋转来确定物体的方位,即通过旋转坐标系的三个坐标轴来获得目标方位
    • 用xyz描述旋转之前的坐标系,用XYZ来描述旋转之后的坐标系,记x-y平面与X-Y平面的交线为N
    • 用α、β、γ三个角度可以描述xyz与XYZ之间的关系:
      • α 表示 x轴与N间的夹角
      • β 表示z轴与Z轴之间的夹角
      • γ 表示X轴与N的夹角
        在这里插入图片描述

DICOM 文件的主要结构

主要包括: 文件头、像素数据(0x7ef0, 0x0010)
在这里插入图片描述

数据元素的组成规则:

  • Tag: 信息的唯一性编码,两个十六进制的数的组合(Group, Element)
    • Group: 为偶数时代表标准数据字典
    • Group: 为奇数时代表的是私有数据字典
  • VR(Value Representations): DICOM定义的数据类型
  • Value Length(数据长度):所有的数据元素都应该为偶数,如果有奇数,需要加空格或空
    • 奇数长度的字符串加空格
    • 奇数长度的数字加nul
  • Value Field: 数据值,长度必须是偶数
  1. 文件引言Meta Info: 标识一些常用的信息,存储在0x0002 Group 里
    在这里插入图片描述

    • 使用vscode插件可以打看.dcm文件可以查看到这些信息
      在这里插入图片描述
  2. 数据集Data Set: 医学图像的相关信息

    • 患者信息(Patient)
      在这里插入图片描述

    • 检查信息(Study)
      在这里插入图片描述

    • 序列信息(Series)
      在这里插入图片描述

    • SOP影像信息(Image)
      在这里插入图片描述
      在这里插入图片描述

三、医学影像名词解释

HIS(hospital information system): 医院信息系统

RIS(Radiology information system): 放射信息管理系统

EMP(electronic medical system): 电子病历

PACS(picture archiving and communication systems): 医学影像存档与通信

MPR 多平面重建(Multi Planar Reformation)

在一系列横断面基础上形成的冠状位、矢状位或斜位方向上单一体素厚度平面,对显示任意方向上解剖关系的各种变化很有用。

  1. 多平面重建是将扫描范围内所有的轴位图像叠加起来,再对某些标线标定的重组线索指定的组织进行冠状位,矢状位任意角度图像位进行重组
  2. 能任意产生新的断层图像,无需重复扫描
  3. 原图像的密度值被可靠的保存到了结果图像上
  • MPR 有什么作用?
  • 有时候拍的影像不是很正,通过MPR调整,可以查看任意截面的影像而不用重新拍片

CPR 曲面重建(Curved Planar Reformation)

MPI 、minIP 、avelIP(maximum/minimum/averageintensity project)

  • 最大/最小/平均密度投影
  • MIP 是可视化平面之上投射三维空间数据的一种计算机可视化方法
  • 沿着视点到投影平面的平行光线,各个体素密度所呈现的亮度以某种方式衰减,在投影面上呈现的是亮度最大的体素

VR(Volume Rendering) 体绘制

SR(Surface Rendering) 面绘制

LUT(Look Up Table)

  • LUT 是一张像素灰度值的映射表,它将实际采样到的像素灰度值经过一定的变换,如阈值、反转、二值化、对比度、线性变换等,变成了另外一个与之对应的灰度值。通过这样处理就可以起到突出图像有用信息、增强图像的光对比度的作用
  • LUT 常用于 VR/SR 后对重建结果进行颜色转换,使其更接近于真实物体的颜色,或者可以应用于MPI中标记不同的功能区等。

窗宽/窗位(Window width/ Window level)

  • 窗宽: 表示所显示信息强度值的范围
  • 窗位: 是窗的中心位置
  • 窗技术是CT检查中用于观察不同密度的正常组织或者病变的一种技术。由于各种组织或病变具有不同的CT值,因此欲显示某一组织结构细节是,应选择合适观察改组织或病变的窗位和窗宽,以获得最佳显示

四、医学影像处理开源包

ITK(Insight segmentation and registrationtookit)

  • ITK 是一款看远的、跨平台的影像分析扩展工具。
  • ITK 开发过程中采用了先进的多模态数据分割配准算法。
  • ITK 提供了一些主流的算法,如 区域生长、阈值分割、基于分水岭的分割、Fast Marching 算法、Level Set 等多种分割算法,并将这些用于医学图像处理的算法和程序的开发过程屏蔽起来
  • ITK 没有实现可视化功能,在VTK中实现可视化
  • 在医学影像中,在用ITK进行分割的基础上,结合VTK对图像进行可视化处理

VTK(Visualization tooklkit)

  • VTK 是一个开发资源的免费软件系统,主要用于三维计算机图形学,图像处理和可视化。
  • VTK 是在面向对象原理的基础上设计和实现的,它的内核是用C++构建的,包含了650多个类,还包含几个转换界面,因此可以自由的通过java, Tcl/TK 和python各种语言使用vtk
;