医学图像之DICOM格式解析

最近导师给安排了新任务，由于刚进入实验室，对于医学图像这一块还一知半解，所以就想分享一下有关医学常见影像的学习(尤其是dicom后缀的图像文件)，欢迎大家一起交流。

1.医学影像学的介绍

2.DICOM信息的简介

3.DICOM内部信息详解(DICOM Tag与VR)

4.利用python+pydicom这个库解析DICOM文件

5.DICOM的三个切面

1.医学影像学

（1）.医学影像学Medical Imaging，是研究借助于某种介质（如X射线、电磁场、超声波等）与人体相互作用，把人体内部组织器官结构、密度以影像方式表现出来，供诊断医师根据影像提供的信息进行判断，从而对人体健康状况进行评价的一门科学，包括医学成像系统和医学图像处理两方面相对独立的研究方向。

（2）.仪器主要包括X光成像仪器、CT(普通CT、螺旋CT）、正子扫描(PET)、超声（分B超、彩色多普勒超声、心脏彩超、三维彩超）、核磁共振成像（MRI）、心电图仪器、脑电图仪器等

2.DICOM简介

（1）DICOM（Digital Imaging and Communications in Medicine）即医学数字成像和通信，是医学图像和相关信息的国际标准（ISO 12052）。DICOM被广泛应用于放射医疗，心血管成像以及放射诊疗诊断设备（X射线，CT，核磁共振，超声等），并且在眼科和牙科等其它医学领域得到越来越深入广泛的应用。所有患者的医学图像都以 DICOM 文件格式进行存储。这个格式包含关于患者的 PHI（protected health information，https://en.wikipedia.org/wiki/Protected_health_information）信息，例如姓名，性别，年龄，以及其他图像相关信息比如捕获并生成图像的设备信息，医疗的一些上下文相关信息等。医学图像设备生成 DICOM 文件，医生使用 DICOM 阅读器（能够显示 DICOM 图像的计算机软件）阅读并对图像中发现的问题进行诊断

（2）目前采用的标准是DICOM3.0，每一张图像中都携带着大量的信息，这些信息具体可以分为以下四类：（a）Patient（b）Study（c）Series（d）Image。每一个DICOM Tag都是由两个十六进制数的组合来确定的，分别为Group和Element。如(0010,0010)这个Tag表示的是Patient’s Name，它存储着这张DICOM图像的患者姓名。

（3）基于C++的DCMTK、基于Java的dcm4che以及基于python的pydicom，都是非常优秀的解释DICOM标准的第三方库，通过在工程中引入它们可以避免软件开发人员去进行底层的解析工作，可为项目开发提高效率。下文将会利用基于python的pydicom解析一下dicom文件。

（4）目前例如CT，核磁共振，超声等利用精确准直的X线束、γ射线、超声波等，与灵敏度极高的探测器一同围绕人体的某一部位作一个接一个的断面扫描，所以扫描后得到的图像是多层的图像，而我们把一层层的图像在z轴上堆叠起来就可以形成三维图像(这就涉及到三维重建的问题)，这时，每一层的图像我们都可以存在dicom文件中（当然，dicom文件不是单纯的像素信息，它还有很多的数据头部信息），如下图，我们的目的就是要把在这些数据头部信息和像素信息从一系列dicom文件中读取出来。

（5） DICOM文件是指按照DICOM标准而存储的医学文件，一般由一个DICOM文件头和一个DICOM数据集合组成，结构图如下图

DICOM文件头包含了标识数据集合的相关信息，每个DICOM文件都必须包括一个文件头：

文件导言，由128个字节组成。
DICOM前缀，可根据这长为4个字节的字符串是否等于“DICM”来判断该文件是不是DICOM文件。
文件信息元素

有关DICOM文件中的数据集部分内容在下一个知识点。

3.DICOM内部信息详解(DICOM Tag与VR)

（1）DICOM文件的主要组成部分是数据集，它是由DICOM数据元素按照指定的顺序依次排列组成的。对于DICOM文件，一般采用显式传输，数据元素按照标签Tag从小到大顺序排列。最基本的单元是数据元，数据元主要由4个部分组成：

DICOM TAG：存储该项信息的标识
VR(value representation) ：存储描述该项信息的数据类型。
value length : 存储描述该项信息的数据长度
value：存储描述该项信息的数据值

（2）DICOM TAG的分类与说明，在上一个内容中说过，DICOM TAG具体可分为4大类。

Patient Tag
Study Tag
Series Tag
Image Tag

（3）VR是DICOM标准中用来描述数据类型的，总共有27个值。简单分类如下

4.利用python+pydicom这个库解析DICOM文件

1.1首先导入解析DICOM文件所需的库

 import pydicom

 import pylab

1.2加载DICOM文件

 ds = dicom.read_file('D:/dicom_image/V/P01-0000.dcm')# 在你机器上DICOM文件的位置

1.3相关属性的打印

 print(ds.dir()) # 打印所有 DICOM TAG 名

 print(ds.dir('pat')) # 打印包含 'pat' 的 DICOM TAG

 print(ds.PatientName, ds.PatientSex, ds.PatientSize, ds.PatientWeight ) # 打印 DICOM TAG 相应的属性值

 print(ds.data_element('PatientID')) # 打印一个完整的数据元素，包括 DICOMTAG编码值（Group, Element）, VR, Value

 print(ds.data_element('PatientID').VR, ds.data_element('PatientID').value)

 pixel_bytes = ds.PixelData # 原始二进制文件

 pix = ds.pixel_array       # 像素值矩阵

 print(pix.shape) # 打印矩阵维度

 pylab.imshow(pix, cmap=pylab.cm.bone)

 pylab.show() # cmap 表示 colormap,可以是设置成不同值获得不同显示效果,打印dicom图片

2.以上只是针对一张DICOM图片进行解析，接下俩让我看看将一系列的dicom文件读入的效果。

首先导入相应所需要的包

 import os

 import pydicom

 import numpy

 from matplotlib import pyplot

其次就是解析代码

 # 用lstFilesDCM作为存放DICOM files的列表

 PathDicom = "D:/dicom_image/V"  # 与python文件同一个目录下的文件夹

 lstFilesDCM = []

 # 将所有dicom文件读入

 for diName, subdirList, fileList in os.walk(PathDicom):

     for filename in fileList:

         if ".dcm" in filename.lower():  # 判断文件是否为dicom文件

             print(filename)

             lstFilesDCM.append(os.path.join(diName, filename))  # 加入到列表中

 ## 将第一张图片作为参考图

 RefDs = pydicom.read_file(lstFilesDCM[10])  # 读取第一张dicom图片

 # print(RefDs)

 # print(RefDs.pixel_array)

 # print(RefDs.PatientPosition)

 pyplot.imshow(RefDs.pixel_array, cmap=pyplot.cm.bone)

 pyplot.show()

 # 建立三维数组,分别记录长、宽、层数(也就是dicom数据个数)

 ConstPixelDims = (int(RefDs.Rows), int(RefDs.Columns), len(lstFilesDCM))

 print(ConstPixelDims)

 # 得到spacing值 (mm为单位)

 # PixelSpacing - 每个像素点实际的长度与宽度,单位(mm)

 # SliceThickness - 每层切片的厚度,单位(mm)

 ConstPixelSpacing = (float(RefDs.PixelSpacing[0]), float(RefDs.PixelSpacing[1]), float(RefDs.SliceThickness))

 # 三维数据

 x = numpy.arange(0.0, (ConstPixelDims[0] + 1) * ConstPixelSpacing[0], ConstPixelSpacing[0])  # 0到（第一个维数加一*像素间的间隔），步长为constpixelSpacing

 y = numpy.arange(0.0, (ConstPixelDims[1] + 1) * ConstPixelSpacing[1], ConstPixelSpacing[1])  #

 z = numpy.arange(0.0, (ConstPixelDims[2] + 1) * ConstPixelSpacing[2], ConstPixelSpacing[2])  #

 print(len(x),"xxxx")

 ArrayDicom = numpy.zeros(ConstPixelDims, dtype=RefDs.pixel_array.dtype)

 # 遍历所有的dicom文件，读取图像数据，存放在numpy数组中

 for filenameDCM in lstFilesDCM:

     ds = pydicom.read_file(filenameDCM)

     ArrayDicom[:, :, lstFilesDCM.index(filenameDCM)] = ds.pixel_array

 # 轴状面显示

 # dpi是指每英寸的像素数,dpi越大,表示打印出来的图片越清晰。不是指图片的大小.

 # 像素用在显示领域 分辨率用在打印领域 也就是你的图像是用来打印的时候才去考虑分辨率的问题

 pyplot.figure(dpi=1000)

 # 将坐标轴都变为同等长度

 # pyplot.axes().set_aspect('equal', 'datalim')

 pyplot.axes().set_aspect('equal')

 # 将图片变为gray颜色

 pyplot.set_cmap(pyplot.gray())

53 pyplot.imshow(ArrayDicom[:, :, 360])# 第三个维度表示现在展示的是第几层 
 pyplot.show() 
55
 # 冠状面显示 
 pyplot.figure(dpi=100) 
 pyplot.axes().set_aspect('equal', 'datalim') 
 pyplot.set_cmap(pyplot.gray()) 
60 pyplot.imshow(ArrayDicom[:, 90, :])
 pyplot.show()

结果如下：

轴状面：

冠状面：

更多相关内容可以查看pydicom文档官网

5.DICOM的三个切面

如下图所示：是一个三维矩阵的模型，黄线一面区域是横断位面，蓝线一面区域是冠状面，红线一面区域是矢状面：

参考：https://pyscience.wordpress.com/2014/09/08/dicom-in-python-importing-medical-image-data-into-numpy-with-pydicom-and-vtk/

以上为本次学习内容，欢迎交流

医学图像之DICOM格式解析的更多相关文章

Dicom格式文件解析器
转自:http://www.cnblogs.com/assassinx/archive/2013/01/09/dicomViewer.html Dicom全称是医学数字图像与通讯,这里讲的暂不涉及通讯 ...
Dicom格式文件解析器[转]
Dicom格式文件解析器 Dicom全称是医学数字图像与通讯,这里讲的暂不涉及通讯那方面的问题只讲*.dcm 也就是diocm格式文件的读取,读取本身是没啥难度的无非就是字节码数据流处理.只不 ...
dicom格式文件界定标识符的处理
转自:http://www.cnblogs.com/assassinx/archive/2013/05/18/3084854.html 说到底无非几个事情 :1传输语法确定 2数据元素读取 3 7fe ...
Dicom图像解析
医疗图像解析 Dicom 后缀: .dcm..DCM Dicom中规定的坐标系是以人坐标系为绝对坐标系的,规定X轴正向指向病人的左侧,Y轴正向指向病人的背部,Z轴正向指向病人的头部.但是,坐标点的位置 ...
plist文件、NSUserDefault 对文件进行存储的类、json格式解析
========================== 文件操作 ========================== Δ一 .plist文件 .plist文件是一个属性字典数组的一个文件: .plis ...
MySQL binlog的格式解析
我搜集到了一些资料,对理解代码比较有帮助. 在头文件中binlog_event.h中,有描述 class Log_event_header class Log_event_footer 参见[Myst ...
JSON格式解析和libjson使用简介(关于cjson的使用示例)
JSON格式解析和libjson使用简介在阅读本文之前,请先阅读下<Rss Reader实例开发之系统设计>一文. Rss Reader实例开发中,进行网络数据交换时主要使用到了两种数据 ...
转：YUV RGB 常见视频格式解析
转: http://www.cnblogs.com/qinjunni/archive/2012/02/23/2364446.html YUV RGB 常见视频格式解析 I420是YUV格式的一种,而Y ...
TS格式解析
1.TS格式介绍 TS:全称为MPEG2-TS.TS即"Transport Stream"的缩写.它是分包发送的,每一个包长为188字节(还有192和204个字节的包).包的结构为 ...

随机推荐

解题：ZJOI 2006 皇帝的烦恼
禁止DP,贪心真香有一个比较明显的贪心思路是让每个人和距离为$2$(隔着一个人)的人尽量用一样的,这样只需要扫一遍然后对每对相邻的人之和取最大值即可.但是当人数为奇数时这样就会出锅,因为最后一个人和 ...
Libre 6003 「网络流 24 题」魔术球（网络流，最大流）
Libre 6003 「网络流 24 题」魔术球 (网络流,最大流) Description 假设有n根柱子,现要按下述规则在这n根柱子中依次放入编号为 1,2,3,4......的球. (1)每次只 ...
Linux上软件安装
手动安装以安装SublimeText3为例: 首先下载安装包 [keysystem@localhost ~]$ wget https://download.sublimetext.com/subli ...
关于Html class id 命名规范
CSS命名规则头:header 内容:content/containe 尾:footer 导航:nav 侧栏:sidebar 栏目:column 页面外围控制整体布局宽度:wrapper 左右中:l ...
Codeforces 338 D. GCD Table
http://codeforces.com/problemset/problem/338/D 题意: 有一张n*m的表格,其中第i行第j列的数为gcd(i,j) 给出k个数问在这张表格中是否有某一 ...
HDU 3537 基础翻硬币模型 Mock Turtles 向NIM转化
翻硬币游戏,任意选3个,最右边的一个必须是正面.不能操作者败. 基本模型..不太可能自己推还是老实记下来吧..对于单个硬币的SG值为2x或2x+1,当该硬币的位置x,其二进制1的个数为偶数时,sg= ...
Web性能优化系列（1）：Web性能优化分析
本文由伯乐在线 - 鸭梨山大翻译,sunbiaobiao 校稿.未经许可,禁止转载!英文出处:gokulkrishh.github.io.欢迎加入翻译小组. 如果你的网站在1000ms内加载完成, ...
20155230 2016-2017-2 《Java程序设计》第五周学习总结
20155230 2016-2017-2 <Java程序设计>第五周学习总结教材学习内容总结 1.错误处理通常称为异常处理. 2.catch括号中列出的异常不得有继承关系,否则会发生编译 ...
进程ID[PID(Process ID)]与端口号[(Port ID)]的联系
1.首先声明一点:PID不是端口(port id),而是Process ID进程号的意思. 2.那么,什么是进程号? 采集网友的意见就是: 进程号,是系统分配给么一个进程的唯一标识符.PID就是各进程 ...
内置函数bytes()
a=b'\x00\x9c@c' print a[3]#99,c的ascii码是99 print a[1]#156 并且byte是无法修改的 c[1]=155 Traceback (most recen ...

医学图像之DICOM格式解析

医学图像之DICOM格式解析的更多相关文章

随机推荐

热门专题