MIMIC-III 数据集官方样例

MIMIC-III 数据集官方样例

611人浏览

背景

将病历信息电子化在近些年成为了一个热门的话题,引发了众多讨论。在现代电子信息系统的助力下,信息本身的数字化存储已经不再是问题的焦点。如何有效利用这些数据,如何利用数据提供更好的医疗服务才是需要被解决的问题。

MIMIC-III 数据库整合了来自波士顿 Beth Israel Deaconess 医疗中心的脱敏诊疗数据,并将他们开放给签署了数据使用协议的全球医学研究者们,是他们的研究结果更容易被复现,同时也方便对这些研究结果进行进一步的优化。

数据库采集了常规的诊疗护理数据,所以并不会为看护者和相关工作人员产生更多的工作负担。更多信息请查看 MIMIC-III Clinical Database 介绍页.

数据构成

demo数据包含了100位ICU内病人的数据,由于这100位病人是从最终不幸逝世的病人中随机选出,所以数据中都会包含DOD (死亡日期) 字段,但是病人并不一定都会在医院中逝世。该项目已经通过 Beth Israel Deacones 医疗中心的机构审查委员和 麻省理工大学 的审批。由于所有数据都已经脱敏并且数据的开放并不影响正常的诊疗,所以无需向所有人相关病人征求同意。

数据描述

MIMIC-III 数据库是一个包含了 26 张表格的关系型数据库,可以查看 MIMIC-III Clinical Database 介绍页,来获取更细致的数据结构信息。demo 数据采用同样结构,只是去除了NOTEEVENTS 表格中的所有相关行。所有数据都以 .csv 文件的形式,采用 RFC 4180 规范保存。数据中字符串类型的字段,包含逗号,换行或双引号时,都会用双引号封装,而双引号本身会用多加一对双引号进行转义。比如 she said "the patient was notified at 6pm" 在 csv 文件中会被存储为 "she said ""the patient was notified at 6pm""" 。更多相关信息请查阅 RFC 4180 规范的介绍 : https://tools.ietf.org/html/rfc4180