医疗图像数据集 MedMNIST
328人浏览
背景描述
MedMNIST 数据集包含 10 个预处理数据集,覆盖主要的数据模态(如 X 光片、OCT、超声、CT)、多样化的分类任务(二分类 / 多分类、有序回归和多标签)和数据规模。
数据集设计的多样性导致了任务难度的多样化,而这正是 AutoML 基准所需要的。研究人员对每个数据集进行预处理,将其分割为训练 - 验证 - 测试子集。
这些数据集的数据模态涵盖 X 光片、OCT、超声、CT、病理切片、皮肤镜检查等形式,涉及结直肠癌、视网膜疾病、乳腺疾病、肝肿瘤等多个医学领域。
数据说明
Name | Data Modality | Tasks (# Classes/Labels) | # Training | # Validation | # Test |
---|---|---|---|---|---|
PathMNIST | Pathology | Multi-Class (9) | 89,996 | 10,004 | 7,180 |
ChestMNIST | Chest X-ray | Multi-Label (14) Binary-Class (2) | 78,468 | 11,219 | 22,433 |
DermaMNIST | Dermatoscope | Multi-Class (7) | 7,007 | 1,003 | 2,005 |
OCTMNIST | OCT | Multi-Class (4) | 97,477 | 10,832 | 1,000 |
PneumoniaMNIST | Chest X-ray | Binary-Class (2) | 4,708 | 524 | 624 |
RetinaMNIST | Fundus Camera | Ordinal Regression (5) | 1,080 | 120 | 400 |
BreastMNIST | Breast Ultrasound | Binary-Class (2) | 546 | 78 | 156 |
OrganMNIST_Axial | Abdominal CT | Multi-Class (11) | 34,581 | 6,491 | 17,778 |
OragnMNIST_Coronal | Abdominal CT | Multi-Class (11) | 13,000 | 2,392 | 8,268 |
OrganMNIST_Sagittal | Abdominal CT | Multi-Class (11) | 13,940 | 2,452 | 8,829 |