医疗图像数据集 MedMNIST

医疗图像数据集 MedMNIST

328人浏览

背景描述

MedMNIST 数据集包含 10 个预处理数据集,覆盖主要的数据模态(如 X 光片、OCT、超声、CT)、多样化的分类任务(二分类 / 多分类、有序回归和多标签)和数据规模。

数据集设计的多样性导致了任务难度的多样化,而这正是 AutoML 基准所需要的。研究人员对每个数据集进行预处理,将其分割为训练 - 验证 - 测试子集。

Image Name

这些数据集的数据模态涵盖 X 光片、OCT、超声、CT、病理切片、皮肤镜检查等形式,涉及结直肠癌、视网膜疾病、乳腺疾病、肝肿瘤等多个医学领域。

数据说明

Name Data Modality Tasks (# Classes/Labels) # Training # Validation # Test
PathMNIST Pathology Multi-Class (9) 89,996 10,004 7,180
ChestMNIST Chest X-ray Multi-Label (14) Binary-Class (2) 78,468 11,219 22,433
DermaMNIST Dermatoscope Multi-Class (7) 7,007 1,003 2,005
OCTMNIST OCT Multi-Class (4) 97,477 10,832 1,000
PneumoniaMNIST Chest X-ray Binary-Class (2) 4,708 524 624
RetinaMNIST Fundus Camera Ordinal Regression (5) 1,080 120 400
BreastMNIST Breast Ultrasound Binary-Class (2) 546 78 156
OrganMNIST_Axial Abdominal CT Multi-Class (11) 34,581 6,491 17,778
OragnMNIST_Coronal Abdominal CT Multi-Class (11) 13,000 2,392 8,268
OrganMNIST_Sagittal Abdominal CT Multi-Class (11) 13,940 2,452 8,829