呼吸声音数据集

呼吸声音数据集

106人浏览

背景描述

在呼吸健康和呼吸疾病中,呼吸声音是一个重要的指标。当人们进行呼吸时,会发出声音。这个声音与空气的流动、肺部组织的变化和肺部分泌物的位置直接相关。比如,有类似哮喘、慢性阻塞性肺病(COPD)等气道阻塞疾病的病人,他们的常见症状就是喘息声。这些声音可以用电子听诊器或者其他录音设备记录下来。通过这些数据,我们也许可以尝试用机器学习的方法自动诊断出像哮喘、肺炎、细支气管炎等等这类的呼吸疾病。

数据说明

数据集包含了920个标注过的录音,长度在10秒到90秒不等,录音来自126位病人。录音总时长为5.5小时,包含6898个呼吸周期:其中1864个有爆裂声(crackles),886个有喘息声(wheezes),506个二者皆有。数据包括背景干净的声音和为了模拟真实生活下嘈杂的录音。囊括了各个年龄段的病人:儿童、成年人和老人。

数据集的zip文件包含以下文件

  • 920个.wav格式的音频文件和相关的.txt格式的标注信息(audio_and_txt_files)
  • csv格式的病人诊断信息(patient_diagnosis)
  • 解释文件命名格式的txt文件(filename_format)
  • 罗列了91个名字的txt文件(filename_differences)
  • 病人的人口信息(demographic_info)

注:filename_differences这个文件是数据集制作人发现原始文件有bug的时候的修正数据,现在可以忽略~

用户的人口信息包含6个字段

  • Patient number:病人编号
  • Age:年龄
  • Sex:性别
  • Adult BMI 体重/身高的平方 (kg/m2)
  • 儿童体重(kg)
  • 儿童身高(cm)