呼吸声音数据集
106人浏览
背景描述
在呼吸健康和呼吸疾病中,呼吸声音是一个重要的指标。当人们进行呼吸时,会发出声音。这个声音与空气的流动、肺部组织的变化和肺部分泌物的位置直接相关。比如,有类似哮喘、慢性阻塞性肺病(COPD)等气道阻塞疾病的病人,他们的常见症状就是喘息声。这些声音可以用电子听诊器或者其他录音设备记录下来。通过这些数据,我们也许可以尝试用机器学习的方法自动诊断出像哮喘、肺炎、细支气管炎等等这类的呼吸疾病。
数据说明
数据集包含了920个标注过的录音,长度在10秒到90秒不等,录音来自126位病人。录音总时长为5.5小时,包含6898个呼吸周期:其中1864个有爆裂声(crackles),886个有喘息声(wheezes),506个二者皆有。数据包括背景干净的声音和为了模拟真实生活下嘈杂的录音。囊括了各个年龄段的病人:儿童、成年人和老人。
数据集的zip文件包含以下文件:
- 920个.wav格式的音频文件和相关的.txt格式的标注信息(audio_and_txt_files)
- csv格式的病人诊断信息(patient_diagnosis)
- 解释文件命名格式的txt文件(filename_format)
- 罗列了91个名字的txt文件(filename_differences)
- 病人的人口信息(demographic_info)
注:filename_differences这个文件是数据集制作人发现原始文件有bug的时候的修正数据,现在可以忽略~
用户的人口信息包含6个字段:
- Patient number:病人编号
- Age:年龄
- Sex:性别
- Adult BMI 体重/身高的平方 (kg/m2)
- 儿童体重(kg)
- 儿童身高(cm)