中东呼吸综合征(MERS)数据集

中东呼吸综合征(MERS)数据集

85人浏览

背景描述

中东呼吸综合征(英文缩写:MERS)是一种由中东呼吸综合征冠状病毒(前称“2012年新型冠状病毒”)所引起的新型人畜共患的呼吸系统传染病。患者常见的症状为发烧、咳嗽、喉咙痛或胸痛、腹泻或呕吐。该病曾于2012年在中东引起大型爆发。在2015年5月,韩国首尔出现首例境外移入病例。至6月,在韩国遭到感染的患者数已经超过百例。特别引起注意的是,依照病史,少数被感染者和患者处于同一病房的时间,仅有五分钟到数小时即受到病毒感染,显示出高度传播力,此一现象引起世界卫生组织关注。现时患者分布在25国,主要流行国为沙特阿拉伯、阿拉伯联合酋长国、约旦、卡塔尔、伊朗等中东(西亚)地区和东亚的韩国 。全球病例数截至2015年6月20日为止,已有1342名患者,其中有513人死亡。

 

数据说明

该数据集记录了全球的MERS-CoV病例,含了动物传染人的病例,病例发现的地理信息等。

 

字段解释

  1. nid: 给出版物的唯一标识ID
  2. title: 出版物的标题
  3. author: 文章作者
  4. doi: 文章的DOI.
  5. abstract: 文章的摘要
  6. source_title: 文章出版的杂志
  7. year: 文章发表年份
  8. source: 文章被发现的数据库
  9. pmid_if_applicable: 如果文章来自PubMed,则有PMID
  10. full_text_link_if_included: 全文链接
  11. file_id: pdf的参考,格式是第一作者_年份(e.g. Smith_2017).
  12. occ_id: 每例中东呼吸综合征发现的唯一标识ID。一个pdf里可能有多个病例发现。每个条目都有它的occ_id, 从1-883
  13. organism_type: MERS-CoV检验呈阳性的有机体类型(human, mammal, 还是 environmental)。
  14. organism_specific: 具体检验呈阳性的有机体。命名与Wilson and Reeder (2005) 世界哺乳动物名录一致。
  15. pathogen: 确诊的病原体名称 (e.g. MERS-CoV, Bat Coronaviruses, other MERS-CoV-like pathogens).
  16. pathogen_note: 针对病原体的不同记录。
  17. patient_type: index, unspecified, NA, secondary, import, absent.
  •          index: 直接与动物接触导致的人类MERS-CoV感染,并且报道中没有与MERS-Cov病例或医疗机构接触过
  •          unspecified: 没有充分流行病学证据(e.g.血清学调查)能够将这些病例分类到其他类别
  •          NA: 不适用领域; 非人类病例(e.g. 哺乳动物)
    • secondary: 已确诊的人感染病例。在index之后报道的病例都被推断为secondary cases,除非有非常细节的证据证明这些病人有可能单独接触动物传染源。
    • import: 从其他病情传播地区带到非病区的国家的病例。
    • absent: 疑似病例,但确诊为非MERS-CoV。

                 transmission_route: zoonotic, direct, unspecified, or animal-to-animal.

  • zoonotic: 动物传染人
  • direct: 人传染人
  • unspecified: 缺乏足够流行病学证据来证明该人感染病例的传染源动物还是人
  • animal-to-animal: 动物传动物
  1. clinical: 该MERS-CoV病例是否有临床感染病征,用by yes, no, or unknown表示。
  • yes: 报道中有呈现临床感染病征。人类的感染病征可能有不同程度,轻度(mild)的有发热、咳嗽( fever、cough),严重的(severe)有肺炎、肾衰竭(pneumonia, kidney failure)。骆驼的病征有 流鼻涕(nasal discharge)
  • no: 报道中未呈现临床感染病征。
  • unknown: 病例可能有病征,但文章中没有足够的证据表明是否有。
  1. diagnostic: 运用的诊断方法的类别 (e.g. PCR, serology, or reported)
  2. diagnostic_note: 具体医疗检验的信息 (e.g. rk39, IgG, or IgM serology).
  3. serosurvey: 使用血清检验的场景
  • diagnostic: 用于检验有症状的病人。
  • exploratory: historic exposure determined among healthy asymptomatic individuals.
  1. country: 有病例国家的ISO3码
  2. origin: 非必填项,具体国内MERS-CoV病例发现位置
  3. problem_geography: e.g. 医院(hospital), 屠宰场(abattoir)。
  4. lat: 维度,精确到小数。
  5. long: 经度,精确到小数。
  6. latlong_source: 经纬度的来源。
  7. loc_confidence: 当研究者在确认病例地理位置时的置信程度(good/bad)。
  • Good 表示文章明确表示了病例发现的地理位置,研究者无需推断。
  • Bad 表示文章中没有明确指出位置所在,但研究者可以推断出其地理位置。(字段site_note记录了研究者做推断的逻辑)
  1. shape_type: MERS-CoV发病的地理图形类型 (point 或 polygon).
  2. poly_type: 当MERS-CoV的shape_type是polygon时, 它是 admin (GAUL), custom, 还是 buffer?
  3. buffer_radius: 当是buffer类型时, 它的半径是多少?(km为单位)
  4. gaul_year_or_custom_shapefile: ArcGIS里图形文件的文件路径,本数据集定制的文件路径在此: https://cloud.ihme.washington.edu/index.php/s/DGoyKYqnbjG54F2/download
  5. poly_id: 每个GAUL图形文件的ID
  6. poly_field: 哪种polygon类型用于在地理位置标记发病地点?(e.g. 如果使用了admin1 polygon,则输入的是 ADM1_CODE)
  7. site_notes: 病例出事地点的各种记录
  8. month_start: 病情爆发的初始月份,如果文章中有明确提到月份,则用数字表示月份 (1 = January, 2 = February, etc.). 如果没有,研究人员会写‘NA’。
  9. month_end: 病情结束的月份,即病人MERS-CoV检测为阴性的日期。如果文章中有明确提到月份,则用数字表示月份 (1 = January, 2 = February, etc.). 如果没有,研究人员会写‘NA’。
  10. year_start: 病情开始的年份。如果文章中没有明确提及,则用IHME标准推断 : (year_start = publication year – 3).
  11. year_end: 病情结束的年份。如果文章中没有明确提及,则用IHME标准推断:(year_end = publication year – 1).
  12. year_accuracy: 如果年份在文章中明确提及了,则是'0',如果是推断得到的年份,则是‘1’.
  13.