公用、开放的医学数据库有哪些呢?能提供具体的准入方式吗?有专门的血管类疾病的公用数据库吗?

统计之光

统计之光有问题直接私信,付费咨询经常看不到。私可领免费Meta分析课​ 关注36 人赞同了该回答​目录

本文全面整理23个医学公用数据库,提供了每个数据库的官方访问地址,其中也涵盖你所需的血管类公共数据库。如果内容对你有帮助,希望点赞收藏以资鼓励(感恩ORZ)

每一种数据库的数据申请方式、下载方式,如果你感兴趣的话,可以平论留言告知我,会根据大家的需求给大家安排详细的使用教程,也可以再分享一些用它们发表SCI的成功案例解读~~

公共卫生与交叉学科数据库

一、中国 营养健康调查CHNS 数据库

中国健康与营养调查(China Health and Nutrition Survey ,CHNS)是美国北卡罗来纳大学人口中心与中国预防科学医学院联合进行的大规模的社会健康调查。

旨在研究健康、营养、以及国家和地方政府实施的计划生育政策和项目,并了解中国社会的社会和经济转型如何影响其人口的健康和营养状况。

这项调查采用多阶段随机聚类方法,从 15 个省和直辖市的约 7200 个家庭、3 万多个人中抽取样本。还通过对食品市场、卫生设施、计划生育官员以及其他社会服务机构和社区领导人的调查收集了详细的社区数据。

调查的内容涉及健康学、营养学、社会学、人口学、经济学、公共政策等多个学科,数据内容包括社区调查、家庭户调查、个人调查、健康调查、营养和体质测验、食品市场调查及健康和计划生育调查。

网址:China Health and Nutrition Survey

二、国家人口健康科学数据中心

国家人口健康科学数据中心(National Population Health Data Center,,NPHDC)是国家科技部和财政部认定 20 个的国家科学数据中心之一,集成涉及基础医学、临床医学、药学、公共卫生、中医药学、人口与生殖健康等多方面的科学数据资源。

网址:https://www.ncmi.cn/​www.ncmi.cn/

三、中国健康与养老追踪调查数据库CHAELS

中国健康与养老追踪调查(China Health and Retirement Longitudinal Survey, CHARLS)是由北京大学国家发展研究院主持、北京大学中国社会科学调查中心与北京大学团委共同执行的大型跨学科调查项目,是国家自然科学基金委资助的重大项目,旨在收集一套代表中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析我国人口老龄化问题,推动老龄化问题的跨学科研究,为制定和完善我国相关政策提供更加科学的基础。

网站:中国健康与养老追踪调查

四、美国健康与营养调查NHANES

NHANES数据库,实际上就是美国国家健康与营养调查机构收集的一项基于美国家庭人口健康、营养和社会学信息的调查数据。

该数据库每年都会调查一个全国代表性的样本,约 5000 人,分为访谈和体检数据两大部分进行收集更新。

访谈部分主要包括了人口统计学、社会经济学、饮食和健康相关的问题;体检部分则包括了基础医疗信息,血压、测听检查、口腔健康、握力等,以及大量的实验室检测数据和部分放射科数据。

网址:https://www.cdc.gov/nchs/nhanes/index.htm

五、全球疾病负担数据库

它提供包括特定疾病或风险因素的流行程度,也包括其造成的相对伤害的全球范围的数据,并提供工具量化数百种疾病、伤害和风险因素造成的健康损失。衡量GBD的指标包括:死亡、寿命损失、寿命残疾、限制生命的残疾、患病率、发病率、预期寿命、死亡概率和健康预期寿命、孕产妇死亡率和总暴露。提取的数据指标包括:数量、比率、百分比、年份和死亡概率。

网址:Global Burden of Disease Study 2019 (GBD 2019) Data Resources

临床研究数据库

一、SEER

SEER 数据库 (Surveillance, Epidemiology, and End Results) 由美国国立癌症研究所于 1973 年建立,是美国癌症统计的权威来源。由美国国家癌症研究所 (National Cancer Institute, NCI) 癌症控制和人口科学部 (Division of Cancer Control and Population Sciences, DCCPS) 的监视研究项目 (Surveillance Research Program, SRP) 提供支持。

SEER 可提供癌症统计信息,数据库中的肿瘤可分为 9 类:乳腺、结肠 & 直肠、其他消化系统、女性生殖、淋巴 & 白血病、男性生殖、呼吸系统、泌尿系统及其它尚未确定的类型。

官网:https://seer.cancer.gov/Surveillance, Epidemiology, and End Results Programhttps://seer.cancer.gov/

二、NCDB

美国国家癌症数据库(National Cancer Database, NCDB)是经国家认证的,由美国外科医师学会和美国癌症学会联合组建的,它是一个基于医院登记数据的临床肿瘤学数据库,来源于超过1500多个癌症委员会认证的机构。

NCDB数据库可用于分析和跟踪恶性肿瘤患者的治疗过程和结局。数据库代表了全美超过70%的新诊断癌症病例和超过三千四百万个历史记录。

网址:https://www.facs.org/quality-programs/cancer/ncdb

三、MIMIC重症

MIMIC 数据库是面向全球科研人员公开的公共大型临床数据库,搜集了美国马塞诸塞州波士顿贝斯以色列女执事医疗中心收治的从 2008 年至 2019 年超过 38 万名患者「其中 5 万余重症患者」的临床数据

数据库详细记录了患者的人口统计学信息、实验室检查、用药情况、生命体征、手术操作、疾病诊断、药物管理、生存状态等详细信息,包含了多种类型ICU(外科监护室、内科监护室、创伤外科监护室、心脏病监护室、心外恢复监护室)的入住信息。

网址:https://mimic.physionet.org/

四、Orphanet

Orphanet定位于一个全面的,综合的罕见病和治疗所需药物(即孤儿药物)及其其他资料的数据库和信息门户网站,能为普通患者,医生,研发机构提供丰富的罕见病信息。

目前, Orphanet已收录了近6000种罕见病的各种相关信息,堪称目前世界上最为权威和丰富的罕见病知识库。通过对这个网站上的信息查询和数据分析,可以得到很多罕见病的有用资源。

网址:http://www.orpha.net/consor/cgi-bin/index.php

五、BioLINCC

生物标本和数据采集信息中心,2008年由美国国家心肺血液研究所(National Heart,Lung,and Blood Institute,NHLBI)建立的数据库,旨在帮助科研人员便捷获取研究数据,提高NHLBI资助项目的转化率。

BioLINCC数据库包含两类数据:

  • 生物标本数据,自1975年开始由血液疾病部门管理
  • 临床研究数据,自2000年开始由心血管科学研究中心管理

网址:https://biolincc.nhlbi.nih.gov/

六、TCGA

TCGA(The cancer genome atlas,癌症基因组图谱)由 National Cancer Institute(NCI,美国国家癌症研究所) 和 National Human Genome Research Institute(NHGRI,美国国家人类基因组研究所)于 2006 年联合启动的项目, 收录了11000个肿瘤样本,33个肿瘤类型的数据。

网址:https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga

生物信息有关数据库

一、METABRIC(乳腺数据库

国际乳腺癌协会的分子分类数据库(Molecular Taxonomy of Breast Cancer International Consortium, METABRIC) 是一个加拿大-英国联合项目,旨在根据有助于确定最佳治疗过程的分子特征将乳腺肿瘤进一步分类。迄今为止已经根据肿瘤的基因指纹将乳腺癌重新分类为10个全新的类别。这些基因可以对乳腺癌生物学提供迫切需要的洞察力,使医生能够预测肿瘤是否会对某种特定的治疗产生反应。肿瘤是否有可能扩散到身体的其他部位,或者治疗后是否有可能复发。

网址:METABRIC data access committee – EGA European Genome-Phenome Archive (ega-archive.org)

二、GEO

GEO数据库全称Gene Expression Omnibus database,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。创建于2000年,收录了世界各国研究机构提交的高通量基因表达数据,也就是说只要是目前已经发表的论文,论文中涉及到的基因表达检测的数据都可以通过这个数据库中找到。

网址:Home – GEO – NCBI (nih.gov)

三、DGV【需要科学上网】

DGV提供了一个可公开访问的,全面的结构变异(SV)目录,这些结构变异(SV)存在于全球人群的控制个体的基因组中。 基因组变异数据库的目标是提供人类基因组结构变异的全面摘要。我们将结构变异定义为涉及大于50bp的DNA片段的基因组改变。数据库的内容仅表示在健康对照样本中识别的结构变异。 基因组变异数据库为旨在将基因组变异与表型数据相关联的研究提供了有用的对照数据目录。该数据库不断更新来自同行评审研究的新数据。

网址:DGV – Database Commons (cncb.ac.cn)

四、DECIPHER

DECIPHER是一项国际化的合作项目,是一个由200多个临床中心和1600多个遗传学家和实验室构成的联盟,从各种生物信息资源中进行数据整合,提供了一套全面的工具来识别与患者表型相关的基因组结构变异,挖掘潜在的致病基因,所有的成果存在在一个在线数据库中,方便科学家查看和利用,对应的文章发表在Nucleic Acids Research上。

网址:https://decipher.sanger.ac.uk/

五、OMIM

OMIM(Online Mendelian Inheritance in Man)数据库,中文称在线人类孟德尔遗传数据库。OMIM侧重于疾病表型与其致病基因之间的关联。

OMIM数据库包括1.gene entry基因条目;2.allelic variations 等位基因变异;3.gene map 基因图谱;4.phenotypic series 表型系列;5.phenotype entry 表型条目;6.clinical synopsis 临床提要;7.external links 外部链接

网址:Home – OMIM

六、Comparative Toxicogenomics Database

CTD(The Comparative Toxicogenomics Database)提供了有关化学暴露(环境和药物),基因和蛋白质,表型和疾病之间复杂相互作用的信息。这些数据与功能和途径数据集成在一起,有助于发展关于受环境影响的疾病的潜在机制的假设。CTD包括超过230万种化学药物,46689个基因,4340个表型和7212种疾病的基因,化学表型,药物相关疾病,基因相关疾病和药物相互作用,自上次更新以来,内容增加了46%,与其他数据集集成后,产生的药物基因组关联超过3800万。

网址:The Comparative Toxicogenomics Database | CTD (ctdbase.org)

七、Kaplan Meier Plotter

Kaplan-Meier Plotter是常用的进行生存分析的网站,其数据来源于GEO、EGA、TCGA数据库,能够评估来自21种肿瘤的30000多个样本中所有基因的表达与患者生存率之间的相关性,从而发现和验证与生存相关的生物标志物。

网址:http://kmplot.com/analysis/index.php?p=background

医学影像数据库

一、Open Access Series Of Imaging Studies

OASIS,全称为Open Access Series of Imaging Studies,已经发布了第3代版本,第一次发布于2007年,是一项旨在使科学界免费提供大脑核磁共振数据集的项目。它有两个数据集可用,下面是第1版的主要内容。

(1) 横截面数据集:年轻,中老年,非痴呆和痴呆老年人的横断面MRI数据。该组由416名年龄在18岁至96岁的受试者组成的横截面数据库组成。对于每位受试者,单独获得3或4个单独的T1加权MRI扫描包括扫描会话。受试者都是右撇子,包括男性和女性。100名60岁以上的受试者已经临床诊断为轻度至中度阿尔茨海默病

(2) 纵向集数据集:非痴呆和痴呆老年人的纵向磁共振成像数据。该集合包括150名年龄在60至96岁的受试者的纵向集合。每位受试者在两次或多次访视中进行扫描,间隔至少一年,总共进行373次成像。对于每个受试者,包括在单次扫描期间获得的3或4次单独的T1加权MRI扫描。受试者都是右撇子,包括男性和女性。在整个研究中,72名受试者被描述为未被证实。包括的受试者中有64人在初次就诊时表现为痴呆症,并在随后的扫描中仍然如此,其中包括51名轻度至中度阿尔茨海默病患者。另外14名受试者在初次就诊时表现为未衰退,随后在随后的访视中表现为痴呆症。

数据集地址:http://www.oasis-brains.org/

二、DeepLesion

DeepLesion由美国国立卫生研究院临床中心(NIHCC)的团队开发,是迄今规模最大的多类别、病灶级别标注临床医疗CT图像开放数据集。在该数据库中图像包括多种病变类型,目前包括4427个患者的32,735 张CT图像及病变信息,同时也包括肾脏病变,骨病变,肺结节和淋巴结肿大。DeepLesion多类别病变数据集可以用来开发自动化放射诊断的CADx系统。

数据集地址:https://nihcc.app.box.com/v/DeepLesion

三、NITRC

NITRC可提供有关神经信息学软件和数据。自2007年首次亮相以来,NITRC借助过去经常丢失或无视的研究软件和数据,帮助神经科学界做出了进一步发现。NITRC还提供对数据的免费访问,并允许按使用量付费的基于云的访问来获得无限的计算能力,从而以最小的启动和成本实现了全球科学合作。NITRC的内容包括:MR,PET / SPECT,CT,EEG / MEG,光学成像,临床神经成像,计算神经科学以及成像基因组学软件工具,数据和计算资源。

网址:https://www.nitrc.org/

四、ADNI

一个阿尔茨海默病相关的数据库。ADNI将研究人员与研究数据联合起来,共同努力确定阿尔茨海默氏病(AD)的进展。ADNI研究人员收集,验证和利用数据,包括MRI和PET图像,遗传学,认知测试,CSF和血液生物标记物作为疾病的预测因子。北美ADNI研究的研究资源和数据可通过此网站获得,其中包括阿尔茨海默氏病患者,轻度认知障碍受试者和老年人对照。

网址:http://adni.loni.usc.edu/

五、OAI

一个骨关节炎(OA)的数据库,该数据存储库提供对11年OAI纵向队列研究的数据和图像的访问 。这项研究记录了 整个疾病范围内的膝骨关节炎的自然病史,包括处于危险中的受试者,患有早期/临床前疾病,患有确定性OA的受试者以及患有晚期疾病的受试者。在OAI中,已经记录了膝OA的影像学,生化,遗传和危险标志物。将这些指标与结构和/或临床 结果进行比较可以使人们对预防和治疗这种使人衰弱的疾病有深入的了解。该OAI研究设计,措施,临床数据和DICOM图像都可以使用本网站下载。

网址:https://nda.nih.gov/oai发布于 2023-02-28 11:35・IP 属地四川​

更多回答

MRNet: A Dataset of Knee MRIs and Competition for Automated Knee MRI Interpretation。

Alzheimer’s Disease

OASIS Brains – Open Access Series of Imaging Studies (oasis-brains.org)

Brain Tumor

Brain Tumor Dataset](https://paperswithcode.com/dataset/brain-tumor-dataset)

Brain Tumor MRI Dataset Dataset | Papers With Code](https://paperswithcode.com/dataset/brain-tumor-mri-dataset)

RSNA-MICCAI Brain Tumor Radiogenomic Classification

X-Rays

MURA Dataset: Towards Radiologist-Level Abnormality Detection in Musculoskeletal Radiographs: Towards Radiologist-Level Abnormality Detection in Musculoskeletal Radiographs

CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning: CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning

CT/PET

DeepLesion, a dataset with 32735 lesions in 32120 CT slices from 10594 studies of 4427 unique patients: https://nihcc.app.box.com/v/DeepLesion

Lung Cancer

The Cancer Imaging Archive (TCIA): Cancer Imaging Program (CIP)

A Large-Scale CT and PET/CT Dataset for Lung Cancer Diagnosis (Lung-PET-CT-Dx) – The Cancer Imaging Archive (TCIA) Public Access – Cancer Imaging Archive Wiki: A Large-Scale CT and PET/CT Dataset for Lung Cancer Diagnosis (Lung-PET-CT-Dx)

Chest CT-Scan images Dataset: Chest CT-Scan images Dataset

Luna16 Lung Cancer Dataset: Luna16 Lung Cancer Dataset

CT Scan Images for Lung Cancer: CT Scan Images for Lung Cancer

IQ-OTH/NCCD – Lung Cancer Dataset: IQ-OTH/NCCD – Lung Cancer Dataset

Breast Cancer

Breast Cancer CT (Fully Preprocessed); Breast Cancer CT (Fully Preprocessed)

Duke Breast Cancer MRI Dataset: https://paperswithcode.com/dataset/duke-breast-cancer-mri

COVID/Pneumonia

Access the Data – The Cancer Imaging Archive (TCIA)

Large COVID-19 CT scan slice dataset: Large COVID-19 CT scan slice dataset发布于 2023-07-03 09:24

常见的医学数据库有知网,万方,维普,以及国家科学技术部,中国科学技术情报研究所等,但不是开放的。 美国国立医学图书馆数据库是开放免费的。目前好像暂时没有血管疾病的开放数据库。

来自网络

作者 divusun

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注