- +1
新冠數(shù)據(jù)錦集
原創(chuàng) 服老思和同學(xué)們 P話 收錄于話題#新冠1#疫情1#數(shù)據(jù)11
自 2020 年初新冠肺炎爆發(fā),一年多過去,covid-19 依然影響著世界。2020 年疫情初期,我們整理部分疫情初期的數(shù)據(jù)項(xiàng)目[1]和基于 Tableau 設(shè)計(jì)的可視化作品[2],2021 年初,我們再次整理有關(guān)新冠疫情可視化的套路集錦[3]。本次是疫情相關(guān)集錦的第四期,我們收集 27 個(gè)數(shù)據(jù)集,分為案例、疫苗、病毒、政策、輿情、醫(yī)療和其他 7 大類別,疫情改變了些什么?現(xiàn)在狀況如何?或許這些數(shù)據(jù)集會帶給你一些新的視角。
JHU數(shù)據(jù)集
JHU數(shù)據(jù)集是由約翰霍普金斯大學(xué)系統(tǒng)科學(xué)與工程中心 (JHU CSSE) 運(yùn)營的 2019 年新型冠狀病毒可視化儀表板的數(shù)據(jù)存儲庫。數(shù)據(jù)收集自各國政府和衛(wèi)生部官網(wǎng)。包含世界各地區(qū)的病例數(shù)和死亡數(shù),可精確到省,美國地區(qū)已精確到縣級。數(shù)據(jù)格式為csv。可視化儀表板:JHU儀表盤[4]
鏈接:JHU數(shù)據(jù)集[5]
紐約時(shí)報(bào)數(shù)據(jù)集
紐約時(shí)報(bào)數(shù)據(jù)集發(fā)布的主要數(shù)據(jù)是自大流行開始以來美國每個(gè)縣和州報(bào)告的每日累計(jì)病例數(shù)和死亡數(shù),還會發(fā)布監(jiān)獄、學(xué)校、死亡人數(shù)過多、口罩使用等數(shù)據(jù)。數(shù)據(jù)格式為csv??梢暬貓D:紐約時(shí)報(bào)可視化地圖[6]
鏈接:紐約時(shí)報(bào)數(shù)據(jù)集[7]
ECDC 數(shù)據(jù)集(歐盟)
ECDC數(shù)據(jù)集包含歐洲經(jīng)濟(jì)區(qū)國家的病例和死亡人數(shù)數(shù)據(jù),還包含病毒變異體數(shù)據(jù),醫(yī)療系統(tǒng)承載力數(shù)據(jù)及應(yīng)對疫情的建議。有xls、csv、json、xml多鐘數(shù)據(jù)格式供下載??梢暬刂罚篊OVID-19情況儀表板[8]
鏈接:ECDC 數(shù)據(jù)集(歐盟)[9]
疫苗數(shù)據(jù)
—
Launch& Scale Speedometer
杜克全球健康創(chuàng)新中心之下的Launch & Scale Speedometer項(xiàng)目開發(fā)了一個(gè)數(shù)據(jù)框架,并對公開信息進(jìn)行案頭研究,追蹤全球新冠疫苗候選者和狀態(tài)、采購和制造訂單、正在進(jìn)行的談判、按國家劃分的新冠疫苗需求量,以及分配和分發(fā)計(jì)劃等數(shù)據(jù)。研究團(tuán)隊(duì)還對主要國家的政府官員進(jìn)行了訪談,從而更好地了解疫苗分配和分發(fā)的背景以及面臨的挑戰(zhàn)。該項(xiàng)目的數(shù)據(jù)已被《紐約時(shí)報(bào)》《華盛頓郵報(bào)》、彭博社等西方主流媒體引用。讀者在其網(wǎng)站上可以查閱交互圖并下載部分?jǐn)?shù)據(jù)。數(shù)據(jù)格式為xls。
鏈接:Launch& Scale Speedometer[10]
owid-vaccinations
由Our World in Data收集的全球 COVID-19 疫苗接種數(shù)據(jù)。數(shù)據(jù)收集自不同國家相關(guān)的官方網(wǎng)站。多次被BBC、紐約時(shí)報(bào)等媒體引用。數(shù)據(jù)格式為csv。nature地址:A global database of COVID-19 vaccinations[11]
鏈接:owid-vaccinations[12]
病毒數(shù)據(jù)
—
Global.health數(shù)據(jù)集
Global.health數(shù)據(jù)集包含來自 100 多個(gè)國家/地區(qū)的超過3000 萬個(gè)匿名案例的詳細(xì)信息。包含支持其數(shù)據(jù)管理工作的服務(wù)器和腳本:Global.health開發(fā)[13]
鏈接:Global.health數(shù)據(jù)集[14]
CAS抗病毒候選化合物數(shù)據(jù)集
CAS抗病毒候選化合物數(shù)據(jù)集包含近 50,000 種化學(xué)物質(zhì)的連接表,以及相關(guān)元數(shù)據(jù)。數(shù)據(jù)集采用 SD 文件格式 (.sdf),可用于研究,數(shù)據(jù)挖掘,機(jī)器學(xué)習(xí)和分析等。
鏈接:CAS抗病毒候選化合物數(shù)據(jù)集[15]
微軟開放研究數(shù)據(jù)集
微軟開放研究數(shù)據(jù)集把COVID-19 和冠狀病毒相關(guān)學(xué)術(shù)論文的全文和元數(shù)據(jù)數(shù)據(jù)集針對機(jī)器閱讀進(jìn)行了優(yōu)化。目的是動員研究人員應(yīng)用自然語言處理的最新進(jìn)展來生成新的分析信息,以支持對抗這種傳染病。鏈接內(nèi)包含詳細(xì)的數(shù)據(jù)訪問方式,提供python代碼。
鏈接:微軟開放研究數(shù)據(jù)集[16]
TCIA數(shù)據(jù)集
癌癥成像計(jì)劃 (CIP)正在利用其癌癥成像檔案 (TCIA) 作為將圖像集公開以供社區(qū)立即參考 COVID-19 患者圖像。含有美國一百多位患者的多種成像數(shù)據(jù)、臨床數(shù)據(jù)及已被上傳到 Genbank 存儲庫的SARS-COV-2 cDNA 序列數(shù)據(jù)。圖像類型為DICOM(醫(yī)學(xué)圖像和相關(guān)信息的國際標(biāo)準(zhǔn)),注釋格式為json,臨床數(shù)據(jù)格式為csv。
鏈接:TCIA數(shù)據(jù)集[17]
EIBIR數(shù)據(jù)庫
EIBIR數(shù)據(jù)庫是由歐洲生物醫(yī)學(xué)成像研究所匯總的來自全世界各地超過1000例患者的成像數(shù)據(jù)及臨床數(shù)據(jù),對于放射學(xué)診斷以及開發(fā)用于基于機(jī)器的診斷的人工智能工具至關(guān)重要。
鏈接:EIBIR數(shù)據(jù)庫[18]
covid-chestxray數(shù)據(jù)庫
該數(shù)據(jù)集包含COVID-19 或其他病毒性和細(xì)菌性肺炎(MERS、SARS和ARDS .)陽性或疑似患者的近1000張胸部 X 射線和 CT 圖像及臨床數(shù)據(jù),收集旨在用于計(jì)算分析。使用這些圖像來開發(fā)基于人工智能的方法來預(yù)測和理解感染。開源預(yù)測模型平臺:Chester the AI Radiology Assistant[19]
鏈接:covid-chestxray-dataset[20]
NextStrain
NextStrain 是一個(gè)搜集全球病毒毒株的開源數(shù)據(jù)庫,目前擁有來自多個(gè)國家的400+個(gè)變種,公開在 GitHub 上。項(xiàng)目同時(shí)提供一個(gè)關(guān)系網(wǎng)絡(luò)圖的可視化工具,使用系統(tǒng)發(fā)生樹的方法,來研究病毒變異的過程和推斷首次爆發(fā)的時(shí)間。路透社也在 2020 年初的作品 Genetics of the new virus[21] 基于此數(shù)據(jù)繪制所有冠狀病毒關(guān)系譜系。
鏈接:NextStrain[22]
政策數(shù)據(jù)
—
CoronaNet
CoronaNet收集有關(guān)政府為戰(zhàn)勝冠狀病毒而采取的各種精細(xì)行動的信息,這不僅包括收集有關(guān)哪些政府正在應(yīng)對冠狀病毒的信息,還包括他們的政策針對誰(例如其他國家)、他們是如何做的(例如旅行限制、禁止口罩出口)以及他們何時(shí)這樣做??稍趦x表盤內(nèi)篩選區(qū)域進(jìn)行下載。數(shù)據(jù)格式為csv
鏈接:CoronaNet[23]
covid-policy-tracker
covid-policy-tracker, 是由牛津大學(xué)收集的數(shù)據(jù)集,收集有關(guān)哪些政府在何時(shí)采取了哪些措施的信息。這可以幫助決策者和公民以一致的方式了解政府的應(yīng)對措施,從而有助于抗擊大流行。系統(tǒng)地收集有關(guān)政府采取的幾種不同常見政策響應(yīng)的信息,按一定比例記錄這些政策以反映政府行動的程度,并將這些分?jǐn)?shù)匯總成一套政策指數(shù),根據(jù)此數(shù)據(jù)集給政府提出的建議:When do government responses need to be increased or maintained?[24]
鏈接:covid-policy-tracker[25]
CCCSL
CCCSL( Complexity Science Hub COVID-19 Control Strategies List )總結(jié)關(guān)于政府對 COVID-19 的反應(yīng)的綜合結(jié)構(gòu)化數(shù)據(jù)集,包括其實(shí)施的相應(yīng)時(shí)間表,數(shù)據(jù)來自官方政府資源、科學(xué)論文、公共衛(wèi)生機(jī)構(gòu)(WHO、CDC 和 ECDC)的網(wǎng)頁、社交媒體發(fā)布信息、報(bào)紙文章。數(shù)據(jù)格式有json、bib、csv、ris。提供用于探索數(shù)據(jù)集的R代碼。
鏈接:CCCSL[26]
HIT-COVID
HIT-COVID項(xiàng)目跟蹤政府為減緩 SARS-COV-2 在全球的傳播而采取的公共衛(wèi)生和社會措施的實(shí)施,由數(shù)百位志愿者收集自官方來源或非官方來演。對于每項(xiàng)干預(yù),HIT-COVID 都會捕獲一組額外數(shù)據(jù),包括是否需要干預(yù)以及政策適用的人群。數(shù)據(jù)格式為csv。
鏈接:HIT-COVID[27]
輿情數(shù)據(jù)
—
ROPER
該數(shù)據(jù)集由康奈爾大學(xué)羅珀中心收集整理美國各個(gè)機(jī)構(gòu)如ABC,CNN的民意調(diào)查數(shù)據(jù)。包括個(gè)人行為、隔離、在家工作、準(zhǔn)備和政府評級。
鏈接:ROPER[28]
COVID-19 Public Monitor
數(shù)據(jù)由倫敦帝國理工學(xué)院和 YouGov(一家全球性的輿論組織)收集。旨在提供關(guān)于不同人群如何應(yīng)對大流行的行為分析,幫助公共衛(wèi)生機(jī)構(gòu)努力限制疾病的影響。數(shù)據(jù)包括:性別、年齡、地區(qū)(國內(nèi))、家庭人數(shù)、家庭兒童、健康狀況、工作狀態(tài)和調(diào)查回復(fù)日期。還提供了一個(gè)基于年齡、性別和地區(qū)的加權(quán)變量,受訪者來自近五十多個(gè)國家,數(shù)據(jù)格式為csv??梢暬瘍x表盤:coviddatahub.com[29]
鏈接:https://today.yougov.com/covid-19[30]
醫(yī)療數(shù)據(jù)
—
healthdata
healthdata匯總美國醫(yī)院設(shè)施利用率數(shù)據(jù)。來自兩個(gè)主要來源:(1) HHS TeleTracking(美國衛(wèi)生及公共服務(wù)部[31]), (2) 衛(wèi)生部門代表其醫(yī)療機(jī)構(gòu)直接提供給 HHS Protect 的報(bào)告??梢暬刂?Hospital Facilities[32]。數(shù)據(jù)格式有json和csv。
鏈接:healthdata[33]
Coronavirus (COVID-19) Testing
由Our World In Data收集的關(guān)于各個(gè)國家對國民COVID-19檢測的數(shù)據(jù)。用于研究哪個(gè)國家做的好,哪個(gè)國家漏報(bào)了病例。數(shù)據(jù)包括確診病例和死亡數(shù)住院和ICU數(shù)據(jù),疫苗接種等。數(shù)據(jù)格式為xsl,csv,json。
鏈接:Coronavirus (COVID-19) Testing - Statistics and Research[34]
COVID-19 TREATMENT AND VACCINE TRACKER
該數(shù)據(jù)集跟蹤 COVID-19治療方法和疫苗的開發(fā)。包括治療方法300多種,疫苗200多種??稍诰W(wǎng)頁查看,也可下載csv表格來研究其中的關(guān)系。
鏈接:COVID-19 TREATMENT AND VACCINE TRACKER[35]
其他/綜合
—
Finding Health Statistics
JHU整理的有關(guān) COVID-19 的各種統(tǒng)計(jì)數(shù)據(jù)。如全球知名數(shù)據(jù)集JHU數(shù)據(jù)集[36]
鏈接:Finding Health Statistics[37]
PHSM
全球知名有關(guān)疫情數(shù)據(jù)集的集合。提供用于數(shù)據(jù)獲取的API。
鏈接:PHSM[38]
美國國立衛(wèi)生研究院數(shù)據(jù)集
關(guān)病毒特征數(shù)據(jù)集的集合
鏈接:美國國立衛(wèi)生研究院數(shù)據(jù)集[39]
Our World in Data
整合很多知名數(shù)據(jù)集,涵蓋世界大部分國家/地區(qū),有多鐘數(shù)據(jù)格式。以數(shù)據(jù)看世界(OurWorldinData)是由英國牛津大學(xué)的Leszell創(chuàng)建的網(wǎng)站,他致力于研究幾十年來各國關(guān)于人類生活水平的數(shù)據(jù),以揭示全世界的生活狀況是如何潛移默化地發(fā)生變化的,并對未來產(chǎn)生了什么影響。
鏈接:Our World in Data[40]
GoogleCloudPlatform
谷歌云平臺,包含跟蹤 90 多個(gè)國家/地區(qū)人口統(tǒng)計(jì)、經(jīng)濟(jì)、流行病學(xué)、地理、健康、住院、流動性、政府響應(yīng)、天氣等數(shù)據(jù)。被許多組織使用,例如 WHO/Covax、世界銀行、國際貨幣基金組織、哈佛大學(xué)研究中心、美國國際開發(fā)署和 Verily,可以免費(fèi)使用 BigQuery直接運(yùn)行 SQL 查詢。
鏈接:GoogleCloudPlatform[41]
CREDIT
—
?撰文:@花季
?編輯:@服老思 @包小包
? 背景圖:Shutterstock
?排版:bee
REFERENCE
—
?[1] 疫情初期的數(shù)據(jù)項(xiàng)目: https://mp.weixin.qq.com/s/Diurg0rEmF8gLOm7FeO7Yw
?[2] 基于 Tableau 設(shè)計(jì)的可視化作品: https://mp.weixin.qq.com/s/Dpr8BSkh-M_6--fGQ-mR2Q
?[3] 新冠疫情可視化的套路集錦: https://mp.weixin.qq.com/s/ZvH2WOuoT6QexJK6j316fg
?[4] JHU儀表盤: https://www.arcgis.com/apps/dashboards/bda7594740fd40299423467b48e9ecf6
?[5] JHU數(shù)據(jù)集: https://github.com/CSSEGISandData/COVID-19
?[6] 紐約時(shí)報(bào)可視化地圖: https://www.nytimes.com/interactive/2021/us/covid-cases.html
?[7] 紐約時(shí)報(bào)數(shù)據(jù)集: https://github.com/nytimes/covid-19-data
?[8] COVID-19情況儀表板: https://qap.ecdc.europa.eu/public/extensions/COVID-19/COVID-19.html%23global-overview-tab
?[9] ECDC 數(shù)據(jù)集(歐盟): https://www.ecdc.europa.eu/en/covid-19/data
?[10] Launch& Scale Speedometer: https://launchandscalefaster.org/COVID-19
?[11] A global database of COVID-19 vaccinations: https://www.nature.com/articles/s41562-021-01122-8
?[12] owid-vaccinations: https://www.nature.com/articles/s41562-021-01122-8
?[13] Global.health開發(fā): https://github.com/globaldothealth/list
?[14] Global.health數(shù)據(jù)集: https://global.health/
?[15] CAS抗病毒候選化合物數(shù)據(jù)集: https://www.cas.org/covid-19-antiviral-compounds-dataset
?[16] 微軟開放研究數(shù)據(jù)集: https://azure.microsoft.com/ja-jp/services/open-datasets/catalog/covid-19-open-research/
?[17] TCIA數(shù)據(jù)集: https://wiki.cancerimagingarchive.net/display/Public/COVID-19
?[18] EIBIR數(shù)據(jù)庫: https://www.eibir.org/covid-19-imaging-datasets/
?[19] Chester the AI Radiology Assistant: https://mlmed.org/tools/xray/
?[20] covid-chestxray-dataset: https://github.com/ieee8023/covid-chestxray-dataset
?[21] Genetics of the new virus: https://graphics.reuters.com/CHINA-HEALTH-VIRUS-SCIENCE/0100B59Z39Q/index.html
?[22] NextStrain: https://github.com/nextstrain/ncov
?[23] CoronaNet: https://kubinec.shinyapps.io/coronanet/
?[24] When do government responses need to be increased or maintained?: https://www.bsg.ox.ac.uk/sites/default/files/2020-09/09-2020-Risk-of-Openness-Index-BSG-Research-Note.pdf
?[25] covid-policy-tracker: https://github.com/OxCGRT/covid-policy-tracker/tree/main
?[26] CCCSL: https://github.com/amel-github/covid19-interventionmeasures
?[27] HIT-COVID: https://github.com/HopkinsIDD/hit-covid
?[28] ROPER: https://ropercenter.cornell.edu/supporting-public-opinion-data-related-covid-19
?[29] coviddatahub.com: http://coviddatahub.com/
?[30] https://today.yougov.com/covid-19: https://today.yougov.com/covid-19
?[31] 美國衛(wèi)生及公共服務(wù)部: https://www.hhs.gov/
?[32] Hospital Facilities: https://covidtracking.com/data/hospital-facilities
?[33] healthdata: https://beta.healthdata.gov/Hospital/COVID-19-Reported-Patient-Impact-and-Hospital-Capa/anag-cw7u
?[34] Coronavirus (COVID-19) Testing - Statistics and Research: https://ourworldindata.org/coronavirus-testing
?[35] COVID-19 TREATMENT AND VACCINE TRACKER: https://covid-19tracker.milkeninstitute.org/
?[36] JHU數(shù)據(jù)集: https://github.com/CSSEGISandData/COVID-19
?[37] Finding Health Statistics: https://browse.welch.jhmi.edu/health-statistics/Covid19
?[38] PHSM: https://www.who.int/emergencies/diseases/novel-coronavirus-2019/phsm
?[39] 美國國立衛(wèi)生研究院數(shù)據(jù)集: https://datascience.nih.gov/covid-19-open-access-resources
?[40] Our World in Data: https://github.com/owid/covid-19-data/tree/master/public/data
?[41] GoogleCloudPlatform: https://github.com/GoogleCloudPlatform/covid-19-open-data
完
—
控制感 | 好奇心 | 弱鏈接
原標(biāo)題:《新冠數(shù)據(jù)錦集》
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




