Giriş / Introduction
Coronavirüsler (CoV), soğuk algınlığından Orta Doğu Solunum Sendromu (MERS-CoV) ve Şiddetli Akut Solunum Sendromu (SARS-CoV) gibi daha ciddi hastalıklara kadar pek çok hastalığa neden olan büyük bir virüs ailesidir. Bu yeni virüse, yüzey çıkıntıları taç görünümünde olduğu için coronavirus adı verilmiş olup, bu virüs ailesi tek zincirli, pozitif polariteli, zarflı RNA virüsleridir.
Koronavirüs hastalığı (COVID-19), 2019 yılında keşfedilen ve daha önce insanlarda tanımlanmamış yeni bir suştur. Suş, bir bakteri veya virüsün farklı alt türlerinin, aralarında genetik farklılıklar bulunan grupları olarak adlandırılır.
Bu Koronavirüsler zoonotiktir, yani hayvanlar ve insanlar arasında bulaşırlar. Ayrıntılı araştırmalar SARS-CoV’nin misk kedilerinden insanlara ve MERS-CoV’un tek hörgüçlü develerden insanlara bulaştığını göstermiştir. Bilinen birkaç koronavirüs henüz insanları enfekte etmeyen hayvanlarla taşınmaktadır.
Enfeksiyon belirtileri arasında solunum semptomları, ateş, öksürük, nefes darlığı ve solunum güçlüğü bulunur. Daha ciddi vakalarda, enfeksiyon pnömoniye, ciddi akut solunum sendromuna, böbrek yetmezliğine ve hatta ölüme neden olabilir. Solunum sistemi hastalıklarından biri olan pnömoni ya da halk arasında zatürre bakteriler başta olmak üzere mikroorganizmalara bağlı olarak ortaya çıkan akciğer dokusunun iltihaplanmasıdır. Grip gibi bu hastalık da bağışıklık (immun) sistemini baskılayan hastalıklardan biridir. Özellikle ileri yaşlardaki bireylerde hem bağışıklık sisteminin yaşla birlikte yavaşlaması hem de yaşa ve/veya diğer nedenlere bağlı olarak kronik ve diğer hastalıkların görülmesi bu yaşlardaki bireylerde ölüm oranlarını artırabilmektedir. Diğer bir deyişle, bu enfeksiyon komplikasyon yaratarak ve mevcut diğer hastalıkları tetikleyerek bu yaş gruplarında diğer yaş gruplarına göre daha öldürücü olabilir.
Enfeksiyonun yayılmasını önlemek için standart öneriler arasında düzenli el yıkama, öksürme ve hapşırma sırasında ağız ve burnun kapatılması, et ve yumurtaların iyice pişirilmesi yer alır. Öksürme ve hapşırma gibi solunum yolu rahatsızlığı belirtileri gösteren kişilerle yakın temastan kaçınmak bu hastalıktan korunmak için atılacak önemli koruyucu tedbirlerden biridir.
Hastalıktan nasıl korunulacağı hakkında bilgi verdikten sonra bu hastalığın teşhisinde kullanılan ve adı son zamanlarda sık sık duyulan PCR testi hakkında bilgi vermek faydalı olacaktır. PCR, ingilizce adıyla “Polymerase Chain Reaction” kelimelerinin bir araya gelmesinden oluşan ve moleküler biyoloji alanında kullanılan bir tekniktir.Türkçe ise ise polimeraz zincir reaksiyonu olarak adlandırılır. Bazen PCR moleküler fotokopi (molecular photocopying) olarak da adlandırılabilmektedir. DNA’nın küçük bölümlerini kopyalamak için kullanılan hızlı ve ucuz bir tekniktir. Moleküler ve genetik analizler için büyük miktarlarda DNA örneği gerekli olduğundan, izole edilmiş DNA parçaları üzerinde çalışmalar PCR amplifikasyonu olmadan neredeyse imkansızdır. PCR’ın kullanım alanları şöyle özetlenebilir:
- Amplifiye edildikten sonra PCR ile üretilen DNA, birçok farklı laboratuvar prosedüründe kullanılabilir. Örneğin, İnsan Genom Projesindeki (HGP) çoğu haritalama tekniği PCR’a dayanmaktadır.
- Parmak izi, bakteri veya virüslerin (özellikle AIDS) tespiti ve genetik bozuklukların teşhisi gibi bir dizi laboratuvar ve klinik teknikte de değerlidir.
PCR ( Polimeraz Zincir Reaksiyonu) tekniğinin çalışma şeması ise aşağıdaki şekilde verilmiştir.
PCR tekniğini kullanarak koronavirüs teşhisinin nasıl konulduğuna ilişkin bir video aşağıda verilerek teşhis süreci hakkında bilgi verilmesi amaçlanmıştır.
Bilindiği üzere koronavirüs hastalığının teşhis ve özellikle tedavisine yönelik olarak ilaç ve aşı geliştirme alanında Dünya’da ve ülkemizde yoğun bir mesai harcanmaktadır. Bunlardan biri ülkemizde 02.04.2020 tarihinde Sanayi ve Teknoloji Bakanlığı ve TÜBİTAK bünyesinde “Covid-19 Türkiye Platformu Aşı ve İlaç Geliştirme” bilim insanların katıldığı sanal bir konferans gerçekleştirilmiştir. Türkiye dışında da benzer çalışmalar sanal ortamda çalıştay ve konferans olarak yapılmaktadır. Dünyada yapılan ve benim de katılım sağladığım önde giden bu çalışmalardan biri de Avrupa Öğrenme ve Akıllı Sistemler Laboratuvarı ingilizce adıyla European Laboratory for Learning and Intelligent Systems (ELLIS)’ın 02.04.2020 tarihinde düzenlediği “ELLIS Against Covid-19” adlı çalıştaydır. Dünyanın farklı üniversitelerinden bilim insanlarının katılım sağladığı çalıştayda koranavirüs pandemisinin teşhisinde kullanılan yapay zeka teknolojilerinden koronavirüsün tedavisinde kullanılan ilaçların geliştirilmesinde kullanılan yapay zeka teknolojilerine kadar pek çok konu ele alınmıştır. Çalıştayda ağırlıklı olarak ele alınan konu yapay zekanın teşhis ve tedavide nasıl kullanıldığı ve kullanılacağı idi. Çalıştayda koronavirüs ile mücadele çok güzel uygulama örneklerine yer verilmiştir. Daha önce de dile getirdiğim gibi yapay zeka günümüzün ve geleceğin en kritik teknolojisidir. Bu gerek 4. Sanayi Devrimi gerekse Toplum 5.0 açısından olsun böyledir ve farklı ülkeler yapay zekayı teşhis ve tedavi (robotik cerrahi ve ilaç geliştirme) alanlarında kullanmak için çok ciddi adımlar atmıştır. Bu yapıların da ülkemizde kurulması ve yapay zeka enstitülerinin ülkemizde yaygınlaştırılması gerekmektedir. Aynı zamanda Türkiye Büyük Millet Meclisi bünyesinde Yapay Zeka Komisyonu kurulmalıdır. Yapay zeka özünde öğrenen sistemler olduğu ve sürekli gelişim gösterdiği için sektör ayrımı olmaksızın her alanda kendine uygulama alanı bulan bir teknolojidir.
Koronavirüs salgını Çin ile birlikte diğer ülkelere de yayıldığı için Dünya Sağlık Örgütü tarafından 30/01/2020 tarihinde uluslararası halk sağlığı açısından acil durum ilan edilmiştir. Bu hastalıktan bahsedilirken lise ve üniversite yıllarımda benim de ders olarak aldığım Epidemiyoloji biliminden bahsetmemek olmaz. Epidemiyoloji, toplumda sağlıkla ilgili durumların veya olayların (hastalık dahil) dağılımını, görülme sıklıklarını ve bunları etkileyen faktörleri inceleyen bir tıp bilimi dalıdır.
Epidemiyolojik araştırmalar yapmak için çeşitli yöntemler kullanılabilir. Bu yöntemler dağılımı incelemek için sürveyans, tanımlayıcı çalışmalar ve hastalık belirleyicilerini incelemek için analitik çalışmalar olabilir. Bilindiği üzere Koronavirüs hastalığı artık pandemik bir vaka olarak adlandırılmaktadır. Epidemiyolojinin konu alanına giren pandemi dünyada birden fazla ülkede veya kıtada, çok geniş bir alanda
yayılan ve etkisini gösteren salgın hastalıklara verilen genel isim olarak ifade edilmektedir. Diğer bir deyişle, salgın (epidemi) durumundaki bir hastalığın ülke sınırlarını aşarak diğer ülkelere yayılım göstermesidir.
Avrupa Birliği kurumlarından biri olan “Avrupa Hastalık Önleme ve Kontrol Merkezi (European Centre for Disease Prevention and Control)”‘ne göre ön bulgular koronavirüs hastalığından vakalara dayalı ölüm oranı (fatalite hızı)’nın binde 20-30 olduğunu göstermektedir. Bu, 2003 SARS salgınından önemli ölçüde daha az. Bununla birlikte, mevsimsel gripin neden ölüm oranlarından çok daha yüksektir.
Çalışma kapsamında koronavirüs pandemi vakalarının epidemiyolojik hızlarla birlikte keşifsel veri analizi (EDA) yapılarak vakaların izlediği seyrin ortaya konulması amaçlanmıştır
Metodoloji / Methodology
Çalışmanın amacı, koronavirüs vakalarının epidemiyolojik düzlemde Türkiye’de ve diğer ülkelerde izlediği seyri detaylı bir şekilde keşifsel veri analiziyle ortaya konulara karar vericilere katkı sunmaktır.
Koronavirüs vakalarının analizinde Türkiye veri setinin oluşturulmasında Türkiye İstatistik Kurumu (TÜİK)’ndan ve Dünya Sağlık Örgütü (DSÖ) raporlarından ve Sağlık Bakanlığı basın açıklamalarından yararlanılmıştır. Bunun nedeni Türkiye veri setine daha derinlemesine bakılmak istenmesidir.
Çalışma kapsamında diğer ülkelere ilişkin koronavirüs vakaları ise Johns Hopkins Üniversitesi Sistem Bilimi ve Mühendisliği Merkezi (JHU CCSE) tarafından desteklenen “The Humanitarian Data Exchange (HDX) (İnsani Veri Alışverişi)” adlı platforma ait https://data.humdata.org web sitesinden alınmıştır. Önceki çalışmalardan faklı olarak bu platformdan veri alınmasının nedeni veri setleri içerisinde onaylanmış ve ölüm vakaları dışında iyileşen koronavirüs vakalarına da yer verilmiş olmasıdır.
Analizlerde Türkiye verisi için Microsoft Excel 2016 ve diğer ülke verileri için R programlama dili kullanılmıştır.
Keşifsel veri analizine geçilmeden önce vaka sayılarından yararlanarak epidemiyolojik hızlar hesaplanmıştır. Bu nedenle, çalışmada kullanılacak hızları açıklamanın faydalı olacağı düşünülmektedir.
Epidemiyoloji biliminde hız kavramı, bir sağlık olayının nüfus içindeki görülme frekansını hesaplamada kullanılan bir ölçüttür. Hızlar, belirli bir zaman diliminde meydana gelen olayların sayısının olayın meydana geldiği nüfusa bölünerek hesaplanır. Eşitliğin payı, sağlık olayı ile karşılaşanların sayısını (X), payda ise risk altındaki nüfusu (X+Y) göstermektedir. Risk altındaki nüfus hastalığa veya sağlık olaylarına karşı duyarlı olan nüfusu ifade etmektedir. Formülize edilirse;
Hız (Rate) = (X / X +Y) * k
Burada, k katsayıyı göstermektedir.
Analizde hızlardan girdi değişkeni olarak kullanılması düşünülen ilk gösterge ölüm veya mortalite ölçütlerinden biri olan Kaba Ölüm Hızı‘dır. Bu hız nüfusun sağlık düzeyini ortaya koymada duyarlı olmasa da bir fikir vermesi açısından önemlidir. Kaba ölüm hızı aşağıdaki eşitlikte gösterilmiştir.
Kaba Ölüm Hızı (Crude Death Rate) = (Bir toplumda belirli bir süre içinde meydana gelen ölüm sayısı / Aynı toplumun aynı süredeki
(yıl ortası) nüfusu) * 1000
Crude death rate = (Total number of deaths during a given time interval / Mid-interval population) * 1000
Girdi değişkeni olarak kullanılması düşünülen ikinci gösterge ölüm veya fatalite ölçütlerinden biri olan Fatalize Hızı‘dır. Bu gösterge kaba ölüm hızına göre daha duyarlı bir göstergedir. Diğer bir ifadeyle, hastalığa yakalananların ne kadarının öldüğünü gösterir. Fatalite hızı aşağıdaki eşitlik yardımıyla hesaplanmaktadır;
Fatalite Hızı (Fatality Rate) = (Nüfusta belirli bir süre içinde “X” hastalığından ölenlerin sayısı / Aynı nüfusun aynı süre içinde “X” hastalığına yakalananların sayısı) * 100
Fatality Rate = (Number of cause-specific deaths among the incident cases / Total number of incident cases) * 100
Morbitide veya hastalık hızları gelişmekte olan hastalığın ortaya çıkma hızını ortaya koymak için kullanılır. Bunlardan biri olan insidans,
bir hastalığın gelişme (yeni vakalar) olasılığını ortaya koymak için kullanılır. Diğer taraftan, bu hızlardan prevelans ise hastalığın görülme sıklığını (tüm vakalar) gösteren bir hızdır. İnsidans ve prevelans da analizde girdi değişkenleri olarak kullanılması düşünülmektedir. İnsidans aşağıdaki eşitlik yardımıyla hesaplanmaktadır.
İnsidans (Incidence) = (Bir nüfusta belirli bir sürede saptanan YENİ vaka sayısı / Aynı toplumun yıl ortası nüfusu) * k
Incidence = (Number of new cases of disease during specified time interval / Population at start of time interval) * k
İnsidans hızının kümülatif şekli ise atak hızlarını göstermektedir.
Prevelans ise aşağıdaki eşitlik yardımıyla hesaplanmaktadır.
Prevelans (Prevalence) = (Belirli bir sürede toplam (eski+yeni) vaka sayısı / Risk altındaki kişi sayısı) * k
Prevalence = (Number of cases of disease during specified time interval / Population at start of time interval) * k
Keşifsel Veri Analizi Bulguları / Exploratory Data Analysis Findings
Türkiye Örneği / The Case of Turkey
Bu kısımda bahsedilen epidemiyolojik hızların uygulama sonuçlarına yer verilmiştir. İlk olarak günlük onaylanmış vaka sayıları ile ölüm vaka sayıları Tablo 1’de verilmiştir. Tabloda test sayılarının olduğu sütunda kırmızı renkteki sayılar kesin olarak bilinmediğinden ortalama olarak verilmiştir. Tablo 1’e göre öne çıkan bulgular şöyledir:
- 04.04.2020 tarihinde toplam vaka sayısı 23934’e yülselmiştir. Aynı günde gerçekleşen yeni vaka sayısı ise 3013 olup bir önceki güne göre % 8,1 artmıştır. Yeni vaka sayısının 2786 olduğu 03.04.2020 tarihi Türkiye’de salgının başladığı günden bugüne kadar vaka sayısının en yüksek olduğu tarihtir.
- Kümülatif vaka sayısından kümülatif ölen kişi sayısı çıkarılmasından sonra kalan toplam aktif vaka sayısı 23433’tür.
- Salgında ölen toplam kişi sayısı 501 olup, en yüksek ölüm vakalarının yaşandığı gün 79 kişi ile 02.04.2020 tarihidir.
Tablo 1. Koronavirüs Vaka Sayıları / Number of Coronavirus Cases, Turkey
Epidemiyolojik hızları gösteren bulgular ise Tablo 2’de sunulmuştur. Tablo 2’ye göre öne çıkan bulgular şöyledir:
- Sağlık düzeyini belirlemede duyarlı bir gösterge olmasa da fikir vermesi açısından kaba ölüm hızı hesaplanmıştır. Buna göre kaba ölüm hızı en yüksek seviyesine ulaştığı 02.4.2020 tarihinde milyonda 0,95’dır. Katsayı bin yerine milyon alınmasının nedeni ortaya konulan bulgunun çok küçük değer almasından kaynaklanmaktadır. Toplam ölüm vaka sayına göre kaba ölüm hızı ise milyonda 5,11’ten 6,02’ye yükselmiştir.
- Fatalite hızının en yüksek olduğu tarih binde 43 ile 21.3.2020 tarihidir. Toplam vaka sayılarına göre fatalite hızı ise binde yaklaşık 21’dir. Bu bulgu şu anlama gelmektedir; bugüne kadar koronavirüs hastalığına yakalanan her 1000 kişiden yaklaşık 21’i hayatını kaybetmiştir.
- Yapılan test sayıları ve vaka sayıları dikkate alınarak koronavirüs salgının insidansı ve prevelansı da hesaplanmıştır. Yapılan toplam test sayısı 161330’dur. Belirli bir zaman diliminde bir hastalığın bir nüfus grubunda görülme sıklığını ortaya koyan prevelans hızı yaklaşık % 15 olup bir önceki güne göre artış göstermemiştir. Buradan salgın meydana geldiği süre içerisinde test uygulanan her 100 vakadan 15’inde koronavirüs vakası tespit edildiği anlamı çıkmaktadır.
- Belirli bir zaman diliminde bir hastalığın gelişme (yeni vakalar) olasılığını ortaya koyan insidans hızı % 17,3’ten % 15,3’e düşmüştür. Bu bulgudan koronavirüs testi (PCR) yapılan her 100 yeni vakadan yaklaşık 15’inde koronavirüs tespit edildiği anlaşılmaktadır. İnsidans hızı ne kadar çok düşerse salgının yeni vakalar ortaya çıkarma olasılığı o kadar düşer. Bu hız bu açıdan ayrı bir öneme sahiptir.
Tablo 2. Koronavirüs Vakalarının Epidemiyolojik Hızları / Epidemiological Rates of Coronavirus Cases, Turkey
Türkiye’deki Fatalite (Ölüm) Hızlarının Zamana Göre Dağılımı / Distribution of Fatality Rates in Turkey by Time
Koronavirüs vaka sayıları baz alınarak Türkiye ve İtalya’nın karşılaştırıldığı görülmektedir. Bu oldukça eksik bir bakış açısıdır. Zira vaka sayıları ve hatta ölüm sayıları bile tek başına değerlendirilmesi eksik ve hatalı yorumlara ve sonuçlara neden olabilir. Bu göstergelerden daha da önemli olan epidemiyolojik hızlardan ve aynı zamanda ölüm ölçütlerinden biri olan fatalite hızının dikkate alınmasının değerlendirme açısından daha sağlıklı olacağı düşünülmektedir. Aşağıdaki grafikte İtalya ve Türkiye fatalite hızları karşılaştırmalı olarak sunulmuştur. Aşağıdaki grafikte fatalite hızları açısından bakılırsa fatalite hızlarının görüldüğü y ekseninde İtalya’nın çok farklı bir seyir izlediği görülmektedir. Ancak en kötü senaryo olarak düşünülürse atılacak adımlar açısından faydalı olacağı düşünülmektedir. Grafikte X eksenine paralel olarak kesikli doğrular ortalama fatalite hızlarını göstermektedir. İtalya Türkiye’ye göre çok daha yüksek fatalite hızlarına sahip olmasının yanısıra aynı zamanda fatalite hızları ortalamasına yakın bir seyir izlemiştir.
Türkiye ve İtalya’daki Fatalite (Ölüm) Hızlarının Zamana Göre Dağılımı / Distribution of Fatality Rates in Turkey and Italy by Time
Ayrıca Türkiye, Avrupa Hastalık Önleme ve Kontrol Merkezi‘nden alınan koronavirüs ölüm vakaları açısından İtalya’nın yanısıra Fransa, İspanya ve İran ile de ilk 14 günlük seyir karşılaştırılmıştır. Aşağıdaki tabloda toplam ölüm vaka sayıları açısından Türkiye’nin İran ile benzerlik gösterdiği görülmektedir.
Türkiye, İtalya, Fransa, İspanya ve İran’ın Ölüm Vakalarının İlk 14 Günlük Seyri / First 14-Day Dealth Figures, Cases of Turkey, Italy, France, Spain and Iran
Yukarıdaki tabloda ilk 14 günlük zaman diliminde Türkiye’de koronavirüs ölüm vakaları açısından İspanya ve Fransa’ya göre daha yüksek olsa da aşağıdaki tabloda fatalite hızları açısından bu ülkelerin Türkiye’den daha yüksek olduğu olduğu görülmektedir. Diğer taraftan genel olarak Türkiye’nin fatalite hızları açısından ABD’ye benzer ancak ondan daha yüksek fatalite hızlarının olduğu görülmektedir. Tabloda İtalya’nın fatalite hızları açısından açık ara önde olduğu görülmektedir. Bu bulgu aynı zamanda koronavirüs hastalığına yakalananlar içerisinde ölenlerin İtalya’da daha yüksek olduğunu ortaya koymaktadır.
Ülkelere Göre Fatalite Hızlarının Karşılaştırılması / The Comparison of Fatality Rates by Countries
Dünya ve Diğer Ülke Örnekleri / Cases of World and Other Countries
İlk olarak adım adım uygulamaya geçilerek İnsani Veri Alışverişi (HDX) web sitesinden csv (Comma-seperated value) uzantılı olarak okutulan onaylanmış, ölen ve iyileşen koronavirüs vaka sayılarını içeren 3 farklı veri seti birleştirilerek tanıtılmıştır.
Çalışmanın bu kısmında epidemiyolojik hızlarla birlikte keşifsel veri analizi yapılarak Dünyada koronavirüs vakalarıyla ilgili olarak öne çıkan ülkeler verilmiştir.
Aşağıda yazdığım R kod bloğu ile birlikte “İnsani Veri Alışverişi (HDX)” veri tabanından güncel veri akışı sağlanabilecektir. Aşağıdaki kod bloğunda görüleceği üzere mevcut veri setlerinde olmayan 2 adet değişken hesaplanmıştır. Daha sonra bu değişkenler kod bloğu ile veri akışı sağlanmasından sonra birleştirilerek oluşturulan yeni veri setine ilave edilmiştir. İlave edilen değişkenler şöyledir:
- Aktif Vakalar (ActiveCases) : Onaylanmış vaka sayısından ölen ve iyileşen vakalar çıkarılması ile hesaplanmıştır.
- Fatali Fızı (FataliteRate): Onaylanmış vaka sayılarının ölüm vaka sayılarına bölünmesiyle hesaplanmıştır. Çarpım katsayısı (k) ise 1000’dir.
url1="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_confirmed_global_narrow.csv?dest=data_edit&filter01=explode&explode-header-att01=date&explode-value-att01=value&filter02=rename&rename-oldtag02=%23affected%2Bdate&rename-newtag02=%23date&rename-header02=Date&filter03=rename&rename-oldtag03=%23affected%2Bvalue&rename-newtag03=%23affected%2Binfected%2Bvalue%2Bnum&rename-header03=Value&filter04=clean&clean-date-tags04=%23date&filter05=sort&sort-tags05=%23date&sort-reverse05=on&filter06=sort&sort-tags06=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_confirmed_global.csv"
url2="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_deaths_global_narrow.csv?dest=data_edit&filter01=explode&explode-header-att01=date&explode-value-att01=value&filter02=rename&rename-oldtag02=%23affected%2Bdate&rename-newtag02=%23date&rename-header02=Date&filter03=rename&rename-oldtag03=%23affected%2Bvalue&rename-newtag03=%23affected%2Binfected%2Bvalue%2Bnum&rename-header03=Value&filter04=clean&clean-date-tags04=%23date&filter05=sort&sort-tags05=%23date&sort-reverse05=on&filter06=sort&sort-tags06=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_deaths_global.csv"
url3="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_recovered_global_narrow.csv?dest=data_edit&filter01=explode&explode-header-att01=date&explode-value-att01=value&filter02=rename&rename-oldtag02=%23affected%2Bdate&rename-newtag02=%23date&rename-header02=Date&filter03=rename&rename-oldtag03=%23affected%2Bvalue&rename-newtag03=%23affected%2Binfected%2Bvalue%2Bnum&rename-header03=Value&filter04=clean&clean-date-tags04=%23date&filter05=sort&sort-tags05=%23date&sort-reverse05=on&filter06=sort&sort-tags06=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_recovered_global.csv"
case<-read_csv(url1)[-1,-1]
case<-case %>% rename(Country="Country/Region", Cases= "Value")
case
death<-read_csv(url2)[-1,-1]
d<-death %>% rename(Country="Country/Region", Deaths= "Value")
recovered<-read_csv(url3)[-1,-1]
r<-recovered%>% rename(Country="Country/Region", Recovered= "Value")
df<-left_join(case, d, by = c("Country","Lat", "Long","Date"))
df<-left_join(df, r, by = c("Country","Lat", "Long","Date"))
df<-tibble(Country=df$Country, Date=as.Date(df$Date), Month=month(as.Date(df$Date)), Lat=as.numeric(df$Lat), Long=as.numeric(df$Long),Cases=as.integer(df$Cases), Deaths=as.integer(df$Deaths), Recovered= as.integer(df$Recovered), ActiveCases=as.integer(as.numeric(df$Cases)-as.numeric(df$Deaths)-as.numeric(df$Recovered)), FatalityRate=round(as.numeric((as.integer(df$Deaths)/as.integer(df$Cases))*1000),1))
df
Veri setindeki değişken sayısı 8, gözlem sayısı ise 18980’dir. Aşağıda mevcut değişkenler, değişkenlerin veri tipi ile birlikte gözlem sayısı görülmektedir.
Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 18980 obs. of 8 variables:
$ Country : chr "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
$ Date : Date, format: "2020-04-03" "2020-04-02" ...
$ Month : num 4 4 4 3 3 3 3 3 3 3 ...
$ Cases : num 281 273 237 174 170 120 110 110 94 84 ...
$ Deaths : num 6 6 4 4 4 4 4 4 4 2 ...
$ Recovered : num 10 10 5 5 2 2 2 2 2 2 ...
$ ActiveCases : num 265 257 228 165 164 114 104 104 88 80 ...
$ FatalityRate: num 21.4 22 16.9 23 23.5 33.3 36.4 36.4 42.6 23.8 ...
Veri setinde koronavirüs salgınının yaşandığı aşağıdaki listesi verilen 181 ülke ve/veya bölge bulunmaktadır.
[1] "Afghanistan" "Albania"
[3] "Algeria" "Andorra"
[5] "Angola" "Antigua and Barbuda"
[7] "Argentina" "Armenia"
[9] "Australia" "Austria"
[11] "Azerbaijan" "Bahamas"
[13] "Bahrain" "Bangladesh"
[15] "Barbados" "Belarus"
[17] "Belgium" "Belize"
[19] "Benin" "Bhutan"
[21] "Bolivia" "Bosnia and Herzegovina"
[23] "Botswana" "Brazil"
[25] "Brunei" "Bulgaria"
[27] "Burkina Faso" "Burma"
[29] "Burundi" "Cabo Verde"
[31] "Cambodia" "Cameroon"
[33] "Canada" "Central African Republic"
[35] "Chad" "Chile"
[37] "China" "Colombia"
[39] "Congo (Brazzaville)" "Congo (Kinshasa)"
[41] "Costa Rica" "Cote d'Ivoire"
[43] "Croatia" "Cuba"
[45] "Cyprus" "Czechia"
[47] "Denmark" "Diamond Princess"
[49] "Djibouti" "Dominica"
[51] "Dominican Republic" "Ecuador"
[53] "Egypt" "El Salvador"
[55] "Equatorial Guinea" "Eritrea"
[57] "Estonia" "Eswatini"
[59] "Ethiopia" "Fiji"
[61] "Finland" "France"
[63] "Gabon" "Gambia"
[65] "Georgia" "Germany"
[67] "Ghana" "Greece"
[69] "Grenada" "Guatemala"
[71] "Guinea" "Guinea-Bissau"
[73] "Guyana" "Haiti"
[75] "Holy See" "Honduras"
[77] "Hungary" "Iceland"
[79] "India" "Indonesia"
[81] "Iran" "Iraq"
[83] "Ireland" "Israel"
[85] "Italy" "Jamaica"
[87] "Japan" "Jordan"
[89] "Kazakhstan" "Kenya"
[91] "Korea, South" "Kosovo"
[93] "Kuwait" "Kyrgyzstan"
[95] "Laos" "Latvia"
[97] "Lebanon" "Liberia"
[99] "Libya" "Liechtenstein"
[101] "Lithuania" "Luxembourg"
[103] "Madagascar" "Malawi"
[105] "Malaysia" "Maldives"
[107] "Mali" "Malta"
[109] "Mauritania" "Mauritius"
[111] "Mexico" "Moldova"
[113] "Monaco" "Mongolia"
[115] "Montenegro" "Morocco"
[117] "Mozambique" "MS Zaandam"
[119] "Namibia" "Nepal"
[121] "Netherlands" "New Zealand"
[123] "Nicaragua" "Niger"
[125] "Nigeria" "North Macedonia"
[127] "Norway" "Oman"
[129] "Pakistan" "Panama"
[131] "Papua New Guinea" "Paraguay"
[133] "Peru" "Philippines"
[135] "Poland" "Portugal"
[137] "Qatar" "Romania"
[139] "Russia" "Rwanda"
[141] "Saint Kitts and Nevis" "Saint Lucia"
[143] "Saint Vincent and the Grenadines" "San Marino"
[145] "Saudi Arabia" "Senegal"
[147] "Serbia" "Seychelles"
[149] "Sierra Leone" "Singapore"
[151] "Slovakia" "Slovenia"
[153] "Somalia" "South Africa"
[155] "Spain" "Sri Lanka"
[157] "Sudan" "Suriname"
[159] "Sweden" "Switzerland"
[161] "Syria" "Taiwan*"
[163] "Tanzania" "Thailand"
[165] "Timor-Leste" "Togo"
[167] "Trinidad and Tobago" "Tunisia"
[169] "Turkey" "Uganda"
[171] "Ukraine" "United Arab Emirates"
[173] "United Kingdom" "Uruguay"
[175] "US" "Uzbekistan"
[177] "Venezuela" "Vietnam"
[179] "West Bank and Gaza" "Zambia"
[181] "Zimbabwe"
Dünya / World
Dünyada görülen koronavirüs vakalarının tanımlayıcı istatistikleri aşağıdaki tabloda verilmiştir. Veri setindeki vaka sayıları kümülatif olarak ilerlemektedir. Tabloda koronavirüs vakalarına ilişkin öne çıkan bulgular şöyledir:
- Günlük ortalama vaka sayısı yaklaşık 5598’ten yaklaşık 6055’e, ortalama ölüm vaka sayısı ise yaklaşık 293’ten yaklaşık 325’e yükselmiştir.
- Günlük ortalama iyileşen vaka sayısı 1152’ten yaklaşık 1236’ya, ortalama aktif vaka sayısı ise yaklaşık 5305’ten 5730’a yükselmiştir.
- Günlük ortalama fatalite hızı binde yaklaşık 35’tir. Bu bulgu koronavirüs hastalığına yakalanan her 1000 kişiden yaklaşık 35’inin hayatını kaybettiğini göstermektedir.
Dünyadaki Koronavirüs Vakalarının Tanımlayıcı İstatistikleri / Descriptive Statistics of Coronavirus Cases in the World
Kümülatif Vaka Sayıları Baz Alınarak Dünya’daki Fatalite (Ölüm) Hızlarının Zamana Göre Dağılımı / Distribution of Fatality Rates by Time Based on Cumulative Cases in the World
Kümülatif vaka sayılarına göre en yüksek 10 ülke aşağıdaki tabloda karşılaştırmalı olarak verilmiştir.
En Yüksek Kümülatif Vaka Sayısına Sahip 10 Ülke / Top 10 Countries with the Highest Number of Cumulative Cases
En Yüksek Kümülatif Ölüm Vaka Sayısına Sahip 10 Ülke / Fatality Rates of Top 10 Countries with the Highest Cumulative Death Figures
Kümülatif Vaka Sayılarına Göre Dünyadaki Son 10 Günlük Fatalite (Ölüm) Hızları / Last 10-Day Fatality Rates Based by Cumulative Cases in the World
Sonuç / Conclusion
Özetle, İnsani Veri Alışverişi (HDX) platformundan alınan 3 farklı koronavirüs hastalık veri setinin birleştirilmesinden sonra epidemiyolojik hızlarla birlikte keşifsel veri analizi yapılarak koronavirüs pandemisinin trendi hakkında farkındalık oluşturulması amaçlanmıştır.
Bu arada son 10 gündür üzerinde yoğun bir şekilde çalıştığım salgının dalga boyunun hesaplanmasına yönelik geliştirdiğim modelleri Avrupa Hastalık Önleme ve Kontrol Merkezi ile paylaştıktan sonra faydalı olması adına burada da paylaşılacaktır.
Faydalı olması ve farkındalık oluşturması dileğiyle.
Sağlıkla ve bilimle kalınız.
Saygılarımla.
Note: It can not be cited or copied without referencing.
Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.
Yararlanılan Kaynaklar / Resources Utilized
- World Health Organization (2020). Report of the WHO-China Joint Mission on Coronavirus Disease 2019 (COVID-19). Available online at: https://www.who.int/docs/default-source/coronaviruse/who-china-joint-mission-on-covid-19-final-report.pdf
- https://www.who.int/health-topics/coronavirus
- https://www.ecdc.europa.eu/en/publications-data/download-todays-data-geographic-distribution-covid-19-cases-worldwide
- http://www.hastane.hacettepe.edu.tr/_948.html
- https://www.youtube.com/watch?v=mOV1aBVYKGA&t=42s
- Humanitarian Data Exchange (HDX), https://data.humdata.org/. 19.03.2020
- http://www.halksagligi.hacettepe.edu.tr/sunumlar_ve_seminerler/OLCUTLERTB18MART2015.pdf
- https://www.youtube.com/watch?v=4KFP3tay5vM
- De Livera, A. M., Hyndman, R. J., & Snyder, R. D. (2011). Forecasting time series with complex seasonal patterns using exponential smoothing. J American Statistical Association, 106(496), 1513–1527. https://robjhyndman.com/publications/complex-seasonality/
- http://tagteam.harvard.edu/hub_feeds/1981/feed_items/273923
- https://robjhyndman.com/papers/ComplexSeasonality.pdf
- https://www.medicalpark.com.tr/zaturre-nedir-belirtileri-ve-tedavileri-nelerdir/hg-152
- https://www.who.int/topics/epidemiology/en/
- https://www.grip.gov.tr/depo/saglik-calisanlari/ulusal_pandemi_plani.pdf
- https://www.r-project.org/
- https://www.who.int/docs/default-source/coronaviruse/getting-workplace-ready-for-covid-19.pdf
- https://www.cdc.gov/csels/dsepd/ss1978/lesson3/section3.html
- https://www.genome.gov/about-genomics/fact-sheets/Polymerase-Chain-Reaction-Fact-Sheet
- https://www.yourgenome.org/facts/what-is-pcr-polymerase-chain-reaction
- https://go.amboss.com/covid-swab
- https://www.youtube.com/watch?v=syXd7kgLSN8
- https://ellis.eu/