Güven aralıkları ingilizce ifadeyle confidence interval (CI) hem sahadan veri toplama yöntemleriyle elde edilen birincil verilerin hem de veri tabanlarından elde edilen işlenmiş ikincil verilerin analizinde çok yoğun bir şekilde kullanılmaktadır. Peki nedir bu güven aralığı? Güven aralığının hesaplanması için hangi parametrelere ihtiyaç vardır? Güven aralığı nasıl hesaplanır? Güven aralığını etkileyen faktörler nelerdir? Bu çalışmada bahsedilen bu sorulara cevaplar bulunacaktır. Bu amaçla olasılıklı örneklem yöntemlerinden biri olan ön yargısız (without bias) basit tesadüfi tekrarsız örneklem yöntemi kullanılmıştır. Basit tekrarlı örneklem yöntemi ile ise rastgele beden kitle endeksi verileri üretilmiştir. Üretilen bu sentetik veriler üzerinden deneysel güven aralığı çalışması hazırlanmıştır. Diğer programlama dilleri kullanılarak veya paket programlar üzerinde de bu çalışmanın yapılması her zaman mümkündür. Bunu da yapabilirdim ancak Microsoft Office Excel 2016 kullanılarak güven aralığı çalışması yapılmasının daha uygun olacağını düşündüm. Bunun nedeni excel üzerinde okuyucuya fonksiyon (formül) etkileşimleri gösterilerek konu hakkında daha fazla katkı sunulması amaçlanmasıdır. İki farklı güven aralığı çalışmasına yer verilmiştir. İlkinde güven aralığı çalışmasında elde edilen değerler sabitlenmiştir. İkincisi ise simülasyona izin verecek dinamik bir şekilde excel uzantılı dosya içerisinde sunulmuştur.Bunun nedeni seçilen örneklemlerdeki parametre ve güven aralıkları değişimlerinin karşılaştırmalı ve dinamik olarak sunulmak istenmesidir.
Güven aralığı nedir?
Maliyetlerin yüksekliği, uzun zaman alması, güncel ve derinlemesine veri elde edilmesi gibi temel öncelikler esas alınarak sıklıkla kişiler ya da kurumlar popülasyonun tamamının yerine bu popülasyonu temsil eden örneklem üzerinde araştırma yapmayı tercih ederler. Ancak seçilen örneklemin popülasyonun tamamını temsil etmesi isteniyorsa yeterli örneklem büyüklüğü (n) belirlenerek mutlaka olasılıklı örneklem yöntemlerinden biri veya birkaçı birlikte kullanılmalıdır. Popülasyonun tamamı yerine bu popülasyondan seçilen örneklem söz konusu olunca örneklem popülasyonu ne kadar temsil ediyor sorusu ortaya çıkmaktadır. Güven aralığı ise aslında tam da bize bunu söylemektedir. Güven aralığı, popülasyon ortalamasının tahmincisi olup, bize örneklem ortalamalarının popülasyon ortalamasından ne kadarlık bir sapma olduğunu göstermektedir. Güven aralığının bir alt limit (lower bound)’i ve üst limit (upper bound)’i vardır. Bu alt ve üst limitlerin olması güven aralığına adını vermektedir. Yani örneklemden elde edilen güven aralıkları popülasyon ortalamasını mutlaka içerecektir. Burada güven aralığındaki alt ve üst limitin yorumlanması önem arz etmektedir. Alt ve üst limitler arasında fark ne kadar az ise, diğer bir deyişle güven aralığı genişliği (CI Width) ne kadar dar ise örneklem ortalaması popülasyon ortalamasına o kadar yakın ve popülasyon ortalamasını o kadar doğru tahmin ediyor demektir. Tersi bir durum, örneklem ortalamasının popülasyon ortalamasından uzaklaşması anlamı taşımaktadır ki, bu durum örneklemin popülasyonu kötü temsili anlamına gelmektedir.
Güven aralığının hesaplanması için hangi parametrelere ihtiyaç vardır?
Genel olarak, güven aralığını hesaplamak için adım adım ele alınması gereken parametreler Şekil 1’de verilmiştir.
Şekil 1: Güven Aralığı Hesaplama Adımları
Şekil 1’de görüleceği üzere ilk olarak popülasyondan çekilen örneklemin ortalaması hesaplanır. Ortalama ise aşağıdaki eşitlik yardımıyla hesaplanmaktadır. Eşitlik örneklem ortalamasının hesaplanmasına yönelik olduğu için “X” parametresi kullanılmıştır. Örneklem ortalaması bütün gözlem değerlerinin toplamının toplam gözlem sayısına bölünmesi ile elde edilir. Eşitlikte küçük “n” örneklem büyüklüğünü ifade etmektedir.
Eğer popülasyon ortalamasını hesaplamış olsaydık eşitlikte n yerine büyük “N” e yer verecektik. Burada N popülasyondaki gözlem sayısını ifade etmektedir. Popülasyon ortalaması (μ) ise bütün gözlem değerlerinin toplamının toplam gözlem sayısı (N)’na bölünmesi ile elde edilmekte olup, aşağıdaki eşitlik yardımıyla hesaplanır.
Örnekleme ait standart sapmanın hesaplanmasında ise aşağıdaki eşitlikten faydalanılır. Burada standart sapma ile aslında örneklem ortalamasından ne kadarlık bir sapma olduğunu gösteriyoruz. Adım adım örneklem standart sapması şöyle hesaplanır:
- Örneklemdeki gözlem değerlerinin ortalaması hesaplanır.
- Her bir gözlemin gözlem ortalamasından farkı alınır.
- Her bir gözleme ait hesaplanan farkın karesi hesaplanır.
- Her bir gözleme ait hesaplanan farkların karesi toplanır.
- Elde edilen fark kareleri toplamı örneklemdeki gözlem sayısının bir eksiğine bölünür.
- Elde edilen değerin karesi hesaplanır.
Popülasyon standart sapmasının hesaplanması ise örneklem standart sapmasına benzer olup tek fark karekök içindeki eşitliğin paydasında büyük “N” e, diğer bir deyişle popülasyondaki toplam gözlem sayısına yer verilmesidir. Yukarıda örneklem standart sapmasındaki işlemler popülasyon standart sapması için de yapılır.
Element varyansı ise örneklem standart sapmasının karesi olup, aşağıdaki eşitlik yardımıyla hesaplanmaktadır.
Eğer örneklemin popülasyon içinde yüzdesi (f=(n/N) x 100) %5’ten büyükse örneklem varyansının hesaplanması ve bunun üzerinden standart hata hesaplanması yoluna gidilmelidir. Örneklem varyansı ise aşağıdaki eşitlik yardımıyla hesaplanır.
Popülasyon varyansı ise popülasyon standart sapmasının karesinin alınması ile hesaplanır. Aşağıdaki eşitlik yardımıyla popülasyon varyansı hesaplanır.
Standart hata (se), diğer bir ifade ile ortalamanın standart hatası aşağıdaki eşitlik yardımıyla hesaplanmaktadır. Örneklemin standart sapması (s)’nın karekök içerisindeki örneklem gözlem sayısı (n)’na bölünmesi bize ortalamanın standart hatası (standard error of the mean)’nı verir. Standart hatayı aynı zamanda örneklem varyansının karekökünü alarak da hesaplayabiliriz. Örneklem büyüklüğünün artırılması merkezi limit teoremi (central limit teorem)’ne dayalı olarak standart hatayı azaltır ve bu istenen bir durumdur. Böylece, örneklem dağılımı standart normal dağılıma (ortalaması 0, standart sapması 1) evrilir.
Güven aralığı nasıl hesaplanır?
Güven aralığının belirlenmesini sağlayan eşitliklere yer verildikten sonra sırasıyla şimdi çok yalın bir şekilde güven aralığı eşitliğini alt ve üst limitten başlayarak verelim. Bu çalışmada güven aralığı, ortalaması ve standart sapması bilinen bir popülasyon üzerinden hesaplanmıştır.
Güven aralığının alt ve üst limitini verdikten sonra bir bütün olarak güven aralığı (confidence interval) eşitliğini verelim. Eşitliğin ortasında yer verilen μ popülasyon ortalamasını göstermektedir. Daha önce de belirtildiği üzere güven aralıklarıyla aslında popülasyon ortalamasını tahmin ediyoruz.
Güven aralığının alt ve üst, diğer bir deyişle iki kuyruklu (two tailed) alfa katsayıları aşağıdaki şekil üzerinde verilmiştir. Z tablosu ortalaması 0, standart sapması 1 olan standart normal dağılımı kullanmaktadır. Standart normal dağılım eğrisi şeklinden dolayı can eğrisi (bell curve) olarak da adlandırılmaktadır. Eğrinin altında alanın toplamı 1’e eşittir. Burada belirlenen güven düzeyi % 95’tir. Bu güven düzeyi sosyal bilimler dışında özellikle sağlık bilimlerinde % 95’in üzerine çıkabilmektedir daha kesin çıkarımlar (inferences) alınmak istendiğinden.
Güven aralığı eşitliğinde görüleceği üzere güven aralığının hesaplanması için gerekli parametreler örneklemin ortalaması, standart hatası (se) ve Z tablo değeridir. Burada Z tablo yerine pekala t tablo değeri de alınabilirdi. Ancak örneklem büyüklüğümüz bu çalışma kapsamında 30’un üzerinde (n>30) olduğu için Z tablosu kullanılmıştır. Ancak isteğe bağlı olarak çalışmada 30’un altında örneklem büyüklüğü (n) belirlenerek t tablo değeri hesaplanabilir. Diğer taraftan, genel olarak sosyal bilimlerdeki istatistiksel analiz ve araştırmalarda güven düzeyleri % 95 olarak alındığı için bu araştırmada da bu düzey benimsenmiştir. Güven düzeyinin % 95 olarak alınması % 5’lik hata payının kabul edildiğini göstermektedir. Hazırlamış olduğum çalışmalar, özellikle de simülasyon çalışması % 95 üzeri ve altı güven düzeyleri için de kolaylıkla uyarlanabilme özelliğine sahiptir.
Sırası gelmişken belirtmekte fayda olduğuna inanıyorum. Güven aralığının kamuoyunda ve literatürde sık sık yanlış yorumlandığı ve adlandırıldığı görülmektedir. Diğer bir deyişle, güven aralığı (confidence interval) ile güven düzeyi (confidence level) karıştırılmaktadır. Burada güven aralığı eğer yüzde olarak ifade edilmişse bu güven düzeyini, yüzde olarak ifade edilmemişse güven aralığını ifade etmektedir. % 95 güven düzeyine sahip olmak, sonuçlarınızın herkese anket yapmış gibi neredeyse aynı olduğundan emin olduğunuz anlamına gelir.
Güven aralığını etkileyen faktörler nelerdir?
Güven aralığını etkileyen faktörler şöyle sıralanabilir.
- Örneklem büyüklüğü: örneklem büyüklüğü (n) artıkça elde edilen cevapların popülasyonu doğrulama olasılığı o kadar artar. Diğer bir deyişle, örneklem büyüklüğünün artması güven aralığını daraltır. Ancak bu artış lineer olmayabilir.
- Örneklem seçiminde kullanılan yöntem: eğer örneklem olasıklı örneklem yöntemleri kullanılmadan ya da bu yöntemler kullanılsa bile hatalı örneklem seçimi yapılmışsa güven aralıklarını etkileyebilir. Dolayısıyla popülasyon parametresi olan ortalamalar doğru bir şekilde tahmin edilmemiş olur.
- Güven düzeyi (% 95’ten % 99’a yükselmesi) yükseldikçe güven aralığı genişler. Çünkü matematiksel olarak çarpım katsayısı da büyür. Örnek vermek gerekirse Z tablo değeri % 95 güven aralığında 1,96 iken güven aralığı = X-+1,96 x Standart Hata. Ancak Z tablo değeri % 99 güven aralığında 2,58 iken güven aralığı = X-+2,58 x Standart Hata olur.
- Örneklem ortalaması arttıkça güven aralığının genişliği aynı kalır. Dolayısıyla, örneklem ortalaması aralığın genişliğinde bir rol oynamaz.
- Örneklem standart sapmasının azalması varyansın azalması anlamına geldiğinden standart hata düşer. Bu durum güven aralığının daralmasına ve daha yüksek doğruluk (accuracy) ile popülasyon ortalamasının tahmini anlamına gelmektedir. Burada örneklem büyüklüğü ile standart hata arasında ters orantı vardır.
Güven aralığından yeterince bahsettikten sonra şimdi uygulama aşamasına geçebiliriz. Uygulamada kullanılan popülasyon veri seti beden kitle endeksi (BKİ) değerlerini içeren ve 1000 (N) gözlemden oluşan sentetik veri setidir. Olasılıklı örneklem yöntemlerinden basit tekrarlı tesadüfi örnekleme yöntemiyle 7 ve 50 aralığında BKİ değerleri üretilmiştir. BKİ değerleri üretilirken Sağlık Bakanlığı resmi web sitesindeki BKİ alt ve üst referans değerlerinden yararlanılmıştır. Burada belirlenen BKİ alt ve üst limitleri şöyledir:
Parametre Değeri | Kategori |
8.5 kg/m2’nin altında ise | zayıf |
18.5-24.9 kg/m2 arasında ise | normal kilolu |
25-29.9 kg/m2 arasında ise | fazla kilolu |
30-34.9 kg/m2 arasında ise | I.Derece obez |
35-39.9 kg/m2 arasında ise | II.Derece obez |
40 kg/m2 üzerinde ise | III.Derece morbid obez |
İlk olarak popülasyondan tekrarsız basit tesadüfi örneklem yöntemi kullanarak her birinin örneklem büyüklüğü sırasıyla 35, 31 ve 34 olan 3 farklı örneklem çekilmiştir. Çekilen örneklemler popülasyondaki ID koduyla birlikte Tablo 1’de verilmiştir.
Tablo 1: Üç Farklı Örneklem Seçimi
Örneklem1 ID | BKİ | Örneklem2 ID | BKİ | Örneklem3 ID | BKİ |
33 | 28,8 | 5 | 35,52 | 28 | 41,87 |
34 | 8,7 | 3 | 13,9 | 25 | 19,97 |
20 | 39,3 | 20 | 39,34 | 18 | 10,55 |
16 | 10,2 | 12 | 28,64 | 8 | 7,81 |
13 | 8,3 | 9 | 40,26 | 29 | 19,67 |
19 | 28,3 | 19 | 28,28 | 24 | 33,82 |
2 | 24,8 | 2 | 24,83 | 20 | 39,34 |
3 | 13,9 | 14 | 44,36 | 19 | 28,28 |
25 | 20,0 | 18 | 10,55 | 31 | 29,96 |
11 | 21,9 | 21 | 15,14 | 13 | 8,34 |
7 | 44,9 | 11 | 21,94 | 32 | 11,19 |
29 | 19,7 | 28 | 41,87 | 27 | 36,69 |
6 | 9,2 | 8 | 7,81 | 30 | 22,34 |
21 | 15,1 | 4 | 18,82 | 12 | 28,64 |
1 | 47,3 | 10 | 37,82 | 26 | 16,71 |
31 | 30,0 | 1 | 47,34 | 3 | 13,9 |
23 | 20,8 | 22 | 15,39 | 22 | 15,39 |
28 | 41,9 | 15 | 31,19 | 2 | 24,83 |
8 | 7,8 | 24 | 33,82 | 21 | 15,14 |
26 | 16,7 | 25 | 19,97 | 14 | 44,36 |
15 | 31,2 | 13 | 8,34 | 15 | 31,19 |
5 | 35,5 | 29 | 19,67 | 7 | 44,87 |
27 | 36,7 | 26 | 16,71 | 17 | 17,62 |
22 | 15,4 | 17 | 17,62 | 11 | 21,94 |
35 | 31,5 | 16 | 10,18 | 33 | 28,79 |
10 | 37,8 | 31 | 29,96 | 5 | 35,52 |
4 | 18,8 | 6 | 9,22 | 4 | 18,82 |
24 | 33,8 | 23 | 20,82 | 16 | 10,18 |
12 | 28,6 | 7 | 44,87 | 10 | 37,82 |
18 | 10,6 | 30 | 22,34 | 9 | 40,26 |
32 | 11,2 | 27 | 36,69 | 1 | 47,34 |
14 | 44,4 | 6 | 9,22 | ||
30 | 22,3 | 34 | 8,71 | ||
9 | 40,26 | 23 | 20,82 | ||
17 | 17,62 |
Güven aralıklarını vermeden önce popülasyona ait temel parametreleri vermekte fayda olduğu düşünülmektedir. Bu amaçla popülasyon parametre değerleri Tablo 2’te sunulmuştur.
Tablo 2: Popülasyon Parametreleri
Popülasyon Parametreleri | Değer |
Ortalama (µ) | 28,7 |
Varyans | 153,0 |
Standart Sapma | 12,4 |
N | 1000 |
Örneklem gruplarına ait üretilen güven aralıkları ise Tablo 3’te verilmiştir. Tablo 3’e göre öne çıkan bulgular şöyledir:
- Ortalamasının 24,95, ortalamanın standart hatasının (se) 2,00 olduğu örneklem1 grubu popülasyon ortalamasını en doğru tahmin eden grup olarak öne çıkmıştır. Bu grupta güven aralığı genişliği (7,83) diğer gruplara göre daha dar olup güven aralığı (CI) “21,04 ≤ µ ≤28,87“ şeklindedir. Buradan örneklem beden kitle endeksi ortalamasının % 95 olasılıkla veya güven düzeyinde 21,04 ile 28,87 arasında olduğunu söyleyebiliriz. Örneklem 1 grubunu ise güven aralığı genişliği (CI width) 8,03 olan örneklem 3 grubu izlemiştir.
Tablo 3: Örneklem Grubuna Göre Güven Aralıkları
Örneklem Parametreleri | Örneklem1 | Örneklem2 | Örneklem3 |
Ortalama (m) | 24,95 | 25,59 | 24,76 |
Element Varyans (s^2) | 139,81 | 140,96 | 142,62 |
Standart Sapma (s) | 11,82 | 11,87 | 11,94 |
Örneklem büyüklüğünün popülasyon içindeki oranı (f) | 0,04 | 0,03 | 0,03 |
Finite population correction(fpc) (1-f): Popülasyon düzeltmesi | 0,97 | 0,97 | 0,97 |
Örneklem varyansı (var(x)) | 3,99 | 4,55 | 4,19 |
Standart Hata (se) | 2,00 | 2,13 | 2,05 |
Nispi hata (Coefficient of Variation) (CV) | 8,01 | 8,33 | 8,27 |
Alfa (a/2) değeri (güven aralığının olasılık değeri) | 0,03 | 0,03 | 0,03 |
Z tablo değeri | 1,96 | 1,96 | 1,96 |
%95 Güven Aralığı Alt Limit (Lower boundary of CI) | 21,04 | 21,41 | 20,75 |
%95 Güven Aralığı Üst Limit (Upper boundary of CI) | 28,87 | 29,77 | 28,78 |
Güven Aralığı Genişliği (CI Width) | 7,83 | 8,36 | 8,03 |
Güven aralığı gösterimi (CI) | 21,04 ≤ µ ≤28,87 | 21,41 ≤ µ ≤29,77 | 20,75 ≤ µ ≤28,78 |
En iyi güven aralığına sahip örneklem grubu | Örneklem 1 |
Tablo 3’teki güven aralıkları genişlikleri baz alınarak örneklem gruplarına göre güven aralıkları Şekil 2’te verilmiştir. Görüleceği üzere güven aralığı genişliği en dar olan örneklem grubu 7,83 ile örneklem 1 grubudur. Buradan şöyle bir yorum yapabiliriz: örneklem büyüklüğü (n) artıkça standart hata (se) düşer, buna bağlı olarak güven aralığı (CI width) daralır.
Şekil 2: Örneklem Gruplarına Göre Güven Aralığı Genişlikleri
Burada Z tablosu üzerinden yapılan güven aralığı deneysel çalışmasının excel uzantılı dosyasını aşağıda linkten indirebilirsiniz.
Z tablosu üzerinden Güven aralığının hesaplanmasına yönelik olarak hazırladığım simülasyonu ise aşağıdaki linkten indirebilirsiniz. Simülasyon çalışmasında bazı sayfalardaki formüller şifre ile korunmuştur. Değişiklik yapılması istenmesi durumundan sayfa korumasının kaldırılması için şifre olarak “tevfik” girilmesi yeterlidir. Özellikle bu simülasyon çalışmasının sahada ve akademide faaliyet gösteren çalışanlara çok faydalı olacağı düşünülmektedir. Bu çalışmanın içerisinde olaslıklı örneklem seçiminden örneklem büyüklüğünün belirlenmesine kadar pek çok konu mevcuttur. Bu simülasyonda örneklem büyüklüğünü siz belirleyebilirsiniz.
Ayrıca güven aralığı simülasyonuna sizlerin örneklem büyüklüğünü elle belirlemenize gerek kalmadan tesadüfi bir şekilde belirlenmesine olanak tanıyan özellik ilave ettim. Güven aralığı simülasyonunun bu versiyonunu ise aşağıdaki linkten indirebilirsiniz.
Faydalı olması ve farkındalık oluşturması dileğiyle.
Bilimle ve teknolojiyle kalınız.
Saygılarımla…
Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.
Note: It can not be cited or copied without referencing.
Yararlanılan Kaynaklar
- https://www.sbn.gov.tr/BKindeksi.aspx
- https://www.statisticshowto.com/probability-and-statistics/confidence-interval/
- http://www.stat.yale.edu/Courses/1997-98/101/confint.htm
- https://researchbasics.education.uconn.edu/confidence-intervals-and-levels/
- https://researchbasics.education.uconn.edu/confidence-intervals-and-levels/
- https://online.stat.psu.edu/statprogram/reviews/statistical-concepts/confidence-intervals
- http://web.pdx.edu/~stipakb/download/PA551/boxplot.html
- https://www.got-it.ai/
- Field, Andy. (2009). Discovering Statistics Using SPSS. Third Edition.