Giriş
Daha önce basit tesadüfi örnekleme (simple random sampling) üzerine burada çalışmalar yapılmıştı. İlgilenecekler için aşağıda yararlanılan kaynaklar kısmında bu çalışmaların linklerine yer verilmiştir. Bu çalışmada ise örnek bir uygulama üzerinden ve olabildiğince yalın bir dille sistematik örnekleme yapılacaktır. Sistematik örnekleme, 1’den N’e kadar olan popülasyon birimlerinden ilk seçimin tesadüfi bir şekilde seçilmesinden sonra örneklem genişliği (k=N/n)’ne denk gelen popülasyon birimlerinin seçilmesidir. Basit tesadüfi örneklemeye göre daha kolay olan ve ona alternatif olarak kullanılan bu yöntem olasılıklı örneklem yöntemlerinden biridir. Olasılıklı örnekleme yöntemleri popülasyona ait çıkarımlar (inferences) açısından son derece önemlidir. Diğer bir deyişle, eğer örneklem çekilen popülasyon hakkında çıkarımlarda bulunmak isteniyorsa mutlaka olasılıklı örneklem yöntemlerinden biri veya bir kaçı kullanılmak zorundadır. Aslında bu yönteme sistematik tesadüfi örnekleme (systematic random sampling) de diyebiliriz. Bunun nedeni örneklem seçimi yapılan popülasyondan ilk (1.) seçimin tesadüfi bir şekilde belirlenmesidir. Genel olarak sistematik örneklemede örneklem birimlerinin seçiminin nasıl olduğuna ilişkin hazırlamış olduğum diyagram Şekil 1’de yer verilmiştir.
Şekil 1: Sistematik Örneklem Seçimi
Şekil 1’de örnekleme seçilen ilk örneklem birimine (sampling unit), ingilizce ifadeyle random start (RS) diyoruz. Sistematik örnekleme adımları ise Şekil 2’de şöyle özetlenebilir:
Şekil 2: Sistematik Örnekleme Adımları
Şekil 2’ye göre sistematik örnekleme adımlarını sırasıyla ele alalım:
- N popülasyon büyüklüğünü, n ise örneklem büyüklüğünü göstersin. Bu iki büyüklüğü kullanarak ilk olarak aralık genişliğini hesaplayalım. Aralık genişliğini k olarak gösterelim. k=N/n olmak üzere popülasyon büyüklüğünün örneklem büyüklüğüne oranını ifade etmektedir. Eşitliğinin çarpmaya göre tersi ise bize örneklem katsayısı dediğimiz sampling fraction (f=n/N)’i verir.
- 1 ile k arasında tesadüfi bir tamsayı belirlenir. Belirlenen bu sayı (RS)’ya denk gelen popülasyon birimi ilk örneklem birimini oluşturur.
- İlk örneklem biriminden sonra belirlenen örneklem büyüklüğüne ulaşıncaya kadar aşağıdaki işlemler yapılarak örneklem seçimi tamamlanır.
- İkinci örneklem birimi RS + k
- Üçüncü örneklem birimi için RS +2k
- Dörtüncü örneklem birimi için RS +3k
- Son örneklem birimi için ise RS + (n-1) x k
Popülasyon büyüklüğü (N) 81 olan Türkiye illeri içerisinden sistematik örnekleme yöntemiyle iki farklı büyüklükte sistematik örneklem yöntemi kullanılarak örneklem seçimi yapılacaktır. Örnek uygulamalar daha açık ve anlaşılır olması adına Microsoft Excel üzerinden yapalım. Bu amaçla ilk olarak popülasyon büyüklüğü belli olan 81 ilimizi, diğer bir deyişle popülasyon birimlerimizi alfabetik sıraya göre Tablo 1’de verelim.
Tablo 1: Popülasyon Listesi (N=81)
Sıra | İl |
1 | Adana |
2 | Adıyaman |
3 | Afyonkarahisar |
4 | Ağrı |
5 | Aksaray |
6 | Amasya |
7 | Ankara |
8 | Antalya |
9 | Ardahan |
10 | Artvin |
11 | Aydın |
12 | Balıkesir |
13 | Bartın |
14 | Batman |
15 | Bayburt |
16 | Bilecik |
17 | Bingöl |
18 | Bitlis |
19 | Bolu |
20 | Burdur |
21 | Bursa |
22 | Çanakkale |
23 | Çankırı |
24 | Çorum |
25 | Denizli |
26 | Diyarbakır |
27 | Düzce |
28 | Edirne |
29 | Elazığ |
30 | Erzincan |
31 | Erzurum |
32 | Eskişehir |
33 | Gaziantep |
34 | Giresun |
35 | Gümüşhane |
36 | Hakkâri |
37 | Hatay |
38 | Iğdır |
39 | Isparta |
40 | İstanbul |
41 | İzmir |
42 | Kahramanmaraş |
43 | Karabük |
44 | Karaman |
45 | Kars |
46 | Kastamonu |
47 | Kayseri |
48 | Kilis |
49 | Kırıkkale |
50 | Kırklareli |
51 | Kırşehir |
52 | Kocaeli |
53 | Konya |
54 | Kütahya |
55 | Malatya |
56 | Manisa |
57 | Mardin |
58 | Mersin |
59 | Muğla |
60 | Muş |
61 | Nevşehir |
62 | Niğde |
63 | Ordu |
64 | Osmaniye |
65 | Rize |
66 | Sakarya |
67 | Samsun |
68 | Şanlıurfa |
69 | Siirt |
70 | Sinop |
71 | Sivas |
72 | Şırnak |
73 | Tekirdağ |
74 | Tokat |
75 | Trabzon |
76 | Tunceli |
77 | Uşak |
78 | Van |
79 | Yalova |
80 | Yozgat |
81 | Zonguldak |
Şimdi örneklem genişliği yada aralık genişliği olan k katsayımızı bulalım. k katsayımıza ilişkin iki durum önümüze çıkmaktadır. Birincisi k’nın tamsayı değeri alması, diğeri ise kesirli bir değer almasıdır. Birinci durum ikinci duruma göre kolaylıkla çözümlenmektedir.
Uygulama
a) k’nın tamsayı değeri alması durumunda sistematik örneklem seçimi
Konuyu kavramak adına ilk örnek uygulamamızı yapabiliriz. Popülasyon büyüklüğü (N) 81 olan Türkiye illeri içerisinden örneklem büyüklüğü (n) 27 olan ilimizi sistematik örnekleme yöntemiyle sırasıyla seçelim. Örnek uygulamamızı Microsoft Excel üzerinden yapalım.
- 1. k=N/n, yani 81/27=3 olarak bulunur. k’yı belirledik. Sıra 1 ile k arasında tesadüfi bir tamsayı değeri hesaplamaya gelmiştir. Excelde bu işlemi =RASTGELEARADA(1; 3) fonksiyonu ile yapıyoruz. RASTGELEARADA() fonksiyonu dinamik bir fonksiyon olduğu için excel üzerinde EĞER() fonksiyonu ile sabitlenmiştir. Bu fonksiyon içerisindeki ilk sayı alt limiti, ikinci sayı ise üst limiti, diğer bir deyişle k’yı ifade eder. Bu fonksiyon belirlenen alt ve üst limit (bu limitler de dahil) arasında tamsayı değeri ürerir. Yukarıdaki fonksiyon çalıştırıldığında ilk örneklem birimimiz (RS) 2 olarak bulunur. Bu 2 sıra numarasına Tablo 1 satırında karşılık gelen il (Adıyaman) bizim ilk örneklem birimimizi oluşturur. Sıra numarasına göre eşleştirme işlemi excel üzerinde DÜŞEYARA() fonksiyonu ile yapılmıştır. =DÜŞEYARA(F2;A:B;2;YANLIŞ) fonksiyonu ile aşağıdaki tabloda F2 hücresindeki sıra numarasına A ve B sütunlarında karşılık gelen ili tam eşleştirme ile getir diyoruz.
- 2. İkinci örneklem birimimiz ise RS+k, yani 2+3 eşitliğinden 5. sıradaki Adıyaman ilimizdir.
- 3. Üçüncü örneklem birimimiz ise RS+2k, yani 2+2×3 eşitliğinden 8. sıradaki Aydın ilimizdir.
- 4. Son örneklem birimimiz ise RS+(n-1)k, yani 2+26×3 eşitliğinden 80 sıradaki Yozgat ilimiz olarak belirlenir ve örneklem seçim işlemi tamamlanır.
Yapılan yukarıdaki örneğe ilişkin excel dokümanını aşağıdaki linkten indirebilirsiniz.
b) k’nın kesirli bir değer alması durumunda sistematik örneklem seçimi
İkinci örneğimizde popülasyon büyüklüğü (N) 81 olan Türkiye illeri içerisinden örneklem büyüklüğü (n) 45 olan ilimizi sistematik örnekleme yöntemiyle sırasıyla seçelim. Örnek uygulamamızı Microsoft Excel üzerinden yapalım.
- 1. k=N/n, yani 81/45=1,8 olarak bulunur. k’yı belirledik. Ancak k katsayısı kesirli burada. Amacımız bizim k katsayısının tamsayı olmasıdır. Bu amaçla k katsayısını 10 (k x 10) ile çarparak 18 k katsayısını elde ediyoruz. Sıra 1 ile 18 (k) arasında tesadüfi bir tamsayı değeri buluyoruz. Excelde bu işlemi =RASTGELEARADA(1; 18) fonksiyonu ile yapıyoruz. Bu fonksiyon içerisindeki ilk sayı alt limiti, ikinci sayı ise üst limiti, diğer bir deyişle k’yı ifade eder. Bu fonksiyon belirlenen alt ve üst limit (bu limitler de dahil) arasında tamsayı değeri ürerir. Yukarıdaki fonksiyon çalıştırıldığında ilk örneklem birimimiz (RS) 10 olarak bulunur. RASTGELEARADA() fonksiyonu dinamik bir fonksiyon olduğu için excel üzerinde EĞER() fonksiyonu ile sabitlenmiştir. =EĞER(RASTGELEARADA(1;18)<>10;10;10) fonksiyonu yazarak 1 ile 18 arasında tesadüfi bir şekilde seçilen hangi tamsayı olursa olsun 10 sayısını bize getir diyerek RS’yi sabitliyoruz. RASTGELEARADA() fonksiyonunun dışındaki EĞER() fonksiyonu kaldırılırsa 10’nun dışında sayıların da geleceği görülecektir. Ancak henüz üretilen bu sayıya göre bir seçim yapamayız. Çünkü başlangıçta örneklem aralığı (k)’nı 10 ile çarptığımız için sağdan bir basamak çıkartılır. Yani bu durumda 10 yerine 1’i alarak ilk örneklem birimimizi oluştururuz. Bu 1 sıra numarasına Tablo 1 satırında karşılık gelen il (Adıyaman) bizim ilk örneklem birimimizi oluşturur. Sıra numarasına göre eşleştirme işlemi excel üzerinde DÜŞEYARA() fonksiyonu ile yapılmıştır. =DÜŞEYARA(G2;A:B;2;YANLIŞ) fonksiyonu ile aşağıdaki tabloda G2 hücresindeki sıra numarasına A ve B sütunlarında karşılık gelen ili tam eşleştirme ile getir diyoruz. Sağdan bir basamak çıkartma işlemi bütün örneklem birimleri seçilene kadar devam edecektir. “Revize edilmiş popülasyon sırası” sütunu (G sütunu)’nda sağdan bir basamak çıkarma işlemi kolaylık sağlaması açısından yazdığım şu fonksiyonla kolaylıkla yapılabilmektedir:
=SAYIYAÇEVİR(EĞER(VE(F2>9;F2<100);SOLDAN(F2;1);EĞER(VE(F2>99;F2<1000);SOLDAN(F2;2)))).
Literatürde bu yapılan işlemin dışında hesaplanan örneklem genişliği (k)’nin kesirli olması durumunda, bu örnekte olduğu gibi, k katsayısını tam sayıya dönüştürmek için aşağı veya yukarı yuvarlandığı görülmektedir. Bu yöntem zaman zaman belirlenmiş olan örneklem büyüklüğünde örneklem birimlerin eksik veya fazla seçilmesine sebebiyet verebilmektedir. Bu hususu dikkate almakta fayda vardır. Bu nedenle k katsayının 10 ile çarpılması, ardından 1 ile k arasında tesadüfi bir şekilde belirlenen RS (ilk örneklem birimi) ve RS’ye k’nın ilave edilerek elde edilen 2. ve sonraki örneklem birimlerini temsil eden sıra sayılarının son basamağı çıkartılarak kalan sıra sayıları üzerinden gidilmesinin daha sağlıklı ve güvenilir bir yol olduğu düşünülmektedir.
- 2. İkinci örneklem birimimiz ise RS+k, yani 10+18 eşitliğinden 28 bulunur. Ancak sağdan bir basamak çıkarılıp elde edilen 2. sıradaki Adıyaman ilimiz ikinci örneklem birimimiz olarak belirlenir.
- 3. Üçüncü örneklem birimimiz ise RS+2k, yani 10+2×18 eşitliğinden 46 bulunur. Ancak sağdan bir basamak çıkarılıp elde edilen 4. sıradaki Ağrı ilimiz üçüncü örneklem birimimiz olarak belirlenir.
- 4. Son örneklem birimimiz ise RS+(n-1)k, yani 10+ 44×18 eşitliğinden 802 bulunur. Ancak sağdan bir basamak çıkarılıp elde edilen 80. sıradaki Yozgat ilimiz son örneklem birimimiz olarak belirlenir ve örneklem seçim işlemi tamamlanır.
Yapılan yukarıdaki örneğe ilişkin excel dokümanını aşağıdaki linkten indirebilirsiniz.
Yapılan bu çalışma ile özellikle veri bilimi (data science) ile ilgilenen akademi ve saha çalışanlarına bir katkı sunulması amaçlanmıştır.
Faydalı olması ve farkındalık oluşturması dileğiyle.
Bilimle ve teknolojiyle kalınız.
Saygılarımla…
Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.
Note: It can not be cited or copied without referencing.
Yararlanılan Kaynaklar
- https://tevfikbulut.com/2020/05/18/tekrarsiz-basit-tesadufi-ornekleme-yontemi-kullanilarak-t-dagilim-tablosu-uzerinden-guven-araliginin-hesaplanmasina-yonelik-bir-simulasyon-calismasi-a-simulation-study-for-the-calculation-of-confiden/
- https://tevfikbulut.com/2020/05/17/tekrarsiz-basit-tesadufi-ornekleme-yontemi-kullanilarak-z-tablosu-uzerinden-guven-araliginin-hesaplanmasina-yonelik-bir-simulasyon-calismasi-a-simulation-study-for-the-calculation-of-confidence-inter/
- Microsoft Office Excel 2016. Microsoft
- http://dissertation.laerd.com/systematic-random-sampling.php
- https://www.sciencedirect.com/topics/mathematics/systematic-sampling
- Kish, Leslie .(1965). Survey Sampling. John Wiley & Sons.
- https://researchbasics.education.uconn.edu/systematic-sampling/