Logo Logo
  • Ana Sayfa
  • Hakkında
  • Kategoriler
    • Genel
    • İstatistik
    • Makine Öğrenme
    • Model Geliştirme
    • Sağlık
    • Teknoloji
  • Tüm Yazılarım
  • İletişim

İletişim

  • Email buluttevfik@gmail.com

Site Haritası

  • Ana Sayfa
  • Hakkında
  • İletişim

Sosyal Medya Adresleri

Microsoft Excel’de Sistematik Örnekleme Üzerine Bir Vaka Çalışması: A Case Study on Systematic Sampling in Microsoft Excel

  • ANA SAYFA
  • Blog Details
Mayıs 19 2020
  • İstatistik

Giriş

Daha önce basit tesadüfi örnekleme (simple random sampling) üzerine burada çalışmalar yapılmıştı. İlgilenecekler için aşağıda yararlanılan kaynaklar kısmında bu çalışmaların linklerine yer verilmiştir. Bu çalışmada ise örnek bir uygulama üzerinden ve olabildiğince yalın bir dille sistematik örnekleme yapılacaktır. Sistematik örnekleme, 1’den N’e kadar olan popülasyon birimlerinden ilk seçimin tesadüfi bir şekilde seçilmesinden sonra örneklem genişliği (k=N/n)’ne denk gelen popülasyon birimlerinin seçilmesidir. Basit tesadüfi örneklemeye göre daha kolay olan ve ona alternatif olarak kullanılan bu yöntem olasılıklı örneklem yöntemlerinden biridir. Olasılıklı örnekleme yöntemleri popülasyona ait çıkarımlar (inferences) açısından son derece önemlidir. Diğer bir deyişle, eğer örneklem çekilen popülasyon hakkında çıkarımlarda bulunmak isteniyorsa mutlaka olasılıklı örneklem yöntemlerinden biri veya bir kaçı kullanılmak zorundadır. Aslında bu yönteme sistematik tesadüfi örnekleme (systematic random sampling) de diyebiliriz. Bunun nedeni örneklem seçimi yapılan popülasyondan ilk (1.) seçimin tesadüfi bir şekilde belirlenmesidir. Genel olarak sistematik örneklemede örneklem birimlerinin seçiminin nasıl olduğuna ilişkin hazırlamış olduğum diyagram Şekil 1’de yer verilmiştir.

Şekil 1: Sistematik Örneklem Seçimi

Şekil 1’de örnekleme seçilen ilk örneklem birimine (sampling unit), ingilizce ifadeyle random start (RS) diyoruz. Sistematik örnekleme adımları ise Şekil 2’de şöyle özetlenebilir:

Şekil 2: Sistematik Örnekleme Adımları

Şekil 2’ye göre sistematik örnekleme adımlarını sırasıyla ele alalım:

  1. N popülasyon büyüklüğünü, n ise örneklem büyüklüğünü göstersin. Bu iki büyüklüğü kullanarak ilk olarak aralık genişliğini hesaplayalım. Aralık genişliğini k olarak gösterelim. k=N/n olmak üzere popülasyon büyüklüğünün örneklem büyüklüğüne oranını ifade etmektedir. Eşitliğinin çarpmaya göre tersi ise bize örneklem katsayısı dediğimiz sampling fraction (f=n/N)’i verir.
  2. 1 ile k arasında tesadüfi bir tamsayı belirlenir. Belirlenen bu sayı (RS)’ya denk gelen popülasyon birimi ilk örneklem birimini oluşturur.
  3. İlk örneklem biriminden sonra belirlenen örneklem büyüklüğüne ulaşıncaya kadar aşağıdaki işlemler yapılarak örneklem seçimi tamamlanır.
    1. İkinci örneklem birimi RS + k
    2. Üçüncü örneklem birimi için RS +2k
    3. Dörtüncü örneklem birimi için RS +3k
    4. Son örneklem birimi için ise RS + (n-1) x k

Popülasyon büyüklüğü (N) 81 olan Türkiye illeri içerisinden sistematik örnekleme yöntemiyle iki farklı büyüklükte sistematik örneklem yöntemi kullanılarak örneklem seçimi yapılacaktır. Örnek uygulamalar daha açık ve anlaşılır olması adına Microsoft Excel üzerinden yapalım. Bu amaçla ilk olarak popülasyon büyüklüğü belli olan 81 ilimizi, diğer bir deyişle popülasyon birimlerimizi alfabetik sıraya göre Tablo 1’de verelim.

Tablo 1: Popülasyon Listesi (N=81)

Sıraİl
1Adana
2Adıyaman
3Afyonkarahisar
4Ağrı
5Aksaray
6Amasya
7Ankara
8Antalya
9Ardahan
10Artvin
11Aydın
12Balıkesir
13Bartın
14Batman
15Bayburt
16Bilecik
17Bingöl
18Bitlis
19Bolu
20Burdur
21Bursa
22Çanakkale
23Çankırı
24Çorum
25Denizli
26Diyarbakır
27Düzce
28Edirne
29Elazığ
30Erzincan
31Erzurum
32Eskişehir
33Gaziantep
34Giresun
35Gümüşhane
36Hakkâri
37Hatay
38Iğdır
39Isparta
40İstanbul
41İzmir
42Kahramanmaraş
43Karabük
44Karaman
45Kars
46Kastamonu
47Kayseri
48Kilis
49Kırıkkale
50Kırklareli
51Kırşehir
52Kocaeli
53Konya
54Kütahya
55Malatya
56Manisa
57Mardin
58Mersin
59Muğla
60Muş
61Nevşehir
62Niğde
63Ordu
64Osmaniye
65Rize
66Sakarya
67Samsun
68Şanlıurfa
69Siirt
70Sinop
71Sivas
72Şırnak
73Tekirdağ
74Tokat
75Trabzon
76Tunceli
77Uşak
78Van
79Yalova
80Yozgat
81Zonguldak

Şimdi örneklem genişliği yada aralık genişliği olan k katsayımızı bulalım. k katsayımıza ilişkin iki durum önümüze çıkmaktadır. Birincisi k’nın tamsayı değeri alması, diğeri ise kesirli bir değer almasıdır. Birinci durum ikinci duruma göre kolaylıkla çözümlenmektedir.

Uygulama

a) k’nın tamsayı değeri alması durumunda sistematik örneklem seçimi

Konuyu kavramak adına ilk örnek uygulamamızı yapabiliriz. Popülasyon büyüklüğü (N) 81 olan Türkiye illeri içerisinden örneklem büyüklüğü (n) 27 olan ilimizi sistematik örnekleme yöntemiyle sırasıyla seçelim. Örnek uygulamamızı Microsoft Excel üzerinden yapalım.

  • 1. k=N/n, yani 81/27=3 olarak bulunur. k’yı belirledik. Sıra 1 ile k arasında tesadüfi bir tamsayı değeri hesaplamaya gelmiştir. Excelde bu işlemi =RASTGELEARADA(1; 3) fonksiyonu ile yapıyoruz. RASTGELEARADA() fonksiyonu dinamik bir fonksiyon olduğu için excel üzerinde EĞER() fonksiyonu ile sabitlenmiştir. Bu fonksiyon içerisindeki ilk sayı alt limiti, ikinci sayı ise üst limiti, diğer bir deyişle k’yı ifade eder. Bu fonksiyon belirlenen alt ve üst limit (bu limitler de dahil) arasında tamsayı değeri ürerir. Yukarıdaki fonksiyon çalıştırıldığında ilk örneklem birimimiz (RS) 2 olarak bulunur. Bu 2 sıra numarasına Tablo 1 satırında karşılık gelen il (Adıyaman) bizim ilk örneklem birimimizi oluşturur. Sıra numarasına göre eşleştirme işlemi excel üzerinde DÜŞEYARA() fonksiyonu ile yapılmıştır. =DÜŞEYARA(F2;A:B;2;YANLIŞ) fonksiyonu ile aşağıdaki tabloda F2 hücresindeki sıra numarasına A ve B sütunlarında karşılık gelen ili tam eşleştirme ile getir diyoruz.
  • 2. İkinci örneklem birimimiz ise RS+k, yani 2+3 eşitliğinden 5. sıradaki Adıyaman ilimizdir.
  • 3. Üçüncü örneklem birimimiz ise RS+2k, yani 2+2×3 eşitliğinden 8. sıradaki Aydın ilimizdir.
  • 4. Son örneklem birimimiz ise RS+(n-1)k, yani 2+26×3 eşitliğinden 80 sıradaki Yozgat ilimiz olarak belirlenir ve örneklem seçim işlemi tamamlanır.

Yapılan yukarıdaki örneğe ilişkin excel dokümanını aşağıdaki linkten indirebilirsiniz.

Örnek 1: Sistematik Örneklemeİndir

b) k’nın kesirli bir değer alması durumunda sistematik örneklem seçimi

İkinci örneğimizde popülasyon büyüklüğü (N) 81 olan Türkiye illeri içerisinden örneklem büyüklüğü (n) 45 olan ilimizi sistematik örnekleme yöntemiyle sırasıyla seçelim. Örnek uygulamamızı Microsoft Excel üzerinden yapalım.

  • 1. k=N/n, yani 81/45=1,8 olarak bulunur. k’yı belirledik. Ancak k katsayısı kesirli burada. Amacımız bizim k katsayısının tamsayı olmasıdır. Bu amaçla k katsayısını 10 (k x 10) ile çarparak 18 k katsayısını elde ediyoruz. Sıra 1 ile 18 (k) arasında tesadüfi bir tamsayı değeri buluyoruz. Excelde bu işlemi =RASTGELEARADA(1; 18) fonksiyonu ile yapıyoruz. Bu fonksiyon içerisindeki ilk sayı alt limiti, ikinci sayı ise üst limiti, diğer bir deyişle k’yı ifade eder. Bu fonksiyon belirlenen alt ve üst limit (bu limitler de dahil) arasında tamsayı değeri ürerir. Yukarıdaki fonksiyon çalıştırıldığında ilk örneklem birimimiz (RS) 10 olarak bulunur. RASTGELEARADA() fonksiyonu dinamik bir fonksiyon olduğu için excel üzerinde EĞER() fonksiyonu ile sabitlenmiştir. =EĞER(RASTGELEARADA(1;18)<>10;10;10) fonksiyonu yazarak 1 ile 18 arasında tesadüfi bir şekilde seçilen hangi tamsayı olursa olsun 10 sayısını bize getir diyerek RS’yi sabitliyoruz. RASTGELEARADA() fonksiyonunun dışındaki EĞER() fonksiyonu kaldırılırsa 10’nun dışında sayıların da geleceği görülecektir. Ancak henüz üretilen bu sayıya göre bir seçim yapamayız. Çünkü başlangıçta örneklem aralığı (k)’nı 10 ile çarptığımız için sağdan bir basamak çıkartılır. Yani bu durumda 10 yerine 1’i alarak ilk örneklem birimimizi oluştururuz. Bu 1 sıra numarasına Tablo 1 satırında karşılık gelen il (Adıyaman) bizim ilk örneklem birimimizi oluşturur. Sıra numarasına göre eşleştirme işlemi excel üzerinde DÜŞEYARA() fonksiyonu ile yapılmıştır. =DÜŞEYARA(G2;A:B;2;YANLIŞ) fonksiyonu ile aşağıdaki tabloda G2 hücresindeki sıra numarasına A ve B sütunlarında karşılık gelen ili tam eşleştirme ile getir diyoruz. Sağdan bir basamak çıkartma işlemi bütün örneklem birimleri seçilene kadar devam edecektir. “Revize edilmiş popülasyon sırası” sütunu (G sütunu)’nda sağdan bir basamak çıkarma işlemi kolaylık sağlaması açısından yazdığım şu fonksiyonla kolaylıkla yapılabilmektedir:
=SAYIYAÇEVİR(EĞER(VE(F2>9;F2<100);SOLDAN(F2;1);EĞER(VE(F2>99;F2<1000);SOLDAN(F2;2)))). 

Literatürde bu yapılan işlemin dışında hesaplanan örneklem genişliği (k)’nin kesirli olması durumunda, bu örnekte olduğu gibi, k katsayısını tam sayıya dönüştürmek için aşağı veya yukarı yuvarlandığı görülmektedir. Bu yöntem zaman zaman belirlenmiş olan örneklem büyüklüğünde örneklem birimlerin eksik veya fazla seçilmesine sebebiyet verebilmektedir. Bu hususu dikkate almakta fayda vardır. Bu nedenle k katsayının 10 ile çarpılması, ardından 1 ile k arasında tesadüfi bir şekilde belirlenen RS (ilk örneklem birimi) ve RS’ye k’nın ilave edilerek elde edilen 2. ve sonraki örneklem birimlerini temsil eden sıra sayılarının son basamağı çıkartılarak kalan sıra sayıları üzerinden gidilmesinin daha sağlıklı ve güvenilir bir yol olduğu düşünülmektedir.

  • 2. İkinci örneklem birimimiz ise RS+k, yani 10+18 eşitliğinden 28 bulunur. Ancak sağdan bir basamak çıkarılıp elde edilen 2. sıradaki Adıyaman ilimiz ikinci örneklem birimimiz olarak belirlenir.
  • 3. Üçüncü örneklem birimimiz ise RS+2k, yani 10+2×18 eşitliğinden 46 bulunur. Ancak sağdan bir basamak çıkarılıp elde edilen 4. sıradaki Ağrı ilimiz üçüncü örneklem birimimiz olarak belirlenir.
  • 4. Son örneklem birimimiz ise RS+(n-1)k, yani 10+ 44×18 eşitliğinden 802 bulunur. Ancak sağdan bir basamak çıkarılıp elde edilen 80. sıradaki Yozgat ilimiz son örneklem birimimiz olarak belirlenir ve örneklem seçim işlemi tamamlanır.

Yapılan yukarıdaki örneğe ilişkin excel dokümanını aşağıdaki linkten indirebilirsiniz.

Örnek 2: Sistematik Örneklemeİndir

Yapılan bu çalışma ile özellikle veri bilimi (data science) ile ilgilenen akademi ve saha çalışanlarına bir katkı sunulması amaçlanmıştır.

Faydalı olması ve farkındalık oluşturması dileğiyle.

Bilimle ve teknolojiyle kalınız.

Saygılarımla…

Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.

Note: It can not be cited or copied without referencing.

Yararlanılan Kaynaklar

  • https://tevfikbulut.com/2020/05/18/tekrarsiz-basit-tesadufi-ornekleme-yontemi-kullanilarak-t-dagilim-tablosu-uzerinden-guven-araliginin-hesaplanmasina-yonelik-bir-simulasyon-calismasi-a-simulation-study-for-the-calculation-of-confiden/
  • https://tevfikbulut.com/2020/05/17/tekrarsiz-basit-tesadufi-ornekleme-yontemi-kullanilarak-z-tablosu-uzerinden-guven-araliginin-hesaplanmasina-yonelik-bir-simulasyon-calismasi-a-simulation-study-for-the-calculation-of-confidence-inter/
  • Microsoft Office Excel 2016. Microsoft
  • http://dissertation.laerd.com/systematic-random-sampling.php
  • https://www.sciencedirect.com/topics/mathematics/systematic-sampling
  • Kish, Leslie .(1965). Survey Sampling. John Wiley & Sons.
  • https://researchbasics.education.uconn.edu/systematic-sampling/
Önceki yazı Sonraki Yazı
İlk SeçimÖrneklem KatsayısıRandom StartRSSampling FractionSistematik ÖrneklemeSistematik Tesadüfi ÖrneklemeSystematic Random SamplingSystematic Sampling

Yorum Yaz Cevabı iptal et

Son Yazılar

  • Kanada Sağlık Sisteminde Bekleme Süreleri
  • Araştırma Metodolojisi Notları-II
  • Araştırma Metodolojisi Notları-I
  • Microsoft Excel’de Bulut Endeks-Beta [BE-β] Simülasyonu
  • R’da Statik ve Dinamik Haritalama Vaka Çalışmaları: Türkiye Örneği

Son Yorumlar

  1. Küresel İnovasyon Endeksi 2021 Yılı Raporu ve Türkiye - winally.com - Küresel İnovasyon Endeksi’nde Türkiye Ne Durumda?
  2. R’da Birliktelik Kuralları | canözkan - Apriori Algoritması Üzerine Bir Vaka Çalışması: A Case Study on Apriori Algorithm
  3. Tevfik BULUT - Python’da Şans Oyunları Perspektifinden Olasılık : Probability from Perspective of the Chance Games in Python
  4. Ahmet Aksoy - Python’da Şans Oyunları Perspektifinden Olasılık : Probability from Perspective of the Chance Games in Python
  5. Tevfik BULUT - Z Tablosuna Göre Güven Aralığının Hesaplanmasına Yönelik Bir Simülasyon Çalışması: A Simulation Study for Calculating Confidence Interval by Z Table

Arşivler

  • Ocak 2023
  • Ekim 2022
  • Eylül 2022
  • Nisan 2022
  • Mart 2022
  • Ekim 2021
  • Eylül 2021
  • Ağustos 2021
  • Temmuz 2021
  • Haziran 2021
  • Mayıs 2021
  • Nisan 2021
  • Şubat 2021
  • Ocak 2021
  • Aralık 2020
  • Kasım 2020
  • Ekim 2020
  • Eylül 2020
  • Ağustos 2020
  • Temmuz 2020
  • Haziran 2020
  • Mayıs 2020
  • Nisan 2020
  • Mart 2020
  • Şubat 2020
  • Ocak 2020
  • Aralık 2019
  • Kasım 2019
  • Ekim 2019
  • Eylül 2019
  • Ağustos 2019
  • Mayıs 2019
  • Şubat 2019
  • Aralık 2018
  • Eylül 2018
  • Ağustos 2018
  • Temmuz 2018
  • Mayıs 2018
  • Nisan 2018
  • Ekim 2017
  • Temmuz 2017
  • Haziran 2017
  • Mayıs 2017
  • Ocak 2017

Kategoriler

  • Genel
  • İstatistik
  • Makine Öğrenme
  • Model Geliştirme
  • Sağlık
  • Teknoloji

Kategoriler

  • Genel
  • İstatistik
  • Makine Öğrenme
  • Model Geliştirme
  • Sağlık
  • Teknoloji

Etiketler

Accuracy Basit Tesadüfi Örnekleme Bernoulli Olasılık Dağılımı Confusion Matrix Coronavirus Doğruluk Doğruluk Oranı Dünya Sağlık Örgütü EDA Epidemi Epidemiyology Epidemiyoloji Exploratory Data Analysis Exploratory Data Analysis (EDA) F1 Forecast Keşifsel Veri Analizi Kitle Olasılık Fonksiyonu Koronavirüs Koronavirüs Salgını Olasılık Olasılıklı Örneklem OSB Pandemi Point Estimation Point Forecast Prevalance Prevalans Probability Sampling R Recall Salgın Sağlık Bakanlığı Simple Random Sampling Tahmin TBATS TURKEY TÜRKİYE Veri Madenciliği WHO World Health Organization Yapay Zeka ÇKKV Örneklem Örneklem Büyüklüğü
Logo

Burada, gazete ve dergilerde yayınlanan çalışmalarımın tamamı çalışmakta olduğum kurumdan bağımsız olarak özel hayatımda yaptığım çalışmalardır. Dolayısıyla, burada yer alan çalışmalardan emeğe saygı adına kaynak gösterilmesi suretiyle azami ölçüde herkes yararlanabilir.

Site Haritası

  • Ana Sayfa
  • Hakkında
  • Blog
  • İletişim

Linkler

  • winally.com

Bana Ulaşın

Bu sayfa, bazı temel bilgilerin ve bir iletişim formunun yer aldığı bir iletişim sayfasıdır. Suç teşkil edecek, yasadışı, tehditkar, rahatsız edici, hakaret ve küfür içeren, aşağılayıcı, küçük düşürücü, kaba, müstehcen, ahlaka aykırı, kişilik haklarına zarar verici ya da benzeri niteliklerde içeriklerden doğan her türlü mali, hukuki, cezai, idari sorumluluk içeriği gönderen Kişilere aittir.

  • Email: buluttevfik@gmail.com

© Copyright 2022 Tevfik Bulut