Logo Logo
  • Ana Sayfa
  • Hakkında
  • Kategoriler
    • Genel
    • İstatistik
    • Makine Öğrenme
    • Model Geliştirme
    • Sağlık
    • Teknoloji
  • Tüm Yazılarım
  • İletişim

İletişim

  • Email buluttevfik@gmail.com

Site Haritası

  • Ana Sayfa
  • Hakkında
  • İletişim

Sosyal Medya Adresleri

R ve Python’da Tekrarlı Basit Tesadüfi Örnekleme Üzerine Bir Vaka Çalışması: A Case Study on Simple Random Sampling (SRS) with Replacement in R and Python

  • ANA SAYFA
  • Blog Details
Eylül 15 2019
  • İstatistik

Basit tesadüfi örnekleme, popülasyondaki birimlerinden örnekleme seçilme olasılığı bilinen ve seçilme olasılığı sıfır olmayan örnekleme türüdür. Bu örnekleme türü aynı zamanda olasılıklı örnekleme tekniklerinden biri olup, popülasyon hakkında çıkarımsal (inferential) istatistikler ortaya koymaya ve örneklemden elde edilen bulguların hedef popülasyona genellebilmesine olanak tanır.

Basit tesadüfi örnekleme, tekrarlı (popülasyondaki birimlerin eşit ve birden fazla seçilme olasılığı) ve varsayımsal bir örnek üzerinden uygulamalı olarak gösterilecektir. Tekrarlı seçilme olasılığı, topların olduğu torbadan seçilmiş bir topun tekrar torbanın içine atılarak tekrar seçilme olasılığının tanındığı bir olasılık tekniği olarak ele alınabilir. Benzer işlem burada örneklem seçiminde de yapılacaktır. Bu kapsamda Microsoft Excel kullanılacaktır. Aşağıdaki excel dokümanını ihtiyacınıza uygun uyarlayarak kolaylıkla uygulayabilirsiniz.

Örnek Olay (Example)

Popülasyon büyüklüğü (N) 850 firma arasından 120 firma (n: örneklem büyüklüğü) tekrarlı basit tesadüfi örnekleme yapılarak örnekleme seçilecektir. Daha sonra örnekleme seçilen bu firmalar üzerinde araştırma yapılacaktır. Bir kez seçilmiş firmalara 1. soru kağıdı, birden fazla seçilmiş firmalara cevaplarının tutarlılığını ölçümlemek için belirli zaman aralıklarıyla 1. soru kağıdı ile birlikte 2. ve 3. soru kağıtları firmaların cevaplaması için gönderilecektir.

Not 1: Örneklem seçimine geçmeden önce elde edilen firma listesinin mükerrer kayıtlardan arındırılması (firmaların benzersiz olması) ve her bir firmaya küçükten büyüğe doğru numara ataması yapılması gerekmektedir.

Not 2: Eğer tabakalı örnekleme yapılacaksa her bir tabaka için örneklem büyüklüğü belirlenmesi gerekir ve her bir tabaka için ayrı ayrı tekrarsız basit tesadüfi örnekleme yapılır. Eğer örneklemde tabaka yoksa 120 firma tekrarsız olarak seçilmesi yeterli olacaktır.

Örnek olayın çözümüne ilişkin ilk uygulama, R programlama dili kullanılarak yapılacaktır.

Çözüm 1: R Kod Bloğu (Solution 1)

#Aşağıda tamsayı bileşenli "sample" fonksiyonu kullanılmıştır. Bunun nedeni Firma sayısının tamsayı olmasıdır. Buna göre firma sayısı 850 olup, 1'den 850'ye kadar numaralandırılmıştır. Fonksiyon içindeki 120, örneklem büyüklüğü (sample size)'dür. Fonksiyon içerisindeki replace= TRUE ise örneklemin tekrarlı olacağı, diğer bir deyişle popülasyondaki firmalara birden fazla seçilme şansı verileceği anlamına gelir. İlaveden sort fonksiyonu ilave edilerek seçilen firmaların küçükten büyüğe doğru sıralanması sağlanmıştır. matrix fonksiyonu ise elde edilen firma numaralarının matris olarak 12 satır ve 10 sütun düzeninde verileceğini gösterir. İlk satırdaki set.seed (sabitleme) fonksiyonu ise her defasında örnekleme seçilen firmaların aynı kalacağı anlamına gelir. Bu fonksiyon duruma göre kullanılabilir de kullanılmayabilir de. Tamamen karar vericiye bağlıdır.

set.seed(123)
orneklem<- matrix(sort(sample.int(850, 120, replace=TRUE)), 12, 10)
orneklem

Çözüm 1‘e ait R kod bloğunun run edilmesiyle elde edilen sonuç aşağıda yer almaktadır.

        [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
 [1,]    1  109  188  279  353  411  518  603  689   767
 [2,]   21  112  197  283  355  416  521  604  691   778
 [3,]   36  118  199  292  370  435  535  613  693   796
 [4,]   39  121  208  300  374  449  545  641  730   800
 [5,]   39  122  210  314  376  463  556  642  751   806
 [6,]   52  126  227  319  382  467  558  645  754   811
 [7,]   80  126  234  323  386  469  559  665  757   812
 [8,]   81  130  245  327  389  477  566  670  757   812
 [9,]   88  149  246  344  397  487  568  671  759   814
[10,]   88  160  257  348  397  498  576  676  760   819
[11,]   95  176  271  350  405  506  588  677  761   838
[12,]  104  184  273  352  407  510  589  680  765   846

Örnek olayın Pyhton programlama dili kullanılarak üretilen çözümü ise aşağıdaki gibi olacaktır.

Çözüm 2: Python Kod Bloğu (Solution 2)

#Örneklemden tesadüfi ve tekrarlı olanı çağrılır.
from random import sample
#Aşağıdaki random.seed fonksiyonu ise her defasında örnekleme seçilen firmaların aynı kalacağı anlamına gelir. Bu fonksiyon duruma göre kullanılabilir de kullanılmayabilir de. Bu durum, tamamen karar vericiye bağlıdır.
import random
random.seed(123)
#Populasyon aralığı belirlenir (1'den 850'ye kadar olan firmalar) 
Populasyon = range(1,851)
#Popülasyondan örnekleme seçilen firmalar belirlenir.
print("Tekrarlı Basit Tesadüfi Örnekleme", random.choices(Populasyon, k=120))

Çözüm 2‘ye ait Python kod bloğunun run edilmesiyle elde edilen sonuç aşağıda yer almaktadır.

Tekrarlı Basit Tesadüfi Örnekleme [45, 75, 347, 92, 767, 33, 456, 283, 725, 136, 287, 284, 209, 2, 371, 75, 508, 60, 269, 382, 770, 79, 121, 672, 19, 775, 488, 226, 713, 654, 292, 682, 176, 518, 449, 688, 268, 339, 654, 436, 583, 543, 567, 757, 414, 569, 319, 28, 642, 155, 698, 777, 560, 145, 287, 333, 63, 389, 488, 286, 161, 75, 535, 11, 300, 195, 453, 616, 773, 543, 844, 820, 536, 199, 412, 151, 844, 378, 639, 38, 115, 165, 218, 300, 232, 370, 358, 93, 54, 302, 76, 369, 8, 456, 63, 591, 344, 838, 224, 402, 639, 285, 297, 544, 825, 752, 357, 611, 578, 317, 200, 67, 748, 49, 441, 457, 125, 558, 779, 660]

Sonuç olarak, yukarıda çözüm 1 veya çözüm 2’ye göre ortaya konulan çıktıdan (output) numaralara karşılık gelen firmalarla araştırmaya başlanır.

Faydalı olması dileğiyle.

Saygılarımla.

Not: Emeğe saygı adına, burda yapılan çalışmanın başka bir mecrada ya da ortamda paylaşılması halinde alındığı yer adının belirtilmesini rica ederim.

Note: In the name of respect for labor, I would kindly request that the name of the place where this work is taken if the work done on this web site is shared in another medium or environment.

Yararlanılan Kaynaklar

https://www.r-project.org/

https://www.python.org/

https://colab.research.google.com (Python)

https://rstudio.cloud/

Önceki yazı Sonraki Yazı
Basit Tesadüfi ÖrneklemeÇıkarımÇıktıHedef PopülasyonOlasılıkOlasılıklı ÖrneklemOlasılıklı ÖrneklemeÖrneklemÖrneklem BüyüklüğüOutputPopülasyonPopülasyon BüyüklüğüPopulation SizeProbability SamplingPytonRrandom.seedReplacementSampleset.seedSimple Random SamplingSortSRSTarget PopulationTekrarlı SeçimWith Replacement

Yorum Yaz Cevabı iptal et

Son Yazılar

  • Kanada Sağlık Sisteminde Bekleme Süreleri
  • Araştırma Metodolojisi Notları-II
  • Araştırma Metodolojisi Notları-I
  • Microsoft Excel’de Bulut Endeks-Beta [BE-β] Simülasyonu
  • R’da Statik ve Dinamik Haritalama Vaka Çalışmaları: Türkiye Örneği

Son Yorumlar

  1. Küresel İnovasyon Endeksi 2021 Yılı Raporu ve Türkiye - winally.com - Küresel İnovasyon Endeksi’nde Türkiye Ne Durumda?
  2. R’da Birliktelik Kuralları | canözkan - Apriori Algoritması Üzerine Bir Vaka Çalışması: A Case Study on Apriori Algorithm
  3. Tevfik BULUT - Python’da Şans Oyunları Perspektifinden Olasılık : Probability from Perspective of the Chance Games in Python
  4. Ahmet Aksoy - Python’da Şans Oyunları Perspektifinden Olasılık : Probability from Perspective of the Chance Games in Python
  5. Tevfik BULUT - Z Tablosuna Göre Güven Aralığının Hesaplanmasına Yönelik Bir Simülasyon Çalışması: A Simulation Study for Calculating Confidence Interval by Z Table

Arşivler

  • Ocak 2023
  • Ekim 2022
  • Eylül 2022
  • Nisan 2022
  • Mart 2022
  • Ekim 2021
  • Eylül 2021
  • Ağustos 2021
  • Temmuz 2021
  • Haziran 2021
  • Mayıs 2021
  • Nisan 2021
  • Şubat 2021
  • Ocak 2021
  • Aralık 2020
  • Kasım 2020
  • Ekim 2020
  • Eylül 2020
  • Ağustos 2020
  • Temmuz 2020
  • Haziran 2020
  • Mayıs 2020
  • Nisan 2020
  • Mart 2020
  • Şubat 2020
  • Ocak 2020
  • Aralık 2019
  • Kasım 2019
  • Ekim 2019
  • Eylül 2019
  • Ağustos 2019
  • Mayıs 2019
  • Şubat 2019
  • Aralık 2018
  • Eylül 2018
  • Ağustos 2018
  • Temmuz 2018
  • Mayıs 2018
  • Nisan 2018
  • Ekim 2017
  • Temmuz 2017
  • Haziran 2017
  • Mayıs 2017
  • Ocak 2017

Kategoriler

  • Genel
  • İstatistik
  • Makine Öğrenme
  • Model Geliştirme
  • Sağlık
  • Teknoloji

Kategoriler

  • Genel
  • İstatistik
  • Makine Öğrenme
  • Model Geliştirme
  • Sağlık
  • Teknoloji

Etiketler

Accuracy Basit Tesadüfi Örnekleme Bernoulli Olasılık Dağılımı Confusion Matrix Coronavirus Doğruluk Doğruluk Oranı Dünya Sağlık Örgütü EDA Epidemi Epidemiyology Epidemiyoloji Exploratory Data Analysis Exploratory Data Analysis (EDA) F1 Forecast Keşifsel Veri Analizi Kitle Olasılık Fonksiyonu Koronavirüs Koronavirüs Salgını Olasılık Olasılıklı Örneklem OSB Pandemi Point Estimation Point Forecast Prevalance Prevalans Probability Sampling R Recall Salgın Sağlık Bakanlığı Simple Random Sampling Tahmin TBATS TURKEY TÜRKİYE Veri Madenciliği WHO World Health Organization Yapay Zeka ÇKKV Örneklem Örneklem Büyüklüğü
Logo

Burada, gazete ve dergilerde yayınlanan çalışmalarımın tamamı çalışmakta olduğum kurumdan bağımsız olarak özel hayatımda yaptığım çalışmalardır. Dolayısıyla, burada yer alan çalışmalardan emeğe saygı adına kaynak gösterilmesi suretiyle azami ölçüde herkes yararlanabilir.

Site Haritası

  • Ana Sayfa
  • Hakkında
  • Blog
  • İletişim

Linkler

  • winally.com

Bana Ulaşın

Bu sayfa, bazı temel bilgilerin ve bir iletişim formunun yer aldığı bir iletişim sayfasıdır. Suç teşkil edecek, yasadışı, tehditkar, rahatsız edici, hakaret ve küfür içeren, aşağılayıcı, küçük düşürücü, kaba, müstehcen, ahlaka aykırı, kişilik haklarına zarar verici ya da benzeri niteliklerde içeriklerden doğan her türlü mali, hukuki, cezai, idari sorumluluk içeriği gönderen Kişilere aittir.

  • Email: buluttevfik@gmail.com

© Copyright 2022 Tevfik Bulut