Basit tesadüfi örnekleme, popülasyondaki birimlerinden örnekleme seçilme olasılığı bilinen ve seçilme olasılığı sıfır olmayan örnekleme türüdür. Bu örnekleme türü aynı zamanda olasılıklı örnekleme tekniklerinden biri olup, popülasyon hakkında çıkarımsal (inferential) istatistikler ortaya koymaya ve örneklemden elde edilen bulguların hedef popülasyona genellebilmesine olanak tanır.
Basit tesadüfi örnekleme, tekrarlı (popülasyondaki birimlerin eşit ve birden fazla seçilme olasılığı) ve varsayımsal bir örnek üzerinden uygulamalı olarak gösterilecektir. Tekrarlı seçilme olasılığı, topların olduğu torbadan seçilmiş bir topun tekrar torbanın içine atılarak tekrar seçilme olasılığının tanındığı bir olasılık tekniği olarak ele alınabilir. Benzer işlem burada örneklem seçiminde de yapılacaktır. Bu kapsamda Microsoft Excel kullanılacaktır. Aşağıdaki excel dokümanını ihtiyacınıza uygun uyarlayarak kolaylıkla uygulayabilirsiniz.
Örnek Olay (Example)
Popülasyon büyüklüğü (N) 850 firma arasından 120 firma (n: örneklem büyüklüğü) tekrarlı basit tesadüfi örnekleme yapılarak örnekleme seçilecektir. Daha sonra örnekleme seçilen bu firmalar üzerinde araştırma yapılacaktır. Bir kez seçilmiş firmalara 1. soru kağıdı, birden fazla seçilmiş firmalara cevaplarının tutarlılığını ölçümlemek için belirli zaman aralıklarıyla 1. soru kağıdı ile birlikte 2. ve 3. soru kağıtları firmaların cevaplaması için gönderilecektir.
Not 1: Örneklem seçimine geçmeden önce elde edilen firma listesinin mükerrer kayıtlardan arındırılması (firmaların benzersiz olması) ve her bir firmaya küçükten büyüğe doğru numara ataması yapılması gerekmektedir.
Not 2: Eğer tabakalı örnekleme yapılacaksa her bir tabaka için örneklem büyüklüğü belirlenmesi gerekir ve her bir tabaka için ayrı ayrı tekrarsız basit tesadüfi örnekleme yapılır. Eğer örneklemde tabaka yoksa 120 firma tekrarsız olarak seçilmesi yeterli olacaktır.
Örnek olayın çözümüne ilişkin ilk uygulama, R programlama dili kullanılarak yapılacaktır.
Çözüm 1: R Kod Bloğu (Solution 1)
#Aşağıda tamsayı bileşenli "sample" fonksiyonu kullanılmıştır. Bunun nedeni Firma sayısının tamsayı olmasıdır. Buna göre firma sayısı 850 olup, 1'den 850'ye kadar numaralandırılmıştır. Fonksiyon içindeki 120, örneklem büyüklüğü (sample size)'dür. Fonksiyon içerisindeki replace= TRUE ise örneklemin tekrarlı olacağı, diğer bir deyişle popülasyondaki firmalara birden fazla seçilme şansı verileceği anlamına gelir. İlaveden sort fonksiyonu ilave edilerek seçilen firmaların küçükten büyüğe doğru sıralanması sağlanmıştır. matrix fonksiyonu ise elde edilen firma numaralarının matris olarak 12 satır ve 10 sütun düzeninde verileceğini gösterir. İlk satırdaki set.seed (sabitleme) fonksiyonu ise her defasında örnekleme seçilen firmaların aynı kalacağı anlamına gelir. Bu fonksiyon duruma göre kullanılabilir de kullanılmayabilir de. Tamamen karar vericiye bağlıdır.
set.seed(123)
orneklem<- matrix(sort(sample.int(850, 120, replace=TRUE)), 12, 10)
orneklem
Çözüm 1‘e ait R kod bloğunun run edilmesiyle elde edilen sonuç aşağıda yer almaktadır.
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,] 1 109 188 279 353 411 518 603 689 767
[2,] 21 112 197 283 355 416 521 604 691 778
[3,] 36 118 199 292 370 435 535 613 693 796
[4,] 39 121 208 300 374 449 545 641 730 800
[5,] 39 122 210 314 376 463 556 642 751 806
[6,] 52 126 227 319 382 467 558 645 754 811
[7,] 80 126 234 323 386 469 559 665 757 812
[8,] 81 130 245 327 389 477 566 670 757 812
[9,] 88 149 246 344 397 487 568 671 759 814
[10,] 88 160 257 348 397 498 576 676 760 819
[11,] 95 176 271 350 405 506 588 677 761 838
[12,] 104 184 273 352 407 510 589 680 765 846
Örnek olayın Pyhton programlama dili kullanılarak üretilen çözümü ise aşağıdaki gibi olacaktır.
Çözüm 2: Python Kod Bloğu (Solution 2)
#Örneklemden tesadüfi ve tekrarlı olanı çağrılır.
from random import sample
#Aşağıdaki random.seed fonksiyonu ise her defasında örnekleme seçilen firmaların aynı kalacağı anlamına gelir. Bu fonksiyon duruma göre kullanılabilir de kullanılmayabilir de. Bu durum, tamamen karar vericiye bağlıdır.
import random
random.seed(123)
#Populasyon aralığı belirlenir (1'den 850'ye kadar olan firmalar)
Populasyon = range(1,851)
#Popülasyondan örnekleme seçilen firmalar belirlenir.
print("Tekrarlı Basit Tesadüfi Örnekleme", random.choices(Populasyon, k=120))
Çözüm 2‘ye ait Python kod bloğunun run edilmesiyle elde edilen sonuç aşağıda yer almaktadır.
Tekrarlı Basit Tesadüfi Örnekleme [45, 75, 347, 92, 767, 33, 456, 283, 725, 136, 287, 284, 209, 2, 371, 75, 508, 60, 269, 382, 770, 79, 121, 672, 19, 775, 488, 226, 713, 654, 292, 682, 176, 518, 449, 688, 268, 339, 654, 436, 583, 543, 567, 757, 414, 569, 319, 28, 642, 155, 698, 777, 560, 145, 287, 333, 63, 389, 488, 286, 161, 75, 535, 11, 300, 195, 453, 616, 773, 543, 844, 820, 536, 199, 412, 151, 844, 378, 639, 38, 115, 165, 218, 300, 232, 370, 358, 93, 54, 302, 76, 369, 8, 456, 63, 591, 344, 838, 224, 402, 639, 285, 297, 544, 825, 752, 357, 611, 578, 317, 200, 67, 748, 49, 441, 457, 125, 558, 779, 660]
Sonuç olarak, yukarıda çözüm 1 veya çözüm 2’ye göre ortaya konulan çıktıdan (output) numaralara karşılık gelen firmalarla araştırmaya başlanır.
Faydalı olması dileğiyle.
Saygılarımla.
Not: Emeğe saygı adına, burda yapılan çalışmanın başka bir mecrada ya da ortamda paylaşılması halinde alındığı yer adının belirtilmesini rica ederim.
Note: In the name of respect for labor, I would kindly request that the name of the place where this work is taken if the work done on this web site is shared in another medium or environment.
Yararlanılan Kaynaklar
https://www.r-project.org/
https://www.python.org/
https://colab.research.google.com (Python)
https://rstudio.cloud/