Contents
BAB CENTRAL LIMIT THEOREM....................................................................................................................1
A. Pendahuluan....................................................................................................................................1
B. Distribusi Sampling Rata-Rata........................................................................................................3
C. Sifat-sifat Teorema Limit Pusat :.....................................................................................................4
D. Ukuran sampel dan teorema limit sentral.........................................................................................5
E. Pentingnya teorema limit sentral......................................................................................................6
F. Penggunaan Teorema Limit Pusat...................................................................................................7
G. Gambar penjelasan CLT................................................................................................................10
A. Pendahuluan
Teorema adalah sebuah pernyataan, sering dinyatakan dalam bahasa alami, yang dapat dibuktikan atas
dasar asumsi yang dinyatakan secara eksplisit ataupun yang sebelumnya disetujui. Teorema limit pusat
(“central limit theorem”) (CLT) adalah teori paling mendasar dalam statistika modern. Dengan teorema
limit sentral, uji parametrik memiliki kekuatan statistik yang lebih tinggi daripada uji nonparametrik,
yang tidak memerlukan asumsi distribusi probabilitas[1]. Saat ini, beberapa tes parametrik digunakan
untuk menilai validitas statistik studi klinis yang dilakukan oleh peneliti medis; namun, sebagian besar
peneliti tidak mengetahui nilai teorema limit pusat, meskipun mereka menggunakan uji parametrik
secara rutin. Dengan demikian, peneliti klinis akan mendapat manfaat dengan mengetahui apa itu
teorema limit sentral dan bagaimana hal itu menjadi dasar untuk uji parametrik.
Definisi : Teorema limit pusat (“central limit theorem”) adalah sebuah teorema yang menyatakan bahwa
kurva distribusi sampling (untuk ukuran sampel 30 atau lebih) akan berpusat pada nilai parameter
populasi dan akan memiliki semua sifat-sifat distribusi normal.
1
Distribusi normal mempunyai beberapa sifat dan ciri, yaitu: Kurva distribusi normal mempunyai satu
puncak (uni-modal) Kurva berbentuk simetris dan menyerupai lonceng hingga mean, median dan modus
terletak pada satu titik. Kurva normal dibentuk dengan n yang tak terhingga.
Pembuktian teorema limit sentral akan dijelaskan, dengan konsep matematika yang diperlukan
(misalnya, fungsi pembangkit momen dan rumus Taylor) yang diperlukan untuk memahami
pembuktiannya. Teorema adalah konsep kunci dalam teori probabilitas karena menyiratkan bahwa
probabilistik dan metode statistik yang bekerja untuk distribusi normal dapat diterapkan pada banyak
masalah melibatkan jenis distribusi lainnya[1].
Teorema limit sentral bergantung pada konsep distribusi sampling, yang merupakan distribusi
probabilitas statistik untuk sejumlah besar sampel yang diambil dari suatu populasi.
Teorema limit pusat menyatakan bahwa jika beberapa kondisi tertentu terpenuhi, maka distribusi
mean dari sejumlah variabel random independen mendekati distribusi normal dengan jumlah sampel
mendekati tak terhingga. jika ukuran sampel semakin besar, maka sifat dari rata-rata distribusi peluang
sampelnya (sample mean distribution) akan semakin mendekati distribusi normal.
Misalkan Anda mengambil sampel acak dari suatu populasi dan menghitung statistik untuk sampel
tersebut, seperti rata-rata.
2
Sekarang Anda mengambil sampel acak lain dengan ukuran yang sama, dan menghitung rata-rata lagi.
Anda mengulangi proses ini berkali-kali, dan berakhir dengan banyak cara, satu untuk setiap sampel.
Teorema limit sentral menyatakan bahwa distribusi sampling dari rata-rata akan selalu berdistribusi
normal, selama ukuran sampel cukup besar. Terlepas dari apakah populasi memiliki distribusi normal,
Poisson, binomial, atau lainnya, distribusi sampling rata-rata akan normal.
Misalkan seorang peneliti memilih sampel 30 laki-laki dewasa dan menemukan rata-rata ukuran
kadar trigliserida untuk subjek sampel menjadi 187 miligram / desiliter. Kemudian menganggap sampel
kedua dipilih, dan rata-rata sampel tersebut adalah 192 miligram / desiliter. Maka dilanjutkan untuk 100
sampel. Kemudian mean menjadi variabel acak, dan mean sampel 187, 192, 184,. . . , 196 merupakan
distribusi sampling rata-rata.
Distribusi sampling rata-rata adalah distribusi menggunakan rata-rata yang dihitung dari semua
sampel acak yang mungkin dengan ukuran tertentu yang diambil dari suatu populasi.
Jika sampel dipilih secara acak dengan pengembalian, sebagian besar mean sampel akan berbeda dari
mean populasi (μ). Perbedaan ini disebabkan oleh kesalahan pengambilan sampel. Sampling
error adalah perbedaan antara ukuran sampel dan ukuran populasi yang sesuai fakta bahwa sampel
bukanlah representasi yang sempurna dari populasi.
Ketika semua kemungkinan sampel dengan ukuran tertentu dipilih dengan pengembalian dari
populasi, distribusi sampling rata-rata untuk variabel memiliki dua sifat penting yaitu :
2. Standar deviasi mean sampel akan lebih kecil daripada standar deviasi populasi, dan akan sama
dengan standar deviasi populasi dibagi dengan akar kuadrat ukuran sampel.
Dasar dari Random Sampling adalah Teorema Limit Pusat. Teorema Limit Pusat adalah sebuah teori
statistik di mana jika diambil banyak sampel dari sebuah populasi dengan variansi data yang berhingga
(finite), mean dari sampel yang diambil pada populasi yang sama akan sesuai dengan mean dari
populasi. Teorema Limit Pusat menunjukkan bahwa semakin bertambahnya jumlah sampel yang diambil
secara acak, maka distribusi kemungkinan letak nilai mean dari sampel tersebut akan mengikuti
distribusi normal.
Teorema limit pusat (“central limit theorem”) adalah sebuah teorema yang menyatakan bahwa kurva
distribusi sampling (untuk ukuran sampel 30 atau lebih) akan berpusat pada nilai parameter populasi
dan akan memiliki semua sifat-sifat distribusi normal.
3
Asumsi distribusi normal dapat kita pakai ketika jumlah sampel yang diambil sudah mencapai batas
nilai tertentu. Jika distribusi normal dapat dicapai dengan sampel yang kita ambil, maka persamaan-
Sx = σx / √n
Keterangan :
σx = standard deviasi
moe = z(Sx)
Keterangan :
1. Bentuk distribusi dari rata-rata sampel akan mendekati distribusi normal meskipun
distribusi populasi tidak normal
3. Standar deviasi dari rata-rata sampel sama dengan standar deviasi populasi (σ) dibagi
dengan akar jumlah sampel. Dikenal dengan istilah Standar Error (SE) = σx / √n
Jika X adalah mean dari sampel acak berukuran n yang diambil dari populasi dengan mean µ
dan variansi σ2, maka batasan bentuk sebaran adalah sebagai berikut :
4
karena n → ∞ adalah distribusi normal standar n (z; 0, 1)
Sumber :
Bluman, Allan G. 2009. Elementary Statistics: A Step by Step Approach. New York: The
McGraw-Hill Companies, Inc.
Matodang, Josef. 2019. Statistika 101: Ukuran Sampel Untuk Data Proporsi.
https://josefmtd.com/tag/central-limit-theorem/ (diakses pada 24 Oktober 2020)
Ukuran sampel (n) adalah jumlah pengamatan yang diambil dari populasi untuk setiap sampel.
Ukuran sampel sama untuk semua sampel.
Semakin besar ukuran sampel, semakin dekat distribusi sampling akan mengikuti distribusi
normal.
Ketika ukuran sampel kecil, distribusi rata-rata sampling kadang-kadang tidak normal. Itu karena
teorema limit sentral hanya berlaku ketika ukuran sampel "cukup besar".
Ketika n < 30, teorema limit pusat tidak berlaku. Distribusi sampling akan mengikuti distribusi
yang mirip dengan populasi. Oleh karena itu, distribusi sampling hanya akan normal jika
populasinya normal.
5
Ketika n ≥ 30, berlaku teorema limit sentral. Distribusi sampling kira-kira akan mengikuti
distribusi normal.
Ukuran sampel mempengaruhi standar deviasi dari distribusi sampling. Standar deviasi adalah
ukuran variabilitas atau penyebaran distribusi (yaitu, seberapa lebar atau sempitnya).
Ketika n rendah, standar deviasi tinggi. Ada banyak penyebaran dalam rata-rata sampel karena
itu bukan perkiraan yang tepat dari rata-rata populasi.
Ketika n tinggi, standar deviasi rendah. Tidak banyak penyebaran dalam rata-rata sampel karena
itu adalah perkiraan yang tepat dari rata-rata populasi.
Teorema limit sentral menyatakan bahwa distribusi sampling rata-rata akan selalu mengikuti
distribusi normal dalam kondisi berikut:
Ukuran sampel cukup besar. Kondisi ini biasanya terpenuhi jika ukuran sampel n ≥ 30.
Sampel adalah variabel acak independen dan terdistribusi secara identik (i.i.d.). Kondisi ini
biasanya terpenuhi jika pengambilan sampel dilakukan secara acak.
Distribusi populasi memiliki varians yang terbatas. Teorema limit sentral tidak berlaku untuk
distribusi dengan varian tak terhingga, seperti distribusi Cauchy. Sebagian besar distribusi
memiliki varian yang terbatas.
Teorema limit pusat adalah salah satu teorema statistik yang paling mendasar. Faktanya,
"sentral" dalam "teorema limit pusat" mengacu pada pentingnya teorema tersebut.
Catatan
Uji parametrik, seperti uji t, ANOVA, dan regresi linier, memiliki kekuatan statistik lebih besar
daripada sebagian besar uji nonparametrik. Kekuatan statistik mereka berasal dari asumsi tentang
distribusi populasi yang didasarkan pada teorema limit sentral.
6
Menerapkan teorema limit pusat ke distribusi nyata dapat membantu Anda untuk lebih
memahami cara kerjanya.
Teorema Limit Pusat menyatakan bahwa tidak peduli bagaimana distribusi populasi jika saya
mengambil sampel acak dalam jumlah yang cukup besar (sampel1, sampel2, sampel3, sampel4
dan seterusnya...) dari populasi dan mencoba menghitung rata-rata sampel dan coba diplot maka
distribusi sampling rata-rata sampel akan berdistribusi normal.
1. Dari semua sampel jika kita mengambil rata-rata maka rata-rata itu akan mewakili rata-
rata populasi.
2. Simpangan baku rata-rata sampel sama dengan kesalahan baku rata-rata populasi.
Asumsi CLT
1. Data harus mengikuti syarat pengacakan itu harus diambil sampelnya secara acak.
3. Ukuran sampel tidak boleh lebih dari 10% dari populasi bila pengambilan sampel
dilakukan tanpa penggantian.
Misalkan kita harus menghitung tinggi rata-rata siswa dari 100 sekolah yang berbeda dan di
setiap sekolah jumlah siswa adalah 2k hingga 3k jadi pergi ke setiap sekolah dan menghitung
tinggi badan setiap individu itu sulit jadi ide terbaik dalam hal ini adalah dengan menggunakan
CLT alias Central Limit Theorem untuk memudahkan perhitungan karena dengan menggunakan
CLT kita tahu bahwa rata-rata sampel akan mendekati rata-rata populasi seiring bertambahnya
ukuran sampel sehingga tinggi rata-rata sampel akan sama atau mendekati rata-rata populasi
tinggi. Jadi jika kita tidak mengetahui rata-rata populasi dengan bantuan CLT, kita dapat
memperkirakannya dengan bantuan rata-rata sampel.
CLT berlaku untuk jumlah sampel yang cukup besar (n >= 30). Rumus untuk CLT dapat
dinyatakan sebagai berikut;
7
Standar deviasi adalah salah satu nilai statistik yang digunakan untuk menentukan bagaimana
persebaran data dalam suatu sampel, dan seberapa dekat elemen data-data yang ada dengan mean
dari sampel tersebut.
Dalam pemakaiannya, standar deviasi berfungsi untuk menentukan seberapa heterogen elemen
data yang terdapat dalam sebuah data. Semakin besar selisihnya dengan mean, semakin
heterogen data yang terdapat dalam populasi/sampel.
Contoh
Distribusi diskrit
Sekitar 10% orang kidal. Jika kita menetapkan nilai 1 untuk kidal dan nilai 0 untuk kidal,
distribusi probabilitas kidal untuk populasi semua manusia terlihat seperti ini:
1. Dalam proses ini Anda mengambil sampel acak dari lima orang dan menanyakan apakah
mereka kidal.
8
2. Rata-rata populasi adalah proporsi orang yang kidal (0,1). Deviasi standar populasi
adalah 0,3.
3. Bayangkan Anda mengulangi proses ini 10 kali, mengambil sampel lima orang secara
acak dan menghitung rata-rata sampel. Ini adalah distribusi sampling rata-rata.
0+0+0+ 0+1
Rata-rata adalah;
(0 + 0 + 0 + 0 + 1) /5 = 0.2
Jika Anda mengulangi proses ini berkali-kali, distribusi akan terlihat seperti ini:
Distribusi sampling tidak berdistribusi normal karena ukuran sampel tidak cukup besar untuk
menerapkan teorema limit pusat.
9
Saat ukuran sampel meningkat, distribusi sampling terlihat semakin mirip dengan distribusi
normal, dan penyebarannya menurun:
Selanjutnya;
Distribusi sampling mean untuk sampel dengan n = 30 mendekati normalitas. Ketika ukuran
sampel dinaikkan menjadi n = 100, distribusi sampling mengikuti distribusi normal.
Kita dapat menggunakan rumus teorema limit pusat untuk menggambarkan distribusi sampling
untuk n = 100.
µ = 0.1
σ = 0.3
10
n = 100
11
Perhatikan bahwa, saat sampel diambil dari populasi berdistribusi normal, distribusi
sampling dari rata-rata sampel juga berdistribusi normal terlepas dari ukuran
sampelnya (bahkan untuk sampel kecil). Untuk distribusi yang tidak simetris atau
normal, distribusi sampling-nya adalah menceng (skewed) untuk sampel kecil, tetapi
untuk n = 25, distribusi sampling-nya mendekati atau hampir simetris (normal).
Contoh 1:
Misalkan sampel acak berukuran n = 25, 50, dan 100 diambil dari populasi yang
sehingga P(a≤X≤b)=0.95
12
Pembahasan:
Dari Teorema Limit Pusat, kita tahu bahwa distribusi akan mendekati normal dengan
13
Karena Z=√n (x−μ)/σ akan mempunyai distribusi yang mendekati distribusi normal
bahwa P(−1.96≤Z≤1.96)=0.95
Ini
Tabel berikut memberikan interval untuk ukuran sampel yang berbeda. Perhatikan
(Anda dapat mengamati Gambar 1 di atas sebagai contoh). Akibatnya, interval (a,b)
14
Video CLT
https://www.youtube.com/watch?v=eQde8nDeE50
15