S
n
=
(1)
dimana :
2
, dengan estimator
variasi dari populasi serta error marginal (tingkat kesalahan marginal) tertentu sebesar . Secara
teoritis formula tersebut digunakan dalam pengambilan sampel dengan pengembalian, sementara
yang digunakan dalam pengambilan sampel tanpa pengembalian diformulasikan sebagai berikut :
2 2
2
2 2 2
2
( 1)
S N
n
N S
=
+
(2)
Dalam berbagai penelitian kebanyakan memakai metode pengambilan sampel tanpa
pengembalian yang tergantung pada jumlah populasi (N). Berdasarkan ada beberapa hal yang
perlu diperhatikan sebelum menggunakan formula tersebut. Pertama adalah jumlah populasi
apakah sangat besar atau tidak karena erat kaitannya dengan Data Besar, misal jumlah populasi
blog buatan Indonesia tahun 2013. Sehingga formula tersebut diturunkan sebagai berikut :
2 2 2 2 2 2 2 2
2 2 2 2
2 2 2 2 2 2 2 2 2
2 2
lim
lim
0 0 ( 1) ( )
lim
N
N
N
N
S S N S S
N
N S N S
N
= = =
+ | | + +
|
|
\
uuur
uuur
uuur
(3)
Dalam hal ini dengan Data Besar, jumlah populasi sedemikian banyak sangat dipengaruhi oleh
distribusi peluang karakteristik, variasi data serta tingkat kesalahan marjinal yang ditentukan,
tetapi dalam hal ini perlu ditinjau ulang mengenai variasi dari populasinya, semakin besar
populasi (Data Besar) akan membuat variasi menjadi homogen sehingga diharapkan estimator
dari variasi sampel dapat mendekati variasi data yang sebenarnya. Penurunan formula tersebut
juga sama untuk formula Isaac-Michael, hanya saja distribusi yang digunakan adalah distribusi
Chi-square dengan derajat kebebasan sebesar 1.
Kedua, menentukan ukuran sampel berdasarkan formula Slovin. Formula ini sangat
sering bahkan menjadi umum digunakan oleh para peneliti untuk mendapatkan ukuran dalam
penelitiannya. Ketika penggunaan tersebut ditelisik lebih jauh, mungkin terdapat beberapa hal
yang perlu diperhatikan mengenai penggunaannya, khususnya untuk Data Besar. Formula Slovin
merupakan formula ukuran sampel yang sangat sederhana tetapi mengandung beberapa hal
didalamnya. Formula Slovin secara umum dinyatakan sebagai berikut :
2
1
N
n
N
=
+
(4)
Berdasarkan formula diatas, terlihat bahwa ukuran sampel dipengaruhi oleh dua hal, yaitu jumlah
populasi serta besarnya kesalahan marjinal yang diinginkan oleh peneliti. Menurut Setiawan
(2007, hal. 7), formula Slovin dapat diuraikan sebagai berikut :
2
2
2
2
2
0,025
2 2
0,025
2
2 2
2
2 2 2
2
. . .(1 )
. . .(1 )
. . .(1 )
. . .(1 )
.1, 96 .0, 5.(1 0, 5)
. 1, 96 .0, 5.(1 0, 5)
.2 .0, 5.(1 0, 5) .4.0, 25
. 2 .0, 5.(1 0, 5) . 4.0, 25
1 .
N Z P P
n
N Z P P
N Z P P
n
N Z P P
N
n
N
N N
n
N N
N
n
N
=
+
=
+
=
+
= =
+ +
=
+
(5)
Dan disimpulkan bahwa formula Slovin hanya dapat dipakai untuk menentukan ukuran
sampel untuk tujuan menduga porporsi populasi. Kemudian asumsi tingkat keandalan formula
Slovin sebesar 95% dengan
=0,0455
2
. Lebih lanjut jika dihadapkan pada Data Besar, formula Slovin dapat diturunkan
sebagai berikut :
2 2 2 2 2
lim
lim 1 1
lim
1 lim (1 ) 0 (1 )
lim
N
N
N
N
N
N
N N
N
N N N
N
= = = =
+ + + | | +
|
\
uuur
uuur
uuur
uuur
uuur
(6)
Dari penurunan tersebut terlihat
bahwa jika formula Slovin digunakan
untuk Data Besar (populasi sangat
besar) maka besarnya ukuran sampel
hanya bergantung pada tingkat
kesalahan marjinal yang ditentukan
oleh peneliti. Dengan memperhatikan
hasil simulasi disamping dapat
diperoleh bahwa ukuran sampel
maksimal yang dapat dihasilkan
formula Slovin adalah 400 untuk dan
batas maksimal jumlah populasi
sebesar 320.000
3
(dengan nilai
=0,05). Angka 400 sebagai angka
ukuran sampel maksimal tersebut didapatkan dengan formula
2
1
= 1/0,05
2
= 400. Hal ini
menunjukkan keandalan formula Slovin tidak serta merta mampu digunakan untuk Data Besar
karena mempunyai kecenderungan menghasilkan ukuran sampel yang stagnan pada angka seper-
kesalahan marjinal. Jikapun digunakan formula Slovin hanya dapat digunakan untuk populasi
berjumlah 320.000.
Ketiga, menentukan ukuran sampel dengan formula Isaac-Michael. Sebenarnya formula
Isaac-Michael sama dengan metode berdasarkan presisi, hanya saja Isaac-Michael menggunakan
2
Spiegel, Murray, Schiller, John and Srinivasan, R.Alu. 2002. Schaums Outlines, Probabilitas dan Statistik Edisi
kedua [alih bahasa oleh Refina Indriasari]. Hal. 167.
3
Berdasarkan perhitungan manual dengan bantuan Excell.
No N n n/N
1 10 10 0.98
2 30 28 0.93
3 70 60 0.85
4 150 109 0.73
5 400 200 0.50
6 1000 286 0.29
7 10000 385 0.04
8 100000 398 0.00
9 1000000 400 0.00
10 10000000 400 0.00
11 100000000 400 0.00
12 1000000000 400 0.00
13 10000000000 400 0.00
14 1E+11 400 0.00
15 1E+12 400 0.00
16 1E+17 400 0.00
distribusi Chi-square berderajat 1 dalam perhitungannya dan secara sistematis dituliskan sebagai
berikut :
2
(1)
2 2
( ,1)
2
(1)
2 2
(1)
2
2 2
2
2 2 2
2
. . .(1 )
. . .(1 )
. . .(1 )
. . .(1 )
.2 .0, 5.(1 0, 5)
. 2 .0, 5.(1 0, 5)
.2 .0, 5.(1 0, 5) .4.0, 25
. 2 .0, 5.(1 0, 5) . 4.0, 25
1 .
N P P
n
N P P
N P P
n
N P P
N
n
N
N N
n
N N
N
n
N
=
+
=
+
=
+
= =
+ +
=
+
(7)
Kesamaan ini didapatkan ketika menggunakan tingkat kepercayaan 82,34%
4
Chi-square
berderajat 1 dengan
=
+
(8)
4
Hasil ini didapatkan dengan metode interpolasi antara Chi-square denga tingkat signifikansi 75% dan Chi-square
dengan tingkat signifikansi 90% pada derajat 1.
Dan dalam penelitian Sharafat (2013), menggunakan formula Newbold yang termodifikasi
menjadi sebagai berikut :
/2
2
2
/ 2
2
. .
. . .
Z p q
n
N Z p q
N
| |
|
\
=
| |
( +
|
|
\
(9)
Untuk melihat keandalan formula tersebut jika digunakan untuk Data Besar, maka diturunkan
sebagai berikut :
2 2 2
2 2
2 2
2
2
2 2
2
2
lim . .(1 )
lim . .(1 ) . .(1 )
lim
( 1) .(1 )
lim [( 1) .(1 )] [( 1) .(1 )]
lim
. .(1 )
.(1 )
0 0
N
N
N
px
N
N
N
p p
N p p N p p
N
N p p
N p p N p p
Z Z
N
Z p p
p p
Z
= =
+
+ +
= =
+ +
uuur
uuur
uuur
uuur
uuur
(10.1)
Dan formula termodifikasi diturunkan sebagai berikut :
2 2 / 2
2
2 2
2
2 2 2 2
/ 2
2 2 2
2
2
. .(1 )
. . .(1 ) lim . . .(1 )
lim lim
. . .(1 )
. . .(1 ) lim . . .(1 )
lim . . .(1 )
.
lim
N
N N
N
N
N
Z p p
Z N p p Z N p p
N Z p p
N Z p p N Z p p
N
N
Z p p
N
N
| |
|
\
= =
| | ( ( ( +
+ +
( ( |
|
\
=
uuur
uuur uuur
uuur
uuur
uuur
2
2
2
2 2
2
. .(1 )
. .(1 )
Z p p
Z p p
N
=
(
+
(
(10.2)
Berdasarkan hasil kedua formula tersebut, terlihat keduanya bergantung pada komponen yang
sama bila digunakan untuk Data Besar. Secara umum, formula tersebut digunakan dalam
penelitian untuk menduga besarnya proporsi populasi.
Dari keseluruhan formula yang digunakan untuk menentukan ukuran sampel, terlihat
semakin banyak jumlah populasi (N) keandalan formula tersebut semakin berkurang. Hal
tersebut tampak dari jumlah sampel yang dihasilkan stagnan pada jumlah tertentu saja dengan
kendala distribusi yang ditentukan, tingkat kesalahan marjinal, serta terhadap proporsi. Namun,
hal ini tidak serta merta bahwa sampel kurang mewakili terhadap populasi, melainkan ukuran
sampel maksimal tersebut memang sudah cukup dengan pertimbangan lain termasuk biaya
penelitian serta diharapakan sudah mencakup keseluruhan informasi dari populasi meskipun
jumlahnya besar.
Terlihat pula, semakin banyak asumsi yang digunakan dalam suatu formula ukuran
sampel menunjukkan ketidakmampuan formula tersebut untuk menangkap elemen lain yang
dalam populasi, misalnya karena varian populasi sebenarnya tidak diketahui, rerata sebenarnya
tidak diketahui atau hanya untuk aspek kemudahan serta biaya yang ekonomis. Selain itu,
semakin sederhana formula tersebut juga menjelaskan sejumlah asumsi yang harus dipenuhi dan
diperhatikan sehingga berguna sebagai informasi awal untuk keputusan penggunaan formula
ukuran sampel tertentu.