ILMIAH
Dalam metode statistic telah dikembangkan untuk mengumpulkan
data secara acak, namun tetap relevan dengan pertanyaan khusus yang
kita inginkan. Kesimpulan selalu bergabung pada model probabilitas yang
kita asumsikan benar. Ketika data tidak dikumpulkan secar acak, maka
terdapat resiko bahwa pola yang diamati menjadi lurking variable dan
bukan cerminan sejati dari pola yang mendasarinya.
Pada gambar 2.2 kita melihat empat treatmen grup memiliki kisaran
yang sama unit eksperimental. Nilai yang diharapkan dari lurking
variabel adalah sama untuk setiap grup. Rata-rata dari lurking variabel
dari setiap grup mendekati nilai rata-rata dari populasi karena angka
pengacakan saling bebas itu besar.
Randomized Block design
Peneliti mengelompokkan unit grup menjadi blok yang mengandung
unit yang mirip. Orang mungkin berpikir bahwa penilaian tentang
menugaskan unit ekperimental untuk kelompok yang diamati dan
kelompok kontrol akan menyebabkan kisaran unit yang mirip yang
diberikan kepada kedua kelompok.
BAB 3
MENAMPILKAN DAN
MERINGKAS DATA
Kita menggunakan metode statistik untuk mengekstrak informasi dari
data dan memperoleh wawasan menuju proses dasar yang menghasilkan
data. Sering kali set data terdiri dari pengukuran dari satu atau lebih
variabel atas unit eksperimental satau atau lebih sampel. Distribusi dari
sample akan memberikan kita wawasan dari distribusi populasi.
Alat untuk analisis data standar
n+1
2 ]. Ketika n adalah ganjil
y
[ ]
n+ 1 1
1
= .y n + . yn
2
2 |2| 2 |2 +1| . Median juga diketahui
Q 1= y
n+ 1
]
4
Q 3= y
3 (n +1)
]
4
Gambar 3.2 adalah boxplot dari table 3.1. Terlihat bahwa distribusi
data cukup simetris tetapi dengan ekor bawah sedikit panjang.
digit pertama dari setiap data item, dan daun merepresentasikan digit
selanjutnya. Langkahnya adalah
Gambar 3.3 adalah diagram batang daun dari pengukuran table 3.1
dan Q1
X 29+1 = X 7
4
1
2
1
1
Q 1= . X 7 + . X 8
2
2
X 29+1 = X 15
2
adalah 5,46
adalah 5,295.
Untuk mendapatkan median, naik hingga 50% pada sumbu vertical dan
tarik garis horizontal untuk polygon frekuensi kumulaif dan garis vertical
hingga sumbu horizontal. Begitupun untuk kuartil pertama dan kuartil
ketiga.
1
1
y = x y i= x ( y 1 ++ y n)
n i=1
n
y i=ui +v i+wi
Contoh
y =u + v + w
y =
n
1
n j x m j= j x m j
n h=1
h=1 n
xk =
i=k+1
x0
n2k
n
2
n2
2
, kemudian
xk
kemudian
xk
R= y [ n] y [1]
Observasi yang terbesar dan terkecil paling mungkin menjadi outliers.
Maka range sangat terpengaruh dengan outliers
Interquartil Range Keuntungan dan Kerugian
IQR=Q3Q1
Interquartil range tidak terpengaruh oleh outlier. Tetapi tidak
digunakan dalam kesimpulan karena seperti median yang peka
terhadap penambahan jumlah.
Variansi : Keuntungan dan Kerugian
n
1
Var ( y )= x ( y i y )2
n i=1
Rata-rata dari kuadrat deviasi dari mean, sangat dipengaruhi oleh
outliers. Variansi memilih sifat matematika yang baik dan
penggabungan yang baik, tetapi itu adalah unit kuadrat dan tidak
langsung dibandingkan dengan mean.
Menghitung Variansi untuk Data Berkelompok
Untuk data yang dalam bentuk table frekuensi, kita hanya mengetahui
batas setiap pengamatan, kita tidak memiliki nilai yang actual. Berikut
dua asumsi yang dapat dibuat dari nilai actual:
1. Semua nilai dalam kelompok terletak di titik tengah kelompok
2. Semua nilai dalam kelompok secara merata tersebar di
kelompok
Dari asumsi diatas didapatkan
J
Var ( y )=
1
2
n j x (m j y )
n j=1
Dibalik asumsi kedua, kita tambahkan dalam variasi setiap grup untuk
mendapatkan formula
nj
1
Vary ( y )=
n j=1
Dimana Rj adalah batas atas dikurang batas bawa dari kelompok ke-j.
Standar Deviasi : Keuntungan dan Kerugian
sd ( y )=
1
x ( y y )2
n i=1 i
Contoh diatas adalah scatter plot dari panjang kepala dan lebar kepala
dari beruang. Dari plot diatas, terlihat beruang dengan lebar kepala
yang besar cenderung memiliki kepala yang panjang. Kita juga dapat
melihat beruang jantan cenderung memiliki kepala lebih besar
daripada beruang betina.
Scatterplot Matrix
Untuk menyelidiki hubungan antara variabel-variabe (data multivariat),
bentuklah scatterplot matriks. Kita membangun scatterplot untuk
setiap variabel yang berpasangan kemudian tunjukkan dalam bentuk
array seperti matriks.
Cov ( x , y )=
1
( x x ) ( y i y )
n i=1 i
Corr ( x , y )=
Cov ( x , y )
Var ( x ) x Var ( y)