Anda di halaman 1dari 33

4.

Ukuran Keragaman

Kuswanto, 2020
Ukuran keragaman
 Dari tiga ukuran pemusatan, belum dapat memberikan
deskripsi yang lengkap bagi suatu data.
 Perlu juga diketahui seberapa jauh pengamatan-
pengamatan tersebut menyebar dari rata-ratanya.
 Ada kemungkinan diperoleh rata-rata dan median yang
sama, namun berbeda keragamannya.
 Beberapa ukuran keragaman yang sering kita temui
adalah range (rentang=kisaran=wilayah), simpangan
(deviasi), varian (ragam), simpangan baku (standar
deviasi) dan koefisien keragaman.
Measures of Dispersion and Variability

These are measurements of how spread the


data is around the center of the distribution
f

X X
1. Range  Kisaran = Rentang
 Merupakan selisih (beda) nilai pengamatan dari
data terbesar dan terkecil. Tanpa satuan.
 Penggunaan yang paling sering adalah dalam
statistika pengendalian mutu.
 Misal, bobot dari 8 buah semangka adalah (kg) 4,2;
4,1; 4,0; 3,9; 4,1; 3,8; 4,0 dan 4,5, maka Range
data (R) adalah 4,5 - 3,8 = 0,7 kg.
 Tidak ada informasi lain dari ukuran sebaran ini.
 Namun demikian dalam pengendalian mutu
barang, range sangat membantu.
Contoh Pemanfaatan Range
 Penentuan grade atau ukuran umbi kentang
bisa dikelompok menjadi 2 atau 3 kelas
berdasarkan ukuran umbi.
 Karena range antara umbi kecil dan besar
sangat jauh, maka kualitas umbi perlu dibagi
menjadi kelas A, B dan C.
 Kelas A adalah umbi yang mempunyai ukuran
besar, kelas B adalah umbi yang mempunyai
ukuran sedang dan kelas C adalah umbi yang
mempunyai ukuran kecil.
2. SIMPANGAN
 Simpangan atau deviasi merupakan posisi relatif
setiap nilai pengamatan terhadap nilai reratanya.
 Simpangan setiap data bisa positip atau negatif,
namun jumlah nilai simpangan satu gugus data akan
selalu nol.
 Semua angka yang lebih tinggi dari rerata akan
mempunyai simpangan positif dan semua angka yang
lebih kecil dari rerata akan mempunyai simpangan
negatif.
 Kurang efisien apabila datanya cukup besar, karena
penyajian dalam bentuk tabel simpangan
Contoh
 Misal, jumlah buku tulis yang dibawa 5 mahasiswa adalah 3, 5, 7, 7,
8. Rerata (mean) data tersebut adalah 30/5 = 6. Simpangan
dihitung dg mengurangi setiap nilai pengamatan dengan reratanya

No. Nilai Simpangan Simpangan kuadrat


observasi (x - x) (x - x)2
1 3 3-6 = -3 9
2 5 5-6 = -1 1
3 7 7-6 = 1 1
4 7 7-6 = 1 1
5 8 8-6 = 2 4
Jumlah 0 16
Agar nilainya tidak negatip, dapat di kuadratkan yang
kemudian
disebut simpangan kuadrat.
Simpangan kuadrat bermanfaat untuk penghitungan varian.
3. Simpangan Rerata (Mean Deviation)

Nilai simpangan dibagi rerata =  | Xi - X |


n
Dari Tabel sebelumnya diperoleh :

No. Nilai observasi Simpangan Simpangan rerata


(x - x) (x - x)/n

1 3 3-6 = -3 (3-6)/5 = -3/5


2 5 5-6 = -1 (5-6)/5 = -1/5
3 7 7-6 = 1 (7-6)/5 = 1/5
4 7 7-6 = 1 (7-6)/5 = 1/5
5 8 8-6 = 2 (8-6)/5 = 2/5
Jumlah 0 0
4. VARIAN (RAGAM)
 Dalam prakteknya, simpangan jarang digunakan
karena sulit dimanipulasi secara matematis.
 Sebagai gantinya diperlukan kuadrat semua
simpangan tersebut kemudian dibagi derajad
bebas n-1, dan disebut dengan varian (ragam)
 Digunakan pembagi n-1 agar menjadi penduga
tak bias.
 Ragam populasi dilambangkan dengan σ²,
sedang ragam contoh dilambangkan dengan s2,
RUMUS VARIAN

(xi - x)2  xi2 - ( xi)2/n


s2 = ---------------- = ---------------------------,
n-1 n-1
  dimana n-1 = derajad bebas
dengan demikian, dari data tabel di atas,
ragam contoh adalah
s2 = 16/(5-1) = 4
Masalahnya : satuan jadi kuadrat
Mengapa (n-1) disebut derajad bebas
(kebebasan)?
 Perhatikan ilustrasi berikut.
 Apabila seseorang hendak mengangkat 100 kg beras
dari lantai 1 ke lantai 3 dan ia harus mengangkat
maksimal sebanyak 5 kali, maka orang tersebut dapat
memilih menyelesaikannya dalam 2 kali angkat, 3 kali
atau sampai (n-1) kali.
 Sampai dengan 4 (n-1) kali, orang tersebut bebas
memilih berapa kg yang diangkat ke lantai 3.
 Namun pada angkatan terakhir (1 kali), mau tidak mau,
orang tersebut harus mengangkat semua beras yang
tersisa. Artinya kebebasan memilih jumlah yang
diangkat hanya (n-1) kali.
Penggunaan Varian
 Untuk data yang nilainya besar, tentu akan diperoleh
nilai varian yang besar, dan sebaliknya
 Varian tidak dapat digunakan untuk membedakan
keragaman dua atau lebih gugus data yang besaran
nilainya sejak awal berbeda, misalnya antara jumlah
daun (helai) dengan bobot buah (kg).
 Varian hanya dapat digunakan untuk mengetahui
keragaman suatu gugus data atau membedakan
keragaman data yang besaran nilainya sama atau
hampir sama, atau data yang diamati pada kondisi
yang sama.
5. Standar Deviasi
 Penggunaan ragam untuk mengukur keragaman,
diperoleh satuan kuadrat dari satuan semula.
 Apabila yang dihitung keragamannya adalah bobot buah
melon dengan satuan kg, maka ragamnya akan
mempunyai satuan kg².
 Apabila yang diukur keragamannya adalah jumlah petani
dengan satuan orang, maka ragamnya akan mempunyai
satuan orang²??. Tentu saja hal ini sangat tidak logis.
 Agar diperoleh satuan yang sama dengan satuan
asalnya, maka varian tersebut diakarkan. Akar dari
ragam disebut simpangan baku (s) atau dikenal dengan
standar deviasi
Rumus Standar Deviasi
Standar deviasi adalah akar dari varian, maka

(xi - x)2  xi2 - ( xi)2/n


S = STD = -------------- = ----------------------,
n-1 n-1
  dimana n-1 = derajad bebas
dengan demikian, dari data tabel di atas, standar
deviasi contoh adalah
s = √ 16/(5-1) = √ 4 = 2
 Simpangan baku telah mempunyai satuan yang
sama dengan data asalnya, sehingga dapat
digunakan untuk mengetahui keragaman dari
data tersebut.
 Simpangan baku tidak tepat digunakan untuk
membedakan keragaman dua atau lebih gugus
data yang besaran nilainya sejak awal berbeda.
 Simpangan baku hanya tepat digunakan untuk
membedakan keragaman data yang besaran
nilainya sama atau hampir sama, atau data yang
diambil pada kondisi yang sama.
6. KOEFISIEN KERAGAMAN
 Ukuran keragaman lain yang lebih cocok untuk
membedakan keragaman dua variabel yang
satuannya berbeda adalah koefisien keragaman (KK).
 Koefisien keragaman merupakan simpangan baku
yang diwujudkan sebagai persentase dari nilai tengah.
 Karena KK merupakan ukuran keragaman relatif yang
dinyatakan dalam persen, maka KK dapat digunakan
untuk membandingkan keragaman dua atau lebih
kumpulan data, meskipun satuan pengukurannya tidak
sama.
Rumus Koefisien Keragaman
Note that there are no
CV =
s units – emphasizes that it
X 100%
X is a relative measure
Sometimes expressed as a %

Dari hasil perhitungan standar deviasi, maka


s 2
KK = --------- x 100% = -------- x 100% = 33,33%
x 6
 Koefisien keragaman dapat untuk menduga
tingkat ketelitian pengamatan atau cara
memperoleh data.
 Obyek seragam, misalnya tanaman, yang diberi
perlakuan sama akan mempunyai KK rendah
(<15%). Apabila KK tinggi, kemungkinan ada
kesalahan dalam penyiapan bahan, pemberian
perlakuan atau kesalahan cara pengamatan.
 Namun, tinggi rendahnya koefisien keragaman
juga dipengaruhi oleh keragaman awal dari
bahan tanam.
7. Parameter Distribusi Normal
 Populasi menyebar normal mempunyai dua parameter
utama, yaitu  (mean/rerata) dan  (standar deviasi).
 Distribusi normal dituliskan dengan lambang : X ~ N
(, ),
 Dibaca “X menyebar normal dengan rerata  dan simpangan
baku .
 Ini menjelaskan bagaimana rerata sebagai ukuran
tendensi sentral dan simpangan baku sebagai ukuran
keragaman yang paling populer.
 Dengan demikian dalam setiap populasi, nantinya
diperlukan penjajagan apakah sampel yang diambil
berasal dari distribusi normal atau tidak.
Petunjuk apakah suatu sampel berasal dari distribusi normal atau
tidak, berikut adalah ciri data yang mengikuti distribusi normal
(bell-shaped distribution).
68.27%

95.44%
f

99.73%

3 2   2 3
X
There is an equation which describes the height of
the normal curve in relation to its standard dev ()
Normal distribution with σ = 1, with varying means

ƒ
μ=0 μ=1 μ=2

-3 -2 -1 0 1 2 3 4 5

If you get difficulties to keep this term,


read statistics books
Normal distribution with μ = 0, with varying standard
deviations

σ=1

σ = 1.5
ƒ

σ=2

-5 -4 -3 -2 -1 0 1 2 3 4 5
8. Symmetry and Kurtosis
Symmetry means that the population is equally
distributed around the mean i.e. the curve to the right
side of the mean is a mirror image of the curve to the left
side
ƒ

Mean, median and mode


Symmetri
Data may be positively skewed (skewed to the right)
ƒ

Or negatively skewed (skewed to the left)

So direction of skew
refers to the direction of
ƒ

longer tail
Simmetris

mode

median
ƒ

mean
Kurtosis refers to how flat or peaked a curve is
(sometimes referred to as peakedness or tailedness)
(memuncak dan melandai)

The normal curve is


ƒ

known as mesokurtic

A more peaked curve is


known as leptokurtic
ƒ

A flatter curve is known as


platykurtic
Latihan dan Diskusi
1. Satu set data : 10, 12, 9, 8, 11. a) hitunglah
deviasinya, dan apa yang terjadi apabila ditambah angka
0 (nol)? b)hitunglan varian dan standar deviasinya
2. Hitunglah nilai ragam contoh dari masing-masing data
berikut:
 2, 5, 4, 3, 3, 4
 -1, 2, 0, -2, 1, -1
 -3, -2, -1, 0, 1, 2, 3
 11, 12, 13, 14, 15, 16, 17,
3. Banyaknya buah pisang yang tersengat hama dari 16 tanaman
adalah 4, 9, 0, 1, 3, 24, 12, 3, 30, 12, 7, 13, 18, 4, 5, dan 15.
Dengan menganggap data tersebut sebagai contoh, hitunglah
varian, simpangan baku dan koefisien keragamannya. Statistik
mana yang paling tepat untuk menggambarkan keragaman data
tersebut?
4. To study how first-grade students utilize their time when assigned to
a math task, researcher observes 24 students and records their time
off task out of 20 minutes. Times off task (minutes) : 4, 0, 2, 2, 4, 1,
4, 6, 9, 7, 2, 7, 5, 4,13, 7, 7, 10, 10, 0, 5, 3, 9 and 8. For this data
set, find :
a) Mean and standard deviation, median and range
b) Display the data in the histogram plot, dot diagram and also stem-and-leaf
diagram
c) Determine the intervals x ± s, x ± 2s, x ± 3s
d) Find the proportion of the meausurements that lie in each of this intervals.
e) Compare your finding with empirical guideline of bell-shaped distribution
5. The data below were obtained from the detailed record of purchases
over several month. The usage vegetables (in weeks) for a
household taken from consumer panel were (gram) :
 84 58 62 65 75 76 56 87 68 77 87 55 65 66 76 78 74 81 83 78 75 74 60 50
86 80 81 78 74 87
a. Plot a histogram of the data!
b. Find the relative frequency of the usage time that did not exceed
80.
c. Calculate the mean, variance and the standard deviation
d. Calculate the median and quartiles.

6. The mean of corn weight is 278 g by ear and deviation standard is


9,64 g, and than we have 10 ears. If they are gotten from ten
different fields, mean of plant height is Rp. 1200,- and its deviation
standard is Rp 90,-, which one have more homogenous, the weight
of corn ear or the plant height? Explain your answer! Verify your
results by direct calculation with the other data.
7. The employment’s salary at seed company, abbreviated, as follows :
18, 15, 21, 19, 13, 15, 14, 23, 18 and 16 rupiah. If these
abbreviation is real salary divide Rp. 100.000,-, find the mean,
variance and deviation standard of them.
 
8. Computer-aided statistical calculations. Calculation of the
descriptive statistic such as x and s are increasingly tedious with
large data sets. Modern computers have come a long way in
alleviating the drudgery of hand calculation. Microsoft Exel, Minitab
or SPSS are three of computing packages those are easy
accessible to student because its commands are in simple English.
Find these programs and install its at your computers. Bellow main
and sub menu of Microsoft Exel, Minitab and SPSS program. Use
these software to find x, s, s2, and coefisien of variation (CV) for
data set in exercise b. Histogram and another illustration can also
be created.
9. Some properties of the standard deviation
a) if a fixed number c is added to all measurements in a data
set, will the deviations (xi -x) remain changed? And
consequently, will s² and s remain changed, too? Take data
sample.
b) If all measurements in a data set are multiplied by a fixed
number d, the deviation (xi -x) get multiplied by d. Is it
right? What about the s² and s? Take data sample.
c) Apply your computer software to explain your data sample.
Verify your results by other data.
10. In a plant psychological experiment, a stimulating signal of
fixed intensity was used on six experimental subjects. Their
reaction time, recorded in second, were 4, 2, 3, 3, 6, 3.
Calculate the standard deviation for the data. What is your
conclusion?
11. Fruit weight (g) levels were recorded for 20 tomato sampled in a
farmers field and following data were obtained : 98, 100, 96, 93,
102, 102, 99, 96, 97, 100, 95, 105, 108, 98, 100, 102, 99,
98, 91, 101, 102, 104, 99, 100, 101.
a) Group the data into a frequency distribution.
b) Plot the histogram and comment on the shape of the distribution
c) Calculate the mean, deviation standard, median and the quartiles
d) Calculate range and interquartile range
 
12. Refer to No.11 and the answerd, continue your ideas.
e) Determine the intervals ͞x ± s, x ± 2s and x ± 3s
f) Find the proportion of the measurement in No. 11 a and b., that lie
in each these intervals
g) Compare your finding with the empirical guideline for bell-shaped
distribution

Anda mungkin juga menyukai