Kolom paling kiri menunjukkan frekuensi, kolom tengah menunjukkan stem, dan kolom
paling kanan menunjukkan leaf. Jadi, misalkan data observasi 15.2, stemnya adalah 15
dan leafnya adalah 2.
#Contoh Stem and Leaf pada Data Boston Housing (Variabel :AGE).
Berikut adalah stem plot variable AGE pada data Boston Housing.
Intepretasi :
-Pusat data terletak pada stem 7, sekitar 7 puluhan.
-Sebaran data tidak simetris, namun menjulur ke kiri.
-Modus terletak pada stem 9, data 9 puluhan
-Pada data housing, penduduk paling banyak adalah umur 9 puluhan, dan terlihat bahwa
penduduk yang berumur lebih tua jumlahnya lebih banyak, karena datanya tidak simetris,
namun menjulur ke kiri.
#Contoh Stem and Leaf pada Data Boston Housing (Variabel :AGE) by CHAS.
Berikut adalah stem plot variable AGE pada data Boston Housing berkategori CHAS.
AGE, CHAS=0
Intepretasi:
-Pemusatan data terletak pada stem 7, sekitar 7 puluhan
-Data tidak simetris, namun menjulur ke kiri
-Modus data terletak pada stem 9, sekitar 9 puluhan
-Pada data housing, penduduk yang jauh dari sungai banyak yang berumur sudah tua,
ditinjau dari modus dan penjuluran datanya.
AGE, CHAS=1
Intepretasi:
-Data tidak simetri, menjulur ke kiri, sehingga semakin berumur frekuensinya semakin
banyak
-Pemusatan data terletak pada stem 8, sekitar 8 puluhan
-Modus data terletak pada stem 9, sekitar 9 puluhan.
-Penduduk yang tinggal di dekat sungai banyak yang berumur 9 puluhan.
#Contoh Stem and Leaf pada Data Housing(Variabel:MEDV).
Berikut adalah stem plot variable MEDV pada data housing berkategori.
Intepretasi :
- Pusat data terletak pada stem 2, sekitar 2 puluhan.
- Data tidak simetris, menjulur ke kanan
-Modus data terletak pada stem 2, sekitar 2 puluhan
-Pada data housing, harga rumah terbanyak yaitu pada harga rumah 2 puluhan, dan harga
rumah pada data housing relative murah, karena datanya menjulur ke kanan, semakin ke
kanan frekuensinya semakin sedikit, sehingga harga rumah yang mahal juga semakin
sedikit.
MEDV,CHAS=1
Intepretasi:
-Data tidak simetri, namun menjulur ke kanan.
-Pemusatan data terletak pada stem 2
-Modus juga terletak pada stem data stem 2
-Harga rumah yang dekat dengan sungai relatif murah.
2. BOX PLOT
a. Manfaat dan Tujuan:
-Menilai dan membandingkan distribusi sampel
-Menilai kesimetrisan sebaran data
b. Contoh:
#Box Plot pada Data Housing (Variabel: AGE) berkategori CHAS
Boxplot of AGE
100
80
60
AGE
40
20
0
0 1
CHAS
Intepretasi:
Penduduk yang berusia lebih tua banyak yang tinggal di dekat sungai, sedangkan penduduk
yang tinggal jauh dari sungai, median umurnya lebih muda. Data tidak terdapat outlier.
Median umur penduduk yang jauh dari sungai adalah 76,5. Median umur penduduk yang
dekat dari sungai adalah 88,5.
#Box Plot pada Data Housing (Variabel: MEDV) berkategori CHAS
Boxplot of MEDV
50
40
30
MEDV
20
10
0
0 1
CHAS
Intepretasi:
Harga rumah yang dekat dengan sungai lebih mahal daripada yang jauh dari sungai,
walaupun perbedaan harganya tidak terlalu signifikan. Pada data harga rumah yang jauh
dengan sungai terdapat outlier. Median harga rumah yang jauh dari sungai adalah 20,9.
Sedangkan median harga rumah yang dekat dengan sungai adalah 23,3.
3. LETTER VALUES
a. Manfaat dan Tujuan
-Menggambarkan lokasi dan penyebaran distribusi sampel
b. Contoh
4. Median Polish
a. Manfaat dan Tujuan
Mengidentifikasi adanya suatu trends dan outliers dengan menghitung median dari
kolom dan baris secara iteraksi dimana hasil akhirnya adalah sebuah model linear dari
data tersebut.
b. Contoh
5. Resistant Line
a. Manfaat dan Tujuan
-Untuk melihat apakah hubungan itu linier, untuk menemukan kembali pengalaman
untuk mer linierisasi hubungan jika perlu, dan untuk mengidentifikasi outlier.
b. Contoh
Resistant Line Fit: AGE versus MEDV
Intepretasi: Dari data diatas diperoleh kemiringan sebesar 226,1239 dan level sebesar
-56,5583 menunjukkan bahwa data tersebut memiliki hubungan yang linier atau tidak.
Hal tersebut akan mengindentifikasi terdapat data yang outlier.
6. Resistant Smooth
a. Manfaat dan Tujuan
-Memuluskan serangkaian data yang terurut, biasanya dikumpulkan dari waktu ke
waktu, untuk menghilangkan fluktuasi acak. Menghaluskan berguna untuk
menemukan dan meringkas tren data dan outlier.
b. Contoh
MTB > RSmooth 'AGE' C30 c31.
Intepretasi:
Variabel yang dipilih akan mengurutkan datanya sehingga pada data tersebut
ditemukan data yang outlier dan menghilangkan fluktuasi acak pada data.
7. Rootogram
a. Manfaat dan Tujuan
Histogram dengan kesesuaian distribusi normal, yang menampilkan penyimpangan
dari distribusi normal yang sesuai, rootogram cocok menggunakan persentil.
b. Contoh
Rootogram: AGE
Interpretasi :
Dari data yang diperoleh pada rootogram diatas, terdapat data yang memiliki nilai
113,0 yang merupakan data outlier dari keseluruhan data yang diperoleh. Sehingga
data tersebut menampilkan penyimpangan nilai dari distribusi normal.