Chapter II
Chapter II
TRANSFORMASI DATA DENGAN R 3
Pada modul 3 akan dipelajari Transformasi data menggunakan R. Terdapat tiga
sub bahasan dalam modul 3 ini, yaitu transformasi untuk kesimetrikan data,
transformasi homogenitas rentang sebaran, serta transformasi untuk
meluruskan pola garis
3 Transformasi Data Dengan R
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
25
Analisis Data Eksplorasi (Modul Praktikum)
Contoh : Lihat data yl (Tingkat bunuh diri) yang disajikan pada Tabel 3.1.
Tabel 3.1. Data Tingkat bunuh diri di berbagai Negara.
Negara 25‐34 35‐44 45‐54 55‐64 65‐74
Kanada 22 27 31 34 24
Israel 9 10 10 14 27
Jepang 22 19 21 31 49
Aust 29 40 52 53 69
Prancs 16 25 36 47 56
Jerman 28 35 41 49 52
Hongar 48 65 84 81 107
Italia 7 8 11 18 27
Blanda 8 11 18 20 28
Poland 26 29 36 32 28
Spanyl 4 7 10 16 22
Swedia 28 41 46 51 35
Swiss 22 34 41 50 51
Inggrs 10 13 15 17 22
USA 20 22 28 33 37
LANGKAH DALAM R:
> bunuh<- read.table("C:/R/bunuh.txt", header=TRUE)
> boxplot(bunuh)
3 Transformasi Data Dengan R
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
26
Analisis Data Eksplorasi (Modul Praktikum)
> attach(bunuh)
> boxplot(X25.34)
Jika dilihat dari boxplot tersebut, maka dapat dilihat bahwa data menjulur ke
atas, jadi transformasi yang dapat disarankan adalah:
Latihan Praktikum:
Lakukan transformasi pada data bunuh diri berbagai Negara pada usia 25‐34
tahun agar simetrik. Buat boxplotnya, apakah nilai median dan juraian
boxplot telah proporsional?
3.2 Transformasi Homogenitas Rentang Sebaran
3 Transformasi Data Dengan R
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
27
Analisis Data Eksplorasi (Modul Praktikum)
; Nilai nisbah ini merupakan arah garis.
; Lakukan transformasi berdasarkan acuan sbb. :
TRANSFORMASI YANG SESUAI DENGAN NISBAH
Nisbah kira‐kira Transformasi yang dicoba
½ x1/2
1 Log x
3/2 ‐1/x
2 ‐ 1/x2
; Contoh : Lihat data tentang tingkat bunuh diri (laki‐laki) dari lima
kelompok umur (bunuh.txt)
Latihan Praktikum:
Buatlah program menggunakan R, untuk melakukan transformasi rentang
sebaran data. Data yang digunakan adalah data tingkat bunuh diri berbagai
Negara.
3.3 Transformasi Untuk Meluruskan Pola Garis
Untuk memeriksa apakah model linier (garis lurus) tepat digunakan (sebelum
mencari persamaan garis taksiran), dilakukan cara sebabagai berikut :
Perhatikan scatter diagram
Periksa apakah YA < YT < YB atau YB < YT < YA ?
3 Transformasi Data Dengan R
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
28
Analiisis Data Eksp
splorasi (Modul Praktikum
m)
; Jiika ya, mak
ka model liinier dapat digunakan
n.
maka hubungan antarra X dan Y ttidak linier.
; Jiika tidak, m
; Hal ini dapa
H at diperhatiikan dalam
m Gambar 3.1 berikut ::
Gam
mbar 3.1. Scatter Diaggram untuk masi pelurusan pola gaaris
k transform
Mesk
kipun YA < YT < YB atau YB < YT < YA , masih
h ada kemungkinan
hubungan yang tidak linierr. Hal ini taampak dari scatter diaagram,
Pemeeriksan yan
ng lebih baiik, adalah d
dengan men
nghitung :
; S = min( b
S T, bAT ), M =
BT = maks( bBTT, bAT ), N =
= S/M
; Jiika N = 1 , berarti bahwa bBT = bAT , maka mode
m el linier baaik untuk
d
digunakan.
; Jiika N = 0 , bBT dan b
bAT bertand
da sama, dillakukan traansformasi..
ATURAN
N PENGGU
UNAAN TR
RANSFORM
MASI
0,9 < N ≤ 1; Tidaak perlu diigunakan trransformassi, tetapi gu
unakan mo
odel linier
sederrhana (gariis lurus).
0,5 <
< N ≤ 0,9 ;
3 Transform
masi Data De
engan R
Annindya Apriliyanti P, M.Si – Jurusaan Statistika FMIPA Unpad
299
Analisis Data Eksplorasi (Modul Praktikum)
PETUNJUK PEMILIHAN TRANSFORMASI
Tukey (1977) memberikan petunjuk pemilihan transformasi sebagai berikut :
FORMULA R
Diberikan data penduduk pada Tabel 3.2: penduduk.txt
Simpan dengan nama penduduk.txt. Misal simpan di C:/R/penduduk.txt
Panggil di R
3 Transformasi Data Dengan R
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
30
Analisis Data Eksplorasi (Modul Praktikum)
Tabel 3.2. Ratio Penduduk
tahun penduduk
1 2.44
2 3.23
3 3.69
4 4.32
5 4.83
6 5.37
7 7.21
8 8.79
9 10.38
10 11.51
11 14.01
12 18.24
Buat scatter plot
Buat program sebagai berikut:
> trans1<-function(x,y){
+ xa<-max(x); ya<-max(y)
+ xb<-min(x); yb<-min(y)
+ xt<-median(x); yt<-median(y)
+ bbt<-((yt-yb)/(xt-xb))
+ bat<-((ya-yt)/(xa-xt))
+ s<-min(bbt,bat)
+ m<-max(bbt,bat)
3 Transformasi Data Dengan R
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
31
Analisis Data Eksplorasi (Modul Praktikum)
+ N<-(s/m)
+ N
+ }
> transform<-trans1(tahun,penduduk)
> transform
Periksa nilai N, lakukan transformasi jika perlu. Mial dalam hal ini,
transformasi dilakukan untuk y Æ log y, maka fungsi dalam R adalah:
> logy<-log(penduduk)
> logy
[1] 0.891998 1.172482 1.305626 1.463255 1.574846 1.680828
1.975469 2.173615
[9] 2.339881 2.443216 2.639771 2.903617
> plot(logy~tahun)
> abline(lm(logy~tahun))
Untuk mengetahui persamaan garisnya, maka diberikan formula:
> fit<-lm(logy~tahun)
> fit
Call:
lm(formula = logy ~ tahun)
Coefficients:
(Intercept) tahun
0.7492 0.1740
3 Transformasi Data Dengan R
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
32
Analisis Data Eksplorasi (Modul Praktikum)
Petunjuk:
Jika tidak ada data yang mengandung ke‐asimetrisan, maka anda boleh mencari
data lain.
3 Transformasi Data Dengan R
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
33