Anda di halaman 1dari 9

Analisis Data Eksplorasi (Modul Praktikum)

 
TRANSFORMASI DATA DENGAN R 3
 
Pada modul 3 akan dipelajari Transformasi data menggunakan R. Terdapat tiga 
sub  bahasan  dalam  modul  3  ini,  yaitu  transformasi  untuk  kesimetrikan  data, 
transformasi  homogenitas  rentang  sebaran,  serta  transformasi  untuk 
meluruskan pola garis 

 
 

3.1 Transformasi Untuk Kesimetrikan Data


Data yang kita miliki, terutama data asli, seringkali tidak menunjukkan pola 
simetrik. 
Ketidaksimetrikan  data  (kemiringan  pola  sebaran)  dapat  dilihat  dari  posisi 
Me di dalam kotak suatu box‐plot. 
Letak Me (Median) yang lebih dekat ke qB (quartile bawah) mencirikan suatu 
sebaran dengan kemiringan positif  (menjulur ke atas). 
Letak  Me  yang  lebih  dekat  ke  qA  mencirikan  suatu  sebaran  dengan 
kemiringan negatif  (menjulur ke bawah). 
Panjang garis yang menjulur dari kotak, menjadi petunjuk adanya data yang 
agak  jauh  dari  kumpulannya  dan  hal  ini  tidak  selalu  berarti  pola  sebaran 
tersebut miring. 
Selama posisi Me terhadap qB maupun qA relatif seimbang, garis yang terlalu 
panjang  hanya  menunjukkan  bhw.  sebaran  data  itu  memiliki  ekor  atau 
kemenjuluran yang lebih panjang dari semestinya.  
Tujuan  transformasi  jelas,  yaitu  membuat  sedekat  mungkin  dengan  bentuk 
standar,  yaitu  berpuncak  tunggal,  simetri,  mengecil  dengan  mulus  di  kedua 
sisinya.  
Tangga transformasi Tukey : 

3­ Transformasi Data Dengan R 
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
25
Analisis Data Eksplorasi (Modul Praktikum)

Contoh : Lihat data yl (Tingkat bunuh diri) yang disajikan pada Tabel 3.1. 

Tabel 3.1. Data Tingkat bunuh diri di berbagai Negara. 
Negara 25‐34  35‐44 45‐54 55‐64 65‐74 
Kanada  22  27 31 34 24
Israel   9  10 10 14 27
Jepang   22  19 21 31 49
Aust   29  40 52 53 69
Prancs   16  25 36 47 56
Jerman  28  35 41 49 52
Hongar  48  65 84 81 107
Italia   7  8 11 18 27
Blanda  8  11 18 20 28
Poland  26  29 36 32 28
Spanyl   4  7 10 16 22
Swedia  28  41 46 51 35
Swiss   22  34 41 50 51
Inggrs   10  13 15 17 22
USA   20  22 28 33 37
 
LANGKAH DALAM R: 
 
> bunuh<- read.table("C:/R/bunuh.txt", header=TRUE)
> boxplot(bunuh)

 
 

3­ Transformasi Data Dengan R 
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
26
Analisis Data Eksplorasi (Modul Praktikum)

> attach(bunuh)
> boxplot(X25.34)

 
 
Jika dilihat dari boxplot tersebut, maka dapat dilihat bahwa data menjulur ke 
atas, jadi transformasi yang dapat disarankan adalah: 
 
 

 
 
Latihan Praktikum:
Lakukan transformasi pada data bunuh diri berbagai Negara pada usia 25‐34 
tahun  agar  simetrik.  Buat  boxplotnya,  apakah  nilai  median  dan  juraian 
boxplot telah proporsional? 
 
 
3.2 Transformasi Homogenitas Rentang Sebaran
 

Pembandingan  pusat  kelompok  data  akan  lebih  efisien  kalau  rentang 


sebarannya  lebih  homogen.  (Salah  satu  asumsi  dalam  ANAVA  untuk 
pembandingan data adalah homogenitas varians). 
Untuk  menyamakan  sebaran,  perlu  diketahui  hubungan  sebaran  dengan 
pusat data. 
Bila  sebaran  cenderung  naik  bersama  dengan  naiknya  pusat,  diperlukan 
trans. yang membuat sebaran data yang pusatnya tinggi menjadi lebih kecil, 
misal  x1/2, log x, ‐1/x 

3­ Transformasi Data Dengan R 
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
27
Analisis Data Eksplorasi (Modul Praktikum)

Bila  sebaran  mengecil  dengan  naiknya  pusat,  diperlukan  trans.  yang 


membuat sebaran data yang pusatnya tinggi menjadi lebih besar, mis. X2, X3.  
Aturan praktis dari Tukey ialah  : 
; Plot pasangan (log Me, log d) pada diagram pencar 
; Tarik garis lurus putus‐putus yang paling mendekati titik‐titik yang ada 
; Ambil  dua  titik  pada  garis,  sebaiknya  berupa  pasangan  (log  Me,  log  d) 
dari kelompok data 
; Hitung nisbah sebagai berikut: 
 

 
 
; Nilai nisbah ini merupakan arah garis.  
; Lakukan transformasi berdasarkan acuan sbb. : 
TRANSFORMASI YANG SESUAI DENGAN  NISBAH 
 

Nisbah kira‐kira  Transformasi yang dicoba 
½  x1/2 
1  Log x 
3/2  ‐1/x 
2  ‐ 1/x2 
 
; Contoh  :  Lihat  data  tentang  tingkat  bunuh  diri  (laki‐laki)  dari  lima 
kelompok umur (bunuh.txt) 

Latihan Praktikum:
Buatlah  program  menggunakan  R,  untuk  melakukan  transformasi  rentang 
sebaran  data.  Data  yang  digunakan  adalah  data  tingkat  bunuh  diri  berbagai 
Negara. 
 
 
3.3 Transformasi Untuk Meluruskan Pola Garis
 
Untuk  memeriksa  apakah  model  linier  (garis  lurus)    tepat  digunakan  (sebelum 
mencari  persamaan garis taksiran), dilakukan cara sebabagai berikut : 
 

Perhatikan scatter diagram 
Periksa apakah  YA < YT < YB  atau  YB < YT < YA ? 

3­ Transformasi Data Dengan R 
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
28
Analiisis Data Eksp
splorasi (Modul Praktikum
m)

; Jiika ya, mak
ka  model liinier dapat digunakan
n.  
maka hubungan antarra X dan Y ttidak linier.   
; Jiika  tidak, m
; Hal ini dapa
H at diperhatiikan dalam
m Gambar 3.1 berikut ::  

 
Gam
mbar 3.1. Scatter Diaggram untuk masi pelurusan pola gaaris 
k transform

Mesk
kipun      YA  <  YT  <  YB    atau    YB  <  YT  <  YA  ,    masih
h  ada  kemungkinan 
hubungan yang tidak linierr. Hal ini taampak dari scatter diaagram, 
Pemeeriksan yan
ng lebih baiik, adalah d
dengan men
nghitung : 
 

 
 

 
 
; S = min( b
S T, bAT ),  M =
BT = maks( bBTT, bAT ), N =
= S/M 
; Jiika  N  = 1  ,    berarti  bahwa  bBT  =  bAT ,  maka  mode
m el  linier  baaik untuk 
d
digunakan. 
; Jiika N = 0 ,   bBT dan   b
bAT bertand
da sama, dillakukan traansformasi..  

 
ATURAN
N PENGGU
UNAAN TR
RANSFORM
MASI 
 
0,9 <  N ≤ 1; Tidaak perlu diigunakan trransformassi, tetapi gu
unakan mo
odel linier 
sederrhana (gariis lurus).  
 0,5 <
< N  ≤  0,9 ;  

3­ Transform
masi Data De
engan R 
Annindya Apriliyanti P, M.Si – Jurusaan Statistika FMIPA Unpad
299
Analisis Data Eksplorasi (Modul Praktikum)

; Jika  scatter  diagram  menunjukkan  bahwa  data  memencar,  yang  berarti 


bahwa hubungan antara X dan Y renggang, maka model linier sederhana 
sudah cukup baik.  
; Jika  hubungan  antara  X  dan  Y  erat  atau  jumlah  observasi  sedikit,  maka  
gunakan transformasi.  
; Sehubungan dengan makna transformasi tersebut, jika ada alasan wajar 
untuk  melakukan  transformasi  (bila  kelengkungan  pada  data  memang 
wajar,  maka  gunakan  transformasi.  Tetapi  jika  yakin  bahwa 
kelengkungan itu terjadi secara kebetulan, yaitu karena fluktuasi sampel, 
maka tak perlu dihiraukan. 
0  <  N  ≤  0,5; Gunakan transformasi untuk X  atau  kedua‐duanya.  

 
PETUNJUK PEMILIHAN TRANSFORMASI 
 
Tukey (1977) memberikan  petunjuk  pemilihan transformasi  sebagai berikut : 
 

 
 
 
FORMULA R 
 
Diberikan data penduduk  pada Tabel 3.2:  penduduk.txt 
 
 

Simpan dengan nama penduduk.txt. Misal simpan di C:/R/penduduk.txt 
Panggil di R 
 

> dataku<- read.table("C:/R/penduduk.txt", header=TRUE)

3­ Transformasi Data Dengan R 
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
30
Analisis Data Eksplorasi (Modul Praktikum)

Tabel 3.2. Ratio Penduduk 
 

tahun  penduduk 
1  2.44 
2  3.23 
3  3.69 
4  4.32 
5  4.83 
6  5.37 
7  7.21 
8  8.79 
9  10.38 
10  11.51 
11  14.01 
12  18.24 
 
Buat scatter plot 
 

>plot(penduduk~tahun, data=dataku, pch=16)


 

 
Buat program sebagai berikut: 
> trans1<-function(x,y){
+ xa<-max(x); ya<-max(y)
+ xb<-min(x); yb<-min(y)
+ xt<-median(x); yt<-median(y)
+ bbt<-((yt-yb)/(xt-xb))
+ bat<-((ya-yt)/(xa-xt))
+ s<-min(bbt,bat)
+ m<-max(bbt,bat)

3­ Transformasi Data Dengan R 
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
31
Analisis Data Eksplorasi (Modul Praktikum)

+ N<-(s/m)
+ N
+ }
> transform<-trans1(tahun,penduduk)
> transform

Periksa  nilai  N,  lakukan  transformasi  jika  perlu.  Mial  dalam  hal  ini, 
transformasi  dilakukan untuk y Æ log y, maka fungsi dalam R adalah: 
 
> logy<-log(penduduk)
> logy
[1] 0.891998 1.172482 1.305626 1.463255 1.574846 1.680828
1.975469 2.173615
[9] 2.339881 2.443216 2.639771 2.903617
> plot(logy~tahun)
> abline(lm(logy~tahun))

 
Untuk mengetahui persamaan garisnya, maka diberikan formula: 
 
> fit<-lm(logy~tahun)
> fit

Call:
lm(formula = logy ~ tahun)

Coefficients:
(Intercept) tahun
0.7492 0.1740

3­ Transformasi Data Dengan R 
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
32
Analisis Data Eksplorasi (Modul Praktikum)

Latihan Mandiri Modul 3


Gunakan data yang telah anda pilih untuk mengerjakan Latihan Mandiri Modul 2. 
Lakukan  transformasi  untuk  kesimetrikan  data,  transformasi  homogenitas 
rentang sebaran, serta transformasi untuk meluruskan pola garis. 

Petunjuk:  

Jika tidak ada data yang mengandung ke‐asimetrisan, maka anda boleh mencari 
data lain. 

 
 

3­ Transformasi Data Dengan R 
Anindya Apriliyanti P, M.Si – Jurusan Statistika FMIPA Unpad
33

Anda mungkin juga menyukai