Anda di halaman 1dari 28

1

ANALISIS
DATA
STATISTIKA
Eksplorasi dan
Transformasi Data

Dr. Utriweni Mukhaiyar, S.Si., M.Si


Kinanti Hanugera Gusti, S.Stat., M.Stat
Febri Dwi Irawati, S.Si., M.Si
2
TUGAS

Kerjakan Latihan dibawah ini!


Durasi Pengerjaan : 45 menit (10:15 – 11:00WIB)
Estimasi Pengiriman ke GCR : 10 menit (11:00 – 11:10 WIB)
Sifat : Open Book/PPT/Modul, Kalkulator, Individu

Terdapat 50 data pengukuran tingkat keasaman air hujan di Winconsin


3,58 3,80 4,01 4,01 4,05 4,05 4,12 4,18 4,20 4,21
4,27 4,28 4,30 4,32 4,33 4,35 4,35 4,41 4,42 4,45
4,45 4,50 4,50 4,50 4,50 4,51 4,52 4,52 4,52 4,57
4,58 4,60 4,61 4,61 4,62 4,62 4,65 4,70 4,70 4,70
4,70 4,72 4,78 4,78 4,80 5,07 5,20 5,26 5,41 5,48
1. Hitunglah Sari Numeriknya
2. Tampilkan data dalam bentuk boxplot, apakah ada data pencilan? Jika iya sebutkan!
3. Buatlah tabel distribusi frekuensi dan gambarkan bentuk histogramnya!
4. Kesimpulan apa yang bisa didapatkan dari data tersebut?

Format Pengumpulan: ADS(RA/RB)_Tugas 1_ NIM_Nama


3
TUGAS

Sari Numerik Interval Frequency


N 50
Min 3.58
3.5-3.79 1
Max 5.48 3.79-4.08 5
Range 1.9
1st Quartile 4.305 4.08-4.37 11
Median 4.505 4.37-4.66 20
3rd Quartile 4.6875
Sum 225.37 4.66-4.95 8
Mean 4.5074 4.95-5.24 2
Variance (n-1) 0.135534
Standard Deviation (n-1)
0.368149 5.24-5.53 3
Skewness 0.388
Kurtosis 1.201
Modus 4.5
4
TUGAS

Keasaman Hujan
25

20

15

10

0
3.5-3.79 3.79-4.08 4.08-4.37 4.37-4.66 4.66-4.95 4.95-5.24 5.24-5.53
5
POKOK BAHASAN

EKSPLORASI DATA

TRANSFORMASI DATA
6
EKSPLORASI DATA
7
EKSPLORASI DATA
8
EKSPLORASI DATA

Contoh
Univariat Bivariat Multivariat - Jenis kelamin dan jenis pekerjaan lulusan
perguruan tinggi
- Kebiasaan merokok dan kapasitas paru-
paru pria dewasa
Tujuan: - Rata-rata asupan karbohidrat dan protein
1. Menemukan apakah ada hubungan antara harian anak usia 10 tahun
variabel, jika ada seberapa kuat hubungan itu - Usia pesawat dan waktu yang dibutuhkan
tampak untuk perbaikan
2. Apakah suatu variabel dapat diprediksi dari - Penghasilan orangtua, jalur masuk
variabel lainnya mahasiswa, besar UKT mahasiswa
- Kriteria calon debitur, jenis pekerjaan,
lama bekerja
9
EKSPLORASI DATA
10
EKSPLORASI DATA

Comparison
11
EKSPLORASI DATA

Comparison
12
EKSPLORASI DATA

Comparison
13
EKSPLORASI DATA

Comparison
14
EKSPLORASI DATA

Relationship

Tujuan utama pengumpulan data bivariat adalah untuk menjawab


pertanyaan seperti:
• Apakah variabel terkait?
• Bentuk hubungan apa yang ditunjukkan oleh data tersebut?
• Bisakah kita mengukur strength hubungan mereka?
• Bisakah kita memprediksi satu variabel dari yang lain?

Scatter plot pada Gambar 1. Pola titik barat daya ke


timur laut menunjukkan hubungan positif antara x
dan y. Artinya, pelamar dengan IPK tinggi
cenderung memiliki GMAT tinggi. Hubungan
tersebut jauh dari hubungan matematis yang
sempurna.
15
EKSPLORASI DATA

Relationship
16
EKSPLORASI DATA

Relationship and Comparison

Kekhawatiran dikemukakan oleh para pemerhati


lingkungan bahwa tumpahan kontaminan
mempengaruhi satwa liar di dalam dan di sekitar
danau yang berdekatan. Kontaminan estrogenik
di lingkungan dapat memiliki konsekuensi serius
pada kemampuan makhluk hidup untuk
bereproduksi.

Peneliti meneliti perkembangan reproduksi


aligator jantan muda yang ditetaskan dari telur
yang diambil dari sekitar (1) Lake Apopka, danau
yang tercemar, dan (2) Lake Woodruff, yang
berfungsi sebagai kontrol. Kontaminan dianggap
mempengaruhi konsentrasi steroid seks.
Konsentrasi dua steroid (estradiol dan testosteron)
ditentukan dengan radioimmunoassay.
17
EKSPLORASI DATA

Relationship and Comparison

Fitur yang paling menonjol dari data


tersebut adalah bahwa aligator jantan
dari Lake yang terkontaminasi, secara
umum, memiliki kadar testosteron yang
jauh lebih rendah daripada yang berasal
dari Lake kontrol yang hampir bebas
polusi. (A berada di sepertiga terbawah
dari multiple scatter plot.) Tingkat
testosteron yang rendah pada jantan
memiliki konsekuensi serius terkait
reproduksi.
18
EKSPLORASI DATA

Suatu metode pembelajaran baru XYZ dilakukan di suatu Sekolah Dasar (SD) dengan ketentuan kelas IV A
menggunakan metode baru dan kelas IV B tidak menggunakan metode baru. Setelah akhir pertemuan mata
pelajaran, dilakukanlah evaluasi untuk mengukur ketercapaian pelajaran dengan data beberapa sampel sebagai
berikut :

Dengan XYZ 81,11 84,91 79,30 69,74 74,84 68,60 75,04 77,68 78,43 76,52

Tanpa XYZ 83,29 92,75 76,14 77,70 86,70 82,17 87,66 87,41 93,83 84,74

Waka Kurikulum ingin mengetahui apakah metode pembelajaran baru XYZ memberikan dampak pada tingkat
pemahaman siswa
19
EKSPLORASI DATA

DenganXYZ TanpaXYZ
Min. :68.60 Min. :76.14
1st Qu.:74.89 1st Qu.:82.45
Median :77.10 Median :85.72
Mean :76.62 Mean :85.24
3rd Qu.:79.08 3rd Qu.:87.60
Max. :84.91 Max. :93.83
20
TRANSFORMASI DATA

Transformasi Data adalah upaya yang dilakukan dengan tujuan utama untuk mengubah skala pengukuran data asli
menjadi bentuk lain sehingga data dapat memenuhi asumsi-asumsi yang mendasari analisis ragam.

Jenis Transformasi Data


1. Transformasi Square Root (Akar)
2. Tansformasi Logaritma
3. Transformasi Arcsin
4. Transformasi Square (Kuadrat)
5. Transformasi Cubic (Pangkat Tiga)
6. Transformasi Inverse (Kebalikan)
7. Transformasi Inverse Square Root (Kebalikan
Akar)
8. Transformasi Inverse Square (Kebalikan
Kuadrat)
9. Transformasi Inverse Cubic (Kebalikan Pangkat
Tiga)
10.Transformasi Reverse Score (Balik Skor)
21
TRANSFORMASI DATA
22
TRANSFORMASI DATA
23
TRANSFORMASI DATA
24
TRANSFORMASI DATA
25
TRANSFORMASI DATA
26
TRANSFORMASI DATA
27
TRANSFORMASI DATA
28

T H A N K

Y O U

Anda mungkin juga menyukai