Anda di halaman 1dari 20

PROBLEM SET 4 “MENGENALI KARAKTERISTIK DATA LANJUTAN”

MATA KULIAH ANALISIS DATA LINGKUNGAN

Oleh:
Putri Sandi Daniar
25321314

Asisten:
Nadiyatur Rahmatikal Wasi'ah, ST, MT

Dosen Pengampu:
Ir. Driejana, MSCE, Ph.D
Dr. Sukandar, MT

PROGRAM MAGISTER
JURUSAN TEKNIK LINGKUNGAN
FAKULTAS TEKNIK SIPIL DAN LINGKUNGAN
INSTITUT TEKNOLOGI BANDUNG
2022
KARAKTERISTIK MASING-MASING PARAMETER

1. Identifikasi data yang tidak normal berdasarkan problem set 2


Grafik Deskripsi
1. Bicarbonate (mg/L) Berdasarkan grafik scatterplot, dapat
diketahui bahwa kandungan bikarbonat
pada keseluruhan sumur pemantauan
400

memiliki sebaran terbanyak pada


rentang konsentrasi sekitar 150-300
BICARBONATE

300

mg/L.
Apabila dihubungkan dengan
200

normalitas, maka distribusi data


konsentrasi bikarbonat pada analisis ini
dianggap tidak normal, sebab terdapat
100

kecenderungan data yang menceng ke


0 20 40 60 80

SAMPLE_NUMBER
nilai > 300 mg/L. Hal ini tentunya akan
membuat nilai tengah (median) tidak
sama dengan nilai mean dari data
tersebut.
2. Magnesium Berdasarkan grafik scatterplot, dapat
diketahui bahwa kandungan magnesium
80

pada keseluruhan sumur pemantauan


70

memiliki sebaran terbanyak pada


rentang konsentrasi sekitar 14,2-40
60
MAGNESIUM

mg/L.
50

Apabila dihubungkan dengan


40

normalitas, maka distribusi data


30

konsentrasi magnesium pada analisis ini


dianggap tidak normal, sebab terdapat
20

kecenderungan data yang menceng ke


0 20 40 60 80

SAMPLE_NUMBER
nilai > 40 mg/L. Hal ini tentunya akan
membuat nilai tengah (median) tidak
sama dengan nilai mean dari data
tersebut.

3. Potassium Berdasarkan grafik scatterplot, dapat


diketahui bahwa kandungan potassium
pada keseluruhan sumur pemantauan
memiliki sebaran terbanyak pada
rentang konsentrasi sekitar 1-6 mg/L.
Apabila dihubungkan dengan
normalitas, maka distribusi data

8
konsentrasi potassium pada analisis ini
dianggap tidak normal, sebab terdapat
POTASSIUM

kecenderungan data yang menceng ke


6

nilai > 4 mg/L. Hal ini tentunya akan


membuat nilai tengah (median) tidak
4

sama dengan nilai mean dari data


tersebut.
2

0 20 40 60 80

SAMPLE_NUMBER

4. Specific conductance Berdasarkan grafik scatterplot, dapat


diketahui bahwa nilai konduktansi pada
keseluruhan sumur pemantauan
1500

memiliki sebaran terbanyak pada


SPECIFIC_CONDUCTANCE

rentang nilai sekitar 332-1000 S/cm.


Apabila dihubungkan dengan
1000

normalitas, maka distribusi data nilai


konduktansi pada analisis ini dianggap
tidak normal, sebab terdapat
500

kecenderungan data yang menceng ke


nilai > 1000 S /L. Hal ini tentunya
0 20 40 60 80

SAMPLE_NUMBER
akan membuat nilai tengah (median)
tidak sama dengan nilai mean dari data
tersebut.
5. Sulfate reducers (× 103 ) Berdasarkan grafik scatterplot, dapat
diketahui bahwa nilai sulfate reducer
pada keseluruhan sumur pemantauan
80000

memiliki sebaran terbanyak pada


rentang nilai sekitar 5103 −
SULFATE_REDUCERS

60000

18.000103 copies/L.
40000

Apabila dihubungkan dengan


normalitas, maka distribusi data nilai
20000

sulafte reducers pada analisis ini


dianggap tidak normal, sebab terdapat
0

kecenderungan data yang menceng ke


0 20 40 60 80

SAMPLE_NUMBER
nilai > 18.000103 copies/L. Hal ini
tentunya akan membuat nilai median
tidak sama dengan nilai mean dari data
tersebut.
6. TCE reducers (× 103) Berdasarkan grafik scatterplot, dapat
500000 diketahui bahwa nilai TCE reducer
pada keseluruhan sumur pemantauan
memiliki sebaran terbanyak pada
400000

rentang nilai sekitar 5103 −


TCE_REDUCERS

300000

580.000103 copies/L.
Apabila dihubungkan dengan
200000

normalitas, maka distribusi data nilai


100000

TCE reducers pada analisis ini


dianggap tidak normal, sebab terdapat
0

kecenderungan data yang menceng ke


0 20 40 60 80

SAMPLE_NUMBER nilai > 580.000103 copies/L. Hal ini


tentunya akan membuat nilai median
tidak sama dengan nilai mean dari data
tersebut.
7. VC reducers (× 103) Berdasarkan grafik scatterplot, dapat
diketahui bahwa nilai VC reducer pada
keseluruhan sumur pemantauan
6000000

memiliki sebaran terbanyak pada


rentang nilai sekitar 5103 −
VC_REDUCERS

4000000

2.000.000103 copies/L.
Apabila dihubungkan dengan
normalitas, maka distribusi data nilai
2000000

VC reducers pada analisis ini dianggap


tidak normal, sebab terdapat
0

kecenderungan data yang menceng ke


0 20 40 60 80

SAMPLE_NUMBER nilai > 1.000.000103 copies/L. Hal ini


tentunya akan membuat nilai median
tidak sama dengan nilai mean dari data
tersebut.
8. Temperature Berdasarkan grafik scatterplot, dapat
diketahui bahwa temperatur pada
keseluruhan sumur pemantauan
memiliki nilai yang cukup bervariasi
dengan rentang nilai yang berberiksar
antara 12,57-17,92C.
Apabila dihubungkan dengan
normalitas, maka distribusi data nilai
temperature pada analisis ini

18
kemungkinan dianggap normal, sebab

17
tidak terlihat dengan jelas adanya
16 kecenderungan arah data, sehingga bisa
TEMPERATURE

saja nilai median akan sama dengan


15

nilai mean dari data tersebut.


14
13

0 20 40 60 80

SAMPLE_NUMBER

2. Metode transformasi data


Transformasi data dapat digunakan untuk mengatasi data yang tidak terdistribusi
dengan normal. Adapun pemilihan metode transformasi yang tepat dapat dilakukan
menggunakan tangga transformasi yang dibuat oleh Tukey, dimana pemilihannnya
dapat dilakukan berdasarkan tipe juraian diagram box plot ataupun kemencengan
pada histogram.

Apabila box plot menjurai ke bawah (median lebih dekat dengan kuartil atas) atau
histogram menceng ke kiri, maka metode transformasi yang digunakan adalah yang
berada di ruas kanan secara berurutan dari transformasi x2 sampai anti log z, sampai
didapatkan bentuk box plot ataupun histogram yang simetris (menyerupai data
normal). Kemudian apabila box plot menjurai ke atas (median lebih dekat dengan
kuartil bawah) atau histogram menceng ke kanan, maka metode transformasi yang
digunakan adalah yang berada di ruas kiri secara berurutan dari transformasi √𝑥
1
sampai 𝑥 2
3. Plot data hasil transformasi
Grafik Deskripsi
1. Bicarbonate (mg/L) Berdasarkan histogram dapat dilihat
• Sebelum tarnsformasi bahwa data konsentrasi bikarbonat
cenderung menceng ke kanan,
sehingga untuk mentranformasinya
digunakan metode transformasi ke
30

arah kiri sampai didapatkan bentuk


histogram yang menyerupai data
frequency

20

normal. Dalam percobaan ini


didapatkan bahwa histogram
menyerupai data normal pada
10

tansformasi √𝑥. Hasil transfromasi


data yang didapatkan menampilkan
histogram dengan persebaran data
0

100 200 300 400 500


yang lebih homogen, dimana dari
BICARBONATE_DISS
hasil transfromasi tersebut
Shapiro-Wilk normality test didapatkan p-value yang nilainya
data: BICARBONATE_DISS lebih mendekati distribusi normal
W = 0.7731, p-value = 2.47e-10 (0,05), yaitu p-value =
• Transformasi √𝑥 0.000000006763.
40
30
frequency

20
10
0

8 10 12 14 16 18 20 22

BICARBONATEsqrt

Shapiro-Wilk normality test


data: BICARBONATEsqrt
W = 0.82257, p-value = 0.000000006763
2. Magnesium (mg/L) Berdasarkan histogram dapat dilihat
• Sebelum tarnsformasi bahwa data konsentrasi magnesium
cenderung menceng ke kanan,
sehingga untuk mentranformasinya

60
digunakan metode transformasi ke

50
arah kiri sampai didapatkan bentuk
histogram yang menyerupai data
40 normal. Dalam percobaan ini
frequency

didapatkan bahwa histogram


30

menyerupai data normal pada


20

tansformasi -1/x. Hasil transfromasi


data yang didapatkan menampilkan
10

histogram dengan persebaran data


0

yang lebih homogen, dimana dari


20 40 60 80
hasil transfromasi tersebut
MAGNESIUM_DISS
didapatkan p-value yang nilainya
Shapiro-Wilk normality test lebih mendekati distribusi normal
data: MAGNESIUM_DISS (0,05), yaitu p-value =
W = 0.56943, p-value = 1.155e-14 0.000006841.
• Transformasi √𝑥
50
40
30
frequency

20
10
0

4 5 6 7 8 9

MAGNESIUMsqrt
• Transformasi log10(x)

50
40
30
frequency

20
10
0

1.2 1.4 1.6 1.8 2.0

MAGNESIUMlog10

• Transformasi -1/x
50
40
30
frequency

20
10
0

-0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01

MAGNESIUM1x

Shapiro-Wilk normality test


data: MAGNESIUM1x
W = 0.90301, p-value = 0.000006841
3. Potassium (mg/L) Berdasarkan histogram dapat dilihat
• Sebelum transformasi bahwa data konsentrasi potassium
cenderung menceng ke kanan,
sehingga untuk mentranformasinya
digunakan metode transformasi ke
arah kiri sampai didapatkan bentuk
histogram yang menyerupai data
normal. Dalam percobaan ini
didapatkan bahwa histogram
menyerupai data normal pada
tansformasi -1/x. Hasil transfromasi

40
data yang didapatkan menampilkan
histogram dengan persebaran data
30 yang lebih homogen, dimana dari
frequency

hasil transfromasi tersebut


20

didapatkan p-value = 0.1558 yang


nilainya >0,05 sehingga data dapat
10

dikatakan terdistribusi normal.


0

2 4 6 8 10

POTASSIUM_DISS

Shapiro-Wilk normality test


data: POTASSIUM_DISS
W = 0.76819, p-value = 1.827e-10
• Transformasi √𝑥
40
30
frequency

20
10
0

2 4 6 8 10

POTASSIUM_DISS
• Transformasi log10(x)

30
25
20
frequency

15
10
5
0

0.2 0.4 0.6 0.8 1.0

POTASSIUMlog10

• Transformasi -1/x
15
10
frequency

5
0

-0.6 -0.5 -0.4 -0.3 -0.2 -0.1

POTASSIUM1x

Shapiro-Wilk normality test


data: POTASSIUM1x
W = 0.97868, p-value = 0.1558
4. Specific conductance (S/cm) Berdasarkan histogram dapat dilihat
• Sebelum transformasi bahwa data nilai specific
conductance cenderung menceng ke
kanan, sehingga untuk
mentranformasinya digunakan
metode transformasi ke arah kiri
sampai didapatkan bentuk
histogram yang menyerupai data
normal. Dalam percobaan ini
didapatkan bahwa histogram
menyerupai data normal pada

50
tansformasi -1/x. Hasil transfromasi

40
data yang didapatkan menampilkan
histogram dengan persebaran data
frequency

30

yang lebih homogen, dimana dari


hasil transfromasi tersebut
20

didapatkan p-value yang nilainya


lebih mendekati distribusi normal
10

(0,05), yaitu p-value = 0.001086.


0

500 1000 1500 2000

SPECIFIC.CONDUCTANCE_YSI

Shapiro-Wilk normality test


data: SPECIFIC.CONDUCTANCE_YSI
W = 0.66261, p-value = 6.473e-13
• Transformasi √𝑥
60
50
40
frequency

30
20
10
0

15 20 25 30 35 40 45

SPECIFIC_CONDUCTANCEsqrt
• Transformasi log10(x)

40
30
frequency

20
10
0

2.6 2.8 3.0 3.2

SPECIFIC_CONDUCTANCElog10

• Transformasi -1/x
50
40
frequency

30
20
10
0

-0.0035 -0.0030 -0.0025 -0.0020 -0.0015 -0.0010 -0.0005

SPECIFIC_CONDUCTANCE1x

Shapiro-Wilk normality test


data: SPECIFIC_CONDUCTANCE1x
W = 0.94583, p-value = 0.001086
5. Dsr (copies/L) Berdasarkan histogram dapat dilihat
• Sebelum transformasi bahwa data nilai Dsr cenderung
menceng ke kanan, sehingga untuk
mentranformasinya digunakan
metode transformasi ke arah kiri
sampai didapatkan bentuk
histogram yang menyerupai data
normal. Dalam percobaan ini
didapatkan bahwa histogram
menyerupai data normal pada

80
tansformasi log10(x). Hasil
transfromasi data yang didapatkan

60
menampilkan histogram dengan
persebaran data yang lebih
frequency

homogen, dimana dari hasil


40

transfromasi tersebut didapatkan p-


value = 0.3178 yang nilainya >0,05
20

sehingga data dapat dikatakan


terdistribusi normal.
0

0 20000000 40000000 60000000 80000000 100000000

DSR

Shapiro-Wilk normality test


data: DSR
W = 0.29511, p-value < 2.2e-16
• Transformasi √𝑥
70
60
50
40
frequency

30
20
10
0

0 2000 4000 6000 8000 10000

DSRsqrt
• Transformasi log10(x)

25
20
15
frequency

10
5
0

0 2 4 6 8

DSRlog10

Shapiro-Wilk normality test


data: DSRlog10
W = 0.9833, p-value = 0.3178
6. Dhc (copies/L) Berdasarkan histogram dapat dilihat
• Sebelum transformasi bahwa data nilai Dhc cenderung
menceng ke kanan, sehingga untuk
80

mentranformasinya digunakan
metode transformasi ke arah kiri
60

sampai didapatkan bentuk


histogram yang menyerupai data
frequency

normal. Dalam percobaan ini


40

didapatkan bahwa histogram


menyerupai data normal pada
20

tansformasi log10(x). Hasil


transfromasi data yang didapatkan
menampilkan histogram dengan
0

0 100000000 300000000 500000000


persebaran data yang lebih
DHC
homogen, dimana dari hasil
Shapiro-Wilk normality test transfromasi tersebut didapatkan p-
data: DHC value yang nilainya lebih mendekati
W = 0.32617, p-value < 2.2e-16 distribusi normal (0,05), yaitu p-
value = 0.04039.
• Transformasi √𝑥

60
frequency

40
20
0

0 5000 10000 15000 20000 25000

DHCsqrt

• Transformasi log10(x)
25
20
frequency

15
10
5
0

0 2 4 6 8

DHClog10

Shapiro-Wilk normality test


data: DHClog10
W = 0.97024, p-value = 0.04039
7. Vcr (copies/L) Berdasarkan histogram dapat dilihat
• Sebelum transformasi bahwa data nilai Vcr cenderung
menceng ke kanan, sehingga untuk
mentranformasinya digunakan
metode transformasi ke arah kiri
sampai didapatkan bentuk
histogram yang menyerupai data
normal. Dalam percobaan ini
didapatkan bahwa histogram
menyerupai data normal pada

80
tansformasi log10(x). Hasil
transfromasi data yang didapatkan

60
menampilkan histogram dengan
persebaran data yang lebih
frequency

homogen, dimana dari hasil


40

transfromasi tersebut didapatkan p-


value = 0.05692 yang nilainya >0,05
20

sehingga data dapat dikatakan


terdistribusi normal.
0

0 2000000000 4000000000 6000000000 8000000000

VCR

Shapiro-Wilk normality test


data: VCR
W = 0.26458, p-value < 2.2e-16
• Transformasi √𝑥
60
frequency

40
20
0

0 20000 40000 60000 80000

VCRsqrt
• Transformasi log10(x)

20
15
frequency

10
5
0

0 2 4 6 8 10

VCRlog10

Shapiro-Wilk normality test


data: VCRlog10
W = 0.97239, p-value = 0.05692
8. Temperature Berdasarkan histogram dapat dilihat
• Sebelum transformasi bahwa data nilai temperature
cenderung menceng ke kanan,
sehingga untuk mentranformasinya
20

digunakan metode transformasi ke


arah kiri sampai didapatkan bentuk
15

histogram yang menyerupai data


frequency

normal. Dalam percobaan ini


10

didapatkan bahwa histogram


menyerupai data normal pada
5

tansformasi log10(x). Hasil


transfromasi data yang didapatkan
menampilkan histogram dengan
0

13 14 15 16 17 18
persebaran data yang lebih
TEMP_YSI
homogen, dimana dari hasil
Shapiro-Wilk normality test transfromasi tersebut didapatkan p-
data: TEMP_YSI value = 0.07842 yang nilainya >0,05
W = 0.96224, p-value = 0.01157 sehingga data dapat dikatakan
terdistribusi normal.
• Transformasi √𝑥

30
25
20
frequency

15
10
5
0

3.6 3.8 4.0 4.2

TEMPsqrt

• Transformasi log10(x)
25
20
frequency

15
10
5
0

1.10 1.15 1.20 1.25

TEMPlog10

Shapiro-Wilk normality test


data: TEMPlog10
W = 0.97439, p-value = 0.07842
KESIMPULAN

Berdasarkan percobaan transformasi data dan hasil uji normalitas menggunakan Rcmdr,
dapat disimpulkan bahwa transformasi data dapat digunakan untuk mengatasi data yang
tidak terdistribusi dengan normal, hal ini dapat dibuktikan dengan hasil p-value setelah
transformasi pada keseluruhan data yang lebih mendekati atau bahkan lebih dari 0,05. Pada
percobaan yang telah dilakukan, diketahui bahwa data yang nilai p-valuenya >0,05 adalah
potassium, Dsr, dan Vcr, sedangkan data lainnya hanya lebih mendekati nilai 0,05.
REFERENSI

Permana, R.D. (2014). Praktikum Statistika dan Penyajian Data. Yogyakarta: Sekolah
Vokasi Universitas Gadjah Mada.

Anda mungkin juga menyukai