Anda di halaman 1dari 20

PROBLEM SET 4 “MENGENALI KARAKTERISTIK DATA LANJUTAN”

MATA KULIAH ANALISIS DATA LINGKUNGAN

Oleh:
Putri Sandi Daniar
25321314

Asisten:
Nadiyatur Rahmatikal Wasi'ah, ST, MT

Dosen Pengampu:
Ir. Driejana, MSCE, Ph.D
Dr. Sukandar, MT

PROGRAM MAGISTER
JURUSAN TEKNIK LINGKUNGAN
FAKULTAS TEKNIK SIPIL DAN LINGKUNGAN
INSTITUT TEKNOLOGI BANDUNG
2022
KARAKTERISTIK MASING-MASING PARAMETER

1. Identifikasi data yang tidak normal berdasarkan problem set 2


Grafik Deskripsi
1. Bicarbonate (mg/L) Berdasarkan grafik scatterplot, dapat
diketahui bahwa kandungan bikarbonat
pada keseluruhan sumur pemantauan
memiliki sebaran terbanyak pada
rentang konsentrasi sekitar 150-300
mg/L.
Apabila dihubungkan dengan
normalitas, maka distribusi data
konsentrasi bikarbonat pada analisis ini
dianggap tidak normal, sebab terdapat
kecenderungan data yang menceng ke
nilai > 300 mg/L. Hal ini tentunya akan
membuat nilai tengah (median) tidak
sama dengan nilai mean dari data
tersebut.
2. Magnesium Berdasarkan grafik scatterplot, dapat
diketahui bahwa kandungan
magnesium pada keseluruhan sumur
pemantauan memiliki sebaran
terbanyak pada rentang konsentrasi
sekitar 14,2-40 mg/L.
Apabila dihubungkan dengan
normalitas, maka distribusi data
konsentrasi magnesium pada analisis
ini dianggap tidak normal, sebab
terdapat kecenderungan data yang
menceng ke nilai > 40 mg/L. Hal ini
tentunya akan membuat nilai tengah
(median) tidak sama dengan nilai mean
dari data tersebut.

3. Potassium Berdasarkan grafik scatterplot, dapat


diketahui bahwa kandungan potassium
pada keseluruhan sumur pemantauan
memiliki sebaran terbanyak pada
rentang konsentrasi sekitar 1-6 mg/L.
Apabila dihubungkan dengan
normalitas, maka distribusi data
konsentrasi potassium pada analisis ini
dianggap tidak normal, sebab terdapat
kecenderungan data yang menceng ke
nilai > 4 mg/L. Hal ini tentunya akan
membuat nilai tengah (median) tidak
sama dengan nilai mean dari data
tersebut.

4. Specific conductance Berdasarkan grafik scatterplot, dapat


diketahui bahwa nilai konduktansi pada
keseluruhan sumur pemantauan
memiliki sebaran terbanyak pada
rentang nilai sekitar 332-1000 S/cm.
Apabila dihubungkan dengan
normalitas, maka distribusi data nilai
konduktansi pada analisis ini dianggap
tidak normal, sebab terdapat
kecenderungan data yang menceng ke
nilai > 1000 S /L. Hal ini tentunya
akan membuat nilai tengah (median)
tidak sama dengan nilai mean dari data
tersebut.
5. Sulfate reducers (×10 3) Berdasarkan grafik scatterplot, dapat
diketahui bahwa nilai sulfate reducer
pada keseluruhan sumur pemantauan
memiliki sebaran terbanyak pada
rentang nilai sekitar 5103 
18.000103 copies/L.
Apabila dihubungkan dengan
normalitas, maka distribusi data nilai
sulafte reducers pada analisis ini
dianggap tidak normal, sebab terdapat
kecenderungan data yang menceng ke
nilai > 18.000103 copies/L. Hal ini
tentunya akan membuat nilai median
tidak sama dengan nilai mean dari data
tersebut.
6. TCE reducers (×10 3) Berdasarkan grafik scatterplot, dapat
diketahui bahwa nilai TCE reducer
pada keseluruhan sumur pemantauan
memiliki sebaran terbanyak pada
rentang nilai sekitar 5103 
580.000103 copies/L.
Apabila dihubungkan dengan
normalitas, maka distribusi data nilai
TCE reducers pada analisis ini
dianggap tidak normal, sebab terdapat
kecenderungan data yang menceng ke
nilai > 580.000103 copies/L. Hal ini
tentunya akan membuat nilai median
tidak sama dengan nilai mean dari data
tersebut.
7. VC reducers (×10 3) Berdasarkan grafik scatterplot, dapat
diketahui bahwa nilai VC reducer pada
keseluruhan sumur pemantauan
memiliki sebaran terbanyak pada
rentang nilai sekitar 5103 
2.000.000103 copies/L.
Apabila dihubungkan dengan
normalitas, maka distribusi data nilai
VC reducers pada analisis ini dianggap
tidak normal, sebab terdapat
kecenderungan data yang menceng ke
nilai > 1.000.000103 copies/L. Hal ini
tentunya akan membuat nilai median
tidak sama dengan nilai mean dari data
tersebut.
8. Temperature Berdasarkan grafik scatterplot, dapat
diketahui bahwa temperatur pada
keseluruhan sumur pemantauan
memiliki nilai yang cukup bervariasi
dengan rentang nilai yang berberiksar
antara 12,57-17,92C.
Apabila dihubungkan dengan
normalitas, maka distribusi data nilai
temperature pada analisis ini
kemungkinan dianggap normal, sebab
tidak terlihat dengan jelas adanya
kecenderungan arah data, sehingga bisa
saja nilai median akan sama dengan
nilai mean dari data tersebut.

2. Metode transformasi data


Transformasi data dapat digunakan untuk mengatasi data yang tidak terdistribusi
dengan normal. Adapun pemilihan metode transformasi yang tepat dapat dilakukan
menggunakan tangga transformasi yang dibuat oleh Tukey, dimana pemilihannnya
dapat dilakukan berdasarkan tipe juraian diagram box plot ataupun kemencengan
pada histogram.

Apabila box plot menjurai ke bawah (median lebih dekat dengan kuartil atas) atau
histogram menceng ke kiri, maka metode transformasi yang digunakan adalah yang
berada di ruas kanan secara berurutan dari transformasi x 2 sampai anti log z, sampai
didapatkan bentuk box plot ataupun histogram yang simetris (menyerupai data
normal). Kemudian apabila box plot menjurai ke atas (median lebih dekat dengan
kuartil bawah) atau histogram menceng ke kanan, maka metode transformasi yang
digunakan adalah yang berada di ruas kiri secara berurutan dari transformasi √ x
1
sampai 2
x
3. Plot data hasil transformasi
Grafik Deskripsi
1. Bicarbonate (mg/L) Berdasarkan histogram dapat
 Sebelum tarnsformasi dilihat bahwa data konsentrasi
bikarbonat cenderung menceng ke
kanan, sehingga untuk
mentranformasinya digunakan
metode transformasi ke arah kiri
sampai didapatkan bentuk
histogram yang menyerupai data
normal. Dalam percobaan ini
didapatkan bahwa histogram
menyerupai data normal pada
tansformasi √ x . Hasil transfromasi
data yang didapatkan menampilkan
histogram dengan persebaran data
yang lebih homogen, dimana dari
Shapiro-Wilk normality test hasil transfromasi tersebut
data: BICARBONATE_DISS didapatkan p-value yang nilainya
W = 0.7731, p-value = 2.47e-10 lebih mendekati distribusi normal
 Transformasi √ x (0,05), yaitu p-value =
0.000000006763.

Shapiro-Wilk normality test


data: BICARBONATEsqrt
W = 0.82257, p-value = 0.000000006763
2. Magnesium (mg/L) Berdasarkan histogram dapat
 Sebelum tarnsformasi dilihat bahwa data konsentrasi
magnesium cenderung menceng ke
kanan, sehingga untuk
mentranformasinya digunakan
metode transformasi ke arah kiri
sampai didapatkan bentuk
histogram yang menyerupai data
normal. Dalam percobaan ini
didapatkan bahwa histogram
menyerupai data normal pada
tansformasi -1/x. Hasil transfromasi
data yang didapatkan menampilkan
histogram dengan persebaran data
yang lebih homogen, dimana dari
Shapiro-Wilk normality test hasil transfromasi tersebut
data: MAGNESIUM_DISS didapatkan p-value yang nilainya
W = 0.56943, p-value = 1.155e-14 lebih mendekati distribusi normal
 Transformasi √ x (0,05), yaitu p-value =
0.000006841.
 Transformasi log10(x)

 Transformasi -1/x

Shapiro-Wilk normality test


data: MAGNESIUM1x
W = 0.90301, p-value = 0.000006841
3. Potassium (mg/L) Berdasarkan histogram dapat
 Sebelum transformasi dilihat bahwa data konsentrasi
potassium cenderung menceng ke
kanan, sehingga untuk
mentranformasinya digunakan
metode transformasi ke arah kiri
sampai didapatkan bentuk
histogram yang menyerupai data
normal. Dalam percobaan ini
didapatkan bahwa histogram
menyerupai data normal pada
tansformasi -1/x. Hasil transfromasi
data yang didapatkan menampilkan
histogram dengan persebaran data
yang lebih homogen, dimana dari
hasil transfromasi tersebut
didapatkan p-value = 0.1558 yang
nilainya >0,05 sehingga data dapat
dikatakan terdistribusi normal.

Shapiro-Wilk normality test


data: POTASSIUM_DISS
W = 0.76819, p-value = 1.827e-10
 Transformasi √ x
 Transformasi log10(x)

 Transformasi -1/x

Shapiro-Wilk normality test


data: POTASSIUM1x
W = 0.97868, p-value = 0.1558
4. Specific conductance (S/cm) Berdasarkan histogram dapat
 Sebelum transformasi dilihat bahwa data nilai specific
conductance cenderung menceng
ke kanan, sehingga untuk
mentranformasinya digunakan
metode transformasi ke arah kiri
sampai didapatkan bentuk
histogram yang menyerupai data
normal. Dalam percobaan ini
didapatkan bahwa histogram
menyerupai data normal pada
tansformasi -1/x. Hasil transfromasi
data yang didapatkan menampilkan
histogram dengan persebaran data
yang lebih homogen, dimana dari
hasil transfromasi tersebut
didapatkan p-value yang nilainya
lebih mendekati distribusi normal
(0,05), yaitu p-value = 0.001086.

Shapiro-Wilk normality test


data: SPECIFIC.CONDUCTANCE_YSI
W = 0.66261, p-value = 6.473e-13
 Transformasi √ x
 Transformasi log10(x)

 Transformasi -1/x

Shapiro-Wilk normality test


data: SPECIFIC_CONDUCTANCE1x
W = 0.94583, p-value = 0.001086
5. Dsr (copies/L) Berdasarkan histogram dapat
 Sebelum transformasi dilihat bahwa data nilai Dsr
cenderung menceng ke kanan,
sehingga untuk mentranformasinya
digunakan metode transformasi ke
arah kiri sampai didapatkan bentuk
histogram yang menyerupai data
normal. Dalam percobaan ini
didapatkan bahwa histogram
menyerupai data normal pada
tansformasi log10(x). Hasil
transfromasi data yang didapatkan
menampilkan histogram dengan
persebaran data yang lebih
homogen, dimana dari hasil
transfromasi tersebut didapatkan p-
value = 0.3178 yang nilainya >0,05
sehingga data dapat dikatakan
terdistribusi normal.

Shapiro-Wilk normality test


data: DSR
W = 0.29511, p-value < 2.2e-16
 Transformasi √ x
 Transformasi log10(x)

Shapiro-Wilk normality test


data: DSRlog10
W = 0.9833, p-value = 0.3178
6. Dhc (copies/L) Berdasarkan histogram dapat
 Sebelum transformasi dilihat bahwa data nilai Dhc
cenderung menceng ke kanan,
sehingga untuk mentranformasinya
digunakan metode transformasi ke
arah kiri sampai didapatkan bentuk
histogram yang menyerupai data
normal. Dalam percobaan ini
didapatkan bahwa histogram
menyerupai data normal pada
tansformasi log10(x). Hasil
transfromasi data yang didapatkan
menampilkan histogram dengan
persebaran data yang lebih
homogen, dimana dari hasil
Shapiro-Wilk normality test transfromasi tersebut didapatkan p-
data: DHC value yang nilainya lebih
W = 0.32617, p-value < 2.2e-16 mendekati distribusi normal (0,05),
yaitu p-value = 0.04039.
 Transformasi √x

 Transformasi log10(x)

Shapiro-Wilk normality test


data: DHClog10
W = 0.97024, p-value = 0.04039
7. Vcr (copies/L) Berdasarkan histogram dapat
 Sebelum transformasi dilihat bahwa data nilai Vcr
cenderung menceng ke kanan,
sehingga untuk mentranformasinya
digunakan metode transformasi ke
arah kiri sampai didapatkan bentuk
histogram yang menyerupai data
normal. Dalam percobaan ini
didapatkan bahwa histogram
menyerupai data normal pada
tansformasi log10(x). Hasil
transfromasi data yang didapatkan
menampilkan histogram dengan
persebaran data yang lebih
homogen, dimana dari hasil
transfromasi tersebut didapatkan p-
value = 0.05692 yang nilainya
>0,05 sehingga data dapat
dikatakan terdistribusi normal.

Shapiro-Wilk normality test


data: VCR
W = 0.26458, p-value < 2.2e-16
 Transformasi √ x
 Transformasi log10(x)

Shapiro-Wilk normality test


data: VCRlog10
W = 0.97239, p-value = 0.05692
8. Temperature Berdasarkan histogram dapat
 Sebelum transformasi dilihat bahwa data nilai temperature
cenderung menceng ke kanan,
sehingga untuk mentranformasinya
digunakan metode transformasi ke
arah kiri sampai didapatkan bentuk
histogram yang menyerupai data
normal. Dalam percobaan ini
didapatkan bahwa histogram
menyerupai data normal pada
tansformasi log10(x). Hasil
transfromasi data yang didapatkan
menampilkan histogram dengan
persebaran data yang lebih
homogen, dimana dari hasil
Shapiro-Wilk normality test transfromasi tersebut didapatkan p-
data: TEMP_YSI value = 0.07842 yang nilainya
W = 0.96224, p-value = 0.01157 >0,05 sehingga data dapat
dikatakan terdistribusi normal.
 Transformasi √x

 Transformasi log10(x)

Shapiro-Wilk normality test


data: TEMPlog10
W = 0.97439, p-value = 0.07842
KESIMPULAN

Berdasarkan percobaan transformasi data dan hasil uji normalitas menggunakan Rcmdr,
dapat disimpulkan bahwa transformasi data dapat digunakan untuk mengatasi data yang
tidak terdistribusi dengan normal, hal ini dapat dibuktikan dengan hasil p-value setelah
transformasi pada keseluruhan data yang lebih mendekati atau bahkan lebih dari 0,05.
Pada percobaan yang telah dilakukan, diketahui bahwa data yang nilai p-valuenya >0,05
adalah potassium, Dsr, dan Vcr, sedangkan data lainnya hanya lebih mendekati nilai 0,05.
REFERENSI

Permana, R.D. (2014). Praktikum Statistika dan Penyajian Data. Yogyakarta: Sekolah
Vokasi Universitas Gadjah Mada.

Anda mungkin juga menyukai