Anda di halaman 1dari 29

PROBLEM SET 3 “MENGENALI KARAKTERISTIK DATA”

MATA KULIAH ANALISIS DATA LINGKUNGAN

Oleh:
Putri Sandi Daniar
25321314

Asisten:
Nadiyatur Rahmatikal Wasi'ah, ST, MT

Dosen Pengampu:
Ir. Driejana, MSCE, Ph.D
Dr. Sukandar, MT

PROGRAM MAGISTER
JURUSAN TEKNIK LINGKUNGAN
FAKULTAS TEKNIK SIPIL DAN LINGKUNGAN
INSTITUT TEKNOLOGI BANDUNG
2022
KARAKTERISTIK MASING-MASING PARAMETER

1. Bikarbonat
Mean 222,008046
Standard Error 7,362163078
Median 210,1
Mode 207,7
Standard Deviation 69,06321146
Sample Variance 4769,727177
Kurtosis 4,893581382
Skewness 1,739733541
Range 402,6
Minimum 66,7
Maximum 469,3
Sum 19536,70805
Count 88

a. Histogram
30
frequency

20
10
0

100 200 300 400 500

BICARBONATE_DISS
WELL_NUMBER = 15BR WELL_NUMBER = 36BR-A

15

15
frequency

frequency
10

10
5

5
0

0
100 200 300 400 500 100 200 300 400 500

BICARBONATE_DISS BICARBONATE_DISS

WELL_NUMBER = 70BR-72 WELL_NUMBER = 71BR-C


15

15
frequency

frequency
10

10
5

5
0

100 200 300 400 500 100 200 300 400 500

BICARBONATE_DISS BICARBONATE_DISS

Berdasarkan histogram diatas, dapat dilihat bahwa konsentrasi bikarbonat pada


keseluruhan sampel analisis air tanah paling banyak berada diantara 150-250
mg/L, yaitu dua batang dengan masing-masing jumlah sampel di atas 30.
Kemudian juga terlihat bahwa histogram di atas cenderung menceng ke kanan,
dimana kemencengan ini diakibatkan oleh sampel pada well number 70BR-72
yang memiliki variasi konsentrasi yang cukup beragam dari 66,7-469,3 mg/L.
Kemencengan histogram ini bersesuaian dengan nilai skewness pada tabel
analisis deskriptif data, dimana nilainya adalah lebih besar dari 0, yaitu
1,739733541.
b. Boxplot
49
51
50
52

400
48

53
BICARBONATE_DISS

300 47
54
46
60
200

88
100

65
66
67

Berdasarkan boxplot, dapat dilihat bahwa terdapat beberapa data outlier yang
berada di luar batas atas maupun batas bawah persebaran data. Apabila
diperhatikan, rentang antara median-Q1 sedikit lebih besar dibandingkan dengan
median-Q3, artinya persebaran data dalam interquartile range cukup seragam
namun lebih dominan di daerah median-Q1, hal ini bersesuaian dengan nilai
mean, median, maupun modus dari data yang masih berada pada rentang nilai
yang dekat, yaitu sekitar 207,7-222,008046 mg/L.

c. Steam-leaf

Berdasarkan diagram stem-leaf, dapat diketahui bahwa sebaran data tidak


simetris, dan titik pemusatan data (median) berada pada nilai sekitar 210 mg/L.
Selain itu juga terlihat bahwa dalam diagram terdapat nilai yang berada cukup
jauh dari titik pemusatan data, yaitu yang berada di bawah nilai 161 mg/L (LO)
dan di atas nilai 282 mg/L (HI).

d. Q-Q plot
51 49

400
BICARBONATE_DISS

300
200
100

-2 -1 0 1 2

norm quantiles

Berdasarkan Q-Q plot di atas, dapat dilihat bahwa terdapat cukup banyak titik
data yang menjauhi garis normal.

2. Magnesium
Mean 25,84723356
Standard Error 1,429089806
Median 21,951
Mode 20,6
Standard Deviation 13,40605069
Sample Variance 179,7221952
Kurtosis 9,025562582
Skewness 3,018548108
Range 68,218
Minimum 14,182
Maximum 82,4
Sum 2274,556554
Count 88
a. Histogram

60
50
40
frequency

30
20
10
0

20 40 60 80

MAGNESIUM_DISS

WELL_NUMBER = 15BR WELL_NUMBER = 36BR-A


20

20
15

15
frequency

frequency
10

10
5

5
0

20 40 60 80 20 40 60 80

MAGNESIUM_DISS MAGNESIUM_DISS

WELL_NUMBER = 70BR-72 WELL_NUMBER = 71BR-C


20

20
15

15
frequency

frequency
10

10
5

5
0

20 40 60 80 20 40 60 80

MAGNESIUM_DISS MAGNESIUM_DISS

Berdasarkan histogram diatas, dapat dilihat bahwa konsentrasi magnesium pada


keseluruhan sampel analisis air tanah paling banyak berada diantara 20-30 mg/L
dengan jumlah sampel mencapai 60. Kemudian juga terlihat bahwa histogram di
atas cenderung menceng ke kanan, dimana kemencengan ini diakibatkan oleh
sampel pada well number 70BR-72 yang memiliki variasi konsentrasi
magnesium yang cukup beragam yaitu dari 14,182-82,4 mg/L. Kemencengan
histogram ini bersesuaian dengan nilai skewness pada tabel analisis deskriptif
data, dimana nilainya adalah lebih besar dari 0, yaitu 3,018548108.

b. Boxplot
50
51
80

49
70

52
60

48
MAGNESIUM_DISS

53
54
50
40

47
58
57
30
20

Berdasarkan boxplot dan Q-Q plot, dapat dilihat bahwa terdapat beberapa data
outlier yang berada di luar batas atas persebaran data. Apabila diperhatikan,
rentang antara median-Q1 sedikit lebih kecil dibandingkan dengan median-Q3,
artinya persebaran data dalam interquartile range cukup seragam namun lebih
dominan di daerah median-Q3, hal ini bersesuaian dengan nilai mean, median,
maupun modus dari data yang masih berada pada rentang nilai yang dekat, yaitu
sekitar 20,6- 25,84723356 mg/L.
c. Steam-leaf

Berdasarkan diagram stem-leaf, dapat diketahui bahwa sebaran data tidak


simetris, dan titik pemusatan data (median) berada pada nilai sekitar 21,1-22,9
mg/L. Selain itu juga terlihat bahwa dalam diagram terdapat nilai yang berada
cukup jauh dari titik pemusatan data, yaitu yang berada di atas nilai 26,6 mg/L
(HI).

d. Q-Q plot
51 50
80
70
60
MAGNESIUM_DISS

50
40
30
20

-2 -1 0 1 2

norm quantiles

Berdasarkan Q-Q plot di atas, dapat dilihat bahwa terdapat cukup banyak titik
data yang menjauhi garis normal.
3. Potassium
Mean 3,084923523
Standard Error 0,152358209
Median 2,615
Mode 2,2
Standard Deviation 1,429246686
Sample Variance 2,042746089
Kurtosis 5,632612478
Skewness 2,194866452
Range 7,73
Minimum 1,67
Maximum 9,4
Sum 271,47327
Count 88

a. Histogram
40
30
frequency

20
10
0

2 4 6 8 10

POTASSIUM_DISS
WELL_NUMBER = 15BR WELL_NUMBER = 36BR-A

20

20
15

15
frequency

frequency
10

10
5

5
0

0
2 4 6 8 10 2 4 6 8 10

POTASSIUM_DISS POTASSIUM_DISS

WELL_NUMBER = 70BR-72 WELL_NUMBER = 71BR-C


20

20
15

15
frequency

frequency
10

10
5

5
0

2 4 6 8 10 2 4 6 8 10

POTASSIUM_DISS POTASSIUM_DISS

Berdasarkan histogram diatas, dapat dilihat bahwa konsentrasi potasium pada


keseluruhan sampel analisis air tanah paling banyak berada diantara 2-3 mg/L
dengan jumlah sampel di atas 45. Kemudian juga terlihat bahwa histogram di
atas cenderung menceng ke kanan, dimana kemencengan ini diakibatkan oleh
sampel pada well number 70BR-72 yang memiliki variasi konsentrasi yang
cukup beragam dari 2-10 mg/L. Kemencengan histogram ini bersesuaian dengan
nilai skewness pada tabel analisis deskriptif data, dimana nilainya adalah lebih
besar dari 0, yaitu 2,194866452.
b. Boxplot
65

66

8
POTASSIUM_DISS 49

67

50
6
51
88
4
2

Berdasarkan boxplot dan Q-Q plot, dapat dilihat bahwa terdapat beberapa data
outlier yang berada di luar batas persebaran data. Apabila diperhatikan, rentang
nilai antara median-Q1 lebih kecil dibandingkan dengan median-Q3, artinya
persebaran data dalam interquartile range lebih dominan di daerah median-Q3.

c. Steam-leaf

Berdasarkan diagram stem-leaf, dapat diketahui bahwa sebaran data tidak


simetris, dan titik pemusatan data (median) berada pada nilai sekitar 2,6-2,7
mg/L. Selain itu juga terlihat bahwa dalam diagram terdapat nilai yang berada
cukup jauh dari titik pemusatan data, yaitu yang berada di atas nilai 5,0 mg/L
(HI).
d. Q-Q plot
65

66

8
POTASSIUM_DISS

6
4
2

-2 -1 0 1 2

norm quantiles

Berdasarkan Q-Q plot di atas, dapat dilihat bahwa terdapat cukup banyak titik
data yang menjauhi garis normal.

4. Specific conductance
Mean 629,1264368
Standard Error 26,95891551
Median 563,5
Mode 595
Standard Deviation 252,8970444
Sample Variance 63956,91505
Kurtosis 9,923428815
Skewness 2,943580323
Range 1494
Minimum 332
Maximum 1826
Sum 55363,12644
Count 88
a. Histogram

50
40
frequency

30
20
10
0

500 1000 1500 2000

SPECIFIC.CONDUCTANCE_YSI

WELL_NUMBER = 15BR WELL_NUMBER = 36BR-A


20

20
15

15
frequency

frequency
10

10
5

5
0

500 1000 1500 2000 500 1000 1500 2000

SPECIFIC.CONDUCTANCE_YSI SPECIFIC.CONDUCTANCE_YSI

WELL_NUMBER = 70BR-72 WELL_NUMBER = 71BR-C


20

20
15

15
frequency

frequency
10

10
5

5
0

500 1000 1500 2000 500 1000 1500 2000

SPECIFIC.CONDUCTANCE_YSI SPECIFIC.CONDUCTANCE_YSI

Berdasarkan histogram diatas, dapat dilihat bahwa nilai konduktansi pada


keseluruhan sampel analisis air tanah paling banyak berada diantara 500 S/cm
dengan jumlah sampel di atas 55. Kemudian juga terlihat bahwa histogram di
atas cenderung menceng ke kanan, dimana kemencengan ini diakibatkan oleh
sampel pada well number 70BR-72 dan 36BR-A yang memiliki variasi
konsentrasi yang cukup beragam. Kemencengan histogram ini bersesuaian
dengan nilai skewness pada tabel analisis deskriptif data, dimana nilainya adalah
lebih besar dari 0, yaitu 2,943580323.

b. Boxplot
46

45
1500
SPECIFIC.CONDUCTANCE_YSI

32
47

48

44
1000

49
53
63
500

Berdasarkan boxplot dan Q-Q plot, dapat dilihat bahwa terdapat beberapa data
outlier yang berada di luar batas atas persebaran data. Apabila diperhatikan,
rentang nilai antara median-Q1 sedikit lebih kecil dibandingkan dengan median-
Q3, artinya persebaran data dalam interquartile range lebih dominan di daerah
median-Q3.

c. Steam-leaf
Berdasarkan diagram stem-leaf, dapat diketahui bahwa sebaran data tidak
simetris, dan titik pemusatan data (median) berada pada nilai sekitar 550-590
mg/L. Selain itu juga terlihat bahwa dalam diagram terdapat nilai yang berada
cukup jauh dari titik pemusatan data, yaitu yang berada di atas nilai 910 mg/L
(HI).

d. Q-Q plot
46

45
1500
SPECIFIC.CONDUCTANCE_YSI

1000
500

-2 -1 0 1 2

norm quantiles

Berdasarkan Q-Q plot di atas, dapat dilihat bahwa terdapat cukup banyak titik
data yang menjauhi garis normal.

5. Dsr
Mean 3269861,025
Standard Error 1253547,077
Median 105793,8218
Mode #N/A
Standard Deviation 11759313,93
Sample Variance 1,38281E+14
Kurtosis 43,59194654
Skewness 6,169682617
Range 94436453,33
Minimum 5
Maximum 94436458,33
Sum 287747770,2
Count 88
a. Histogram

80
60
frequency

40
20
0

0 20000000 40000000 60000000 80000000 100000000

DSR

WELL_NUMBER = 15BR WELL_NUMBER = 36BR-A


20

20
15

15
frequency

frequency
10

10
5

5
0

0 40000000 80000000 0 40000000 80000000

DSR DSR

WELL_NUMBER = 70BR-72 WELL_NUMBER = 71BR-C


20

20
15

15
frequency

frequency
10

10
5

5
0

0 40000000 80000000 0 40000000 80000000

DSR DSR
Berdasarkan histogram diatas, dapat dilihat bahwa nilai Dsr pada keseluruhan
sampel analisis air tanah paling banyak berada di bawah 10.000.000 copies/L
dengan jumlah sampel di atas 80. Kemudian juga terlihat bahwa histogram di
atas cenderung menceng ke kanan, dimana kemencengan ini diakibatkan oleh
sampel pada well number 36BR-A yang memiliki variasi konsentrasi yang cukup
beragam dan rentang nilai antar sampel yg sangat jauh. Kemencengan histogram
ini bersesuaian dengan nilai skewness pada tabel analisis deskriptif data, dimana
nilainya adalah lebih besar dari 0, yaitu 6,169682617.

b. Boxplot
32
80000000
60000000
DSR

40000000

43
31
20000000

74
36
34
35
30
40
75
0

Berdasarkan boxplot, dapat dilihat bahwa terdapat beberapa data outlier yang
berada di luar batas atas persebaran data.

c. Steam-leaf
Berdasarkan diagram stem-leaf, dapat diketahui bahwa sebaran data tidak
simetris, dan titik pemusatan data (median) berada pada nilai sekitar 0-110.000
copies/L.

d. Q-Q plot
32

80000000
60000000
DSR

40000000

43
20000000
0

-2 -1 0 1 2

norm quantiles

Berdasarkan Q-Q plot di atas, dapat dilihat bahwa terdapat cukup banyak titik
data yang menjauhi garis normal.

6. Dhc
Mean 23642627,7
Standard Error 8607877,779
Median 274321,7565
Mode 5
Standard Deviation 80749051,18
Sample Variance 6,52041E+15
Kurtosis 27,44319579
Skewness 4,952522694
Range 570474132,9
Minimum 5
Maximum 570474137,9
Sum 2080551238
Count 88
a. Histogram

80
60
frequency

40
20
0

0 100000000 300000000 500000000

DHC

WELL_NUMBER = 15BR WELL_NUMBER = 36BR-A


20

20
15

15
frequency

frequency
10

10
5

5
0

0 200000000 500000000 0 200000000 500000000

DHC DHC

WELL_NUMBER = 70BR-72 WELL_NUMBER = 71BR-C


20

20
15

15
frequency

frequency
10

10
5

5
0

0 200000000 500000000 0 200000000 500000000

DHC DHC
Berdasarkan histogram diatas, dapat dilihat bahwa nilai Dhc pada keseluruhan
sampel analisis air tanah paling banyak berada di bawah 100.000.000 copies/L
dengan jumlah sampel di atas 80. Kemudian juga terlihat bahwa histogram di
atas cenderung menceng ke kanan, dimana kemencengan ini diakibatkan oleh
sampel pada well number 36BR-A yang memiliki variasi konsentrasi yang cukup
beragam dan rentang nilai antar sampel yg sangat jauh. Kemencengan histogram
ini bersesuaian dengan nilai skewness pada tabel analisis deskriptif data, dimana
nilainya adalah lebih besar dari 0, yaitu 4,952522694.

b. Boxplot
38
500000000
300000000

35
DHC

37

34

36
100000000

31
29
27
30
33
0

Berdasarkan boxplot dan Q-Q plot, dapat dilihat bahwa terdapat beberapa data
outlier yang berada di luar batas atas persebaran data.

c. Steam-leaf

Berdasarkan diagram stem-leaf, dapat diketahui bahwa sebaran data tidak


simetris, dan titik pemusatan data (median) berada pada nilai sekitar 0-900.000
copies/L. Selain itu juga terlihat bahwa dalam diagram terdapat nilai yang berada
sangat jauh dari titik pemusatan data, yaitu yang berada di atas nilai 11.200.000
copies/L (HI).

d. Q-Q plot
38

500000000
300000000

35
DHC

100000000
0

-2 -1 0 1 2

norm quantiles

Berdasarkan Q-Q plot di atas, dapat dilihat bahwa terdapat cukup banyak titik
data yang menjauhi garis normal.

7. Vcr
Mean 226685143,8
Standard Error 96696505,43
Median 144000,4195
Mode 5
Standard Deviation 907093626
Sample Variance 8,22819E+17
Kurtosis 53,47951389
Skewness 6,840501469
Range 7664545254
Minimum 5
Maximum 7664545259
Sum 19948292658
Count 88
a. Histogram

80
60
frequency

40
20
0

0 2000000000 4000000000 6000000000 8000000000

VCR

WELL_NUMBER = 15BR WELL_NUMBER = 36BR-A


20

20
15

15
frequency

frequency
10

10
5

5
0

0 2000000000 6000000000 0 2000000000 6000000000

VCR VCR

WELL_NUMBER = 70BR-72 WELL_NUMBER = 71BR-C


20

20
15

15
frequency

frequency
10

10
5

5
0

0 2000000000 6000000000 0 2000000000 6000000000

VCR VCR
Berdasarkan histogram diatas, dapat dilihat bahwa nilai Dsr pada keseluruhan
sampel analisis air tanah paling banyak berada di bawah 1.000.000.000 copies/L
dengan jumlah sampel di atas 80. Kemudian juga terlihat bahwa histogram di
atas cenderung menceng ke kanan, dimana kemencengan ini diakibatkan oleh
sampel pada well number 36BR-A yang memiliki variasi konsentrasi yang cukup
beragam dan rentang nilai antar sampel yg sangat jauh. Kemencengan histogram
ini bersesuaian dengan nilai skewness pada tabel analisis deskriptif data, dimana
nilainya adalah lebih besar dari 0, yaitu 6,840501469.

b. Boxplot
36
6000000000
4000000000
VCR

34
2000000000

35

30
29
28
27
38
33
31
0

Berdasarkan boxplot dan Q-Q plot, dapat dilihat bahwa terdapat beberapa data
outlier yang berada di luar batas atas persebaran data.

c. Steam-leaf

Berdasarkan diagram stem-leaf, dapat diketahui bahwa sebaran data tidak


simetris, dan titik pemusatan data (median) berada pada nilai sekitar 0-300.000
copies/L. Selain itu juga terlihat bahwa dalam diagram terdapat nilai yang berada
sangat jauh dari titik pemusatan data, yaitu yang berada di atas nilai 7.400.000
copies/L (HI).

d. Q-Q plot
36

6000000000
4000000000
VCR

34
2000000000
0

-2 -1 0 1 2

norm quantiles

Berdasarkan Q-Q plot di atas, dapat dilihat bahwa terdapat cukup banyak titik
data yang menjauhi garis normal.

8. Temperatur
Mean 14,81116279
Standard Error 0,125020105
Median 14,69
Mode 14,6
Standard Deviation 1,17279254
Sample Variance 1,375442342
Kurtosis 0,079689299
Skewness 0,607647415
Range 5,35
Minimum 12,57
Maximum 17,92
Sum 1303,382326
Count 88
a. Histogram

20
15
frequency

10
5
0

13 14 15 16 17 18

TEMP_YSI

WELL_NUMBER = 15BR WELL_NUMBER = 36BR-A


8

8
6

6
frequency

frequency
4

4
2

2
0

13 14 15 16 17 18 13 14 15 16 17 18

TEMP_YSI TEMP_YSI

WELL_NUMBER = 70BR-72 WELL_NUMBER = 71BR-C


8

8
6

6
frequency

frequency
4

4
2

2
0

13 14 15 16 17 18 13 14 15 16 17 18

TEMP_YSI TEMP_YSI
Berdasarkan histogram diatas, dapat dilihat bahwa temperatur pada keseluruhan
sampel analisis air tanah paling banyak berada di antara 14,5-15C dengan
jumlah sampel di atas 20. Kemudian juga terlihat bahwa histogram di atas
cenderung menceng ke kanan, dimana terlihat juga bahwa pada histogram
masing-masing well number memiliki kecendrungan yang sama. Kemencengan
histogram ini bersesuaian dengan nilai skewness pada tabel analisis deskriptif
data, dimana nilainya adalah lebih besar dari 0, yaitu 0,607647415.

b. Boxplot
18

53
61
60
17
16
TEMP_YSI

15
14
13

Berdasarkan boxplot dan Q-Q plot, dapat dilihat bahwa terdapat beberapa data
outlier yang berada di luar batas atas persebaran data. Apabila diperhatikan,
rentang nilai antara median-Q1 dengan median-Q3 cukup seimbang, artinya
persebaran data cukup seragam, hal ini bersesuaian dengan nilai mean, median,
maupun modus dari data yang masih berada pada rentang nilai yang sama, yaitu
sekitar 14C.

c. Steam-leaf
Berdasarkan diagram stem-leaf, dapat diketahui bahwa sebaran data tidak
simetris, dan titik pemusatan data (median) berada pada nilai sekitar 14,5-
14,9C.

d. Q-Q plot

18
53
61
17
16
TEMP_YSI

15
14
13

-2 -1 0 1 2

norm quantiles

Berdasarkan Q-Q plot di atas, dapat dilihat bahwa terdapat cukup banyak titik
data yang menjauhi garis normal.
UJI NORMALITAS

Berdasarkan hasil uji normalitas menggunakan Rcmdr, didapatkan nilai p-value pada
masing-masing parameter sebagai berikut:
• p-value bikarbonat = 2,47 × 10−10
• p-value magnesium = 1,155 × 10−14
• p-value potassium = 1,827 × 10−10
• p-value konduktansi = 6,473 × 10−13
• p-value Dsr = 2,2 × 10−16
• p-value Dhc = 2,2 × 10−16
• p-value Vcr = 2,2 × 10−16
• p-value temperatur = 0,01157
Berdasarkan nilai p-value masing-masing parameter yang nilainya kurang dari 0,05 (5%),
maka dapat disimpulkan bahwa keseluruhan data hasil analisis sampel air tanah tidak
terdistribusi secara normal. Adapun hal ini dapat disebabkan oleh banyaknya outlier pada
hasil analisis masing-masing parameter. Hasil uji normalitas ini bersesuaian dengan
analisis menggunakan histogram, boxplot, steam-leaf, dan Q-Q plot yang telah dilakukan.

Anda mungkin juga menyukai