GEOSTATISTIKA TG 3202
MODUL KE – 1
KONSEP STATISTIKA DASAR
Oleh:
Benny Chandra Gea 118120088
Asisten :
Oktaria Futri Ilham 12116089
Muhammad Fadhilah Harahap 12116084
Gita Rusmala 12116090
Helen Zetri 12116014
Adelia Gita Parera 12116123
Fira Pratiwi Darsono 12117151
Dita Aprilia Hutabalian 12116033
Safna Ramadhani 12116096
Mikha Parasian GT 12116042
b. Variansi
Variansi bertujuan untuk mengetahui perbedaan tingkat data. Contohnya
perbedaan tingkat petani dan karyawan industri. Variansi juga disebut
dengan ragam data.
c. Standar Deviasi
Standar deviasi atau simpangan baku ialah salah satu cara mengukur
variasi sekelompok data kuantitatif. Besar harga standar deviasi
menunjukkan tingkat varians dari sekumpulan data.
d. Median
Median merupakan skor yang membagi distribusi frekuensi menjadi dua
saa besar (50% sekelompok objek yang diteliti terletak di bawah median
dan 50% yang lainnya terletak di atas median.
e. Modus
Modus atau mode adalah nilai variabel (atribut) yang memiliki frekuensi
terbanyak. Modus ialah skor yang mempunyai frekuensi terbanyak dalam
sekumpulan distribusi skor.
f. Kovariansi
Kovarian ialah perhitungan statistik yang membantu dan memahami
hubungan antar data.
g. Korelasi
Analisa korelasi merupakan suatu bentuk analisis inferensial yang
digunakan untuk mengetahui derajat atau kekuatan hubungan, bentuk
atau hubungan kausal dan hubungan timbal balik diantara variabel-
variabel penelitian.
III. Pengolahan Data
3. 1 Script
def mean_data(X):
'''
Params:
X:Sekuens data, np.array 1D
Return:
avg : Nilai rata-rata, float
'''
N = len(X) #Menghitung Banyak Data
sum_X = 0
for i in range(N):
sum_X = sum_X + X[i] #Menjumlahkan Tiap Elemen Data
avg = sum_X/N #Menghitung Nilai Rata-
rata, Jumlah dibagi Banyak Data
return avg
def min_data(X):
'''
Params:
X: Sekuens data, np.array 1D
Return:
min_X : Nilai X paling kecil
'''
N = len(X) #Menghitung Banyak Data
min_X = X[0] #Asumsi Nilai Minimum Awal Adalah X
def max_data(X):
'''
Params:
X: Sekuens data, np.array 1D
Return:
min_X : Nilai X paling besar
'''
N = len(X) #Menghitung Banyak Data
max_X = X[0] #Asumsi Nilai Minimum Awal Adalah X
sum_X = 0
for i in range(N):
sum_X = sum_X + (X[i]-avg_X)**2
if mode == 'populasi':
var_X = sum_X/N
elif mode == 'sampel':
var_X = sum_X/(N-1)
else:
print('Pastikan hanya memilih mode populasi atau sampel')
return var_X
def std_data(X):
'''
Params:
X: Sekuens data, np.array 1D
mode : populasi(default) dan sampel
Return:
std_X : Nilai standar deviasi X
'''
var_X = var_data(X, mode='populasi') #variansi data X
std_X = var_X ** (0.5) #standard deviasi == akar dari var_X
return std_X
def median_data(X):
'''
Params:
X: Sekuens data, np.array 1D
Return:
M : Nilai median X
'''
X = sorted(X) #sorting data
N = len(X)
if N%2 == 0: #cek N, ganjil atau genap
n = int(N/2 - 1)
m = int(N/2)
M = (X[n] + X[m]) / 2
else:
i= int((N)/2)
M = X[i] #akses nilai tengah berdasarkan i
return M
return cov_XY
return r_xy
if __name__ == "__main__":
import numpy as np
#00_ Mean
X_avg = mean_data(X) #rata-rata X
Y_avg = mean_data(Y) #rata-rata Y
print('Mean X : {0}, Mean Y : {1}'.format(X_avg, Y_avg))
#01_Min_Max
X_min = min_data(X)
Y_min = min_data(Y)
X_max = max_data(X)
Y_max = max_data(Y)
print('Min X : {0}, Max X : {1}'.format(X_min, X_max))
print('Min Y : {0}, Max Y : {1}'.format(Y_min, Y_max))
#02_Median
X_med = median_data(X)
Y_med = median_data(Y)
print('Med X : {0}, Med X : {1}'.format(X_med, Y_med))
#03_Variansi
X_var = var_data(X)
Y_var = var_data(Y)
print('Var X : {0}, Var Y : {1}'.format(X_var, Y_var))
#04_Standard_Deviasi
X_std = std_data(X)
Y_std = std_data(Y)
print('Std X : {0}, Std Y : {1}'.format(X_std, Y_std))
#05_Kovariansi
XY_cov = cov_data(X, Y)
print('Kovariansi XY : ', XY_cov)
#06_Korelasi
koef_kor = corr_coeff(X, Y)
print('Koefisien Korelasi XY : ', koef_kor)
#118120088_Benny Chandra Gea_RTGC
import numpy as np
import matplotlib.pyplot as plt
N_bins = 5
frekuensi, bins, patches = plt.hist(data, N_bins, denstiy=True, face
color='g', alpha=0.75)
plt.ylabel('Frekuensi')
plt.xlabel('Porositas [v/v]')
plt.grid(True)
plt.show()
N = 5000
porositas = porositas.values[0:N, 0]
3. 2 Langkah Kerja
Langkah pengerjaan untuk script yang pertama yaitu mencari mean,
median, modus, kovarian, korelasi, variansi, dan standar deviasi.
1. Pertama mendefinisikan dari mean data atau menentukan rata-rata dari
data tersebut.
2. Lalu, def min data. Disini akan mencari nilai minium dari data-data
yang telah ada. Kemudian juga def max data untuk mencari nilai
maksimumnya.
3. Kemudian def var data yang berfungsi untuk mencari nilai variamsi
data. Setelah didapat variansinya, maka didapat standard deviasi
dengna def std data.
4. Selanjutnya ialah def median data, disini mencari nilai tengah dari
data tersebut.
5. Def cov data ialah mencari nilai kovariansi dari XY yang
menggunakan rata-rata dari Y. Lalu def corr coef mencari koefisien
korelasi dari data XY.
6. Selanjutnya ialah membuat library numpy dan menginput data dengan
np.loadtxt.
7. Terakhir, menampilkan data-data yang sudah diolah mulai dari mean,
max dan min, median, variansi, standard deviasi, kovariansi, dan
korelasi.
Script 1
Script 2
Script 3