Anda di halaman 1dari 7

LAPORAN PRAKTIKUM 1

METODE STATISTIKA

EDA DENGAN NUMERIK

OLEH :

NAMA : ZETI ZARLINA


NIM : 60600123033
KELAS : B
KELOMPOK : 5 (LIMA)
ASISTEN : NURFADILLAH
ALHUMAERAH

PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI ALAUDDIN MAKASSAR

2023
LAPORAN PRAKTIKUM

PERTEMUAN 1

EDA DENGAN NUMERIK

I. Pendahuluan

EDA (Exploratory Data Analysis) atau dikenal dengan analisis data


eksploratif adalah pendekatan analisis untuk suatu data guna membuat gambaran
keseluruhan (summary) data sehingga mudah untuk dipahami. Proses analisis data
ini bertujuan untuk memahami karakteristik, pola, dan hubungan dalam data. EDA
dengan pendekatan numerik berfokus pada penggunaan metode dan teknik statistik
untuk menganalisis data numerik atau kuantitatif.

Dalam EDA numerik, kita menggunakan berbagai metode statistik dan


visualisasi untuk menjelajahi dan menganalisis data numerik. Pada laporan
praktikum ini, digunakan 10 data tunggal numerik yaitu 10,5,10,6,8,7,10,8,9,7. Dan
digunakan metode statistik deskriptif yang merupakan metode-metode yang
berkaitan dengan pengumpulan dan penyajian suatu data sehingga memberikan
informasi yang berguna (Walpole, 1995). Metode statistik deskriptif terdiri dari
median, mean, nilai minimun, nilai maksimal, nilai quartile, standar deviansi, dan
variansi. Metode statistik deskriptif ini akan dimasukan kedalam program RStudio.

Median adalah nilai tengah dalam sebuah data yang diurutkan. Untuk
menemukan median, perlu diurutkan dari yang terkecil hingga yang terbesar. Jika
data yang disajikan berjumlah ganjil, maka mediannya adalah nilai yang berada
(𝑛+1)
tepat ditengah susunan data. Rumus umtuk Data tunggal ganjil Me = 𝑋 + ,
2

(Me: Median, X: data ke-, n: banyak data). Namun, jika data yang disajikan
berjumlah genap maka median dapat dihitung dengan cara menemukan rata-rata
dari dua nilai yang berada di tengah susunan data. Rumus untuk Data tunggal genap
𝑛 𝑛
Me = [( 2) + ( 2 ) + 1]÷ 2.
Dalam statistik, mean merujuk pada nilai rata-rata dari sejumlah data. Nilai
mean dapat diperoleh dengan menjumlahkan seluruh nilai data, kemudian
membaginya banyaknya data. Ini memberikan nilai rata-rata dari data tersebut.
∑x
Rumus mean (rata-rata) x̄ = . (∑x : jumlah semua nilai data, n :banyak data).
n

Nilai minimum adalah nilai terendah dalam suatu himpunan data.


Sedangkan Nilai maksimum adalah nilai tertinggi dari dari suatu himpunan data.

Nilai quantile adalah salah satu konsep dalam statistika yang digunakan
untuk membagi data menjadi beberapa bagian yang sama besar. Nilai quantile
dibagi menjadi 3 yaitu; Quantil pertama (𝑄1) adalah nilai yang membagi 25% data
terendah dari yang tertinggi. Dengan kata lain, 25% data berada dibawah 𝑄1.
Quantil kedua (𝑄2 ) adalah median atau nilai tengah dari data, yang membagi data
menjadi dua bagian sama besar. Sebanyak 50% data berada dibawah (𝑄2 ). Quantil
ketiga (𝑄3 ) adalah nilai yang membagi 75% data terendah dari yang tertinggi 75%
data berada dibawah 𝑄3 .

Standar deviasi adalah suatu nilai yang menunjukkan tingkat penyebaran


data terhadap nilai rata-rata data tersebut. Standar deviasi juga dikenal dengan
𝑛
∑𝑖 =1(xi− x̄ )2
istilah simpangan baku. σ = √ n−1
.

Variansi didefinisikan sebagai nilai yang mendeskripsikan seberapa besar


data tersebar dan nilai reratanya. Oleh karena itu, nilai variansi yang besar
menggambarkan sebaran data yang besar dan jauh dari nilai reratanya.

2
∑𝑛
𝑖=1(xi −x̄ )
Rumus sampel 𝑆 2 = , dimana x̄ : rata-rata hitung sampel, n : ukuran
n−1

sampel, xi : data ke i.

∑(xi −μ)2
Rumus populasi 𝜎 2 = , dimana μ ,∶ rata − rata hitung populasi, N :
𝑁

ukuran populasi.
Dalam konteks statistika, summary mengacu pada informasi yang
digunakan untuk mayajikan gambaran singkat dari data statistic. Ini termasuk
penggunaan ukurran statistic seperti median, mean, nilai minimun, nilai maksimum,
quartile, standar deviasi dan variansi. Ringkasan statistik ini digunakan untuk
memberikan pemahaman tentang distribusi data.

II. Metode

Berikut adalah metode yang digunakan untuk menyelesaikan praktikum yaitu:


1. Dimulai dengan membuka aplikasi RStudio.
2. Input data tunggal yang sudah disiapkan
3. Lakukan analisis statistik deskriptif menggunakan fungsi yang telah ada dan
perintah R.
4. Untuk mengetahui nilai median, input: mean(Z)
5. Untuk mengetahui nilai mean, input: median(Z)
6. Untuk mengetahui nilai minimum, input: min(Z)
7. Untuk mengetahui nilai maksimum, input: max(Z)
8. Untuk mengetahui nilai quartile, input: quartile(Z)
9. Untuk mengetahui nilai standar deviasi, input: sd(Z)
10. Untuk mengetahui nilai variansi, input: var(Z)
11. Untuk mengetahui seluruh rangkuman statistik secara lengkap, input:
summary(Z)
12. Klik kata “Run” di konsol RStudio dan outputnya akan muncul
13. Selesai.
III. Hasil

A. Program
Z<-c(10,5,10,6,8,7,10,8,9,7)
median(Z)
mean(Z)
min(Z)
max(Z)
quantile(Z)
sd(Z)
var(Z)
summary(Z)

B. Output

IV. Pembahasan

Pada program EDA dengan numerik langkah awal yang dapat


digunakan untuk menyelesaikan praktikum dengan mendefinisikan nama
variabelnya menggunakan huruf Z. Dimana variabel Z ini dapat diubah sesuai
dengan variabel yang diinginkan, variabel tersebut berfungsi untuk
mendefinisikan fungsi c(), dimana fungsi “combine” ini untuk mengurutkan
list dari data yang masukkan. Ini akan digunakan untuk menggabungkan nilai
argumen dalam bentuk daftar data yang digunakan, dimana terdapat 10 data
tunggal yang dimasukkan yaitu (10,5,10, 6,8,7,10,8,9,7).

Langkah kedua dengan mencari nilai median mengguanakan


Rstudio, kita dapat menggunakan kondisi/syarat dengan sintaksis median(Z),
dimana Z adalah variabel yang ditentukan sebelumnya yang mencakuo semua
data. Jika perintah dijalankan, hasilnya 8. Kemudian kita mulai memasukkan
rumus atau syarat syntax untuk mean yang setara dengan median yaitu mean(Z)
kemudian setelah dijalankan mendapatkan hasil 8.

Kemudian masukkan rumus atau kondisi syntax min(Z) dengan min


sebagai nilai, dimana Z adalah variabel yang mencakup semua data input,
setelah dieksekusi akan memberikan output dengan nilai 5. Untuk mencari
max, masukkan syntax max(Z), setelah dieksekusi akan memberikan output
dengan nilai 10.

Begitu pula dengan quantil dan standar deviasi masukkan rumus


atau persyaratan syntax yaitu quantil(Z) dan sd(Z) setelah dijalankan
mendapatkan output dengan nilai quantil adalah 0% dari 5.00, 25% dari 7.00,
50% dari 8.00, 75% dari 9.75, dan 100% dari 10.00. dan output yang dihasilkan
dari standar deviasi setelah dieksekusi ialah 1.763834. dan untuk mendapatkan
nilai varians yaitu dengan memasukkan kondisi syntax var(Z) setelah
dieksekusi di dapatkan output dengan nilai 3.111111.

Untuk summary (ringkasan), untuk mengetahui seluruh rangkuman


nilai dari data statistik yang telah diinput mulai dari median, mean, min, max,
quantile, standar deviasi, dan varians. Sama dengan syarat pada rumus
sebelumya yaitu syntax-nya dimasukkan sebagai sum(Z) setelah dijalankan
maka itu akan memberikan output keluaran ringkasan.
V. Referensi

Febrian. 2023. Exploratory Data Analiysis (EDA) dengan orange data mining.
Diakses 26 November 2023. https://dqlab.id/dataanalisis-machine-
learning-untuk-proses-pengolahan-data

Juniardi Wilman, & Pamela Anatasa S,Pd, “Pengertian Standar Deviasi, Fungsi,
Rumus dan Cara Menghitungnya,” diakses 26 November 2023
darihttps://www.quipper.com/id/blog/mapel/matematika/standar-
deviasi.

Niko Ramadhani. (2022). https://www.akseleran.co.id/blog/rumus-varians/.


Diakses pada 27 November 2023.

Anda mungkin juga menyukai