Anda di halaman 1dari 7

PENDAHULUAN STATISTIKA DAN ANALISIS DATA

Pencarian informasi telah dilakukan oleh manusia semenjak ribuan tahun yang lalu. Namun,
pencarian informasi pada awalnya tidak didasarkan pada tradisi keilmiahan yang dapat
membawa manfaat yang lebih, atas pencarian data yang dilakukan. Oleh karena itu, dengan
dipergunakannya tradisi keilmiahan yang seringkali disebut sebagai metode ilmiah dapat
membawa informasi menjadi data yang dapat dianalisis untuk kepentingan yang lebih luas dan
mendalam.

Hal ini terbukti pada awal tahun 80’an dimana Jepang mampu menjadi salah satu negara maju
di dunia dengan memanfaatkan metode statistik dan metode berpikir statistik diantara personil
manajemen. Hal ini terbukti dengan kemampuan mereka untuk memproduksi produk-produk
berkualitas tinggi disaat negara-negara lain masih gagal untuk membuat produk serupa.

Data Dalam Keseharian

Dalam kehidupan sehari-hari kita sering menjumpai adanya data, misal data dalam sebuah
pemberitaan, perdebatan pemilu, perencanaan dan penelitian. Hasil dari suatu percobaan
maupun penelitian bisa berupa nilai numerik maupun representasi deskriptif seperti Pendidikan
terakhir seseorang SD, SMP, SMA, S1, S2 dan S3. Namun pada dasarnya nilai numerik lebih
disenangi daripada representasi deskriptif. Sebab, dengan nilai numerik kita dapat menggali
informasi yang lebih banyak untuk menggambarkan populasi yang diteliti. Dalam hal ini ada
beberapa istilah penting yang mungkin sudah sering kita dengar, seperti Data, populasi, dan
ukuran populasi. Berikut adalah makna dari beberapaistilah tersebut:

Data adalah hasil observasi atau pengamatan yang telah dikumpulkan. Data dapat berupa hasil
pengukuran (missal tinggi badan dan berat badan), hasil pengelompokan (missal jenis kelamin,
pekerjaan, hasil jawaban terhadap suatu kuisioner).

Populasi adalah total (keseluruhan) observasi yang diamati, baik berhingga maupun tak
berhingga. Contoh populasi dengan ukuran berhingga :

1. Banyaknya kartu dalam satu set kartu remi


2. Tinggi penduduk disuatu kota tertentu
3. Siswa di suatu sekolah yang diklasifikasikan berdasarkan jenis kelamin

Contoh populasi dengan ukuran tak berhingga:


1. Observasi yang diperoleh dengan mengukur tekanan udara setiap hari dari masa lalu
hingga masa yang akan datang
2. Observasi yang diperoleh dnegan mengukur curah hujan pada suatu daerah setiap
harinya dari masa lalu hingga masa depan
3. Pengukuran kedalaman danau dari semua posisi yang mungkin.

Catatan : Biasanya beberapa populasi berhingga dengan jumlah yang sangat besar,
didalam teori diasumsikan sebagai populasi dengan ukuran tak berhingga.

Ukuran Populasi adalah banyaknya observasi di dalam populasi

Ilustrasi Populasi dan Peubah (Variabel) Acak

Misalkan terdapat suatu populasi tinggi badan 10 anak balita pada suatu komplek, berikut
adalah datanya:

85,82,79,90,92,87,91,89,95,93

Misalkan variable acak 𝑋 menyatakan tinggi badan balita yang dipilih dari populasi tersebut,
sehingga 𝑋 memiliki nilai 82,90,87,91,89,93. Nilai dari variable acak 𝑋 biasanya dinotasikan
dengan huruf kecil 𝑥. Nilai dari variable acak 𝑋 dan peluangnya akan menentukan distribusi
peluang dari 𝑋

Variabel atau peubah adalah atribut yang menggambarkan seseorang, tempat, benda atau
suatu ide.

Data (observasi) adalah nilai yang berbeda-beda dari suatu variable.

Terdapat dua Tipe Variabel yaitu Variabel kategorik atau biasa disebut dengan kualitatif dan
variable numerik atau biasa disebut dengan kuantitatif. Variabel Kategorik adalah suatu
variable yang memiliki nilai berupa nama atau label contohnya seperti jenis anjing, warna bola,
golongan darah, dll. Variabel Numerik adalah variable yang memiliki nilai yang
merepresentasikan kuantitas yang dapat diukur, dalam variable numerik ini terbagi menjadi 2
jenis yaitu variable diskrit dan kontinu. Variabel Diskrit adalah variable yang memiliki nilai
numerik yang dibangun dari prises perhitungan, contohnya seperti banyaknya item barang yang
dibeli, banyaknya lampu yang rusak pada suatu stock lampu pada Gudang dll. Sedangkan
Variabel Kontinu adalah variable yang memiliki nilai numerik yang dibangun dari proses
pengukuran, contohnya waktu antrean, tinggi badan, berat badan dst.
Catatan mengidentifikasi suatu variable termasuk numerik atau kategorik terlihat mudah,
namun ada beberapa variable yang dapat merupakan variable kategorik atau numerik.
Contohnya variable usia biasanya orang langsung berfikir bahwa usia merupakan variable
numerik. Namun jika diamati berdasarkan penggolongan anak, remaja, dewasa, dna lansia,
maka usia masuk ke dalam variable kategorik.

Skala Pengukuran digunakan untuk mengelompokkan variable, terdapat 4 skala yaitu skala
nominal, dan ordinal yang digunakan untuk mendeskripsikan varibel katogorik dan skala
interval dan rasio yang digunakan untuk mendeskripsikan variable numerik.

• Skala Nominal, menglompokkan data de dalam beberapa


kategori yang tidak mengenal urutan, contohnya : jenis
kelamin, pekerjaan
Variabel Kategorik
• Skala Ordinal, menelompokkan data ke dalam beberapa
kategori yang menegnal urutan, contohnya: usia yang
dikategorikan menjadi anak-anak, remaja dan dewasa.

• Skala Interval, adalah skala terurut yang dapat digunakan


untuk mengukur dan membandingkan perbedaan diantara
nilai, tetai tidak melibatkan titik nol sebenarnya. contohnya:
suhu yang diukur dalam cercius, kita bisa mengatakan suatu
suhu adalah 0℃ dimana nilai 0℃ disini memiliki makna
bahwa suhunya 0, bukan tidak mempunyai suhu.
Variabel Numerik
• Skala Rasio, adalah skala terurut yang memungkinkan kita
untuk menyatakan rasion atau perbandingan atntara dua
nilai serta titik nol mutlaknya sudah bisa
diidentifikasi.Contohnya: Berat badan, Jika berat bdan
dikatakan 0kg artinya tidak mempunyai berat badan.

Parameter sifat-sifat dari variable acak akan menggambarkan sifat dari populasinya.
Contohnya: nilai harapan yang didefinisikan sebagai nilai rata-rata variable acak X yang
diperoleh dari percobaan yang dilakukan berulang kali juga dikenal sebagai rata-rata dari
populasi yang obsevasinya merupakan nilai dari X. Parameter adalah nilai numerik yang
menggambarkan suatu populasi, biasanya ditulis dalam huruf Yunani seperti : 𝜇 (Rata-rata
Populasi) dan 𝜎 2 (Variasi Populasi).

Tujuan dalam melakukan suatu penelitian/ Percobaan adalah untuk mengambil kesimpulan dari
populasi. Namun, jika populasinya besar akan sangat sulit jika harus mengamati seluruh nilai
atau observasi dari populasi tersebut. Oleh karena itu kita hanya akan mengambil sebagian
(subset) dari populasinya yang kita sebut dengan sample. Pengambilan sample harus bersifat
tak bias dan dapat mewakili populasi dengan baik, sehingga dalam melakukan penarikan
kesimpulan terhadap parameter populasi akurat. Salah satu metode pengambilan sample yang
memenuhi kriteria tak bias dan sering digunakan adalah pengambilan sample secara acak.

Sample Acak didefinisikan sebagai sample yang dipilih sedemikiran rupa sehingga setiap
bagian dari observasi memiliki perluang yang sama untuk dipilih.

Contoh : Akan dilakukan suatu penelitian untuk mengatahui rata-rata berat badan mahasiswa
baru Universitas Indonesia tahun 2020 (Salah satu parameter populasi). Untuk mendapatkan
hasil dari penelitian tersebut perlu dilakukan pengambilan data berat badan mahasiswa Baru
UI tahun 2020. Namun, kendala yang didapatkan adalah sangat banyaknya jumlah mahasiswa
baru UI sehingga akan membutuhkan waktu yang lama dan biaya yang lebih besar. Oleh karena
itu kita cukup mengambil sample 5 mahasiswa per program studi.

Sering kali kita mendengar kata Statistik dan Statistika, pada umumnya kebanyakan orang
tidak membedakan antara statistic dan statistika. Sebenernya statistic dan statistika adalah dua
hal yang berbeda. Statistik merupakan kumpulan data yang disajikan sedemikian rupa yang
menggambarkan suatu persoalan atau keadaan. Sedangkan statistika atau ilmu statistic adalah
pengetahuan yang berhubungan dengan cara-cara pengumpulan, penyajian, pengolahan, dan
analisis data. Lebih lanjut statistika adalah cara untuk mengolah data, pengambil kesimpulan
dan keputusan dari pengolahan data tersebut. Terdapat dua cabang ilmu dalam statistika, yaitu
Statistika deskriptif dan statistika inferensia.

Statistika Deskriptif adalah metode yang digunakan untuk mengumpulakn, meringkas,


menyajika, melakukan pengukuran pemusatan dan penyebaran data untuk mendapatkan
informasi yang lebih menarik, berguna dan lebih mudah dipahami. Penyajian data pada
statistika deskriptif biasanya berupa tabulasi penyajian dalam bentuk gafik, diagram atau
menyajikan karakteristik dari ukuran pemusatan dan penyebarannya.

Statistik Inferensia adalah metode yang digunakan untuk menarik kesimpulan terkait populasi
berdasarkan sample yang dimiliki

Ilustrasi : Berikut diberikan data penambahan pasien positive COVID 19 pada daerah DKI
Jakarta selama 2 minggu pertama pada bulan Juli 2020

198 144 215 256 231 199 308 293


236 359 404 279 275 258 304

Statistika Deskriptif :

1. Berapakah rata-rata banyaknya penambahan pasien positif COVID-19 selama 15 hari


tersebut?
2. Berapakah jumlah pasien positif COVID-19 terbanyak selama 15 hari?

Statistika Inferensi :

1. Apakah rata-rata penambahan pasien positif COVID-19 di DKI Jakarta lebih banyak
daripada daerah lainnya?

Pada bab ini akan kita bahas statistika deskriptif terlebih dahulu, Langkah awal ketika kita
diberikan suatu data adalah meringkas dan menyajikan data tersebut sehingga diperoleh
informasi yang berguna. Dalam meringkas data dapat dilakukan dengan menentukan ukuran-
ukuran yang menggambarkan sifat penting dari distribusi atau populasi. Ukuran tersebut
dikelompokkan menjadi 2 yaitu ukuran pemusatan data dan ukuran penyebaran data.

Ukuran pemusatan data adalah statistic yang memberikan informasi dimana data berkumpul
dengan ukuran/jumlah tertentu. Berikut adalah beberapa ukuran pemusatan data:

1. Rata-rata (mean)

𝑛
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 1
𝑥ҧ = = ෍ 𝑥𝑖
𝑛 𝑛
𝑖=1
Dimana
𝑥𝑖 : Data ke-𝑖
𝑛 : Banyak data

2. Kuartil
Nilai yang membagi data menjadi 4 bagian yang sama. Ada 3, yaitu:
- Kuartil bawah (kuartil pertama), 𝑞1
- Kuartil tengah (median), 𝑞2
- Kuartil atas (kuartil ketiga), 𝑞3

𝑞𝑖 = 𝑥 𝑖(𝑛+1) , 𝑖 = 1,2,3
൬ ൰
4

dimana,
𝑥(𝑘) : data ke-𝑘 (setelah data mentah diurutkan)
3. Modus adalah nilai yang sering muncul
4. Persentil
Nilai yang membagi data menjadi 100 bagian yang sama

𝑝𝑖 = 𝑥 𝑖(𝑛+1) , 𝑖
൬ ൰
100
= 1,2, … ,100
Catatan: Untuk menghitung kuartil dan persentil data harus diurutkan dulu dari yang
terkecil hingga data terbesar.

Ukuran Penyebaran Data adalah statistik yang memberikan informasi tentang bagaimana
data menyebar di sekitar pusat data. Beberapa ukuran peberana data sebagai berikut :

1. Variansi
𝑛 𝑛 𝑛
(σ 2
2
1 2
1 2 𝑖=1 𝑥𝑖 )
𝑠 = ෍(𝑥𝑖 − 𝑥ҧ ) = ൭෍ 𝑥𝑖 − ൱
𝑛−1 𝑛−1 𝑛
𝑖=1 𝑖=1
2. Simpangan baku, 𝑠, yaitu akar dari variansi.
3. Jangkauan Data (Range)

𝐽 = 𝑥𝑚𝑎𝑘𝑠 − 𝑥𝑚𝑖𝑛

4. Jangkauan Antar Kuartil

𝑑𝑞 = 𝑞3 − 𝑞1

Referensi:

[1] Walpole,R.E, Myers. R.H, Myers S.L., dan Ye K. (2013): Probability and Statistics for
Engineering and Scientist. Edisi 10. Pearson Education, Inc.

[2] Berenson,M.L, Levine,D.M, dan Krehbiel,T.C. (2012): Basic Business Statistics: Concepts
and Applications. Edisi 12. Pearson Education, Inc.

Anda mungkin juga menyukai