PENDAHULUAN
Dan dalam makalah ini kami akan mengangkat tema “Ukuran gejala pusat data
yang belum di kelompokkan”.
Adapun maksud dan tujuan penulis membuat makalah ini agar teman-
teman lebih paham apa itu statistik yang dimana memahami secara rinci agi
tentang pengantar probabilitas,frekuensi distribusi, histogram, harga rata-
rata dan lain-lain
1
BAB II
PEMBAHASAN
2.1 HISTOGRAM
Histogram dikenal juga sebagai grafik distribusi frekuensi, salah satu jenis
grafik batang yang digunakan untuk menganalisa mutu dari sekelompok data
(hasil produksi), dengan menampilkan nilai tengah sebagai standar mutu produk
dan distribusi atau penyebaran datanya. Meski sekelompok data memiliki standar
mutu yang sama, tetapi bila penyebaran data semakin melebar ke kiri atau ke
kanan, maka dapat dikatakan bahwa mutu hasil produksi pada kelompok
tersebut kurang bermutu, sebaliknya, semakin sempit sebaran data pada kiri dan
kanan nilai tengah, maka hasil produksi dapat dikatakan lebih bermutu, karena
mendekati spesifikasi yang telah ditetapkan.
Histogram pertama kali digunakan oleh Karl Pearson pada tahun 1895
untuk memetakan distribusi frekuensi dengan luasan area grafis batangan
menunjukkan proporsi banyak frekuensi yang terjadi pada tiap kategori dan
merupakan salah satu dari seven basic tools of quality control.
2
Tetapi sebaliknya, bila sebaran data ternyata berada di dalam batas-batas
spesifikasi, maka hasil produk sudah memenuhi spesifikasi mutu yang
ditetapkan.
1. Mengumpulkan data.
Sampel data haruslah dapat mewakili populasinya. Berapa jumlah sampel yang
dapat mewakili populasi dapat dipelajari loebih jauh di bidang kajian statistik atau
metodologi penelitian.
2. Pengolahan data.
Pengolahan data ini menjadi bagian yang tidak kalah pentingnya dengan langkah
pertama agar Histogram memberikan gambaran yang akurat tentang kondisi
hasil produk, terutama dalam menentukan besaran nilai tengah (standar) dan
seberapa banyak kelas-kelas data yang akan menggambarkan penyebaran data
yang tercipta.
3
4. Menentukan ujung kelas
Ujung kelas pertama biasanya diambil dari terkecil. Kelas berikutnya dihitung
dengan cara menjumlahkan ujung bawah kelas.
5. Menghitung nilai frekuensi histogram masing-masing kelas.
6. Menggambarkan diagram batangnya
Standar deviasi disebut juga simpangan baku. Seperti halnya varians, standar
deviasi juga merupakan suatu ukuran dispersi atau variasi. Standar deviasi
merupakan ukuran dispersi yang paling banyak dipakai. Hal ini mungkin karena
standar deviasi mempunyai satuan ukuran yang sama dengan satuan ukuran
data asalnya. Misalnya, bila satuan data asalnya adalah cm, maka satuan
standar deviasinya juga cm. Sebaliknya, varians memiliki satuan kuadrat dari
data asalnya (misalnya cm2). Simbol standar deviasi untuk populasi adalah σ
(baca: sigma) dan untuk sampel adalah s.
Contoh:
Data umur berbunga (hari) tanaman padi varietas Pandan Wangi adalah sbb:
84 86 89 92 82 86 89 92 80 86 87 90
4
Sampel y y2
1 84 7056
2 86 7396
3 89 7921
4 92 8464
5 82 6724
6 86 7396
7 89 7921
8 92 8464
9 80 6400
10 86 7396
11 87 7569
12 90 8100
2.3 POPULASI
Populasi berasal dari kata bahasa inggris population, yang berarti jumlah
penduduk. Populasi adalah wilayah generalisasi yang terdiri atas obyek/subyek
yang mempunyai kualitas dan karakteristik tertentu yang ditetapkan oleh peneliti
untuk dipelajari dan kemudian ditarik kesimpulan (Sugiyono, 2013: 117).
Menurut Nazir (1983:327) mengatakan bahwa popuasi adalah berkenaan
5
dengan data bukan barang atau bendanya. Pengertian lainnya, diungkapkan
oleh Nawawi yang menyebutkan bahwa populasi adalah keseluruhan objek
penelitian yang terdiri dari manusia, benda-benda, hewan, tumbuh-tumbuhan,
gejala-gejala, nilai tes, atau peristiwa-peristiwa sebagai sumber data yang
memiliki karaktersitik tertentu di dalam suatu penelitian. Sedangkan Ridwan
(2002: 3) mengatakan bahwa populasi adalah keseluruhan dari karakteristik atau
unit hasil pengukuran menjadi objek penelitian.
6
2.4 SAMPEL
a. Sax (1979: 181) mengemukakan bahwa sampel adalah suatu jumlah yang
terbatas dari unsur-unsur yang terpilih dari suatu populasi, unsur-unsur
tersebut hendaklah mewakili populasi.
b. Warwick (1975:69) mengemukakan pula bahwa sampel adalah sebagian
dari suatu hal yang luas, yang khusus dipilih untuk mewakili keseluruhan.
c. Kerlinger (1973:118) menyatakan: Sampling is taking any portion of a
population or universe as representative of that population or universe.
d. Leedy (1980:111) mengemukakan bahwa sampel dipilih dengan hati-hati
sehingga dengan melalui cara sedemikian peneliti akan dapat melihat
karakteristik total populasi.
Dari pengertian-pengertian di atas dapat disimpulkan bahwa sampel adalah
bagian dari jumlah dan karakteristik yang dimiliki oleh populasi. Bila populasi
besar, dan peneliti tidak mungkin mempelajari semua yang ada pada
populasi, misalnya karena keterbatasan dana, tenaga dan waktu, maka
peneliti dapat menggunakan sampel yang diambil dari populasi itu,
kesimpulannya akan diberlakukan untuk populasi. Untuk itu sampel yang
diambil dari populasi betul-betul representatif (mewakili).
7
tiap kelas. Distribusi frekuensi merupakan salah satu bentuk klasifikasi data, yaitu
klasifikasi data secara kuantitatif.
Distribusi kategorikal
8
Dalam hal ini pembuat distribusi terlebih dahulu harus dapat menghitung
persentase pada masing-masing kelompok. Distribusi akan memberikan
informasi yang lebih jelas tentang posisi masing-masing bagian dalam
keseluruhan, karena kita dapat melihat perbandingan antara kelompok yang satu
dengan kelompok yang lainnya.walaupun demikian kita masih belum
memperoleh gambaran yang jelastentang penyebab adanya perbedaan tersebut.
Berikut adalah rumus mencari Distribusi frekuensi relatif:
2.6 PROBABILITAS
“Probabilitas” ialah suatu nilai yang digunakan untuk mengukur tingkat terjadinya
suatu kejadian acak.
Dalam mempelajari probabilitas, ada tiga kata kunci yang harus diketahui :
1. Eksperimen,
2. Hasil (outcome)
Contoh :
9
2.6.1 Manfaat Probabilitas Dalam Penelitian
Dengan teori probabilitas kita dapat menarik kesimpulan secara tepat atas
hipotesis yang terkait tentang karakteristik populasi.
Mengukur derajat ketidakpastian dari analisis sampel hasil penelitian dari suatu
populasi.
Kita tahu bahwa kumpulan hasil pengamatan mengenai sesuatu hal, skor
hasil belajar para siswa, berat bayi yang baru lahir, gaji pegawai di suatu
perusahaan misalnya, nilai datanya bervariasi dari yang satu dengan yang lain.
Karena adanya variasi atau ragam ini untuk sekumpulan data, telah dihitung alat
ukurnya, utamanya varians. Kita lihat juga bahwa varians bersama-sama rata-
rata telah banyak digunakan untuk membuat kesimpulan mengenai populasi ,
baik secara deskriptif maupun secara induktif melalui penaksiran dan pengujian
hipotesis mengenai parameter.
Dalam bab ini, varians akan dibahas lebih lanjut dengan terlebih dahulu melihat
berbagai jenis varians kemudian menggunakannya untuk pengujian hipotesis
melalui teknik analisis varians, disingkat ANAVA (ANA dari analisis dan VA dari
varians).
10
yang menyebabkan terjadinya peristiwa dapat diduga atau diramalkan dalam
arah tertentu, merupakan pengaruh sistematik sehingga menyebabkan terjadinya
varians sistematik. Cara mengajar yang dilakukan seorang ahli secara sistematik
mempengaruhi kemajuan anak didik lebih baik bila dibandingkan dengan
kemajuan anak yang diajar sembarangan, hasil skor ujiannya menggambarkan
adanya varians sistematik.
Salah satu jenis varians sistematik dalam kumpulan data hasil penelitian
adalah varians antar kelompok atau kadang-kadang disebut pula varians
eksperimental. Varians ini menggambarkan adanya perbedaan atau variasi
sistematik antara kelompok-kelompok hasil pengukuran. Dengan demikian
varians ini terjadi karena adanya perbedaan antara kelompok-kelompok individu.
Dalam bagian ini akan dibahas perluasan, yaitu menguji kesamaan k, (k >
2), buah rata-rata populasi. Tepatnya, misalkan kita mempunyai k, (k > 2), buah
populasi yang masing-masing berdistribusi independent dan normal dengan rata-
rata 1 , 2 , . . . , k dan simpangan baku berturut-turut 1 , 2 , . . . , k . Akan
diuji hipotesis nol H 0 dengan tandingan H 1 :
Selain daripada asumsi kenormalan tentang populasi, untuk pengujian ini juga
akan dimisalkan bahwa populasi bersifat homogen ialah bahwa
12 22 ... k2 .
Dari tiap populasi secara independent kita ambil sebuah sample acak, berukuran
n 1 dari populasi kesatu, n 2 dari populasi ke dua dan seterusnya berukuran n k
dari populasi ke k.
Data sample akan dinyatakan dengan Y ij yang berarti data ke-j dalam sample
yang diambil dari populasi ke-i. Untuk memudahkan, sebaiknya data sample
disusun seperti dalam Daftar XIV (1).
Dalam statistika, rata-rata, rerata, atau rataan (Bahasa Inggris: mean) memiliki
tiga arti yang berkaitan:
11
rerata aritmetik, pengertian yang paling umum dikenal awam,
nilai harapan dari suatu peubah acak, dan
ukuran pemusatan dari suatu sebaran probabilitas.
Rerata merupakan salah satu konsep sentral dalam statistika matematis dan,
bersama dengan varians, menjadi bagian penting dalam berbagai penurunan
berbagai metode statistika.
Dipandang dari sisi matematis, rerata adalah momen pertama dari suatu peubah
acak. Momen pertama mengenai rerata dari suatu peubah acak disebut
simpangan (deviasi).
12
Populasi
Jika adalah mean dari sampel random dengan ukuran yang diambil dari
populasi dengan mean dan variance , maka distribusi limit dari
13
mendekati distribusi normal standar saat . Secara matematis dapat
dituliskan dalam persamaan berikut.
CLT secara umum dapat digunakan untuk sampel besar. Dalam hal ini,
nilai sudah dikatakan cukup besar. Semakin besar nilai , maka
aproksimasi CLT akan semakin akurat atau semakin mendekati distribusi normal.
Eksperimen,
Hasil (outcome)
Kejadian atau peristiwa (event)
14
Teknik ini mungkin merupakan teknik yang paling mudah dan paling banyak
digunakan untuk mendeskripsikan data. Distribusi frekuensi mengindikasikan
jumlah dan persentase responden, obyek yang masuk ke dalam kategori yang
ada. Teknik ini biasanya digunakan untuk memberikan informasi awal dalam
penelitian tentang obyek atau responden.
Cross-Tabulations
Korelasi
Satu hal yang perlu diingat adalah “korelasi tidak menyatakan hubungan sebab-
akibat”. Dari contoh di atas, korelasi hanya menyatakan bahwa ada relasi antara
lamanya waktu belajar dengan nilai ujian tinggi, namun bukan “lamanya waktu
belajar menyebabkan nilai ujian tinggi”.
Regresi
15
(independent) dan variabel terikat (dependent), misalnya lama waktu belajar
dengan nilai ujian. Regresi sederhana berusaha memprakirakan nilai ujian
dengan lamanya waktu belajar. Analisis regresi mengindikasikan kepentingan
relatif satu atau lebih variabel dalam memprediksi variabel lainnya.
t-test
Teknik t-test digunakan bila periset ingin mengevaluasi perbedaan antara efek.
Sebagai contoh, periset mungkin tertarik dalam perbedaan kepuasan kerja untuk
orang-orang yang berbeda tingkat pendidikannya. Teknik analisis yang banyak
digunakan adalah membandingkan dua kelompok, misalnya mereka yang
mendapat pendidikan universitas dengan mereka yang tidak, dengan
menggunakan mean kelompok sebagai dasar perbandingan. t-test akan
mengindikasikan apakah perbedaan antara kedua kelompok tersebut signifikan
secara statistika.
F-test
F-test menguji apakah populasi tempat sampel diambil memiliki korelasi multiple
(R) nol atau apakah terdapat sebuah relasi yang signifikan antara variabel-
variabel independen dengan variabel-variabel dependen.
Analisis Validitas
16
BAB III
PENUTUP
3.1 KESIMPULAN
Sampel data haruslah dapat mewakili populasinya. Berapa jumlah sampel yang
dapat mewakili populasi dapat dipelajari loebih jauh di bidang kajian statistik atau
metodologi penelitian.
Standar deviasi disebut juga simpangan baku. Seperti halnya varians, standar
deviasi juga merupakan suatu ukuran dispersi atau variasi. Standar deviasi
merupakan ukuran dispersi yang paling banyak dipakai. Hal ini mungkin karena
standar deviasi mempunyai satuan ukuran yang sama dengan satuan ukuran
data asalnya. Misalnya, bila satuan data asalnya adalah cm, maka satuan
standar deviasinya juga cm. Sebaliknya, varians memiliki satuan kuadrat dari
data asalnya (misalnya cm2). Simbol standar deviasi untuk populasi adalah σ
(baca: sigma) dan untuk sampel adalah s.
3.2 SARAN
Sebaiknya pembaca lebiih teliti lagi membaca tulisan ini,di karenakan ada hal
yang kalian anggap remeh tetapi sebenarnya mengandung makna lebih jika di
teliti lebih lanjut.
17
DAFTAR PUSTAKA
http://www.hendrisetiawan.com/2014/05/contoh-makalah-statistika-
deskriptif_11.html
https://id.wikipedia.org/wiki/Histogram
https://www.google.co.id/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja
&uact=8&ved=0ahUKEwi93-
TnrcrYAhUMp48KHSbbCk8QFggnMAA&url=https%3A%2F%2Fwww.scribd.com
%2Fdoc%2F223455477%2FMakalah-Histogram-Citra-
docx&usg=AOvVaw0qiipJo-aAg1eEaD49pNs6
http://www.statsdata.my.id/2014/06/pengantar-probabilitas.html
https://hrisdianto.files.wordpress.com/2010/02/pengantar-probabilitas-drs1-arief-
a-m-si.pdf
https://statmat.id/distribusi-frekuensi/
https://smartstat.wordpress.com/2010/03/29/distribusi-frekuensi/
http://statistikpendidikanii.blogspot.co.id/2008/04/mean-rata-rata.html
https://kbbi.web.id/varian
https://www.rumusstatistik.com/2013/07/varian-dan-standar-deviasi-
simpangan.html
http://caraharian.com/rumus-simpangan-baku.html
http://www.sarjanaku.com/2013/01/pengertian-populasi-sampel-dan-
sampling.html
http://www.sarjanaku.com/2013/01/pengertian-populasi-sampel-dan-
sampling.html
18