Anda di halaman 1dari 23

MAKALAH BIOSTATISTIK

“Descriptive Statistics, Probability, and Measures of Central Tendency”


Dosen : Ns. Rahmah Widyaningrum, M.Kep

Disusun oleh :

Hafshah Nur Attariq


Hanif Jueni Siregar
Istiara Anis Valeni

SEKOLAH TINGGI ILMU KESEHATAN MADANI YOGYAKARTA


BANTUL
2022/2023
KATA PENGANTAR

Puji syukur kami panjatkan kehadirat Allah ‫ﷻ‬, karena berkat rahmat dan karunia-
Nya, sehingga kami dapat menyelesaikan makalah ini dengan baik dan dibuat sesuai dengan
waktu yang telah ditentukan.
Makalah ini kami buat untuk memenuhi tugas mata kuliah Biostatistik tentang
”Descriptive Statistics, Probability, and Measures of Central Tendency”.
Tidak lupa kami memohon maaf apabila terdapat kesalahan dalam pembuatan
makalah ini, baik yang disengaja maupun tidak disengaja. Kami mengucapkan terima kasih
kepada dosen pengajar sebagai pendukung dalam pembuatan makalah ini. Mengingat
pengetahuan dan wawasan kami dalam pembuatan makalah ini masih kurang dari kata
sempurna, maka kami mengharapkan adanya masukan dari berbagai pihak.
Demikian makalah ini dibuat, semoga dapat memberikan manfaat. Terima kasih.

Yogyakarta, 26 September 2022

Penulis
DAFTAR ISI

KATA PENGANTAR......................................................................................................................

DAFTAR ISI....................................................................................................................................

BAB I : PENDAHULUAN..............................................................................................................

A. Latar belakang........................................................................................................................
B. Rumusan masalah..................................................................................................................
C. Tujuan....................................................................................................................................

BAB II : PEMBAHASAN...............................................................................................................

A. Perbandingan statistik deskriptif dan statistic inferensial......................................................


B. Define, distinguish between, and interpret the mean, median, mode and standard
deviation.................................................................................................................................
C. Indentify unimodal, bimodal, and multimodal distributions.................................................
D. Determine which measure of central tendency is appropriate in a given date set.................
E. Calcute and interpret a standard deviation and range for a given data set.............................
F. Explain descriptive results from a given data set using a Statistical Package for the
Social Sciences (SPSS)..........................................................................................................
G. Printout...................................................................................................................................
H. Define propbability and explain the range of possible propbabilities...................................
I. Compare and contrast frequency and contrast frequency and probability distributions........
J. Contrast positive and negative distribution skews and describe where the outliers are
present....................................................................................................................................

BAB III : PENUTUP.......................................................................................................................

A. Kesimpulan............................................................................................................................
B. Saran......................................................................................................................................

DAFTAR PUSTAKA.......................................................................................................................
BAB I
PENDAHULUAN

A. Latar Belakang
Statistik adalah salah satu cabang ilmu yang sering digunakan dalam sebuah
penelitian. Statistik merupakan sebuah ilmu yang khusus untuk mempelajari tentang
bagaimana cara dalam mengumpulkan data, menyajikan data, menganalisis data serta
berinterpretasi tentang data tersebut. Data dalam statistik dapat berupa data numerik
maupun kategorik Terdapat dua metode statistik yang sering dipakai dalam penelitian
yaitu statistik deskriptif dan statistik inferensial. Kedua metode tersebut memiliki
perbedaan dalam hal penggunaanya serta memiliki fungsinya masing-masing. Oleh
karena itu pembahasan mengenai statistik deskriptif dan statistik inferensial menjadi
sesuatu hal yang penting.

B. Rumusan Masalah
1. Apa yang dimaksud dengan Statistik Deskriptif ?
2. Apa yang dimaksud dengan Statistik Inferensial ?
3. Apa perbedaan antara Statistik Deskriptif dan Statistik Inferensial ?
4. Apa fungsi dari Statistik Deskriptif dan Statistik Inferensial ?

C. Tujuan
1. Untuk mengetahui pengertian dari Statistik Deskriptif ?
2. Untuk mengetahui pengertian dari Statistik Inferensial ?
3. Untuk mengetahui perbedaan Statistik Deskriptif dan Statistik Inferensial ?
4. Untuk mengetahui fungsi dari Statistik Deskriptif dan Statistik Inferensial ?
BAB II
PEMBAHASAN

A. Perbandingan Statistik Deskriptif dan Statistik Inferensial

Statistik deskriptif merupakan proses transformasi data penelitian dalam bentuk


tabulasi sehingga mudah dipahami dan di interpretasikan. Informasi yang di dapatkan
yang berasal dari statistik deskriptif ini antara lain ukuran pemusatan data, ukuran
penyebaran data, dan juga kecenderungan suatu gugus data.

Statistik inferensial adalah metode yang digunakan untuk mengetahui populasi


berdasarakan  sampel dengan menganalisis dan menginterpretasikan data menjadi sebuah
kesimpulan (Hatani, 2008). Statistik inferensial ini juga merupakan suatu rangkuman dari
semua metode atau cara yang berkaitan dengan analisis sebagian data, yang mana
selanjutnya akan sampai pada peramalan ataupun penarikan kesimpulan tentang
keseluruhan data induk dari populasi tersebut. Sifat statistik inferensial yaitu (1) data
yang dianalisis  berasal dari random sampling; (2) menggeneralisasikan dan meramalkan
baik tentang ciri penting suatu variabel maupun hubungan antar variabel; (3) generalisasi
dan ramalan yang dibuat diberlakukan bagi keseleruhan populasi atas dasar hasil analisis
data dari sampel; dan (4) generalisasi dan ramalan dilaksanakan dengan uji hipotesis atau
pengecekan asumsi.

Statistik deskriptif hanya terbatas dalam penyajian data pada bentuk tabel, diagram,
ataupun grafik serta besaran lainnya. Statistik deskriptif bertujuan untuk mendeskripsikan
karakteristik data.  Sementara statistik inferensial tidak hanya mencakup statistik
deskriptif saja, tetapi juga dapat dipakai dalam melakukan estimasi serta penarikan
kesimpulan kepada populasi dari sampelnya. Statistik inferensial bertujuan untuk
mengambil kesimpulan untuk populasi dengan menganalisis sampel.

Setelah variabel-variabel yang menarik dalam penelitian telah ditentukan, perawat dan
ahli statistik biasanya melihat satu set yang disebut statistik deskriptif yang
memungkinkan mereka untuk mengetahui lebih banyak tentang setiap variabel. Sebuah
variabel dapat dijelaskan dalam dua cara utama :
 Dalam hal nilai atau tendensi sentralnya
 Dalam hal seberapa jauh pengamatan menyebar dari pusat variable

Kita akan mulai dengan mendefinisikan tendensi sentral. Tendensi sentral merupakan
indikator dari pusat data. Namun, mendefinisikan tendensi sentral dari suatu distribusi
secara lebih spesifik tidaklah mudah, karena jawabannya bergantung pada teknik analisis
yang digunakan yang pada gilirannya bergantung pada tingkat pengukuran data. Mari kita
mulai dengan meninjau tingkat pengukuran Pertama, variabel nominal menggambarkan
perbedaan kategoris, seperti jenis kelamin. Satu-satunya ukuran tendensi sentral untuk
data nominal adalah modus, yang merupakan ukuran yang paling sering muncul dalam
data. Misalnya, jika sampel Anda mencakup 15 pria dan 5 wanita, modusnya adalah 15
pria. Jika Anda melihat grafik batang pada Gambar 3-1, Anda dapat dengan mudah
mengidentifikasi mode karena ini adalah kolom tertinggi. Ini adalah contoh distribusi
unimodal, di mana hanya ada satu mode.

Jika sampel kode ZP mencakup tujuh orang yang tinggal di 14617, tujuh orang yang
tinggal di 14619, dan enam orang yang tinggal di 14621, kedua nilai 14617 dan 14619
memiliki kejadian tertinggi dan sama, maka sampel tersebut memiliki dua mode dan
disebut bimodal. Sekali lagi, jika Anda melihat diagram batang seperti pada Gambar 3-2.
Anda dapat dengan mudah melihat bahwa ini adalah variabel himodal karena dua kolom
untuk kode ZIP 14617 dan 14615 memilik sampel besar bahkan mungkin multimodal
yaitu, mereka memiliki lebih dari dua mode.

B. Mean, median, modus dan simpangan baku


Data yang diurutkan (ordinal, interval, atau rasio) memiliki ukuran tendensi sentral
kedua: median Jika Anda mengurutkan semua nilai terukur dari yang terkecil hingga yang
terbesar, nilai di tengah daftar adalah median. Sebagai contoh, anggaplah sekelompok
siswa membikinitai berikut pada ujian keperawatan terbaru mereka: 66,74, 83, 83, 88, 94,
96, 97, 99. Nital median adalah 88, yang berada tepat di tengah. Atau misalkan orang
pertama yang mengambil ujian hipa menyerahkannya, jadi jumlah ujiannya genap: 74, 83,
83, 88, 94, 36, 97, 99. Maka median sebenarnya adalah rata-rata keempat dan nilai
kelima: (+94) 2, atau 91% Modus dalam data ini adalah 83. Anda dapat melihat bahwa
ukuran tendensi sentral tidak selalu menghasilkan hasil yang sama. Inilah alasan utama
mengapa sulit mendefinisikan tendensi santral Mungkin ukuran tendensi sentral yang
paling umum dikenal adalah mean, yang merupakan jumlah nilai dibagi dengan jumlah
total pengamatan. Misalnya, jika Anda menambahkan semua nilal ujian asli yang
tercantum pertama di atas dan membaginya dengan jumlah siswa yang mengikuti ujan,
Anda menemukan bahwa rata-rata nilalan ali adalah 86,67: (6674+ 83 83-88 54+ 96 97
99+) 9. Sekali lagi, mean tidak sama dengan median atau modus. Masing-masing adalah
ukuran tendensi sentral yang berbeda. Mereka bahkan mungkin nomor yang sama (seperti
dalam distribusi normal, yang akan kita bicarakan nanti dalam bobin), tetapi mereka tidak
harus sama dan mereka semua memiliki definisi yang berbeda. Mean dapat dihitung
hanya jika data yang tersedia berada pada ting Anda tidak dapat menghitung rata-rata
pada data ordinal atau nominal. Pikirkan tentang ini: Apa jenis kelamin "ra rata"?
Pertanyaan itu tidak masuk akal. Data nominal atau ordinal tidak cocok untuk
perhitungan rata-rata. Namun, bahkan dengan data tingkat interval atau rasio, Anda dapat
memutuskan untuk menggunakan median daripada rata-rata untuk ukuran tendensi sentral
Anda. Ini sering dianggap sebagai pilihan yang lebih baik. Mengapa median dianggap
sebagai statistik yang lebih baik untuk digunakan daripada mean? Siswa dalam kursus apa
pun harus sangattertarik dengan jawabannya. Katakanlah nilai berikut dicatat pada ujan
akhir:71/200 22, 35, 38, 40, 41, 41, 42, 43, 44, 45, 46, 47, 48, 99, 100, 100 Jelas, kelas,
secara keseluruhan, tidak mengerjakan ujian ini dengan baik. Faktanya, dari 16 orang
yang mengikuti ujian, hanya 3 yang lulus, dengan nilai yang jauh lebih tinggi staripada
siswa lainnya. Ketiga skor ini adalah outlier (pengamatan yang secara signifikan berbeda
dari sampel lainnya) dan dapat mendistorsi mean sementara meninggalkan median relatif
tidak berubah, Mari lihat Rata-rata dari data tersebut adalah 52,6 Median dari data
tersebut adalah 43,5.Anda dapat melihat bahwa 43,5 adalah perkiraan tendensi sentral
yang jauh lebih baik, dan sebenarnya rata-ratanya sangat tinggi hanya karena tiga skor
teratas, yang sangat berbeda dari data lainnya. Jika Anda mendapat skor 48 pada tes ini,
Anda melakukannya dengan cukup baik dibandingkan dengan teman sekelas Anda,
mencetak lebih tinggi dari 75% dari mereka. Namun, bagaimana jika profesor Anda
memutuskan untuk melihat rata-ratanya saja? Dia mungkin memberi tahu Anda bahwa
Anda bahkan tidak mengalahkan nilai rata-rata untuk kelas, meskipun hanya tiga orang
yang benar-benar mengungguli Anda.

C. Range dan Sampel Standart Deviasi

Variabel dapat bervariasi dari pusat atau tendensi sentralnya, dan variasi tersebut dapat
dijelaskan dengan dua istilah. Pertama, range adalah selisih antara nilai maksimum dan
nilai minimum suatu variabel. Misalnya, dalam suatu sampel mungkin ada lima subjek
berusia 10, 14, 20, 55, dan 95. Rentang usia sampel adalah 85 tahun (95 tahun dikurangi
10 tahun), atau dapat juga dilaporkan 10 hingga 95 tahun. bertahun-tahun. Standar deviasi
adalah jarak rata-rata nilai dari mean variabel. Ketika standar deviasi besar, penyebaran di
antara nilai-nilai dalam kumpulan data besar, menunjukkan sampel yang heterogen.
Ketika penyimpangannya kecil, sebagian besar skor sangat dekat dengan skor rata-rata,
menunjukkan sampel yang lebih homogen. Anda mungkin menemukan bahwa, meskipun
denyut jantung rata-rata sama pada unit postpartum seperti pada unit perawatan intensif
jantung, kisaran dan standar deviasi pada denyut jantung secara substansial berbeda (lihat
Gambar 3-3). Pasien pascapersalinan umumnya merupakan kelompok homogen wanita
muda yang relatif sehat dengan detak jantung yang seharusnya mendekati normal.
Sebaliknya, pasien ICU jantung adalah sampel yang lebih heterogen dengan variasi besar
dalam denyut jantung yang diamati; beberapa akan cukup tinggi dan yang lain akan
sangat rendah. Kedua kelompok mungkin memiliki rata-rata detak jantung yang sama,
tetapi rentang dan standar deviasi pada detak jantung yang diamati secara substansial
berbeda. Anda dapat melihat ide ini dillustrasikan secara gratis pada Gambar 3-3. Pusat
data pada setiap kurva adalah mean, yang sama pada kedua sampel. Namun, detak
jantung yang diamati dalam sampel postpartum didistribusikan secara ketat di sekitar
rata-rata itu, sedangkan detak jantung yang diamati dalam sampel ICU jantung tersebar
jauh lebih banyak.
D. Menghitung Standart Deviasi

Deviasi standar lebih sulit untuk dihitung daripada rentang, tetapi tidak terlalu sulit.
Misalkan Anda mengumpulkan detak jantung untuk pasien yang hari 1 pasca melahirkan
di unit postpartum Anda dan menemukan bahwa denyut jantung rata-rata adalah (45+60 +
75 +90) 4 = 67,5 (lihat Tabel 3-1). Rumus untuk standar deviasi (9) ditunjukkan pada
Gambar 3-4. Dalam waktu kurang versi "matematis".

DARI STATISTIK Brendan Heavey


Mengapa Ada n 1 dalam Penyebut Varians Sampel?
Bukankah akan jauh lebih mudah untuk mengingat varians sampel jika penyebutnya tidak
mengandung n 12 Jawabannya adalah ya, mengingat rumus akan jauh lebih mudah jika
kita hanya membuang n 1 dan memasukkan n ke dalam penyebutnya. Faktanya, ketika
ukuran sampel kumpulan data kami meningkat, n menjadi semakin dapat diabaikan.
Namun, dalam sampel kecil, kita dapat melihat bahwa rata-rata sampel jauh lebih dekat
dengan setiap nilai sampel daripada rata-rata populasi. Pikirkan tentang ini: Meskipun
rata-rata sampel adalah deskriptor yang layak dari tengah sampel kami, rata-rata populasi
bahkan tidak harus berada dalam kisaran sampel kami! Mari kita pikirkan sebuah contoh.
Jika Anda tertarik untuk memperkirakan detak jantung rata-rata manusia dalam ritme
sinus normal, Anda dapat mengambil sampel 10 sukarelawan sehat yang berbeda. Setiap
sukarelawan akan memiliki perbedaan kecil dalam detak jantung individu tergantung
pada jam berapa Anda mengambil denyut nadi mereka, seberapa banyak mereka telah
bergerak pada saat-saat menjelang pengukuran Anda, indeks massa tubuh (BMI) mereka,
dan sebagainya. Katakanlah Anda memilih untuk menguji detak jantung setiap orang lima
kali berbeda dan mengambil rata-rata pengukuran tersebut untuk dilaporkan; hasil Anda
mungkin terlihat seperti ini: detak Jantung Diukur pada Lima Waktu Yang Berbeda.
Lihatlah bagaimana denyut nadi individu bervariasi di sekitar rata-rata sampel masing-
masing. Perhatikan bahwa rata rata keseluruhan umumnya lebih jauh dari titik data
daripada rata-rata sampel. Faktanya, rata-rata populasi bahkan tidak berada dalam kisaran
nilai yang tercatat dari Person 5. Mari kita hitung pembilang varians Person 5
menggunakan mean sampel:
(79-76,2)2 + (72-76,2)2 + (75-76,2)2 + (78-76.2)2 + (77-76,2)2-30,8
Sekarang, mari kita lakukan hal yang sama tetapi substitusikan mean populasinya:
(79-65.52)2+(72-65.52)2+(75-65.52)2+(78-65.52)2 + (77-65.52)2=601.112
Jelas, Orang 5 berkontribusi lebih banyak pada komponen varians populasi daripada yang
dia lakukan pada sampel, Secara umum, varians di sekitar mean sampel jauh lebih sedikit
daripada mean populasi, sehingga varians sampel cenderung meremehkan varians
populasi. Anda dapat menebus perbedaan ini, atau apa yang oleh ahli statistik disebut
bias, dengan menempatkan n 1 pada penyebut sampel perhitungan varians.
Saya tahu beberapa dari Anda mulai bertanya-tanya, "Mengapa saya berada di kelas ini
lagi? Jangan terlalu frustrasi dengan persamaan. Di sisi lain, Jika Anda hanya ingin tahu
lebih banyak tentang varians, baca fitur "Dari Ahli Statistik", yang menggali lebih jauh ke
dalam topik ini. Konsep penting untuk dipahami adalah mengapa deviasi standar itu
penting: Ini memberi tahu Anda jarak rata-rata bahwa nilai-nilai dalam distribusi Anda
jatuh dari rata-rata, dan ini memberi Anda gambaran tentang seberapa mirip atau seberapa
bervariasi sampel Anda dalam hal variabel yang Anda periksa 76/200. Kami secara
singkat menyentuh plot kotak dan kumis di bab terakhir, tetapi sekarang saya menduga
beberapa terminologi yang terlibat akan lebih masuk akal. Pada diagram pada Gambar 3-
5, Anda dapat melihat plot kotak dan kumis yang ditampilkan secara vertikal.

Kami secara singkat menyentuh plot kotak dan kumis di bab terakhir, tetapi sekarang saya
menduga beberapa terminologi yang terlibat akan lebih masuk akal. Pada diagram pada
Gambar 3-5, Anda dapat melihat plot kotak dan kumis yang ditampilkan secara vertikal.
Untuk mengembangkan plot kotak dan kumis, pertama-tama susun skor kekuatan dalam
urutan peringkat, lalu tentukan median dan kuartil. Kotak pada setiap diagram berisi
rentang interkuartil (IQR), yang merupakan 50% tengah dari skor kekuatan untuk setiap
jenis kelamin. Garis di tengah kotak adalah median skor kekuatan untuk setiap jenis
kelamin. "Kumis" menggambarkan kisaran skor yang terlihat untuk setiap jenis kelamin.
Kumis bawah adalah kuartil pertama, atau 25% terendah dari pengamatan; kumis atas
adalah kuartil keempat, atau paling atas 25% dari pengamatan. Kumpulan data ini tidak
memiliki outlier yang teridentifikasi, yang biasanya diilustrasikan oleh titik individu yang
diplot di luar kumis. Pencilan sering didefinisikan sebagai nilai yang lebih dari 1,5 kali
rentang interkuartil (panjang kotak) baik di atas atau di bawah tepi kotak (awal kuartil 2
dan akhir kuartil 3). Cutoff yang telah ditentukan ini digunakan untuk mengidentifikasi
outlier disebut sebagai pagar Tukey (Tukey, 1977). Kita dapat dengan mudah mengetahui
dengan melihat plot kotak dan kumis bahwa kumpulan data ini tidak memiliki outlier
yang teridentifikasi, skor kekuatan rata-rata lebih tinggi untuk pria daripada wanita, dan
wanita memiliki rentang skor kekuatan yang lebih besar. Metode ini jauh lebih cepat
daripada melihat data mentah, yang merupakan alasan lain mengapa ilustrasi grafis bisa
sangat membantu saat Anda memprese Kita juga dapat melihat plot kotak dan kumis
secara horizontal (Gambar 3-6). Tidak peduli ke arah mana grafiknya ditampilkan,
konsepnya sama. Ini adalah representasi visual dari pusat dan penyebaran kumpulan data.
E. Probabilitas dan Distribusi Normal

Probabilitas adalah konsep yang sulit untuk dipahami sepenuhnya. Faktanya, ia memiliki
begitu banyak segi yang berbeda sehingga para ahli statistik terkadang kesulitan
mendefinisikannya secara memadai. Kabar baiknya adalah, pada titik ini, Anda tidak
memerlukan pemahaman mendalam tentangnya. Sebenarnya, untuk tujuan teks ini,
pikirkan probabilitas sebagai frekuensi relatif jangka panjang. Anda harus tahu apa
artinya frekuensi relatif, tetapi apa artinya "frekuensi relatif jangka panjang"? Itu adalah
pertanyaan penting, dan tidak memiliki jawaban yang sangat baik. Mari kita lihat sebuah
contoh untuk mencoba menjelaskan konsep ini. Kita akan meninjau kembali eksperimen
kuno melempar dadu. Tabel 3-2 menunjukkan hasil pelemparan satu dadu 10 kali dan
menghitung berapa kali dadu menunjukkan angka 3 pada wajahnya. Frekuensi kumulatif
dan relatif yang terkait dengan setiap gulungan ditabulasikan dalam dua kolom terakhir.
Kali ini, kita akan fokus pada kolom terakhir, frekuensi relatif. Frekuensi relatif adalah
jumlah total berapa kali Anda menggulung nilai tertentu (dalam hal ini, 3) dari jumlah
total gulungan.
Jika Anda melihat kolom frekuensi relatif dengan cermat, Anda akan melihat bahwa itu
dimulai dengan rendah dan kemudian, segera setelah kita menggulung 3. frekuensi relatif
melonjak hingga 0,5. Faktanya, jika kita melanjutkan eksperimen ini untuk waktu yang
lama, lompatan akan bertanjut selamanya-setiap kali Anda melempar 3 lagi,
pembilangnya bertambah. Namun, setiap lompatan akan lebih kecil dari yang terakhir
(karena setiap gulungan juga meningkatkan penyebut).Hanya untuk bersenang-senang,
kami melakukan hal ini dan memplot frekuensi relatif lebih dari 1.000 gulungan pada
Gambar 3-7.Perhatikan bahwa, setelah beberapa saat, frekuensi relatif penggulingan 3
menjadi sekitar 0,16, atau 1/6. Pada awalnya,frekuensi relatif melompat ke atas dan ke
bawah, tetapi setelah sekitar 100 gulungan, kita dapat dengan jelas melihat tren menetap.
Kami sepenuhnya mengharapkan ini maju karena dadu memiliki enam sisi, dan jika kita
melempar dadu 1 juta kall,kita akan mengharapkan sekitar 1/6 gulungan muncul 3.
Karena kita dapat melihat pola utama yang dikembangkan setelahnya. 100 gulungan
dalam percobaan ini, kami mendefinisikan "jangka panjang sebagai 100
gulungan.Namun, perlu diingat bahwa definisi dapat berubah di antara eksperimen.
F. BERGERAK MAJU: STATISTIK INFERENSIAL

Setelah peneliti selesai menggambarkan variabel yang mereka minati, mereka biasanya
suka membuat kesimpulan tentang populasi berdasarkan pengukuran yang telah mereka
ambil dalam sampel mereka. Praktik ini, yang disebut statistik inferensial, melibatkan
pengaitan probabilitas dengan setiap variabel yang dipelajari. Probabilitas adalah peluang
bahwa hasil tertentu akan terjadi. Sebagai contoh, katakanlah sebuah kelas yang terdiri
dari 100 mahasiswa keperawatan memiliki 25 pria dan 75 wanita, dan kita ingin
mengetahui probabilitas bahwa seorang mahasiswa yang dipilih secara acak dari kelas ini
adalah wanita. Jawabannya adalah 75/100, atau 0,75, atau 75%. Probabilitas penting
karena, tidak peduli seberapa cermat dan tepat peneliti, selalu ada beberapa tingkat
ketidakpastian. Bahkan jika para peneliti percaya bahwa kelas tersebut seluruhnya terdiri
dari laki laki, para peneliti tidak dapat mengatakan probabilitasnya adalah 1,0, atau 100%,
bahwa seorang siswa yang dipilih secara acak adalah laki-laki, mereka hanya bisa
mengatakan bahwa kemungkinannya mendekati 100%. (Apakah ada yang melihat film
Disney Mulan? Seorang wanita muda Cina bergabung dengan tentara kekaisaran yang
menyamar sebagai seorang pria. Jika seseorang secara acak memilih seorang prajurit
infanteri dari kelompok "semua laki-laki ini, kemungkinan Anda akan memilih seorang
pria mendekati 100%, tetapi selalu ada ruang untuk beberapa kesalahan, seperti jika
seseorang memilih Mulan secara acak dalam penyamaran.) Sebaliknya, para peneliti tidak
dapat mengatakan bahwa probabilitas memilih secara acak seorang perempuan dari apa
yang mereka yakini sebagai kelas yang seluruhnya laki-laki adalah 0,0. atau 0%. Mereka
hanya bisa mengatakan probabilitas itu sendiri, jadi di sini kita akan membahasnya secara
singkat di fitur "Dari Ahli Statistik berikutnya.

G. DISTRIBUSI FREKUENSI VS DISTRIBUSI PROBABILITAS

Anda mungkin ingat bahwa, untuk membuat distribusi frekuensi, peneliti membuat daftar
semua kemungkinan hasil atau pengamatan dan menghitung berapa kali setiap hasil
terjadi. Peneliti kemudian membuat grafik total ini untuk membuatnya lebih mudah untuk
divisualisasikan dan dipahami. Kami melihat banyak contoh bagaimana kami dapat
memilih untuk menampilkan distribusi frekuensi data sampel kami di Bab 2. Distribusi
probabilitas menggambarkan probabilitas semua hasil yang mungkin dari variabel "dalam
jangka panjang" alih-alih frekuensinya. Jumlah dari semua probabilitas individu adalah 1,
atau 100%. Ini juga berarti bahwa area di bawah kurva dalam distribusi probabilitas
dalam grafik adalah sama dengan 1, atau 100%. Seperti yang dapat Anda lihat dalam
distribusi probabilitas pada Gambar 3-8, jika kami mengumpulkan data berat lahir semua
bayi yang lahir dalam populasi kami, probabilitas memilih secara acak satu bayi dengan
berat sekitar tujuh pon adalah sekitar 50%. Sekitar setengah dari nilai berat lahir di bawah
7 pon dan sekitar setengahnya di atas. Meskipun distribusi frekuensi dan distribusi
probabilitas sangat mirip, keduanya mewakili dua konsep.

Distribusi probabilitas banyak membantu kami dalam statistik. Misalnya, saat kita
melanjutkan di buku teks, Anda akan mulai menjalankan uji statistik untuk mencari
asosiasi atau perbedaan antar variabel. Masing masing tes ini akan menghasilkan nilai-p
dan (Anda dapat menebaknya) bahwa nilai-p hanyalah probabilitas untuk menemukan
hasil yang Anda amati jika hipotesis nol benar. (Ingat, nol berarti tidak ada hubungan atau
hubungan antara variabel independen dan dependen dalam penelitian Anda.) Jadi, jika
Anda memiliki nilai p yang rendah, itu berarti kemungkinan menemukan hasil tes
tersebut jika hipotesis nol itu benar adalah sangat rendah. Jika uji statistik Anda
menghasilkan nilai p yang tinggi, itu berarti kemungkinan menemukan hasil uji tersebut
jika hipotesis nol benar sangat tinggi. Jika Anda melihat distribusi probabilitas pada
Gambar 3-9, Anda dapat melihat ide itu secara gratis. Jika penelitian Anda meneliti
hubungan antara jumlah jam yang dihabiskan dalam stoking TED dan sirkulasi perifer,
hipotesis nol Anda adalah: Tidak ada hubungan antara jumlah jam yang dihabiskan untuk
memakai stoking TED dan sirkulasi perifer. Setelah menyelesaikan analisis Anda, Anda
menemukan bahwa statistik uji Anda memiliki nilai p 0,02. Anda dapat melihat bahwa itu
jauh di ujung ekor distribusi probabilitas. Ini adalah tanda yang cukup bagus bahwa
kemungkinan menemukan hasil tes ini. benar, cukup kecil, dan Anda mungkin memiliki
cukup bukti untuk mendukung hipotesis alternatif Anda bahwa mengenakan stoking TED
memang meningkatkan sirkulasi perifer. Menentukan apakah tingkat probabilitas itu
signifikan secara statistik atau tidak bergantung pada banyak faktor lain yang akan kita
bicarakan lebih lanjut di buku ini. Untuk saat ini, ingatlah bahwa ketika Anda mendengar
nilai-p, itu adalah probabilitas untuk menemukan hasil yang Anda miliki jika hipotesis
nol itu benar. Sebagian besar waktu, peneliti menginginkan nilai p yang rendah karena
mereka benar-benar percaya hipotesis alternatif itu benar atau mereka tidak akan repot
dengan penelitian ini sejak awal.

Mari luangkan lebih banyak waktu untuk melihat perbedaan antara distribusi frekuensi
dan distribusi probabilitas. Distribusi frekuensi untuk percobaan pelemparan sebuah dadu
1.000 kali ditunjukkan pada Gambar 3-10 dan dibandingkan dengan distribusi peluang
pelemparan sebuah dadu tanpa batas. Seperti yang Anda lihat, distribusi frekuensi
memiliki takik dan perubahan, tergantung seperti apa sampel itu. Distribusi probabilitas
seragam dan tidak pernah berubah. Hubungan antara frekuensi relatif dan probabilitas
sangat mirip dengan hubungan antara sampel dan populasi. Perbedaannya bermuara pada
perbedaan mendasar antara jangka pendek (100 lemparan dadu) dan jangka panjang
(1.000, 10.000, 100.000 lemparan), dan mendefinisikan jangka panjang sedikit subjektif.
"Itu bagus," Anda mungkin berkata, "Tapi saya seorang perawat! Saya tidak akan pernah
perlu melempar dadu dan menghasilkan probabilitas terkait kecuali saya bertemu dengan
ahli statistik malang yang duduk di bar sendirian di suatu tempat!" Namun, ternyata,
melempar dadu hanyalah contoh eksperimen yang sangat sederhana. Mari kita
pertimbangkan beberapa pertanyaan dan lihat bagaimana hal itu dapat berhubungan
dengan kehidupan dan profesi Anda. Berapa probabilitas saya akan meninggal karena
penyakit kardiovaskular? • Berapa probabilitas bahwa salah satu pasien saya akan
dipulangkan sebelum saya kembali ke rumah sakit untuk bekerja pada shift berikutnya?
Berapa probabilitas bahwa obat baru akan membunuh tumor kanker di hati pasien saya
tanpa membunuh pasien saya?
Menjawab pertanyaan-pertanyaan ini dengan tingkat akurasi apa pun membutuhkan
banyak studi, banyak sampel berulang, dan menentukan probabilitas.
H. Distribusi Normal
Banyak variabel yang menarik bagi kita memiliki distribusi probabilitas yang sangat
mirip dengan distribusi yang sangat terkenal: distribusi normal, yang merupakan
distribusi probabilitas di mana mean, median, dan modusnya sama (lihat Gambar 3-11).
Faktanya, salah satu asumsi yang paling umum dalam penelitian dasar adalah bahwa
variabel memiliki distribusi probabilitas yang dapat diperkirakan dengan distribusi
normal. Distribusi normal disebut juga kurva lonceng. Dan ya, ini adalah bagaimana nilai
"melengkung" ketika tidak ada yang berhasil dalam ujian. Banyak orang percaya bahwa,
mengingat ujian yang disusun dengan baik yang diberikan pada sampel yang cukup besar,
kita harus mengharapkan distribusi nilai yang dapat diperkirakan dengan distribusi
normal
Karena mean, median, dan modus sama dalam distribusi normal, Anda mengetahui
beberapa hal tentang variabel yang terdistribusi normal (lihat Gambar 3-11): Enam puluh
delapan persen nilainya termasuk dalam satu standar deviasi dari mean. Sembilan puluh
lima persen nilainya termasuk dalam dua standar deviasi dari mean. Sembilan puluh
sembilan persen nilainya termasuk dalam tiga standar deviasi rata-rata.
DARI STATISTIK Brendan Heavey
Apa Itu Distribusi Normal?
Bagi kebanyakan peneliti, distribusi normal adalah distribusi yang paling penting dalam
semua statistik.
Dua fakta yang sangat penting tentang distribusi normal membuatnya sangat penting:
1. Jika Anda mengambil rata-rata dari banyak dan banyak sampel dari suatu populasi,
distribusi sampelnya mean (distribusi sampling mean) menjadi normal dalam jangka
panjang. Distribusi sampel memplot frekuensi sebenarnya dari suatu statistik versus
kisaran nilai yang mungkin yang dapat diperoleh statistic
2. Saat Anda menambahkan lebih banyak variabel acak bersama-sama, distribusi
keseluruhannya mendekati norma distribusi.Periksa bagaimana plot distribusi normal
pada Gambar 3-12 terlihat saat Anda menyesuaikan rata-ratanya. Sebagai mean (y) dari
distribusi meningkat dalam grafik ini, kurva bergeser ke kanan; menurun, kurva bergeser
ke kiri. Pergeseran ini adalah mengapa kami menyebut mean sebagai parameter lokasi.
Pada Gambar 3-13, lihat apa yang terjadi ketika kita mengubah varians. Jika kita hanya
mengubah varians (y) dalam rumus kita, kita akan melihat perubahan dalam skala. Saat
kita mengurangi varians, grafik menjadi lebih tinggi dan lebih kurus; saat kita
meningkatkannya, grafik menjadi lebih pendek dan lebih gemuk. Itulah sebabnya varians
diseb variable.

Berikut adalah beberapa hal penting yang kita ketahui tentang distribusi normal:
• Enam puluh delapan persen dari area di bawah kurva berada dalam 1 standar deviasi
dari mean.
• Sembilan puluh lima persen dari area di bawah kurva berada dalam 2 standar deviasi
dari mean. Meningkatkan mean membuat kurva bergeser ke kanan.
 Penurunan mean membuat kurva bergeser ke kiri.
 Penurunan varians membuat grafik terlihat lebih tinggi dan kurus.
 Meningkatkan varians membuatnya terlihat lebih pendek dan lebih gemuk.
Hal penting yang dapat kita lakukan dengan variabel normal apa pun adalah
mengubah distribusinya menjadi standar distribusi normal. Ini memaksa semua area
di bawah kurva jatuh di bawah kurva normal dengan rata-rata dari 0 dan standar
deviasi 1. Kami melakukan ini dengan rumus transformasi yang ditunjukkan pada
Gambar 3-14. Jika Yadalah variabel yang terdistribusi normal, persamaan ini
menghasilkan Z, yang merupakan variabel normal standar. Variabel normal standar
sangat bagus karena kita tahu banyak tentang probabilitasnya. Misalnya, 5% dari
probabilitas ditemukan di luar Z 1,96.

I. Distribusi Cekat
Tentu saja, tidak semua sampel terdistribusi normal. Misalnya, beberapa sampel miring;
mereka memiliki distribusi nilai variabel yang asimetris di sekitar mean sehingga satu
ekor lebih panjang dari yang lain (lihat Gambar 3-15). Skewing biasanya disebabkan oleh
sejumlah besar outlier. Ketika outlier berada di sebelah kanan, kemiringannya positif; jika
sebagian besar outlier berada di sebelah kiri, kemiringannya negatif. Dalam distribusi
miring, mean, median, dan modus tidak sama. Ingat tes di mana Anda mendapat skor 48
tetapi hanya tiga orang yang mendapat skor lebih tinggi? Itu adalah contoh condong
positif yang dihasilkan oleh outlier.

Hal menarik lainnya yang dapat kita lakukan ketika kita memiliki distribusi normal
adalah menghitung statistik uji yang disebut skor-Z. Z-score adalah ukuran standar yang
memberi tahu Anda berapa banyak standar deviasi pengamatan dari mean. Jika nilai
dalam kumpulan data di atas rata-rata atau rata-rata, itu akan memiliki skor Z positif. Jika
di bawah rata-rata atau rata-rata, itu akan memiliki Z-score negatif. Semakin besar nilai
absolut dari Z-score, semakin jauh nilainya dari nilai rata-rata atau mean dalam kumpulan
data. Misalnya, seorang perawat pendidik memberikan pretest kepada sekelompok
penderita diabetes yang baru didiagnosis sebelum mengajarkan tentang teknik injeksi
insulin. Skor tes berdistribusi normal, dengan skor rata-rata 70% dan standar deviasi
empat poin. Skor Z untuk nilai tes 70% adalah 0, dan skor Z 1,0 sesuai dengan skor tes
74%. Skor Z 2,0 terletak 2,0 standar deviasi di atas rata-rata dan, dalam contoh ini, sesuai
dengan skor tes 78%; sebaliknya, nilai 2 0,5 terletak 0,5 standar deviasi di bawah rata-
rata, atau, dala contoh ini, nilai tes 68%. Rumus untuk menghitung Z-score dalam suatu
populasi ditunjukkan pa 3-14 dan hanya nilai yang diamati dikurangi mean, yang
kemudian dibagi dengan standar deviasi. Skor-Z dapat membantu karena kita mengetahui
probabilitas terkait (seperti 95%) dari nilai-nilai yang berada di antara dua simpangan
baku atau skor-2 sekitar 2 hingga +2. Skor-Z juga distandarisasi sehingga kami dapat
menggunakannya untuk membandingkan nilai yang berbeda dari kumpulan data yang
berbeda. Misalnya, pasien rehabilitasi ortopedi dengan skor tes mobilitas fungsional 12
dan nilai Z-score yang sesuai 1, dan rentang skor gerak 17 dengan Z-score yang sesuai
0,5, berarti pasien melakukan lebih baik daripada rata-rata penduduk dalam mobilitas
fungsional tetapi lebih buruk dari rata-rata penduduk dalam rentang gerak.
BAB III
PENUTUP
A. Kesimpulan

Statistik mempunyai dua kelompok besar metode yaitu statistik deskriptif dan
statistik inferensial. Statistik deskriptif merupakan proses transformasi data penelitian
dalam bentuk tabulasi sehingga mudah dipahami dan di interpretasikan.
Sedangkan Statistik inferensial merupakan suatu rangkuman dari semua metode atau cara
yang berkaitan dengan analisis sebagian data, yang mana selanjutnya akan sampai pada
peramalan ataupun penarikan kesimpulan tentang keseluruhan data induk dari populasi
tersebut.
Penggunaan kedua jenis metode statistik ini tegantung pada ruang lingkup sebuah
penelitian. Jika ruang lingkup yaitu penyajian data, pengukuran tendensi sentral,
pengukuran variabilitas. angka indeks, dan deret berkala, maka metode statistik deskriptif
yang dipilih. Jika ruang lingkup yaitu probabilitas, metode sampel, pengujian hipotesis,
statistik parametrik, dan statistik nonparametrik, maka statistik infernsial yang akan
dipilih.

B. Saran

Adapun saran yang penulis sampaikan adalah agar pembaca dapat menggunakan
pemecahan masalah secara statistik, lebih tepat jika mengikuti tahapan yang ilmiah. Data
yang baik tentu saja harus yang mutakhir, cocok (relevan), dengan masalah penelitian dari
sumber yang dapat dipertanggungjawabkan, lengkap akurat, objektif dan konsisten.
Pengumpulan data sedapat mungkin di peroleh dari tangan pertama. Data yang baik
sangat di perlukan dalam penelitian, sebab bagaimanapun canggihnya suatu analisis data
jika tidak di tunjang oleh data yang baik, maka hasilnya kurang dapat di
pertanggungjawabkan.
DAFTAR PUSTAKA

Sulung, N, Yasril, A.l. (2020). Buku Pengantar Statistik Kesehatan (Biostatistik). Sleman:
Deepublish

Heavey, E.(2019) Statistics for Nursing A Partical Approach. Amerika Serika. Jones&Bartlett
Learning.

Ardiyanto, Rama. Statistik Deskriptif-Pengertian, Materi, Jenis-Jenis, Contoh Soal. 24 12


2019. https://rumus.co.id/statistik-deskriptif/ (diakses 2 29, 2020).

Imam Gunawan, S.pd., M.Pd. Pengantar Statistika Inferensial. Jakarta: PT RajaGrafindo


Persada, 2016.

Anda mungkin juga menyukai