Statistik Deskriptif

• Pada kebanyakan penelitian klinis, mereka akan mengumpulkan data kualitatif.
• Awalnya data ini ada dalam bentuk mentah, artinya, kumpulan data ini tidak
mengandung makna yang berarti, hanya merupakan sekumpulan angka hasil
pengamatan.
• Agar data ini berguna sebagai ukuran kinerja kelompok, data tersebut harus
diatur, diringkas, dan dianalisis, sehingga maknanya dapat dikomunikasikan.
• Hal tersebut adalah fungsi dari cabang matematika yang disebut statistika.
• Statistika deskriptif digunakan untuk mengkarakterisasi bentuk, tendensi
sentral, dan variabilitas dalam sekumpulan data, dengan maksud untuk
menggambarkan suatu populasi
Jumlah skor (sample) Distribusi
Distribusi Frekwensi
• Meskipun inspeksi visual dari suatu distribusi memungkinkan kita untuk

melihat semua skor, daftar ini bisa terlalu Panjang dan sulit dipahami, dan
tidak memadai untuk menggambarkan kelompok ini atau
membandingkannya dengan kelompok lain mana pun.
• Kita dapat mulai meringkas data dengan menyajikannya dalam distribusi
frekuensi.
• Distribusi frekuensi adalah tabel skor urutan peringkat yang menunjukkan
berapa kali setiap nilai muncul, atau frekuensinya (f).
• Sekarang kita dapat mengetahui dengan lebih mudah bagaimana skor
didistribusikan. Kita bisa melihat skor terendah dan tertinggi, dimana skor
cenderung mengelompok, dan skor mana yang paling sering terjadi.
• Kadang-kadang frekuensi lebih
bermakna dinyatakan sebagai
persentase dari distribusi total.
• Kita dapat melihat persentase yang
diwakili oleh setiap skor dalam
distribusi, atau persentase kumulatif
yang diperoleh dengan menambahkan
nilai persentase untuk setiap skor ke
semua persentase yang berada di
bawah skor tersebut.
• Ketika data klinis dikumpulkan, peneliti akan sering menemukan bahwa
sangat sedikit subjek yang memperoleh skor yang sama persis.
• Jika setiap skor hanya memiliki frekwensi 1, membuat

distribusi frekuensi adalah proses yang tidak
berguna.
• Dalam situasi spt ini, distribusi frekuensi yang

dikelompokkan dapat dibangun dengan
mengelompokkan skor ke dalam kelas, atau interval,
di mana setiap kelas mewakili rentang skor yang unik
dalam distribusi.
• Frekuensi kemudian ditetapkan untuk setiap interval

• Tabel dibawah menunjukkan distribusi frekuensi yang dikelompokkan untuk
rentang data gerak.
• Kelas mewakili rentang 10 derajat. Kelas-kelas

tersebut saling eksklusif (tidak tumpang tindih)
dan lengkap dalam kisaran skor yang diperoleh.
• Pilihan jumlah kelas yang akan digunakan dan

jangkauan dalam setiap kelas adalah keputusan
mutlak peneliti. Itu tergantung pada rentang
skor keseluruhan, jumlah pengamatan, dan
seberapa banyak detail yang relevan untuk
audiens yang dituju
• Meskipun informasi secara inheren hilang dalam data yang dikelompokkan,
pendekatan ini seringkali merupakan satu-satunya cara yang layak untuk
menyajikan data yang dapat dipahami ketika sejumlah besar informasi
dikumpulkan untuk data yang berkelanjutan.
• Pengelompokan harus dikelompokkan untuk mengungkapkan fitur penting dari

data. Peneliti harus menyadari bahwa pilihan jumlah kelas dan kisaran dalam
setiap kelas dapat mempengaruhi interpretasi bagaimana suatu variabel
didistribusikan
Distribusi Frekwensi dalam bentuk Grafik
• Representasi grafis dari data sering mengkomunikasikan informasi tentang tren

dan karakteristik umum dari distribusi yang lebih jelas dibandingkan distribusi
frekuensi tabular.
• Metode yang paling umum untuk membuat grafik distribusi frekuensi adalah
plot batang dan daun (Stem-and-leaf plot), histogram, dan polygon frekuensi.
Stem-and-leaf plot
• Plot batang-dan-daun adalah distribusi frekuensi berkelompok halus yang
paling berguna untuk menyajikan pola distribusi variabel kontinu.
• Di dalam statistik, stem-and-leaf plot merupakan alat untuk menyajikan data
kuantitatif dalam format grafis, untuk membantu dalam memvisualisasikan
bentuk distribusi data yang sering digunakan dalam analisis eksplorasi.
• Stemplot diperkenalkan oleh Arthur Bowley di awal tahun 1900-an.
• Namun penggunaannya secara umum baru dimulai pada tahun 1980 setelah
John Tukey’s mempublikasikan Exploratory Data Analysis pada tahun 1977
• Stem-and-leaf plot memberikan informasi lebih banyak tentang nilai yang
sebenarnya dibanding histogram.
• Seperti dalam histogram, panjang setiap batang sesuai dengan jumlah
kejadian yang jatuh ke dalam interval tertentu. Namun, pada Histogram kita
hanya bisa melihat nilai frekuensi dari data saja, tetapi kita tidak tahu berapa
nilai angka sebenarnya.
• Sedangkan pada Stem-and-leaf Plot selain kita bisa mengetahui nilai
frekuensinya, kita pun bisa tau berapa nilai data sebenarnya. Hal ini dilakukan
dengan membagi nilai-nilai yang diamati menjadi dua komponen, stem dan
leaf
• Stem-and-leaf plot menyajikan data
dengan cara memisahkan setiap nilai
menjadi dua bagian: bagian batang (stem)
yaitu digit angka paling kiri dan diikuti
dengan angka berikutnya, yaitu daun (leaf),
digit angka paling kanan
• Skor memiliki digit paling kiri dari 6 sampai
13. Nilai-nilai ini menjadi batang. Digit
terakhir di setiap skor menjadi daun. Untuk
membaca plot batang dan daun, kita
melihat ke seberang setiap baris,
menempelkan setiap digit daun ke batang
• Oleh karena itu, baris pertama mewakili skor
60 dan 68; baris kedua, 72, 77 dan 77; baris
ketiga, 80, 82, 84, 85 dan 86; dan seterusnya.
• Tampilan ini memberikan ringkasan data
yang ringkas, dengan tetap menjaga
integritas data asli.
• Jika kita membandingkan plot ini dengan
distribusi frekuensi yang dikelompokkan,
jelas seberapa banyak informasi yang
diberikan oleh plot batang-dan-daun dalam
ruang kecil, dan bagaimana ia menyediakan
elemen tampilan tabel dan grafik.
Tujuan utama Stem-and-leaf plot adalah untuk hal berikut ini:
•Apakah pola pengamatan simetris.
•Penyebaran atau variasi dari data pengamatan.
•Apakah terdapat outlier (nilai-nilai yang berada jauh dari yang
lainnya).
•Titik pemusatan data.
•Ada Lokasi yang merupakan gap (kesenjangan dalam data)
Histogram
• Histogram adalah grafik batang, terdiri dari serangkaian kolom, masing-masing
mewakili satu skor atau interval kelas.
• Gambar 17.1A adalah histogram yang

menunjukkan distribusi skor sikap yang diberikan
pada Tabel 1 7.1.
• Frekuensi setiap skor diplot pada sumbu Y

(vertikal), dan variabel yang diukur, dalam hal ini
skor sikap, berada pada sumbu X (horizontal).
Bar dipusatkan di atas skor.
Frequency Polygon
• Poligon frekuensi adalah plot garis, di mana setiap titik pada garis mewakili
frekuensi atau persentase
• Gambar sebelah mengilustrasikan poligon

frekuensi untuk data sikap.
• Ketika data yang dikelompokkan digunakan,

titik-titik dalam grafik terletak di titik tengah
setiap interval kelas untuk mewakili frekuensi
di kelas itu
Bentuk-bentuk Distribusi
• Ketika grafik distribusi frekuensi digambar, distribusi dapat dicirikan oleh
bentuknya.
• Meskipun data nyata jarang mencapai kurva yang mulus, perbedaan kecil
sering diabaikan dalam upaya untuk menggambarkan bentuk distribusi secara
keseluruhan.
• Beberapa distribusi simetris dimana masing-masing setengah adalah
bayangan cermin dari yang lain.
• Kurva A dan B pada Gambar dibawah adalah simetris.
• Ketika skor sama di seluruh distribusi, bentuknya digambarkan sebagai
seragam, atau persegi panjang, seperti yang ditunjukkan pada Kurva A.
• Kurva B mewakili kasus khusus dari distribusi simetris yang disebut distribusi
normal.
• Dalam terminologi statistik, "normal" mengacu pada jenis tertentu dari

distribusi berbentuk lonceng di mana sebagian besar skor jatuh di tengah
skala dan semakin sedikit yang jatuh di ekstrem.
• Distribusi miring adalah asimetris.
• Sejauh mana distribusi menyimpang dari simetri adalah kemiringannya.
• Kurva C pada Gambar 17.2 miring positif, atau miring ke kanan, karena sebagian
besar skor mengelompok di ujung bawah dan hanya beberapa skor di ujung
atas yang menyebabkan ekor kurva mengarah ke kanan.
• Jika kita merencanakan distribusi untuk

pendapatan keluarga tahunan di Amerika
Serikat, misalnya, itu akan condong positif,
karena sebagian besar keluarga memiliki
pendapatan rendah hingga sedang.
• Ketika kurva "mengekor" ke kiri, distribusinya
miring negatif, atau miring ke kiri, seperti pada
Kurva D. Kita mungkin melihat distribusi miring
negatif jika kita memplot nilai ujian untuk tes
mudah, di mana relatif sedikit siswa mencapai
skor rendah
Central Tendency
(ukuran pemusatan data)
• Meskipun distribusi frekuensi memungkinkan kita untuk mengurutkan data

dan mengidentifikasi pola kelompok, mereka tidak memberikan ringkasan
kuantitatif praktis dari karakteristik kelompok.
• Indeks numerik diperlukan untuk menggambarkan sifat "khas" data dan untuk
mencerminkan konsep yang berbeda dari "pusat" distribusi. Indeks ini disebut
ukuran tendensi sentral, atau rata-rata.
• Istilah rata-rata dapat menunjukkan tiga ukuran yang berbeda dari tendensi
sentral: modus, median, dan mean
Mode
• Mode adalah skor yang paling sering muncul dalam suatu distribusi.
• Ini paling mudah ditentukan dengan pemeriksaan distribusi frekuensi.
• Distribusi frekuensi pada Tabel disebelah menunjukkan

bahwa mode untuk data sikap adalah 15 karena terjadi
sembilan kali, lebih banyak daripada skor lainnya.
• Ketika interval kelas digunakan, mode diambil sebagai

titik tengah interval dengan frekuensi terbesar.
• Ketika lebih dari satu skor terjadi dengan
frekuensi tertinggi, distribusi dianggap
bimodal (dengan dua mode) atau multimodal
(dengan lebih dari dua mode).
• Banyak distribusi variabel kontinu tidak
memiliki mode
• Modus hanya memiliki aplikasi terbatas
sebagai ukuran tendensi sentral untuk data
kontinu, tetapi dapat berguna dalam penilaian
variabel kategorik.
• Misalnya, untuk menentukan kategori
diagnostik yang paling sering terlihat di klinik
Median
• Median adalah sebuah distribusi yang diurutkan peringkat menjadi dua

bagian yang sama, sehingga nilai yang berada diatas sama banyaknya dengan
yang berada di bawahnya.
• Ketika distribusi berisi jumlah skor ganjil, seperti 4, 5, 6, 7, 8, skor tengah, 6,
adalah median.
• Dengan jumlah skor genap, titik tengah antara dua skor tengah adalah
median, sehingga untuk deret 4, 5, 6, 7, 8, 9, median terletak di tengah
antara 6 dan 7. Oleh karena itu, mediannya sama dengan 6,5 .
• Keuntungan median sebagai ukuran tendensi sentral adalah tidak
dipengaruhi oleh nilai skor ekstrim.
• Ini adalah indeks posisi rata-rata dalam distribusi, bukan jumlah. Oleh karena
itu, Median merupakan ukuran yang berguna dalam menggambarkan
distribusi miring (skewed distribution).
• Misalnya, harga rata-rata sebuah rumah biasanya disebut dalam median,
karena distribusinya cenderung miring ke kanan.
Mean
• Mean adalah jumlah dari sekumpulan skor dibagi dengan banyaknya skor, n .
• Ini adalah nilai yang kebanyakan orang sebut sebagai "rata-rata".
• Simbol yang digunakan untuk menyatakan mean suatu populasi adalah huruf
Yunani mu, μ dan mean sampel dilambangkan dengan X-Bar
Membandingkan Pengukuran Central Tendency
• Menentukan ukuran tendensi sentral mana yang paling tepat untuk

menggambarkan suatu distribusi tergantung pada beberapa faktor.
• Yang terpenting adalah data tersebut mau digunakan untuk apa.
• Skala pengukuran dari variabel adalah pertimbangan penting lainnya.
• Ketiga jenis pengukuran tendensi sentral dapat diterapkan pada variabel
pada skala interval atau rasio, meskipun mean yang paling berguna.
• Untuk data pada skala nominal, hanya modus yang bermakna.
• Jika datanya ordinal, maka median dan modus dapat diterapkan
• Penting untuk mempertimbangkan bagaimana ringkasan hasil pengukuran
akan digunakan secara statistik.
• Dari tiga ukuran tendensi sentral, mean dianggap paling stabil; yaitu, jika kita
berulang kali mengambil sampel acak dari suatu populasi, rata-rata sampel
tersebut akan berfluktuasi lebih kecil daripada mode atau median.
• Hanya mean yang dapat dimanipulasi aritmatika, menjadikannya estimasi
karakteristik populasi yang paling masuk akal.
• Untuk alasan ini, mean lebih sering digunakan dari pada median atau mode
untuk analisis statistik data rasio atau interval
• Kita juga dapat mempertimbangkan kegunaan dari ketiga ukuran tendensi
sentral untuk menjelaskan distribusi berbagai bentuk yg berbeda.
• Dengan distribusi sama dan normal, yang manapun dari ketiga rata-rata dapat
diterapkan dengan valid.
• Dengan distribusi miring, bagaimanapun, rata-rata terbatas sebagai ukuran
deskriptif karena, tidak seperti median dan modus, itu dipengaruhi oleh nilai
kuantitatif setiap skor dalam distribusi dan dapat dibiaskan oleh skor ekstrim.
Misalnya, pada contoh skor ROM sebelumnya, jika subjek pertama
memperoleh skor 20, bukan 60, rata-rata akan turun dari 94,9 menjadi 93,6.
• Median dan mode tidak akan terpengaruh oleh perubahan ini
• Kurva pada Gambar dibawah mengilustrasikan bagaimana ukuran tendensi
sentral dipengaruhi oleh skewness.
• Median biasanya akan berada di antara mode dan mean dalam kurva miring,
dan mean akan ditarik ke arah ekor.
• Karena sifat-sifat ini, pilihan indeks mana yang akan dilaporkan dengan
distribusi miring bergantung pada aspek informasi apa yang sesuai untuk
analisis.
• Seringkali masuk akal untuk melaporkan ketiga nilai, untuk menyajikan

gambaran lengkap tentang karakteristik distribusi
Pengukuran Variabilitas
• Bentuk dan tendensi sentral dari suatu distribusi berguna tetapi belum
lengkap untuk mendiskripsikan sebuah sample.
• Untuk mengilustrasikan hal ini, pertimbangkan dilema berikut:
 Anda bertanggung jawab untuk merencanakan hiburan musik untuk
pesta yang terdiri dari tujuh orang, tetapi Anda tidak tahu jenis musik
apa yang harus dipilih—jadi Anda memutuskan untuk menggunakan usia
rata-rata mereka sebagai panduan.
 Usia tamu adalah 3, 3, 13, 14, 59, 70, dan 78 tahun.
 Jika Anda mendasarkan keputusan Anda pada
mode 3 tahun, Anda akan membawa karakter dari
Sesame Street.
 Menggunakan median 14 tahun, Anda mungkin
menyewa band heavy metal.
 Dan menurut usia rata-rata 34,3 tahun, Anda
mungkin memutuskan untuk bermain soft rock,
meskipun tidak ada orang dalam kelompok yang
benar-benar berada dalam rentang usia tersebut.
 Dan penggemar Frank Sinatra benar-benar
terabaikan! Yang kita abaikan adalah penyebaran
usia di dalam kelompok
• Pertimbangkan sekarang contoh yang lebih konkret menggunakan skor dari
coin rotation test (CRT) untuk dua kelompok pasien.
• Jika kita menggambarkan dua distribusi ini hanya dengan menggunakan
ukuran tendensi sentral, mereka akan tampak identik.
• Deskripsi sampel tidak lengkap tanpa kita dapat mengkarakterisasi
perbedaan yang ada di antara skor serta tendensi sentral dari data.
• Oleh karena itu penting juga untuk memahami lima ukuran statistik
variabilitas yang umum digunakan:
 range,
 percentiles,
 variance,
 standard deviation,
 coefficient of variation.
Range
Ukuran variabilitas yang paling sederhana adalah range, yaitu selisih antara nilai
tertinggi dan terendah dalam suatu distribusi.
Untuk nilai tes yang dilaporkan pada table diatas:
Group A range = 20 – 14 = 6
Group B range = 28 – 9 = 19
Nilai tersebut mengindikasikan bahwa Group A lebih homogen dr pd Group B

• Meskipun range adalah ukuran statistik yang relatif sederhana,namun
penerapannya terbatas, karena ditentukan hanya dengan menggunakan
dua skor ekstrem dalam distribusi.
• Ini tidak mencerminkan apa pun tentang penyebaran skor antara dua
ekstrem.
• Satu skor ekstrem yang menyimpang dapat sangat meningkatkan
jangkauan, meskipun variabilitas dalam kumpulan data lainnya tidak
berubah
• Rentang skor juga cenderung meningkat dengan sampel yang lebih besar,
menjadikannya kurang bermakna untuk membandingkan distribusi dengan
jumlah skor yang berbeda.
• Oleh karena itu, meskipun mudah dihitung, biasanya range digunakan hanya
sebagai ukuran deskriptif kasar dan biasanya dilaporkan bersama dengan
indeks variabilitas lainnya.
Daripada melaporkan rentang sebagai perbedaan antara skor,

laporan penelitian biasanya akan memberikan skor minimum dan
maksimum yang sebenarnya, yang merupakan informasi yang lebih
berguna untuk mengkarakterisasi sampel.
Percentiles dan Quartiles
• Persentil digunakan untuk menggambarkan posisi skor dalam distribusi
relatif terhadap semua skor lainnya.
• Persentil membagi data menjadi 100 bagian yang sama. Skor tertentu
terletak di salah satu bagian ini.
• Persentil berguna untuk mengubah skor aktual menjadi skor komparatif atau
untuk menyediakan titik referensi untuk menafsirkan skor tertentu.
• Misalnya, seorang anak yang sesuai dengan persentil ke-20 (P20) untuk
berat badan dalam kelompok usianya dapat dievaluasi relatif terhadap
kelompok sebayanya, dari pada hanya mempertimbangkan nilai absolut dari
berat badannya.
• Sebagian besar dari kita akrab dengan penggunaan persentil dalam ujian
standar, seperti SAT dan GRE. Jika nilai siswa berada pada persentil ke-92
(P92), nilai individu tersebut lebih tinggi dari 92% dari mereka yang
mengikuti tes.
• Kuartil membagi distribusi menjadi empat bagian yang sama, atau

seperempat.
• Oleh karena itu, ada tiga kuartil untuk kumpulan data apa pun.
• Kuartil Q1, Q2, dan Q3 sesuai dengan persentil pada 25%, 50%, dan 75% dari
distribusi (P25, P50, P75). Skor pada persentil ke-50 atau Q2 adalah median.
• Jarak antara kuartil pertama dan ketiga, Q3 - Q1, disebut jangkauan
interkuartil, yang mewakili batas-batas 50% tengah dari distribusi
• Grafik plot kotak (box plot), juga disebut plot
kotak-dan-kumis, adalah cara yang berguna
untuk menunjukkan secara visual penyebaran
skor dalam distribusi, termasuk rentang
median dan interkuartil.
• Plot kotak dapat digambar dengan " kumis"

mewakili skor tertinggi dan terendah. Kumis
juga dapat digambar untuk mewakili persentil
ke-90 dan ke-10, dan outlier di luar nilai
tersebut dapat diindikasikan sebagai lingkaran
di luar kumis.
• Kuartil sering digunakan dalam penelitian klinis sebagai dasar untuk
membedakan subkelompok dalam sampel.
• Sebagai contoh, para peneliti mempelajari hubungan antara kepadatan
tulang dan kebiasaan berjalan pada 239 wanita pascamenopause.
• Sampel dikelompokkan menjadi kuartil berdasarkan jarak berjalan
sepanjang tahun, dan keempat kelompok ini dibandingkan berdasarkan
kepadatan tulang dan beberapa variabel antropometrik.
• Kuartil menyediakan struktur untuk membuat grup perbandingan di mana
tidak ada kriteria yang jelas tersedia

Statistik Deskriptif

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Statistik Deskriptif

Diunggah oleh

Hak Cipta:

Format Tersedia

• Pada kebanyakan penelitian klinis, mereka akan mengumpulkan data kualitatif.

• Meskipun inspeksi visual dari suatu distribusi memungkinkan kita untuk

• Jika setiap skor hanya memiliki frekwensi 1, membuat

• Dalam situasi spt ini, distribusi frekuensi yang

• Frekuensi kemudian ditetapkan untuk setiap interval

• Kelas mewakili rentang 10 derajat. Kelas-kelas

• Pilihan jumlah kelas yang akan digunakan dan

• Pengelompokan harus dikelompokkan untuk mengungkapkan fitur penting dari

• Representasi grafis dari data sering mengkomunikasikan informasi tentang tren

• Gambar 17.1A adalah histogram yang

• Frekuensi setiap skor diplot pada sumbu Y

• Gambar sebelah mengilustrasikan poligon

• Ketika data yang dikelompokkan digunakan,

• Dalam terminologi statistik, "normal" mengacu pada jenis tertentu dari

• Jika kita merencanakan distribusi untuk

• Meskipun distribusi frekuensi memungkinkan kita untuk mengurutkan data

• Distribusi frekuensi pada Tabel disebelah menunjukkan

• Ketika interval kelas digunakan, mode diambil sebagai

• Median adalah sebuah distribusi yang diurutkan peringkat menjadi dua

• Menentukan ukuran tendensi sentral mana yang paling tepat untuk

• Seringkali masuk akal untuk melaporkan ketiga nilai, untuk menyajikan

Nilai tersebut mengindikasikan bahwa Group A lebih homogen dr pd Group B

Daripada melaporkan rentang sebagai perbedaan antara skor,

• Kuartil membagi distribusi menjadi empat bagian yang sama, atau

• Plot kotak dapat digambar dengan " kumis"

Anda mungkin juga menyukai