Masrizal
Dalam penelitian, kita mencari data ilmiah, yang dengan analisis memberikan
jawaban atas pertanyaan penelitian. Data merupakan informasi mentah yang dapat
diperoleh melalui wawancara, kuesionr, observasi, atau basis data sekunder. Dengan
mengelola data dengan cara tertentu, menganalisinya dan mengartikan hasilnya, kita
menemukan jawaban yang kita cari.
Secara singkat kita akan melihat sekilas beberapa istilah dan tipe pengajian,
seperti frekuensi, ukuran tendensi sentral dan dispersi, korelasi, uji t, analisis regresi dan
sebagainya.
STATISTIK DESKRIPTIF
Statitik deskriptif meliputi transformasi data mentah kedalam bentuk yang akan
memberikan informasi untuk menjelaskan sekumpilan faktor dalam suatu situasi.
Statistik deskriptif ditunjukkan dengan frekuensi, ukuran tendasi sentral, dan dispersi.
1. Frekuensi
Frekuensi hanya mengacu pada berapa kali berbagai sub kategori dari suatu
fenomena tertentu terjadi, darimana persentase dan persentase komulatif. Jumlah
terjadinya dapat dengan mudah dihitung.
Mean atau biasa disebut dengan rerata hitung adalah ukuran tendensi sentral yang
memberikan gambaran umum mengenai data tanpa membanjiri seseorang secara tidak
perlu dengan setiap obsevasi dalam sekelompok data.
Median atau biasa disebut dengan nilai tengah dalam sekelompok observasi jika
mereka diatur, entah dalam urutan rendah-tinggi atau sebaliknya. Misalnya, untuk
melihat bagaimana median ditentukan sebagai ukuran tendensi sentral. Misalkan gaji
tahunan sembilan karyawan dalam satu departemen adalah $65.000, $30.000, $64.000,
$35.000, $63.000, $32.000, $60.000 dan $61.000. Mean gajidisini adalah sekitar
$48.333, namun mediannya $60.000. yaitu jika diatur dalam urutan yang menaik,
angkanya adalah sebagai berikut $25.000, $30.000, $32.000, $35.000, $60.000,
$61.000, $63.000, $64.000, $65.000 dan angka ditengah adalah $60.000. bila jumlah
karyawan genap maka mediannya adalah mean dari dua gaji ditengah.
Modus dalam beberapa kasus, sekelompok obsevasi tidak dapat digambarkan secara
memadai dengan mean atau median, tetapi bisa ditinjau dengan fenomena yang paling
sering terjadi.
Misal dalam satu departemen dimana ada 10 wanita kulit putih, 24 pria kulit putih, 3
wanita Amerika-Afrika, dan 2 wanita Asia, kelompok yang paling sering terjadi -
modus- adalah pria kulit putih, mean adapun median tidak dapat dihitung atau
diterapkan dalam kasus ini. Juga tidak ada cara untuk menunjukkan ukuran dispersi.
Seperti terbukti diatas, data nominal hanya dapat dideskripsikan dengan modus sebagai
ukuran tendensi sentral. Ada kemungkinan behwa suatu kumpulan data memuat
observasi bimodal. Misalnya, menggunakan skenario terlebih dahulu, bisa juga terdapat
24 pria asia yang secara khusus direkrut untuk sebuah proyek. Dengan demikian, kita
mempunyai dua modus: pria kulit putih dan pria asia.
Kita telah mengilustrasikan begaimana mean, median dan modus dapat menjadi ukuran
tendensi sentral yang berguna, berdasarkan tipe data yang dimiliki. Sekarang kita akan
membahas mengenai despersi.
Ukuran Dispersi
Selain dari mengetahui bahwa ukuran trendensi sentral adalah mean, median,
dan modus (tergantung pada tipe data yang tersedia), seseorang juga perlu mengetahui
tentang variabelitas yang eksis dalam sekumpulan observasi. Seperti ukuran tendensi
sentral, Ukuran dispersi juga khusus untuk data nominal dan interval.
Dua sekumpulan data bisa memiliki mean yang sama, tetapi dispersi bisa saja
berbeda. Misalnya bila perusahaan A bisa menjual 30, 40, dan 50 unit dari sebuah
produk selama bulan April, Mei dan Juni secara berturut-turut, dan perusahaan B
menjual 10, 40, dan 70 unit selama periode yang sama, maka mean unit yang perlu
terjual per bulan oleh kedua perusahaan adalah sama -40-unit- tetapi variabilitas atau
dispersi (dispersion) dalam perusahaan yang berakhir lebih besar.
Tiga ukuran dispersi yang berkaitan dengan mean adalah kisaran, varians, dan
standar deviasi, yang dijelaskan dibawah ini.
Tiga ukuran dispersi yang berkaitan dengan mean adalah sebagai berikut
a. Kisaran
b. Varians
Varians dihitung dengan mengurangkan mean dari tiap observasi dalam kumpulan
data, mengambil kuadrat dari selisihnya, dan membagi totalnya dengan jumlah
observasi. Dalam contoh diatas varians untuk masing-masing perusahaan adalah:
(30−40)2+(40−40)2+(50−40)2
Varians untuk perusahaan A = = 66,7
3
(10−40)2+(40−40)2+(70−40)2
Varians untuk perusahaan B = = 600
3
Seperti bisa kita lihat varians lebih besar dalam perusahaan B dibandingkan perusahaan
A. Menjadi lebih sulit bagi manajer perusahaan B untuk mengistimasi seberapa banyak
barang yang disimpan daripada bagi manajer perusahaan A. Dengan demikian, varians
memberi petunjuk mengenai seberapa menyebar data dalam sekumpulan data.
c. Standar Deviasi
Standar deviasi adalah ukuran dispersi yang lain untuk data berskala inteval dan
rasio, serta memberikan indeks penyebaran distribusi atau variabilitas dalam data. Ini
adalah ukuran dispersi yang sangat sering dipakai, dan merupakan akar kuadrat dari
varians. Dalam kasus kedua perusahaan diatas, standar deviasi untuk perusahaan A dan
B adalah √66,7 dan √600 atau 8,167 dan 24,495, berturut-turut.
Mean dan standar deviasi merupakan statistik deskriptif yang paling lazim. Standar
deviasi dalam kombinasi dengan mean adalah alat yang sangat berguna karena kaidah
statistik berikut ini, dalam distribusi normal :
1. Hampir semua obsevasi berada dalam tiga standar deviasi dari mean.
2. Lebih dari 90% obsevasi berada dalam dua stabdar deviasi dari mean.
3. Lebih dari setengah observasi berada dalam satu standar deviasi dalam mean.
Dengan menerapkan hal tersebut pada kasus perusahaan A dan B, apa yang ditunjukkan
pada manajer perusahaan A adalah bahwa jika mean adalah 40 unit, dan standar deviasi
8,167, secara sangat simplistis (yaitu tanpa menghitung standar error dan
mempertimbangkan skor z untuk tingkar kepercayaan) ia akan memerlukan kira-kira
antara 15 dan 65 unit untuk bulan depan [40± (3 x 8,167)]. Dengan kata lain dalam
semua probabilitas, perusahaan A memerlukan tidak lebih dari 65 unit. Untuk
perusahaan B, disisi lain, permintaan bisa saja sebesar 114 unit. Permintaan dapat
bervariasi diantara 0 dan 114 [40±(3 x 24,485)]-sebaran yang lebih luas.
Seperti dapat diperkirakan, bila suatu taksiran harus dibuat mengenai jumlah untuk
optimum yang harus diproduksi untuk bulan depan berdasarkan data penjualan tida
bulan, manajer perusahaan B akan mengalami kesulitan yang lebih besar dibanding
manajer perusahaan A, meskipun kedua perusahaan menjual 40 unit per bulan, dalam
mean. Daripada berusaha menaksi berapa unit yang sebaiknya diproduksi berdasarkan
mean 3 bukan yang lalu. Manajer perusahaan B dapat memilih untuk menelusuri tren
selama bulan yang sama tahun lalu dan menjadikan dasar untuk penafsiran karena
terdapat variabel yang sangat besar dalam penjualan.
Dalam contoh terdahulu perhitungan mean, dan standar deviasi dapat dilakukan karena
observasi berkaitan dengan nilai yang diukur pada skala rasio-yaitu, tidak bersifat
nominal atau ordinal. Bila onsevasi diukur entah pada skala interval atau rasio, adalah
mungkin untuk menghitung mean, lihat kembali pembahasan mengenai skala pada fur
8.3 pada Bab 8, dimana mean dikatakan tepat sebagai ukuran tendensi sentral, dan
varians dan standar deviasi dinyatakan sebagai indikator dispersi yang tepat, jika skala
interval atu rasio digunakan sebagai dasar pengukuran.
ukuran dispersi lainnya. Bila median adalah ukuran tendensi sentral, persentil, desil
dan kuartil menjadi berarti. Sama seperti median yang membagi total keseluruhan
obsevasi kedalam dua (2) bagian yang sama, kuartil membaginya kedalam empat (4)
bagian yang sama, desil kedalam sepuluh (10) dan persetil kedalam seratus (100) bagian
yang sama. Persetil digunakan jika melibatkan data yang sangat banyak. Misalnya skor
test GRE atau GMAT. Bila area observasi dibagi kedalam 100 bagian yang sama,
terdapat 99 poin persetil. Setiap skor yang ada mempunya probabilitas 0,01 untuk jatuh
dalam salah atu poin tersebut. Jika skor john berada dalam persentil ke-16, hal tersebut
menujukkan bahwa 84% mereka yang mengikuti ujian mempunyai skor yang lebih baik
darinya, sedangkan 15% lebih buruk.
Seringkali kita ingin mengetahui dimana kita berada dalam perbandingan dengan orang
lain, apakah ditengah, diatas 10 atau 25%, dibaeah 20 atau 25%, atau dimana ?
misalnya, jika dalam satu test yang diselenggarakan perusahaan. Tn choi mendapatkan
skor 78 dari total 100 poin, ia akan tidak senang jika termasuk dalam 10% terbawah
dintara rekan-rekannya (peserta test), tetapi akan cukup senang jika ia berada diantara
10% tertas, meskipun faktanya skornya tetap sama. Posisinya dalam kaitan dengan
orang lain dapat ditentukan dengan tendensi sentral, median dan persentil dimana ia
berada.
Ukuran dispersi untuk median, kisaran antarkuartil, meliputi setengah 50% dari
observasi (yaitu, observasi yang megeluarkan 25% kuartil terbawah dan teratas).
Kisaran antar kuartil dapat sangat berguna ketika harus dibuat perbandingan diantara
beberapa kelompok.
Singkatnya kita telah mengilustrasikan bagaimana mean, median, dan modus dapat
menjadi ukuran tendensi sentral yang berguna , bergantubg pada tipe data yang tersedia.
Demikian pula kita telah melihat bagaimana standar deviasi (dan varians, yang adalah
kuadrat dari standar deviasi), dan kisaran antar kuartil berguba sebagai ukuran dispersi.
Dengan jelas tidak ada ukuran dispersi yang berkaitan dengan modus.
STATISTIK INFERENSIAL
Statistik inferensial diperlukan saat kita mungkin ingin mengetahui atau menduga dari
analisis data :
Korelasi
Figur M1
Yaitu kita ingin melihat sifat, arah dan signifikansi hubungan bivariat dari variabel
yang digunakan dalam studi (yaitu hubungan antara dua variabel apasaja diantara
variabel yang diungkap dalam studi). Matriks korelasi pearson akan memberikan
informasi tersebut, yaitu menunjukkan arah, kekuatan, dan signifikansi hubungan
bivariat dari semua variabel dalam studi.
Korelasi diperoleh dengan menilai variasi dalam satu variabel sebagi variabel
alin yang juga bervariasi. Uktuk menyederhanakan anggaplah kita telah mempunyai
data dua variabel harga dan penjualan untuk dua produk berbeda. Volume penjualan
pada tiap tingkat harga dapat diplot untuk masing-masing produk, seperti
ditunjukkan dalam diagram pancar dalm figur M2a dan M2b.
Figur M2b menunjukkan pola yang dapat dilihat mengenai bagaimana dua
vaktor bervariasi secara simultan [tren dari pencaran (scatter) adalah garis lurus
kebawah], sedangkan figu M2a tidak. Dengan melihat pada diagram pacar pada
figur M2b, tampak bahwa ada korelasi negatif antara harga dan penjualan produk.
Yaitu, saat harga naik, penjualan produk turun secara konsisten. Figur M2a tidak
memberikan pola yang berarti utuk produk yang lain. Koefesien korelasi yang
menunjukkan kekuatan dan arah hubungan bisa dihitung dengan menerapkan rumus
yang melibatkan dua set figur dalam kasus ini, volume penjualan yang berbeda pada
harga yang berbeda. Secara teoritis bisa saja terdapat korelasi positif sempurna
diantara dua variabel, yang ditunjukkan oleh 1,0 (plus 1). Atau korelasi negatif
sempurna yang adalah -1,0 (minus 1). Tetapi hal tersebut tidak akan ditemukan
dalam kenyataan ketika menghitung korelasi antara dua variabel apasaja yang
diduga berbeda satu sama lain.
Sementara korelasi dapat membentang dari -1,0 dan +1,0, kita perlu mengetahui
apakah korelasi yang ditemukan antara dua variabel signifikan atau tidak (yaitu,
apakah hal tersebut hanya kebetulan atau apakah terdapat probabilitas tinggi dari
keberadaan aktualnya). Koefesien korelasi menunjukkan kekuatan dan arah
hubungan antara suatu variabel dengan varibel lainnya. Tingkat signifikan hubungan
korelasi yaitu p = 0.05 biasanya merupakan tingkat konvensional yang diterima
dalam penelitian ilmu sosial. Hal tersebut menunjukkan bahwa 95 kali dari 100, kita
dapat yakin hanya ada kemungkinan 5% bahwa hubungan tersebut tidak benar-benar
eksis. Bila terdapat korelasi 0,56 (disimbulkan dengan r= 0,56) antara dua variabel
Adan B, dengan p < 0,01, maka kita mengetahui bahwa ada hubungan positif antara
dua variabel dab probabilitas hal tersebut tidak benar adalah 1% atau kurang. Yaitu
lebih dari 99% dari waktu kita menduga korelasi tersebut eksis. Korelasi o,56 juga
menunjukkan bahwa variabel akan menjelaskan varians satu sama lain pada tingkat
31,4% (0,562).
Dengan ini kita memang tidak mengetahui variabel mana yang menyebabkan
suatu hal, tetapi kita tau bahwa kedua variabel saling berkaitan satu sama lain.
Dengan demikian sebuah hipotesis yang mendalilkan hubungan positif atau negatif
yang signifikan antar dua varibel dapat dites dengan menguji korelasi antar
keduanya. Analisi variasi bivariat yang menunjukkan kekuatan hubungan (r) antar
dua variabel dapat dihasilkan untuk ukuran variabel pada skala interval atau rasio.
kita mungkin kadang ingin mengetahui apakah terdapat hubungan antar dua
variabel nominal atau apakah keduanya tidak saling berkaitan. Sebagai contoh:
Apakah jenis pekerjaan yang dilakukan oleh individu [pekerjaan kerah putih (staff
kantor) versus pekerjaan kerah biru (buruh)] adalah fungsi dari warna kulit mareka
(putih versus tidak putih)? Perbandingan tersebut dimungkinkan dengan mengatur data
menurut kelompok atau kategori dan melihat pakah terdapak hubungan statistik rang
signifikan. Misalnya kita mengumpulkan data dari sampel 55 orang yang warna kulit
dan sifat pekerjaannya, dipilih dari perhitungan frekuensi, diilustrasikan seperti dalam
tabel M2, berupa tebel kontijensi two-by-two. Hanya dengan melihat tabel M2 tampak
jelas bahwa bahwa mereka yang berkulit putih melakukan pekerjaan kerah putih. Hanya
sedikit dari yang tidak berkulit putih melakukan pekerjaan kerah putih. Dengan
demikian tampaknya ada hubungan antara warna kulit dan jenis pekerjaan yang
dilakukan keduanya tidak tampak bebas. Hal tersebut dapat dipertegas secara statistik
dengan uji chi-square (X2) – pengujian non parametrik yang akan dilakukan
menunjukkan apakah pola yang teramati semata-mata hanya kebetulan atau tidak.
Seperti yang kita ketahui pengujian nonparametrik digunakan jika normalitas distribusi
tidak dapat diasumsikan seperti dalam data nominal atau ordinal. Uji X2
membandingkan frekuensi yang diduga (berdasarkan probabilitas) dan frekuensi yang
teramati, dan statistik X2 diperoleh dengan rumus:
(𝑂𝑖−𝐸)2
X2 = ∑ ( )
𝐸𝑖
Dimana X2 adalah statistik chi-square; Oi adalah frekuensi yang teramati dari sel ke-i
dan Ei adalah frekuensi yang diduga. Statistik X2 dengan tingkiat signifikansi dapat
diperoleh untuk data nominal melaluli analisis komputer.
Dengan demikian ketika menguji perbedaan dalam hubungan di antara variabel yag
berskala nominal, statistik X2 (chi-square) dapat digunakan. Hipotesis nol akan disusun
untuk menyatakan bahwa tidak ada hubungan singnifikan antara dua variabel. Statistik
ini berkaitan dengan derajat kebebasan yang menunjukkan apakah suatu hubungan
signifikan eksis diantara dua veriabel normal. Derajat kebebasan (degrees of freedom-
df) adalah satu kurang dari jumlah sel dalam kolom dan baris. Bila ada empat sel (dua
kolom dua baris), maka derajat kebebasan adalah 1[(2-1) x (2-1)]. Statistik chi-square
untuk berbagai df.
Statistik X2 juga bisa dipakai untuk sejumlah tingkat dari dua veriabel nominal.
Jadi simoulannya uji signifikan X2 membantu kita untuk melihat apakah dua variabel
nominal berkaitan atau tidak. Selain uji X2 , uji lain seperti uji fisher exact, probability
test dan conchran Q test juga digunakan untuk menentukan hubungan antara dua
variabel yang berskala norminal.
Tabel M2
Putih 30 5 35
Tidak putih 2 18 20
Total 32 23 55
Uji t memasukkan rata-rata atau standar deviasi dari dua kelompok pada variabel dan
menguji apakah perbedaan numerikal dan rata-rata berbeda secara signifikan dari nol
(0) sebagaimana didlilkan dalam hipotesis nil kita. Yang telah dipelajari pada bab data
sampel dan pengujian hipotesis.
Ketika membandingkan perbedaan rata-rata antara dua kelompok yang berbeda
pada suatu variabel, kita melakukan uj t pada dua sampel bebas. Kita juga dapat
menguji perbedaan pada kelompok yang sama sebelum atau sesudah melakukan
perlakuan. Dalam hal ini rumus untuk uji t disesuaikan untuk menghitung korelasi
antara dua skor jika ada. Dengan kata lain uji t yang disesuaikan (adjusted t test) untuk
sampel yang sesuai atau jenis sampel terikat lainnya mencerminkan perbedaan rata-rata
yang sebenernya.
Tabel II diakhir buku ini menunjukkan nilai t, untuk distribusi bentuk lonceng
simetris (symmetrical bell-shaped distribution) dengan rata-rata = 0 dan standar deviasi
= 1, untuk bebagai derajat kebebasan [yaitu jumlah observasi atau ukuran sampel
sekarangjumlah pembatas atau (n-1)df.
Statistik yang diklasifikasikan menurut tipe, jumlah, dan ukuran skala variabel
Variabel Kriteria
Satu Dua atau Lebih
Nominal Ordinal Interval Nomina Ordinal Interval
l
Che-square Uji tanda Analisis Analisis
untuk utnuk (sign) varians multidiskrimina
independensi Uji n (mutiple
median discriminant
Uji mann analysis)
Cochran Q whitney
kemungkinan U
saat fisher Analisis
varians
satu arah
kruskal-
wallis
Korelasi Analisis
rank varians
Spearma dengan
n analisis
tren
Korelasi
rank
kendall
Analisis varians Analisis Analisis regret
Regresi berganda
(multiple
regresion
analysis)
Analisis Analisis Analisis varians
two way varians
friedman (desain
factorial
)
Analisis Analisis Analisis Korelasi
multidiskrimina regresi multidiskrimina kanonikal
n (multiple bergand nt (canonical
discriminant) a correltions)
R square atau lazim disebut sebagai R2 adalah jumlah varians yang dijelaskan dalam
variabel terikat.
Dalam uji ANOVA variabel bebas diukur pada skala nominal dan variabel terikat pada
skala interval atau ratio.
Tipe analisis statistik yeng lain seperti analisis faktor, analisis klaster, dan penskalaan
multidemensional membantu kita untuk memahami bagaiman variabel yang diteliti
membentuk suatu pola atau struktur, berbeda dari fokus pada memprediksi variabel
terikat atau menelusuru hubungan.
Analisis faktor (factor analysis) membantu mengurangi sejumlah besar variabel (misal,
semua pertanyaan yang mengungkap beberapa variabel penelitian dalam sebuah
kuesioner) menjadi sekumpulan faktor yang berarti, dapat diinterpretasi, dan dapat
dikelola. Analisis komponem utama mentransformasi smua variabel kedalam
sekelompok variabel gabungan yang tidak berkorelasi satu sama lain. Misalkan kita
mengukur sebuah kuesioner empat konsep, yaitu kesehatan mental, kepuasan kerja,
kepuasan hidup, dan ketelibatan kerja, dengan 7 pertanyaan untuk mengunkap masing-
masing, bila kita menganalisis faktor 28 item tersebut, kita akan menemukan 4 faktor
dengan variabel yang tepat termuat pada setiap faktor, yang mengonfirmasi bahwa kita
telah mengukur konsep dengan benar.
Singkatnya teknik multi variat MANOVA, analisis diskriminant, dan korelasi kanonikal
membantu kita menganalisis pengaruh variabel bebas terhadap variabel terikat dengan
berbagai cara. Teknik multi variat lainnya seperti analisis faktor, analisis klaster, dan
penskalaan multidimensional memberi wawasan yang berharga kedalam kelompok data
dengan bentuk pola-pola data dalam satu atau lain bentuk.
Adalah berfaedah bahwa beberapa tehnik univariat, bivariat, dan multi variat tersedia
untuk menganalisis data sampel, sehingga kita dapat menggeneralisasi hasil yang
diperoleh dari sampel ke populasi secara luas. Tetapi, penting pula untuk memberi
perhatian pada hipotesis yang disusun, dan penggunaan tehnik statistik yang tepat untuk
mengujinya, daripada menerapkan tehnik rumit yang tidak tepat.
Data kualitatif bisa diperoleh melalui banyak sumber, yang utama diantaranya
wawancara mendalam, observasi partisipan atau non partisipan, film dan video tape, uji
proyektif, study kasus dokumen dan data elektronik. Diskripsi persoalan yang diteliti
merupakan eksensi utama dari penelitian kualitatif dan berbagai tehnik interpretasi
dapat digunakan untuk menguraikan, menerjemahkan, mengartikan pola, dan
menemukan pola dari berbgai fenomena yang terjadi.
Bila informasi diperoleh dari sumber seperti surat kabar, artikel jurnal, audio
yang video tape, dan informasi tersebut dapat diklasifikasi, ditabulasi, dianalisis untuk
memahami fenomena, menjelaskannya, atau meramalkan tren masa depan. Ramalan
masa depan naisbitt yang terkenal (lihat mega trens) bisa saja meruopakan hasil dari
keterlibatan dirinya dalam pengujian seemacam itu. Dalam menganalisis informasi
kualitatif, peneliti melakukan penyelidikan mendalam dan secara subjektif
menginterpretasikan data dalam upaya menghitung banyak variasi dalam fenomena
yang diteliti.
Peristiwa, objek, orang, kata, dan sintaks yang digunakan dalam berbagai
sumber sering secara hati-hati dianalisis isinya, dimana beberapa kesimpulan ditarik dan
proyeksi dibuat untuk masa depan. Solusi perbaikan untuk beberapa jenis permasalahan
yang dihadapi dalam organisasi juga mungkin diperoleh dari analisis isi terhadap studi
kasus, rekaman audio, video tape, dan lain-lain.
RELEVANSI MANAJERIAL
Manajer membuat keputusan setiap hari, yang sebagian diantaranya rutin dan
sebagian lagi sangat penting bagi organisasi. Kemampuan untuk memahami berbagai
tipe analisis serta probabilitas yang terkait dengan setiap hasil yang diproyeksikan untuk
membantu manajer untuk mengambil risiko yang telah diperhitungkan (atau
menghindarinya) berdasarkan kecenderungan alami mereka sekaligus kegawatan situasi
masalah.