Mengetahui,
Koordinator Asisten
Abiyani Choitul Huda
26020113190095
I. PENDAHULUAN
1.3 Manfaat
Manfaat yang praktikan dapat dari praktikum statistika modul 1 ini ialah:
1. Praktikan mendapatkan wawasan tentang program SPSS sebagai alat
membantu mahasiswa dalam mengolah data statistik.
2. Praktikam tidak hanya mengetahui fungsi program SPSS namun dapat
juga menggunakannya secara efektif.
3. Praktikan mampu mengolah file data dengan tingkat yang lebih rumit
II. TINJAUAN PUSTAKA
2.2 SPSS 22
SPSS dikembangkan oleh Norman Nie, seorang mahasiswa lulusan fakultas
ilmu politik dari Stanford University. Pada awalnya program ini bernama
Statistical Package for the Social Sciences kemudian berubah menjadi Statistical
Product Solitions. SPSS muncul pertama kali pada tahun 1968. Seiring
perkembangan persahaan, akhir tahun 2009, SPSS diakui oleh IBM. Kemudian
namanya berubah menjadi PASW (Predictive Analytics SoftWare) Statistics.
Namun masyarakan masih akrab dengan nama SPSS. SPSS merupakan kalkulator
yang canggih untuk melakukan perhitungan statistik. Yang penting adalah kita
memahami metode statistik apa yang kita gunakan dan memaknai hasil keluaran
dari SPSS tersebut (Nasoetion, 2003).
Berikut diagram kerja SPSS menurut Nasoetion (2003):
SPSS adalah singkatan dari Statistical Package for the Social Sciences,
sekarang diperluas untuk melayani berbagai jenis user, seperti untuk proses
produksi dipabrik, riset ilmu-ilmu sains dan lainnya. Sekarang kepanjangan SPSS
adalah Statistical Product and Service Solutions. Hingga saat sekarang produk
SPSS telah dipakai dalam berbagai bidang seperti ilmu keuangan, retail,
telekomunikasi, farmasi, broadcasting, militer, database marketing, riset
pemasaran, peramalan bisnis, penilaian kredit, customer relationship, penilaian
kepuasan konsumen (customer satisfaction) dan sebagainya (Nasoetion, 2003).
SPSS dibuat untuk keperluan pengolahan data statistik untuk ilmu-ilmu
social, sehingga kepanjangan SPSS itu sendiri adalah Statistikal Package for the
Social Sciens. Sekarang kemampuan SPSS diperluas untuk melayani berbagai
jenis pengguna (user), seperti untuk proses produksi di pabrik, riset ilmu sains dan
lainnya. Dengan demikian, sekarang kepanjangan dari SPSS Statistikal Product
and Service Solutions (Nasoetion, 2003).
2.3 Statistika Diskriptif
Statistik deskriptif yaitu merupakan salah satu bidang ilmu statistika yang
mempelajari cara – cara pengumpulan, penyusunan, dan penyajian data suatu
penelitian. Penyampaian data pada statistik deskriptif bersifat menggambarkan
atau mendiskripsikan sesuai dengan kondisi lapangan. Berbagai kegiatan dalam
bidang ilmu tersebut antara lain pengumpulan data, penentuan nilai dan fungsi
statistik, serta pembuatan grafik dan gambar (Nugroho, 2007).
2.3.1 Mean
Mean merupakan nilai rata – rata dari sekelompok data baik berupa
frekuensi data tunggal maupun frekuensi data kelompok. Mean (rata – rata)
merupakan suatu ukuran pemusatan data. Mean suatu data juga merupakan
statistik karena mampu menggambarkan bahwa data tersebut berada pada
kisaran mean data tersebut. Mean tidak dapat digunakan sebagai ukuran data
pemusatan untuk jenis data nominal maupun ordinal. Cara menghitung mean
adalah jumlah seluruh data dibagi dengan banyaknya data (Nugroho, 2007).
2.3.2 Median
Pengukuran data sampel dengan cara membagi data kedalam dua
bagian yang sama dinamakan median. Untuk menentukan ukuran median, data
sampel diurutkan dari nilai data terkecil sampai nilai data terbesar. Misalkan
X(1), X(2), .........., X(n) adalah data yang telah diurutkan, maka median diberikan
dengan cara sebagai berikut :
X(𝑛+1)
2
M = {X𝑛 + X(𝑛)+1
2 2
2
Jika ukuran sampel n adalah ganjil, maka median diambil dari data pada posisi
yang ditengah. Sedangkan jika ukuran sampel n adalah genap, maka median
diambil dari rata – rata dua data pada posisi yang ditengah (Mustafid, 2003).
2.3.3 Skewness
Skewness merupakan statistik yang digunakan dalam memberikan
gambaran distribusi data apakah miring ke kiri, ke kanan atau simetris.
Skewness adalah ukuran dari tingkat kesimetrisan dapat juga menggambarkan
kekurang-simetrisan. Suatu distribusi dikatakan simetris jika distribusi
tersebut nampak sama antara sebelah kanan dan sebelah kiri titik pusatnya.
Distribusi yang simetris misalnya distribusi normal, distribusi t dan distribusi
seragam. Distribusi yang mempunyai skewness positif misalnya distribusi
eksponensial, distribusi chi-kuadrat, distribusi Poisson dan distribusi Binomial
(Setiawan ,2002).
Menurut Setiawan (2002) skewness dari suatu variable random X yang
dinotasikan dengan Skew[X] didefinisikan sebagai :
- Ditribusi Horizontal
3.3. Metodologi
3.3.1. Pengolahan Data Frequences
1. Data yang disimpan pada Microsoft Excel dibuka, lalu edit data
tersebut dengan data diubah menyesuaikan nim kita, contoh : misal =
“900 diubah jadi 937”. Lalu daftar nama fitoplankton dibuat diluar
kolom seperti gambar dibawah. Kemudian daftar nama tersebut
disalin.
2. Aplikasi IBM SPSS Statistic dibuka, kemudian data yang telah disalin
ditempel pada variable view. Kemudian pada kolom Measure, scale
dipilih.
3. Pada kolom decimals angka diubah menjadi 0.
dipilih.
1. Data Variables dipindah ke kolom samping kanan.
4.1.1.3. Explores
4.2. Pembahasan
4.2.1. Cara Membaca Hasil
Statistik deskriptif merupakan bidang ilmu statistika yang mempelajari
cara-cara pengumpulan, penyusunan, dan penyajian data suatu penelitian.
Kegiatan yang termasuk dalam kategori tersebut adalah kegiatan collecting atau
pengumpulan data, grouping atau pengelompokan data, penentuan nilai dan fungsi
statistik, serta yang terakhir termasuk pembutan grafik dan gambar (Mustafid,
2003).
Untuk dapat membaca setiap skala dan proses pada program SPSS,
syaratnya adanya distribusi normal suatu percobaan. Distribusi normal memiliki
syarat kurvanya berbentuk seperti lonceng, rata-rata berada pada tengah distribusi
dan disribusinya simetris disekitar garis tegak lurus rata-rata, serta kedua ekor
kura yang memanjang tidak terbatas. Hal yang harus diingat dari membaca hasil
output adalah mengetahui pedomandari arti tiap data yang ada
padaoutput,contohnya : Mean adalah jumlah dari seluruh nilai data dibagi dengan
banyaknya data/ kasus, StDev (standar deviasi) adalah akar kuadrat positif dari
variansi. Variance adalah jumlah kuadrat dari selisih nilai observasi dengan rata-
rata hitung dibagi banyaknya observasi. Q1 adalah kuartil ke satu, ingat arti
kuartil adalah nilai-nilai yang membagi data yang telah diurutkan menjadi empat
bagian yang sama, sehingga dalam suatu gugus didapat 3 kuartil (kuartil 1, kuartil
2/ Median dan kuartil 3). Median adalah nilai tengah dari nilai-nilai pengamatan
yang disusun secara teratur menurut besarnya data. Q3 adalah kuartil ke tiga.
Range adalah selisih antara nilai maksimum dengan nilai minimum dalam suatu
gugus data. IQR (interquartil range) adalah jarak antara persentil 75 dan
persentil 25. Mode adalah nilai yang mempunyai frekuensi terbesar dalam suatu
kumpulan data. Skewness adalah suatu ukuran yang dapat digunakan untuk
menentukan miring tidaknya suatu kurva distribusi. Kurtosis adalah tingkat
menggunungnya suatu distribusi yang umumnya dibandingkan dengan distribusi
normal, dan lain-lain (Santoso, 2003).
Untuk data Cocconeis sp. didapatkan hasil rata rata sebesar 587.
Standart Error of Mean sebesar 224.722. Besarnya nilai median adalah
337. dan nilai mode adalah 337. Standar deviasi 550.454. Nilai minimum
37 dan nilai maksimum 16537 serta sum 3522. Dilihat dari histogram, data
tersebut dapat dikatakan normal karena hasilnya yang terlihat seperti
hampir membentuk lonceng dan homogen.
Untuk data Cocconeis sp. didapatkan hasil rata rata sebesar 1587.
Standart Error of Mean sebesar 224.722. Besarnya nilai skewness adalah
1.236 dan nilai kurtosis adalah 0.862. Dari dua data tersebut (skewness dan
kurtosis) dapat diketahui bahwa data fitoplankton tersebut bersifat normal
karena nilai skewness dan kurtosis berada dalam range -2 sampai 2.
4.1.2.3. Menu Explore
Analisis eksplorasi data merupakan teknik analisa yang sekaligus
dapat membantu memberi arahan bagi peneliti untuk memilih teknik
statistik yang akan diimplementasikan pada data yang akan dikehendaki.
Prosedur eksplorasi data memungkinkan untuk mengetahui tampilan data,
identifikasi data, deskripsi data, pengujian asumsi, perbedaan karakteristik
antara subpopulasi, yaitu group dalam suatu kasus. Pada hasil eksplorasi
data ini, tampilan data mungkin menunjukkan bahwa data yang akan
dianalisis memiliki nilai yang tidak biasa. Misalkan dalam suatu data
pengamatan ada suatu data yang nilainya jauh dari jangkauan nilai-nilai
yang ada, nilai yang ekstrim, jarak antara data atau karakteristik yang lain.
Selanjutnya dengan melakukan eksplorasi data mungkin mengindikasikan
kebutuhan transformasi data jika teknik yang akan digunakan
mensyaratkan berdistribusi normal atau mungkin membutuhkan suatu
analisis statistik non-parametrik. Dari data explore diatas terapat dua
kategori yaitu valid dan missing, untuk nilai valid sendiri bernilai 100%
dan nilai missing bernilai 0% itu artinya data – data yang diinput tidak ada
yang salah, secara otomatis explore akan mengetahui data data yang salah
atau tidak valid.
Setelah di ketahui nilai valid maupun nilai missing dari data – data
tersebut maka dibuatlah histogram explore, dimana untuk gambar
histogram explore itu sendiri satu sama lain hampir sama dari bentuknya,
panjang yang berdiri tegak terhadap frekuensi masing – masing data yang
berada disamping, tiap – tiap frekuensi menunjukkan nilai yang berbeda
itu bergantung dari input data yang dibuat, seperti tinggi, panjang dan
berat daging, data – data tersebut dimasukkan dalam explore dan dengan
sendirinya akan langsung dibaca data – data tersebut dengan histogram
explore itu.
Beberapa hasil analisa yang dapat dilihat dari tabel output antara
lain adalah tabel descriptives, tabel m-estimator, percentile, outlier, dan
tampilan grafik steam and leaf plots power estimation. Output-output
tersebut akan dibahas sebagai berikut :
Tabel Descriptive. Pengukuran ini menunjukkan
ukuran terpusat dari data yang diwakili oleh mean (rata-rata) dan
dispersi data yang berupa standard deviasi, standard error, varian,
nilai minimum, nilai maksimum, range, jangkaun interkuartil,
median, dan 5% trimmed mean. Trimmed mean sendiri dihitung
dengan cara data diurutkan secara ascending, kemudian setelah
urut dihitung 5% dari jumlah data dengan dimutlakkan
perhitungannya. Setelah ketemu nilainya, nilai tersebut digunakan
untuk mengurangi data sebanyak nilai yang diperoleh dari urutan
terkecil dan juga dari urutan terbesar, kemudian sisa data dicari
mean-nya. Dalam Descriptive dapat ditentukan interval konfidensi
rata-rata dengan default 95%, tetapi nilai dapat diubah sesuai
dengan kemauan dari penganalisis data.
Tabel M-Estimators. Pengukuran ini berkaitan
dalam statistik Robust yang diimplementasikan pada perhitungan
rata-rata dan median untuk mengestimasi lokasi data terpusat.
Perhitungan yang diperoleh antara lain M-estimator Huber,
Estimator Andrew’s wave, M-estimator Hampel, dan Estimator
Tukey. Tabel Percentiles Pengukuran ini digunakan untuk
menampilkan nilai persentil.
Tabel Outliers. Pengukuran ini digunakan untuk
menampilkan nilai data terbesar dan data terkecil beserta dengan
labelnya. Dengan adanya tampilan seperti ini, peneliti akan
mengetahui range data dengan baik.
Steam and leaf Plots
Steam and Leaf Plots berkaitan dengan
visualisasi grafik dari data yang merupakan
alternatif kontrol visualisasi jika dimiliki lebih dari
satu variabel dependent. Factor Level melakukan
”generalisasi” sebagian visualisasi untuk setiap
variabel dependent, sedangkan Dependents
Togethermelakukan ”generalisasi” sebagian
visualisasi untuk setiap group yang didefinisikan
dengan faktor variabel.
Pada normal plot QQ, digunakan untuk membandingkan bentuk
distribusi, memberikan pandangan grafis dari bagaimana sifat seperti
lokasi , skala , dan kemiringan yang sama atau berbeda dalam dua
distribusi. Plot QQ dapat digunakan untuk membandingkan koleksi data
yang, atau distribusi teoritis. Pada kurva Detrended Normal Q-Q Plot
menggambarkan selisih antara titik-titik dengan garis diagonal pada grafik
sebelumnya. Jika data yang kita miliki mengikuti distribusi normal dengan
sempurna, maka semua titik akan jatuh pada garis 0,0. Semakin banyak
titik-titik yang tersebar jauh dari garis ini menunjukkan bahwa data kita
semakin tidak normal.