SPSS MM

Statistika
Konsep dasar dan metoda

penggunaannya dalam penelitian
Tujuan :
 Untuk memajukan pemikiran yang tertib, runut

dan jelas, terutama yang berhubungan dengan
pengumpulan dan interpretasi data numerik, serta
menyediakan sejumlah teknik statistika yang
mempunyai kegunaan yang luas dalam penelitian.
 Melakukan penyajian, peringkasan dan pencirian
data
Statistika adalah cara berpikir perihal ketidakpastian.

Penelitian :
 Penyelidikan terencana untuk mendapatkan fakta

baru, untuk memperkuat atau menolak hasil hasil
percobaan terdahulu.
Penyelidikan demikian ini akan membantu pengambilan

keputusan
Pertanyaan yang harus dijawab :
 Untuk setiap perhitungan statistik, selalu muncul

pertanyaan mengenai ketelitiannya, berapa angka
yang masih dapat dipercaya sebagai akhir dari
serangkaian perhitungan yang kita lakukan
Statistics
Descriptive Inferential
Aplikasi Statistik dibagi menjadi dua bagian :
 Statistik Deskriptif
Menjelaskan / menggambarkan berbagai karakteristik data
seperti mean, std dev, variansi dan sebagainya
 Statistik Induktif (Inferensi)
Membuat berbagai inferensi terhadap sekumpulan data
yang berasal dari suatu sampel. Tindakan inferensi
tersebut seperti melakukan perkiraan, peramalan,
pengambilan keputusan dan sebagainya.
Dalam prakteknya kedua bagian statistik
tersebut digunakan bersama-sama,
umumnya dimulai dengan statistik
deskriptif lalu dilanjutkan dengan berbagai
analisis statistik untuk inferensi.
Descriptive
Statistics
Measures of Measure of Graphic

Central Tendency Variability Displays
Mean Variance Frequency

Distribution tables
Median Standard Deviation Frequency

Distribution Polygon
Mode Range Histogram
Deviation Bar Graph
Mean Deviation
Sum of Squared
Deviation
Inferential
Statistics
Estimation Correlation & Chi-Square

Regression
z-scores Pearson Test for

Correlation Goodness of Fit
Single Sample Phi-coefficient Test for
t statistic Independence
Independent Linear Regression
t statistic
Dependent
t statistic
Elemen Statistik.
1. Populasi
Sekumpulan data yang mengidentifikasikan suatu
fenomena yang tergantung dari kegunaan dan
relevansi data yang dikumpulkan.
2. Sampel
Sekumpulan data yang diambil / diseleksi dari
suatu populasi. (sampel adalah bagian dari
populasi).
3. Statistik Inferensi
Suatu keputusan, perkiraan atau generalisasi
tentang suatu populasi berdasarkan informasi yang
terkandung dari suatu sampel
4. Pengukuran Reabilitas dari Statistik Inferensi.
Tujuan dari statistik pada dasarnya adalah
melakukan deskripsi terhadap data sampel,
kemudian melakukan inferensi terhadap populasi
data berdasar pada informasi (hasil statistik
deskriptif) yang terkandung dalam sampel.
Catatan :
Karena sampel yang diambil hanya sebagian dari populasi, dapat terjadi bias dalam
kesimpulannya. Sebagai konsekuensi dari kemungkinan timbulnya berbagai bias dalam inferensi,
perlu diukur reabilitas dari setiap inferensi yang telah dibuat.
Tipe Data Statistik.
 Data Kualitatif
a. Nominal
Mis gender, tgl lahir dsb yang untuk mudahnya
dapat
dikategorikan dengan angka. (level sama)
b. Ordinal
Misal selera, dsb (level tidak sama)
Tipe Data Statistik.
 Data Kuantitatif
a. Data Interval
Data yang memiliki jangkauan
Mis pengukuran suhu,
Cukup panas antara 50 – 80 derajat C,
Panas antara 80 – 110 C,
dan Sangat panas antara 110 – 140 C
b. Data Rasio.
Data dengan tingkat pengukuran ter “tinggi”
diantara jenis lainnya. Sehingga dapat dilakukan
operasi matematika.
Mis jumlah barang, berat badan dsb.
Statistik Deskriptif
Bagian ini lebih berhubungan dengan pengumpulan dan
peringkasan data, serta penyajian hasil peringkasan tersebut.
Penyajian tabel dan grafik misalnya
1. Distribusi Frekuensi
2. Histogram, Pie chart dsb
Dua ukuran penting yang sering digunakan dalam pengambilan
keputusan adalah :
1. Mencari Central Tendency (mean, median, modus)
2. Mencari Ukuran Dispersi (std deviasi, variansi)
Ukuran lain yang sering digunakan adalah Skewness dan
Kurtosis untuk mengetahui kemiringan data.
Statistical Notation
 Variabel biasanya ditulis sbg “x” dan “y”

 Untuk populasi dinotasikan dg huruf besar “N”
(“N” for populations and “n” for samples)
 Sigma ( ) mewakili operasi penjumlahan
X y xy x+1 x2
2 3 6 3 4
3 5 15 4 9
6 8 48 7 36
4 2 8 5 16
x indicates that scores on variable “x” are to be
added;
y indicates that scores on variable “y” are to
be added
In the previous table,
 x = 2 + 3 + 6 + 4 = 15
 y = 3 + 5 + 8 + 2 = 18
 x  y = 15*18 = 270
 xy indicates that the 2 variables (x and y) are to
be multiplied together, then summed.
 xy = (2*3) + (3*5) + (6*8) + (4*2) = 77

( 6 + 15 + 48 + 8 = 77)
 Note that  xy (does not equal)  x  y

(77 vs. 270)
(x+1) indicates that a constant value of 1 is

added to each score, then each score is added up
 Remember that operations in parenthesis are

always done first
(x+1) = (2+1) + (3+1) + (6+1) + (4+1) = 19

=( 3 + 4 + 7 + 5 = 19)
 Notice that (x+1)   x+1 (19 vs. 16)

X2 indicates to square each of the x values, then
add them up
 X2 = 2² + 3² + 6² + 4² = 65
(= 4 + 9 + 36 + 16=65)
 Notice that x2  (x) 2 (65 vs. 225)

Dalam statistika hal yang paling penting adalah
PENGAMATAN
Perhatikan data berikut :
8, 8, 9, 10, 11, 12, 12
5, 6, 8, 10, 12, 14, 15
1, 2, 5, 10, 15, 18, 19
Dan
8, 9, 10, 10, 10, 11, 12
5, 7, 9, 10, 11, 13, 15
1, 5, 8, 10, 12, 15, 19
Perhatikan data berikut :
8, 8, 9, 10, 11, 12, 12 s: 1.6
5, 6, 8, 10, 12, 14, 15 s: 3.58
1, 2, 5, 10, 15, 18, 19 s: 6.96
Dan
8, 9, 10, 10, 10, 11, 12 s: 1.19
5, 7, 9, 10, 11, 13, 15 s: 3.16
1, 5, 8, 10, 12, 15, 19 s: 5.60
Central Tendency
CENTRAL TENDENCY:
 A statistical measure that identifies a single score
that is most typical or representative of the entire
group; a single score or measurement used to
describe an entire distribution
 Usually, a value that reflects the middle of the
distribution is used, because this is where most of
the scores pile up
 No single measure of central tendency works best
in all circumstances, so there are 3 different
measures -- mean, median, and mode. Each
works best in a specific situation
Central Tendency (Mode)
MODE:
 The score or category that has the greatest
frequency; the most common score
 To find the mode, simply locate the score that

appears most often
– In a frequency distribution table, it will be the
score with the largest frequency value
– In a frequency graph, it will be the tallest bar or
point
Example: A sample of class ages is given. . .
Ages f * The age with the highest

23 1 frequency is 19, with a
22 0 frequency of 3; therefore, the
21 1 mode is 19.
20 0
19 3
18 2
 A distribution may have more than one mode, or
peak: A distribution with 2 modes is said to be
bimodal; A distribution with more than 2 modes is
said to be multimodal
Example: A sample of class ages. . .
Age f * age 22 and age 19 both
23 1 have a frequency of 3; if
22 3 this distribution were
21 1 graphed, there would be
20 1 2 peaks; therefore this
19 3 distribution is bimodal --
18 2 both 22 and 19 are modes
Advantages:
 Easiest to determine
 The only measure of central tendency that
can be used with nominal (categorical) data
Disadvantages
 Sometimes is not a unique point in the
distribution (bimodal or multimodal)
 Not sensitive to the location of scores in a
distribution
 Not often used beyond the descriptive level
Central Tendency (Median)
MEDIAN:
 The score that divides the distribution exactly in
half; 50% of the individuals in a distribution have
scores at or below the median
Method 1: (Use when N (or n) is an odd number)
List the scores from lowest to highest; the middle
score on the list is the median
Example: The ages of a sample of class members

are 24, 18, 19, 22, and 20. What is the median
value?
 List the scores from lowest to highest:
18, 19, 20, 22, 24
 The middle score is 20 - therefore, that is the
median
Method 2: (Use when N (or n) is an even number)
List scores in order from lowest to highest and
locate the point halfway between the middle two
scores
Example: The ages of a sample of class members
are 18, 19, 20, 22, 24 and 30. What is the median
age?
The scores are already listed from lowest to highest;
select the middle two scores (20, 22) and find the
middle point: 20  22
median   21
2
Central Tendency (Mean)
MEAN (µ, x):
 The mathematical average of the scores
 The amount that each individual would receive if the
total (x) were divided up equally between everyone
in the distribution
 Computed by adding all of the scores in the
distribution and dividing that sum by the total number
of scores
x
 Population mean:   N
 Sample mean: x
 x
n
 Note that, while the computations would yield the
same answer, the symbols differ for a population
(, N) and a sample (x,n)
Example:
x
 x 18 19  19  21  23 100
   20
n 5 5
 If a constant is added or subtracted from each

score used to compute the mean, the mean will
change by the value of that constant
Example: The class scores on a 15-point quiz are 8,

4, 12, 14, 4, and 6. The mean of these scores is. . .
x
 x 8  4 12  14  4  6 48
  8
n 6 6
Suppose the instructor made an error on the quiz and
decided to add 1 point to everyone’s score. How
would that change the mean?
X+1 * The new scores are 9, 5, 13, 15, 5, &7

8+1= 9 * The new mean is:
4+1= 5  x  54  9
12+1=13 n 6
14+1=15 * so, adding a constant to each score
4+1= 5 (x+a) and calculating mean has the
6+1= 7 same result as adding that constant to
X = 54 the mean (x+ a)
 If all of the scores are multiplied or divided by a

constant value, and the mean is then computed,
the result will be the same as if the mean were
multiplied or divided by that constant
Example: A 10-point quiz is given to a class. Their

scores are 6, 5, 7, 8, 10 and 6. The mean is
computed. . .
42
X=42 x 7
6
The instructor then decides to change the value of
the quiz from 10 points to 20 points. What is the
new mean for the class?
X(2) * The new scores are 12, 10, 14,
6(2)=12 16, 20, 12
84
5(2)=10 * The new mean is: x   14
7(2)=14 6
8(2)=16 * thus, multiplying each score by
10(2)=20 a constant is the same as
6(2)=12 multiplying the mean by the
X=84 constant
 Sensitive to extreme scores, and therefore
may not be desirable when working with
highly skewed distributions
Example: compare 2 samples of class ages
1) 18, 19, 20, 22, 24
2) 18, 19, 20, 22, 47
x1  20.6 Vs.
x2  25.2
Mode
Median
Mean
Mean – Mode = 3(Mean – Median)
Persentase luas daerah antara Mean dan Std Dev
X 1 2 3
| x +/- 1s | = 68.27%
| x +/- 2s | = 95.45%
| x +/- 3s | = 99.73%
Measures of Variability
 range- (highest score - lowest score) +1
(Xhi  Xlow ) 1
 deviation- score - mean
(Xi  X)
 mean deviation- the average absolute
deviation score
 Xi  X
n
 sum of squares- the sum of the squared

deviation scores
– definitional
2 2
SS  (Xi  X)  (xi )
 variance- the average sum of the

squared deviation scores
– sample-
2
2 SS (Xi  X)
s  
n 1 n 1
– population-
2
2 SS (X i  u)
  
N N
Statistik Inferensi
Setelah dilakukan uji terhadap suatu distribusi

data, dan terbukti bahwa data yang diuji
berdistribusi normal atau mendekati normal, maka
pada data tersebut dapat dilakukan berbagai
Inferensi dengan metode statistik parametrik.
Tetapi jika dalam pengujian terbukti distribusi data
tidak berdistribusi normal atau jauh dari normal
maka Inferensi yang dilakukan harus dengan
metode statistik non parametrik.
Uji Hipotesa
Dalam melakukan uji hipotesis, ada banyak faktor yang

menentukan seperti apakah sampel yang diambil berjumlah
banyak atau hanya sedikit, apakah std deviasi populasi
diketahui, apakah variansi dari populasi diketahui, apa metode
parametrik yang digunakan, dst.
1. Prosedur Uji Hipotesis
a. Menentukan H0 dan H1
b. Menentukan nilai statistiknya
1. Tingkat kepercayaan
2. Derajat kebebasan
3. Jumlah sampel yang didapat
c. c. Menentukan Statistik hitung, nilai ini
d. tergantung pada metode parametrik
e. yang digunakan.
b. d. Mengambil keputusan, hal ini

ditentukan dengan membandingkan
nilai statistik hitung dengan nilai
statistik tabel atau nilai kritisnya.
Kesalahan :
 Jika kita menolak hipotesa, sedangkan hipotesa

benar dikatakan kita melakukan kesalahan type I
 Sebaliknya jika kita menerima hipotesa sedangkan

hipotesa salah, dikatakan kita melakukan
kesalahan type II
Derajat kepercayaan.
(level of significant)
 Dalam melakukan test terhadap hipotesa,

maksimum probabitity yang akan kita gunakan
untuk mendapatkan resiko Type I disebut derajat
kepercayaan
 Harga yang umum di gunakan adalah 0.05 dan

0.01
2. Berbagai Metode Parametrik
a. Inferensi terhadap sebuah rata-rata populasi

 sampel besar, gunakan rumus z
 sampel kecil (<30), gunakan student t test
b. Inferensi terhadap dua rata-rata populasi
 Sampel besar, gunakan z test yang
dimodifikasi
 Sampel kecil, gunakan t test yang
dimodifikasi atau F test
c. Inferensi untuk mengetahui hubungan antar
variabel
> Hubungan antar Dua Variabel, meng
gunakan metode korelasi dan Regresi
sederhana
> Hubungan antar lebih dari dua variabel,
menggunakan metode korelasi dan regresi
berganda
Regresi Sederhana dan Korelasi
Jika akan dibahas mengenai dua variabel numerik

atau lebih, termasuk hubungan di antara keduanya,
maka digunakan dua teknik perhitungan, yaitu
Regresi dan Korelasi.
Dalam analisa Regresi, akan dikembangkan
sebuah persamaan regresi yaitu formula
matematika yang mencari nilai variabel tergantung
(dependent) dari nilai variabel bebas
(independent) yang diketahui. Analisa regresi
terutama digunakan untuk tujuan peramalan.
Model Matematika yang digunakan :
 Garis Lurus
 Parabola / Kurva Kuadratik
 Kurva kubik
 Kurva Quartic
 Kurva pangkat n
 Biasanya disebut sebagai polinomial berderajat

satu, dua, ….dst
Metoda Garis Lurus
 y= a + bx
Metoda Kuadrat Terkecil
(Least Square)
Untuk mendapatkan parameter

y = a + bx + e
Statistik Non-Parametrik
Jika data yang ada tidak berdistribusi

Normal, atau jumlah data sangat sedikit
serta level data adalah nominal atau ordinal,
maka perlu digunakan metode statistik
alternatif yang tidak harus menggunakan
suatu parameter tertentu misalnya Mean,
STD Deviasi dll. Metode ini disebut
metode Statistik Non Parametrik.
Keuntungannya :
  Data tidak harus berdistribusi Normal,

 (distribution free test)
  Dapat digunakan untul level data
 nominal dan ordinal
  Cenderung lebih sederhana
Kelemahan :
  Tidak ada sistematika yang jelas

  Hasil bisa meragukan karena
 kesederhanaan metodenya
  Tabel yang digunakan lebih banyak
Dalam penggunaannya apakah akan digunakan

metode parametrik atau non parametrik, semua
tergantung pada situasi yang ada, dan keduanya
lebih bersifat saling melengkapi dalam melakukan
berbagai pengambilan keputusan.
SPSS
(Statistical Product and Service Solutions)
Adalah suatu program komputer statistik yang

mampu mengolah/memproses data statistik secara
cepat dan tepat, untuk mendapatkan berbagai
hasil/keluaran yang dikehendaki para pengambil
keputusan
Komponen SPSS
1. Data Collection, mengumpulkan data untuk

pengolahan data
2. Data Preparation, persiapan data untuk
pengolahan data lebih lanjut
3. Data analysis & Data mining, menyediakan
berbagai perhitungan statistik untuk pengolahan
data
4. Data deployment, mendistribusikan hasil
pengolahan data (informasi)
Cara Kerja SPSS (analogi dengan proses komputer)
Pada Komputer
Proses Data
Data Input
Komputer Output
Pada Statistik
Proses Data
Data Input Output
Statistik
Window Pada SPSS
 1. Data Editor
– File, Edit, View, Data, Transform, Analize, Graphs, Utilities,
– Window, Help
 2. Menu Output Navigator
Insert, Format
 3. Menu Pivot Table Editor
 4. Menu Chart Editor
Gallery, Chart, Series
 5. Menu Text Output Editor
 6. Menu Syntax Editor
 7. Menu Script Editor
Bagian SPSS yang berhubungan dengan
Statistik Deskriptif
 1. Frequencies.
– Membahas beberapa penjabaran ukuran statistik deskriptif seperti
Mean, Median, Kuartil, Persentil, Standar Deviasi dll
 2. Descriptive
– Berfungsi untuk mengetahui skor z dari suatu distribusi data dan
menguji apakah data berdistribusi normal atau tidak
 3. Explore
– Berfungsi untuk memeriksa lebih teliti terhadap sekelompok data
dengan Box-Plot dan Steam and Leaf Plot, selain beberapa uji
tambahan untuk menguji apakah data berasal dari distribusi
normal.
 4. Crosstab
– Digunakan untuk menyajikan deskripsi data dalam
bentuk tabel silang. Menu ini juga dilengkapi dengan
analisis hubungan di antara baris dan kolom, seperti
independensi antara mereka, besar hubungannya dsb
 5. Case Summaries
– Digunakan untuk melihat lebih jauh isi statistik
deskriptif yang meliputi subgroup dari sebuah kasus.
Penggunaan Regresi dengan SPSS.
 1. Pilih menu Analyze – Regression – Linear

 2. Tentukan var bergantung dan var bebas
 3. Tentukan Metoda yang digunakan (Enter, Stepwise,
 Forward, Backward)
 4. Tentukan perhitungan statistik yang diperlukan
 5. Tentukan jenis plot yang diperlukan
 6. Tentukan harga F testnya


SPSS MM

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

SPSS MM

Diunggah oleh

Hak Cipta:

Format Tersedia

Statistika

Konsep dasar dan metoda

 Untuk memajukan pemikiran yang tertib, runut

Statistika adalah cara berpikir perihal ketidakpastian.

 Penyelidikan terencana untuk mendapatkan fakta

Penyelidikan demikian ini akan membantu pengambilan

 Untuk setiap perhitungan statistik, selalu muncul

Measures of Measure of Graphic

Mean Variance Frequency

Median Standard Deviation Frequency

Mode Range Histogram

Deviation Bar Graph

Estimation Correlation & Chi-Square

z-scores Pearson Test for

 Variabel biasanya ditulis sbg “x” dan “y”

 xy = (2*3) + (3*5) + (6*8) + (4*2) = 77

 Note that  xy (does not equal)  x  y

(x+1) indicates that a constant value of 1 is

 Remember that operations in parenthesis are

(x+1) = (2+1) + (3+1) + (6+1) + (4+1) = 19

 Notice that (x+1)   x+1 (19 vs. 16)

 Notice that x2  (x) 2 (65 vs. 225)

 To find the mode, simply locate the score that

Ages f * The age with the highest

Example: The ages of a sample of class members

 If a constant is added or subtracted from each

Example: The class scores on a 15-point quiz are 8,

X+1 * The new scores are 9, 5, 13, 15, 5, &7

 If all of the scores are multiplied or divided by a

Example: A 10-point quiz is given to a class. Their

 sum of squares- the sum of the squared

 variance- the average sum of the

Setelah dilakukan uji terhadap suatu distribusi

Dalam melakukan uji hipotesis, ada banyak faktor yang

b. d. Mengambil keputusan, hal ini

 Jika kita menolak hipotesa, sedangkan hipotesa

 Sebaliknya jika kita menerima hipotesa sedangkan

 Dalam melakukan test terhadap hipotesa,

 Harga yang umum di gunakan adalah 0.05 dan

a. Inferensi terhadap sebuah rata-rata populasi

Jika akan dibahas mengenai dua variabel numerik

 Biasanya disebut sebagai polinomial berderajat

Untuk mendapatkan parameter

Jika data yang ada tidak berdistribusi

  Data tidak harus berdistribusi Normal,

  Tidak ada sistematika yang jelas

Dalam penggunaannya apakah akan digunakan

Adalah suatu program komputer statistik yang

1. Data Collection, mengumpulkan data untuk

 1. Pilih menu Analyze – Regression – Linear

Anda mungkin juga menyukai

 xy = (23) + (35) + (68) + (42) = 77