STATISTIK
Sudarwanto, S.Sos
081315430543
Email : mazd4r@yahoo.com.au
0
Pengertian Statistik
Statistik
adalah
ilmu
yang
mengumpulkan,
mengorganisasikan,
menampilkan,
mendeskripsikan atau menggambarkan tentang data yang disajikan dalam bentuk tabel,
diagram, pengukuran tendensi sentra (rata-rata hitung, rata-rata ukur, dan rata-rata
harmonik), pengukuran penempatan (median, kuartil, desil, dan persentil) pengukuran
penyimpangan (range, rentangan antar kuartil, rentangan semi antar kuartil, simpangan
rata-rata, simpangan baku, varians, koefisien varians, dan angka baku), indeks serta
mecari kuatnya hubungan dua variabel melakukan peramalan (prediksi) dengan
menggunakan analisa regresi linier, membuat perbandingan (komparatif). Tetapi dalam
analisa korelasi regresi maupun komparatif tidak perlu menggunakan uji signifikasi lagi
pula tidak bermaksud membuat generalisasi (bersifat umum).
induktif/ statistika probabilitas adalah suatu alat pengumpul data, pengolah data, menarik
kesimpulan, membuat tindakan berdasarkan analisa data yang dikumpulkan atau statistika
yang digunakan manganalisa data sampel dan hasilnya dimanfaatkan (generalisasi) untuk
populasi. Menurut Sudjana Statistika (statistic) adalah ilmu terdiri dari teori dam metoda
yang merupakan cabang dari matematika terapan dan membicarakan tentang : bagaimana
mengumpulkan data bagaimana meringkas data mengolah dan menyajikan data
bagaimana menarik kesimpulan dari analisa data, bagaimana menentukan keputusan
dalam batas-batas resiko tertentu berdasarkan strategi yang ada (Sudjana, 1993:3).
Manfaat Statistik
1. menjelaskan hubungan antar variable
2. membuat keputusan lebih baik
3. mengatasi perubahan-perubahan
4. membuat rencana dan ramalan
Data
Data adalah kumpulan nilai baik kuantitatif maupun kualitatif mengenai suatu obyek
Jenis-jenis data :
Menurut sifatnya data dapat dibagi dua antara lain :
1. Data kualitatif, yaitu data bukan dalam bentuk angka, melainkan kategori, misalkan :
suka, duka, gembira, mantap, nyaman, banyak, sedikit, dan lain-lain.
2. Data kuantitatif yaitu data yang berbentuk angka misalkan harga beras Rp. 1.250,00
per Kg., tinggi badan 176 Cm., laju inflasi 12,33% dan lain-lain
Menurut sumbernya data dibagi dua yaitu :
1. Data internal, yaitu data dari dalam suatu organisasi yang mengambarkan keadaan
organisasi tersebut . misalkan bagi suatu perusahaan: jumlah karyawan, jumlah modal,
jumlah produksi, jumlah kebutuhan bahan mentah dan lain sebagainya. Misalkan
suatu negara: pendapatan nasional, jumlah penduduk, pendapatan perkapita,
pendapatan dan penerimaan negara dan sebagainya merupakan data internal.
2. Data external, yaitu data dari luar suatu organisasi yang dapat menggambarkan
faktor-faktor yang mungkin mempengaruhi hasil kerja suatu organisasi. Misalnya
daya beli masyarakat mempengaruhi hasil penjualan suatu perusahaan, bantuan luar
negeri akan mempengaruhi hasil pembangunan negara, dan lain sebagainya.
Berdasarkan cara memperolehnya juga dibagi dua :
1. Data primer (primary data) yaitu data yang dikumpulkan sendiri oleh
perorangan/suatu organisasi lang sung melalui obyeknya. Misalnya perusahaan ingin
mengetahui konsumsi margarine langsung menghubungi rumah tangga, untuk
memperoleh informasi tentang harga langsung terjun ke pasar, pemerintah untuk
mendapatkan data pendidikan langsung mendatangi sekolah.
2. Data sekunder (secondary data) yaitu data yang didapat dalam bentuk sudah jadi,
berupa publikasi. Data sudah dikumpulkan oleh pihak lain. Misalnya suatu
perusahaan ingin mengetahui data penduduk, pendapatan nasional, indek harga
konsumen, serta data statistik lainnya dari Badan Pusat Statistik dan data perbankan
dari Bank Indonesia.
Menurut waktu pengumpulannya, juga dibagi dua :
1. Data cross section ialah data yang dikumpulkan pada suatu waktu tertentu (at a point
of time) untuk menggambarkan keadaan dan kegiatan pada waktu tersebut. Analisa
yang didasarkan atas cross section disebut analisa cros section (cross section analysis)
yang sifatnya statis oleh karena tidak memperhitungkan perubahan waktu.
2. Data berkala (time series) ialah data yang dikumpulkan dari waktu kewaktu untuk
melihat
perkembangan
suatu
kejadian
selama
periode
tertentu.
Misalkan
Distribusi Frekuensi
Distribusi frekuensi adalah penyusunan suatu data mulai dari terkecil sampai terbesar
yang membagi banyaknya data kedalam beberapa kelas. Kegunaan data yang masuk
dalam distribusi frekuensi adalah untuk memudahkan data dalam penyajian, mudah
dipahami, dan mudah dibaca sebagai gahan informasi pada gilirannya digunakan untuk
perhitungan membuat gambar statistik dalam berbagai bentuk penyajian data
Langkah-langkah dan teknik pembuatan distribusi frekuensi dilakukan sebagai berikut:
a. Hitunglah jarak atau rentangan (R):
Rumus R=data tertinggi-data terendah
b. Hitunglah jumlah kelas (K) dengan Sturges:
Rumus Jumlah Kelas (K)=1+3,3 log n
c. Cara mencari interval kelas :
Interval kelas
Diketahui nilai Ujian Statistik yang diikuti oleh 70 peserta, diperoleh data:
Tabel 1 Data Nilai UTS Statistik
90 84 66 66 67 67 67 68 71 72
70 70 71 73 73 74 74 80 80 81
74 74 74 60 63 81 81 82 87 87
75 75 76 76 77 77 77 78 85 85
78 78 79 75 75 75 87 89 89 94
80 80 81 78 78 79 82 83 83 84
93 94 75 75 75 84 84 72 72 72
Langkah-langkah dan teknik pembuatan distribusi frekuensi dilakukan sebagai berikut:
a. Hitunglah jarak atau rentangan (R):
Rumus R=data tertinggi-data terendah
R=94-60
=34
b. Hitunglah jumlah kelas (K) dengan Sturges:
Rumus Jumlah Kelas (K)=1+ (3,3 log n)
K=1+ (3,3 log 70)
=1+ (3,3 x 1,845)
=1+6,0885
=7,09 =7
c. Cara mencari interval kelas :
Interval kelas
Jarak
Banyaknya kelas
34
7
4,86
Dibulatkan menjadi 5
Kelas
60 64
65 69
70 74
75 79
80 84
85 89
90 94
Frekuensi
2
6
15
20
16
7
4
%
2,86
8,57
21,43
28,57
22,86
10,00
5,71
Kelas
60 64
65 69
70 74
75 79
80 84
85 89
90 94
Frekuensi
2
6
15
20
16
7
4
% relatif
2,86
8,57
21,43
28,57
22,86
10,00
5,71
% Kumulatif
2,86
11,43
32,86
61,43
84, 29
94,29
100,00
Kelas
60 64
65 69
70 74
75 79
80 84
85 89
90 94
Frekuensi
2
6
15
20
16
7
4
%
2,86
8,57
21,43
28,57
22,86
10,00
5,71
% Kumulatif
100,00
97,14
88,57
67,14
38,57
15,71
5,71
Latihan :
Diketahui data-data sebagai berikut :
25
85
88
57
43
27
24
33
86
66
88
88
72
47
52
24
86
85
73
29
5
87
44
30
41
30
40
50
76
75
55
59
62
56
43
26
38
76
80
80
log 39 = 1,59
Berdasarkan data di atas, carilah distribusi frekuensinya, serta distribusi
frekuensi kumulatif < dan >
Ukuran Penyebaran
Ukuran penyebaran adalah untuk mengukur penyimpangan nilai data di sekitar nilai rataratanya
Ukuran penyebaran meliputi kecondongan dan kepuncakan dari sebuah grafik, yang perlu
dihitung dalam menentukan ukuran penyebaran adalah : (1) Range; (2) Deviasi Rata-rata;
(3) Varians; (4) Standar Deviasi; dan (5) Koefisien Variasi
1. Range
Range adalah selisih antara nilai tertinggi dengan nilai terendah, symbol R
2. Deviasi Rata-rata
Adalah rata-rata aritmatik nilai absolute deviasi dari rata-rata aritmatiknya; symbol
AD
Rumusnya adalah :
1.Data sample AD
(x )
2.Data populasi AD
n
f (M )
3. Varians
Adalah rata-rata aritmatik deviasi kuadrat dari rata-ratanya
Rumusnya :
1.Data sample 2
(x )
2.Data populasi 2
n
f (M ) 2
4. Standar Deviasi
Adalah akar dari nilai varians positif
1.Data sample
2.Data populasi
(x )
n
atau 2
f (M )
f
atau 2
5. Koefisien Variasi
Adalah rasio antara standar deviasi dengan rata-rata aritmatik yang dinyatakan dalam
prosentase; symbol CV
CV
x100%
No
1
2
3
4
5
6
Nilai (x)
72
65
43
50
68
62
=360
60
60
60
60
60
60
(x-)
12
5
17
10
8
2
=54
(x-)2
144
25
289
100
64
4
=626
Jawab :
= 360 : 6 = 60
a. R = 72 43 = 29
b. AD = 54 : 6 = 9
c. 2 = 626 : 6 = 104,33
d.
104,33 10,21
10,21
56
76
65
78
82
66
70
72
70
75
Kelas
- 50
- 60
- 70
- 80
- 90
f
4
8
10
6
2
30
Rata-rata :
fxM
f
M
45.5
55.5
65.5
75.5
85.5
fxM
182
444
655
453
171
1.905
63.5
63.5
63.5
63.5
63.5
M-
18
8
2
12
22
f(M-)
72
64
20
72
44
272
(M-)2
324
64
4
144
484
f(M-)2
1296
512
40
864
968
3680
1905
63,5
30
a. Range = 90 41 = 49
b. Deviasi rata-rata :
AD
c. Varians
2
f (M )
f
3680
122,67
30
d. Standar Deviasi
2 122,67 11,08
e. Koefisien variasi
CV
11,08
x100%
x100% 17,45%
63,5
Latihan :
Diketahui data nilai mahasiswa kelas 321 adalah sbb:
53
65
70
72
75
75
78
80
82
80
72
68
73
74
77
78
75
76
81
68
53
85
88
66
70
87
74
80
80
60
Log 30 = 1,48
Dari data di atas, ditanya :
1. Berapakah nilai deviasi rata-ratanya
2. Berapakah nilai variansnya
3. Berapakah nilai standar deviasinya
4. Berapakah nilai koefisien variasinya
Angka Indeks
A. Pengertian
Yang dimaksud dengan angka indeks adalah ukuran statistik yang menunjukkan
perbandingan nilai suatu barang pada waktu atau tempat (daerah). Angka Indeks
digunakan untuk mengukur perubahan atau perbandingan variabel ekonomi/sosial, seperti
untuk mengukur perubahan tingkat produktivitas, penggangguran, gaji/upah dan harga
Misalnya kita hendak membuat perbandingan antara harga semen tahun 1995
dengan harga semen tahun 1990, didaerah yang sama. Hal ini berarti kita telah membuat
perbandingan dua kategori atau dua variabel yaitu barang berupa semen dan tahun berupa
waktu, tempatnya sama didaerah X, tetapi waktunya berbeda (1990 dan 1995). Begitu
juga jika kita membuat perbandingan harga semen diBandung dengan Jayapura tahun
1996, maka kita membandingkan harga semen berbeda tempat (daerah) pada waktu
bersamaan.
Manfaat angka indeks untuk mengetahui besarnya perubahan (naik turunnya)
suatu nilai barang.
9
( Pn.Qo) x100%
( Po.Qo)
IL
Pn
Po
Qo
Jenis
Barang
W
X
Y
Z
Kuantitas
1998 (Qo)
25
20
30
50
Langkah-langkah menjawab :
1. Kalikan antara harga barang pada tahun dasar (Po) dengan kuantitas barang pada
tahun dasar (Qo). Kemudian kalikan juga antara harga barang pada tahun ke-n
(Pn) dengan kuantitas pada tahun dasar (Qo).
10
( Pn.Qo) x100%
( Po.Qo)
37500
x100% 100
37500
41350
IL(1999)
x100% 110,27%
37500
46450
IL(2000)
x100% 123,87%
37500
52250
IL(2001)
x100% 139,33%
37500
IL(1998)
Metoda Passche
Indeks harga dihitung menurut Passche yaitu dengan menggunakan kuantitas tahun yang
dicari angka indeksnya atau tahun ke-n Rumusnya :
IP
IP
( Pn.Qn) x100%
( Po.Qn)
Pn
Po
Qn
Langkah-langkah menjawab
1. Kalikan antara harga barang pada tahun dasar (Po) dengan kuantitas barang pada
tahun ke-n (Qn). Kemudian kalikan juga antara harga barang pada tahun ke-n (Pn)
dengan kuantitas barang pada tahun ke-n (Qn).
TABEL 5.4
PERHITUNGAN INDEKS HARGA PASSCHE
BARANG XWYZ 1999 SAMPAI 2001 DENGAN TAHUN DASAR 1998
Jenis
98/99
98/00
98/01
1999
2000
2001
barang
Po.Qn
Po.Qn
Po.Qn
Pn.Qn
Pn.Qn
Pn.Qn
W
10500
13500
16500
11900
16200
22000
X
5500
7700
11000
6000
9100
15000
Y
20800
33600
36400
22400
34500
43750
Z
11000
14000
17000
12375
21000
29750
Jumlah
47800
68800
80900
52675
80800
110500
2. Hitunglah dengan rumus
IP
( Pn.Qn) x100%
( Po.Qn)
52675
x100 110,2 %
47800
IP ( 2000)
80800
x100 117 ,44 %
68800
IP (2001)
110500
x100 136,59 %
80900
Metode Drobisch
Perhitungan angka indeks dengan metoda Laspeyres dan metoda Paasche umumnya kecil.
Apabila perbedaannya terlalu besar, maka digunakan metoda Drobisch. caranya membuat
rata-rata hitung dari angka indeks metoda Laspeyres dan metoda Passche dibagi dua.
Rumus metoda Drobisch berikut :
ID 1 / 2
( Pn.Qo) ( Pn.Qn)
( Po.Qo) ( Po.Qn)
x100%
atau
ID = (IL + IP)
IP (1998) = 100%
IL (1999) = 110,27%
IP (1999) = 110,2%
IL (2000) = 123,87%
IP (2000) = 117,44%
12
IL (2001) = 139,33%
IP (2001) = 136,59%
ILxIP
100 x100
=100
IF 1999 =
110, 27 x110, 2
IF 2000 =
=120,61%
IF 2001 =
139,33 x136,59
=137,95%
=110,23%
Latihan :
Jenis
Barang
Harga (Rp)
1998
1999 2000
(Po)
(Pn)
(Pn)
W
22
23
24
X
23
24
27
Y
12
15
17
Z
14
15
17
Dari data di atas berapakah :
2001
(Pn)
25
30
18
17
1998
(Qo)
24
26
29
30
Kuantitas
1999
2000
(Qn)
(Qn)
28
29
27
30
31
35
33
35
2001
(Qn)
34
32
37
37
Korelasi
Korelasi merupakan angka yang menunjukkan arah
dan kuatnya hubungan antar dua variabel (atau lebih). Arah
dinyatakan dalam bentuk hubungan positip (+) atau negatip
13
Menurut
Soegiyono
(2004:216)
memberikan
pedoman interpretasi terhadap nilai korelasi.
1. 0,00 0,19 terdapat hubungan sangat rendah
2. 0,20 0,39 terdapat hubungan rendah
3. 0,40 0,59 terdapat hubungan sedang
4. 0,60 0,79 terdapat hubungan kuat
5. 0,80 1,00 terdapat hubungan sangat kuat
1. Korelasi Linier Sederhana
Koefisien korelasi linier (Pearson product moment correlation coefficient) antara dua
variabel dapat dicari dengan persamaan berikut:
r
n X Y X Y
[n X 2 ( X) 2 ] [n Y 2 ( Y) 2 ]
Dimana :
n = banyaknya data
X = variabel bebas/independent variabel
14
XY
30.114
51.440
48.360
34.438
49.551
57.150
43.425
40.536
355.014
n X Y X Y
[n X ( X) 2 ] [n Y 2 ( Y) 2 ]
2
2840112 2814432
(373920 369664)(21618984 21427641)
25680
4256 x191343
25680
r
814355808
25680
r
28536,92
r 0,90
r
Jadi hubungan antara biaya promosi dengan peningkatan nasabah Bank AAgim adalah
sebesar 0,90. Hubungan yang terjadi adalah sangat kuat dan positif
Latihan :
Diketahui data promosi penjualan dan omzet penjualan pada PT ABC adalah sbb :
15
Tahun
Promosi Penjualan(X)
2000
34
2001
47
2002
65
2003
54
2004
73
2005
87
2006
73
Carilah nilai korelasinya
Omzet (Y)
34
32
52
78
87
73
76
di = selisih rank
n = banyaknya data
X
Y
63 478
80 643
78 620
67 514
83 597
90 635
75 579
72 563
Jumlah
Rank X
8
3
4
7
2
1
5
6
Rank Y
8
1
3
7
4
2
5
6
di
0
2
1
0
-2
-1
0
0
di2
0
4
1
0
4
1
0
0
10
16
6 di 2
n( n 2 1)
6 x10
1
8 x(82 1)
60
1
8 x(64 1)
60
1
504
1 0,119 0,881
Latihan :
Diketahui data sbb:
X
y
57
87
63
96
carilah nilai korelasi rank spearmannya dan korelasi
16
99
80
77
linier sederhananya
42
90
65
92
42
10
Regresi Linier Sederhana
11
52
Regresi adalah analisa pengaruh antara variabel x (independent) terhadap variable y
(dependent)
Persamaan regresi :
y = a + bx
y = variable terikat
x = variable bebas
a = konstanta
b = koefisien regresi
rumus :
b
n X Y X
n X X
2
a Y bX
17
contoh soal
X
Y
XY
X2
50 40
2.000 2.500
60 45
2.700 3.600
70 55
3.850 4.900
80 65
5.200 6.400
90 70
6.300 8.100
350 275 20.050 25.500
_
X = X : n = 350 : 5 = 70
_
Y = Y : n = 275 : 5 = 55
Y = a + bx
b
n XY X Y
n X 2 X
a Y bX
a = 55 0,8x70
a = 55 56
a = -1
y = a + bx
y = -1 + 0,8 (0)
= -1
jika x=1, maka nilai regresinya adalah
y = a + bx
y = -1 + 0,8(1)
y = -1 + 0,8
y = -0,2
jika x = 5 maka nilai regresinya adalah
y = a + bx
y = -1 + 0,8(5)
y = -1 + 4
y=3
Tugas
Diketahui data sbb :
X
46
40
49
40
42
45
48
50
Y
45
29
60
48
45
70
67
73
X = Promosi Y= Penjualan
19
1
2
13
15
15
14
14
16
4
5
6
7
8
9
10
17
21
23
24
21
25
25
16
19
21
23
22
24
25
Analisa Trend
Adalah analisa terhadap sekumpulan data yang dicatat selama periode tertentu, umumnya
berupa data mingguan, bulanan, kuartal atau tahunan, seperti data berkala pada penjualan
yang diperoleh sebuah department store secara kuartalan sejak pembukaan toko tersebut
Bentuk
Y = a + bx
Dimana :
X = waktu
Y = dependent variable
tentukan nilai x dimana nilai pertama dalam nilai (0) diurutkan sampai dengan
data terakhir
b.
bagi data menjadi dua kelompok dimana anggota masing-masing kelompok sama,
jika jumlah data ganjil, maka data yang ada di tengah di abaikan
c.
d.
e.
Contoh soal :
Tahun
1991
1992
1993
1994
1995
1996
1997
y
20
30
40
20
15
25
30
x
0
1
2
3
4
5
6
X1 = 1
di abaikan karena ganjil
X2 = 5
y1 = 20 + 30 + 40 = 30
3
y2 = 15 + 25 + 30 = 23,3
3
(x1;y1) = (1;30)
30 = a + b(1)
(x2;y2) = (5;23,3)
23,3 = a + b(5) _
6,7 = 0 4b
b = 6,7 = -1,7
-4
30 = a + bX
30 = a + (-1,7x1)
a = 30 + 1,7
a = 31,7
y = 31,7 -1,7x
y pada tahun 1998 x = 7
y = 31,7 1,7x
y = 31,7 1,7 (7)
y = 31,7 -11,9
y = 19,8
1992
1993
1994
1995
-1
1
3
5
n = ganjil, data yang ada di tengah diberi angka 0, di atasnya -1 dan di bawahnya
+1 , kenaikan 1
Tahun
X
1990
-3
1991
-2
1992
-1
1993
0
1994
1
1995
2
1996
3
Contoh soal
Tahun
Y
x
xy
x2
1991
28
-9
-252
81
1992
28
-7
-196
49
1993
29
-5
-145
25
1994
29
-3
-87
9
1995
29
-1
-29
1
1996
29
1
29
1
1997
29
3
87
9
1998
30
5
150
25
1999
20
7
140
49
2000
30
9
270
81
jml
281
-33
330
Jawab :
b = -33 = -0,1
330
a = 281 = 28,1
10
Persamaan : y = 28,1 0,1X
Berapakah nilai y pada tahun 2002?
Y = a + bx
Y = 28,1 + (-0,1x13)
Y = 28,1 -1,3
Y = 26,8
Latihan :
1. diketahui data sebagai berikut :
Tahun
Pendapatan
2001
30
2002
46
2003
44
22
2004
2005
2006
2007
2008
2009
37
51
36
39
44
49
23