Anda di halaman 1dari 42

Machine Translated by Google

4
Tujuan pembelajaran
Ketika Anda telah menyelesaikan
Menggambarkan Data:
bab ini, Anda akan dapat: Menampilkan dan Menjelajahi Data

LO1 Buat dan interpretasikan plot titik.

LO2 Bangun dan jelaskan tampilan

batang-dan-daun.

LO3 Mengidentifikasi dan


menghitung ukuran posisi.

LO4 Membangun dan menganalisis


plot kotak.

LO5 Hitung dan jelaskan koefisien


kemiringan.

LO6 Membuat dan


menginterpretasikan diagram pencar.

LO7 Kembangkan dan jelaskan


tabel kontingensi.

McGivern Jewellers baru-baru ini memasang iklan di koran lokal

melaporkan bentuk, ukuran, harga, dan tingkat potongan untuk 33 berliannya

saham. Kembangkan plot kotak dari harga variabel dan komentari

hasil. (Lihat Latihan 37 dan LO4.)


Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 103

4.1 Pendahuluan
Bab 2 memulai studi kami tentang statistik deskriptif. Untuk mengubah data mentah atau
tidak dikelompokkan menjadi bentuk yang bermakna, kami mengatur data ke dalam
distribusi frekuensi. Kami menyajikan distribusi frekuensi dalam bentuk grafik sebagai
histogram atau poligon frekuensi. Ini memungkinkan kita untuk memvisualisasikan di mana
data cenderung mengelompok, nilai terbesar dan terkecil, dan bentuk umum data.
Di Bab 3, pertama-tama kita menghitung beberapa ukuran lokasi, seperti rata-rata dan
median. Ukuran lokasi ini memungkinkan kami untuk melaporkan nilai tipikal dalam kumpulan
pengamatan. Kami juga menghitung beberapa ukuran dispersi, seperti jangkauan dan
standar deviasi. Ukuran dispersi memungkinkan kita untuk menggambarkan variasi atau
penyebaran dalam satu set pengamatan.
Kami melanjutkan studi kami tentang statistik deskriptif dalam bab ini. Kami mempelajari
(1) plot titik, (2) tampilan batang dan daun, (3) persentil, dan (4) plot kotak. Bagan dan
statistik ini memberi kami wawasan tambahan tentang di mana nilai terkonsentrasi serta
bentuk umum data. Kemudian kami mempertimbangkan data bivariat. Dalam data bivariat,
kami mengamati dua variabel untuk setiap individu atau pengamatan yang dipilih. Contohnya
termasuk: jumlah jam yang dipelajari siswa dan poin yang diperoleh dari ujian; apakah
suatu produk sampel dapat diterima atau tidak dan pergeseran pembuatannya; dan jumlah
listrik yang digunakan dalam sebulan oleh pemilik rumah dan rata-rata suhu tinggi harian di
wilayah tersebut selama sebulan.

4.2 Plot Titik


LO1 Buat dan Ingat data Applewood Auto Group, kami merangkum keuntungan yang diperoleh dari 180
interpretasikan plot titik. kendaraan yang dijual ke dalam delapan kelas. Saat kami mengatur data ke dalam delapan
kelas, kami kehilangan nilai pasti dari pengamatan. Sebuah dot plot, di sisi lain,
mengelompokkan data sesedikit mungkin, dan kami tidak kehilangan identitas pengamatan
individu. Untuk mengembangkan plot titik, kami cukup menampilkan satu titik untuk setiap
pengamatan di sepanjang garis bilangan horizontal yang menunjukkan nilai data yang
mungkin. Jika ada pengamatan yang identik atau pengamatan terlalu dekat untuk
ditampilkan satu per satu, titik-titik tersebut “ditumpuk” di atas satu sama lain. Hal ini
Plot titik memberikan memungkinkan kita untuk melihat bentuk distribusi, nilai data yang cenderung mengelompok,
gambaran visual tentang dan observasi terbesar dan terkecil. Plot titik paling berguna untuk kumpulan data yang
penyebaran dan lebih kecil, sedangkan togramnya cenderung paling berguna untuk kumpulan data besar.
konsentrasi data. Contoh akan menunjukkan bagaimana membangun dan menafsirkan plot titik.

Contoh Departemen servis di Tionesta Ford Lincoln Mercury dan Sheffield Motors
Inc., dua dari empat dealer Applewood Auto Group, keduanya buka 24 hari kerja bulan lalu.
Di bawah ini adalah jumlah kendaraan yang diservis bulan lalu di dua diler tersebut. Bangun
plot titik dan laporkan statistik ringkasan untuk membandingkan dua dealer.

Tionesta Ford Lincoln Mercury


Senin Selasa Rabu Kamis Jumat Sabtu
23 33 27 28 39 26
30 32 28 33 35 32
29 25 36 31 32 27
35 32 35 37 36 30
Machine Translated by Google

104 Bab 4

Sheffield Motor Inc.

Senin Selasa Rabu Kamis Jumat Sabtu


31 35 44 36 34 37
30 37 43 31 40 31
32 44 36 34 43 36
26 38 37 30 42 33

Larutan Sistem Minitab menyediakan plot titik dan menampilkan nilai rata-rata, median, maksimum,
dan minimum, serta standar deviasi untuk jumlah mobil yang diservis di kedua dealer
selama 24 hari kerja terakhir.

Plot titik, ditampilkan di tengah keluaran perangkat lunak, secara grafis mengilustrasikan
distribusi untuk kedua dealer. Plot menunjukkan perbedaan lokasi dan penyebaran
pengamatan. Dengan melihat dot plot, kita dapat melihat bahwa jumlah kendaraan yang
diservis di diler Sheffield tersebar lebih luas dan rata-ratanya lebih besar daripada di diler
Tionesta. Beberapa fitur lain dari jumlah kendaraan yang dilayani adalah:

• Tionesta menyervis mobil paling sedikit dalam satu


hari, 23. • Sheffield menyervis 26 mobil selama hari paling lambat, yaitu kurang dari 4 mobil
hari terendah berikutnya.
• Tionesta melayani tepat 32 mobil pada empat hari yang
berbeda. • Jumlah mobil yang dilayani cluster sekitar 36 untuk Sheffield dan 32 untuk
Tionesta.

Dari statistik deskriptif, kita melihat bahwa Sheffield melayani rata-rata 35,83 kendaraan
per hari. Tionesta melayani rata-rata 31.292 kendaraan per hari selama periode yang
sama. Jadi Sheffield biasanya melayani 4,54 kendaraan lebih banyak per hari. Ada juga
lebih banyak dispersi, atau variasi, dalam jumlah harian kendaraan yang dilayani di
Sheffield daripada di Tionesta. Bagaimana kita tahu ini? Standar deviasi lebih besar di
Sheffield (4,96 kendaraan per hari) daripada di Tionesta (4,112 mobil per hari).
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 105

4.3 Tampilan Batang dan Daun


LO2 Bangun dan Di Bab 2, kami menunjukkan cara mengatur data ke dalam distribusi frekuensi sehingga kami
jelaskan tampilan batang- dapat meringkas data mentah menjadi bentuk yang bermakna. Keuntungan utama dari
dan-daun. pengorganisasian data ke dalam distribusi frekuensi adalah kita mendapatkan gambaran
visual yang cepat dari bentuk distribusi tanpa melakukan perhitungan lebih lanjut. Dengan
kata lain, kita dapat melihat di mana data terkonsentrasi dan juga menentukan apakah ada
nilai yang sangat besar atau kecil. Akan tetapi, ada dua kelemahan dalam mengatur data ke
dalam distribusi frekuensi: (1) kita kehilangan identitas pasti dari setiap nilai dan (2) kita tidak
yakin bagaimana nilai dalam setiap kelas didistribusikan. Untuk menjelaskan, distribusi
frekuensi berikut ini menunjukkan jumlah tempat iklan yang dibeli oleh 45 anggota Asosiasi
Dealer Mobil Buffalo Besar pada tahun 2010. Kami mengamati bahwa 7 dari 45 dealer
membeli setidaknya 90 tetapi kurang dari 100 tempat. Namun, apakah tempat yang dibeli
dalam kelas ini mengelompok sekitar 90, tersebar merata di seluruh kelas, atau mengelompok
mendekati 99? Kami tidak tahu.

Jumlah Spot yang Dibeli Frekuensi


80 s/d 90 2
90 s/d 100 7
Statistik dalam Tindakan 100 s/d 110 6
110 s/d 120 9
John W. Tukey
120 s/d 130 8
(1915–2000) menerima
gelar PhD di bidang matematika 130 s/d 140 7

ics dari Princeton di 140 s/d 150 3


150 s/d 160 3
1939. Namun, saat
bergabung dengan Total 45
Fire Control Research

Kantor selama Dunia Salah satu teknik yang digunakan untuk menampilkan informasi kuantitatif dalam bentuk
Perang II, ketertarikannya padat adalah stem-and-leaf display. Keuntungan tampilan batang-dan-daun dibandingkan
pada matematika abstrak
distribusi frekuensi adalah kita tidak kehilangan identitas setiap pengamatan. Pada contoh di
bergeser ke statistik atas, kita tidak akan mengetahui identitas nilai pada kelas 90 sampai dengan 100. Untuk
terapan. Dia mengilustrasikan konstruksi pajangan batang-dan-daun dengan menggunakan jumlah tempat
mengembangkan numerik yang efektif
iklan yang dibeli, misalkan tujuh pengamatan pada kelas 90 sampai dengan 100 adalah: 96,
dan metode grafis 94, 93, 94, 95, 96, dan 97. nilai batang adalah digit atau digit terdepan, dalam hal ini 9. Daun
untuk mempelajari pola adalah digit yang mengikuti. Batang ditempatkan di sebelah kiri garis vertikal dan nilai daun di
dalam data. Di antara sebelah kanan.
grafik yang Nilai dalam kelas 90 hingga 100 akan muncul sebagai berikut:
dikembangkannya
adalah diagram batang 9 @ 6434567
dan daun serta kotak dan kumis

petak atau petak kotak. Biasanya juga mengurutkan nilai dalam setiap batang dari yang terkecil hingga yang terbesar.
Dari tahun 1960 hingga Dengan demikian, tampilan batang dan daun baris kedua akan muncul sebagai berikut:
1980, Tukey memimpin statistik
divisi NBC
9 @ 3445667
tim proyeksi suara
malam pemilu. Dia Dengan tampilan batang dan daun, kita dapat dengan cepat mengamati bahwa ada dua
menjadi terkenal di
dealer yang membeli 94 titik dan jumlah titik yang dibeli berkisar antara 93 hingga 97. Tampilan
1960 untuk mencegah batang dan daun mirip dengan distribusi frekuensi dengan informasi lebih lanjut, yaitu, identitas
seruan awal pengamatan dipertahankan.
kemenangan bagi Richard
Nixon dalam pemilihan
TAMPILAN STEM-AND-LEAF Teknik statistik untuk menampilkan sekumpulan data.
presiden menang
Setiap nilai numerik dibagi menjadi dua bagian. Digit terdepan menjadi batang dan digit
oleh John F. Kennedy.
terakhir menjadi daun. Batang terletak di sepanjang sumbu vertikal, dan nilai daun
ditumpuk satu sama lain di sepanjang sumbu horizontal.
Machine Translated by Google

106 Bab 4

Contoh berikut akan menjelaskan detail pengembangan tampilan batang dan daun.

Contoh Tercantum dalam Tabel 4-1 adalah jumlah iklan radio berdurasi 30 detik yang dibeli oleh masing-masing dari 45
anggota Greater Buffalo Automobile Dealers Association tahun lalu. Mengatur data ke dalam tampilan
batang-dan-daun. Kira-kira pada nilai berapakah jumlah titik iklan cenderung mengelompok? Berapa
jumlah spot yang paling sedikit dibeli oleh dealer? Jumlah terbesar yang dibeli?

TABEL 4–1 Jumlah Tempat Iklan yang Dibeli oleh Anggota Kerbau Besar
Asosiasi Dealer Otomotif

96 93 88 117 127 95 113 96 108 94 148 156


139 142 94 107 125 155 155 103 112 127 117 120
112 135 132 111 125 104 106 139 134 119 97 89
118 136 125 143 120 103 113 124 138

Larutan Dari data pada Tabel 4–1, kami mencatat bahwa jumlah titik terkecil yang dibeli adalah 88. Jadi kami
akan membuat nilai batang pertama menjadi 8. Angka terbesar adalah 156, sehingga nilai batang
akan dimulai dari 8 dan berlanjut ke 15. Angka pertama pada Tabel 4–1 adalah 96, yang akan
memiliki nilai batang 9 dan nilai daun 6. Bergerak melintasi baris atas, nilai kedua adalah 93 dan nilai
ketiga adalah 88. Setelah 3 data pertama nilai dipertimbangkan, bagan Anda adalah sebagai berikut.

Tangkai Daun

8 8
9 63
10
11
12
13
14
15

Mengatur semua data, bagan batang-dan-daun terlihat sebagai berikut.

Tangkai Daun

8 89
9 635644787
10 3463732
11 721983757055
12 0495294688
13 23655
14

15

Prosedur yang biasa dilakukan adalah mengurutkan nilai daun dari yang terkecil hingga terbesar.
Baris terakhir, baris yang mengacu pada nilai di tahun 150-an, akan muncul seperti:

15 @ 556

Tabel terakhir akan muncul sebagai berikut, di mana kami telah mengurutkan semua nilai daun.
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 107

Tangkai Daun

8 89

9 3445667334

10 678122337

11 7890045557724

12 56899238556

13

14

15

Anda dapat menarik beberapa kesimpulan dari tampilan batang-dan-daun.


Pertama, jumlah minimal spot yang dibeli adalah 88 dan maksimal 156. Dua dealer
membeli kurang dari 90 spot, dan tiga membeli 150 atau lebih. Anda dapat mengamati,
misalnya, bahwa tiga dealer yang membeli lebih dari 150 titik sebenarnya membeli
155, 155, dan 156 titik. Konsentrasi jumlah spot antara 110 hingga 130. Terdapat
sembilan dealer yang membeli antara 110 hingga 119 spot dan delapan dealer yang
membeli antara 120 hingga 129 spot. Kami juga dapat mengetahui bahwa dalam grup
120 hingga 129 jumlah sebenarnya tempat yang dibeli tersebar merata. Artinya, dua
dealer membeli 120 spot, satu dealer membeli 124 spot, tiga dealer membeli 125 spot,
dan dua dealer membeli 127 spot.
Kami juga dapat menghasilkan informasi ini di sistem perangkat lunak Minitab.
Kami telah menamai variabel Spots. Keluaran Minitab ada di bawah. Anda dapat
menemukan perintah Minitab yang akan menghasilkan keluaran ini di akhir bab.

Solusi Minitab menyediakan beberapa informasi tambahan mengenai total


kumulatif. Di kolom sebelah kiri batang nilai adalah angka seperti 2, 9, 15, dan
seterusnya. Angka 9 menunjukkan bahwa ada 9 pengamatan yang telah terjadi sebelum
nilai 100. Angka 15 menunjukkan bahwa 15 pengamatan telah terjadi sebelum 110.
Kira-kira di tengah kolom angka 9 muncul dalam tanda kurung. Tanda kurung
menunjukkan bahwa nilai tengah atau median muncul di baris itu dan ada sembilan nilai
dalam grup ini. Dalam hal ini, kami menggambarkan nilai tengah sebagai nilai di bawah
mana setengah dari pengamatan terjadi. Total ada 45 observasi, jadi nilai tengah, jika
data diurutkan dari terkecil ke terbesar, akan menjadi observasi ke-23; nilainya 118.
Setelah median, nilainya mulai menurun. Nilai-nilai ini mewakili total kumulatif "lebih
dari". Ada 21 pengamatan dari 120 atau lebih, 13 dari 130 atau lebih, dan seterusnya.
Machine Translated by Google

108 Bab 4

Manakah pilihan yang lebih baik, plot titik atau bagan batang dan daun? Ini benar-benar
masalah pilihan dan kenyamanan pribadi. Untuk menyajikan data, terutama dengan jumlah
observasi yang banyak, Anda akan menemukan bahwa dot plot lebih sering digunakan. Anda akan
melihat plot titik dalam literatur analitik, laporan pemasaran, dan kadang-kadang dalam laporan
tahunan. Jika Anda melakukan analisis cepat untuk diri Anda sendiri, penghitungan batang dan
daun berguna dan mudah, terutama pada kumpulan data yang lebih kecil.

Tinjauan Diri 4–1

1. Jumlah karyawan pada masing-masing 142 Toko Home Depot di wilayah Tenggara ditunjukkan pada dot
plot berikut.

80 84 88 92 96 100 104
Jumlah karyawan

(a) Berapa jumlah maksimum dan minimum karyawan per toko? (b) Berapa banyak toko yang
mempekerjakan 91 orang? (c) Di sekitar nilai
berapa jumlah karyawan per toko cenderung mengelompok?
2. Tingkat pengembalian 21 saham adalah:

8.3 9.6 9.5 9.1 8.8 11.2 7.7 10.1 9.9 10.8
10.2 8.0 8.4 8.1 11.6 9.6 8.8 8.0 10.4 9.8 9.2

Atur informasi ini menjadi tampilan batang dan daun. (a) Berapa
tarif yang kurang dari 9,0? (b) Cantumkan tarif
dalam kategori 10.0 hingga 11.0. (c) Berapa mediannya? (d)
Berapa tingkat pengembalian
maksimum dan minimum?
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 109

Latihan
1. Jelaskan perbedaan antara histogram dan plot titik. Kapan plot titik lebih baik daripada
histogram?
2. Jelaskan perbedaan antara histogram dan tampilan batang dan daun.
3. Perhatikan bagan berikut.

1 2345 6 7

A. Bagan ini disebut apa? B.


Berapa banyak pengamatan dalam penelitian?
C. Berapakah nilai maksimum dan minimumnya? D. Di
sekitar nilai apa pengamatan cenderung mengelompok?
4. Bagan berikut melaporkan jumlah ponsel yang terjual di Radio Shack untuk yang terakhir
26 hari.

4 9 14 19

A. Berapa jumlah maksimum dan minimum ponsel yang terjual dalam sehari? B. Berapa
jumlah tipikal ponsel yang dijual?
5. Baris pertama bagan batang dan daun muncul sebagai berikut: 62 @ 1 3 3 7 9. Asumsikan utuh
nilai angka. A.
Apa "kisaran yang mungkin" dari nilai-nilai di baris ini? B.
Berapa banyak nilai data di baris ini? C.
Cantumkan nilai aktual dalam baris data ini.
6. Baris ketiga bagan batang-dan-daun muncul sebagai berikut: 21 @ 0 1 3 5 7 9. Asumsikan utuh
nilai angka. A.
Apa "kisaran yang mungkin" dari nilai-nilai di baris ini? B.
Berapa banyak nilai data di baris ini? C.
Cantumkan nilai aktual dalam baris data ini.
7. Bagan batang dan daun berikut dari perangkat lunak Minitab menunjukkan jumlah unit
diproduksi per hari di pabrik.

1 38
1 4
2 56
9 6 0133559
(7) 7 0236778
9 8 59
7 9 00156
2 10 36

A. Berapa hari dipelajari? B. Berapa


banyak pengamatan di kelas satu? C. Berapakah
nilai minimum dan nilai maksimumnya?
Machine Translated by Google

110 Bab 4

D. Cantumkan nilai sebenarnya di baris keempat. e.


Cantumkan nilai sebenarnya di baris kedua. F. Berapa
banyak nilai yang kurang dari 70? G. Berapa
banyak nilai 80 atau lebih? H. Apa mediannya?
Saya. Berapa banyak nilai
antara 60 dan 89, inklusif?
8. Bagan batang-dan-daun berikut melaporkan jumlah film yang disewa per hari di Video
Koneksi di sudut Jalan Keempat dan Utama.

3 12 689
6 13 123
10 14 6889
13 15 589
15 16 35
20 17 24568
23 18 268
(5) 19 13456
22 20 034679
16 21 2239
12 22 789
9 23 00179
4 24 8
3 25 13
1 26
1 27 0

A. Berapa hari dipelajari? B. Berapa banyak


pengamatan di kelas terakhir? C. Berapa nilai maksimum dan
minimum di seluruh kumpulan data? D. Cantumkan nilai sebenarnya di baris keempat. e.
Cantumkan nilai aktual di sebelah baris terakhir. F.
Berapa hari film yang disewa kurang dari 160? G. Berapa hari
220 film atau lebih disewa? H. Berapa nilai tengahnya?

Saya. Berapa hari antara 170 dan 210 film disewa?


9. Survei jumlah panggilan telepon seluler yang dilakukan oleh sampel pelanggan Verizon minggu lalu mengungkapkan
informasi berikut. Kembangkan bagan batang-dan-daun. Berapa banyak panggilan yang dilakukan pelanggan
pada umumnya? Berapa jumlah panggilan maksimum dan minimum yang dilakukan?

52 43 30 38 30 42 12 46 39
37 34 46 32 18 41 5

10. Aloha Banking Co. sedang mempelajari penggunaan ATM di pinggiran kota Honolulu. Sampel dari 30 ATM
menunjukkan bahwa mereka digunakan beberapa kali kemarin. Kembangkan bagan batang dan daun. Ringkas
berapa kali setiap ATM digunakan. Berapa kali tipikal, minimum, dan maksimum setiap ATM digunakan?

83 64 84 76 84 54 75 59 70 61
63 80 84 73 68 52 65 90 52 77
95 36 78 61 59 84 95 47 87 60
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 111

4.4 Ukuran Posisi


LO3 Mengidentifikasi Standar deviasi adalah ukuran dispersi yang paling banyak digunakan. Namun, ada cara lain untuk
dan menghitung ukuran menggambarkan variasi atau penyebaran dalam satu set data. Salah satu metode adalah menentukan
posisi. lokasi nilai yang membagi sekumpulan pengamatan menjadi bagian yang sama. Ukuran-ukuran ini
termasuk kuartil, desil, dan persentil.
Kuartil membagi sekumpulan Kuartil membagi satu set pengamatan menjadi empat bagian yang sama. Untuk menjelaskan lebih
data menjadi empat bagian. lanjut, pikirkan kumpulan nilai apa pun yang disusun dari yang terkecil hingga yang terbesar. Dalam Bab
3, kita menyebut nilai tengah dari kumpulan data yang disusun dari terkecil hingga terbesar sebagai median.
Artinya, 50 persen pengamatan lebih besar dari median dan 50 persen lebih kecil. Median adalah ukuran
lokasi karena menunjukkan dengan tepat pusat data. Dengan cara yang sama, kuartil membagi
sekumpulan pengamatan menjadi empat bagian yang sama. Kuartil pertama, biasanya diberi label Q1,
adalah nilai di bawah 25 persen pengamatan terjadi, dan kuartil ketiga, biasanya diberi label Q3, adalah
nilai di bawah 75 persen pengamatan terjadi. Logikanya, Q2 adalah median. Q1 dapat dianggap sebagai
"median" dari bagian bawah data dan Q3 sebagai "median" dari bagian atas data.

Demikian pula, desil membagi satu set pengamatan menjadi 10 bagian yang sama dan persentil
menjadi 100 bagian yang sama. Jadi jika Anda menemukan bahwa IPK Anda berada di desil ke-8 di
universitas Anda, Anda dapat menyimpulkan bahwa 80 persen siswa memiliki IPK lebih rendah dari
Anda dan 20 persen memiliki IPK lebih tinggi. IPK pada persentil ke-33 berarti 33 persen mahasiswa
memiliki IPK lebih rendah dan 67 persen memiliki IPK lebih tinggi. Skor persentil sering digunakan untuk
melaporkan hasil tes standar nasional seperti SAT, ACT, GMAT (digunakan untuk menilai masuk ke
banyak program magister administrasi bisnis), dan LSAT (digunakan untuk menilai masuk ke sekolah
hukum).

Kuartil, Desil, dan Persentil


Untuk memformalkan prosedur komputasi, misalkan Lp merujuk ke lokasi persentil yang diinginkan.
Jadi jika kita ingin mencari persentil ke-33 kita akan menggunakan L33 dan jika kita menginginkan
median, persentil ke-50, maka L50. Jumlah pengamatan adalah n, jadi jika kita ingin mencari median,
posisinya ada di (n 1)/2, atau kita bisa menuliskannya sebagai (n 1)(P/100), di mana P adalah persentil
yang diinginkan.

P
LOKASI PERSENTIL Lp (n [4–1]
1) 100

Sebuah contoh akan membantu menjelaskan lebih lanjut.

Contoh Di bawah ini adalah komisi yang diperoleh bulan lalu dari sampel 15 broker di
Kantor Salomon Smith Barney di Oakland, California. Salomon Smith Barney adalah perusahaan
investasi dengan kantor yang berlokasi di seluruh Amerika Serikat.

$2.038 $1.758 $1.721 $1.637 $2.097 $2.047 $2.205 $1.787 $2.287


1.940 2.311 2.054 2.406 1.471 1.460

Temukan median, kuartil pertama, dan kuartil ketiga untuk komisi yang diperoleh.
Machine Translated by Google

112 Bab 4

Larutan Langkah pertama adalah mengurutkan data dari komisi terkecil hingga terbesar.

$1.460 $1.471 $1.637 $1.721 $1.758 $1.787 $1.940 $2.038


2.047 2.054 2.097 2.205 2.287 2.311 2.406

Nilai median adalah pengamatan di tengah. Nilai tengah atau L50 terletak pada (n1 )
(50/100), dimana n adalah banyaknya observasi. Dalam hal ini adalah posisi nomor 8,
ditemukan oleh (15 1)(50/100). Komisi terbesar kedelapan adalah $2.038.
Jadi kami menyimpulkan ini adalah median dan setengah dari broker
memperoleh komisi lebih dari $2.038 dan setengahnya menghasilkan
kurang dari $2.038.
Ingat kembali definisi kuartil. Kuartil membagi satu set pengamatan
menjadi empat bagian yang sama. Oleh karena itu 25 persen pengamatan
akan lebih kecil dari kuartil pertama. Tujuh puluh lima persen pengamatan
akan kurang dari kuartil ketiga. Untuk menemukan kuartil pertama, kami
menggunakan rumus (4–1), di mana n 15 dan P 25:
P 25
L25 (n (15 1) 4
1) 100 100

dan untuk menemukan kuartil ketiga, n 15 dan P 75:


P 75
L75 (n (15 1) 12
1) 100 100

Oleh karena itu, nilai kuartil pertama dan ketiga masing-masing terletak
di posisi 4 dan 12. Nilai keempat dalam larik terurut adalah $1.721 dan
yang kedua belas adalah $2.205. Ini adalah kuartil pertama dan ketiga.

Dalam contoh di atas, rumus lokasi menghasilkan bilangan bulat. Yaitu, kami ingin
menemukan kuartil pertama dan ada 15 pengamatan, jadi lokasi mula yang ditunjukkan
kami harus mencari nilai urutan keempat. Bagaimana jika ada 20 observasi dalam sampel,
yaitu n 20, dan kita ingin mencari kuartil pertama?
Dari rumus lokasi (4–1):
P 25
L25 (n (20 1) 5.25
1) 100 100
Kami akan menempatkan nilai kelima dalam larik terurut dan kemudian memindahkan 0,25
jarak antara nilai kelima dan keenam dan melaporkannya sebagai kuartil pertama.
Seperti median, kuartil tidak perlu menjadi salah satu nilai aktual dalam kumpulan data.

Untuk menjelaskan lebih lanjut, misalkan kumpulan data berisi enam nilai: 91, 75, 61,
101, 43, dan 104. Kita ingin mencari kuartil pertama. Kami mengurutkan nilai dari yang
terkecil hingga terbesar: 43, 61, 75, 91, 101, dan 104. Kuartil pertama terletak
P di 25
L25 (n (6 1.75
1) 100 1) 100

Rumus posisi memberi tahu kita bahwa kuartil pertama terletak di antara nilai pertama dan
kedua dan jaraknya adalah 0,75 antara nilai pertama dan kedua. Nilai pertama adalah 43
dan yang kedua adalah 61. Jadi jarak antara kedua nilai ini adalah 18. Untuk mencari kuartil
pertama, kita perlu memindahkan 0,75 jarak antara nilai pertama dan kedua, jadi 0,75(18)
13.5. Untuk menyelesaikan prosedur, kita tambahkan 13,5 ke nilai pertama dan laporkan
bahwa kuartil pertama adalah 56,5.
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 113

Kita dapat memperluas ide untuk menyertakan desil dan persentil. Untuk menemukan persentil ke-23
dalam sampel 80 pengamatan, kita akan mencari posisi 18,63.

P 23
L23 (N 1) (80 1) 100 18.63
100

Untuk menemukan nilai yang sesuai dengan persentil ke-23, kita akan mencari nilai ke-18 dan nilai ke-19 dan
menentukan jarak antara kedua nilai tersebut. Selanjutnya, kita akan mengalikan selisih ini dengan 0,63 dan
menjumlahkan hasilnya dengan nilai yang lebih kecil.
Hasilnya akan menjadi persentil ke-23.
Dengan paket perangkat lunak statistik, mudah untuk mengurutkan data dari yang terkecil ke yang
terbesar dan menemukan persentil dan desil. Baik Minitab dan Excel menyediakan statistik ringkasan. Di
bawah ini adalah output dari sistem Minitab untuk data komisi Smith Barney. Termasuk adalah kuartil pertama
dan ketiga, rata-rata, median, dan standar deviasi. Kami menyimpulkan bahwa 25 persen komisi yang
diperoleh kurang dari $1.721 dan 75 persen kurang dari $2.205. Nilai yang sama dilaporkan dalam Contoh di
halaman sebelumnya.

Excel dan MegaStat, yang didasarkan pada Excel, juga akan menghitung kuartil dan menampilkan
hasilnya. Namun, metode penyelesaian yang digunakan sedikit berbeda.
Untuk menyederhanakan masalah, asumsikan kumpulan data berisi nilai dalam jumlah ganjil.
Metode yang dijelaskan dalam Contoh, dan didukung oleh Minitab, untuk kuartil pertama adalah:

1. Tentukan median dari himpunan n pengamatan.


2. Fokuskan hanya pada pengamatan di bawah median dan temukan median dari nilai-nilai tersebut. Artinya,
jangan menganggap median sebagai bagian dari kumpulan data baru.
3. Laporkan nilai ini sebagai kuartil pertama.

Jadi dalam data komisi Smith Barney kami, komisi median adalah pengamatan ke-8 dalam rangkaian
15 pengamatan. Komisi ini adalah $2.038, jadi kami fokus pada tujuh pengamatan kurang dari $2.038. Median
dari tujuh pengamatan ini terletak di posisi 4 dan nilainya adalah $1.721, nilai yang ditemukan di Contoh
kami dan di keluaran Minitab.

Di bawah ini adalah spreadsheet Excel. Juga ditampilkan adalah kuartil pertama dan ketiga untuk data
komisi Smith Barney. Perhatikan hasilnya berbeda. Sekali lagi, untuk menyederhanakan situasinya, asumsikan
ada jumlah nilai ganjil. Excel menemukan median menurut metode berikut:

1. Tentukan median dari himpunan n pengamatan.


2. Fokus pada semua observasi yang sama atau kurang dari median. Artinya, sertakan median dalam subset
data yang baru.
3. Temukan median dari kumpulan nilai ini.
4. Laporkan nilai ini sebagai kuartil pertama.
Machine Translated by Google

114 Bab 4

Dalam data komisi Smith Barney kami, median dari 15 observasi awal adalah $2.038. Jadi rangkaian
nilai baru kita adalah delapan pengamatan terurut antara $1.460 dan $2.038. Median adalah setengah
antara $1.721 dan $1.758, atau $1.739 seperti yang dilaporkan oleh Excel.

Jadi perbedaan mendasar antara kedua metode ini adalah:

• Dalam metode Minitab, median tidak termasuk dalam subset data. • Dalam metode Excel,
median disertakan dalam subset data.

Dalam contoh ini, ada jumlah pengamatan yang ganjil. Apa yang terjadi dalam metode Excel jika
jumlah pengamatannya genap? Alih-alih menggunakan rumus 4–1 untuk mencari lokasi, rumus ini
menggunakan 0,25n 0,75 untuk mencari posisi kuartil pertama dan 0,75n 0,25 untuk mencari posisi kuartil
ketiga.
Apakah perbedaan ini penting? Tidak, biasanya itu hanya gangguan. Ahli statistik biasanya lebih
menyukai metode pertama yang dibahas. Ketika sampelnya besar, perbedaan hasil dari kedua metode
itu kecil. Misalnya, ingat data Applewood Auto Group yang melaporkan data laba atas penjualan 180
kendaraan. Di bawah ini adalah hasil Minitab dan Excel. Tidak banyak perbedaan, hanya $7.00 untuk 180
kendaraan! Melaporkan salah satu nilai akan membuat sedikit perbedaan dalam interpretasi.
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 115

Tinjauan Mandiri 4–2 Departemen Kontrol Kualitas di Plainsville Peanut Company bertanggung jawab untuk memeriksa
berat stoples selai kacang 8 ons. Bobot sampel sembilan toples yang diproduksi satu jam terakhir adalah:

7.69 7.72 7.8 7.86 7.90 7.94 7.97 8.06 8.09

(a) Berapa berat mediannya? (b)


Tentukan bobot yang sesuai dengan kuartil pertama dan ketiga.

Latihan
11. Tentukan median dan nilai yang sesuai dengan kuartil pertama dan ketiga di
data berikut.

46 47 49 49 51 53 54 54 55 55 59

12. Tentukan median dan nilai yang sesuai dengan kuartil pertama dan ketiga di
data berikut.

5,24 6.02 6.67 7,30 7,99 7.59


8,35 9,45 10,37 10,39
8.0311,86 12,22 12,71
8.81
13,07
9,61 13,59 13,89 15,42

13. Thomas Supply Company Inc. adalah distributor generator bertenaga gas. Seperti halnya bisnis apa pun,
lamanya waktu yang dibutuhkan pelanggan untuk membayar tagihan mereka adalah penting. Tercantum di
bawah ini, disusun dari yang terkecil hingga terbesar, adalah waktu, dalam hari, untuk contoh faktur The
Thomas Supply Company Inc.

13 13 13 20 26 27 31 34 34 34 35 35 36 37 38
41 41 41 45 47 47 47 50 51 53 54 56 62 67 82

A. Tentukan kuartil pertama dan ketiga. B.


Tentukan desil kedua dan desil kedelapan. C. Tentukan persentil
ke-67.
Machine Translated by Google

116 Bab 4

14. Kevin Horn adalah manajer penjualan nasional untuk National Textbooks Inc. Dia memiliki 40 staf
penjualan yang mengunjungi profesor perguruan tinggi di seluruh Amerika Serikat. Setiap Sabtu pagi
dia meminta staf penjualannya untuk mengirimkan laporan kepadanya. Laporan ini antara lain memuat
jumlah profesor yang dikunjungi selama seminggu sebelumnya. Tercantum di bawah ini, diurutkan dari
yang terkecil hingga terbesar, adalah jumlah kunjungan minggu lalu.

38 40 41 45 48 48 50 50 51 51 52 52 53 54 55 55 55 56 56 57 59 59 59 62 62 62 63 64 65 66 66
67 67 69 69 71 77 78 79 79

A. Tentukan jumlah rata-rata panggilan. B.


Tentukan kuartil pertama dan ketiga. C.
Tentukan desil pertama dan desil kesembilan. D. Tentukan
persentil ke-33.

Plot Kotak
LO4 Membangun dan Plot kotak adalah tampilan grafis, berdasarkan kuartil, yang membantu kita membayangkan
menganalisis plot kotak. sekumpulan data. Untuk membuat plot kotak, kita hanya memerlukan lima statistik: nilai
minimum, Q1 (kuartil pertama), median, Q3 (kuartil ketiga), dan nilai maksimum. Sebuah
contoh akan membantu menjelaskan.

Contoh Alexander's Pizza menawarkan pengiriman pizza gratis dalam jarak 15 mil. Alex, pemilik,
ingin beberapa informasi tentang waktu yang dibutuhkan untuk pengiriman. Berapa lama
biasanya pengiriman berlangsung? Dalam rentang waktu berapa banyak pengiriman akan
selesai? Untuk sampel 20 pengiriman, ia menentukan informasi berikut:
Nilai minimal 13 menit

K1 15 menit
Rata-rata 18 menit

Q3 22 menit
Nilai maksimum 30 menit

Kembangkan plot kotak untuk waktu pengiriman. Kesimpulan apa yang dapat Anda buat
tentang waktu pengiriman?

Larutan Langkah pertama dalam menggambar plot kotak adalah membuat skala yang sesuai di
sepanjang sumbu horizontal. Selanjutnya, kami menggambar kotak yang dimulai pada Q1
(15 menit) dan berakhir pada Q3 (22 menit). Di dalam kotak kami menempatkan garis
vertikal untuk mewakili median (18 menit). Terakhir, kami memperluas garis horizontal dari
kotak ke nilai minimum (13 menit) dan nilai maksimum (30 menit). Garis horizontal di luar
kotak ini terkadang disebut "kumis" karena terlihat seperti kumis kucing.

Nilai median Nilai


minimal Q1 Q3 maksimum

12 14 16 18 20 22 24 26 28 30 32
Menit
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 117

Plot kotak menunjukkan bahwa 50 persen tengah pengiriman memakan waktu


antara 15 menit dan 22 menit. Jarak antara ujung kotak, 7 menit, adalah jangkauan
interkuartil. Jangkauan interkuartil adalah jarak antara kuartil pertama dan kuartil
ketiga. Ini menunjukkan penyebaran atau penyebaran sebagian besar pengiriman.

Plot kotak juga mengungkapkan bahwa distribusi waktu pengiriman condong positif.
Ingat dari halaman 70 di Bab 3 bahwa kita mendefinisikan skewness sebagai kurangnya
percobaan simetris dalam satu set data. Bagaimana kita tahu distribusi ini condong
positif? Dalam hal ini, sebenarnya ada dua informasi yang menyarankan hal ini.
Pertama, garis putus-putus di sebelah kanan kotak dari 22 menit (Q3) ke waktu
maksimum 30 menit lebih panjang dari garis putus-putus dari kiri 15 menit (Q1) ke nilai
minimum 13 menit. Dengan kata lain, 25 persen data yang lebih besar dari kuartil ketiga
lebih tersebar daripada 25 persen lebih kecil dari kuartil pertama. Indikasi kedua dari
kecondongan positif adalah median tidak berada di tengah kotak.
Jarak kuartil pertama ke median lebih kecil daripada jarak median ke kuartil ketiga.
Diketahui bahwa jumlah waktu pengiriman antara 15 menit dan 18 menit sama dengan
jumlah waktu pengiriman antara 18 menit dan 22 menit.

Contoh Lihat data Applewood Auto Group. Kembangkan plot kotak untuk usia variabel
dari pembeli. Apa yang dapat kita simpulkan tentang distribusi usia pembeli?

Larutan Sistem perangkat lunak statistik Minitab digunakan untuk mengembangkan bagan dan
ringkasan statistik berikut.

Usia rata-rata pembeli adalah 46 tahun, 25 persen pembeli berusia kurang dari 40
tahun, dan 25 persen berusia lebih dari 52,75 tahun.
Berdasarkan informasi ringkasan dan plot kotak, kami menyimpulkan:
• Lima puluh persen pembeli berusia antara 40 dan 52,75 tahun. • Distribusi umur
simetris. Ada dua alasan untuk kesimpulan ini. Panjang kumis di atas 52,75 tahun
(Q3) kurang lebih sama dengan panjang kumis di bawah 40 tahun (Q1). Selain itu,
luas kotak antara 40 tahun dan median 46 tahun hampir sama dengan luas antara
median dan 52,75.
Machine Translated by Google

118 Bab 4

Ada tiga tanda bintang (*) di atas 70 tahun. Apa yang mereka tunjukkan? Dalam plot
kotak, tanda bintang mengidentifikasi outlier. Outlier adalah nilai yang tidak konsisten
dengan data lainnya. Ini didefinisikan sebagai nilai yang lebih dari 1,5 kali rentang ubin
interquar lebih kecil dari Q1 atau lebih besar dari Q3. Dalam contoh ini, outlier akan menjadi
nilai yang lebih besar dari 71,875 tahun, ditemukan oleh:

Outlier 7 Q3 1.5(Q3 Q1) 52.75 1.5(52.75 40) 71.875


Outlier juga akan menjadi nilai kurang dari 20,875 tahun.
Outlier 6 Q1 1.5(Q3 Q1) 40 1.5(52.75 40) 20.875
Dari plot kotak, kami menyimpulkan bahwa ada tiga pembeli berusia 72 tahun atau
lebih dan tidak kurang dari 21 tahun. Catatan teknis: Dalam beberapa kasus, satu tanda
bintang dapat mewakili lebih dari satu pengamatan, karena keterbatasan perangkat
lunak dan ruang yang tersedia. Ini adalah ide yang baik untuk memeriksa data yang
sebenarnya. Dalam hal ini, ada tiga pembeli berusia 72 tahun atau lebih; dua 72 dan
satu 73.

Tinjauan Diri 4–3 Plot kotak berikut menunjukkan aset dalam jutaan dolar untuk serikat kredit di Seattle,
Washington.

0 10 20 30 40 50 60 70 80 90 100

Apa nilai terkecil dan terbesar, kuartil pertama dan ketiga, dan median?
Apakah Anda setuju bahwa distribusinya simetris? Apakah ada outlier?

Latihan
15. Plot kotak di bawah menunjukkan jumlah pengeluaran untuk buku dan perlengkapan per tahun oleh
mahasiswa di perguruan tinggi negeri empat tahun.

$1.750

1.400

1.050

700

350

A. Perkirakan jumlah median yang dihabiskan.


B. Perkirakan kuartil pertama dan ketiga untuk jumlah yang dibelanjakan.
C. Perkirakan rentang interkuartil untuk jumlah yang dibelanjakan. D.
Di luar titik mana suatu nilai dianggap sebagai outlier?
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 119

e. Identifikasi setiap outlier dan perkirakan nilainya. F. Apakah


distribusinya simetris atau condong positif atau negatif?
16. Plot kotak menunjukkan biaya sarjana di negara bagian per jam kredit pada publik empat tahun
perguruan tinggi.

$1.500 *

1.200

900

600

300

A. Perkirakan mediannya. B.
Perkirakan kuartil pertama dan ketiga. C. Tentukan
jangkauan interkuartil. D. Di luar titik mana suatu
nilai dianggap sebagai outlier? e. Identifikasi setiap outlier dan perkirakan
nilainya. F. Apakah distribusinya simetris atau condong positif
atau negatif?
17. Dalam sebuah studi tentang jarak tempuh bensin mobil model tahun 2011, rata-rata mil per galon adalah 27,5 dan
mediannya adalah 26,8. Nilai terkecil dalam penelitian ini adalah 12,70 mil per galon, dan terbesar adalah 50,20. Kuartil
pertama dan ketiga masing-masing adalah 17,95 dan 35,45 mil per galon. Kembangkan plot kotak dan komentari
distribusinya. Apakah itu distribusi simetris?

18. Sampel 28 time share di area Orlando, Florida, mengungkapkan biaya harian berikut untuk suite satu kamar tidur. Untuk
kenyamanan, data diurutkan dari yang terkecil hingga yang terbesar. Buat plot kotak untuk mewakili data. Mengomentari
distribusi. Pastikan untuk mengidentifikasi kuartil pertama dan ketiga serta mediannya.

$116 $121 $157 $192 $207 $209 $209


229 232 236 236 239 243 246
260 264 276 281 283 289 296
307 309 312 317 324 341 353

4.5 Kemiringan
Dalam Bab 3, kami menjelaskan ukuran lokasi pusat untuk serangkaian pengamatan
dengan melaporkan rata-rata, median, dan modus. Kami juga menjelaskan ukuran yang
menunjukkan jumlah penyebaran atau variasi dalam sekumpulan data, seperti rentang dan
standar deviasi.
Ciri lain dari sekumpulan data adalah bentuknya. Ada empat bentuk yang biasa
diamati: simetris, miring positif, miring negatif, dan bimodal. Dalam kumpulan pengamatan
simetris , rata-rata dan median adalah sama dan nilai data tersebar merata di sekitar nilai
ini. Nilai data di bawah rata-rata dan median adalah bayangan cermin dari yang di atas.
LO5 Hitung dan Serangkaian nilai miring ke kanan atau miring positif jika ada satu puncak dan nilainya
jelaskan koefisien meluas lebih jauh ke kanan puncak daripada ke kiri puncak. Dalam hal ini, rata-rata lebih
kemiringan. besar dari median. Dalam distribusi miring negatif terdapat satu puncak tetapi pengamatan
meluas lebih jauh ke kiri, ke arah negatif, daripada ke kanan. Dalam distribusi miring
negatif, rata-rata lebih kecil dari median. Miring secara positif
Machine Translated by Google

120 Bab 4

distribusi lebih umum. Gaji sering mengikuti pola ini. Pikirkan gaji mereka yang bekerja di sebuah
perusahaan kecil sekitar 100 orang. Presiden dan beberapa eksekutif puncak akan memiliki gaji yang
sangat besar dibandingkan dengan pekerja lainnya dan karenanya distribusi gaji akan menunjukkan
Kemiringan menunjukkan kecondongan yang positif. Distribusi bimodal akan memiliki dua atau lebih puncak. Ini sering terjadi
kurangnya simetri dalam satu ketika nilai berasal dari dua atau lebih populasi. Informasi ini dirangkum dalam Bagan 4–1.
set pengamatan.

Simetris Miring Positif Miring Secara Negatif Bimodal

Usia Gaji Bulanan Nilai ujian Diameter luar

Frekuensi Frekuensi Frekuensi Frekuensi

45 Bertahun-tahun $3.000 $4.000 $ 75 80 Skor 0,98 1,04 Inci


X
Berarti Berarti Berarti
median median

Statistik dalam Tindakan BAGAN 4–1 Bentuk Poligon Frekuensi


Almarhum Stephen
Jay Gould (1941– Ada beberapa rumus dalam literatur statistik yang digunakan untuk menghitung skewness.
2002) adalah Yang paling sederhana, dikembangkan oleh Profesor Karl Pearson (1857–1936), didasarkan pada
seorang profesor perbedaan antara mean dan median.
zoologi dan profesor
geologi di Universitas
Harvard. Pada
3(X Median)
KOEFISIEN
tahun 1982, ia didiagnosis menderita PEARSON
kanker dan menderita DARI SKEWNESS sk [4–2]
S
harapan hidup selama
delapan bulan.
Namun, jangan pernah
putus asa, Dengan menggunakan hubungan ini, koefisien skewness dapat berkisar dari 3 sampai 3. Nilai
mendekati
penelitiannya menunjukkan hal itu 3, seperti 2,57, menunjukkan skewness negatif yang cukup besar. Nilai seperti 1,63
distribusi dari menunjukkan kemiringan positif sedang. Nilai 0, yang akan terjadi ketika rata-rata dan median sama,
waktu bertahan hidup adalah dra menunjukkan distribusinya simetris dan tidak ada skewness.
secara otomatis
miring ke kanan dan Dalam teks ini, kami menampilkan keluaran dari paket perangkat lunak statistik Minitab dan
menunjukkan Excel. Kedua paket perangkat lunak ini menghitung nilai koefisien kemiringan yang didasarkan pada
deviasi pangkat tiga dari rata-rata. Rumusnya adalah:
bahwa tidak hanya 50
persen pasien
kanker serupa bertahan lebih dari
8 bulan, tapi itu
3
waktu bertahan hidup N
KOEFISIEN PERANGKAT LUNAK SKEWN sk [4–3]
bisa jadi bertahun-tahun, (N 1)(n 2) c aa XX s b D
bukan berbulan-bulan! Berdasarkan

berdasarkan pengalamannya,

dia menulis esai yang Rumus (4–3) menawarkan wawasan tentang kemiringan. Sisi kanan rumus adalah selisih
dipublikasikan secara luas berjudul, antara setiap nilai dan rata-rata, dibagi dengan standar deviasi. Itu adalah bagian (X X)/s dari rumus.
“Median Bukan
Gagasan ini disebut stan dardizing. Kita akan membahas gagasan standarisasi nilai secara lebih
pesan." rinci di Bab 7 saat kita menjelaskan distribusi probabilitas normal. Pada titik ini, amati bahwa hasilnya
adalah melaporkan perbedaan antara setiap nilai dan rata-rata dalam satuan
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 121

dari standar deviasi. Jika selisih ini positif, nilai tertentu lebih besar dari rata-rata; jika nilainya negatif,
kuantitas standar lebih kecil dari rata-rata. Saat kita menghitung nilai-nilai ini, kita menyimpan informasi
tentang arah perbedaannya. Ingatlah bahwa dalam rumus standar deviasi [lihat rumus (3–11)] kita
mengkuadratkan perbedaan antara setiap nilai dan rata-rata, sehingga hasilnya adalah semua nilai
bukan negatif.

Jika kumpulan nilai data yang dipertimbangkan adalah simetris, ketika kita mengkubiskan nilai
standar dan menjumlahkan semua nilai, hasilnya akan mendekati nol. Jika ada beberapa nilai besar,
jelas terpisah dari yang lain, jumlah selisih pangkat tiga akan menjadi nilai positif yang besar. Beberapa
nilai yang jauh lebih kecil akan menghasilkan jumlah kubus negatif.

Sebuah contoh akan mengilustrasikan gagasan kemiringan.

Contoh Berikut ini adalah laba per saham untuk sampel 15 perusahaan perangkat lunak untuk
tahun 2010. Laba per saham disusun dari yang terkecil hingga terbesar.

$0,09 $0,13 $0,41 3,50 $0,51 $1,12 $1,20 $1,49 $3,18 16,40
6,36 7,83 8,92 10.13 12.99

Hitung rata-rata, median, dan standar deviasi. Temukan koefisien kemiringan menggunakan perkiraan
Pearson dan metode perangkat lunak. Apa kesimpulan Anda tentang bentuk distribusi?

Larutan Ini adalah data sampel, jadi kami menggunakan rumus (3–2) untuk menentukan rata-rata

©X $74,26
X $4,95
N 15

Median adalah nilai tengah dari suatu kumpulan data yang disusun dari yang terkecil sampai yang terbesar.
Dalam kasus ini, nilai tengahnya adalah $3,18, jadi pendapatan rata-rata per saham adalah $3,18.
Kami menggunakan rumus (3–11) pada halaman 84 untuk menentukan simpangan baku sampel.

2
. ($16,40 $4,95)2
$5,22
s C ©(X X) ($0.09
n 1 C $4.95)2 . . 15 1

Koefisien kemiringan Pearson adalah 1,017, ditemukan oleh

3(X Median) 3($4,95 $3,18) $5,22


sk 1.017
S

Hal ini mengindikasikan adanya skewness positif yang moderat pada data laba per saham.
Kami memperoleh nilai yang serupa, tetapi tidak persis sama, dari metode perangkat lunak.
Rincian perhitungan ditunjukkan pada Tabel 4–2. Untuk memulai, kami menemukan perbedaan
antara setiap nilai laba per saham dan rata-rata dan membagi hasil ini dengan standar deviasi. Ingatlah
bahwa kami menyebut ini sebagai standardisasi. Selanjutnya, kita kubus, yaitu, naikkan ke pangkat
ketiga, hasil dari langkah pertama. Akhirnya, kami menjumlahkan nilai pangkat tiga. Rincian untuk
perusahaan pertama, yaitu perusahaan dengan pendapatan per saham $0,09, adalah:

(0,9310)3 0,8070
a XX3sab0,09 4,95 5,22 b 3
Machine Translated by Google

122 Bab 4

TABEL 4–2 Perhitungan Koefisien Kemiringan

3
(XX)
Laba per Saham
S a XX sb
0,09 0,9310 0,8070
0,13 0,9234 0,7873
0,41 0,8697 0,6579
0,51 0,8506 0,6154
1.12 0,7337 0,3950
1.20 0,7184 0,3708
1.49 0,6628 0,2912
3.18 0,3391 0,0390
3.50 0,2778 0,0214
6.36 0,2701 0,0197
7.83 0,5517 0,1679
8.92 0,7605 0,4399
10.13 0,9923 0,9772
12.99 1.5402 3.6539
16.40 2.1935 10.5537
11.8274

Saat kita menjumlahkan 15 nilai pangkat tiga, hasilnya adalah 11,8274. Yaitu, istilah 11,8274.
[(X X)/s] 3 Untuk mencari koefisien skewness, kami menggunakan rumus (4–3),
dengan n 15.

N 3 15
sk (11,8274) 0,975
(N 1)(n 2) aa XX s b (15 1)(15 2)

Kami menyimpulkan bahwa nilai laba per saham agak condong positif.
Bagan berikut, dari Minitab, melaporkan ukuran deskriptif, seperti rata-rata, median, dan
deviasi standar dari data laba per saham. Juga termasuk koefisien kemiringan dan histogram
dengan kurva berbentuk lonceng yang ditumpangkan.
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 123

Tinjauan Diri 4–4 Sampel dari lima pegawai entri data yang dipekerjakan di Kantor Pajak Kabupaten Horry
merevisi jumlah catatan pajak berikut jam terakhir: 73, 98, 60, 92,
dan 84. (a) Temukan rata-rata, median, dan standar
deviasi. (b) Hitunglah koefisien skewness dengan menggunakan
metode Pearson. (c) Hitung koefisien kemiringan menggunakan
metode perangkat lunak. (d) Apa kesimpulan Anda tentang kecondongan data?

Latihan
Untuk Latihan 19–22:

A. Tentukan rata-rata, median, dan standar deviasi. B. Tentukan koefisien kemiringan


menggunakan metode Pearson. C. Tentukan koefisien kemiringan menggunakan metode
perangkat lunak.

19. Nilai berikut adalah gaji awal, dalam $000, untuk sampel lima lulusan akuntansi yang menerima posisi di akuntan publik
tahun lalu.

36.0 26.0 33.0 28.0 31.0

20. Daftar di bawah ini adalah gaji, dalam $000, untuk sampel 15 kepala keuangan di industri elektronik.

$516.0 $548.0 $566.0 $534,0 $586.0 $529,0


546.0 523.0 538.0 523,0 551.0 552,0
486.0 558.0 574.0

21. Daftar di bawah ini adalah komisi yang diperoleh ($000) tahun lalu oleh perwakilan penjualan
di Furniture Patch Inc.

$3,9 $5,7 $7,3 17,6 $10,6 $13,0 $13,6 $15,1 $15,8 $17,1
17,4 22,3 38,6 43,2 87,7

22. Di bawah ini tercantum gaji dalam $000 dari 25 pemain pada daftar hari pembukaan tim Bisbol Liga Utama New York
Yankees 2010.

Pemain Gaji ($000) Posisi Pemain Gaji ($000) Posisi

Aceves, Alfredo 435.7 Kendi Pena, Ramiro 412.1 Infielder


Burnett, AJ 16.500,0 Kendi Pettitte, Andy 11.750,0 Kendi
Cano, Robinson 9.000,0 Baseman Kedua Posada, Jorge 13.100,0 Penangkap

Cervelli, Francisco 410,8 Penangkap Rivera, Mariano 15.000,0 Kendi


Chamberlain, Joba 488.0 Kendi Robertson, David 426,7 Kendi
Gardner, Brett 452.5 Pemain luar Rodriguez, Alex 33.000,0 Baseman Ketiga
Granderson, Curtis 5.500,0 Pemain luar Sabathia, CC 24.285,7 Kendi
Hughes, Phil 447,0 Kendi Swisher, Nick 6.850,0 Pemain luar

Jeter, Derek 22.600,0 Perhentian singkat Teixeira, Mark 20.625,0 Baseman Pertama

Johnson, Nick 5.500,0 Baseman Pertama Thames, Marcus 900,0 Pemain luar

Marte, Damaso 4.000,0 Kendi Vazquez, Javier 11.500,0 Kendi


Mitre, Sergio 850,0 Kendi Win, Randy 1.100,0 Pemain luar

Park, Chan Ho 1.200,0 Kendi


Machine Translated by Google

124 Bab 4

4.6 Mendeskripsikan
Hubungan Dua Variabel
Dalam Bab 2 dan bagian pertama bab ini kami menyajikan
teknik grafis untuk meringkas distribusi variabel tunggal. Kami
menggunakan togramnya di Bab 2 untuk meringkas
keuntungan kendaraan yang dijual oleh Applewood Auto
Group. Di awal bab ini, kami menggunakan plot titik dan
tampilan batang-dan-daun untuk meringkas sekumpulan data
secara visual. Karena kami mempelajari satu variabel, kami
menyebutnya sebagai data univariat .

Ada situasi di mana kita ingin mempelajari dan secara


visual menggambarkan hubungan antara dua variabel. Ketika
kita mempelajari hubungan antara dua variabel, kita menyebut
data sebagai bivariat. Analis data sering ingin memahami
hubungan antara dua variabel. Berikut beberapa contohnya:

• Tybo and Associates adalah firma hukum yang mengiklankan secara ekstensif di TV lokal.
Mitra sedang mempertimbangkan untuk meningkatkan anggaran iklan mereka. Sebelum
melakukannya, mereka ingin mengetahui hubungan antara jumlah yang dibelanjakan per
bulan untuk iklan dan jumlah total tagihan untuk bulan tersebut. Dengan kata lain, apakah
meningkatkan jumlah yang dihabiskan untuk iklan akan menghasilkan peningkatan tagihan?
• Coastal Realty sedang mempelajari harga jual rumah. Variabel apa yang tampaknya terkait
dengan harga jual rumah? Misalnya, apakah rumah yang lebih besar dijual lebih mahal
daripada yang lebih kecil? Mungkin. Jadi Coastal mungkin mempelajari hubungan antara
luas dalam kaki persegi dan harga jual.
• Dr Stephen Givens adalah seorang ahli dalam pembangunan manusia. Dia sedang
mempelajari hubungan antara tinggi ayah dan tinggi anak laki-laki mereka. Artinya, apakah
ayah yang tinggi cenderung memiliki anak yang tinggi? Apakah Anda berharap Shaquille
O'Neal, pemain bola basket profesional seberat 71, 335 pon, memiliki putra yang relatif tinggi?

Salah satu teknik grafis yang kami gunakan untuk menunjukkan hubungan antar variabel disebut
diagram pencar.
LO6 Membuat dan Untuk menggambar diagram pencar kita membutuhkan dua variabel. Kami menskalakan satu
menginterpretasikan variabel di sepanjang sumbu horizontal (sumbu X) grafik dan variabel lainnya di sepanjang sumbu
diagram pencar. vertikal (sumbu Y). Biasanya satu variabel bergantung pada tingkat tertentu pada variabel lainnya.
Pada contoh ketiga di atas, tinggi badan anak laki-laki bergantung pada tinggi badan ayahnya.
Jadi kami menskalakan tinggi ayah pada sumbu horizontal dan anak laki-laki pada sumbu vertikal.
Kita dapat menggunakan software statistik, seperti Excel, untuk melakukan fungsi plotting
untuk kita. Perhatian: Anda harus selalu berhati-hati dengan timbangan. Dengan mengubah skala
sumbu vertikal atau horizontal, Anda dapat memengaruhi kekuatan visual yang tampak dari
hubungan tersebut.
Diagram pencar digunakan Berikut adalah tiga diagram pencar (Bagan 4–2). Yang di sebelah kiri menunjukkan hubungan
sebagai cara untuk positif yang cukup kuat antara usia dalam tahun dan biaya perawatan tahun lalu untuk sampel 10
memahami hubungan bus milik kota Cleveland, Ohio. Perhatikan bahwa seiring bertambahnya usia bus, biaya perawatan
antara dua variabel. tahunan juga meningkat.
Contoh di tengah, untuk sampel 20 kendaraan, menunjukkan hubungan tidak langsung yang
cukup kuat antara pembacaan odometer dan harga lelang. Artinya, saat jumlah jarak tempuh
meningkat, harga lelang menurun. Contoh di sebelah kanan menggambarkan hubungan antara
tinggi badan dan gaji tahunan untuk sampel 15 pengawas shift. Grafik ini menunjukkan ada sedikit
hubungan antara tinggi badan dan gaji tahunan.
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 125

Usia Bus dan


Biaya perawatan Harga Lelang versus Odometer Tinggi versus Gaji
$10.000 125
$5.600 120
8.000 115
Biaya 5.200
(tahunan) 6.000 110
4.800 105
4.000
lelang
Harga ($000)
Gaji

4.400 100
95
2.000 4.000 90
0
0123456 10.000 30.000 50.000 54 55 56 57 58 59 60 61 62 63
Umur (tahun) Odometer Tinggi inchi)

BAGAN 4–2 Tiga Contoh Diagram Sebar.

Contoh Dalam pengantar Bab 2, kami menyajikan data dari Applewood Auto
Kelompok. Kami mengumpulkan informasi mengenai beberapa variabel, termasuk keuntungan
yang diperoleh dari penjualan 180 kendaraan yang terjual bulan lalu. Selain jumlah keuntungan
dari setiap penjualan, salah satu variabel lainnya adalah umur pembeli. Apakah ada hubungan
antara keuntungan yang diperoleh dari penjualan kendaraan dan usia pembeli? Apakah masuk
akal untuk menyimpulkan bahwa lebih banyak keuntungan diperoleh dari kendaraan yang dibeli
oleh pembeli yang lebih tua?

Solusi Kita dapat menyelidiki hubungan antara laba kendaraan dan usia pembeli dengan diagram pencar. Kami
menskalakan usia pada sumbu horizontal atau sumbu X, dan laba pada sumbu vertikal atau
sumbu Y. Kami menggunakan Microsoft Excel untuk mengembangkan diagram pencar. Perintah
Excel yang diperlukan untuk keluaran ditampilkan di bagian Perintah Perangkat Lunak di
akhir bab ini.

Diagram pencar menunjukkan hubungan positif yang agak lemah antara kedua variabel.
Tampaknya tidak ada banyak hubungan antara keuntungan kendaraan dan usia pembeli. Pada
Bab 13, kita akan mempelajari hubungan antar variabel secara lebih luas, bahkan menghitung
beberapa ukuran numerik untuk menyatakan hubungan antar variabel.
Machine Translated by Google

126 Bab 4

Dalam contoh sebelumnya, ada hubungan positif yang lemah, atau langsung, antara
variabel. Namun, ada banyak contoh di mana ada hubungan antara variabel, tetapi hubungan
itu terbalik atau negatif. Misalnya:
• Nilai kendaraan dan jumlah mil yang ditempuh. Sebagai jumlah mil
meningkat, nilai kendaraan menurun.
• Premi untuk asuransi mobil dan usia pengemudi. Tarif otomatis cenderung menjadi yang
tertinggi untuk orang dewasa muda dan lebih sedikit untuk orang
tua. • Bagi banyak petugas penegak hukum, karena jumlah tahun bekerja meningkat, jumlah
kutipan lalu lintas menurun. Ini mungkin karena personel menjadi lebih bebas dalam
interpretasi mereka atau mereka mungkin berada dalam posisi supervisor dan tidak dalam
posisi mengeluarkan banyak kutipan. Namun bagaimanapun juga, seiring bertambahnya
usia, jumlah kutipan semakin berkurang.

Diagram pencar mensyaratkan bahwa kedua variabel setidaknya berskala interval.


Dalam contoh Applewood Auto Group, umur dan laba kendaraan merupakan variabel skala
rasio. Tinggi badan juga merupakan skala rasio seperti yang digunakan dalam pembahasan
hubungan antara tinggi badan ayah dan tinggi badan anak laki-lakinya. Bagaimana jika kita
ingin mempelajari hubungan antara dua variabel ketika salah satu atau keduanya berskala
nominal atau ordinal? Dalam hal ini, kami menghitung hasilnya dalam tabel kemungkinan.

LO7 Kembangkan TABEL KONTINJENSI Tabel yang digunakan untuk mengklasifikasikan pengamatan menurut dua
dan jelaskan tabel karakteristik yang dapat diidentifikasi.
kontingensi.

Tabel kontingensi adalah tabulasi silang yang secara bersamaan meringkas dua
variabel minat. Misalnya:

• Mahasiswa di universitas diklasifikasikan menurut jenis kelamin dan peringkat kelas. •


Suatu produk diklasifikasikan sebagai dapat diterima atau tidak dapat diterima dan berdasarkan shift (hari,
sore, atau malam hari) di mana ia diproduksi. • Pemilih
dalam referendum obligasi sekolah diklasifikasikan berdasarkan afiliasi partai (Demokrat,
Republik, lainnya) dan jumlah anak yang bersekolah di distrik tersebut (0, 1, 2, dll.).

Contoh Ada empat dealer di Applewood Auto Group. Misalkan kita ingin com
pare keuntungan yang diperoleh pada setiap kendaraan yang dijual oleh dealer tertentu. Dengan
kata lain, apakah ada hubungan antara jumlah keuntungan yang diperoleh dan dealer?

Larutan Tingkat pengukuran untuk variabel dealership adalah nominal dan rasio untuk variabel profit.
Untuk menggunakan tabel kontingensi secara efektif, kedua variabel harus berskala nominal
atau ordinal. Untuk membuat variabel kompatibel, kami mengklasifikasikan keuntungan variabel
menjadi dua kategori, kasus-kasus di mana keuntungan yang diperoleh lebih dari median dan
kasus-kasus di mana lebih sedikit. Pada halaman 69 kami menghitung laba rata-rata untuk
semua penjualan bulan lalu di Applewood Auto Group menjadi $1.882,50.

Tabel Kontinjensi Menunjukkan Hubungan antara Profit dan Dealership


Atas bawah
Laba Median kane Olean Sheffield Tionesta Total

Di atas 25 20 19 26 90
Di bawah 27 20 26 17 90

Total 52 40 45 43 180
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 127

Dengan mengatur informasi ke dalam tabel kontingensi, kita dapat membandingkannya


keuntungan di empat dealer. Kami mengamati hal-hal berikut:

• Dari kolom Total di sebelah kanan, 90 dari 180 mobil yang terjual memiliki keuntungan
di atas median dan setengahnya di bawah. Dari definisi median, ini diharapkan. • Untuk
dealer Kane 25 dari 52, atau 48 persen, dari mobil yang terjual terjual dengan keuntungan
lebih dari rata-rata. • Persentase keuntungan
di atas rata-rata dealer lainnya adalah 50 persen untuk Olean, 42 persen untuk Sheffield,
dan 60 persen untuk Tionesta.

Kami akan kembali ke studi tabel kontingensi di Bab 5 selama studi probabilitas dan di
Bab 17 selama studi metode analisis nonparametrik.

Tinjauan Diri 4–5 Grup rock Blue String Beans sedang melakukan tur di Amerika Serikat. Bagan berikut menunjukkan
hubungan antara kapasitas tempat duduk konser dan pendapatan dalam $000 untuk sampel
konser.

Jumlah
($000)
5

2
5800 6300 6800 7300
Kapasitas tempat duduk

(a) Disebut apakah gambar itu?


(b) Berapa banyak konser yang dipelajari?
(c) Perkirakan pendapatan untuk konser dengan kapasitas tempat duduk
terbesar. (d) Bagaimana Anda mencirikan hubungan antara pendapatan dan kapasitas tempat duduk?
Apakah kuat atau lemah, langsung atau terbalik?

Latihan
23. Kembangkan diagram pencar untuk contoh data berikut. Bagaimana Anda menggambarkan
hubungan antar nilai?

X-Nilai Y-Nilai X-Nilai Y-Nilai


10 6 11 6
8 2 10 5
96 72
11 5 7 3
13 7 11 7
Machine Translated by Google

128 Bab 4

24. Silver Springs Moving and Storage Inc. sedang mempelajari hubungan antara jumlah kamar yang dipindahkan dan jumlah jam
tenaga kerja yang diperlukan untuk pemindahan tersebut. Sebagai bagian dari analisis, CFO Silver Springs mengembangkan
diagram pencar berikut.

40

30

Jam 20

10

0
123 4 5
Kamar

A. Berapa banyak gerakan yang ada dalam sampel? B.


Apakah terlihat bahwa lebih banyak jam tenaga kerja yang dibutuhkan saat jumlah kamar bertambah, atau apakah jam tenaga
kerja berkurang saat jumlah kamar bertambah?
25. Direktur Perencanaan Devine Dining Inc. ingin mempelajari hubungan antara jenis kelamin tamu dan apakah tamu tersebut
memesan hidangan penutup. Untuk menyelidiki hubungan tersebut, manajer mengumpulkan informasi berikut tentang 200
pelanggan terakhir.

Jenis kelamin

Makanan Penutup Dipesan Pria Perempuan Total

Ya 32 15 47
TIDAK 68 85 153

Total 100 100 200

A. Berapakah tingkat pengukuran kedua variabel tersebut? B. Disebut apakah tabel


di atas? C. Apakah bukti di tabel menunjukkan
bahwa pria lebih cenderung memesan makanan penutup daripada?
wanita? Jelaskan mengapa.
26. Ski Resorts of Vermont Inc. sedang mempertimbangkan merger dengan Gulf Shores Beach Resorts Inc. of Alabama. Dewan direksi
mensurvei 50 pemegang saham tentang posisi mereka dalam merger. Hasilnya dilaporkan di bawah ini.

Pendapat

Jumlah Saham yang Dimiliki Kebaikan Menolak Bimbang Total

Di bawah 200 8 6 2 16

200 hingga 1.000 6 8 1 15

Lebih dari 1.000 6 12 1 19

Total 20 26 4 50

A. Tingkat pengukuran apa yang digunakan dalam tabel ini? B. Apa nama
tabel ini? C. Kelompok apa yang
tampaknya paling menentang merger?
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 129

Ringkasan Bab
I. Plot titik menunjukkan rentang nilai pada sumbu horizontal dan jumlah pengamatan untuk setiap nilai pada
sumbu vertikal.
A. Plot titik melaporkan rincian setiap pengamatan.
B. Mereka berguna untuk membandingkan dua atau lebih kumpulan data.
II. Tampilan batang dan daun adalah alternatif dari histogram.
A. digit terdepan adalah batang dan digit terakhir adalah daun.
B. Keuntungan tampilan batang dan daun dibandingkan histogram meliputi:
1. Identitas setiap pengamatan tidak hilang.
2. Digit-digit itu sendiri memberikan gambaran distribusi.
3. Frekuensi kumulatif juga ditampilkan.
AKU AKU AKU. Ukuran lokasi juga menggambarkan bentuk dari sekumpulan pengamatan.
A. Kuartil membagi sekumpulan pengamatan menjadi empat bagian yang sama.
1. Dua puluh lima persen pengamatan lebih kecil dari kuartil pertama, 50 persen lebih kecil dari kuartil
kedua, dan 75 persen lebih kecil dari kuartil ketiga.

2. Jangkauan interkuartil adalah selisih antara kuartil ketiga dan kuartil pertama.
B. Desil membagi satu set pengamatan menjadi sepuluh bagian yang sama dan persentil menjadi 100 sama
bagian.
C. Sebuah plot kotak adalah tampilan grafis dari satu set data.
1. Digambar sebuah kotak yang melingkupi daerah antara kuartil pertama dan kuartil ketiga. A. Sebuah
garis ditarik di dalam kotak pada nilai median. B. Segmen garis
putus-putus ditarik dari kuartil ketiga ke nilai terbesar untuk menunjukkan 25 persen nilai tertinggi dan
dari kuartil pertama ke nilai terkecil untuk menunjukkan 25 persen nilai terendah.

2. Plot kotak didasarkan pada lima statistik: nilai maksimum dan minimum, kuartil pertama dan ketiga, dan
median.
IV. Koefisien kemiringan adalah ukuran simetri distribusi.
A. Ada dua rumus untuk koefisien kemiringan.
1. Rumus yang dikembangkan oleh Pearson adalah:

3(X Median)
sk [4–2]
S

2. Koefisien skewness yang dihitung dengan perangkat lunak statistik adalah:

3
N
sk [4–3]
(N 1)(n 2) c aa XX s b D

V. Diagram pencar adalah alat grafis untuk menggambarkan hubungan antara dua variabel.
A. Kedua variabel diukur dengan skala interval atau rasio.
B. Jika sebaran titik bergerak dari kiri bawah ke kanan atas, variabel di bawah
pertimbangan terkait secara langsung atau positif.
C. Jika sebaran titik bergerak dari kiri atas ke kanan bawah, variabelnya adalah
berhubungan terbalik atau negatif.
VI. Tabel kontingensi digunakan untuk mengklasifikasikan observasi skala nominal menjadi dua
karakteristik.

Kunci Pengucapan
SIMBOL ARTI PENGUCAPAN

LP Lokasi persentil L sub hal


Q1 Kuartil pertama Q sub 1
Q3 Kuartil ketiga Q sub 3
Machine Translated by Google

130 Bab 4

Latihan Bab
27. Sampel mahasiswa Universitas Florida Tenggara ditanyai jumlah kegiatan sosial yang mereka ikuti minggu lalu.
Bagan di bawah ini disiapkan dari data sampel.

0 1 2 3 4
Kegiatan

A. Apa nama yang diberikan untuk bagan ini? B.


Berapa banyak siswa yang belajar? C. Berapa
banyak siswa yang dilaporkan tidak menghadiri kegiatan sosial?
28. Doctor's Care adalah klinik berjalan kaki, dengan lokasi di Georgetown, Monks Corners, dan Aynor, di mana
pasien dapat menerima pengobatan untuk luka ringan, pilek, dan flu, serta pemeriksaan fisik. Bagan berikut
melaporkan jumlah pasien yang dirawat di masing-masing dari tiga lokasi bulan lalu.

Lokasi

Georgetown

Sudut Biksu

Aynor
10 20 30 40 50
Pasien

Jelaskan jumlah pasien yang dilayani di tiga lokasi setiap hari. Berapa jumlah maksimal dan minimal pasien
yang dilayani di masing-masing lokasi?
29. Ukuran layar untuk 23 televisi LCD diberikan di bawah ini. Buat pajangan batang dan daun
variabel ini.

46 52 46 40 42 46 40 37 46 40 52 32 37 32 52
40 32 52 40 52 46 46 52

30. 25 perusahaan teratas (berdasarkan kapitalisasi pasar) yang beroperasi di wilayah Washington, DC, beserta
tahun pendiriannya dan jumlah karyawan diberikan di bawah ini.
Buat tampilan batang-dan-daun dari masing-masing variabel ini dan tulis deskripsi singkat tentang temuan
Anda.

Nama Perusahaan tahun Ditemukan Karyawan


AES Corp. 1981 30000
American Capital Strategies Ltd. 1986 484
Komunitas AvalonBay Inc. 1978 1767
Capital One Financial Corp. 1995 31800
Constellation Energy Group Inc. 1816 9736
Coventry Health Care Inc. 1986 10250
Danaher Corp. 1984 45000
Dominion Resources Inc. 1909 17500
Fannie Mae 1938 6450
Freddie Mac 1970 5533
(lanjut )
Machine Translated by Google

Mendeskripsikan Data : Menampilkan dan Mengeksplorasi Data 131

Nama perusahaan tahun Ditemukan Karyawan

Gannet Co. 1906 49675

General Dynamic Corp. 1952 81000


Genworth Financial Inc. 2004 7200
Harman International Industries Inc. 1980 11246
Host Hotels & Resorts Inc. 1927 229

Legg Mason Inc. 1899 3800

Lockheed Martin Corp. 1995 140000


Marriot Internasional Inc. 1927 151000
MedImmune Inc. 1988 2516

NII Holdings Inc. 1996 7748

Norfolk Southern Corp. 1982 30594

Pepco Holding Inc. 1896 5057


Sallie Mae 1972 11456

Sprint Nextel Corp. 1899 64000

T. Rowe Price Group Inc. 1937 4605

The Washington Post Co. 1877 17100

31. Dalam beberapa tahun terakhir, karena suku bunga rendah, banyak pemilik rumah membiayai kembali hipotek rumah mereka.
Linda Lahey adalah petugas hipotek di Down River Federal Savings and Loan.
Di bawah ini adalah jumlah yang dibiayai kembali untuk 20 pinjaman yang dia proses minggu lalu. Data dilaporkan dalam
ribuan dolar dan disusun dari yang terkecil hingga yang terbesar.

59,2 59,5 61,6 65,5 66,6 72,9 74,8 77,3 79,2


83,7 85,6 85,8 86,6 87,0 87,1 90,2 93,3 98,6
100,2 100,7

A. Temukan median, kuartil pertama, dan kuartil ketiga. B. Temukan


persentil ke-26 dan ke-83. C. Gambarlah plot kotak
dari data tersebut.
32. Sebuah penelitian dilakukan oleh industri rekaman di Amerika Serikat tentang jumlah CD musik yang dimiliki oleh orang lanjut
usia dan dewasa muda. Informasinya dilaporkan di bawah ini.

Senior

28 35 41 48 52 81 97 98 98 99
118 132 133 140 145 147 153 158 162 174
177 180 180 187 188

Dewasa Muda

81 107 113 147 147 175 183 192 202 209


233 251 254 266 283 284 284 316 372 401
417 423 490 500 507 518 550 557 590 594

A. Temukan median dan kuartil pertama dan ketiga untuk jumlah CD yang dimiliki oleh lansia. Kembangkan plot kotak untuk
informasi tersebut. B. Temukan median dan kuartil pertama dan ketiga untuk
jumlah CD yang dimiliki oleh dewasa muda. Kembangkan plot kotak untuk informasi tersebut. C. Bandingkan jumlah CD yang
dimiliki kedua kelompok.

33. Kantor pusat perusahaan Bank.com, sebuah perusahaan Internet baru yang melakukan semua transaksi perbankan melalui
Internet, berlokasi di pusat kota Philadelphia. Direktur sumber daya manusia membuat studi tentang waktu yang dibutuhkan
karyawan untuk mulai bekerja. Kota ini berencana untuk menawarkan insentif kepada setiap pemberi kerja di pusat kota jika
mereka mau mendorong mereka
Machine Translated by Google

132 Bab 4

karyawan untuk menggunakan transportasi umum. Di bawah ini adalah daftar waktu berangkat kerja pagi ini menurut apakah
karyawan tersebut menggunakan kendaraan umum atau mengendarai mobil.

Kendaraan umum

23 25 25 30 31 31 32 33 35 36
37 42

Pribadi

32 32 33 34 37 37 38 38 38 39
40 44

A. Temukan median dan kuartil pertama dan ketiga untuk waktu yang digunakan karyawan
kendaraan umum. Kembangkan plot kotak untuk informasi tersebut.
B. Temukan median dan kuartil pertama dan ketiga untuk waktu yang dibutuhkan karyawan yang mengemudikan kendaraan
mereka sendiri. Kembangkan plot kotak untuk informasi tersebut.
C. Bandingkan waktu kedua kelompok.
34. Plot kotak berikut menunjukkan jumlah surat kabar harian yang diterbitkan di setiap negara bagian dan Distrik Columbia. Tulis
laporan singkat meringkas nomor yang diterbitkan. Pastikan untuk menyertakan informasi tentang nilai kuartil pertama dan
ketiga, median, dan apakah terdapat kemiringan. Jika ada outlier, perkirakan nilainya.

* **

0 20 40 60 80
100

Jumlah Surat Kabar

35. Walter Gogel Company adalah pemasok industri pengencang, perkakas, dan pegas. Jumlah tagihannya sangat bervariasi, dari
kurang dari $20,00 hingga lebih dari $400,00. Selama bulan Januari perusahaan mengirimkan 80 faktur. Berikut adalah plot
kotak dari faktur ini. Tulis laporan singkat yang meringkas jumlah faktur. Pastikan untuk menyertakan informasi tentang nilai
kuartil pertama dan ketiga, median, dan apakah terdapat kemiringan. Jika ada outlier, perkirakan nilai faktur ini.

050 100 150 200 250

Jumlah tagihan

36. American Society of PeriAnesthesia Nurses (ASPAN; www.aspan.org) adalah organisasi nasional yang melayani perawat yang
berpraktik dalam perawatan bedah praanestesi dan postanes thesia rawat jalan. Organisasi ini terdiri dari 40 komponen,
yang tercantum di bawah ini.

Negara Bagian/Wilayah Keanggotaan Negara Bagian/Wilayah Keanggotaan

Alabama 95 Illinois 562


Arizona 399 Indiana 270

Maryland, Delaware, DC 531 Iowa 117


Connecticut 239 Kentucky 197
Florida 631 Louisiana 258

Georgia 384 Michigan 411


Hawaii 73 Massachusetts 480

(lanjut )
Machine Translated by Google

Mendeskripsikan Data : Menampilkan dan Mengeksplorasi Data 133

Negara Bagian/Wilayah Keanggotaan Negara Bagian/Wilayah Keanggotaan

Maine 97 California 1.165


Minnesota, Dakota 289 Meksiko Baru 79

Missouri, Kansas 282 Pennsylvania 575

Mississippi 90 Pulau Rhode 53


Nebraska 115 Colorado 409
Karolina utara 542 Karolina selatan 237
Nevada 106 Texas 1.026
Jersey baru, Bermuda 517 Tennessee 167

Alaska, Idaho, Montana, Utah 67


Oregon, Washington 708 Virginia 414
New York 891 Vermont,
Ohio 708 New Hampshire 144
Oklahoma 171 Wisconsin 311
Arkansas 68 Virginia Barat 62

Gunakan perangkat lunak statistik untuk menjawab pertanyaan berikut. A. Cari mean,
median, dan standar deviasi dari jumlah anggota per
komponen.
B. Temukan koefisien kemiringan, menggunakan perangkat lunak. Apa yang kamu simpulkan tentang
bentuk distribusi ukuran komponen?
C. Tentukan kuartil pertama dan ketiga. Jangan gunakan metode yang dijelaskan oleh Excel. D. Kembangkan plot kotak.
Apakah ada outlier? Komponen mana yang outlier? Apa yang
batas untuk outlier?

37. McGivern Jewellers terletak di Levis Square Mall tepat di sebelah selatan Toledo, Ohio. Baru-baru ini memasang iklan di surat kabar
lokal yang melaporkan bentuk, ukuran, harga, dan tingkat potongan untuk 33 berliannya yang saat ini tersedia. Informasinya
dilaporkan di bawah ini.

Membentuk Ukuran (karat) Harga Potong Nilai Membentuk Ukuran (karat) Harga Potong Nilai

Putri 5,03 $44.312 Potongan ideal Bulat 0,77 $2.828 Potongan yang sangat ideal

Bulat 2,35 20.413 Potongan premium Bulat telur 0,76 3.808 Potongan premium

Bulat 2,03 13.080 Potongan ideal Putri 0,71 2.327 Potongan premium

Bulat 1,56 13.925 Potongan ideal Marquise 0,71 2.732 Potongan bagus

Bulat 1,21 7.382 Potongan yang sangat ideal Bulat 0,70 1.915 Potongan premium

Bulat 1.21 5.154 Potongan rata-rata Bulat 0,66 1.885 Potongan premium

Bulat 1,19 5.339 Potongan premium Bulat 0,62 1.397 Potongan bagus

Zamrud 1,16 5.161 Potongan ideal Bulat 0,52 2.555 Potongan premium

Bulat 1,08 8.775 Potongan yang sangat ideal Putri 0,51 1.337 Potongan ideal

Bulat 1,02 4.282 Potongan premium Bulat 0,51 1.558 Potongan premium

Bulat 1,02 6.943 Potongan ideal Bulat 0,45 1.191 Potongan premium

Marquise 1,01 7.038 Potongan bagus Putri 0,44 1.319 Potongan rata-rata

Putri 1,00 4.868 Potongan premium Marquise 0,44 1.319 Potongan premium

Bulat 0,91 5.106 Potongan premium Bulat 0,40 1.133 Potongan premium

Bulat 0,90 3.921 Potongan bagus Bulat 0,35 1.354 Potongan bagus

Bulat 0,90 3.733 Potongan premium Bulat 0,32 896 Potongan premium

Bulat 0,84 2.621 Potongan premium

A. Kembangkan plot kotak dari harga variabel dan komentari hasilnya. Apakah ada outlier? Berapa harga mediannya? Berapakah
nilai kuartil pertama dan ketiga? B. Kembangkan plot kotak dengan ukuran variabel dan komentari hasilnya. Apakah ada
outlier? Berapa harga mediannya? Berapakah nilai kuartil pertama dan ketiga? C. Kembangkan diagram pencar antara variabel
harga dan ukuran. Pastikan untuk menempatkan harga pada sumbu vertikal dan ukuran pada sumbu horizontal. Apakah
tampaknya ada hubungan antara kedua variabel tersebut? Apakah asosiasi langsung atau tidak langsung? Apakah ada poin yang
terlihat berbeda dari yang lain? D. Kembangkan tabel kontingensi untuk variabel shape dan cut grade. Apa grade potongan
yang paling umum? Apa bentuk yang paling umum? Apa kombinasi yang paling umum dari tingkat potongan dan bentuk?
Machine Translated by Google

134 Bab 4

38. Di bawah ini tercantum jumlah komisi yang diperoleh bulan lalu untuk delapan anggota staf penjualan di Best Electronics.
Hitung koefisien skewness menggunakan kedua metode tersebut. Petunjuk: Penggunaan spreadsheet akan mempercepat
perhitungan.

980,9 1.036,5 1.099,5 1.153,9 1.409,0 1.456,4 1.718,4 1.721,2

39. Di bawah ini adalah jumlah pencurian mobil di kota besar selama seminggu terakhir. Hitung koefisien kemiringan menggunakan
kedua metode. Petunjuk: Penggunaan spreadsheet akan mempercepat perhitungan.

3 12 13 7 8 3 8

40. Manajer Layanan Informasi di Wilkin Investigations, sebuah firma investigasi swasta, sedang mempelajari hubungan antara
usia (dalam bulan) mesin kombinasi printer, fotokopi, dan faks dengan biaya perawatan bulanannya. Untuk sampel 15
mesin, manajer mengembangkan bagan berikut. Apa yang bisa manajer simpulkan tentang hubungan antara variabel?

$130

120

110
Perawatan
Bulanan
Biaya

100

90

80
34 39 44 49
Bulan

41. Sebuah perusahaan asuransi mobil melaporkan informasi berikut mengenai usia seorang pengemudi dan jumlah kecelakaan
yang dilaporkan tahun lalu. Kembangkan diagram pencar untuk data dan tulis ringkasan singkat.

Usia Kecelakaan Usia Kecelakaan

16 4 23 0
24 2 27 1
18 5 32 1
17 4 22 3

42. Wendy's menawarkan delapan bumbu yang berbeda (mustard, saus tomat, bawang, mayones, acar, selada, tomat, dan
nikmat) pada hamburger. Seorang manajer toko mengumpulkan informasi berikut tentang jumlah bumbu yang dipesan
dan kelompok usia pelanggan. Apa yang dapat kamu simpulkan dari informasi tersebut? Siapa yang cenderung memesan
bumbu paling banyak atau paling sedikit?

Usia

Jumlah bumbu Dibawah 18 18 hingga 40 40 hingga 60 60 atau lebih

0 12 18 24 52
1 21 76 50 30
2 39 52 40 12
3 atau lebih 71 87 47 28

43. Tercantum di bagian atas halaman berikutnya adalah tabel yang menunjukkan jumlah pekerja yang bekerja dan menganggur
berusia 20 tahun atau lebih menurut jenis kelamin di Amerika Serikat.
Machine Translated by Google

Menggambarkan Data: Menampilkan dan Menjelajahi Data 135

Jumlah Pekerja (000)


Jenis kelamin Dipekerjakan Penganggur
Pria 70.415 4.209
Wanita 61.402 3.314

A. Berapa banyak pekerja yang dipelajari? B.


Berapa persen pekerja yang menganggur? C. Bandingkan
persentase pengangguran untuk pria dan wanita.

Latihan Kumpulan Data


44. Lihat data Real Estat, yang melaporkan informasi tentang rumah yang dijual di area Goodyear, Arizona, selama
setahun terakhir. Membuat laporan harga jual rumah.
Pastikan untuk menjawab pertanyaan-pertanyaan berikut dalam laporan
Anda. A. Kembangkan plot kotak. Perkirakan kuartil pertama dan ketiga. Apakah ada outlier? B. Kembangkan
diagram pencar dengan harga pada sumbu vertikal dan ukuran rumah pada sumbu horizontal. Apakah tampaknya
ada hubungan antara variabel-variabel ini? Apakah hubungannya langsung atau terbalik?

C. Kembangkan diagram pencar dengan harga pada sumbu vertikal dan jarak dari pusat kota pada sumbu
horizontal. Apakah tampaknya ada hubungan antara variabel-variabel ini? Apakah hubungannya langsung
atau terbalik?
45. Lihat data Baseball 2009, yang melaporkan informasi tentang 30 Pangkalan Liga Utama
tim bola untuk musim 2009. Lihat gaji tim variabel. A. Pilih variabel yang mengacu
pada tahun pembangunan stadion. (Petunjuk: Kurangi tahun pembuatan stadion dari tahun sekarang untuk
menemukan umur stadion dan kerjakan variabel ini.) Kembangkan plot kotak. Apakah ada outlier? Sta dium
mana yang outlier? B. Pilih gaji tim variabel dan gambar plot kotak. Apakah ada outlier? Apa itu kuartil? Tulis
ringkasan singkat dari
analisis Anda. Bagaimana gaji New York Yankees dibandingkan dengan tim lain?

C. Gambarlah diagram pencar dengan jumlah pertandingan yang dimenangkan pada sumbu vertikal dan gaji tim
pada sumbu horizontal. Apa kesimpulan Anda?
D. Pilih variabel menang. Gambarlah plot titik. Apa yang dapat Anda simpulkan dari plot ini?
46. Lihat data bus Buena School District. A. Mengacu pada
variabel biaya pemeliharaan. Kembangkan plot kotak. Apa itu kuartil pertama dan ketiga? Apakah ada outlier? B.
Tentukan biaya pemeliharaan rata-rata.
Berdasarkan median tersebut, buatlah tabel kemungkinan dengan produsen bus sebagai salah satu variabel dan
apakah biaya pemeliharaan di atas atau di bawah median sebagai variabel lainnya. Apa kesimpulan Anda?

Perintah Perangkat Lunak


1. Perintah Minitab untuk plot titik di halaman 104 statistik yang diinginkan untuk ditampilkan, dan terakhir klik
OK dua kali.
adalah : Masukkan jumlah kendaraan yang dilayani di Tionesta
Ford Lincoln Mercury di kolom C1 dan Sheffield Motors di C2.
Beri nama variabel yang sesuai. B. Pilih Grafik dan
Dotplot. Di kotak dialog pertama, pilih Multiple Y's, Simple di
pojok kiri bawah, dan klik OK. Di kotak dialog berikutnya pilih
Tionesta dan Sheffield sebagai variabel Grafik, klik Label
dan tulis judul yang sesuai. Lalu klik Oke.

C. Untuk menghitung statistik deskriptif yang ditampilkan di


output, pilih Stat, Statistik dasar, lalu Tampilkan statistik
Deskriptif. Di kotak dialog, pilih Tionesta dan Sheffield
sebagai Variabel, klik Statistik, pilih
Machine Translated by Google

136 Bab 4

2. Perintah Minitab untuk batang-dan-daun dis B. Pilih Grafik dan kemudian Boxplot. Di kotak dialog, pilih
bermain di halaman 107 Sederhana di sudut kiri atas dan klik OK. Pilih Usia
adalah: a. Impor data untuk Tabel 4–1. sebagai Variabel Grafik, klik Label dan sertakan tajuk
B. Pilih Grafik, dan klik Batang-dan-Leaf. C. Pilih variabel yang sesuai, lalu klik OK.
Spots, masukkan 10 untuk Incre
ment, lalu klik OK.

6. Perintah Minitab untuk ringkasan deskriptif pada halaman 122


adalah: a. Masukkan data
di kolom pertama. Di sel di bawah C1, masukkan variabel
3. Perintah Minitab untuk ringkasan deskriptif pada halaman 113 Penghasilan. B. Pilih Stat, Basic Statistics,
adalah: a. Masukkan data lalu klik Graphical Summary. Pilih Penghasilan sebagai
komisi Smith Barney dari Contoh di halaman 111. b. Dari bilah variabel, lalu klik OK.
alat, pilih Stat, Statistik Dasar, dan
Tampilkan Statistik Deskriptif. Di kotak dialog, pilih Komisi 7. Perintah Excel untuk diagram pencar pada halaman 125 adalah:
sebagai Variabel, lalu klik OK. a. Ambil data
Applewood Auto. B. Dengan menggunakan
mouse, sorot kolom umur dan keuntungan. Sertakan baris
4. Perintah Excel untuk statistik deskriptif pada halaman 114 pertama. C. Pilih tab Sisipkan . Pilih
adalah: a. Sebarkan dari opsi Bagan . Pilih opsi kiri atas. Plot pencar
Masukkan data komisi Smith Barney dari Contoh di halaman akan muncul. D. Dengan Alat Bagan ditampilkan di bagian
111. atas, pilih tab Tata Letak .
B. Di sel C4 tulis Kuartil 1 dan di C6 tulis Quar Pilih Chart Title dan ketikkan judul plot. Selanjutnya, di bawah
ubin 3. tab Layout yang sama , pilih AxisTitles. Menggunakan
C. Di sel D4 , tulis " QUARTILE(A1:A16,1) " dan tekan Enter. Judul Sumbu Vertikal Utama, beri nama sumbu vertikal
Di sel D6, tulis " QUARTILE(A1:A16,1) " dan tekan Enter. Untung. Menggunakan Pri mary Horizontal Axis Title,
beri nama sumbu horizontal Umur. Selanjutnya, pilih
5. Perintah Minitab untuk plot kotak di halaman 117 Legend dan pilih None.
adalah:

A. Impor data Applewood Auto Group.

Bab 4 Jawaban Tinjauan Diri


4–1 1.a. 79, 105b . 15c . A.
Dari 8b . 10.1, 10.2, 10.4, 10.8 c.
88 hingga 97; 75 persen toko berada dalam kisaran ini. 9.5 d.
11.6, 7.7

2. 4–2 a. 7.9
7 7 B. Q 7.76, Q3 8.015 4–3
1
8 0013488
Nilai terkecil adalah 10 dan terbesar 85; kuartil pertama adalah
9 1256689
25 dan kuartil ketiga adalah 60. Sekitar 50 persen
10 1248 nilainya berada di antara 25 dan 60. Nilai mediannya adalah
11 26 40. Distribusinya condong positif. Tidak ada outlier.
Machine Translated by Google

Tinjauan Bab 1–4 137

407 5
4–4 hari. X 81.4, Median 84 sk [1,3154] (4)
5 (3)

0,5481
15.19
51
s A 923.2
D. Distribusi agak condong negatif.
3(81.4 84.0)
B. sk 0,51
15.19 4–5 hari. Diagram pencarb .
16c .
C.
XX 3 $7.500d .
X Kuat dan langsung
S c XX s d
73 0,5530 0,1691
98 1.0928 1.3051
60 1.4088 2.7962
92 0,6978 0,3398
84 0,1712 0,0050
1.3154

Tinjauan Bab 1–4


Bagian ini merupakan ulasan tentang konsep dan istilah utama yang diperkenalkan di Bab 1–4. Bab 1 dimulai dengan
menjelaskan pengertian dan tujuan statistika. Selanjutnya kami menjelaskan berbagai jenis variabel dan empat tingkat
pengukuran. Bab 2 berkaitan dengan menggambarkan satu set pengamatan dengan mengaturnya menjadi distribusi
frekuensi dan kemudian menggambarkan distribusi frekuensi sebagai histogram atau poligon frekuensi. Bab 3 dimulai
dengan menjelaskan ukuran lokasi, seperti rata-rata, rata-rata tertimbang, median, rata-rata geometrik, dan modus. Bab
ini juga mencakup ukuran penyebaran, atau penyebaran. Yang dibahas pada bagian ini adalah range, mean deviasi,
varians, dan standar deviasi. Bab 4 mencakup beberapa teknik grafik seperti plot titik, plot kotak, dan diagram pencar.
Kami juga membahas koefisien skewness, yang melaporkan kurangnya simetri dalam satu set data.

Sepanjang bagian ini kami menekankan pentingnya perangkat lunak statistik, seperti Excel dan Minitab. Banyak
output komputer dalam bab-bab ini menunjukkan seberapa cepat dan efektif kumpulan data besar dapat diatur ke dalam
distribusi frekuensi, beberapa ukuran lokasi atau ukuran atau variasi yang dihitung, dan informasi yang disajikan dalam
bentuk grafik.

Glosarium

Bab 1 90 derajat adalah 10 derajat lebih dari suhu 80 derajat, dan


Statistik deskriptif Teknik yang digunakan untuk menggambarkan seterusnya.
karakteristik penting dari sekumpulan data. Ini termasuk mengatur Pengukuran nominal Tingkat pengukuran “terendah”. Jika data
nilai data ke dalam distribusi frekuensi, menghitung ukuran lokasi, diklasifikasikan ke dalam kategori dan urutan kategori tersebut tidak
dan menghitung ukuran dispersi dan skewness. penting, itu adalah tingkat pengukuran nominal. Contohnya adalah
jenis kelamin (pria, wanita) dan afiliasi politik (Republik, Demokrat,
Statistik inferensial, juga disebut inferensi statistik Aspek statistik Independen, lainnya). Jika tidak ada bedanya apakah laki-laki atau
ini berkaitan dengan pendugaan parameter populasi berdasarkan perempuan dicantumkan terlebih dahulu, datanya adalah tingkat
statistik sampel. Misalnya, jika sampel 10 kalkulator surya TI-36X nominal.
menunjukkan 2 rusak, kita dapat menyimpulkan bahwa 20 persen Pengukuran ordinal Data yang dapat diurutkan disebut sebagai
dari produksi rusak. pengukuran ordinal. Misalnya, tanggapan konsumen terhadap suara
Pengukuran interval Jika satu pengamatan lebih besar dari yang speaker baru mungkin sangat baik, sangat baik, sedang, atau buruk.
lain dengan jumlah tertentu, dan titik nolnya sewenang-wenang,
pengukurannya menggunakan skala interval. Misalnya, perbedaan Populasi Koleksi, atau himpunan, dari semua individu, objek, atau
suhu antara 70 derajat dan 80 derajat adalah 10 derajat. Demikian ukuran yang sifat-sifatnya sedang dipelajari.
pula, suhu
Machine Translated by Google

138 Bab 4

Pengukuran rasio Jika jarak antar angka adalah ukuran konstan, Ukuran lokasi Nilai tunggal yang khas dari data. Ini menunjukkan
ada titik nol yang sebenarnya, dan rasio dua nilai bermakna, maka pusat distribusi. Rata-rata aritmatika, rata-rata tertimbang, median,
datanya adalah skala rasio. Misalnya, jarak antara $200 dan $300 modus, dan rata-rata geometri adalah ukuran lokasi.
adalah $100, dan dalam kasus uang, ada titik nol sebenarnya. Jika
Anda memiliki nol dolar, tidak ada uang (Anda tidak punya). Juga Median Nilai tengah pengamatan setelah semua pengamatan
rasio antara $200 dan $300 bermakna. disusun dari rendah ke tinggi. Misalnya, jika pengamatan 6, 9, 4
disusun kembali menjadi 4, 6, 9, mediannya adalah 6, nilai tengah.
Sampel Sebagian, atau subset, dari populasi yang sedang dipelajari.
Mode Nilai yang paling sering muncul dalam sekumpulan data.
Statistik Ilmu mengumpulkan, mengatur, menganalisis, dan Untuk data yang dikelompokkan, itu adalah titik tengah dari kelas
menafsirkan data numerik untuk tujuan membuat keputusan yang yang berisi jumlah nilai terbesar.
lebih efektif. Rentang Ini adalah ukuran dispersi. Rentang ditemukan dengan
mengurangkan nilai minimum dari nilai maksimum.

Bab 2 Bagan Standar deviasi Akar kuadrat dari varians.


Format grafik khusus yang digunakan untuk menggambarkan Varians Ukuran dispersi berdasarkan perbedaan kuadrat rata-rata
distribusi frekuensi, termasuk histogram, poligon frekuensi, dan dari rata-rata aritmatika.
poligon frekuensi kumulatif. Perangkat grafis lain yang digunakan Rata-rata tertimbang Setiap nilai diberi bobot sesuai dengan
untuk menggambarkan data adalah diagram batang dan diagram kepentingan relatifnya. Misalnya, jika harga 5 kemeja adalah $10
lingkaran.
dan 20 kemeja adalah $8, harga rata-rata tertimbangnya adalah
Kelas Interval di mana data dihitung. Untuk ujian $8,40: [(5 $10) (20 $8)]/25 $210/25 $8,40.
tolong, $4 hingga $7 adalah kelas; $7 hingga $11 adalah kelas lain.
Frekuensi kelas Jumlah observasi pada setiap kelas. Jika ada 16
pengamatan di kelas $4 sampai dengan $6, 16 adalah frekuensi Bab 4 Box
kelas. plot Tampilan grafis yang menunjukkan bentuk umum dari distribusi
Mendalam Setiap pengamatan harus termasuk dalam salah satu variabel. Ini didasarkan pada lima statistik deskriptif: nilai maksimum
kategori. dan minimum, kuartil pertama dan ketiga, dan median.
Distribusi frekuensi Pengelompokan data ke dalam kelas-kelas
yang menunjukkan jumlah pengamatan di masing-masing kelas Koefisien skewness Ukuran kurangnya simetri dalam distribusi.
yang saling terpisah. Untuk distribusi simetris tidak ada skewness, sehingga koefisien
Histogram Sebuah tampilan grafis dari frekuensi atau distribusi skewness adalah nol.
frekuensi relatif. Sumbu horizontal menunjukkan kelas. Ketinggian Kalau tidak, itu bisa positif atau negatif, dengan batas
3.0.
vertikal batang yang berdekatan menunjukkan frekuensi atau
frekuensi relatif dari masing-masing kelas. Tabel kontingensi Tabel yang digunakan untuk mengklasifikasikan
Midpoint Nilai yang membagi kelas menjadi dua bagian yang pengamatan menurut dua karakteristik.
sama. Untuk kelas $10 hingga $20 dan $20 hingga $30, titik Desil Nilai kumpulan data terurut (minimum ke maksimum) yang
tengahnya masing-masing adalah $15 dan $25. membagi data menjadi sepuluh bagian yang sama.
Saling eksklusif Properti dari sekumpulan kategori sedemikian Dot plot Sebuah dot plot meringkas distribusi satu variabel dengan
rupa sehingga individu, objek, atau pengukuran termasuk dalam menumpuk titik-titik pada titik-titik pada garis bilangan yang
hanya satu kategori. menunjukkan nilai variabel. Plot titik menunjukkan semua nilai.
Distribusi frekuensi relatif Distribusi frekuensi yang menunjukkan
bagian atau proporsi dari jumlah pengamatan pada setiap kelas. Kisaran interkuartil Perbedaan numerik mutlak antara kuartil
pertama dan ketiga. Lima puluh persen dari nilai distribusi terjadi
dalam rentang ini.
Outlier Sebuah titik data yang biasanya jauh dari yang lain.
Bab 3 Rata- Aturan yang diterima adalah untuk mengklasifikasikan pengamatan
rata aritmatika Jumlah nilai dibagi dengan jumlah nilai. Simbol sebagai outlier jika 1,5 kali rentang interkuartil di atas kuartil ketiga
mean sampel adalah X dan simbol mean populasi adalah . atau di bawah kuartil pertama.
Persentil Nilai kumpulan data terurut (minimum hingga maksimum)
Rata -rata geometris Akar ke-n dari hasil kali semua nilai. Ini yang membagi data menjadi seratus interval.
sangat berguna untuk rata-rata tingkat perubahan dan nomor
indeks. Ini meminimalkan pentingnya nilai-nilai ekstrim. Penggunaan Kuartil Nilai kumpulan data terurut (minimum ke maksimum) yang
kedua rata-rata geometris adalah untuk menemukan rata-rata membagi data menjadi empat interval.
perubahan persen tahunan selama periode waktu tertentu. Misalnya, Diagram sebar Teknik grafis yang digunakan untuk menunjukkan
jika penjualan kotor adalah $245 juta pada tahun 1990 dan $692 hubungan antara dua variabel yang diukur dengan skala interval
juta pada tahun 2010, tingkat pengembalian tahunan rata-rata atau rasio.
adalah 5,33 persen. Tampilan batang dan daun Metode untuk menampilkan distribusi
Rata-rata penyimpangan Rata-rata penyimpangan dari rata-rata, variabel menggunakan setiap nilai. Nilai diklasifikasikan menurut
mengabaikan tanda-tanda. Ini diidentifikasi sebagai MD. digit terdepan data. Misalnya, jika kumpulan data berisi nilai antara
Ukuran dispersi Nilai yang menunjukkan penyebaran kumpulan 13 dan 84, delapan kelas berdasarkan digit 10-an akan digunakan
data. Rentang, varians, dan standar deviasi adalah ukuran dispersi. untuk batang. Angka 1 adalah daunnya.
Machine Translated by Google

Tinjauan Bab 1–4 139

Masalah
1. Contoh dana yang disimpan di MCA First Federal Savings Bank (miniatur cek
ing account) mengungkapkan jumlah berikut.

$124 $14 $150 $289 $52 $156 $203 $82 $27 $248
39 52 103 58 136 249 110 298 251 157
186 107 142 185 75 202 119 219 156 78
116 152 206 117 52 299 58 153 219 148
145 187 165 147 158 146 185 186 149 140

Gunakan paket perangkat lunak statistik seperti Excel atau Minitab untuk membantu menjawab pertanyaan berikut. A.
Tentukan rata-
rata, median, dan standar deviasi. B. Tentukan kuartil pertama dan ketiga.
C. Kembangkan plot kotak. Apakah ada outlier? Apakah
jumlahnya mengikuti dis simetris
kontribusi atau mereka miring? Benarkan jawaban Anda. D.
Mengatur distribusi dana ke dalam distribusi frekuensi. e. Tuliskan rangkuman hasil
secara singkat pada bagian a sampai dengan d.

2. Di bawah ini tercantum 44 presiden AS dan usia mereka saat mereka memulai masa jabatannya.

Nomor Nama Usia Nomor Nama Usia


1 Washington 57 23 B.Harrison 55
2 J. Adams 61 24 Cleveland 55
3 Jefferson 57 25 McKinley 54
4 Madiun 57 26 T. Roosevelt 42
5 Monroe 58 27 Taft 51
6 JQ Adams 57 28 Wilson 56
7 Jackson 61 29 Pengerasan 55
8 Van Buren 54 30 Coolidge 51
9 WH Harrison 68 31 Alat pengisap debu 54
10 Tyler 51 32 FD Roosevelt 51
11 Polk 49 33 Truman 60
12 Taylor 64 34 Eisenhower 62
13 Fillmore 50 35 Kennedy 43
14 Menembus 48 36 LB Johnson 55
15 Buchanan 65 37 Nixon 56
16 Lincoln 52 38 Mengarungi 61
17 A.Johnson 56 39 Tukang gerobak 52
18 Menganugerahkan 46 40 Reagan 69
19 Hayes 54 41 GHW Bush 64
20 Garfield 49 42 Clinton 46
21 Arthur 50 43 GW Bush 54
22 Cleveland 47 44 Obama 47

Gunakan paket perangkat lunak statistik seperti Excel atau Minitab untuk membantu menjawab pertanyaan berikut. A.
Tentukan rata-
rata, median, dan standar deviasi. B. Tentukan kuartil pertama dan ketiga.
C. Kembangkan plot kotak. Apakah ada outlier? Apakah
jumlahnya mengikuti dis simetris
kontribusi atau mereka miring? Benarkan jawaban Anda. D.
Mengatur distribusi usia menjadi distribusi frekuensi. e. Tuliskan rangkuman hasil secara
singkat pada bagian a sampai dengan d.
Machine Translated by Google

140 Bab 4

3. Di bawah ini tercantum pendapatan per kapita untuk 50 negara bagian dan Distrik Columbia.

Negara Jumlah Negara Jumlah

Alabama $ 30.894 Montana $ 30.790


Alaska 38.138 Nebraska 34.440
Arizona 31.936 Nevada 38.994
Arkansas 28.473 New Hampshire 39.753
California 39.626 Jersey baru 46.763
Colorado 39.491 Meksiko Baru 29.929
Connecticut 50.762 New York 44.027
Delaware 39.131 Karolina utara 32.247
DC 57.746 Dakota Utara
Florida 3220 Ohio
Georgia Oklahoma
Hawaii Oregon
Idaho Pennsylvania
Illinois Pulau Rhode
Indiana Karolina selatan
Iowa Dakota Selatan
Kansas Tennessee
Kentucky Texas
Louisiana Utah
Maine Vermont
Maryland Virginia
Massachusetts Washington
Michigan Virginia Barat
Minnesota Wisconsin
Mississippi Wyoming 32.6666666.6666666666666666666
Missouri 32888999999999999999999.88899.888899.888888

Gunakan paket perangkat lunak statistik seperti Excel atau Minitab untuk membantu menjawab pertanyaan berikut.
Tentukan kuartil pertama dan ketiga. A. Tentukan rata-rata, median, dan
standar deviasi. B. Tentukan kuartil pertama dan ketiga. C. Kembangkan plot
kotak. Apakah ada outlier? Apakah jumlahnya mengikuti
dis simetris
kontribusi atau mereka miring? Benarkan jawaban Anda. D. Mengatur
distribusi dana ke dalam distribusi frekuensi. e. Tuliskan rangkuman hasil secara singkat
pada bagian a sampai dengan d.

4. Sampel dari 12 rumah yang terjual minggu lalu di St. Paul, Minnesota, mengungkapkan informasi berikut. Gambarlah
diagram pencar. Bisakah kita menyimpulkan bahwa, ketika ukuran rumah (dilaporkan di bawah dalam ribuan kaki persegi)
meningkat, harga jual (dilaporkan dalam $ ribuan) juga meningkat?

Ukuran Ukuran
Rumah (ribuan Harga Jual ($ Rumah (ribuan Harga Jual ($
kaki persegi) ribuan) kaki persegi) ribuan)
1.4 100 1.3 110
1.3 110 0,8 85
1.2 105 1.2 105
1.1 120 0,9 75
1.4 80 1.1 70
1.0 105 1.1 95
Machine Translated by Google

Tinjauan Bab 1–4 141

5. Lihat diagram berikut.

* *

0 40 80 120 160 200

A. Apa yang disebut grafik? B. Berapa


nilai median, dan kuartil pertama dan ketiga? C. Apakah distribusinya condong
positif? Ceritakan bagaimana Anda tahu. D. Apakah ada outlier? Jika ya,
perkirakan nilai-nilai ini. e. Dapatkah kamu menentukan banyaknya
pengamatan dalam penelitian tersebut?

Kasus

A. Century National Bank Kasus berikut


akan muncul di bagian review selanjutnya. Asumsikan bahwa Anda saldo median untuk empat cabang. Apakah ada perbedaan antar
bekerja di Departemen Perencanaan Bank Nasional Century dan melapor cabang? Pastikan untuk menjelaskan perbedaan antara rata-rata
kepada Ms. Lamberg. dan median dalam laporan Anda.
Anda perlu melakukan beberapa analisis data dan menyiapkan laporan
tertulis singkat. Ingat, Tuan Selig adalah presiden bank, jadi Anda pasti 3. Tentukan kisaran dan standar deviasi saldo rekening giro. Apa yang
ingin memastikan bahwa laporan Anda lengkap dan akurat. Salinan data ditunjukkan oleh kuartil pertama dan ketiga? Tentukan koefisien
muncul di Lampiran A.6. kemiringan dan tunjukkan apa yang ditunjukkannya. Karena Pak

Century National Bank memiliki kantor di beberapa kota di Midwest Selig tidak berurusan dengan statistik harian, termasuk deskripsi
dan bagian tenggara Amerika Serikat. Tn. Dan Selig, presiden dan CEO, singkat dan interpretasi standar deviasi dan tindakan lainnya.
ingin mengetahui karakteristik pelanggan rekening korannya. Berapa saldo
pelanggan tipikal?

Berapa banyak layanan bank lain yang digunakan pelanggan untuk B. Wildcat Plumbing Supply Inc.: Apakah Kita Memiliki
memeriksa jumlah rekening? Apakah nasabah menggunakan layanan Perbedaan Jenis Kelamin?
ATM dan jika ya, seberapa sering? Bagaimana dengan kartu debit? Siapa
Wildcat Plumbing Supply telah melayani kebutuhan pipa ledeng Arizona
yang menggunakannya, dan seberapa sering digunakan?
Barat Daya selama lebih dari 40 tahun. Perusahaan ini didirikan oleh Tuan
Untuk lebih memahami pelanggan, Tuan Selig meminta Ibu Wendy
Terrence St. Julian dan saat ini dijalankan oleh putranya Cory. Perusahaan
Lamberg, direktur perencanaan, untuk memilih sampel pelanggan dan
telah berkembang dari segelintir karyawan menjadi lebih dari 500 hari ini.
menyiapkan laporan. Untuk menjadi gin, dia telah menunjuk tim dari
Cory prihatin dengan beberapa posisi dalam perusahaan di mana dia
stafnya. Anda adalah kepala tim dan bertanggung jawab untuk menyiapkan
memiliki pria dan wanita yang pada dasarnya melakukan pekerjaan yang
laporan. Anda memilih sampel acak dari 60 pelanggan. Selain saldo masing-
sama tetapi dengan gaji yang berbeda. Untuk menyelidiki, ia mengumpulkan
masing rekening pada akhir bulan lalu, Anda juga menentukan: (1) jumlah
informasi menjadi rendah. Misalkan Anda adalah seorang mahasiswa
transaksi ATM (anjungan tunai mandiri) pada bulan lalu; (2) jumlah layanan
magang di Jurusan Akuntansi dan diberi tugas untuk menulis laporan
bank lain (rekening tabungan, sertifikat deposito, dll.) yang digunakan
ringkasan situasi.
nasabah; (3) apakah pelanggan memiliki kartu debit (ini adalah layanan
bank yang biayanya langsung dibebankan ke rekening pelanggan); dan (4)
apakah bunga dibayarkan atau tidak pada rekening giro. Sampel meliputi
pelanggan dari cabang di Cincinnati, Ohio; Atlanta, Georgia; Louisville, Gaji Tahunan ($000) Wanita Pria
Kentucky; dan Erie, Pennsylvania.
Kurang dari 30 2 0
30 s/d 40 3 1
40 s/d 50 17 4
50 s/d 60 17 24
1. Kembangkan grafik atau tabel yang menggambarkan saldo cek. Berapa 60 s/d 70 8 21
saldo pelanggan tipikal? 70 s/d 80 3 7
Apakah banyak pelanggan memiliki lebih dari $2.000 di akun mereka? 80 atau lebih 0 3
Apakah tampak adanya perbedaan dalam pembagian rekening di
antara keempat cabang tersebut? Kira-kira berapa nilai saldo akun
yang cenderung mengelompok? Untuk memulai proyek, Tuan Cory St. Julian mengadakan pertemuan
dengan stafnya dan Anda diundang. Pada pertemuan ini, disarankan agar
2. Tentukan rata-rata dan median saldo rekening giro. Bandingkan rata-rata menghitung beberapa ukuran lokasi, menggambar grafik, seperti kumulatif
dan
Machine Translated by Google

142 Bab 4

distribusi frekuensi, dan tentukan kuartil untuk pria dan wanita. hubungi langsung pelanggan volume besar, seperti departemen
Kembangkan bagan dan tulis laporan yang meringkas gaji olahraga di perguruan tinggi dan universitas besar dan waralaba
tahunan karyawan di Wildcat Plumbing Supply. Apakah terlihat olahraga profesional. Terdapat 30 tenaga penjualan yang
ada perbedaan gaji berdasarkan jenis kelamin? mewakili perusahaan ke toko retail yang berlokasi di pusat
perbelanjaan dan toko diskon besar seperti Kmart dan Target.

C. Produk Kimble: Apakah Ada Perbedaan Sekembalinya ke kantor pusat perusahaan, CEO meminta
Komisi? laporan kepada manajer penjualan yang membandingkan misi
yang diperoleh tahun lalu oleh dua bagian tim penjualan.
Pada rapat penjualan nasional bulan Januari, CEO Kimble
Informasinya dilaporkan di bawah ini. Tulis laporan singkat.
Products ditanyai secara luas mengenai kebijakan perusahaan
Apakah Anda akan menyimpulkan bahwa ada perbedaan?
untuk membayar komisi kepada perwakilan penjualannya.
Pastikan untuk memasukkan informasi dalam laporan tentang
Perusahaan menjual barang olahraga ke dua pasar utama. Ada
kecenderungan sentral dan penyebaran kedua kelompok.
40 perwakilan penjualan yang

Komisi yang Diperoleh oleh Perwakilan Penjualan Komisi yang Diperoleh oleh Perwakilan Penjualan
Memanggil Departemen Atletik ($) Menelepon Pengecer Besar ($)
354 87 1.676 1.187 69 3.202 680 39 1.683 1.106 883 3.140 299 1,116 681 1.294 12 754 1.206 1.448 870 944 1.255 1.213 1.291 719 934 1.313 1.083 899

2.197 175 159 1.105 434 615 149 4 392 886 886 1.556 886 1.315 1.858 1.262 1.262 1.264 1.386 1.315 1.315 1.858 1.266 1.264

1.168 278 579 7 357 252 1.602 2.321 1.386 1.315 1.386 1.386 1.386 1.386 1.386 1.886 1.386 1.886 1.886 1.886 1.886 1.886 1.886 1.28

416 427 1.738 526 13 1.604 249 557 635 527

Tes Praktek
Ada tes latihan di akhir setiap bagian ulasan. Tesnya ada dua bagian. Bagian pertama berisi beberapa pertanyaan objektif, biasanya
dalam format isian-kosong. Bagian kedua adalah masalah. Dalam kebanyakan kasus, diperlukan waktu 30 hingga 45 menit untuk
menyelesaikan tes. Masalah membutuhkan kalkulator. Periksa jawabannya di Bagian Jawaban di bagian belakang buku.

Bagian 1—Tujuan 1.
Ilmu mengumpulkan, mengatur, menyajikan, menganalisis, dan menafsirkan data untuk membantu pengambilan keputusan yang efektif
sion disebut . 1.
2. Metode pengorganisasian, meringkas, dan menyajikan data secara informatif disebut .
2.
3. Seluruh rangkaian individu atau objek kepentingan atau pengukuran yang diperoleh dari semua individu atau objek dalam
terest disebut 4. . 3.
Sebutkan dua jenis variabel. 4.

5. Jumlah kamar tidur di sebuah rumah adalah contoh variabel— . (variabel diskrit, variabel kontinyu, kualitatif
pilih salah satu) 5.
6. Nomor punggung pemain Major League Baseball merupakan contoh pengukuran tingkat berapa?
6.
7. Penggolongan siswa berdasarkan warna mata merupakan contoh pengukuran tingkat berapa? 7.
8. Jumlah selisih antara setiap nilai dan rata-rata selalu sama dengan nilai berapa? 8.
9. Satu set data berisi 70 observasi. Berapa banyak kelas yang akan Anda sarankan untuk membangun sebuah frekuensi
distribusi? 9.
10. Berapa persen nilai dalam kumpulan data yang selalu lebih besar dari median? 10.
11. Kuadrat dari standar deviasi adalah 12. Standar . 11.
deviasi mengasumsikan nilai negatif ketika nilainya negatif, atau . (Semua nilai negatif, setidaknya setengah dari
tidak pernah—pilih satu.) 12.
13. Manakah dari berikut ini yang paling tidak terpengaruh oleh outlier? (rata-rata, median, atau rentang—pilih salah satu) 13.

Bagian 2—Masalah 1.
Indeks harga saham Russell 2000 meningkat dengan jumlah berikut selama tiga tahun terakhir.

18% 4% 2%

Berapa kenaikan rata-rata geometris selama tiga tahun?


Machine Translated by Google

Tinjauan Bab 1–4 143

2. Informasi di bawah mengacu pada harga jual ($000) rumah yang dijual di Warren, PA, selama tahun 2010.

Harga Jual ($000) Frekuensi

120,0 s/d 150,0 4


150,0 s/d 180,0 18
180,0 s/d 210,0 30
210,0 s/d 240,0 20
240,0 s/d 270,0 17
270,0 s/d 300,0 10
300,0 s/d 330,0 6

A. Berapa interval kelasnya? B.


Berapa jumlah rumah yang terjual pada tahun
2010? C. Berapa banyak rumah yang dijual dengan harga
kurang dari $210.000? D. Berapa frekuensi relatif kelas 210 sampai dengan
240? e. Berapa titik tengah kelas 150 sampai dengan 180? F.
Harga jual berkisar antara dua jumlah berapa?
3. Sebuah sampel dari delapan mahasiswa mengungkapkan bahwa mereka memiliki sejumlah CD berikut.

52 76 64 79 80 74 66 69

A. Berapa rata-rata jumlah CD yang dimiliki? B. Berapa


jumlah rata-rata CD yang dimiliki? C. Berapa persentil
ke-40? D. Berapa kisaran jumlah CD
yang dimiliki? e. Berapa standar deviasi dari jumlah CD yang
dimiliki?
4. Seorang investor membeli 200 saham Blair Company seharga $36 masing-masing pada Juli 2010, 300 saham seharga $40 masing-masing
pada September 2010, dan 500 saham seharga $50 masing-masing pada Januari 2011. Berapa harga rata-rata tertimbang investor per saham?
5. Selama Super Bowl 2008, 30 juta pon makanan ringan dimakan. Bagan di bawah menggambarkan informasi ini.

Kacang Camilan
8%

berondong

jagung 13%
Keripik Kentang
37%
Pretzel

14%

Keripik Tortilla
28%

A. Apa nama yang diberikan untuk grafik ini? B.


Perkirakan, dalam jutaan pound, jumlah keripik kentang yang dimakan selama pertandingan. C. Perkirakan
hubungan keripik kentang dengan popcorn. (dua kali lebih banyak, setengah lebih banyak, tiga kali, tidak satupun dari ini—
Pilih salah satu)
D. Berapa persen dari total keripik kentang dan keripik tortilla?

Anda mungkin juga menyukai