Anda di halaman 1dari 21

> Bab 16

Menjelajahi, Menampilkan, dan Meneliti Data

> belajar tujuan


Setelah membaca bab ini, Anda akan mengerti. . .

1 Teknik analisis data eksplorasi tersebut memberikan wawasan dan diagnostik data dengan mengedepankan visual
representasi data.

2 Bagaimana tabulasi silang digunakan untuk memeriksa hubungan yang melibatkan variabel kategori, berfungsi sebagai a
kerangka kerja untuk pengujian statistik selanjutnya, dan membuat analisis berbasis tabel menggunakan satu atau lebih variabel kontrol sebagai alat yang

efisien untuk visualisasi data dan pengambilan keputusan.

“ ide-ide di luarcarilah
Sehari-hari, industriinspirasi
penelitiandan
untuk mempengaruhi
pemikiran Anda. Misalnya visualisasi data

maga favorit
di museum.

dapat terinspirasi oleh infografis yang Anda lihat di
zine, atau bahkan karya seni yang Anda lihat

Amanda Durkee, rekan

Zanthus

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 40044 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
> membawa penelitian untuk kehidupan Pikiran Penulis

Myra dan Jason menyelesaikan ulasan mereka tentang materi yang dikirimkan Myra untuk kemitraan terbaru MindWriter dengan Henry and

Associates. Jason, mengetahui Myra sangat ingin mendengar informasi terbaru tentang proyek City Center for Performing Arts,

mengantarnya ke luar kantor. Sammye, karyawan magang terbaru Henry and Associates, sibuk meneliti lintas tab. Dia memutuskan ini

adalah waktu yang tepat untuk mengirim pesan kepada Sammye tentang aturan kerahasiaan data yang dia bicarakan dengan para pekerja

magang minggu lalu.

“Sammye Grayson, temui Myra Wines dari MindWriter. Kami akan Sammye, mendapat anggukan dari Jason, berbagi, “Kita mungkin

bekerja sama dengannya dalam proyek jangka pendek selama minggu harus melakukan pengkodean ulang variabel usia dan ras agar polanya

depan.” Sammye bangkit untuk menjabat tangan Myra yang terulur, saat muncul dengan jelas. Tim juga tertarik pada perbedaan antara kelompok

Jason bertanya dengan polos, "Ada yang menarik di tab silang awal itu?" etnis dalam preferensi pertunjukan di masa depan. Kami juga telah

menyelesaikan pengkodean setiap alamat pelindung dengan kode GPS

Myra tersenyum, mengangkat alis yang ekspresif, dan menunggu (Sistem Penentuan Posisi Geografis). Pemetaan awal dimulai besok;

jawaban Sammye. Jason mempekerjakan kandidat master di bidang geografi untuk

Sammye ragu-ragu dan kemudian, melihat Jason untuk beberapa menyediakan pemetaan. Saya sudah menjadwalkan telepon konferensi

sinyal mengapa dia mengajukan pertanyaan di hadapan klien yang untuk. . . (Sammye membalik halaman kalender mejanya ke minggu

berbeda, menjawab, "Tiga dari tab silang awal tampaknya berikutnya). . . Jumat minggu depan dengan Jackson Murray dan anggota

menunjukkan beberapa dukungan untuk asumsi dewan tentang lain dari tim proyek CCPA. ”

masalah alkohol — pada apakah pelanggan saat ini mendukung

penjualan bir dan anggur selama jeda. Tapi kami tidak cukup jauh ke

dalam data untuk mengatakan asumsi dewan mana yang sepenuhnya "Ketika dewan menyetujui rencana analisis yang Anda usulkan," tanya Myra,

benar dan mana yang mungkin harus dimodifikasi berdasarkan pola "Saya tidak ingat melihat referensi apa pun ke diagram berbentuk kotak dengan

yang muncul dalam subkelompok sampel. " ekor yang saya lihat di grafik yang baru saja Anda serahkan kepada Jason."

“Sebagian besar dari apa yang akan dilakukan tim dalam tiga hari ke

Jason mengangkat tangan untuk menghentikan jawaban rinci atas depan,” sela Jason, “melibatkan lebih banyak tampilan grafis daripada

pertanyaannya. Sammye tahu dari raut wajahnya bahwa dia telah melakukan statistik. Saat ini kami baru saja memahami apa yang dikatakan data kepada

kesalahan. kami. Kami akan memutuskan apa, jika ada, analisis baru untuk

"Seharusnya aku tidak menjawab pertanyaanmu," kata Sammye. "Aku ditambahkan ke rencana yang diusulkan pada hari Jumat ini. Pekerjaan awal

langsung masuk ke dalam jebakan yang kau pasang, dengan mata terbuka lebar." inilah yang meletakkan dasar untuk analisis yang lebih canggih berikutnya.

Tidak ada yang glamor tentangnya, tetapi tanpanya kami mungkin

Myra melompat sebelum Jason bisa menjawab. “Saya pernah melihat Jason melewatkan beberapa temuan penting. ”

melakukan ini sekali sebelum magang, jadi Anda harus merasa seperti salah

satu tim. Dan, tidak, Anda seharusnya tidak menanggapi — kerahasiaan adalah Jason berhenti sejenak untuk memberi efek dan kemudian berkata,

aturan nomor satu — dan sebagai klien, saya menghargainya. Tidak ada “Ngomong-ngomong, 'littlediagram' itu disebutaboxplot. Saya benar-benar

salahnya dilakukan kali ini. Yang gagal dikatakan Jason kepada Anda adalah melakukan beberapa kali selama fase analisis pendahuluan untuk studi Perawatan

saya anggota dewan CCPA dan bagian dari tim proyek. Sebelum Jason Lengkap MindWriter's. Saya tidak memberikannya kepada Anda karena saya

menghentikan Anda, segalanya menjadi menarik. Tolong lanjutkan." harus menjelaskan bagaimana menafsirkannya dan. . . ”

“. . . dan apa pun yang harus Anda jelaskan tidak cukup jelas, ”Myra

menyelesaikan.

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 40055 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
406 > bagian IV Analisis dan Penyajian Data

> Analisis Data Eksplorasi


Kenyamanan entri data melalui spreadsheet, pengenalan tanda optimal (OMR), atau editor data program statistik membuatnya tergoda untuk
langsung beralih ke analisis statistik. Godaan itu semakin kuat ketika datanya bisa masuk dan dilihat secara real time. Mengapa
membuang-buang waktu untuk mencari tahu apakah data tersebut mengkonfirmasi hipotesis yang memotivasi penelitian? Mengapa tidak
memperoleh ringkasan statistik deskriptif (berdasarkan pembahasan kita di Lampiran 15a) dan kemudian menguji hipotesis?

Analisis data eksplorasi adalah perspektif analisis data dan serangkaian teknik. Dalam bab ini, kami akan menyajikan teknik unik dan
konvensional termasuk perangkat grafis dan tabel untuk memvisualisasikan data. Tampilan 16-1 mengingatkan Anda tentang pentingnya
visualisasi data sebagai elemen integral dalam proses analisis data dan sebagai langkah penting sebelum pengujian hipotesis. Dalam
Bab 3, kami mengatakan bahwa penelitian yang dilakukan secara ilmiah adalah aktivitas memecahkan teka-teki serta sikap ingin tahu,
curiga, dan imajinasi yang penting untuk penemuan. Oleh karena itu, wajar jika eksplorasi dan pemeriksaan data akan menjadi bagian
integral dari perspektif analisis data kami.

Di analisis data eksplorasi (EDA) Peneliti memiliki fleksibilitas untuk menanggapi pola yang terungkap dalam analisis awal
data. Dengan demikian, pola dalam data yang dikumpulkan memandu analisis data atau menyarankan revisi rencana analisis data
awal. Fleksibilitas ini merupakan atribut penting dari pendekatan ini. Namun, ketika peneliti mencoba untuk membuktikan
sebab-akibat, analisis data konfirmatori diperlukan. Analisis data konfirmatori adalah proses analitis yang dipandu oleh inferensi
statistik klasik dalam penggunaan pengujian signifikansi dan keyakinan. 1

> Gambar 16-1 Eksplorasi, Pemeriksaan, dan Analisis Data dalam Proses Penelitian

Penelitian
Rancangan Analisis awal
Perencanaan

Perbaiki Hipotesis
Pengumpulan data
& Persiapan Visualisasi data

Analisis Data & Interpretasi Statistik

Deskriptif Variabel

Tabulasi Silang Variabel

Persiapan Menampilkan Data


(histogram, plot kotak, Pareto,
batang-dan-daun, AID, dll.)

Analisis data Pengujian Hipotesis

Tentukan Rekomendasi

Pelaporan Penelitian

Pengelolaan
Keputusan

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 40066 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
> Bab 16 Menjelajahi, Menampilkan, dan Meneliti Data 407

Satu otoritas telah membandingkan analisis data eksplorasi dengan peran detektif polisi dan penyidik lainnya dan analisis
konfirmasi dengan hakim dan sistem peradilan. Yang pertama terlibat dalam pencarian petunjuk dan bukti; yang terakhir disibukkan
dengan mengevaluasi kekuatan bukti yang ditemukan. Analisis data eksplorasi adalah langkah pertama dalam mencari bukti, yang
tanpanya analisis konfirmatori tidak perlu mengevaluasi apa pun. 2 Konsisten dengan analogi tersebut, EDA berbagi kesamaan
dengan desain eksplorasi, bukan desain formal. Karena tidak mengikuti struktur yang kaku, ia bebas mengambil banyak jalan untuk
mengungkap misteri dalam data — untuk menyaring yang tidak dapat diprediksi dari yang dapat diprediksi.

Kontribusi utama dari pendekatan eksplorasi terletak pada penekanan pada representasi visual dan teknik grafis di atas statistik
ringkasan. Statistik ringkasan, seperti yang akan Anda lihat sebentar lagi, mungkin mengaburkan, menyembunyikan, atau bahkan salah
menggambarkan struktur yang mendasari data. Jika ringkasan numerik digunakan secara eksklusif dan diterima tanpa inspeksi visual,
pemilihan model konfirmasi dapat didasarkan pada asumsi yang salah. 3 Untuk alasan ini, analisis data harus dimulai dengan inspeksi
visual. Setelah itu, tidak hanya mungkin tetapi juga diinginkan untuk melakukan siklus antara pendekatan eksplorasi dan konfirmatori.

Tabel Frekuensi, Diagram Batang, dan Diagram Lingkaran 4

Beberapa teknik yang berguna untuk menampilkan data bukanlah hal baru bagi EDA. Mereka sangat penting untuk pemeriksaan data apa
pun. Misalnya, a tabel frekuensi adalah perangkat sederhana untuk menyusun data. Contoh disajikan dalam Tampilan 16-2. Ini menyusun
data berdasarkan nilai numerik yang ditetapkan, dengan kolom untuk persen, persen valid (persen disesuaikan untuk data yang hilang),
dan persen kumulatif. Variabel nominal ini menggambarkan usia minimum yang diinginkan untuk diizinkan memiliki akun jejaring sosial.
Data yang sama disajikan dalam Gambar 16-3 menggunakan diagram lingkaran dan diagram batang. Nilai dan persentase lebih mudah
dipahami dalam format grafik ini.

Ketika variabel yang diminati diukur pada skala rasio interval dan merupakan variabel dengan banyak nilai potensial, teknik ini tidak
terlalu informatif. Tampilan 16-4 (halaman 405) adalah tabel frekuensi ringkas dari pembelian tahunan rata-rata 50 pelanggan teratas
PrimeSell. Hanya dua nilai, 59,9 dan 66, yang memiliki frekuensi lebih besar dari 1. Jadi, kontribusi utama tabel untuk data ini adalah daftar
nilai yang diurutkan. Jika tabel diubah menjadi diagram batang, tabel tersebut akan memiliki 48 batang dengan panjang yang sama dan dua
batang dengan dua kejadian. Bagan batang tidak menyediakan ruang untuk nilai di mana tidak ada pengamatan yang terjadi dalam rentang
tersebut. Membuat diagram lingkaran untuk variabel ini juga tidak ada gunanya.

Gambar 16-2 Tabel Frekuensi (Usia Minimum untuk Jejaring Sosial)

Sah Kumulatif
Label Nilai Nilai Frekuensi Persen Persen Persen

21 tahun 1 60 6 6 6

18 tahun min 16 2 180 18 18 24

tahun min 13 tahun 3 330 33 33 57

min 10 tahun min 4 280 28 28 85

Berapapun 5 50 5 5 90

6 60 6 6 96

Tidak ada opini 7 40 4 4 100

1.000 100 100

Kasus Valid 1.000; Kasus yang Hilang 0

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 40077 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
408 > bagian IV Analisis dan Penyajian Data

> Gambar 16-3 Tampilan Nominal Data (Usia Minimum untuk Jejaring Sosial)

Usia Minimum untuk Jejaring Sosial

Persen

21 tahun 6

18 tahun 18

16 tahun 33

13 tahun 28

10 tahun 5

Usia berapa pun 6

Tidak ada opini 4

Usia Minimum untuk Jejaring Sosial


35

30

25

20

15

10

5
Persen

0
21 18 16 13 10 Apa saja

Usia

Histogram
Histogram adalah solusi konvensional untuk menampilkan data rasio interval. Histogram digunakan jika memungkinkan untuk
mengelompokkan nilai variabel ke dalam interval. Histogram dibuat dengan batang (atau tanda bintang) yang mewakili nilai data, di
mana setiap nilai menempati jumlah area yang sama di dalam area tertutup. Analis data menemukan histogram berguna untuk (1)
menampilkan semua interval dalam suatu distribusi, bahkan yang tanpa nilai yang diamati, dan (2) memeriksa bentuk distribusi
untuk kemiringan, kurtosis, dan pola modal. Saat melihat histogram, orang mungkin bertanya: Apakah ada satu punuk (mode)?
Apakah subkelompok dapat diidentifikasi ketika ada beberapa mode? Apakah nilai data yang tidak rata terlepas dari konsentrasi
pusat? 5

Nilai untuk variabel pembelian tahunan rata-rata yang disajikan pada Tampilan 16-4 diukur pada skala rasio dan mudah
dikelompokkan. Variabel lain yang memiliki urutan yang mendasarinya juga sesuai untuk histogram. Histogram tidak akan
digunakan untuk variabel nominal seperti usia minimum untuk jejaring sosial (Gambar 16-3) yang tidak memiliki urutan
kategorinya.
Histogram dari pembelian tahunan rata-rata ditunjukkan pada Tampilan 16-5. Titik tengah untuk setiap interval untuk variabel
bunga, rata-rata pembelian tahunan, ditampilkan pada sumbu horizontal; frekuensi

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 40088 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
> Bab 16 Menjelajahi, Menampilkan, dan Meneliti Data 409

> Gambar 16-4 Pembelian Tahunan Rata-rata 50 Pelanggan Teratas PrimeSell

Kumulatif Kumulatif
Nilai Frekuensi Persen Persen Nilai Frekuensi Persen Persen

54.9 1 2 2 75.6 1 2 54

55.4 1 2 4 76.4 1 2 56

55.6 1 2 6 77.5 1 2 58

56.4 1 2 8 78.9 1 2 60

56.8 1 2 10 80.9 1 2 62

56.9 1 2 12 82.2 1 2 64

57.8 1 2 14 82.5 1 2 66

58.1 1 2 16 86.4 1 2 68

58.2 1 2 18 88.3 1 2 70

58.3 1 2 20 102.5 1 2 72

58.5 1 2 22 104.1 1 2 74

59.9 2 4 26 110.4 1 2 76

61.5 1 2 28 111.9 1 2 78

62.6 1 2 30 118.6 1 2 80

64.8 1 2 32 123.8 1 2 82

66.0 2 4 36 131.2 1 2 84

66.3 1 2 38 140.9 1 2 86

67.6 1 2 40 146.2 1 2 88

69.1 1 2 42 153.2 1 2 90

69.2 1 2 44 163.2 1 2 92

70.5 1 2 46 166.7 1 2 94

72.7 1 2 48 183.2 1 2 96

72.9 1 2 50 206.9 1 2 98

73.5 1 2 52 218.2 1 2 100

Total 50 100

> Gambar 16-5 Histogram Pembelian Tahunan Rata-Rata 50 Pelanggan Teratas PrimeSell

15

10

5
Frekuensi

50 70 90 1101301501701901010

Pembelian tahunan rata-rata

c coo 2 211550077_c
Hai
Hai _ ch
h 1166__ 4 004-
4 4-4227.7 . saya
n dddddi4 4 0099 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
410 > bagian IV Analisis dan Penyajian Data

> jepret tembakan


Visualisasi Data Novation Membawa Aplikasi Unik

Didirikan pada tahun 1998, Novation adalah perusahaan ahli dan kontrak rantai pasokan

perawatan kesehatan terkemuka untuk lebih dari 65.000 anggota dan afiliasi. Organisasi

perawatan kesehatan yang dilayani oleh Novation menghadapi tekanan yang semakin besar

pada laba atas investasi mereka di tengah meningkatnya biaya, meningkatnya perawatan Bagaimana saya bisa
Saya butuh informasi
mendapatkan laporan yang menyertakan semua file
sekarang ... bagaimana saya bisa
tanpa kompensasi, kekurangan perawatan, dan krisis ekonomi nasional.
mendapatkan akses lebih cepat? informasi yang saya butuhkan?

Melinda Gardner, wakil presiden, informasi strategis untuk Novation, memberikan kepemimpinan,

aku ingin Pelanggan Internal saya ingin


arahan dan fokus strategis untuk aktivitas yang berkaitan dengan aktivitas intelijen bisnis Novation.
buat sendiri konsisten
Tantangan Untuk
Timnya sangat penting untuk keberhasilan peluncuran produk visualisasi data baru Novation. "Nomor disesuaikan hasil dari
Visualisasi data
laporan. data.
produk dan konvensi penamaan tidak distandarisasi di seluruh industri perawatan kesehatan," kata Penyebaran

Gardner dalam presentasi tentang penemuan data visual dan dasbor layanan mandiri untuk bisnis. Hal

itu membuat berbagi informasi, terutama dengan sistem layanan kesehatan tentang pemasok dan saya harus pergi ke Saya ingin saya
3 berbeda informasi
perilaku pembelian, menjadi bermasalah. Dengan alat visualisasi datanya, Novation ingin "memajukan
tempat untuk disajikan dalam a
mendapatkan semua informasi. lebih berwawasan
cara organisasi berpikir tentang data," kata Gardner. Novation mengumpulkan data dari pesanan
mode.
pembelian dan faktur rumah sakit anggota, data penjualan, data distribusi dan pemasok serta kontrak

manajemen harga, dan membuat data ini tersedia bagi anggota tidak hanya di desktop, tetapi di iPhone

atau iPad mereka. Sistem baru perlu melayani berbagai pengguna bisnis, termasuk semua orang dari
untuk produk ini, memastikan bahwa sejumlah besar data dan sejumlah besar metrik
pembuat keputusan eksekutif hingga tim penjualan hingga keuangan. Novation tidak ingin membatasi
dapat diakses dalam lingkungan berkinerja tinggi. Analisis dan visualisasi yang kompleks
pengguna pada pendekatan tipikal yang biasanya terdiri dari laporan yang dikembangkan TI dengan
dapat diselesaikan dalam hitungan menit dengan menggunakan server cerdas.
data yang dipaksakan ke dalam model. Sebaliknya, Novation ingin agar para pengguna ini dapat
Keterlibatan pengguna bisnis selama tahap perencanaan memastikan penggunaan awal
'bermain dalam data', dan memiliki kemampuan untuk bereksperimen dengan tampilan tambahan atau
produk ini. Analisis yang telah diisi sebelumnya dan kasus penggunaan digunakan
alternatif. Novation tidak ingin membatasi pengguna pada pendekatan tipikal yang biasanya terdiri dari
selama pelatihan, dan pengguna diperlihatkan bagaimana menambah atau menghapus
laporan yang dikembangkan TI dengan data yang dipaksakan ke dalam model. Sebaliknya, Novation
bidang data dan memanipulasi pembuatan bagan data untuk membuat pola data — dan
ingin agar para pengguna ini dapat 'bermain dalam data', dan memiliki kemampuan untuk
pencilan — menjadi hidup. Dengan menggunakan alat visualisasi data ini, Novation akan
bereksperimen dengan tampilan tambahan atau alternatif. Novation tidak ingin membatasi pengguna
terus menemukan cara untuk membantu rumah sakit dalam memaksimalkan nilai kontrak
pada pendekatan tipikal yang biasanya terdiri dari laporan yang dikembangkan TI dengan data yang
dan mengurangi biaya rantai pasokan.
dipaksakan ke dalam model. Sebaliknya, Novation ingin agar para pengguna ini dapat 'bermain dalam

data', dan memiliki kemampuan untuk bereksperimen dengan tampilan tambahan atau alternatif.

Novation bermitra dengan MicroStrategy untuk menerapkan teknologi inovatif


Novation melayani anggota dan afiliasi VHA Inc. (jaringan nasional

ini. Hasilnya adalah produk yang memungkinkan pengguna bisnis membuat analisis
sistem perawatan kesehatan milik masyarakat), UHC (aliansi nasional yang

ad hoc dengan visualisasi data yang canggih dengan cara yang sangat cepat.
mewakili sekitar 90% pusat medis akademis nonprofit negara), Children's

Produk visualisasi data Novation sekarang diluncurkan dan pengguna berbagi


Hospital Association (aliansi dari rumah sakit anak-anak terkemuka bangsa),

laporan praktik terbaik — dan melakukannya dengan sedikit dukungan teknis.


dan Provista, LLC (organisasi pembelian kelompok yang menyediakan

“Pelatihan itu penting, tetapi adopsi tidaklah sulit,” kata Gardner. Dengan bantuan
manajemen rantai pasokan dan layanan pengadaan).

Microstrategy, Novation memanfaatkan kubus cerdas

www.novationco.com; www.microstrategy.com

atau jumlah pengamatan di setiap interval, pada sumbu vertikal. Kami mendirikan sebuah bar vertikal di atas titik tengah
setiap interval pada skala horizontal. Ketinggian balok sesuai dengan frekuensi pengamatan dalam interval di atasnya yang
didirikan. Histogram ini dibangun dengan lebar interval 20 increment, dan interval terakhir hanya terdiri dari dua observasi,
206,9 dan 218,2. Nilai-nilai ini ditemukan dalam tabel frekuensi pembelian tahunan rata-rata PrimeSell (Exhibit 16-4).
Interval dengan 0 hitungan menunjukkan celah dalam data dan memperingatkan analis untuk mencari masalah dengan
penyebaran. Jika bagian atas distribusi dibandingkan dengan tabel frekuensi, kami menemukan tiga nilai ekstrem (183,2,
206,9, dan 218,2). Seiring dengan titik tengah memuncak dan berkurangnya jumlah pengamatan di ekor atas,

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 41100 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
> Bab 16 Menjelajahi, Menampilkan, dan Meneliti Data 411

Tampilan Batang dan Daun 6


Itu tampilan batang dan daun merupakan teknik yang sangat erat kaitannya dengan histogram. Ini berbagi beberapa fitur histogram tetapi
menawarkan beberapa keuntungan unik. Mudah dibuat dengan tangan untuk sampel kecil atau mungkin diproduksi oleh program komputer.
Berbeda dengan histogram, yang kehilangan informasi dengan mengelompokkan nilai data ke dalam interval, stem-and-leaf menyajikan nilai
data aktual yang dapat diperiksa secara langsung, tanpa menggunakan batang atau tanda bintang yang tertutup sebagai media representasi.
Fitur ini mengungkapkan distribusi nilai dalam interval dan mempertahankan urutan peringkatnya untuk menemukan median, kuartil, dan
statistik ringkasan lainnya. Ini juga memudahkan menghubungkan kembali observasi tertentu ke file data dan ke subjek yang
memproduksinya.

Visualisasi adalah keuntungan kedua dari tampilan batang dan daun. Rentang nilai terlihat sekilas, dan tayangan bentuk
serta sebaran langsung terlihat. Pola dalam data — seperti celah di mana tidak ada nilai, area di mana nilai-nilai
dikelompokkan, atau nilai-nilai terpencil yang berbeda dari bagian utama data — mudah diamati.

Untuk mengembangkan tampilan batang-dan-daun untuk data di Tampilan 16-4, digit pertama dari setiap item data disusun di
sebelah kiri garis vertikal. Selanjutnya, kami melewati persentase pembelian tahunan rata-rata sesuai urutan pencatatannya dan
menempatkan digit terakhir untuk setiap item (posisi unit,
1.0) di sebelah kanan garis vertikal. Perhatikan bahwa digit di sebelah kanan koma desimal diabaikan. Digit terakhir untuk setiap item ditempatkan
pada baris horizontal yang sesuai dengan digit pertamanya. Sekarang adalah masalah sederhana untuk menyusun urutan angka di setiap baris,
membuat tampilan batang dan daun yang ditunjukkan pada Tampilan 16-6.

Setiap baris atau baris dalam tampilan ini disebut sebagai a batang, dan setiap informasi pada batang disebut a daun. Baris atau baris
pertama adalah

5|455666788889

Arti yang dilampirkan pada baris atau baris ini adalah bahwa ada 12 item dalam kumpulan data yang digit pertamanya adalah lima:

54, 55, 55, 56, 56, 56, 57, 58, 58, 58, 58, dan 59. Baris kedua,

6|12466799

menunjukkan bahwa ada delapan rata-rata nilai pembelian tahunan yang digit pertamanya adalah enam: 61, 62, 64, 66, 66,

67, 69, dan 69.


Ketika tampilan batang dan daun yang ditunjukkan pada Gambar 16-6 diputar tegak lurus (diputar 90 derajat ke kiri), bentuknya sama
dengan histogram yang diperlihatkan pada Gambar 16-5.

> Gambar 16-6 Tampilan Batang-dan-Daun dari Data Pembelian Tahunan Rata-Rata PrimeSell

5 455666788889124
6 66799
7 02235678
8 02268
9
10 24
11 018
12 3
13 1
14 06
15 3
16 36
17
18 3
19
20 6
21 8

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 41111 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
412 > bagian IV Analisis dan Penyajian Data

> Menutup naik


Menggunakan Tabel untuk Memahami Data

Karena tugas utama peneliti adalah menemukan pesan yang diungkapkan oleh data, ia Kehadiran angka apapun dalam sebuah tabel untuk perbandingan dengan angka

membutuhkan setiap alat untuk mengungkapkan pesan tersebut. Penulis Sally Bigwood yang serupa — dari tahun lalu, dari kandidat lain, dari mesin lain, melawan gol, dan

dan Melissa Spore dalam buku mereka Menyajikan Angka, Tabel, dan Grafik menyarankan sebagainya. Dengan menggunakan aturan penulis untuk pembuatan tabel, seorang

bahwa tabel adalah alat utama untuk mengekstraksi pengetahuan dari data. peneliti yang mengeksplorasi data dengan membuat tabel harus:

• Angka bulat. • Angka yang dibulatkan dapat dibandingkan dengan paling mudah, memungkinkan kita untuk lebih mudah menentukan rasio atau hubungan satu angka
dengan angka lainnya.

• Jika ketepatan sangat penting untuk angka tersebut (misalnya, Anda meneliti pajak atau spesifikasi desain atau interaksi obat),
jangan bulatkan angkanya.

• Atur nomor- • Urutkan nomor dari nomor terbesar hingga terkecil.


bers untuk mengungkapkan • Dalam tabel yang disusun secara vertikal, urutkan angka terbesar di atas.
pola. • Dalam susunan horizontal, urutkan angka terbesar di sebelah kiri.

• Saat mencari perubahan dari waktu ke waktu, urutkan angkanya berdasarkan tahun, dari yang paling jauh (kiri atau atas) hingga yang terbaru.

• Gunakan aver- • Rata-rata memberikan poin untuk perbandingan.


usia, total, atau • Jangan gunakan rata-rata jika data mentah menunjukkan distribusi bimodal.
persentase untuk
• Total menekankan gambaran besar.
mencapai fokus.
• Persentase menunjukkan hubungan proporsional lebih mudah daripada data mentah.

• Bandingkan seperti timbangan • Ubah angka menjadi skala umum ketika angka mencerminkan skala yang berbeda (misalnya, gram versus ons
konsumsi sereal; data gaji bulanan versus data gaji per jam).
dalam satu tabel.

• Pilih kesederhanaan • Beberapa tabel yang lebih kecil menunjukkan pola lebih baik daripada satu tabel besar dan kompleks.

lebih dari kompleksitas.


• Tabel kompleks digunakan sebagai sumber referensi yang cocok untuk banyak elemen data.

• Gunakan ruang kosong • Desain tabel dengan jumlah kolom yang lebih kecil dari baris.
dan desain untuk memandu
• Nomor spasi tunggal yang harus dibandingkan.
mata ke angka-angka yang
harus dibandingkan dan untuk • Gunakan garis kisi untuk mengelompokkan nomor dalam tabel; hindari garis kisi di antara angka yang harus dibandingkan.
membuat pola dan
pengecualian-
• Gunakan ruang kosong untuk membuat selokan di antara angka-angka dalam tabel sederhana.
tions menonjol.
• Tajuk kolom dan nomor tabel rata kanan.

• Buat ringkasan masing-masing • Tulislah frasa atau kalimat yang merangkum interpretasi Anda tentang data yang disajikan; jangan biarkan interpretasi menjadi
kebetulan.
tampilan data.
• Pernyataan ringkasan dapat digunakan sebagai judul tabel atau bagan dalam laporan penelitian akhir.
• Ringkasan tidak perlu menyebutkan angka apapun.

• Label dan judul • Judul harus lengkap: Sertakan apa (subjek judul atau pesan), di mana (jika data memiliki basis geografis), kapan
(tanggal atau periode waktu yang tercakup), dan satuan ukuran.
tabel untuk kejelasan
pesan.
• Sertakan informasi umum dalam judul: Ini memperpanjang judul tetapi memperpendek judul kolom tabel.

• Hindari singkatan di judul kolom kecuali diketahui oleh audiens Anda.

• Hindari catatan kaki; jika digunakan, gunakan simbol — seperti asterisk — daripada angka (angka yang digunakan sebagai catatan kaki
dapat disalahartikan dengan nomor konten tabel).

• Untuk rujukan, berikan baris sumber yang dapat disambungkan untuk rujukan nanti.

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 41122 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
> Bab 16 Menjelajahi, Menampilkan, dan Meneliti Data 413

> Menutup naik lanjutan

SEBUAH CONTOH

Misalnya Anda sedang menentukan apakah akan memperluas ke Eropa Barat dengan fasilitas distribusi untuk melayani pembelian online dari perusahaan barang khusus Anda.

Tabel 1 Pengeluaran oleh Pengguna Internet di Barat Pilihan


Negara-negara Eropa 2010 (EURO dalam Miliaran)

Tahunan Tahunan

Pengeluaran Pembelian

Perancis Euro 664.5 16

Jerman Euro 658.0 20

Italia Euro 345.5 14

Spanyol Euro 560.1 10

Britania Raya Euro 2284.9 36

Kami mulai dengan tabel di atas yang menyajikan data yang dikembangkan dari beberapa studi tentang belanja online dan perilaku pembelian di negara-negara tertentu di

Eropa Barat. Data diurutkan menurut abjad berdasarkan negara. Meskipun menyusun dalam urutan abjad mungkin ideal untuk pengacakan atau pengurangan bias, ini bukanlah

pilihan logis untuk kejelasan penyajian data.

Data apa yang mungkin Anda perlukan untuk membantu Anda membuat keputusan tentang fasilitas distribusi? Apakah Anda perlu mengetahui ukuran transaksi rata-rata? Jika

Anda tidak mengetahui tingkat konversi euro ke dolar, dapatkah Anda menginterpretasikan tabel? Haruskah Anda menaruh investasi di Inggris Raya atau di tempat lain?

Meja 2 E5 Pengeluaran Online Satu Tahun Per Kapita (2010)

Pengeluaran Tahunan Rata rata tahunan Pengeluaran Tahunan

(EURO) Pembelian (DOLLAR AMERIKA$)

Britania Raya 2284.9 36 1736.2

Jerman 658.0 20 500.0

Perancis 664.5 16 505.0

Italia 345.5 14 262.6

Spanyol 560.1 10 425.6

Nilai Tukar Mata Uang: 1 US $ = 1,316 EURO

Tabel 2 menyusun kembali data menggunakan pedoman Bigwood dan Spore. Pertama, judul tabel telah berubah; sekarang periode tahunan yang menjadi dasar data

pengeluaran lebih jelas, serta fakta bahwa kami sedang melihat pengeluaran per kapita untuk 5 pemain teratas Uni Eropa, yang dikenal sebagai E5. Kami juga telah mengubah

tajuk kolom untuk mencerminkan mata uang, dan kami telah membenarkan tajuk dan angkanya. Kami telah mengatur ulang tabel dengan Pengeluaran Rata-rata (EURO) dalam

urutan menurun dan menafsirkan kolom (EURO) dengan menambahkan kolom konversi dolar. Kita mungkin tidak memerlukan kolom paling kanan jika kita sendiri adalah

pemboros euro, tetapi jika kita lebih akrab dengan mata uang lain, penambahan kolom ini membantu kita menafsirkan data. Dengan pengaturan ini, apakah Jerman terlihat

menarik? Meskipun saat ini tampaknya tidak sekuat Inggris Raya, kami tahu bahwa Inggris secara fisik kuat dan terletak di lokasi yang lebih sentral daripada negara-negara lain

yang sedang dipertimbangkan.

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 41133 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
414 > bagian IV Analisis dan Penyajian Data

> Menutup naik lanjutan


Tabel 3 E5 Pengeluaran Online Satu Tahun Per Kapita (2010)
Pengeluaran Tahunan Rata rata tahunan Tahunan

(EURO) Pembelian Pembelanjaan (US $)

Britania Raya 2284.9 36 1736.24 Di Atas Rata-rata Pembeli Frekuensi Di Atas

Jerman 658.0 20 500,00 Rata-rata Pembeli Frekuensi Di Bawah

Perancis 664.5 16 504.97 Rata-rata Pembeli Di Bawah Rata-rata

Italia 345.5 14 262.57 Pembeli Frekuensi Di Bawah Rata-rata

Spanyol 560.1 10 425.61 Pembeli Frekuensi

Rata-rata 902.6 19.2 685.88

Nilai Tukar Mata Uang: 1 US $ = 1,316 EURO

Tabel 3 menawarkan tambahan sederhana: rata-rata kolom. Dan tabel tersebut sekarang diurutkan berdasarkan Pembelian Tahunan Rata-Rata dalam periode satu tahun yang
dipelajari. Presentasi ini memungkinkan penerjemah data untuk menentukan negara mana yang membeli di atas rata-rata untuk Eropa Barat dan mana yang membeli di bawah
rata-rata. Jerman terlihat cukup bagus. Baik?

Tabel 4 Pengeluaran Online Satu Tahun ES Per Kapita (2010)


Pengeluaran Tahunan Pengeluaran Tahunan Rata rata tahunan Transaksi Rata-rata Transaksi Rata-rata
(EURO) (DOLLAR AMERIKA$) Pembelian (EURO) (DOLLAR AMERIKA$)

Britania Raya 2284.9 1736.24 36 63.5 48.23

Spanyol 560.1 425.61 10 56.0 42.56

Perancis 664.5 504.97 16 41.5 31.56

Jerman 658.0 500,00 20 32.9 25.00

Italia 345.5 262.57 14 24.7 18.75

Rata-rata 902.6 685.88 19.2 47.0 35.72

Nilai Tukar Mata Uang: 1 US $ = 1,316 EURO

Tabel 4 menawarkan penyusunan ulang data berdasarkan kolom yang baru dihitung, Transaksi Rata-rata (Euro). Jerman tidak terlihat begitu menarik sekarang. Ini terutama benar
jika kita adalah penjual barang dagangan khusus dengan harga lebih tinggi.

Tabel 5 E5 Pengeluaran Online Satu Tahun Per Kapita (2010 vs. 2015)

Estimasi Rata-rata Estimasi Rata-rata


Estimasi Persen Perkiraan Internet Transaksi 2015 Transaksi 2015
Pengguna Internet 2015 Pengguna 2015 (jutaan) (EURO) (DOLLAR AMERIKA$)

Jerman 89.9 72.2 51.5 37.06

Italia 78.3 45.3 58.6 42.14

Perancis 87.3 56.9 63.8 45.92

Britania Raya 94.9 58.2 95.2 68.48

Spanyol 77.7 34.5 106.4 76.55

Rata-rata 78.3 45.3 58.6 42.14

Tidak seperti tabel sebelumnya, Tabel 5 diurutkan dari yang paling sedikit hingga yang paling banyak berdasarkan perkiraan Transaksi Rata-Rata 2015 dan kami telah menggunakan proyeksi untuk
data pembelian tahun 2015. Jika Anda tidak melihat banyak tabel, Anda mungkin akan segera melirik ke tabel, dan berpikir Jerman sebagai pusat distribusi harus menjadi pilihan yang jelas.
Meskipun Jerman mungkin masih menjadi pesaing (mengingat posisi keuangannya yang lebih kuat di Uni Eropa), proyeksi ukuran transaksinya yang lebih kecil mungkin akan mengurangi
persaingan bagi distributor barang khusus. Jadi peringatan yang sangat penting pada tabel: Sebagai peneliti Anda ingin mengupayakan konsistensi. Jika Anda memesan dari paling banyak ke paling
sedikit, pilih pengaturan ini untuk setiap tabel yang Anda lakukan.

Setelah menyusun ulang data dalam berbagai tabel, di mana Anda akan meletakkan pusat distribusi?

Sumber: “Eropa,” NewMedia TrendWatch, diakses 1 Agustus 2012 (http://www.newmediatrendwatch.com/regional-overview/103-europe?showall=1). Kurs EURO ke Dolar, X-Rates,
diakses 28 Juli 2012 (http://www.x-rates.com/table/?from=EUR). “Nilai Tukar Historis: EURO ke Dolar,” Oanda, diakses 28 Juli 2012 (http://www.oanda.com/currency/historical-rates/).
Matt Creamer dan Rupal Parekh, "Mengapa Euro Cri- sis Juga Masalah Bisnis Anda," Usia Periklanan, 23 Juli 2012, diakses 28 Juli 2012
(http://adage.com/article/news/euro-crisis-business- problem / 236235 /? Utm_source = daily_email & utm_medium = newsletter & utm_campaign = adage).

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 41144 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
> Bab 16 Menjelajahi, Menampilkan, dan Meneliti Data 415

> Gambar 16-7 Diagram Pareto Perbaikan Keluhan MindWriter

800 100%
99%
95%

80%
600

400 50%

Persen keluhan perbaikan


Jumlah keluhan perbaikan

0 0%

Masalah tidak Banyak Telepon pengiriman Perbaikan


terselesaikan perbaikan mengakses menunda waktu
dibutuhkan menunda

Diagram Pareto
Diagram Pareto mendapatkan namanya dari seorang ekonom Italia abad ke-19. Dalam manajemen mutu,
JM Juran pertama kali menerapkan konsep ini dengan mencatat bahwa hanya beberapa cacat penting yang menyebabkan sebagian besar masalah
dievaluasi untuk kualitas dan bahwa hal sepele dapat menjelaskan sisanya. Secara historis, ini kemudian dikenal sebagai aturan 80/20 — artinya,
peningkatan kualitas atau kinerja sebesar 80 persen dapat diharapkan dengan menghilangkan 20 persen penyebab kualitas atau kinerja yang tidak
dapat diterima.
Itu Diagram pareto adalah diagram batang yang persentasenya mencapai 100 persen. Data berasal dari pilihan ganda,
skala respon tunggal; skala pilihan ganda, tanggapan ganda; atau jumlah frekuensi kata (atau tema) dari analisis konten.
Jawaban responden diurutkan berdasarkan tingkat kepentingan, dengan tinggi batang dalam urutan menurun dari kiri ke kanan.
Deretan gambar yang dihasilkan menunjukkan konsentrasi potensi peningkatan tertinggi dalam jumlah solusi paling sedikit.
Analisis keluhan pelanggan MindWriter digambarkan sebagai diagram Pareto di Tampilan 16-7. Garis frekuensi kumulatif dalam
pameran ini menunjukkan bahwa dua masalah teratas (perbaikan tidak menyelesaikan masalah pelanggan, dan produk
dikembalikan beberapa kali untuk diperbaiki) menyumbang 80 persen dari persepsi layanan perbaikan yang tidak memadai.

Plot kotak 7
Itu plot kotak, atau plot kotak-dan-kumis, adalah teknik lain yang sering digunakan dalam analisis data eksplorasi. 8 Plot kotak
mengurangi detail tampilan batang dan daun dan memberikan gambar visual yang berbeda dari lokasi distribusi, penyebaran, bentuk,
panjang ekor, dan pencilan. Boxplots adalah perpanjangan dari
ringkasan lima angka dari sebuah distribusi. Ringkasan ini terdiri dari median, kuartil atas dan bawah, serta observasi terbesar dan
terkecil. Median dan kuartil digunakan karena keduanya digunakan secara khusus statistik tahan. Resistensi adalah karakteristik yang
"menyebabkan ketidakpekaan terhadap perilaku buruk yang dilokalkan dalam data". 9 Statistik resisten tidak terpengaruh oleh pencilan
dan hanya berubah sedikit sebagai respons terhadap penggantian sebagian kecil kumpulan data.

Ingat pembahasan tentang mean dan deviasi standar dalam Lampiran 15a. Sekarang asumsikan kita mengambil kumpulan data
[5,6,6,7,7,7,8,8,9] dan menghitung meannya. Rata-rata himpunan adalah 7; deviasi standar 1.22. Jika 9 diganti dengan 90, mean
menjadi 16 dan deviasi standar meningkat menjadi 27,78. Rata-rata sekarang dua kali lebih besar daripada kebanyakan angka dalam
distribusi, dan deviasi standar

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 41155 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
416 > bagian IV Analisis dan Penyajian Data

> Gambar 16-8 Komponen Boxplot

Terkecil Terbesar
nilai yang diamati nilai yang diamati
dalam 1,5 IQR dalam 1,5 IQR
engsel bawah engsel atas
Ekstrim
Di luar Di luar atau jauh
Cambang
nilai nilai di luar
atau outlier Median atau outlier nilai

1.5 IQR IQR 1.5 IQR

Pagar luar Pagar bagian dalam Engsel: Engsel: Pagar bagian dalam Pagar luar
engsel bawah engsel bawah Menurunkan Atas 1,5 IQR plus 3 IQR plus
minus minus kuartil kuartil engsel atas engsel atas
3 IQR 1.5 IQR
50% dari
diamati
nilai adalah
dalam
kotak

lebih dari 22 kali ukuran aslinya. Mengubah hanya satu dari sembilan nilai telah mengganggu lokasi dan
menyebarkan ringkasan ke titik di mana mereka tidak lagi mewakili delapan nilai lainnya. Baik mean dan deviasi
standar dipertimbangkan statistik nonresistant; mereka rentan terhadap efek nilai ekstrim pada ekor distribusi dan
tidak mewakili nilai tipikal dengan baik dalam kondisi asimetri. Deviasi standar sangat bermasalah karena dihitung
dari deviasi kuadrat dari mean. 10 Sebaliknya, median dan kuartil sangat tahan terhadap perubahan. Ketika kami
mengubah 9 menjadi 90, median tetap di 7 dan kuartil bawah dan atas masing-masing tetap di 6 dan 8. Karena
sifat kuartil, hingga 25 persen data dapat dibuat ekstrem tanpa mengganggu median, komposisi persegi panjang
plot, atau kuartil itu sendiri. Karakteristik resistensi ini dimasukkan ke dalam konstruksi plot kotak.

Plot kotak dapat dibuat dengan mudah dengan tangan atau dengan program komputer. Bahan dasar dari plot tersebut adalah:

1. Plot persegi panjang yang mencakup 50 persen dari nilai data.


2. Garis tengah (atau notasi lain) yang menandai median dan melewati lebar kotak.
3. Tepi kotak, disebut engsel.
4. The "kumis" yang membentang dari engsel kanan dan kiri ke nilai terbesar dan terkecil. 11

Nilai-nilai ini dapat ditemukan dalam 1,5 kali rentang interkuartil (IQR) dari salah satu tepi kotak. Komponen ini dan
hubungannya ditunjukkan pada Tampilan 16-8.
Saat Anda memeriksa data, penting untuk memisahkan pencilan yang sah dari kesalahan dalam pengukuran, pengeditan, pengkodean,
dan entri data. Pencilan, poin data yang melebihi 1 1.5 kisaran interkuartil, mencerminkan kasus yang tidak biasa dan merupakan sumber
informasi penting untuk penelitian ini. Mereka ditampilkan atau diberi perlakuan statistik khusus, atau bagian lain dari kumpulan data
terkadang dilindungi dari pengaruhnya. Pencilan yang merupakan kesalahan entri harus diperbaiki atau dihapus selama pengeditan.

Tampilan 16-9 merangkum beberapa perbandingan yang membantu analis. Plot kotak adalah alat diagnostik yang sangat baik,
terutama jika dibuat grafik pada skala yang sama. Dua plot atas di pameran keduanya simetris, tetapi yang satu lebih besar dari yang lain.
Lebar kotak yang lebih besar terkadang digunakan jika variabel kedua, dari skala pengukuran yang sama, berasal dari ukuran sampel
yang lebih besar. Lebar kotak harus proporsional dengan akar kuadrat ukuran sampel, tetapi tidak semua program pembuatan plot
memperhitungkannya. 12 Distribusi kemiringan kanan dan kiri serta dengan penyebaran yang berkurang juga disajikan dengan jelas dalam
perbandingan plot. Akhirnya, kelompok dapat dibandingkan dengan menggunakan beberapa plot. Satu

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 41166 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
> Bab 16 Menjelajahi, Menampilkan, dan Meneliti Data 417

> Gambar 16-9 Diagnostik dengan Boxplots

Simetris

Simetris-
ukuran relatif lebih besar dalam
proporsi dengan ukuran sampel

Benar miring

Kiri miring

Olesan kecil

Mencetak di median untuk menguji


kesetaraan median populasi

variasi, di mana takik di median menandai interval kepercayaan untuk menguji kesetaraan median grup, membawa kita
selangkah lebih dekat ke pengujian hipotesis. 13 Di sini, sisi-sisi kotak kembali ke lebar penuh pada interval kepercayaan atas dan
bawah. Jika intervalnya tidak tumpang tindih, kita dapat yakin, pada tingkat kepercayaan tertentu, bahwa median dari kedua
populasi berbeda.
Dalam Tampilan 16-10, beberapa diagram kotak membandingkan lima sektor pelanggan PrimeSell dengan data pembelian tahunan rata-rata
mereka. Kesan keseluruhan adalah salah satu masalah potensial bagi analis: tidak setara

> Gambar 16-10 Perbandingan Boxplot Sektor Pelanggan

2.500

2.000

1.500

1.000

500
Keuntungan bersih ($, jutaan)

- 500

Keuangan Kesehatan Teknologi tinggi Pertanggungan Ritel

Sektor

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 41177 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
418 > bagian IV Analisis dan Penyajian Data

varians, kemiringan, dan pencilan ekstrim. Perhatikan kesamaan profil keuangan dan ritel yang kontras dengan sektor teknologi tinggi
dan asuransi. Jika uji hipotesis direncanakan, pemeriksaan lebih lanjut pada plot ini untuk setiap sektor akan membutuhkan tampilan
batang dan daun dan ringkasan lima angka. Dari sini, kita dapat membuat keputusan tentang jenis tes yang akan dipilih untuk analisis
konfirmatori (lihat Bab 17,
18, dan Pusat Pembelajaran Online melengkapi Analisis Multivariat, Ikhtisar).

Pemetaan
Semakin banyak data peserta yang dilampirkan ke dimensi geografis mereka karena perangkat lunak Sistem Informasi Geografis (GIS)
dan alat pengukur koordinat menjadi lebih terjangkau dan lebih mudah digunakan. Pada dasarnya, SIG bekerja dengan
menghubungkan kumpulan data satu sama lain dengan setidaknya satu bidang data umum (misalnya, alamat jalan rumah tangga). GIS
memungkinkan peneliti menghubungkan variabel target dan klasifikasi dari survei ke database berbasis geografis tertentu seperti data
Sensus AS, untuk mengembangkan pemahaman yang lebih kaya tentang sikap dan perilaku sampel. Ketika data identifikasi frekuensi
radio (RFID) menjadi lebih umum, banyak data perilaku akan dapat terhubung dengan database baru yang kaya secara geografis ini.

Cara paling umum untuk menampilkan data tersebut adalah dengan peta. Warna dan pola yang menunjukkan pengetahuan, sikap, perilaku, atau
susunan data demografis ditumpangkan di atas peta jalan (GIS tingkat terbaik), peta kelompok blok, atau peta wilayah, negara bagian, atau negara
untuk membantu mengidentifikasi lokasi terbaik untuk penyimpanan berdasarkan demografis , psikografis, dan data segmentasi tahap-kehidupan. Toko
bunga menyusun informasi tanggapan promosi secara geografis dan menggunakan peta untuk merencanakan promosi yang ditargetkan. Peneliti
konsumen dan bisnis-bisnis menggunakan pemetaan data tentang kepemilikan, tingkat penggunaan, dan sensitivitas harga dalam merencanakan
peluncuran geografis produk baru. Meskipun ini merupakan pilihan yang menarik untuk analisis eksplorasi, diperlukan perangkat lunak dan perangkat
keras khusus, serta keahlian untuk mengoperasikannya. Siswa didorong untuk mengambil

Terkadang tidak ada cara yang lebih baik untuk menampilkan data selain dengan peta. Sementara pada tahun 2009, penyitaan rumah di Amerika Serikat mencapai titik tertinggi
sepanjang masa, pada tahun 2012 beberapa pasar mulai pulih. Sekilas, saat data geospasial dipetakan, Anda dapat mengetahui status mana yang mengalami rebound. Peta
dari RealtyTrac ini menunjukkan daftar penyitaan rumah, menurut negara bagian untuk Mei 2012.

www.realtytrac.com/trendcenter

c coo 2 211550077_c
Hai
Hai _ ch
h 1166__ 4 004-
4 4-4227.7 . saya
n dddddi4 4 1188 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
> Bab 16 Menjelajahi, Menampilkan, dan Meneliti Data 419

> jepret tembakan


Penduduk Asli Digital Mengalihkan Perhatian Hampir Dua Kali Sebanyak
Rekan Imigran Digital Mereka

Sebuah studi yang dilakukan oleh Time Warner's Time Inc. dan dilakukan oleh waktu. Sistem menyediakan pengukuran keterlibatan emosional yang dapat diukur.

Boston's Innerscope Research memberikan dukungan tambahan bahwa kita Studi ini dirancang untuk memahami peran media dalam kehidupan nyata dan

berbeda dari generasi sebelumnya, terutama dalam hal konsumsi media — secara nyata. Digital native memiliki rentang perhatian yang jauh lebih pendek,

waktu yang dihabiskan dengan media, perhatian yang diberikan pada pesan mengalihkan fokus mereka rata-rata 27 kali per jam, sementara imigran digital

media, dan lintas platform media , serta konsekuensi emosional dari pola beralih hanya 17 kali per jam.

perilaku ini.
“Temuan studi ini berarti bahwa standar [kreatif] ditetapkan lebih tinggi untuk

Tiga puluh subjek, setengah di antaranya adalah digital natives (tumbuh pengiklan,” kata CEO Innerscope Research Dr. Carl Marci. “Saya paling khawatir

dengan media digital) dan setengahnya adalah imigran digital (yang beralih ke tentang tindakan menantang dalam menangkap perhatian dan respons emosional

digital di masa dewasa tetapi tumbuh dengan media tradisional), dipantau saat dari target audiens saya, karena ini hampir seperti beralih dari menembak ikan

mereka berinteraksi dengan media sepanjang hari mereka. —Yang setara dalam tong ke [menembak] ikan kecil kecil. Target menjadi lebih cepat, dan jendela

dengan total 300 jam data waktu nyata. Setiap orang memakai kacamata dengan peluang untuk menangkap mereka menjadi lebih kecil. ”

kamera tertanam untuk memantau platform media apa (TV, komputer, tablet,
ponsel pintar) yang dia gunakan dan konten saat itu. Sistem Pemantauan Jenis studi apa yang dilakukan di sini? Masalah desain apa yang dibahas
Biometrik Innerscope memantau respons sistem saraf otonom dengan sabuk dalam penelitian ini? Konsep dan konstruksi apa yang mungkin diukur?
non-invasif yang dikenakan di sekitar tulang rusuk bagian bawah peserta selama
tidak bekerja www.timewarner.com; www.innerscope.com

Sepanjang bagian ini kami telah mengeksploitasi teknik visual analisis data eksplorasi untuk melihat lebih dari sekadar
ringkasan numerik dan mendapatkan wawasan tentang pola data. Beberapa pendekatan telah menekankan perlunya matematika
tingkat lanjut, dan semuanya memiliki daya tarik intuitif bagi analis. Ketika cara yang lebih umum untuk meringkas lokasi,
penyebaran, dan bentuk memberikan gambaran yang tidak memadai tentang data, kami telah menggunakan statistik yang lebih
tahan untuk melindungi kami dari efek skor ekstrem dan kesalahan sesekali. Kami juga menekankan nilai transformasi skala asli
data selama analisis pendahuluan daripada pada titik pengujian hipotesis.

> Tabulasi Silang


Bergantung pada pertanyaan manajemen, kita dapat memperoleh wawasan berharga dengan memeriksa data dengan tabulasi
silang. Tabulasi silang adalah teknik untuk membandingkan data dari dua atau lebih variabel kategori seperti jenis kelamin dan
pemilihan oleh perusahaan untuk penugasan di luar negeri. Tabulasi silang digunakan dengan variabel demografis dan variabel target
penelitian (pertanyaan pengukuran yang dioperasionalkan). Teknik ini menggunakan tabel yang memiliki baris dan kolom yang sesuai
dengan level atau nilai kode dari setiap kategori variabel. Tampilan 16-11 adalah contoh tabulasi silang yang dihasilkan komputer.
Tabel ini memiliki dua baris untuk jenis kelamin dan dua kolom untuk pemilihan tugas. Kombinasi variabel dengan nilainya
menghasilkan empat sel. Setiap sel berisi hitungan kasus klasifikasi gabungan dan juga baris, kolom, dan persentase total. Jumlah sel
baris dan sel kolom sering digunakan untuk menunjukkan ukuran tabel, seperti pada 2 ini 3 2 meja. Sel-sel tersebut diidentifikasi
secara individual dengan nomor baris dan kolomnya, seperti yang diilustrasikan. Total baris dan kolom, disebut marginal, muncul di
"margin" bawah dan kanan tabel. Mereka memperlihatkan jumlah dan persentase dari baris dan kolom yang terpisah.

Tabulasi silang adalah langkah pertama untuk mengidentifikasi hubungan antar variabel. Ketika tabel dibuat untuk pengujian
statistik, kami memanggilnya tabel kontingensi, dan pengujian menentukan apakah

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 41199 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
420 > bagian IV Analisis dan Penyajian Data

> Gambar 16-11 Tabulasi Silang SPSS Gender berdasarkan Peluang Penugasan di Luar Negeri

PENUGASAN LUAR NEGERI

Menghitung
Sel
Baris Pct Iya Tidak
kandungan
Col Pct Baris
Tot Pct 1 2 Total

JENIS KELAMIN 22 40 62
Pria 1 35.5 64.5 62.0
78.6 55.6
22.0 40.0

6 32 38
Marginal
Perempuan 2 15.8 84.2 38.0
21.4 44.4
Sel 2, 1 6.0 32.0
(baris 2, kolom 1)

Kolom 28 72 100
Total 28.0 72.0 100.0

variabel klasifikasi tidak bergantung satu sama lain (lihat chi-square di Bab 17). Tentu saja, tabel mungkin lebih besar dari 2 3 2.

Penggunaan Persentase
Persentase memiliki dua tujuan dalam penyajian data. Pertama, mereka menyederhanakan data dengan mengurangi semua angka menjadi rentang dari
0 hingga 100. Kedua, mereka menerjemahkan data ke dalam bentuk standar, dengan basis 100, untuk perbandingan relatif. Dalam situasi pengambilan
sampel, jumlah kasus yang termasuk dalam kategori tidak ada artinya kecuali jika dikaitkan dengan suatu basis. Sebanyak 28 penerima tugas luar negeri
tidak banyak artinya kecuali kita tahu itu dari sampel 100. Dengan menggunakan yang terakhir sebagai dasar, kita menyimpulkan bahwa 28 persen dari
sampel studi ini memiliki tugas ke luar negeri.

Meskipun penjelasan di atas bermanfaat, bahkan lebih berguna lagi ketika masalah penelitian membutuhkan perbandingan beberapa
distribusi data. Asumsikan data yang dilaporkan sebelumnya dikumpulkan lima tahun lalu dan penelitian ini memiliki sampel 1.500, di
mana 360 dipilih untuk tugas luar negeri. Dengan menggunakan persentase, kita dapat melihat hubungan dan pergeseran relatif dalam
data (lihat Gambar 16-12).

> Gambar 16-12 Perbandingan Persentase dalam Studi Tabulasi Silang oleh
Tugas Luar Negeri

Pelajaran 1 Pelajaran 2

PENUGASAN LUAR NEGERI PENUGASAN LUAR NEGERI

Menghitung Menghitung

Baris Pct Iya Tidak Baris Pct Iya Tidak

Col Pct Baris Col Pct Baris


Tot Pct 1 2 Total Tot Pct 1 2 Total

JENIS KELAMIN 22 40 62 JENIS KELAMIN 225 675 900


Pria 1 35.5 64.5 62.0 Pria 1 25.0 75.0 60.0
78.6 55.6 62.5 59.2
22.0 40.0 15.0 45.0

6 32 38 135 465 600


Perempuan 2 15.8 84.2 38.0 Perempuan 2 22.5 77.5 40.0
21.4 44.4 37.5 40.8
6.0 32.0 9.0 31.0

Kolom 28 72 100 Kolom 360 1140 1500


Total 28.0 72.0 100.0 Total 24.0 76.0 100.0

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 42200 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
> Bab 16 Menjelajahi, Menampilkan, dan Meneliti Data 421

> jepret tembakan


Memberdayakan Excel

Saat mengembangkan tampilan data, beberapa analis riset tidak beralih ke paket membuat tampilan, seperti Matriks GE yang ditampilkan di sini. Pengguna dapat

perangkat lunak statistik tugas berat seperti SPSS atau SAS, tetapi ke spreadsheet di mempraktikkan teknik pada data sampel dari perusahaan nyata atau memasukkan

desktop mereka. Dua profesor yang giat dari Pennsylvania State University, Gary L. datanya sendiri.

Lilien dan Arvind Rangaswamy, telah bekerja sama untuk mengembangkan plugin Plug-in saat ini memfasilitasi tampilan untuk peramalan, analisis konjoin,
Microsoft Excel yang memberdayakan spreadsheet untuk membuat beberapa tampilan analisis pilihan pelanggan, analisis nilai umur pelanggan, perencanaan Matriks
yang umumnya diinginkan hanya dengan beberapa klik mouse. “Dengan produk Portofolio GE, analisis pemosisian, analisis alokasi sumber daya, desain produk
perangkat lunak ini, pengguna akan dapat menggunakan kekuatan analitik kelas dunia dan layanan baru, dan analisis segmentasi / penargetan — semua analisis umum
dari dalam Excel, sebuah antarmuka yang mereka sudah nyaman,” klaim situs web latihan untuk manajer yang terlibat dalam teknik pemasaran. Berkat Lilien dan
mereka. Rangaswamy, beberapa teknik tampilan yang canggih telah disederhanakan
secara signifikan.
Setiap plugin menawarkan templat unik untuk entri data di mana arah
grafik disematkan
tered, serangkaian panduan jendela t

Dengan tabel dua dimensi, pemilihan baris atau kolom akan menonjolkan distribusi atau perbandingan tertentu. Ini
menimbulkan pertanyaan tentang ke arah mana persentase harus dihitung. Sebagian besar program komputer menawarkan opsi
untuk menyajikan persentase di kedua arah dan menukar baris dan kolom tabel. Tetapi dalam situasi di mana satu variabel
dihipotesiskan sebagai penyebab yang diduga, dianggap mempengaruhi atau memprediksi respons, atau hanya anteseden
variabel lain, kami menamakannya variabel independen. Persentase kemudian harus dihitung ke arah variabel ini. Jadi, jika
variabel independen ditempatkan di baris, pilih persentase baris; jika ada di kolom, pilih persentase kolom. Ke arah mana
persentase berjalan di contoh sebelumnya? Jika hanya persentase kolom yang dilaporkan, kami menyiratkan bahwa status tugas
memiliki beberapa pengaruh pada jenis kelamin. Ini tidak masuk akal. Ketika persentase dilaporkan per baris, implikasinya
adalah bahwa gender memengaruhi pemilihan untuk tugas di luar negeri.

Perhatian harus diberikan dalam menafsirkan persentase dari tabel. Perhatikan kembali data pada Tampilan 16-12. Dari studi
pertama hingga studi kedua, terlihat bahwa persentase perempuan yang dipilih

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 42211 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
422 > bagian IV Analisis dan Penyajian Data

> jepret tembakan


Peneliti Era Internet: Membangun Keterampilan Penting yang Dapat Dipindahtangankan

Berdasarkan Waktu New York kolumnis Steve Lohr, dalam ahli statistik era digital ahli statistik beroperasi sebagai "ilmuwan jembatan" yang terlibat dalam pencarian untuk

"mengubah citra profesi sebagai tempat bagi para kutu buku nomor gila. Mereka menemukan pola yang berarti dalam informasi sementara mereka memajukan peluang bisnis dan

mendapati diri mereka semakin diminati — dan bahkan keren. ” Lohr menegaskan mengidentifikasi risiko.

bahwa peningkatan pesat para ahli statistik, yang dapat memperoleh $ 125.000 di tahun Jadi, kemana perginya para "kutu buku nomor" yang modis? Bahkan
pertama mereka setelah mendapatkan gelar doktor, adalah hasil dari ledakan data dalam ekonomi yang buruk, Wall Street, keuangan, farmasi, asuransi,
digital baru-baru ini. Dengan data berbasis web yang berkembang pesat, hingga lima laboratorium penelitian, dan pemerintah sedang merekrut. Banyak dari
kali lipat pada tahun 2012, ada banyak sekali peluang untuk eksplorasi dan pemecahan mereka yang dipekerjakan adalah bagian dari akuisisi multi-miliar dolar.
masalah. Sejalan dengan pasar yang berkembang untuk perangkat lunak "intelijen
bisnis", SPSS menawarkan perangkat lunak dan alat data yang dirancang
Kepala ekonom Google, Hal Varian, menjelaskan pentingnya data Internet yang gratis untuk membantu banyak perusahaan memahami konsumen mereka. SPSS
dan ada di mana-mana dengan cara ini: “Kemampuan untuk mengambil data — untuk dapat diakuisisi oleh IBM sebesar $ 1,2 miliar. IBM juga menawarkan hampir $ 5
memahaminya, memprosesnya, mengekstrak nilai darinya, memvisualisasikannya, miliar untuk pembelian Cognos. Selain itu, Oracle membeli Hyperion
mengkomunikasikannya itu — itu akan menjadi keterampilan yang sangat penting dalam Solutions sekitar $ 3,3 miliar, sementara SAP membeli Business Objects
beberapa dekade mendatang. . . . ” seharga $ 4,8 miliar. Dan Microsoft membeli Farecast.com seharga $ 115 juta
untuk mendukung usaha barunya, Bing Travel,
Sementara para ahli statistik memiliki permintaan tinggi, Varian menekankan perlunya

manajer memahami data itu sendiri. Di organisasi lama, Anda memiliki "sekumpulan orang

yang mencerna data dan memberikannya kepada pembuat keputusan di puncak". Saat ini,

sangatlah penting bahwa orang dapat mengakses, memahami, dan mengkomunikasikan Jadi, selami analisis data dan pelajari sebanyak yang Anda bisa. Ini adalah keterampilan

wawasan dari analisis data yang memengaruhi keputusan sehari-hari. Menggunakan model yang banyak diminati.

statistik, analisis multivariat, dan penggalian data, era Internet


www.google.com; www.SAP.com; www.spss.com

untuk tugas luar negeri naik dari 15,8 menjadi 22,5 persen dari sampelnya masing-masing. Hal ini jangan disamakan dengan persentase dalam
setiap sampel yang merupakan perempuan dengan penugasan ke luar negeri, yang jumlahnya meningkat dari 6 persen (Studi 1) menjadi 9
persen (Studi 2). Di antara semua peserta luar negeri, dalam studi pertama 21,4 persen adalah perempuan, sedangkan pada studi kedua, 37,5
persen adalah perempuan. Perbandingan serupa dapat dilakukan untuk kategori lain. Tabel tersebut memverifikasi peningkatan wanita dengan
tugas di luar negeri, tetapi kami tidak dapat menyimpulkan bahwa jenis kelamin mereka ada hubungannya dengan peningkatan tersebut.

Persentase digunakan oleh hampir semua orang yang berurusan dengan angka — tetapi sering kali salah. Panduan berikut, jika digunakan
selama analisis, akan membantu mencegah kesalahan dalam pelaporan: 14

• Persentase rata-rata. Persentase tidak dapat dirata-ratakan kecuali masing-masing ditimbang oleh ukuran grup tempat persentase
itu diturunkan. Jadi, rata-rata sederhana saja tidak cukup; perlu menggunakan rata-rata tertimbang.

• Penggunaan persentase terlalu besar. Ini sering kali mengalahkan tujuan persentase — yaitu untuk menyederhanakan. Sebagian
besar sulit untuk dipahami dan membingungkan. Jika terjadi peningkatan 1.000 persen, lebih baik menggambarkannya sebagai
peningkatan 10 kali lipat.

• Menggunakan alas yang terlalu kecil. Persentase menyembunyikan basis dari mana mereka telah dihitung. Angka 60 persen bila
dibandingkan dengan 30 persen akan menunjukkan perbedaan yang cukup besar. Namun jika hanya ada tiga kasus di satu
kategori dan enam kasus di kategori lainnya, perbedaannya tidak akan sepenting seperti yang semula dibuat dengan
persentase.

• Persentase penurunan tidak pernah bisa melebihi 100 persen. Ini jelas, tetapi jenis kesalahan ini sering terjadi. Angka
yang lebih tinggi harus selalu digunakan sebagai alas atau penyebut. Misalnya, jika harga diturunkan dari $ 1 menjadi $
0,25, penurunannya menjadi 75 persen (75/100).

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 42222 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
> Bab 16 Menjelajahi, Menampilkan, dan Meneliti Data 423

> Gambar 16-13 Tabulasi Silang SPSS dengan Variabel Kontrol dan Nested

Variabel Kontrol

Kategori 1 Kategori 2

Variabel Bersarang Variabel Bersarang


kucing 1 kucing 2 kucing 3 kucing 1 kucing 2 kucing 3

Stub ... Sel ...

KARYAWAN SEKS

MALES Wanita

MINORITAS MINORITAS
KLASIFIKASI KLASIFIKASI

PUTIH NONWHITE PUTIH NONWHITE

KATEGORI KETENAGAKERJAAN

CLERICAL 16% 7% 18% 7%


OFFICE TRAINEE 7% 3% 17% 2%
PETUGAS KEAMANAN 3% 3%
COLLEGE TRAINEE 7% 0% 1%
KECUALI KARYAWAN 6% 0% 0%
MBA TRAINEE 1% 0% 0%
TEKNIS 1%

Analisis Berbasis Tabel Lainnya


Pengakuan hubungan yang bermakna antara variabel umumnya menandakan kebutuhan untuk penyelidikan lebih lanjut. Bahkan jika
seseorang menemukan hubungan yang signifikan secara statistik, pertanyaan tentang mengapa dan dalam kondisi apa tetap ada. Pengenalan
sebuah variabel kontrol untuk menafsirkan hubungan seringkali diperlukan. Tabel lintas tabulasi berfungsi sebagai kerangka kerja.

Paket statistik seperti Minitab, SAS, dan SPSS memiliki banyak pilihan di antara modul mereka untuk pembuatan n- tabel
cara dengan ketentuan untuk beberapa variabel kontrol. Misalkan Anda tertarik untuk membuat tabulasi silang dari dua variabel
dengan satu kontrol. Berapa pun jumlah nilai dalam variabel primer, variabel kontrol dengan lima nilai menentukan jumlah tabel.
Untuk beberapa aplikasi, sebaiknya memiliki lima tabel terpisah; untuk orang lain, mungkin lebih baik memiliki tabel yang
berdampingan atau memiliki nilai semua variabel dalam satu. Laporan manajemen adalah jenis yang terakhir. Tampilan 16-13
menyajikan contoh di mana ketiga variabel ditangani di bawah spanduk yang sama. Program seperti ini dapat menangani tabel
dan informasi statistik yang jauh lebih kompleks. 15

Variasi lanjutan pada n- tabel cara deteksi interaksi otomatis (AID). AID adalah proses statistik terkomputerisasi yang
mengharuskan peneliti mengidentifikasi variabel dependen dan seperangkat prediktor atau variabel independen. Komputer
kemudian mencari di antara hingga 300 variabel untuk satu divisi terbaik dari data menurut masing-masing variabel prediktor,
memilih satu, dan memisahkan sampel menggunakan uji statistik untuk memverifikasi kesesuaian pilihan ini.

Gambar 16-14 menunjukkan diagram pohon yang dihasilkan dari studi AID tentang kepuasan pelanggan dengan layanan
perbaikan Perawatan Lengkap MindWriter's. Variabel dependen awal adalah kesan keseluruhan dari layanan perbaikan. Variabel ini
diukur pada skala interval 1 sampai 5. Variabel yang berkontribusi pada persepsi efektivitas perbaikan juga diukur pada skala yang
sama tetapi diskalakan kembali ke data ordinal untuk contoh ini (1–2 5 malang, 3 5 rata-rata, dan 4–5 5 luar biasa). Kotak atas
menunjukkan bahwa 62 persen responden menilai jasa reparasi sangat baik (41% 1 21%). Prediktor terbaik untuk efektivitas
perbaikan adalah "penyelesaian masalah".

Di sisi kiri pohon, pelanggan yang menilai "penyelesaian masalah" sebagai buruk memiliki lebih sedikit harapan yang terpenuhi atau
terlampaui daripada rata-rata untuk sampel (6 persen versus 62 persen). A miskin

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 42233 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE
424 > bagian IV Analisis dan Penyajian Data

> Gambar 16-14 Contoh Deteksi Interaksi Otomatis (Kepuasan Perbaikan MindWriter)

Keseluruhan Tayangan Perawatan Lengkap


(Harapan = skala angka)

1. 7% Bertemu sedikit Atribut Skala Ulang


2. 14% Bertemu beberapa Peringkat

3. 17% Bertemu paling banyak 1–2 Buruk


4. 41% Bertemu semua 3 Rata-rata
5. 21% Terlampaui 4–5 Luar biasa

n = 475

Resolusi masalah

E xcceellleenntt
Miskin Rata-rata Ex
44% Bertemu sedikit 8% Bertemu sedikit 0% Bertemu sedikit

35% Bertemu beberapa orang 42% Bertemu beberapa 2% Bertemu beberapa

15% Bertemu paling banyak 40% Bertemu paling banyak 10% Bertemu paling banyak

6% Bertemu semua 8% Bertemu semua 57% Bertemu semua

0% Terlampaui 2% Terlampaui 31% Terlampaui


n = 54 n = 102 n = 319

Kondisi saat kedatangan Kompetensi teknis perwakilan layanan Kecepatan perbaikan

Miskin Rata-rata / Luar Biasa Miskin Rata-rata / Luar Biasa Buruk / Rata-rata Luar biasa

63% Bertemu sedikit 27% Bertemu sedikit 15% Bertemu sedikit 2% Bertemu sedikit 0% Bertemu sedikit 0% Bertemu sedikit

26% Bertemu beberapa orang 42% Bertemu beberapa 53% Bertemu beberapa orang 34% Bertemu beberapa 5% Bertemu beberapa 1% Bertemu beberapa

9% Bertemu paling banyak 21% Bertemu paling banyak 28% Bertemu paling banyak 49% Bertemu paling banyak 20% Bertemu paling banyak 8% Bertemu paling banyak

2% Bertemu semua 10% Bertemu semua 4% Bertemu semua 11% Bertemu semua 69% Bertemu semua 55% Bertemu semua

0% Terlampaui 0% Terlampaui 0% Terlampaui 4% Terlampaui 6% Terlampaui 36% Terlampaui


n = 25 n = 29 n = 45 n = 57 n = 48 n = 271

Peringkat pada "kondisi saat kedatangan" memperburuk hal ini, mengurangi total kelompok yang puas menjadi 2 persen. Dari contoh ini, Anda dapat
melihat bahwa peneliti mempelajari secara terpisah (menerapkan AID ke) setiap subkelompok untuk menemukan variabel yang jika dipisahkan lagi
akan memberikan kontribusi terbesar berikutnya untuk memahami proses evaluasi konsumen — dan untuk pengurangan variasi yang tidak dapat
dijelaskan di setiap sub-sampel. Analisis ini mengingatkan para pembuat keputusan di MindWriter tentang skenario kasus terbaik dan terburuk untuk
layanan CompleteCare, cara memulihkan selama bulan bermasalah, dan "pendorong utama", atau variabel independen mana yang memengaruhi
proses, yang harus menerima sumber daya korektif.

> ringkasan

1 Analisis data eksplorasi (EDA) memberikan perspektif dan seperangkat alat digunakan dengan variabel kontinu di mana interval mengelompokkan tanggapan.

untuk mencari petunjuk dan pola dalam data. EDA menambah daripada Diagram Pareto adalah diagram batang yang persentasenya berjumlah 100 persen.

menggantikan statistik tradisional. Selain ringkasan numerik dari lokasi, Penyebab masalah yang sedang diselidiki diurutkan menurut kepentingan yang

penyebaran, dan bentuk, EDA menggunakan tampilan visual untuk menurun, dengan ketinggian batang menurun dari kiri ke kanan. Tampilan

memberikan kesan yang lengkap dan akurat tentang distribusi dan hubungan batang-dan-daun dan plot kotak adalah teknik EDA yang memberikan representasi

variabel. visual dari distribusi. Yang pertama menyajikan nilai data aktual menggunakan

perangkat tipe histogram yang memungkinkan pemeriksaan penyebaran dan bentuk.

Tabel frekuensi menyusun data dari nilai terendah hingga tertinggi dengan Plot kotak menggunakan ringkasan lima angka untuk menyampaikan gambaran rinci

jumlah dan persentase. Mereka paling berguna untuk memeriksa rentang tentang badan utama, ekor, dan pencilan distribusi. Tampilan batang dan daun serta

respons dan kemunculannya yang berulang. Diagram batang dan diagram plot kotak mengandalkan statistik tahan untuk mengatasi

lingkaran cocok untuk perbandingan relatif data nominal. Histogram secara


optimal

ooo2211550077__cchh1166__440044--442277..iinndDDd
cco 4 42244 233 //01
0 1 //13
13 9 9 ::31
3 1 Hal M
SORE

Anda mungkin juga menyukai