Anda di halaman 1dari 4

DATA DAN DATA SET

Data adalah fakta dan angka yang dikumpulkan, dianalisis, dan dirangkum untuk
disajikan dan diinterpretasikan. Semua data yang dikumpulkan dalam studi tertentu
disebut sebagai himpunan data untuk penelitian ini.

Elemen, Variabel, dan Pengamatan


Elemen adalah entitas tempat pengumpulan data. Setiap perusahaan yang terdaftar
di Table 1.1 adalah elemen dengan nama perusahaan tercantum pada kolom 1. Dengan 5
perusahaan , berarti data set berisi 5 elemen.
Variabel adalah karakteristik yang menarik untuk elemen. Data set pada Tabel 1.1
meliputi 3 variabel, yaitu: Bursa Efek, penjualan per tahun dan earnings per share.
Bursa efek menyatakan dimana perusahaan tersebut terdaftar, AMEX jika perusahaan
terdaftar di American Stock Exchange, NYSE jika perusahaan terdaftar di New York Stock
Exchange. Penjualan per tahun adalah besarnya penjualan per tahun yang dinyatakan
dalam juta dolar. Earning Per Share adalah laba bersih per saham yang dihitung dengan
rumus laba bersih perusahaan dibagi dengan jumlah seluruh saham yang beredar.
Sekumpulan pengukuran yang diperoleh dari elemen tertentu disebut pengamatan
(observasi).
Satu set data dengan n elemen berisi n pengamatan (observasi). Berdasarkan Tabel 1.1
pengukuran untuk pengamatan pertama (Dataram) adalah: AMEX, 73.10, 0.86.
Pengukuran untuk pengamatan kedua (EnergySouth) adalah: AMEX, 74.00, 1.67, dan
seterusnya. Tabel 1.1 adalah data dengan 5 elemen yang teriri dari 5 pengamatan.
Jumlah total nilai data dalam satu set data lengkap adalah jumlah elemen dikalikan
dengan jumlah variabel. Sehingga dari Tabel satu kita peroleh 15 nilai data (5 elemen x 3
variabel).
Perusahaan Bursa Efek Penjualan per tahun ($juta) Earnings per share ($)
Dataram AMEX 73.10 0.86
EnergySouth AMEX 74.00 1.67
Keystone NYSE 365.70 0.86
LandCare NYSE 111.40 0.33
Psychemedics AMEX 17.60 0.13
Tabel 1.1 Data Set 5 Perusahaan yang Terdaftar di Bursa Efek

Skala Pengukuran
Skala pengukuran adalah sebuah acuan yang digunakan untuk mengidentifikasi atribut
elemen dalam satuan alat ukur. Dalam pengumpulan data kita membutuhkan salah satu
skala pengukuran berikut: nominal, ordinal, interval, atau rasio. Skala pengukuran akan
menentukan jumlah informasi yang terkandung dalam data. Selain itu skala pengukuran
juga menunjukkan ringkasan data dan analisis statistik yang paling tepat.

Skala nominal
Skala pengukuran nominal adalah skala pengukuran yang digunakan untuk
mengidentifikasi atribut elemen yang terdiri dari label atau nama. Label yang digunakan
dapat berupa nonnumerik atau kode numeric.
Contoh:
Siswa dari sebuah universitas diklasifikasikan berdasarkan Fakultas di mana mereka
terdaftar. Kita dapat menggunakan label nonnumeric untuk membedakan Fakultas
seperti Bisnis, Humaniora, Pendidikan, dan seterusnya. Atau alternative lainnya untuk
membedakan variabel Fakultas dapat digunakan kode numeric, misalnya : 1
menunjukkan Bisnis, 2 menunjukkan Humaniora, 3 menunjukkan Pendidikan, dan
seterusnya).

Skala Ordinal
Skala pengukuran ordinal adalah skala pengukuran yang memiliki sifat-sifat data nominal
dan urutan atau peringkat data bermakna. Label yang digunakan dapat berupa
nonnumerik atau kode numerik.

Contoh
Mahasiswa suatu universitas diklasifikasikan berdasarkan statusnya, menggunakan label
non-numerik seperti mahasiswa baru, mahasiswa tahun kedua, junior atau senior.
Alternatifnya kita dapat menggunakan kode numerik untuk variabel status mahasiswa,
misalnya: 1 menunjukkan mahasiswa baru, 2 menunjukkan mahasiswa tahun kedua , dan
seterusnya.

Skala Interval
Skala pengukuran interval adalah skala pengukuran dimana data memiliki sifat-sifat data
ordinal, dan interval antara nilai-nilai dinyatakan dalam satuan ukuran yang tetap, seta
perbedaan antara interval sangat berarti. Data interval selalu berupa angka.

Contoh
Rini memiliki skor SAT (Scholatic Assessment Test) 1985, Sementara Anto memiliki skor
SAT 1880. Rini memiliki skor 1985 – 1880 = 105 poin lebih tinggi dari Anto.

Skala Rasio
Skala pengukuran rasio adalah skala pengukuran untuk data yang memiliki sifat-sifat
data interval dan rasio dua nilai bermakna. Data rasio selalu berupa angka. Nilai nol
termasuk dalam data. Variabel seperti jarak, tinggi, berat, dan waktu menggunakan skala
pengukuran rasio.

Contoh:
Harga buku di toko ritel adalah $ 200, sedangkan harga buku yang sama yang dijual
secara online adalah $100. Properti rasio menunjukkan bahwa toko ritel mengenakan
harga dua kali lipat harga online.
Data Kategorikal dan Kuantitatif
Data selanjutnya dapat diklasifikasikan sebagai data kategorikal atau data kuantitatif.
Analisis statistik yang sesuai tergantung pada apakah data untuk variabel kategorikal
atau kuantitatif. Secara umum, ada lebih banyak alternatif untuk analisis statistik ketika
data kuantitatif.

Data Kategorikal. Data kategorikal adalah data yang menggunakan label atau nama
untuk mengidentfikasi atribut setiap elemen. Data kategorikal disebut juga sebagai data
kualitatif. Data kualitatif menggunakan skala pengukuran nominal atau ordinal. Dalam
mengidentifikasi Data kualitatif dapat berupa numerik atau non-numerik. Alat analisis
statistik yang sesuai agak terbatas. Kita dapat merangkum data kategori dengan
menghitung jumlah pengamatan di setiap kategori atau dengan menghitung proporsi
pengamatan di setiap kategori. Namun, ketika data kategorikal diidentifikasi dengan
menggunakan kode numerik, operasi aritmatika seperti penjumlahan, pengurangan,
perkalian, dan pembagian tidak memberikan hasil yang berarti.

Data Kuantitatif. Data yang menggunakan nilai numerik untuk menunjukkan berapa
banyak. Data kuantitatif menggunakan skala pengukuran baik interval atau rasio. Operasi
aritmatika biasa sangat berarti untuk data kuantitatif. Sebagai contoh, data kuantitatif
dapat ditambahkan dan kemudian dibagi dengan jumlah pengamatan dan dihitung nilai
rata-rata. Rata-rata ini biasanya bermakna dan mudah ditafsirkan.

Gambar 1.1 Diagram Skala Pengukuran

Data Cross-Sectional. Data Cross-sectional adalah data yang dikumpulkan pada titik
waktu yang sama atau sekitar waktu yang sama. Data yang ditampilkan pada Tabel 1
merupakan data cross section, karena data tersebut terdiri dari 3 variabel dari 5
perusahaan yang dikumpulkan pada waktu yang sama. Contoh lain data cross-section
adalah data yang merinci tingkat inflasi di 34 Provinsi di Indonesia pada Tahun 2018.

Data Time series. Data time series adalah data yang dikumpulkan selama beberapa
periode waktu. Contohnya data yang merinci tingkat inflasi di Indonesia selama 10 tahun
terakhir. Data time series sering disajikan dalam bentuk grafik. Contoh grafik time series
yang menunjukkan tingkat inflasi di Indonesia selama 10 tahun terakhir dapat dilihat
pada Gambar 1.2. Grafik data time series membantu analis untuk memahami apa yang
terjadi di masa lalu, mengidentifikasi tren yang terjadi dari waktu ke waktu, dan
memproyeksikan tingkat masa depan untuk beberapa waktu yang akan datang.

Gambar 1.2 Tingkat Inflasi di Indonesia tahun 2008 – 2018

Anda mungkin juga menyukai