Anda di halaman 1dari 12

MAKALAH STATISTIKA KOMPUTASI

INTRODUCTION & FRAMEWORK


Dari Buku : Introduction to Statistics and Data Analysis
With Exercises, Solutions and Applications in R
- Chritian Heumann & Michael Shalabh -

KELOMPOK I STATISTIKA KOMPUTASI

JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SAM RATULANGI
MANADO
2021
Anggota Kelompok I :
 Flora G. Walelang 18101103005
 Sephram L. Kawulusan 18101103007
 Arsista Tololiu 18101103019
 Amram Binowo 18101103028
 Wanny D. F. Situmorang 18101103062
 Devid R. Pontoan 18101103063
Introduction & Framework
Statistika adalah sebuah koleksi metode yang membantu untuk mendeskripsikan,
menjumlahkan, menginterpretasikan, dan menganalisa data. Menarik kesimpulan dari data
sangat penting dalam penelitian, administrasi, dan bisnis. Semenarik apapun pertanyaannya,
sangat penting untuk mengumpulkan data agar dapat dianalisis. Representasi data yang
dikumpulkan dalam data set atau data matrix memungkinkan penerapan berbagai metode
statistik.

1.1 Populasi, Sampel, dan Observasi


Unit dimana kita mengukur data – seperti orang, mobil, hewan, atau tumbuhan –
disebut Observasi. Unit/Observasi dilambangkan dengan ω (omega). Kumpulan
semua unit disebut Populasi yang dilambangkan dengan Ω (omega) yang dimana
ω ∈ Ω, sebuah unit adalah bagian atau elemen dari populasi. Misalkan terdapat
observasi 𝝎𝟏 , 𝝎𝟐 , . . . , 𝝎𝒏 maka ini akan disebut dengan Sampel. Sampel
merupakan bagian dari populasi {𝜔1 , 𝜔2 , . . . , 𝜔𝑛 } ⊆ 𝛺.
Contoh :
 Kita tertarik untuk meneliti mengenai kondisi sosial di suatu
tempat tinggal warga India, maka kita dapat mendefinisikan
semua penduduk India sebagai suatu Populasi (Ω) dan setiap
penduduknya sebagai unit/observasi (ω). Jika kita
mengumpulkan data dari beberapa penduduk, maka itu akan
mewakili sampel dari total populasi.
 Misalnya kita akan menginvestigasi kekuatan ekonomi sy=uatu
industri platinum Afrika, maka perlakuan setiap perusahaan
yang berhubungan dengan platina adalah unit/observasi (ω),
sedangkan jika semua perusahaan yang berhubungan dengan
platina dikumpulkan maka akan menjadi Populasi (Ω). Untuk
beberapa perusahaan 𝝎𝟏 , 𝝎𝟐 , . . . , 𝝎𝒏 terdiri atas sempel semua
perusahaan;
 Atau mungkin tertarik untuk mengumpulkan informasi tentang
mereka yang berpartisipasi dalam kursus statistik. Semua
peserta kursus merupakan populasi (Ω), dan setiap peserta
mengacu pada unit atau observasi (ω).
Terkadang konsep populasi tidak dapat diterapkan atau sulit untuk dibayangkan.
Sebagai contoh :

Kita akan mengukur suhu di New Delhi setiap jam. Setiap sampel mungkin akan
menjadi suatu deret waktu tertentu, misalnya dari Januari hingga Maret 2016.
Populasi dalam artian unit observasi tidak terdapat pada bagian ini tapi untuk
menanggulanginya, kita dapat megasumsikan bahwa kita mengukur suhu di
beberapa kota yang berbeda kemudian semua kota membentuk populasi dan untuk
sampelnya adalah sembarang subset dari kota.

1.2 Variabel
kita telah menentukan populasi minat untuk pertanyaan penelitian tertentu, kita
dapat memikirkan apa yang menarik tentang pengamatan kita. Sebuah fitur khusus
dari pengamatan ini dapat dikumpulkan dalam variabel statistik X. Setiap informasi
dapat kita tangkap dan dimasukkan ke dalam variabel seperti itu. Sebagain contoh,
jika observasi kita mengacu pada manusia, X dapat menggambarkan status
perkawinan, jenis kelamin, usia, atau apa pun yang mungkin berhubungan dengan
orang tersebut. Tentu saja, kita tertarik pada banyak hal yang berbeda, masing-
masing dikumpulkan dalam variabel yang berbeda 𝑋𝑖 ; 𝑖 = 1,2, … , 𝑝. Setiap
observasi ω mengambil nilai tertentu untuk X. Jika X mengacu pada jenis kelamin,
setiap observasi, yaitu setiap orang, memiliki nilai x tertentu yang merujuk pada
"pria" atau "wanita".

Definisi formal variabel adalah :


𝑋: 𝛺 → 𝑆
𝜔⟼𝑥
Definisi ini menyatakan bahwa suatu variabel X mengambil nilai x untuk setiap
pengamatan ω ϵ Ω , dimana jumlah nilai yang mungkin terkandung dalam
himpunan S.
Contoh :
 Jika X mengacu pada jenis kelamin, kemungkinan nilai x terdapat
dalam S = {laki-laki, perempuan}. Setiap observasi ω adalah laki-laki
atau perempuan, dan informasi ini disingkat dalam X.
 Misalkan X menjadi negara asal sebuah mobil. Nilai-nilai yang
mungkin diambil dengan observasi ω (yaitu mobil) adalah S = {Italia,
Korea Selatan, Jerman, Prancis, India, Cina, Jepang, AMERIKA
SERIKAT,...}.
 Variabel X yang mengacu pada usia dapat mengambil nilai apa pun
antara 1 dan 125. Masing-masing orang ω diberi nilai x yang
mewakili usia orang tersebut.
1.2.1 Variabel Kualitatif & Kuantitatif
1. Variabel kualitatif adalah variabel yang mengambil nilai x yang
tidak dapat diurutkan cara yang logis atau alami. Sebagai contoh :
 Warna mata
 Nama partai politik, dan
 Jenis transportasi yang digunakan bepergian ke tempat kerja
adalah semua variabel kualitatif. Juga tidak ada alasan untuk
mencantumkan mata biru sebelum mata coklat (atau sebaliknya) juga
tidak masuk akal untuk mendaftar bus sebelum kereta (atau
sebaliknya).
2. Variabel kuantitatif mewakili kuantitas yang dapat diukur. Nilai-
nilai variabel yang dapat diambil dapat dipesan dengan cara yang
logis dan alami. Contoh variabel kuantitatif adalah:
 Ukuran cepatu
 Harga rumah
 Jumlah semester yang dipelajari, dan
 Berat seseorang
1.2.2 Variabel Diskrit & Kontinu
1. Variabel diskrit adalah variabel yang hanya dapat mengambil
jumlah nilai yang terbatas. Semua variabel kualitatif bersifat diskrit,
seperti warna mata atau wilayah suatu negara. Tetapi juga variabel
kuantitatif dapat bersifat diskrit: ukuran sepatu atau jumlah semester
yang dipelajari dapat bersifat diskrit karena jumlah nilai yang dapat
diambil variabel ini terbatas
2. Variabel yang dapat mengambil jumlah nilai tak terbatas disebut
variabel kontinu. Contohnya adalah waktu yang dibutuhkan untuk
melakukan perjalanan ke universitas, panjang antelop, dan jarak
antara dua planet. Terkadang, dikatakan bahwa variabel kontinu
adalah variabel yang "diukur daripada dihitung". Poin pentingnya
adalah bahwa variabel kontinu dapat secara teori mengambil jumlah
nilai yang tak terbatas; misalnya, tinggi seseorang dapat dicatat
sebagai 172 cm.
1.2.3 Skala
1. Skala Nominal. Nilai variabel nominal tidak dapat diurutkan.
Contohnya adalah jenis kelamin seseorang (pria – wanita) atau status
lamaran (menunggu – bukan menunggu keputusan).
2. Skala Ordinal. Nilai variabel ordinal dapat diurutkan. Namun,
perbedaan antara nilai-nilai ini tidak dapat ditafsirkan. Misalnya,
kemungkinan nilai tingkat pendidikan (tidak ada - pendidikan dasar -
sekolah menengah – gelar universitas) dapat diurutkan secara
bermakna, namun perbedaannya antara nilai-nilai ini tidak dapat
ditafsirkan.
3. Skala Kontinu. Nilai variabel kontinu dapat diurutkan. Selanjutnya,
perbedaan antara nilai-nilai ini dapat ditafsirkan. Misalnya, tinggi
seseorang mengacu pada variabel kontinu karena nilainya dapat
diurutkan (170 cm, 171 cm, 172 cm, ...), dan perbedaan antara nilai-
nilai ini dapat dibandingkan (perbedaan antara 170 dan 171 cm adalah
sama dengan perbedaan antara 171 dan 172 cm).

Terkadang, Skala kontinu dibagi lebih jauh menjadi subskala. Sementara


di sisa buku kami biasanya tidak membutuhkan klasifikasi ini, klasifikasi
ini tetap menggambarkan skala kontinu :

1. Skala Interval. Hanya perbedaan antara nilai, tapi bukan rasio,


yang bisa ditafsirkan. Contoh untuk skala ini adalah suhu (diukur
dalam C): perbedaan antara −2C dan 4 C adalah 6 C, tetapi rasio 4
/ - 2 = −2 tidak berarti bahwa −4C dua kali lebih dingin dari 2C.
2. Skala Rasio. Keduanya berbeda dan rasio dapat ditafsirkan.
Contohnya adalah kecepatan: 60 km / jam adalah 40 km / jam lebih
dari 20 km / jam. Selain itu, 60 km / jam tiga kali lebih cepat dari
20 km / jam karena rasio di antara keduanya adalah 3.
3. Skala Absolut. Skala absolut sama dengan skala rasio, dengan
pengecualian bahwa nilai diukur dalam unit "alami". Contohnya
adalah "jumlah semester yang dipelajari" di mana tidak ada unit
buatan seperti km / jam atau C yang diperlukan: nilai hanya 1, 2, 3,
....
1.2.4 Kumpulan Data
Jika data tersedia dalam bentuk yang dikelompokkan, kita memanggil
pengambilan variabel masing-masing informasi ini variabel yang
dikelompokkan. Terkadang, variabel ini juga dikenal sebagai variabel
kategori. . Variabel yang dikelompokkan atau dikategorikan hanya dapat
mengambil dua nilai yang disebut variabel biner.
Agar memperoleh pemahaman yang lebih baik mengenai definisi dari
bagian diatas yang berhubungan satu sama lain maka disajikan seperti
pada Gambar 1.1

Gambar 1.1 Ringkasan klasifikasi variabel

Data kualitatif selalu bersifat diskrit, tetapi kuantitatif data dapat berupa
diskrit (misalnya ukuran sepatu atau variabel yang dikelompokkan) dan
kontinu (misalnya suhu). Variabel nominal selalu kualitatif dan diskrit
(misalnya warna mata), sedangkan variabel kontinu selalu kuantitatif
(misalnya suhu). Variabel kategori dapat bersifat kualitatif (misalnya
warna mata) dan kuantitatif (tingkat kepuasan dalam skala dari 1 sampai
5). Variabel kategori tidak pernah kontinu.

1.3 Data Collection/Pengumpulan Data


1. Survei. Survei biasanya (tetapi tidak selalu) mengumpulkan data dengan
mengajukan pertanyaan (secara langsung atau melalui telepon) atau
memberikan kuesioner kepada peserta studi (sebagai hasil cetak atau online).
Misalnya, jajak pendapat sebelum pemilihan nasional memberikan bukti
tentang pemerintahan masa depan: calon pemilih ditanya melalui telepon
partai mana yang akan mereka pilih dalam pemilihan berikutnya; pada hari
pemilihan, informasi ini dapat diperbarui dengan mengajukan pertanyaan yang
sama kepada sampel pemilih yang baru saja menyampaikan suara mereka di
tempat pemungutan suara (yang disebut exit poll).
2. Percobaan. Data eksperimental diperoleh dalam pengaturan "terkontrol". Ini
dapat berarti banyak hal, tetapi pada dasarnya itu adalah data yang dihasilkan
oleh peneliti dengan kontrol penuh atas satu atau banyak variabel yang
menarik. Misalnya, misalkan ada dua pasta gigi yang bersaing, yang keduanya
berjanji untuk mengurangi rasa sakit bagi orang dengan gigi sensitif. Jika
peneliti memutuskan untuk secara acak menetapkan pasta gigi A hingga
setengah dari peserta studi, dan pasta gigi B ke setengah lainnya, maka ini
adalah percobaan karena hanya peneliti yang memutuskan pasta gigi mana
yang akan digunakan oleh salah satu peserta. Hal ini tidak diputuskan oleh
peserta. Data pasta gigi variabel dikendalikan oleh eksperimen.
3. Data Observasional. Data observasional adalah data yang dikumpulkan
secara rutin, tanpa peneliti merancang survei atau melakukan eksperimen.
Misalkan sampel darah diambil dari setiap pasien dengan infeksi akut tertentu
ketika mereka tiba di rumah sakit. Data ini dapat disimpan di folder rumah
sakit dan kemudian diakses oleh peneliti yang tertarik untuk mempelajari
infeksi ini.
4. Data Primer dan Sekunder. Data Primer adalah data yang kami kumpulkan
sendiri, yaitu melalui survei atau eksperimen. Data sekunder, sebaliknya,
dikumpulkan oleh orang lain. Misalnya, data dari sensus nasional, database
yang tersedia untuk umum, studi penelitian sebelumnya, laporan pemerintah,
data historis, dan data dari internet, antara lain data sekunder.
1.4 Membuat Data Set
Ada cara unik di mana data disiapkan dan dikumpulkan untuk memanfaatkan
analisis statistik. Data disimpan dalam matriks data (==data set ) dengan kolom p
dan n baris (lihat Gambar 1.2) Setiap baris sesuai dengan observasi / unit ω dan
setiap kolom untuk variabel X. Artinya, misalnya entri pada baris keempat dan
kolom kedua (x42) menggambarkan nilai observasi keempat pada variabel kedua.
Contoh di bawah ini akan mengilustrasikan konsep kumpulan data secara lebih
rinci.

Gambar 1.2 Kumpulan data atau matriks data

Gambar 1.3 Kumpulan data nilai lima siswa


Contoh Kasus :
Layanan pengiriman pizza menangkap informasi yang terkait dengan setiap
pengiriman, misalnya waktu pengiriman, suhu pizza, nama pengemudi, tanggal
pengiriman, nama cabang, dan banyak lagi. Untuk menangkap data semua
pengiriman selama satu bulan, kami membuat matriks data. Setiap baris mengacu
pada pengiriman tertentu, oleh karena itu mewakili pengamatan data. Setiap kolom
mengacu pada variabel.
Pada Gambar 1.4, variabel X1 (waktu pengiriman dalam menit), X2 (suhu dalam
◦C), dan X12 (nama cabang) terdaftar.
Gambar 1.4 Kumpulan data pizza
Baris pertama memberi tahu kita tentang fitur pengiriman pizza pertama: waktu
pengiriman adalah 35,1 menit, pizza tiba dengan suhu 68,3◦C, dan pizza dikirim
dari cabang di sebelah timur kota. Secara total, ada n = 1266 pengiriman. Untuk
variabel nominal, seperti cabang, kita dapat memutuskan untuk membuat daftar
pengkodean, seperti yang diilustrasikan pada Tabel 1.1 dari pada mengacu pada
cabang sebagai "Timur", "Barat", dan "Pusat", kita dapat menyebutnya 1, 2, dan 3.

Variable Values Code

Branch East 1

West 2

Centre 3

Missing 4

Tabel 1.1 Daftar pengkodean untuk cabang


Jika beberapa nilai hilang, misalnya karena tidak pernah ditangkap atau bahkan
hilang, maka hal ini memerlukan perhatian khusus. Pada Tabel 1.1, kami
menetapkan nilai yang hilang nomor "4" dan karena itu memperlakukannya
sebagai kategori terpisah. Dengan perangkat lunak statistik mungkin memerlukan
pengkodean lain seperti NA.
Pertimbangan lain saat mengumpulkan data adalah transformasi. transformasi yang
valid bergantung pada skala variabel. Variabel pada skala interval dapat
menggunakan transformasi jenis berikut:
𝑔(𝑥) = 𝑎 + 𝑏𝑥, 𝑏 > 0
Untuk skala rasio, hanya transformasi berikut yang valid:
𝑔(𝑥) = 𝑏𝑥, 𝑏 > 0
Dalam persamaan di atas, a dijadikan 0 karena rasio hanya tetap sama jika kita
mengindahkan titik asal variabel alami.

1.4.1 Software Statistika


Ada sejumlah paket perangkat lunak statistik yang memungkinkan
pengumpulan, pengelolaan, dan - yang paling penting - analisis data. Kita
akan fokus pada perangkat lunak statistik R Matriks data dapat dibuat
secara manual menggunakan perintah seperti matrix (), data.frame (), dan
lain-lain. Setiap data dapat diedit menggunakan edit (). Di sebagian besar
aplikasi ini, dimungkinkan untuk menyimpan data sebagai file ASCII
(.dat), sebagai file tab-delimited (.txt), atau sebagai file nilai yang
dipisahkan koma (.csv). Semua format ini memungkinkan peralihan yang
mudah antara perangkat lunak dan aplikasi basis data yang berbeda. Data
tersebut dapat dengan mudah dibaca menjadi R melalui perintah berikut:

di mana setwd menentukan direktori kerja. Alternatifnya, memuat


perpustakaan asing memungkinkan impor data dari banyak paket
perangkat lunak statistik yang berbeda, antara lain Stata, SAS, Minitab,
SPSS.

gambaran umum data secara langsung di R-console dengan hanya


menampilkan baris teratas data dengan head (). Kedua pendekatan
tersebut divisualisasikan pada Gambar 1.5 untuk data pizza yang
diperkenalkan pada Contoh :
Gambar 1.5 Melihat data di R
1.5 Kesimpulan
 Skala variabel bukan hanya formalisme tetapi kerangka esensial untuk
memilih metode analisis yang benar.
 Jika variabel diukur pada skala nominal (yaitu jika mereka kategorikal/
kualitatif), kita dapat memilih untuk memberikan nomor ke setiap kategori
variabel ini
 Data biasanya disimpan dalam matriks data dimana baris mewakili observasi
dan kolom adalah variabel

Anda mungkin juga menyukai