Anda di halaman 1dari 9

Narasi Kuliah 10 (Kuliah Online ke 4)

Pengolahan dan Analisis Data


Penelitian adalah kegiatan untuk menjawab masalah. Untuk menghadirkan jawaban (diskusi
dan kesimpulan), maka data yang merupakan fakta tentang adanya masalah harus diolah
menggunakan satu atau lebih rumus atau algoritma. Pengolahan data dapat dimulai dengan
pembersihan dari kotoran (noise) yang tidak diperlukan, kemudian penggabungan, manipulasi,
perhitungan dan tampilan hasil. Setelah dilakukan pengolahan data, maka hasil tersebut harus
dianalisis untuk mendapatkan gambaran atau kesesuaian dengan tujuan penelitian (Kita akan
bahas di kuliah 12).
Aturan-aturan Statistika digunakan dalam mengolah dan menganalisis data. Aturan yang paling
sering digunakan antara lain:
1. Rata-rata dan simpangan baku (ukuran sentral dan sebaran yang umum digunakan)
2. Median dan modus (ukuran sentral untuk melihat data tangah dan data paling sering
muncul)
3. Korelasi (ukuran untuk mengetahui ada tidaknya hubungan antara data satu dengan
lainnya
4. Regressi (untuk memprediksi hubungan fungsional antara variable bebas dengan variable
tak bebas)
5. Angka (Bilangan) Acak / Random
6. MSE (membandingkan dua kumpulan data)
7. Uji Statistik (uji independensi, uji normal, uji validitas dll)
8. Tampilan Grafik (histogram, grafik batang, garis atau pie)
Dalam kuliah ini kita dilatih untuk menggunakan rumus-rumus Statistika sederhana. Contoh
pengerjaan (menggunakan Excel) soal terkait dengan pengolahan data statistika dijelaskan
dalam slide kuliah sebagai bagian dari narasi kuliah ini.
Di samping itu rumus atau formula yang digunakan harus sesuai dengan masalah dan tujuan
penelitian, Dalam kuliah ini diberikan beberapa contoh rumus yang banyak digunakan dalam
perhitungan matematika atau keamanan data (kriptografi) seperti menghasilkan angka random
yang kuat, perpangkatan besar dan generator modulo)
Berikut penjelasan dari beberapa contoh pengolahan data:
1. Rata-rata (rerata)
Misalkan diperoleh n data pengamatan. Kita ingin menghitung rata-rata data tersebut.
Rata-rata yang umum digunakan adalah rata-rata aritmatika, geometri dan harmonis.
Setiap orang yang telah belajar Statistika dan Excel pasti dengan mudah memahami
persoalan rata-rata. Dengan excel kita cukup menggunakan fungsi Average(Array). Array
adalah kumpulan data yang harus diblok dari awal sampai akhir barisan atau kumpulan
data. Contoh perintah Excel berikut: =AVERAGE(D6:H15) adalah fungsi untuk
menghitung rata-rata data yang diletakkan dalam bentuk table dari D6 sampai dengan
H15. Secara matematis rumus rata-rata dari data 𝑋𝑖 dituliskan dengan
𝑛
1
𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1
𝑛 adalah jumlah data
2. Simpangan baku
Simpangan baku (standar deviasi) merupakan ukuran untuk menjelaskan ketersebaran
data dilihat dari posisi rata-rata. Simpangan baku merupakan akar dari variansi
(keberagaman data) yang dihitung dengan rumus:
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑠= ; 𝑘 = 𝑛 𝑢𝑛𝑡𝑢𝑘 𝑝𝑜𝑝𝑢𝑙𝑎𝑠𝑖 𝑑𝑎𝑛 𝑘 = 𝑛 − 1 𝑢𝑛𝑡𝑢𝑘 𝑠𝑎𝑚𝑝𝑒𝑙
𝑘
Dengan excel kita dapat menggunakan fungsi:
=STDEV(E8:E17) untuk menghitung simpangan baku untuk data yang tedapat pada E8
sampai E17
3. Median atau data tengah adalah data yang berada di tengah dari sekumpulan data hasil
pengamatan. Jika dataya terurut, maka median adalah data yang terletak di posisi
tengah jika n (jumlah data ganjil). Jika jumlah data genap, maka data median adalah
rerata dari dua data paling tengah. Dengan Excel kita cukup menggunakan
=MEDIAN(D6:H15) untuk mendapatkan data tengah dari data yang diletakkan pada cell
D6 sampai dengan cell H15
4. Modus (Mode) adalah data yang paling sering muncul dalam kumpulan data. Kita dapat
menentukan modus jika jenis masing-masing data diketahui frekuensinya. Dengan excel
hal ini dengan mudah diperoleh yakni menggunakan fungsi MODE. Misalnya
=MODE(D6:H15) untuk mencari data yang paling sering muncul pada Array D6 sampai
H15. Jika frekuensi semua jenis data sama, maka nilai modus tidak terdefinisi.
Perhatikan contoh berikut:

5. Korelasi disingkat dengan 𝑟𝑥𝑦 adalah angka (-1 sampai +1) yang menggambarkan ada
tidaknya hubungan ketergantungan antara dua kumpulan data 𝑥 dan 𝑦. Jika nilai 𝑟𝑥𝑦 < 0
itu artinya kedua data mempunyai hubungan negative dalam arti jika 𝑥 naik, maka
𝑦 turun dan sebaliknya. Jika 𝑟𝑥𝑦 > 0, itu artinya hubungan 𝑥 dan 𝑦 adalah lurus (satu
naik yang lain juga naik dan sebaliknya). Jika 𝑟𝑥𝑦 = 0, maka disebut 𝑥 dan 𝑦 tidak punya
hubungan. Besarnya nilai 𝑟 menyatakan seberapa kuat hubungan kedua data
Rumus korelasi 𝑥 dan 𝑦 dinyatakan sbb:

Dengan Excel dapat dihitung menggunakan fungsi:


Contoh:
Diketahui kumpulan data x, y sbb:

Maka:

Dengan hasil = 0.151307 (yang menyatakan hubungan positif tetapi tidak terlalu signifikan)
Cara di atas menggunakan excel secara langsung mengetikkan fungsi default yakni
CORREL(A1, A2 )
Dengan menggunakan rumus di atas, kita juga dapat mendapatkan hasil yang sama
Perhatikan perhitungan Excel berikut:

Kita mendapatkan hasil yang sama yakni 0.151307. Terdapat hubungan positif antara x
dengan y, tetapi hubungan tersebut lemah (di bawah 0.5)
Contoh berikut merupakan hasil pengamatan selama 12 hari yang menghubungkan suhu
udara dengan hasil penjualan es krim:

Dengan menggunakan cara yang sama, kita mendapatkan Tabel Perhitungan sebagai
berikut:
Menghitung korelasi dapat juga menggunakan rumus berikut:

Kita pindahkan data tersebut ke dalam Excel dan memisalkan Suhu sebagai x dan penjualan
Ice Cream sebagai peubah y.
Hasilnya dapat dilihat pada gambar berikut

Kita mendapatkan hasil yang sama. Makna dari nilai r di atas adalah terdapat hubungan
positif antara suhu udara dengan hasil penjualan es krim. Artinya semakin tinggi suhu udara,
maka semakin besar hasil penjualan
6. MSE (Mean Squared Error) adalah ukuran yang biasa digunakan untuk melihat perbedaan
kumpulan data satu dengan data lainnya. Akar dari MSE disebut dengan RMSE (Rooted
MSE). Proses perhitungan MSE dapat dilihat pada contoh berikut:
7. Angka Random. Bilangan acak atau angka random sering digunakan untuk menghasilkan
data sembaran sesuai dengan kebutuhan peneliti. Setiap Bahasa pemrograman atau
aplikasi seperti excel mempunyai perintah atau fungsi untuk menghasilkan angka
random baik bilangan bulat maupun bilangan real. Dalam kriptografi kebutuhan angka
acak begitu nyata dalam menghasilkan kunci acak atau kebutuhan lainnya. Dalam Excel,
misalkan kita mempunyai banyak fungsi yang diperuntukkan menghasilkan bilangan
acak. Misalnya: =RANDBETWEEN(start,end) untuk menghasilkan bilangan acak antara
start sampai end. Kemudian =RAND() untuk menghasilkan bilangan acak yang lebih besar
nol dan lebih kecil dari 1. Kita tidak tahu fungsi apa yang digunakan dalam menghasilkan
bilangan acak tersebut. Dalam kriptografi kita sering menggunakan fungsi Pseudo
Random Number Generator (PRNG) untuk menghasilkan bilangan acak yang memiliki
periode (siklus) yang sangat panjang. Salah satu fungsi generator bilangan acak adalah
LCG (Linear Congruential Generator) yang dihasilkan dengan fungsi recursif
dengan aturan:
𝑋𝑖 = (𝑎𝑋𝑖−1 + 𝑏)𝑚𝑜𝑑 𝑚 ; 𝑖 = 1, 2, … ; 𝑋0 = 𝑖𝑛𝑖𝑡𝑖𝑎𝑙 𝑣𝑎𝑙𝑢𝑒; 𝑎, 𝑏 𝜖𝑍 + ; 𝑚 = 𝑚𝑜𝑑𝑢𝑙𝑢𝑠
Untuk memberikan nilai yang lebih menyebar biasanya digunakan modulo (modulus)
bilangan prima.
Misalkan kita menggunakan contoh berikut:
Untuk memperpanjang periode perulangan dapat dilakukan dengan memperbesar
bilangan p
8. Uji Chi Kuadrat digunakan untuk berbagai keperluan. Salah satu adalah untuk
membandingkan data pengamatan dan ekspektasi. Rumus untuk uji chi kuadrat (𝜒 2 Test)
adalah sbb:

𝑂 = 𝑁𝑖𝑙𝑎𝑖 𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖
𝐸 = 𝑁𝑖𝑙𝑎𝑖 𝐸𝑘𝑠𝑝𝑒𝑘𝑡𝑎𝑠𝑖 (𝐻𝑎𝑟𝑎𝑝𝑎𝑛)

Link: https://www.mathsisfun.com/data/chi-square-test.html mungkin dapat


digunakan untuk memahami uji chi kuadrat

9. Regresi adalah cara menghubungkan variable bebas dengan variable tak bebas. Misalnya
kita ingin mengtahui hubungan antara X (variable bebas) dan Y (variable tak bebas)
berdasarkan n pasangan nilai X dan Y. Fungsi Y = F(X) dapat berupa linier, kuadratik,
kubik atau yang lainnya. Dalam kenyataan ada kemungkinan variable bebas lebih dari
satu sehingga Y= F(X1, X2, X3, …, Xn). Aturan regresi silahkan anda pelajari sendiri
10. Generator modulo bilangan prima. Misalkan kita mempunyai bilangan prima 𝑝, kemudian
ambil bilangan 𝑔 = 2, … , 𝑝 − 1. Kita ingin mengetahui apakah 𝑔 adalah generator
modulo 𝑝 atau tidak. Hal tersebut dibuktikan dengan menghitung 𝑥𝑖 = 𝑔𝑎 𝑀𝑜𝑑 𝑝; 𝑖 =
1, … , 𝑝 − 1; 𝑎 = 1, … , 𝑝 − 1
Jika dalam perhitungan 𝑥𝑖 terdapat perulangan, maka 𝑔 bukan generator modulo 𝑝.
Tetapi jika bilangan yang diperoleh tidak ada yang sama, maka 𝑔 adalah generator
modulo 𝑝.
Contoh:
11. Perpangkatan bilangan besar. Sering dikenal dengan Fast Exponentiation yang
dinyatakan dalam bentuk:
𝐴𝐵 𝑀𝑜𝑑 𝐶; 𝐴, 𝐵, 𝐶 𝑏𝑖𝑙𝑎𝑛𝑔𝑎𝑛 𝑏𝑢𝑙𝑎𝑡 𝑝𝑜𝑠𝑖𝑡𝑖𝑓 𝑦𝑎𝑛𝑔 𝑏𝑒𝑠𝑎𝑟 𝐴, 𝐵 < 𝐶;
Untuk bilangan kecil mungkin menghitung 𝐴𝐵 𝑀𝑜𝑑 𝐶 tidak ada masalah. Namun jika
ketiganya besar dan kita menyelesaikan 𝐴𝐵 terlebih dahulu, maka kita akan
mendapatkan kesalahan Overflow.

Cara mengatasinya adalah dengan menggunakan trik khusus yakni memecah bilangan
b (pangkat) menjadi perjumlahan 2^i. Misalnya: 17 = 16 + 1 atau 2^4 + 1; 56 = 32 + 16
+ 8 = 2^5 + 2^4 + 2^3;

123 = 64 + 32 + 16 + 8 + 2 + 1 = 2^6 + 2^32 + 2^4 + 2^3 + 2^1 + 2^0

Dengan demikian kita memecah persoalan a^b mod c menjadi beberapa perhitungan
yang lebih kecil, kemudian hasil diperoleh dengan mengalikan bagian-bagian kecil
yang diperoleh dengan cara bertingkat. Perhatikan contoh berikut:

35^32 = (35^2)^16 atau ((((35^2)^2)^2)^2)^2

Karena kita menggunakan modulo setiap kali berhitung, maka bilangan yang diperoleh
tidak sempat "membesar"

Perhatikan contoh berikut:

Hitung a^b mod c dengan syarat: a , bdan c adalah bilangan bulat positif
dan a,b < c
Contoh: a= 23
b= 37
c= 101

Langsung: #NUM! overflow

Bagaimana menghitungnya?

Uraikan 37 menjadi: 32+4+1

k 1 2 4 5 8 16 32
23^k (mod 101) 23 24 71 17 92 81 97

23^32 (mod 101) = ((((23^2)^2)^2)^2)^2 (mod 101) =


dengan rincian:
23^32 = (23^16)^2 = 97
23^16 = (23 ^8)^2 = 81
23^8 = (23 ^4)^2 = 92
23^4 = (23 ^2)^2 = 71
Jadi:

23^37 MOD 101 = (23^32*23^4*23) Mod 101 = 33


Masih banyak rumus lain yang mungkin kita butuhkan sesuai dengan masalah dan data
dalam penelitian kita. Dalam slide presentasi terdapat banyak rumus. Silahkan anda
mencoba satu per satu. Atau anda sudah mempunyai paper sebagai referensi dalam
membuat rencana TA. Silahkan anda mencoba memahami rumus-rumus yang ada
dengan menggunakan Excel atau mencoba membuat programnya (kemudian
menunjukkan hasil eksekusinya)

Anda mungkin juga menyukai