Anda di halaman 1dari 22

UJIAN TENGAH SEMESTER

ANALISIS DATA EKSPLORATIF

Oleh

Nama : Reinaldi Ferdian


NPM : F1F016026
Dosen Pengampuh : Prof. Ir. Sigit Nugroho, M.Sc., Ph.D

PROGRAM STUDI S1 STATISTIKA


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BENGKULU
2019
SOAL
a. Periksa apakah semua data sudah valid? berikan penjelasan bagaimana cara
memeriksa bahwa semua data sudah valid.
Sebagai tambahan informasi bahwa komponen bobot penilaian sebagai berikut :
Komponen INPUT (15%) terdiri dari Dosen S3 40%, Jabatan Lektor Kepala dan Guru
Besar 40%, Rasio Dosen Mahasiswa 14%, Mahasiswa Asing 4% dan Dosen Asing 2%;
Komponen PROSES (25%) terdiri dari Akreditasi Institusi 35%, Akreditasi Prodi 40%,
eLearning 2%, Kerjasama PT 10%, Ketaatan PDDIKTI 10%, Lap Keuangan 3%;
Komponen OUTPUT (25%) terdiri dari Artikel Publikasi 25%, Kinerja Penelitian 36%,
Kinerja Mahasiswa 15%, Akreditasi Internasional 24%; dan yang terakhir komponen
OUTCOME (35%), Inovasi 35%, Daya Serap Alumni 6%, Sitasi 24%, Paten 10%, dan
Kinerja Pengabdian Masyarakat 25%.
b. Hitunglah Nilai Akhir yang diperoleh masing-masing perguruan tinggi berdasarkan
bobot diatas.
c. Periksa kembali apakah Perangkingan diatas memang berdasarkan nilai akhir yang
diperoleh. Laporkan temuan yang kalian dapatkan jika ada kesalahan perangkingan.
d. Untuk perguruan tinggi yang tergolong klaster pertama (Menurut Kemenristek Dikti)
atau 13 perguruan tinggi rangking teratas, temukan kemiripan sifat (variabel/komponen
penilaian) dengan menggunakan metode statistika multivariat yang sudah anda pelajari.
e. Lakukan klasterisasi untuk semua perguruan tinggi yang berdomisili di Provinsi
Bengkulu, baik secara aglomeratif (single, average, complete) dan divisif bilamana
metode penghitungan jarak antar klasternya menggunakan metode euclidean dan
manhattan.
f. Ulangi klasterisasi pada soal e. dengan menggunakan k-means klastering.
g. Bagaimana cara menentukan klaster optimum? dan gunakan hasil dari penentuan
klaster optimum ini untuk soal e. yaitu untuk semua perguruan tinggi yang ada di
wilayah Provinsi Bengkulu.
h. Pendekatan terbaru klasterisasi adalah penggunaan metode pengklasteran kabur atau
fuzzy k-means clustering. Artinya setiap obyek-obyek dapat saja akan terklasterisasi ke
klaster mana saja dengan peluang tertentu. Lakukan fuzzy k-means clustering untuk
semua perguruan tinggi yang ada di Provinsi Bengkulu.
Jawab :
a. Uji Validitas Data
Keterangan :
X 1 =¿ Dosen S3 X 6 =¿APT
X 2 =¿Dosen LKGB X 7 =¿APS
X 3 =¿Rasio Dosen Mahasiswa X 8=¿ E-Learning
X 4=¿ Mahasiswa Asing X 9=¿ Kerja Sama PT
X 5 =¿Dosen Asing X 10=¿Ketaatan Lap. PDDIKTI
X 11 =¿ Lap. Keuangan X 16 =¿ Inovasi

X 12=¿ Artikel X 17 =¿ Daya Serap

X 13 =¿ Kinerja Penelitian X 18=¿ Sitasi

X 14 =¿ Kinerja Mahasiswa X 19=¿ Paten

X 15 =¿ Akreditasi Internasional X 20 =¿ Kinerja Pengabdian Masyarakat

Uji Validitas data bisa menggunakan korelasi uji pearson dengan rumus sebagai
berikut :
n ∑ X i Y i−∑ X i ∑ Y i
r xy =
√¿ ¿ ¿
Keterangan :
r xy: koefisien korelasi
n : jumlah data
X : jumlah skor item X
Y : jumlah skor item Y
Kemudian, untuk menguji signifikan hasil korelasi kita gunakan uji-t. Adapun
kriteria untuk menentukan signifikan dengan membandingkan nilai t-hitung dan t-tabel.
Jika t-hitung > t-tabel, maka dapat kita simpulkan bahwa butir item tersebut valid.
Rumus t-hitung :
r xy √ (n−2)
t hit =
√1−r xy
2

Hasil uji validitas dengan bantuan Ms. Excel


Variabe
l  r xy t-hit   t-tabel  Kesimpulan
X
  1 0.674 54.689 1.646 Valid
 X 2 0.612 45.550 1.646 Valid
 X 3 0.159 8.007 1.646 Valid
 X 4 0.598 43.691 1.646 Valid
 X 5 0.446 27.789 1.646 Valid
X 6  0.679 55.434 1.646 Valid
 X 7 0.611 45.376 1.646 Valid
 X 8 0.608 45.033 1.646 Valid
 X 9 0.654 51.518 1.646 Valid
  X 10 0.453 28.353 1.646 Valid
  X 11 0.573 40.571 1.646 valid
  X 12 0.637 49.011 1.646 valid
  X 13 0.841 97.621 1.646 valid
  X 14 0.768 73.935 1.646 valid
  X 15 0.505 33.226 1.646 valid
  X 16 0.665 53.153 1.646 valid
  X 17 0.499 32.707 1.646 valid
  X 18 0.539 36.735 1.646 valid
  X 19 0.501 32.855 1.646 valid
  X 20 0.771 74.586 1.646 valid

Jadi, untuk seluruh variabel dari X 1 , X 2 , … , X 20 bahwa semua variabel tersebut


valid diakrenakan nilai t-hitung > t-tabel = 1.646, maka dapat kita simpulkan bahwa
variabel tersebut valid.

c. Berdasarkan nilai akhir dengan bobot masing-masing komponen, ketika dilakukannya


perankingan nilai akhir, ada data yang tidak sesuai dengan ranking nilai akhir, seperti
Universitas Mataram yang diurutan 44 berdasarkan nilai akhir namun pada data tersebut
berada pada urutan 47, dan masih banyak lagi Perguruan Tinggi yang tidak sesuai
urutannya jika digunakan nilai akhir sebagai acuan dalam perankingan akhir.
d. Perguruan tinggi yang termasuk klaster pertama terdiri dari 13 Universitas yaitu
Institut Teknologi Bandung, Universitas Gadjah Mada, Institut Pertanian Bogor, Institut
Teknologi Sepuluh November, Universitas Indonesia, Universitas Diponegoro,
Universitas Airlangga, Universitas Hasanuddin, Universitas Brawijaya, Universitas
Padjajaran, Universitas Andalas, Universitas Sebelas Maret, dan Universitas Sumatera
Utara.
Metode Statistika Multivariat yang digunakan untuk mencari kemiripan antar
variabel adalah metode jarak yaitu jarak Euclidean. Rumusnya adalah :

√∑
m
2
d ij = (x ¿ ¿ ik−x jk ) ¿
k=1
Jarak euclidean adalah perhitungan jarak dari 2 buah titik. Data klaster pertama
Universitas terdiri dari 13 Universitas yang berarti memiliki antar jarak yaitu 12. Untuk
nilai euclidean yaitu untuk jarak 2 dan 1 sebesar 3.386295, jarak 3 dan 2 sebesar
2.523492, jarak 4 dan 3 sebesar 4.992935, jarak 5 dan 4 sebesar 2.044609, jarak 6 dan 5
sebesar 6.390711, jarak 7 dan 6 sebesar 3.881392, jarak 8 dan 7 sebesar 4.323117, jarak
9 dan 8 sebesar 5.316306, jarak 10 dan 9 sebesar 6.717446, jarak 11 dan 10 sebesar
5.939485, jarak 12 dan 11 sebesar 3.225974, dan jarak 13 dan 12 sebesar 4.458100.
Dimana data 1 sampai 13 adalah data Universitas yang berada pada klaster pertama.
e. Klasterisasi Perguruan Tinggi di Provinsi Bengkulu
1. Aglomeratif (Single, Complete, dan Average) dengan jarak Euclidean
Aglomeratif adalah bagian yang sangat penting pada saat kita coba interprestasi
analisis cluster hirarki ini. Proses aglomerasi ini bersifat kompleks, khususnya
perhitungan koefisien yang melibatkan sekian banyak obyek dan terus bertambah.
Proses aglomerasi pada akhirnya akan menyatukan semua obyek menjadi satu cluster.
Hanya saja dalam prosesnya dihasilkan beberapa cluster dengan masing-masing
anggotanya, tergantung jumlah cluster yang dibentuk.
2. Aglomeratif (Single, Complete, dan Average) dengan jarak Manhattan
3. Divisif dengan Jarak Euclidean

4. Divisif dengan Jarak Manhattan


f. K-Means Clustering
K-Means Clustering adalah suatu metode penganalisaan data atau metode Data Mining
yang melakukan proses pemodelan tanpa supervisi (unsupervised) dan merupakan salah
satu metode yang melakukan pengelompokan data dengan sistem partisi. Pada data ini,
dilakukan pengklasteran dengan 3 klaster.

g. Cara untuk menetukan klaster optimum bisa menggunakan beberapa metode:


Dalam menentukan k pada cluster, ada beberapa pendekatan yang dapat digunakan
yaitu: 1. Silhouette 2. Elbow 3. Gap Statistic
Pertama, kita akan coba menggunakan metode Elbow terlebih dahulu. Metode ini
menggunakan pendekatan nilai within sum of square (wss) sebagai penentu k optimal.
Berdasarkan grafik diatas, terlihat penurunan paling tajam membentuk elbow atau
mementuk siku pada k=2. Sehingga untuk metode elbow diperoleh hasil k optimal 2.
Selanjutnya, dengan menggunakan metode Silhouette.

Pendekatan silhouette menggunakan rata-rata nilai cluster untuk menduga nilai k


optimum. Semakin tinggi nilai rata-ratanya maka akan semakin baik clusternya.
Berdasarkan grafik silhouette yang terbentuk, diperoleh banyak cluster optimal
sebanyak 6. Hasil ini sama dengan penentuan k optimal menggunakan metode elbow. 
Diambil k optimum yaitu k=2, sehingga mendapatkan hasil k-means clustering,

h. Fuzzy K-Means

Anda mungkin juga menyukai