Analisis Big Data

Nasywa Nur Indarwati
12030122140217
Data Mahasiswa
NOMOR 1
tabel1=read.delim("clipboard")
tabel1
tugas1=tabel1[,4]
tugas2=tabel1[,5]
praktikum=tabel1[,6]
quiz=tabel1[,7]
UTS=tabel1[,8]
UAS=tabel1[,9]
mean(tugas1)
mean(tugas2)
mean(praktikum)
mean(quiz)
mean(UTS)
mean(UAS)
summary(tabel1)
str(tabel1)
mode(tugas1)
mode(tugas2)
mode(praktikum)
mode(quiz)
mode(UTS)
mode(UAS)
range(tugas1)
range(tugas2)
range(praktikum)
range(quiz)
range(UTS)
range(UAS)
sd(tugas1)
sd(tugas2)
sd(praktikum)
sd(quiz)
sd(UTS)
sd(UAS)
par(mfrow=c(2,3))
boxplot(tugas1)
boxplot(tugas2)
boxplot(praktikum)
boxplot(quiz)
boxplot(UTS)
boxplot(UAS)
par(mfrow=c(2,3))
hist(tugas1)
hist(tugas2)
hist(praktikum)
hist(quiz)
hist(UTS)
hist(UAS)
plot(UTS,UAS)
plot(TUGAS1,TUGAS2)
Nomor 2
#Metode complete linkage
data<-read.delim("clipboard")
data
par(mfrow=c(1,1))
metode_c1<-hclust(dist(scale(data)),method = "complete")
plot(metode_c1)
rect.hclust(metode_c1,3)
anggota<-cutree(metode_c1,3)
anggotatabel=data.frame(anggota)
anggotatabel
#Metode Average Linkage
data<-read.delim("clipboard") #CTRL + C dulu di EXCEL (angkanya saja)
data
metode_a1<-hclust(dist(scale(data)),method = "ave")
plot(metode_a1)
rect.hclust(metode_a1, 2) #angka 2 ini sebagai jumlah kelas yang di-cluster
anggota<-cutree(metode_a1, 2)
anggota
tabel=data.frame(anggota) tabel
#Metode Ward
data
metode_ward<-hclust(dist(scale(data)),method = "ward.D")
plot(metode_ward)
rect.hclust(metode_ward, 3)
anggota<-cutree(metode_ward, 3)
anggota
tabel=data.frame(anggota)
tabel
#Metode Centroid Linkage
data
metode_centroid<-hclust(dist(scale(data)),method = "centroid")
plot(metode_centroid)
rect.hclust(metode_centroid, 3)
anggota<-cutree(metode_centroid, 3)
anggota
tabel=data.frame(anggota)
tabel
#Single linkage
data
metode_s1<-hclust(dist(scale(data)),method = "single")
plot(metode_s1)
rect.hclust(metode_s1,3)
anggota<-cutree(metode_s1, 3)
anggotatabel=data.frame(anggota)
anggotatabel
NOMOR 3
# install packages cluster untuk clustering
library(cluster)
# install packages factoextra untuk clustering dan visualisasi
library(factoextra)
# install packages tidyverse untuk clustering
library(tidyverse)
# mengimport data excel ke RStudio, buka file nilai.xlsx di excel (kopi seluruh file tersebut, kemudian
run di Rstudio file tabel1)
tabel1=read.delim("clipboard")
# melihat data setelah import
tabel1
# melihat data yang sudah lengkap
summary(tabel1)
mean(tabel1$Nilai1)
mean(tabel1$Nilai2)
mean(tabel1$Nilai3)
mean(tabel1$Nilai4)
# transformasi dengan skala pada semua nilai
tabel2=scale(tabel1[,4:9])
# untuk menampilkan hasil perubahan tabel2 menggunakan sintaks berikut;
View(tabel2)
# menentukan jumlah cluster terbaik dengan metode elbow/within sum of square (wss)
fviz_nbclust(tabel2, kmeans, method = "wss")
# menentukan jumlah cluster terbaik dengan metode silhouette
fviz_nbclust(tabel2, kmeans)
# menentukan cluster dengan metode k-means,
tabelfinal = kmeans(tabel2,3)
# melihat hasil clustering
print (tabelfinal)
# melihat hasil clustering dalam bentuk grafik / visual
fviz_cluster(tabelfinal,data=tabel2)
# melihat hasil clustering dalam bentuk tabel
finalakhir=data.frame(tabel2,tabelfinal$cluster)
View(finalakhir)
tabel1[,4:9]%>%
mutate(cluster=tabelfinal$cluster)%>%
group_by(cluster)%>%
summarise_all("mean")
# transformasi dengan skala pada semua UTS dan UAS
View(tabel3)
fviz_nbclust(tabel3, kmeans).
fviz_nbclust(tabel3, kmeans).
# transformasi dengan skala pada nilai UTS dan UAS (kolom 8 dan 9 pada tabel1)
View(tabel3)
# menentukan cluster dengan metode k-means
print (tabelfinal)
View(finalakhir)
# melihat deskripsi data setelah di clusterkan berdasar cluster
tabel1[,7:9]%>%
group_by(cluster)%>%summarise_all("mean")
C. Semua nilai untuk k=3,4, dan 5
# transformasi dengan skala pada nilai TUGAS1,TUGAS2,PRAKTIKUM,QUIZ.UTS dan UAS (kolom

4,5,6,7,8 dan 9 pada tabel1)
View(tabel4)
# menentukan cluster dengan metode k-means
print (tabelfinal)

View(finalakhir)
# melihat deskripsi data setelah di clusterkan berdasar cluster
tabel1[,4:9]%>%
group_by(cluster)%>%
summarise_all("mean")

Analisis Big Data

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Analisis Big Data

Diunggah oleh

Hak Cipta:

Format Tersedia

Nasywa Nur Indarwati

#Metode complete linkage

data<-read.delim("clipboard") #CTRL + C dulu di EXCEL (angkanya saja)

rect.hclust(metode_a1, 2) #angka 2 ini sebagai jumlah kelas yang di-cluster

#Metode Centroid Linkage

# install packages cluster untuk clustering

# install packages factoextra untuk clustering dan visualisasi

# install packages tidyverse untuk clustering

# melihat data setelah import

# transformasi dengan skala pada semua nilai

# untuk menampilkan hasil perubahan tabel2 menggunakan sintaks berikut;

fviz_nbclust(tabel2, kmeans, method = "wss")

# menentukan jumlah cluster terbaik dengan metode silhouette

# menentukan jumlah cluster terbaik dengan metode silhouette

# menentukan jumlah cluster terbaik dengan metode silhouette

# melihat hasil clustering

# melihat hasil clustering dalam bentuk grafik / visual

# melihat hasil clustering dalam bentuk tabel

# transformasi dengan skala pada semua UTS dan UAS

# untuk menampilkan hasil perubahan tabel2 menggunakan sintaks berikut;

# menentukan jumlah cluster terbaik dengan metode silhouette

# menentukan jumlah cluster terbaik dengan metode silhouette

# untuk menampilkan hasil perubahan tabel2 menggunakan sintaks berikut;

fviz_nbclust(tabel3, kmeans, method = "wss")

# menentukan jumlah cluster terbaik dengan metode silhouette

# menentukan cluster dengan metode k-means

# melihat hasil clustering

# melihat hasil clustering dalam bentuk grafik / visual

# melihat hasil clustering dalam bentuk tabel

# melihat deskripsi data setelah di clusterkan berdasar cluster

C. Semua nilai untuk k=3,4, dan 5

# transformasi dengan skala pada nilai TUGAS1,TUGAS2,PRAKTIKUM,QUIZ.UTS dan UAS (kolom

# untuk menampilkan hasil perubahan tabel2 menggunakan sintaks berikut;

fviz_nbclust(tabel4, kmeans, method = "wss")

# menentukan jumlah cluster terbaik dengan metode silhouette

# menentukan cluster dengan metode k-means

# melihat hasil clustering

# melihat hasil clustering dalam bentuk grafik / visual

# melihat hasil clustering dalam bentuk tabel

# melihat deskripsi data setelah di clusterkan berdasar cluster

Anda mungkin juga menyukai