Selamat datang di Scribd!

Lewati carousel

Clustering On Boston Dataset

Diunggah oleh

anubhav582

0% menganggap dokumen ini bermanfaat (0 suara)

138 tayangan3 halaman

Clustering on Boston Dataset

Judul Asli

Clustering on Boston Dataset

Hak Cipta

Format Tersedia

TXT, PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Clustering on Boston Dataset

Hak Cipta:

Format Tersedia

Unduh sebagai TXT, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

138 tayangan3 halaman

Clustering On Boston Dataset

Diunggah oleh

anubhav582

Clustering on Boston Dataset

Hak Cipta:

Format Tersedia

Unduh sebagai TXT, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 3

Cari di dalam dokumen

###

#
# Introduction to Clustering demo
#
# k-means clustering
#
# History:
#
# 2018/07/11 Initial code (copied from other example documents) walter
johnston
#
###
#
# k-means algorithm description/explanation:
#
# user- supplied input parameters:
#
# k: number of clusters
# nstart: number of initializing trials
# iter.max: maximum number of iterations (repetitions)
#
# (1) randomize observations into "k" initial groups (keep best of
"nstart" trials)
# (2) calculate centroid (vector of arithmetic means) for each cluster
# (3) calculate within-sum-of-squares (ESS) for each cluster (retain
value)
# (4) re-assign observations into closest cluster
# (distance from centroid; retain count of re-assignments)
# (5) if iterations <= "iter.max" and count of re-assignments > 0, go to
(2)
# (6) finished
#
###
# code to fetch the package if it is not present

if ( !require(MASS ) ) { install.packages('MASS'); library(MASS) }

if ( !require(tidyverse) ) { install.packages('tidyverse'); library(tidyverse) }
if ( !require(broom ) ) { install.packages('broom'); library(broom) }

data(Boston) # from MASS

###
#
# filter for complete cases (no missing data)
#
###
myBoston <- Boston[ complete.cases(Boston), ]

dim(Boston)
dim(myBoston)
###
#
# kmeans: fixed number of clusters
#
# cluster data based on error-sum-of-squares
# random starting points
# user specified number of clusters
# user specified number of starting trials (best one is automatically selected)
# user specified maximum number of iterations
#
###
# user choices
#
seed <- 1 # random number generator seed
minClusters <- 1 # minimum number of clusters (see code)
maxClusters <- 20 # maximum number of clusters (see code)
km.nstart <- 10 # number of starting trials
km.iter.max <- 20 # iteration limit

###
# start skip of code
###

# track the behavior (initialize to an illegal value) [ total within-ss ] (elbow

method)
#sse <- rep(-1, maxClusters)

# test results for each clustering scenario

#for (i in minClusters:maxClusters) {
# set.seed(seed) # reset RNG each time
# sse[i] <- kmeans(myBoston,
# centers=i,
# nstart=km.nstart,
# iter.max=km.iter.max)$tot.withinss
# }

# plot results to find optimal tradeoff (num clusters v. total winthin-ss)

#plot( minClusters:maxClusters,
# sse,
# type="b",
# xlab="Number of Clusters",
# ylab="Aggregate within cluster SSE (sum of squared error)")

# zoom in to identify the choice more easily

#clust1 <- 3
#clust2 <- 8
#sse2 <- sse[ clust1:clust2 ]
#plot( clust1:clust2,
# sse2,
# type="b",
# xlab="Number of Clusters",
# ylab="Aggregate within cluster SSE (sum of squared error)")

###
# skip to here
###

# test case: 3 clusters

set.seed(seed)
t <- kmeans(myBoston,
centers=3,
nstart=km.nstart,
iter.max=km.iter.max)

# measures of interest
table(t$cluster)
t$tot.withinss # overall
t$withinss # by cluster

# reconstruct the error measurements

t2 <- myBoston
t2$cluster <- t$cluster # add cluster number for each row (observation)

# calculate penalty function (within group error sum of squares)

wssf <- function(df) {
t <- scale(df, center=T, scale=F) # center around the mean
return( sum(t^2) )
}

# by cluster
t3 <- t2 %>%
group_by(cluster) %>%
do( data.frame(wss = wssf(.) ) )

sum(t3) # overall
t3 # by cluster

# individual divergences
t$withinss - t3$wss

# overall divergence
t$tot.withinss - sum(t3$wss)

###
#
# k-means WSS calculations woking correctly
#
# now, apply it to hclust() to select a number of clusters
#
# use: squared euclidean distance as metric for clustering
# method="complete"
#
###

Anda mungkin juga menyukai

Profound Python Data Science
Dari Everand
Profound Python Data Science
Onder Teker
Belum ada peringkat
Support Vector Machine With Multiple Classes
Dokumen5 halaman
Support Vector Machine With Multiple Classes
api-285777244
100% (1)
Lab Report No 2 (M Saad Javed)
Dokumen5 halaman
Lab Report No 2 (M Saad Javed)
SAAD JAVED
Belum ada peringkat
Glove
Dokumen10 halaman
Glove
tareqeee15
100% (1)
Importing Libraries: Import As Import As Import As From Import As From Import From Import Import
Dokumen11 halaman
Importing Libraries: Import As Import As Import As From Import As From Import From Import Import
harishr2494
100% (1)
Accenture Test 6 Hackerrank
Dokumen4 halaman
Accenture Test 6 Hackerrank
Ravi Vadayar
Belum ada peringkat
IDP Lab Report (Saswat Mohanty - 1941012407 - CSE-D)
Dokumen47 halaman
IDP Lab Report (Saswat Mohanty - 1941012407 - CSE-D)
Chirantan Sahoo
Belum ada peringkat
LSTM-AutoEncoders. Understand and Perform Composite & - by Bob Rupak Roy - DataDrivenInvestor
Dokumen9 halaman
LSTM-AutoEncoders. Understand and Perform Composite & - by Bob Rupak Roy - DataDrivenInvestor
8c354be21d
100% (1)
CFDMSH - Python Module For Meshing of Airfoil
Dokumen132 halaman
CFDMSH - Python Module For Meshing of Airfoil
apoorvs75
Belum ada peringkat
Computer Network Vtu Lab Manual
Dokumen6 halaman
Computer Network Vtu Lab Manual
Pavan
100% (1)
Bloxburg Epic Thing Cracked
Dokumen125 halaman
Bloxburg Epic Thing Cracked
・一乃口丂丂ツ
Belum ada peringkat
7 Methods To Calculate PC
Dokumen10 halaman
7 Methods To Calculate PC
api-285777244
Belum ada peringkat
IP - Pandas 1 & 2 (Worksheet) Class 12
Dokumen16 halaman
IP - Pandas 1 & 2 (Worksheet) Class 12
White
Belum ada peringkat
R Basics PDF
Dokumen10 halaman
R Basics PDF
SAILY JADHAV
Belum ada peringkat
Apcs - Recursion Worksheet
Dokumen5 halaman
Apcs - Recursion Worksheet
api-355180314
Belum ada peringkat
Write A C Program To Simulate Bit Stuffing and De-Stuffing
Dokumen23 halaman
Write A C Program To Simulate Bit Stuffing and De-Stuffing
supriya
Belum ada peringkat
Tax Calculation Using Switch Case in Java
Dokumen4 halaman
Tax Calculation Using Switch Case in Java
professorrdsharma
0% (1)
Python Tutorial 3
Dokumen7 halaman
Python Tutorial 3
queen setilo
Belum ada peringkat
Samsung Interview Ques
Dokumen4 halaman
Samsung Interview Ques
Bipin Jaiswal
Belum ada peringkat
Cross-Validation and The Bootstrap
Dokumen5 halaman
Cross-Validation and The Bootstrap
api-285777244
Belum ada peringkat
Java Matrix Determinant
Dokumen1 halaman
Java Matrix Determinant
Mauricio Rojas Valdivia
Belum ada peringkat
PCR and Pls Regression
Dokumen5 halaman
PCR and Pls Regression
api-285777244
Belum ada peringkat
bcsl-063 Solved Lab Manual
Dokumen200 halaman
bcsl-063 Solved Lab Manual
Groot Y
Belum ada peringkat
Random Forests
Dokumen10 halaman
Random Forests
api-285777244
Belum ada peringkat
Date: 15/9/2021 Name: Subhiksha S Reg No: 2019506099
Dokumen13 halaman
Date: 15/9/2021 Name: Subhiksha S Reg No: 2019506099
Subhiksha S
Belum ada peringkat
Graphics With C: Explore The Unexplored
Dokumen9 halaman
Graphics With C: Explore The Unexplored
Adi adi
Belum ada peringkat
Cse1007 - Java Programming LAB Digital Assignment 1 Name-Jeetesh Gowder Reg No: 19BCE2176 Slot: L21+L22
Dokumen11 halaman
Cse1007 - Java Programming LAB Digital Assignment 1 Name-Jeetesh Gowder Reg No: 19BCE2176 Slot: L21+L22
Jeetesh Gowder
Belum ada peringkat
Cannon Strassen DNS Algorithm
Dokumen10 halaman
Cannon Strassen DNS Algorithm
Keshav Bhutani
Belum ada peringkat
Chrome V8 - CVE-2019-5782 Tianfu Cup Qihoo 360 S0rrymybad - EnG
Dokumen1 halaman
Chrome V8 - CVE-2019-5782 Tianfu Cup Qihoo 360 S0rrymybad - EnG
fooloo
Belum ada peringkat
Minutely
Dokumen1 halaman
Minutely
Anonymous CDd9eukAxN
Belum ada peringkat
Open Text Mcqs
Dokumen4 halaman
Open Text Mcqs
thiru12741550
Belum ada peringkat
Computer Networks Algorithms in C Language
Dokumen20 halaman
Computer Networks Algorithms in C Language
leelasaladi
63% (8)
Clustering
Dokumen8 halaman
Clustering
api-285777244
Belum ada peringkat
ANZ Virtual Internship Module Model Answer For Task 1
Dokumen9 halaman
ANZ Virtual Internship Module Model Answer For Task 1
Lily Wang
Belum ada peringkat
AlgoX 11
Dokumen25 halaman
AlgoX 11
tieuly.coc
Belum ada peringkat
Message
Dokumen288 halaman
Message
ASD
Belum ada peringkat
Normality Skewness Kurtosis
Dokumen7 halaman
Normality Skewness Kurtosis
api-285777244
Belum ada peringkat
0x08. C - Recursion
Dokumen13 halaman
0x08. C - Recursion
Elyousoufi hakim
0% (1)
C++ Aptitude Question
Dokumen44 halaman
C++ Aptitude Question
Vicky Singhania
Belum ada peringkat
Support Vector Classification
Dokumen8 halaman
Support Vector Classification
api-285777244
Belum ada peringkat
11 Numpy Cheat Sheet
Dokumen1 halaman
11 Numpy Cheat Sheet
Toldo94
Belum ada peringkat
Python
Dokumen3 halaman
Python
J.G N.H
Belum ada peringkat
Regex
Dokumen5 halaman
Regex
roy.scar2196
Belum ada peringkat
C Aptitude
Dokumen68 halaman
C Aptitude
kudaisya
Belum ada peringkat
Outliers, Hypothesis and Natural Language Processing
Dokumen7 halaman
Outliers, Hypothesis and Natural Language Processing
subhajitbasak001
100% (1)
Continuous Assessment Test - II
Dokumen4 halaman
Continuous Assessment Test - II
Pranav Raj
Belum ada peringkat
Python Assignment1
Dokumen2 halaman
Python Assignment1
Bino
Belum ada peringkat
Program - : AIM: Write A C Program To Implement Goback N Sliding Window Protocol Description
Dokumen5 halaman
Program - : AIM: Write A C Program To Implement Goback N Sliding Window Protocol Description
Lavanya Diet
Belum ada peringkat
DAA Project
Dokumen20 halaman
DAA Project
Monjurul Rana
Belum ada peringkat
Silkroad Bot Source
Dokumen75 halaman
Silkroad Bot Source
plop090
50% (2)
11 June
Dokumen18 halaman
11 June
Yaswanth Pavan Koppuravuri
50% (2)
Autoregressive Integrated Moving Average Arima
Dokumen23 halaman
Autoregressive Integrated Moving Average Arima
api-285777244
Belum ada peringkat
10MCA17 UNIX Programs (MCA SEM 2, VTU)
Dokumen54 halaman
10MCA17 UNIX Programs (MCA SEM 2, VTU)
Abhilash H M
Belum ada peringkat
Yu Cheats Bot Nitro Type
Dokumen32 halaman
Yu Cheats Bot Nitro Type
yucheat
Belum ada peringkat
Laboratory Exercise 2: Discrete-Time Systems: Time-Domain Representation
Dokumen11 halaman
Laboratory Exercise 2: Discrete-Time Systems: Time-Domain Representation
Trung Kieu
Belum ada peringkat
Python Assignment
Dokumen5 halaman
Python Assignment
Ravi Kishore
Belum ada peringkat
M1: at Line 4, Replace Index W by Atweight (Index) W M3: at Line 5, Replace Atweight (Index) W by Atweight (Index) Abs (W)
Dokumen1 halaman
M1: at Line 4, Replace Index W by Atweight (Index) W M3: at Line 5, Replace Atweight (Index) W by Atweight (Index) Abs (W)
Malikijazriaz
Belum ada peringkat
Questions From The CPS125 Final Exam - Winter 2008
Dokumen4 halaman
Questions From The CPS125 Final Exam - Winter 2008
Harpreet Singh Sahota
Belum ada peringkat
.. ML Lab 07
Dokumen25 halaman
.. ML Lab 07
Shezi Fezi
Belum ada peringkat
Parallel Programming in R
Dokumen14 halaman
Parallel Programming in R
Octavio Flores
100% (4)
Chapter2 PDF
Dokumen38 halaman
Chapter2 PDF
anubhav582
Belum ada peringkat
Welcome To Intermediate SQL!: Mona Khalil
Dokumen32 halaman
Welcome To Intermediate SQL!: Mona Khalil
anubhav582
Belum ada peringkat
Correlated Subqueries: Mona Khalil
Dokumen40 halaman
Correlated Subqueries: Mona Khalil
anubhav582
Belum ada peringkat
Joining Tables: John Mackintosh
Dokumen30 halaman
Joining Tables: John Mackintosh
anubhav582
Belum ada peringkat
You'Ve Got The Power: John Mackintosh
Dokumen24 halaman
You'Ve Got The Power: John Mackintosh
anubhav582
Belum ada peringkat
Window Functions: Ginger Grant
Dokumen31 halaman
Window Functions: Ginger Grant
anubhav582
Belum ada peringkat
Chapter2 - SQL Server
Dokumen29 halaman
Chapter2 - SQL Server
anubhav582
Belum ada peringkat
Counts and Totals: Ginger Grant
Dokumen38 halaman
Counts and Totals: Ginger Grant
anubhav582
Belum ada peringkat
WHILE Loops: Ginger Grant
Dokumen17 halaman
WHILE Loops: Ginger Grant
anubhav582
Belum ada peringkat
Chapter1 PDF
Dokumen39 halaman
Chapter1 PDF
anubhav582
Belum ada peringkat
Step 1: Understanding The Model: Project: Diamond Prices
Dokumen1 halaman
Step 1: Understanding The Model: Project: Diamond Prices
anubhav582
Belum ada peringkat
Welcome: Ginger Grant
Dokumen29 halaman
Welcome: Ginger Grant
anubhav582
Belum ada peringkat
Verbal Live Sessions Calendar - Sep 6
Dokumen1 halaman
Verbal Live Sessions Calendar - Sep 6
anubhav582
Belum ada peringkat
SAS Programming II Data Manipulation Techniques
Dokumen2 halaman
SAS Programming II Data Manipulation Techniques
anubhav582
Belum ada peringkat
Instructions To Install Mysql Server Step 1
Dokumen8 halaman
Instructions To Install Mysql Server Step 1
anubhav582
Belum ada peringkat
Data Science Interview Questions and Answer
Dokumen41 halaman
Data Science Interview Questions and Answer
anubhav582
100% (1)
Instructions To Install MySQL Server
Dokumen8 halaman
Instructions To Install MySQL Server
anubhav582
Belum ada peringkat
Verbal Live Sessions Calendar - August 2014 Batch
Dokumen1 halaman
Verbal Live Sessions Calendar - August 2014 Batch
anubhav582
Belum ada peringkat
Entrepreneur India 2014-02
Dokumen104 halaman
Entrepreneur India 2014-02
anubhav582
Belum ada peringkat
Digital Signal Processing Practical 2
Dokumen8 halaman
Digital Signal Processing Practical 2
ravisankarmurugan217
Belum ada peringkat
Thuật toán Johnson
Dokumen8 halaman
Thuật toán Johnson
BabyCoder Hvh
Belum ada peringkat
Comp2024 Btest-11 Mathematics
Dokumen16 halaman
Comp2024 Btest-11 Mathematics
Tttt
Belum ada peringkat
MODULE3 GE003 Math in The Modern World
Dokumen7 halaman
MODULE3 GE003 Math in The Modern World
Lady Reolada
Belum ada peringkat
Hasrat's - Analytic Geometry Gordon Fuller - Compressed
Dokumen208 halaman
Hasrat's - Analytic Geometry Gordon Fuller - Compressed
Oyaaa
Belum ada peringkat
Martins MDO Course Notes PDF
Dokumen239 halaman
Martins MDO Course Notes PDF
Gabriela Diniz
Belum ada peringkat
Herstein: Topics in Algebra - Definition, Examples and Preliminary Lemmas of Groups
Dokumen2 halaman
Herstein: Topics in Algebra - Definition, Examples and Preliminary Lemmas of Groups
Nadia
Belum ada peringkat
Progress Test 2
Dokumen9 halaman
Progress Test 2
Horace Gomez
Belum ada peringkat
Module 5 Abstract Algebra Discussion
Dokumen9 halaman
Module 5 Abstract Algebra Discussion
April C. Cruz
Belum ada peringkat
Basis and Dimension
Dokumen4 halaman
Basis and Dimension
api-318836863
Belum ada peringkat
Student Text: UNIT 7 Number System and Bases Answers
Dokumen5 halaman
Student Text: UNIT 7 Number System and Bases Answers
api-195130729
Belum ada peringkat
Double Integrals As Volume + How To Graph 3D Func
Dokumen67 halaman
Double Integrals As Volume + How To Graph 3D Func
Keren Keziah Tangarorang
Belum ada peringkat
Image Processing: Chapter (3) Part 1:relationships Between Pixels
Dokumen26 halaman
Image Processing: Chapter (3) Part 1:relationships Between Pixels
Thanmayee Thanu
Belum ada peringkat
Machine Learning For Beginner
Dokumen31 halaman
Machine Learning For Beginner
nithin_vn
Belum ada peringkat
Abstract Algebra
Dokumen4 halaman
Abstract Algebra
dennis dancun
Belum ada peringkat
Main
Dokumen260 halaman
Main
api-3726429
Belum ada peringkat
Nda
Dokumen471 halaman
Nda
akshitm340
Belum ada peringkat
Final Step-A Answer Key
Dokumen4 halaman
Final Step-A Answer Key
Vansh Jain
Belum ada peringkat
Math 10
Dokumen131 halaman
Math 10
Kyte Clarisse Cortez
Belum ada peringkat
A Fast Algorithm For Finding An Edge-Maximal Subgraph With A TR-formative Coloring
Dokumen12 halaman
A Fast Algorithm For Finding An Edge-Maximal Subgraph With A TR-formative Coloring
赵夏淼
Belum ada peringkat
All Nimcet Pyss Question Quadratic Solution
Dokumen7 halaman
All Nimcet Pyss Question Quadratic Solution
Rahul singh bisht
Belum ada peringkat
Mean Shift Cluster
Dokumen10 halaman
Mean Shift Cluster
Soumyajit Jagdev
Belum ada peringkat
K Points
Dokumen31 halaman
K Points
Tu Anh Tran
Belum ada peringkat
TSK Fuzzy Function Approximators
Dokumen11 halaman
TSK Fuzzy Function Approximators
Adam Kliber
Belum ada peringkat
Intro To Finite Element Modeling and COMSOL
Dokumen18 halaman
Intro To Finite Element Modeling and COMSOL
SCR_010101
Belum ada peringkat
Signals Classification
Dokumen4 halaman
Signals Classification
khalid
Belum ada peringkat
Detailed Lesson Plan-Dsp
Dokumen6 halaman
Detailed Lesson Plan-Dsp
emssiet
Belum ada peringkat
Module 1
Dokumen31 halaman
Module 1
shaina sucgang
Belum ada peringkat
COMPT Assignment v2
Dokumen14 halaman
COMPT Assignment v2
pmadoh
Belum ada peringkat
g6 m3 Teacher Materials PDF
Dokumen196 halaman
g6 m3 Teacher Materials PDF
james paulo abando
Belum ada peringkat