Anda di halaman 1dari 26

Klasifikasi Numerik-fenetik

Taksonomi Numerik:
pengelompokan unit takson dengan
metode kuantitatif berdasarkan
keadaan sifat-sifat.
Perintis Aplikasi Sistematik Numerik :
Peter H.A. Sneath (1957)

1. Taksonomi alami ideal: taksonomi yang


mengandung informasi terbesar yaitu yang
didasarkan atas sebanyak-banyaknya sifat.
2. Masing-masing sifat diberi nilai yang setara
dalam mengkonstruksi taksa alami.
3. Similaritas keseluruhan (afinitas) merupakan
fungsi proporsi sifat yang dimiliki bersama.
4. Taksa yang berbeda didasarkan atas sifat yang
dimiliki.
5. Similaritas tidak besifat filogenetis.
Taksonomi Tradisional:

monotetik
karakter tunggal
dipilih secara subyektif
tidak dapat mengakomodasi variasi
(mutan)
Taksonomi Numerik:

mengandung banyak informasi


sebanyak-banyak karakter (politetik)
dapat mengakomodasi variasi
sistem simpanan informasi yang
berharga
sistem retrieval bagi para ilmuwan
Prosedur Taksonomi Numerik:

1. Pemilihan strain dan uji karakter


Pemilihan strain (OTU)

Pemilihan karakter

Akuisisi data secara tepat

Pengkodean data (data coding)


Prosedur Taksonomi Numerik:
2. Evaluasi Eror
Estimasi test error
Komputasi resemblance
Konstruksi dendrogram
(pengklasteran)
Evaluasi dendrogram (co-
phenetic-correlation test)

3. Pendefinisian tingkat takson


Contoh: Tabel n x t
Karakter Strain Mikrobia (Operational Taxonomical Unit)
A B C D E
1 + + - - -
2 + - + - -
3 + - - - -
4 - - + - +
5 + + + + +
6 - - + + +
7 + + - - +
8 + + - + +
9 - - + - +
10 - - - + +
Komputasi nilai resemblance (similaritas):
Hasil Uji Hasil uji Strain A
Strain B

+ -

+ a b

- c d
Indeks similaritas:
Simple matching coeficient

a + d
(SSM) = -------------------- x 100%
a +b +c +d
Jaccard coeficient

a
(SJ) = ----------------- x 100%
a +b +c
Contoh kalkulasi SSM

SSM (A-B) : a = 4; b = 2; c = 0; d = 4: SSM = 80%


SSM (A-C) : a = 2; b = 4; c = 3; d = 1: SSM = 30%
SSM (A-D) : a = 2; b = 4; c = 2; d = 2: SSM = 40%
SSM (A-E) : a = 3; b = 3; c = 4; d = 0: SSM = 30%
dan selanjutnya !!!
Matriks Similaritas (Unsorted)
A B C D E

A 100

B 80 100

C 30 30 100

D 40 60 50 100

E 30 50 60 70 100
Clustring analysis
Sim (%) Strain Mikrobia (OTU)
100 A B C D E
90 A B C D E
80 (A, B) C D E
70 (A, B) C (D,E)
60 (A, B) C (D,E)
55 (A, B) (C)(D,E)}
50 (A, B) (C)(D,E)}
40 (A, B) } (C)(D,E)}]
30 (A, B) } (C)(D,E)}]
20 (A, B) } (C)(D,E)}]
10 (A, B) } (C)(D,E)}]
Algoritme Pengklasteran (Clustering Algoritm)

1. Single linkage: fusi klaster dengan nilai


similaritas tertinggi

2. Average linkage: fusi klaster dengan nilai


similaritas rerata (UPGMA)

3. Complete linkage: fusi klaster dengan


nilai similaritas terkecil

UPGMA: Unweighted Paired Group Method with


Arithmetic Averages
Konstruksi dendrogram
Hasil klasifiksi:

30 40 50 60 70 80 90 100
Evaluasi dendrogram: Analisis korelasi ko-
fenetik
Matriks Similaritas original (X)

A B C D E

A 100
B 80 100
C 30 30 100
D 40 60 50 100
E 30 50 60 70 100
Matriks similaritas derived from
Dendrogram (Y)

A B C D E

A 100
B 80 100
C 40 40 100
D 40 40 55 100
E 40 40 55 70 100
Analisis Kofenetik-korelasi
SSM X Y X2 Y2 XY
A-B 80 80
A-C 30 40
A-D 40 40
A-E 30 40
B-C 30 40
B-D 60 40
B-E 50 40
C-D 50 55
C-E 60 55
D-E 70 70
X Y X2 Y2 XY
Matriks Similaritas (Sorted)
A B D E C

A 100

B 80 100

D 40 60 100

E 30 50 70 100

C 30 30 50 60 100
Koefisien Korelasi (r)

n(XY) XY)
r = -------------------------------------------
(nX2 (X)2) (n (Y2) (Y)2)

r 60% (nilai r yang dapat diterima)


Clustring analysis
Sim (%) Strain Mikrobia (OTU)
100 A B C D E
90 A B C D E
80 (A, B) C D E
70 (A, B) C (D,E)
60 (A, B) C (D,E)
55 (A, B) (C)(D,E)}
50 (A, B) (C)(D,E)}
40 (A, B) } (C)(D,E)}]
30 (A, B) } (C)(D,E)}]
20 (A, B) } (C)(D,E)}]
10 (A, B) } (C)(D,E)}]
2. Evaluasi Error
Estimasi eror pengujian karakter: Test of error
and reproducibility

1.Variance of individual test between


replicates (Si2) :
n
Si2 = ------------
2t
n : the number of OTUs with discrepancy in the test
t : total number of duplicate strains
Example:
Test (i) Duplicate strains (OTU)

A1 A2 B1 B2 C1 C2

1 + - + + + +

2 + + - + + -

3 + + - - + +

4 - - + + - -
1. Variance of individual test between
replicates

n = 1; t = 3

S12 = 1/2x3 = 0,16

S22 = 2/2x3 = 0,33

S 32 = 0/2x3 = 0 dst
2. Probability of error for an individual test

Pi =1/2(1-(1-4.Si2)

P1 = 1/2 (1-1- 4 x 0,16)


= 0,2
= 20%

Error untuk test (karakter 1) = 20%


(ditolak) !
3. Global Estimate error
Pooled variance (S2)
1
S2 = --- (S12 + S22 + S32 + .SN2)
N
N: total number of test
S2i: variance of individual test
Example:
S12 = 0,16
S22 = 0,33
S32 = 0

1
S2 = ---- ( 0.16 + 0,33 + 0) = 0,163
3

Global estimate error of all tests:


Pi = ( 1 - (1-4.0,163) = 0,2
Pi = 20%
Keterangan:
Jika Si2 atau Pi 10% maka hasil uji karakter dapat diterima !
Jika Si2 atau Pi > 10% maka hasil uji karakter tidak dapat diterima !!

Anda mungkin juga menyukai