Anda di halaman 1dari 4

Teoria do Clustering rvore Formiga

Mirla Maria de Sousa Santana


Curso Bacharelado em Sistemas de Informao Universidade Federal do Piau
(UFPI) Campus Senador Helvdio Nunes de Barros
Picos PI Brasil
mirlasantanaf@gmail.com

Abstract. Ant Tree Clustering, based on biology, grouping view hierarchically


classifying patterns in different groups. In recent years the demand algorithms
designed to perform clustering techniques is wide. With the advent of swarm
intelligence techniques have opened up new ways of grouping promoting
optimization of the same. This presents a brief analysis of the ant tree clustering
algorithm.
Resumo. O Clustering rvore Formiga, baseado na biologia, visa o
agrupamento de forma hierrquica, classificando padres em diferentes
grupos. Nos ltimos anos a demanda de algoritmos criados para realizar
tcnicas de clustering foi ampla. Com o advento das tcnicas de inteligncia de
enxames abriram-se novas formas de agrupamento promovendo uma
otimizao das mesmas. Neste apresenta uma breve anlise do algoritmo
Agrupamento rvore Formiga.

1. Introduo
Clustering uma tcnica, ou algoritmo, que realiza agrupamentos automticos de dados
segundo seu grau de semelhana. Um conjunto de elementos que partilham da mesma
semelhana fazem parte de um mesmo grupo, sendo diferentes de elementos de outros
grupos. Essa tcnica divide-se em duas formas: clustering hierrquico e clustering
aglomerativo.
Inteligncia de Enxames um paradigma que possui uma grande demanda na
criao de algoritmos para soluo de problemas. O Clustering rvore Formiga utiliza
esse paradigma alm de propor uma metodologia diferente na realizao de agrupamentos
de agentes. Como o prprio nome j diz, esse clustering se baseia no comportamento das
formigas, mais precisamente no processo de construo de estruturas em formato de
rvore.
So vrios os algoritmos de agrupamento, a proposta que o da rvore Formiga
utiliza atravs de uma diviso hierrquica promovendo uma diviso mais detalhada dos

elementos que compe cada n. Tal clustering inspirado pelas cadeias de formigas onde
formigas da espcie Oecophylla se fixam uma na outra para construir estruturas. Cada
formiga artificial representa um n da rvore que est sendo montada, ou os dados que
sero agrupados, o modo como elas se movem e constroem essa rvore dependendo da
semelhana entre os dados.

2. Inteligncia de Enxames
Nome dado ao desenvolvimento de algoritmos para a soluo de problemas inspirandose no comportamento coletivo de colnias de insetos e outras sociedades de animais,
formigas por exemplo. Os comportamentos usados como base para a criao de
algoritmos so: construo de ninhos, diviso de trabalho e alocao de tarefas nas
colnias de formigas, transporte cooperativo de alimento, seleo de melhor fonte de
nctar pelas abelhas e etc.
Santos (2009), destaca que os comportamentos apresentam semelhana quanto s
caractersticas, so elas:
Proximidade: os agentes necessitam interagir entre si para que assim seja
mantida a organizao e foco nos interesses coletivos;
Qualidade: o agente deve ser capaz de entender os fatores ambientais e a
tarefa em que se encontra fazendo, ou seja, avaliar seu comportamento;
Diversidade: permite ao enxame a capacidade de flexibilidade, para trabalhar
com situaes inesperadas e tambm desconhecidas;
Estabilidade: o sistema no pode permitir que todas as variaes ambientais
afetem o comportamento do agente;
Adaptabilidade: capacidade do enxame de se adequar a variaes ambientais.

3. Clustering rvore Formiga


Como foi visto, Clustering rvore Formiga se trata de um algoritmo inspirado no
comportamento das formigas no processo de construo de estruturas. Cada formiga
representa um n da rvore que est sendo montada, inicialmente so adicionadas ao n
inicial, suporte, em seguida as outras vo sendo fixadas a esse n at que todas faam
parte da estrutura. O modo como as formigas, ou agentes, se movem e constroem essa
rvore depende da semelhana entre os dados.
No processo de construo, as interaes entre os agentes criam fixaes ou
conexes. medida que o nmero de interaes entre os agentes cresce a estrutura
tambm aumenta. O princpio bsico envolve uma formiga ai que se move para baixo da
rvore seguindo um caminho de semelhana mxima. Se em um determinado nvel ao
longo deste caminho, ai possuir caractersticas diferentes dos filhos de aps, ento ai
ligado ao aps, a fim de criar uma nova subcategoria. Cada formiga mantm um vetor de
valores, limiar de similaridade e limiar de dissimilaridade. Durante a construo da rvore

elas podem no conseguir se conectar a ela, dessa forma necessria a atualizao de


limiar.

Figura 1. Processo de Construo da rvore


Fonte Channa, 2006
Os clculos responsveis pela atualizao de limiar so:
sim(i) sim(i) 0.9 limiar de similaridade;
dissim(i) dissim(i) + 0.01 limiar de dissimilaridade.
O valor de sim(i) e dissim(i) so inicializados como p/2 e 0, respectivamente,
onde p o escopo de similaridade.
Para a realizao da estimativa de semelhana entre agentes utiliza-se a frmula
da distncia euclidiana, segue a representao:

Sendo M a dimensionalidade dos vetores, p o escopo de similaridade dado pelo


desenvolvedor, geralmente com valores bem pequenos (entre 0 e 1).
Por fim, os critrios de diviso de grupos, ou seja, seleo de semelhana
realizado da seguinte forma:

Se (i, j) > sim (i), formiga i similar formiga j.

Se (i, j) < dissim (i), ento formiga i muito diferente de formiga j.

Se (i, j) dissim (i) e (i, j) sim (i), em seguida, formiga i nem semelhante
nem desigual para formiga j, necessrio um processamento adicional, ou seja,
atualizao de limiar.

5. Concluses
Uma vez que o algoritmo prossegue tomando a forma iterativa, as caractersticas das
primeiras formigas iro influenciar significativamente o resultado final. A rvore
resultante pode ser interpretada como uma partio de dados. Os ciclos de interaes
continuaro at o momento em que todos os agentes estiverem fixados na estrutura.
Ao observar os procedimentos de agrupamento realizados por esse tipo de
clustering, pode-se perceber algumas vantagens na sua execuo: simplicidade nos
clculos, critrio de parada bem definido, alm de utilizar conceitos provenientes da
biologia.

Referncias
Channa A. H., Rajpoot N. M., Rajpoot K. M., Texture Segmentation using Ant Tree
Clustering, Faculty of Computer Science & Engineering, GIK Institute, PAKISTAN,
Department of Computer Science, University of Warwick, UK;
Errecalde M. L., Ingaramo D. A., A new AntTree-based algorithm for clustering shorttext corpora, Universidad Nacional de San Luis, Argentina, 2010;
Chircop, J. The Multiple Pheromone Ant Clustering Algorithm, Aston University,
2014.
Jafar M. O. A., Sivakumar R., Ant-based Clustering Algorithms: A Brief Survey,
International Journal of Computer Theory and Engineering, Vol. 2, No. 5, October,
2010.
Arajo, R. N., Anlise de Clusterizao: Estudo comparativo e Mecanismos de
Agrupamento Usando o Algoritmo de Colnia de Formigas, Engenharia de
Computao Universidade de Pernambuco, Recife, 2012;
Santos D. S., Bee clustering: um Algoritmo para Agrupamento de Dados Inspirado em
Inteligncia de Enxames, Instituto de Infrmatica, Universidade Federal do Rio
Grande do Sul, 2009.

Anda mungkin juga menyukai