Anda di halaman 1dari 5

1 Resumen

Los algoritmos que abordan el problema de la similitud de secuencias se tienen en diferentes tiempos y espacio de ejecucin y se usan para distintas variantes del problema principal, adems si tomamos en cuenta los algoritmos que abordan el problema de emparejamiento aproximado de secuencias toman diferentes criterios para decidir qu alineamiento es el indicado. Entonces qu tiempo y espacio de ejecucin son los indicados? adems qu criterio de decisin es el apropiado? es lo que se formula en el contexto del ADN mitocondrial ante esto el problema radica en cmo proceder para comparar los algoritmos de similitud de secuencias de ADN mitocondrial?. En el marco de lo descrito se proceder a comparar dos algoritmos, que a criterio de estar entre los ms comnmente usados, procedente de diferentes familias de algoritmos, los cual estos sern sus r epresentantes, se evaluara qu tan similares son sus alineamientos y grados de similitud de secuencias es decir qu escala correspondiente le otorga cada algoritmo, por lo que de esta manera se proceder a su comparacin. Los algoritmos a comparar son:

1. Un algoritmo de programacin dinmica:


El algoritmo de Needleman-Wunsch el cual pertenece a la familia de la programacin dinmica y ms generalmente los de tipo emparejamiento aproximado.

2. Un algoritmo de procesamiento de secuencias:


El algoritmo de Weiner que procede de los algoritmos de generacin de rboles de sufijos el cual da un formato que mejora el tiempo de procesamiento de varios algoritmos Por tal motivo comparar los diferentes algoritmos procedentes de diferentes familias es importante saber cmo se comporta estos algoritmos con secuencias como del ADN mitocondrial, ya que estos ltimos se encuentran inmersos en diferentes investigaciones debido a su amplia vinculacin con enfermedades genticas como el Parkinson , Alzheimer , diabetes , cncer de prstata , cncer de mama y otros.

2 Investigacin propuesta
La investigacin propuesta acontinuacion trata especficamente en la tratar de determinar el mejor algoritmo en cuanto a tiempo de ejecucin de los algoritmos de secuenciamiento de caracteres para lo cual tomaremos en este proyecto 2 algoritmos de investigacin el algoritmo de Weiner y el algoritmo de Needleman-Wunsch se proceder a comparar dos algoritmos, que a criterio de estar entre los ms comnmente usados, procedente de diferentes familias de algoritmos, los cual estos sern sus representantes, se evaluara qu tan similares son sus alineamientos y grados de similitud de secuencias es decir qu escala correspondiente le otorga cada

algoritmo en este caso se har una evaluacin ms profunda que la abarcada por este autor investigando ms a fondo cada uno de los detalles las cuales se demostraran en tiempo de ejecucin mostradas en el computador.

2.1 Enunciado de tesis


Existen enfermedades relacionadas a las variaciones que pueden presentar el ADN mitocondrial como el Parkinson, Alzheimer, diversos cnceres, diabetes, y otras enfermedades. Para lo cual el procedimiento para distinguir e identificar las caractersticas propias de cada ADN mitocondrial segn la enfermedad a analizar se procede computacionalmente para lo cual se necesita de algoritmos eficientes en tiempo y espacio para los investigadores de las ramas de biologa, medicina, qumica y otros. De esta manera se aporta al desarrollo de productos finales los cuales podrn reparar el ADN mitocondrial mediante drogas, medicamentos u otros procedimientos para as disminuir el nmero de personas afectadas por los males antes mencionados.

Contexto
Existen enfermedades relacionadas a las variaciones que pueden presentar el ADN mitocondrial como el Parkinson, Alzheimer, diversos cnceres, diabetes, y otras enfermedades.

Problema
Para lo cual el procedimiento para distinguir e identificar las caractersticas propias de cada ADN mitocondrial segn la enfermedad a analizar se procede computacionalmente para lo cual se necesita de algoritmos eficientes en tiempo y espacio para los investigadores de las ramas de biologa, medicina, qumica y otros.

Importancia
De esta manera se aporta al desarrollo de productos finales los cuales podrn reparar el ADN mitocondrial mediante drogas, medicamentos u otros procedimientos para as disminuir el nmero de personas afectadas por los males antes mencionados.

Enfoque
Los procedimientos algortmicos para la evaluacin de similitud de secuencias biolgicas como el ADN nuclear, ADN mitocondrial, ARN, protenas, etc. Se tienen en diferentes familias las cuales resuelven el problema en d iferentes tiempos y espacio de ejecucin usados segn qu variante del problema se desean resolver, por tal motivo comparar los diferentes algoritmos procedentes de diferentes familias es importante para saber cmo se comporta estos algoritmos con secuencias como del ADN mitocondrial, ya que estos ltimos se encuentran inmersos en

diferentes investigaciones debido a su amplia vinculacin con enfermedades genticas como el Parkinson , Alzheimer , diabetes , cncer de prstata , cncer de mama y otros.

2.2 Discusin bibliogrfica

y y

http://www.slideshare.net/Erwin20/mi-proyecto-de-pretesis-presentation http://es.wikipedia.org/wiki/Algoritmo_Needleman-Wunsch

2.3 Hiptesis de trabajo


y Para el alineamiento de secuencias, ambas secuencias las cuales pueden ser de nucletidos o aminocidos, dependiendo que si es ADN o una protena lo que se est analizando. El alineamiento tambi n es realizado por secuencias de dos muestras que pueden ser del mismo o aproximado tamao. La eficiencia de un algoritmo se mide en tiempo y espacio de ejecucin El algoritmo de Needleman-Wunsch el cual pertenece a la familia de la programacin dinmica y ms generalmente los de tipo emparejamiento aproximado. El algoritmo de Weiner que procede de los algoritmos de generacin de rboles de sufijos el cual da un formato que mejora el tiempo de procesamiento de varios algoritmos El algoritmo de Needleman-Wunsch es un algoritmo utilizado para realizar alineamientos globales de dos secuencias . Se suele utilizar en el mbito de la bioinformtica para alinear secuencias de protenas o de nucletidos. Se trata de un ejemplo tpico de programacin dinmica. Este algoritmo siempre termina y garantiza que la solucin devuelta es la ptima.

y y

3 Desarrollo del trabajo


Los dos algoritmos a analizar procedentes de diferentes familias de algoritmos y las bases de datos utilizadas que son GenBank y HMDB.

3.1 Objetivos generales y especficos


3.1.1 Objetivo General
Identificar cul algoritmo es el que logra la mejor distancia de Hamming y Levenshtein adems como la mejor eficiencia O() en el tiempo y espacio de ejecucin.

3.1.2 Objetivos especficos


Los objetivos especficos son los siguientes:

          

Investigar sobre algoritmos ms comnmente usados en bioinformtica. Desarrollar y explicar los algoritmos de Needleman-Wunsch y Weiner. Mostrar ejemplos de los algoritmos. Identificar la base de datos adecuada para la evaluacin de los algoritmos. Investigar la bibliografa correspondiente para la implementacin de los algoritmos. Desarrollar los algoritmos a comparar en MATLAB para su evaluacin y anlisis. Ejecutar los algoritmos usando las base de datos elegidas. Recopilar la informacin estadstica de cada producto obtenido de los algoritmos. Medir las distancias de Hamming y Levenshtein de los alineamientos obtenidos. Comparar los resultados obtenidos entre los dos algoritmos. Identificar cual es el que tiene el mejor desempeo segn los planteamientos fijados.

3.2 metodologa de trabajo 3.3 plan de trabajo 3.4 Recursos 3.5 trabajo adelantado. Para el problema del emparejamiento exacto de secuencias se tienen algoritmos como el Z algoritmo de Gusfield, bsqueda de Tndem exactos, reprocesamiento de secuencias en rboles de sufijos, el algoritmo de Boyer-Moore, el algoritmo de Knuth-Morris y otros. Para el problema de emparejamiento aproximado tenemos varios tipos de algoritmos, entre los cuales podemos citar a la programacin dinmica , autmatas finitos, filtradores, mayor subsecuencia comn aproximada, bsqueda de tndem repetidos aproximados, algoritmos que usan la distancia de Levenshtein, algoritmos que usan la distancia de Hamming y distancia de episodios. Especficamente los algoritmos ms conocidos tenemos al algoritmo de Needleman-Wunsch, el algoritmo de Smith-Waterman, FASTA, BLAST y otros. Tambin se tienen otros tipos de algoritmos y tcnicas computacionales como redes neuronales, algoritmos genticos, mtodos estocsticos, algoritmos de aprendizaje y otras tcnicas relacionadas a la inteligencia artificial.

3.6 resultados esperados. En el presente trabajo se pretende evaluar y comparar dos algoritmos descritos anteriormente los cuales son: 1. Un algoritmo de programacion dinamica: El algoritmo de Needleman-Wunsch. 2. Un algoritmo de procesamiento de secuencias: El algoritmo de Weiner.