Anda di halaman 1dari 12

Curso: Introduccin a la Bioinformtica

Introduccin al diseo de primers


INTRODUCCIN Esta gua es una breve aproximacin al diseo de primers, utilizando programas bioinformticos y pretende dar una orientacin a aquellas personas que estn incursionando por primera vez en esta amplsima disciplina que es la Bioinformtica. Si esta gua orienta y ayuda al cientfico a realizar sus propios primers o cebadores, ha logrado su cometido. En la primera parte de esta gua, revisaremos algunos conceptos generales pertinentes al diseo de primer y a la amplificacin enzimtica de ADN mediante PCR, y en la segunda se detalla un taller que le permitir poner en prctica la mayora de los conceptos revisados. PARTE I Fundamentos tericos de la amplificacin enzimtica de ADN mediante la Reaccin en Cadena de la Polimerasa (PCR; polymerase chain raction) La Reaccin en Cadena de la Polimerasa es una tcnica que ha revolucionado el modo de manipular, clonar y detectar fragmentos de ADN, lo que le ha valido a su descubridor K. B. Mullis el Premio Nobel. Despus de su descubrimiento en 1983, se ha convertido en una de las tcnicas bsicas de Biologa Molecular, ampliamente utilizada debido a su rapidez, especificidad, flexibilidad y aplicabilidad. Entre sus aplicaciones generales encontramos la generacin de sondas, clonacin, secuenciacin, diagnstico clnico y tipificacin de individuos y microorganismos, siendo entonces muy utilizada en medicina forense y en estudios filogenticos. Un ciclo de PCR comienza con un calentamiento inicial que desnaturaliza el ADN blanco a 94-95 C o ms. Este primer paso del ciclo dura en promedio 90 s a 3 minutos. En el proceso de desnaturalizacin, las dos cadenas del ADN se separan una de la otra y permiten que la matriz (template) se encuentre como cadena simple, necesaria para la actividad llevada a cabo por la polimerasa termoestable durante los pasos de amplificacin. En el siguiente paso del ciclo, la temperatura se reduce a un valor que oscila en el rango de los 40 C a los 60 C. A esta temperatura, cada uno de los oligonucletidos (primers) hibrida con la secuencia complementaria en cada una de las cadenas simples de ADN, que se han separado en el paso anterior, y sirven como cebadores para la sntesis, por la polimerasa termoestable. La sntesis de ADN se inicia cuando la temperatura de la reaccin llega al valor ptimo para la actividad de la polimerasa. Para la mayora de las polimerasas esta temperatura se encuentra en, aproximadamente los 72 C. Luego se permite la sntesis durante 30 s a 2 min. Este paso completa un ciclo y el siguiente ciclo se inicia con el retorno a los 94-95 C para la desnaturalizacin. La cantidad de amplificado resultante va a depender de la disponibilidad de sustrato para la reaccin por eso, los oligonucletidos y los desoxirribonucltidos trifosforilados se
Lic. en Gentica Ernesto Martn Giorgio

Curso: Introduccin a la Bioinformtica

aaden en exceso respecto al ADN a amplificar. Como es fcil inferir, la concentracin de ADN, oligonucletidos, de y ADN polimerasa activa disminuyen despus de cada ciclo debido a la sntesis que se est produciendo por lo que la reaccin lleva a un mximo de amplificacin, luego del cual el rendimiento y el nmero de copias obtenidas no aumentan. A esto se lo conoce como el efecto Platteau. En la reaccin de PCR ideal, existen tres fragmentos de cidos nucleicos. El fragmento de ADN de doble cadena a ser amplificado (molcula blanco o target) y dos oligonucletidos de cadena simple que hibridizan en alguna regin del ADN blanco (iniciadores o primers). Adems estn presentes: un componente proteico (la enzima ADN polimerasa), desoxirribonucletidos trifosfatos (dATP, dCTP, dTTP y dGTP), buffers y sales. Los primers se aaden en un vasto exceso comparado con el ADN blanco a ser amplificado. Estos se hibridizan a las cadenas opuestas del blanco y se orientan enfrentndose con sus respectivos terminales 3, de manera tal que la sntesis llevada a cabo por la ADN polimerasa se extiende a travs de todo el segmento del ADN blanco situado entre ellos. Recordemos que la enzima ADN polimerasa cataliza el crecimiento de cadenas de ADN nuevas en la direccin 5 > 3.

La primera ronda de sntesis resulta en la generacin de cadenas de ADN nuevas sin una longitud determinada, las cuales como las cadenas parentales, se pueden hibridizar a los primers luego de la desnaturalizacin e hibridizacin. Estos productos se acumulan con una progresin aritmtica a travs de los ciclos siguientes. Sin embargo, el segundo ciclo de desnaturalizacin, hibridizacin y sntesis, produce dos productos de cadena simple que componen en conjunto un producto de doble cadena en el cual posee la longitud exacta del fragmento original delimitado entre los primers. Cada cadena de este producto discreto es complementaria a uno de los dos primers incluidos en la reaccin y puede en consecuencia participar como blanco en los ciclos subsiguientes.

Lic. en Gentica Ernesto Martn Giorgio

Curso: Introduccin a la Bioinformtica

La cantidad de este producto se duplica con cada ciclo subsiguiente, acumulndose exponencialmente. As, treinta ciclos de desnaturalizacin, hibridizacin y sntesis resultan tericamente en un factor de amplificacin de 236 veces (68 billones de copias) del producto molecular original. Una PCR ideal debera ser altamente especfica, fiel y de gran rendimiento. Cada uno de estos parmetros est influido por varios componentes de la propia reaccin por lo que muchos casos ajustando las condiciones para la mxima especificidad no se obtiene buen rendimiento, o bien optimizando para la fidelidad no se obtiene buena eficiencia. En consecuencia, cada vez que se optimiza una PCR hay que tener en cuenta distintos aspectos que hacen que dicha reaccin sea exitosa. Cules son los factores de los que depende una PCR exitosa? Aunque el concepto de la PCR es simple, el desarrollo de una reaccin exitosa depende de un nmero de factores. Algunos de ellos son: Diseo de los oligonucletidos iniciadores o cebadores (primers):

El diseo cuidadoso de primers es uno de los aspectos ms importantes de la PCR. Primers mal diseados pueden amplificar otros fragmentos de ADN distintos a los buscados (amplificacin inespecfica). En el diseo de los mismos algunas reglas se han demostrado como tiles, por ejemplo: I Cada primer individual debe contar con una longitud de 18-24 bases. II Se debe mantener un contenido de G:C (Guanina:Citosina) entre 40 y 60 %. III Los dos primers del par deben de tener temperatura de fusin Tm cercanos, dentro de los 5 C. IV La secuencia de los primers individuales debe iniciarse y terminarse con 1 o 2 bases pricas. V Evitar regiones con potencialidad para formar estructuras secundarias internas. VI Evitar poli X. VII Secuencias adicionales pueden ser agregadas en el extremo 5 del primer (no incluir cuando se estima la Tm del primer). VIII Se pueden agregar degeneraciones en algunas posiciones del primer: a - Se incrementa el riesgo de amplificacin inespecfica. b - Se disminuye la concentracin en la mezcla de cada uno de los primers posibles c - No se recomienda utilizar ms de 64 primers diferentes en la mezcla. d - Cdigo IUPAC/IUB: A C G T N M V adenina citosina guanina timidina en el ADN Uracilo en el ARN AoCoGoT AoC A o C o G; no T R W S Y K H B D AoG AoT CoG CoT GoT A o C o T; no G C o G o T; no A A o G o T; no C

Lic. en Gentica Ernesto Martn Giorgio

Curso: Introduccin a la Bioinformtica

Concentracin del Cloruro de Magnesio:

En ausencia de concentraciones adecuadas del in Mg++ libre la ADN polimerasa es inactiva, por lo tanto, la concentracin de Magnesio es un factor crucial que afecta el desarrollo de la PCR. Muchos de los componentes de la reaccin unen Magnesio, incluyendo la matriz de ADN, agentes quelantes presentes en la muestra (EDTA o Citrato), dNTPs y protenas. Como resultado, se puede ver afectada la cantidad de Mg++ libre presente en la reaccin. Por otro lado el exceso de Mg++ disminuye la fidelidad de la enzima y puede incrementar el nivel de amplificacin no especfica. Por lo tanto, para cada protocolo de amplificacin por PCR se deben optimizar las concentraciones de Cl2Mg entre los rangos de 1 a 9 mM finales (esto se logra de manera experimental comparando el nivel de amplificacin logrado con diferentes concentraciones de Mg++, proceso conocido como titulacin de Mg++). Eleccin de las enzimas:

La eleccin de las enzimas para ser usada en PCR depende de varios factores. Entre las ventajas obtenidas mediante la utilizacin de polimerasas termoestables, comnmente Taq, esta la habilidad de sintetizar ADN a altas temperaturas (alrededor de 72 C); las cuales permiten principalmente la eliminacin de la mayora de las estructuras secundarias presentes en la molcula blanco. Sin embargo, no todas las polimerasas termoestables son igualmente eficaces a la hora de amplificar. Taq no posee la actividad correctora 3- 5 con lo que su tasa de error es del orden de 10-4 errores por par de bases incorporadas, Vent del orden de 10-5 y Pfu del orden 10-7, siempre considerando que una polimerasa normal tiene una tasa de error de 10-6 errores por par de bases incorporadas. Molde de ADN:

Tendremos que cuantificar el DNA para conocer la masa de cidos nucleicos disuelta, adems de tener indicios acerca de su pureza. Varios autores indican la cantidad de matriz de ADN a agregar a la reaccin, expresndola en micro, nano o picogramos. Con todo, las condiciones ptimas de la PCR siempre acaban por determinarse empricamente. Formacin de dmeros de cebadores (primers dimers) Este artificio ocurre frecuentemente como resultado del apareamiento de bases entre dos cebadores (o eventualmente, un extremo de un cebador sobre s mismo). Dado que la ADN polimerasa elonga en sentido 5 > 3, un oligonucletido cebador puede permitir a la enzima que a partir de su extremo 3 contine polimerizando segn el templado constituido por el otro cebador. Los dmeros ocurren frecuentemente cuando la PCR se realiza por ms de 30 ciclos o cuando la matriz est en muy baja concentracin. Aunque si existe una alta complementariedad entre los primers los primeros cambios de temperatura pueden provocar una predominancia de stos frente al amplicn deseado, perjudicando enormemente al resultado de la PCR.

Lic. en Gentica Ernesto Martn Giorgio

Curso: Introduccin a la Bioinformtica

PARTE II

Primer3
Como la PCR es una herramienta de suma importancia, a la que suelen desembocar muchas investigaciones, es necesario conocerla y utilizarla en cada momento que sea necesario. Aunque siempre tenemos que poner a punto una reaccin de PCR antes de hacer uso extensivo de ella, uno de los pasos fundamentales es contar con los primers y con las caractersticas de los mismos. Esto nos permitir sortear exitosamente uno de los pasos primordiales para obtener la mejor calidad y cantidad del producto de amplificacin. Surge entonces la pregunta: si no existen primers descriptos para amplificar una regin dada cmo los podemos disear y analizar? Sin dudas, tendremos que recurrir a los recursos bioinformticos bsicos, muchos de los cuales se encuentran gratuitamente en Internet. Para disear y analizar un par de primers para ser usados en una reaccin de PCR contamos con varios programas. En ste sencilla gua introductoria, haremos uso de uno denominado Primer3. Primer3 es una aplicacin que se encuentra libre para su uso en diferentes servidores web. En esta oportunidad utilizaremos la implementacin de ste programa ofrecido por la pgina JustBio.com. Este software permite especificar un gran nmero de variables y obtener primers segn las indicaciones solicitadas. Adems permite agregar el nmero de acceso de la secuencia, que se halla en las bases de datos internacionales. Tambin permite discriminar las regiones de la secuencia que se deben incluir, las que se deben excluir y el rango de tamaos del producto. Por otra parte, el software incluye la posibilidad de especificar las caractersticas mnimas de los primers deseados, como Tm, porcentaje de GC, mxima autocomplementariedad, y otros parmetros. Tambin presenta las mismas facilidades si se est buscando y analizando una sonda, por ejemplo, para utilizarse en trabajos de hibridacin. Acceda al programa Primer3 en la siguiente direccin: http://www.justbio.com/. Antes de comenzar con la aplicacin deber registrarse. Luego dirjase a Hosted Tools > Primer3. Despus de unos segundos se encontrar con una pgina web similar a la imagen siguiente:

Lic. en Gentica Ernesto Martn Giorgio

Curso: Introduccin a la Bioinformtica

La pgina principal del programa consiste en un gran recuadro en blanco, en donde debemos pegar la secuencia en formato FASTA. Exactamente debajo de ste recuadro, se encuentran 3 columnas con cuadros de marca permiten seleccionar que es lo que deseamos obtener como salida del programa. Tildando (click) en las columnas de los extremos se obtienen cebadores, y tildando solo la columna del centro se obtiene como salida una sonda. Al mover la ventana del navegador hacia abajo encontrar que Primer3 cuenta con diversas secciones que le permiten controlar una amplia variedad de parmetros relacionados con el diseo de primers. Por favor no se sienta intimidado/a por la cantidad de parmetros modificables por Primer3, la mayora de estos son rara vez modificados, an por los especialistas del diseo de primers. Por ser este, nuestro primer acercamiento al diseo de primers mediante esta herramienta, utilizaremos un set de condiciones mnimas (por default) y la secuencia correspondiente al ARN mensajero que codifica para el gen Gurken en Drosophila melanogaster, nmero de acceso NM_057220.3. Abra otra ventana y dirjase a la pgina del National Center for Biotechnology Information http://www.ncbi.nlm.nih.gov. En la solapa de bsqueda cambie All Database por Nucleotide. A continuacin escriba el nmero de acceso y oprima el botn Search. Visualice y abra la solapa de Display Settings y elija FASTA. Copie la secuencia del gen Gurken y pguela en el Box vacio del Primer3.

Lic. en Gentica Ernesto Martn Giorgio

Curso: Introduccin a la Bioinformtica

Por defecto Primer3 tiene habilitadas las opciones de encontrar tanto un primer corriente arriba (pick left primer or use left primer below) como corriente a bajo de nuestra secuencia. Deshabilitando cualquiera de ellas evitaremos que el programa busque el primer en cuestin. Por otra parte, si tenemos habilitadas estas opciones e ingresamos un primer en la casilla de texto justo debajo de dichas opciones, Primer3 buscar el primer recin ingresado. Por esta vez dejaremos estas opciones tal y como se encuentran. Luego de oprimir el botn PickPrimers y esperar unos segundos, aparecer ahora la pgina de resultados de Primer3:

Lic. en Gentica Ernesto Martn Giorgio

Curso: Introduccin a la Bioinformtica

Los resultados se obtienen en pocos segundos y se presentan en una tabla, cuyo ttulo es Primer3 Output. Estos incluyen un mapa de los mejores pares de oligonucletidos (leftizquierdo, right-derecho) de acuerdo a las especificaciones dadas en el formulario. Adems, y por defecto, Primer3 muestra 4 opciones de primers opcionales (en la seccin Additional Oligos). La posicin (start), el tamao (len), la temperatura de melting (Tm) y el porcentaje de GC (GC%) estn presentes para cada par de oligonucletidos. Si bien, la mayora de estos datos arrojados en la pgina de resultados son bastante explcitos, tal vez los ms confusos sean las columnas denotadas como any y 3'. any: Mxima Complementariedad (o denominada Autocomplementariedad Local): refleja el mximo alineamiento local permisible. Se toma como predictora de la tendencia de los primers a hibridar entre ellos. 3: Mxima Complementariedad 3 ( denominado Alineamiento Global Anclado en 3) es un puntaje mximo permisible cuando se testea la complementariedad entre los primers izquierdo y derecho. Se toma para predecir la probabilidad de generacin de dmeros de primers durante la reaccin de PCR. Como habr notado el programa resulta bastante sencillo de utilizar, la clave para su utilizacin se encuentra en el conocimiento que tengamos acerca de los diferentes parmetros que van a guiar nuestra reaccin de PCR. La manera de operar con Primer3 es bsicamente la misma para cualquiera de las otras 70 opciones disponibles. Vare las diferentes opciones disponibles en Primer3 y familiarcese con algunas de ellas, y aplique las diferentes reglas o consejos generales que se encuentran al comienzo de esta gua para el diseo de primers. Lamentablemente no es posible asegurar con un 100% de certeza que un primer diseado mediante una herramienta bioinformtica va a ser completamente efectivo, pero sin duda le ayudar a aproximarse a la solucin ms ptima de una manera muy rpida y sencilla.

CODEHOP
CODEHOP (COnsensus DEgenerate Hybrid Oligonucleotide Primers) es un programa interactivo que ha sido desarrollado para el diseo de primers degenerados provenientes de bloques conservados de aminocidos dentro de un alineamiento mltiple de secuencias proteicas. El programa se encuentra libre para su uso. Acceda al programa CODEHOP por medio de la siguiente direccin: http://blocks.fhcrc.org/codehop.html. Despus de unos segundos se encontrar con una pgina web similar a la imagen siguiente:

Lic. en Gentica Ernesto Martn Giorgio

Curso: Introduccin a la Bioinformtica

Al mover la ventana del navegador hacia abajo, encontrar algunas secciones (muchas menos en este caso) que le permitir controlar una variedad de parmetros relacionados con el diseo de primers. De forma similar al programa visto anteriormente, por ser este, nuestro primer acercamiento al diseo de primers degenerados mediante esta herramienta, utilizaremos un set de condiciones mnimas (por default) y las secuencia correspondientes a los ARN mensajeros que codifican para la protena del gen Gurken en distintas especies de Drosophila. Los nmeros de acceso son los siguientes NP_476568.2 perteneciente a D. melanogaster, XP_001962566.1 D. ananassae, XP_002018718.1 D. persimilis y XP_002132416.1 D. pseudoobscura pseudoobscura. Abra otra ventana y dirjase a la pgina del National Center for Biotechnology Information http://www.ncbi.nlm.nih.gov. En la solapa de bsqueda cambie All Database por Protein. A continuacin escriba el nmero de acceso y oprima el botn Search. Visualice la solapa de Display Settings y elija FASTA. Copie las secuencias de los genes y pguelas en un Bloc de notas. Realice un alineamiento mltiple con estas secuencias y guarde el archivo con extensin *.clustalw. Vuelva a la pgina principal de CODEHOP y abra el hipervnculo Multiple Alignement Processor. Despus de unos segundos se encontrar con una pgina web similar a la imagen siguiente:

Lic. en Gentica Ernesto Martn Giorgio

Curso: Introduccin a la Bioinformtica

Desplazndose sobre la ventana hacia abajo se encontrar con la siguiente imagen, aqu podr cargar la ruta de acceso de su archivo *.clustalw obtenido por medio del programa que utiliz para el alineamiento mltiple.

Una vez cargado el archivo, oprima el botn Submit, luego de unos segundos aparecer la siguiente ventana:

Lic. en Gentica Ernesto Martn Giorgio

10

Curso: Introduccin a la Bioinformtica

En esta pgina dirjase a la seccin Primers y abra el hipervnculo CODEHOP. Este hipervnculo regresa a la ventana principal del programa y, que en este momento se encuentra cargada con los distintos blocks generados por el programa.

Luego de oprimir el botn Look for primers y esperar unos segundos, aparecer ahora la pgina de resultados de CODEHOP:

Lic. en Gentica Ernesto Martn Giorgio

11

Curso: Introduccin a la Bioinformtica

Los resultados se obtienen en pocos segundos. Estos incluyen el primer sentido y el antisentido, el ndice de degeneracin, el tamao del core, el tamao de clamp, la puntuacin o el score y la temperatura de melting. De igual forma que Primer3, la manera de operar con CODEHOP, es bsicamente la misma para cualquiera de las otras opciones disponibles. Como podr notarlo el programa resulta bastante sencillo de utilizar, y no se olvide que la clave para su utilizacin se encuentra en el conocimiento que tengamos acerca de los diferentes parmetros que van a guiar nuestra seleccin de los primers degenerados. Una vez que haya obtenido sus primers, su responsabilidad final es verificar que ellos no hibridicen en cualquier parte excepto en el lugar que Ud. quiere que hibridicen. Por lo tanto, es muy recomendable que realice un anlisis BLAST, con los primers recin diseados, de tal manera que se asegure que dichos primers no sean complementarios a ninguna de las posibles secuencias involucradas en su reaccin de PCR (por ejemplo, vectores de clonacin). La metodologa para realizar dicho anlisis es la misma que se sigue para cualquier anlisis BLAST, para este propsito puede visitar el servidor NCBI BLAST.

Lic. en Gentica Ernesto Martn Giorgio

12