Al menos desde principios del siglo XX se empezó a sospechar que la información genética guardaba relación con la molécula más abundante en el núcleo de las células, el ADN, que era el principal constituyente de los cromosomas.
El nombre completo del ADN es ácido desoxirribonucleico. Es una molécula con estructura fibrilar, es decir, en forma de hilo, enormemente larga, que está formada por la unión de miles de moléculas más pequeñas llamadas nucleótidos.
Las células utilizan con frecuencia este mecanismo para construir moléculas de gran tamaño: unen entre sí moléculas pequeñas, de naturaleza similar, formando largas cadenas. Las moléculas pequeñas, cuando forman parte de otras más grandes se denominan "monómeros", mientras que las cadenas formadas por ellas se denominan genéricamente "polímeros". Los polímeros están formados por moléculas del mismo tipo (por ejemplo glúcidos, aminoácidos o nucleótidos), que pueden ser iguales entre sí (homopolímeros) o diferentes (heteropolímeros). Con esta estrategia las células consiguen dar un doble uso a sus componentes: además de las funciones que realizan los monómeros, consiguen crear otras moléculas con función diferente, gracias a su tamaño y a su estructura. Los principales polímeros celulares son los polisacáridos, formados por glúcidos, las proteínas, formadas por aminoácidos, y los ácidos nucleicos, formados por nucleótidos.
Los nucleótidos son una familia de compuestos químicos que tienen la misma estructura: una base nitrogenada unida a un monosacárido de cinco carbonos que, a su vez, está unido a uno o varios grupos fosfato. Los seres vivos utilizamos varios tipos de nucleótidos, más o menos unos cincuenta, porque estas sustancias tienen una cierta variabilidad dentro de esa estructura común:
- Se usan dos tipos de monosacáridos, la ribosa y la desoxirribosa, que dan lugar a dos tipos de nucleótidos: ribonucleótidos y desoxirribonucleótidos.
- Pueden incluir uno, dos o tres grupos fosfato.
- La base nitrogenada puede ser de diferentes tipos. Esta diferencia es la más significativa, especialmente dentro de los ácidos nucleicos.
Los nucleótidos son fundamentales para el funcionamiento celular, incluso cuando no forman parte de los ácidos nucleicos. Uno de ellos, el ATP, acumula en sus enlaces la mayor parte de la energía que la célula necesita para su actividad cotidiana, mientras que otro, llamado NADH, permite que la célula evite la oxidación de otras sustancias.
Cuando los nucleótidos se unen entre sí formando cadenas dan lugar a los ácidos nucleicos. Si incluyen ribosa en su composición el ácido nucleico que se forma se denomina ácido ribonucleico (ARN), mientras que si contienen desoxirribosa dan lugar al ADN.
En los ácidos nucleicos los nucleótidos se unen entre sí formando un "esqueleto" de fosfatos y monosacáridos del que "cuelgan" las bases nitrogenadas. En cada molécula de ácido nucleico puede haber cuatro tipos de bases que forman una secuencia. Las bases nitrogenadas que aparecen en el ADN son la Adenina (A), la Citosina (C), la Guanina (G) y la Timina (T), mientras que en el ARN esta última es remplazada por el Uracilo (U), con la que guarda un gran parecido químico. Estas bases pueden ordenarse de cualquier forma posible, repitiéndose indefinidamente, de modo que un ácido nucleico puede presentar cualquier secuencia posible de nucleótidos.
Los ácidos nucleicos y la información
Los seres vivos necesitamos información y, para que nos resulte útil, necesitamos también un mecanismo que nos permita "gestionarla". Ese mecanismo necesita cumplir ciertos requisitos: debe permitir almacenar esa información, transmitirla (por ejemplo de padres a hijos, o de célula madre a células hijas) y expresarla, es decir, hacer que su contenido se transforme en elementos funcionales. Para que los ácidos nucleicos puedan servir como sistemas de gestión de información sus características químicas deberían explicar estos tres procesos. La confirmación de que el ADN puede cumplir esa función se consiguió cuando se descubrió la estructura tridimensional de esta molécula, ya que sus características permitieron explicar el modo en que esos procesos pueden llevarse a cabo.
La estructura del ADN
En 1962 James D. Watson y Francis H. Crick consiguieron establecer la estructura tridimensional del ADN. Estos investigadores descubrieron que las bases nitrogenadas que forman parte de los nucleótidos tienen cierta afinidad química entre sí, de modo que pueden formar enlaces débiles, específicos: la Adenina forma enlaces con la Timina, pero no con las otras bases, mientras que la Citosina se empareja con la Guanina, y no de otro modo. Gracias a estas relaciones específicas, que constituyen lo que se conoce como "principio de complementariedad de bases", fueron capaces de explicar algunas características químicas del ADN que se conocían desde antiguo (reglas de Chargaff) y de proponer un modelo de estructura del ADN.
Según Watson y Crick cada cromátide de un cromosoma estaría constituida, en realidad, por dos hebras de ADN, complementarias entre sí. Que las dos hebras sean complementarias significa que, si en una de las hebras aparece, en una cierta posición, una base nitrogenada, por ejemplo Adenina, en la otra cadena debe aparecer, necesariamente, la Timina, que es su base complementaria. Del mismo modo, si en una cadena aparece la Guanina, en la otra debe aparecer, por fuerza, la Citosina.
Gracias a la complementariedad de bases, a que las bases complementarias se atraen entre sí formando enlaces débiles, las dos cadenas permanecen unidas y se enrollan una en torno a la otra formando una estructura con forma de "doble hélice". El modelo de Watson y Crick puede observarse mediante técnicas de estudio adecuadas, como la difracción de rayos X, y actualmente se considera que refleja fielmente la disposición de los nucleótidos en el ADN de los seres vivos. Este modelo permite explicar, con relativa facilidad, el papel del ADN como sistema de información en los organismos.
Los ácidos nucleicos almacenan información
Nosotros gestionamos nuestra información por medio del lenguaje. Para expresar mensajes distintos, por ejemplo para diferenciar entre conceptos distintos como "ramo" o "mora" utilizamos palabras diferentes. Pero cada palabra es, al fin y al cabo, una secuencia de signos ordenados de un modo concreto. La naturaleza de los signos no tiene demasiada importancia: en el lenguaje hablado son sonidos, pero en el lenguaje escrito son letras. Pueden ser también números, o ideogramas... Lo importante es el orden en que se encuentran, la posibilidad de ordenarlos de diferente manera. En el ejemplo anterior se han utilizado los mismos signos, "a", "m", "o" y "r", dispuestos en orden diferente, lo que ha dado lugar a mensajes distintos.
Los ácidos nucleicos también presentan esta característica. Una molécula de ADN es una sucesión de nucleótidos diferentes entre sí. Cada nucleótido juega el papel de un "signo", y como pueden ordenarse de formas distintas, las diferentes secuencias dan lugar a mensajes distintos, como en el lenguaje escrito. Los grupos de signos juegan el mismo papel que las "palabras" o las "frases" en el lenguaje. Por lo tanto, la naturaleza de los ácidos nucleicos, su carácter de heteropolímeros, explica cómo pueden ser usados para almacenar información.
Según el modelo de Watson y Crick, una cadena de ADN puede tener cualquier secuencia de nucleótidos, sin ninguna restricción. La estructura del ADN en su conjunto está determinada por la relación entre las dos cadenas, de modo que si nos fijamos en una de ellas la otra sí está fijada, porque es su complementaria.
La célula contiene otros heteropolímeros, como las proteínas, que también son moléculas "informativas", aunque en este caso los organismos utilizamos directamente la información contenida en ellas para realizar las funciones que necesitamos desempeñar.
ADN y transmisión de la información
Poder almacenar información no es suficiente para ser útil como sistema de gestión de información. Los seres vivos se caracterizan por su capacidad para reproducirse, y eso implica que puedan transmitir su información a otros organismos, a ser posible sin que se produzcan cambios en ella. La estructura del ADN también explica el modo en que esto puede ocurrir.
Los enlaces que se establecen entre las dos cadenas de la molécula de ADN son débiles, lo que significa que pueden deshacerse con cierta facilidad. Gracias al principio de complementariedad de bases, si se separan entre sí las dos hebras que forman la molécula de ADN, cada una de ellas puede servir de modelo para una nueva cadena complementaria, de modo que a partir de una única molécula se pueden formar dos que contengan la misma información que la original. Este proceso puede repetirse indefinidamente, sin que la información sufra cambios.
El modelo también explica por qué pueden producirse, ocasionalmente, cambios en la información genética (mutaciones), debido a errores durante el proceso de copia. Si, por accidente, una de las bases del ADN es sustituida por otra, en el siguiente proceso de copia de la información se habrá introducido un cambio en la información genética como si, en el lenguaje escrito, nosotros sustituimos una letra por otra.
ADN y expresión de la información
La información genética de las células se expresa mediante la síntesis de proteínas. Esto significa que lo que las células utilizan para realizar sus funciones, sus herramientas, son, en realidad, las moléculas de proteína. Cada proteína diferente tiene una función concreta, y expresar la información genética significa seguir las instrucciones contenidas en ella para construir una proteína concreta, que nos sirva para llevar a cabo la función que queremos realizar.
Las proteínas son heteropolímeros de aminoácidos, y la función que realizan depende de su estructura, de su forma tridimensional, que a su vez está determinada por la secuencia de esos aminoácidos. Por lo tanto, para construir una proteína concreta es necesario saber, en cada momento, qué aminoácido debe ir situado en una posición determinada. Esto hace "equivalente" la información que contienen los ácidos nucleicos (la posición de cada nucleótido) con la que contienen las proteínas (la posición de cada aminoácido), simplemente es necesario traducir la información de un lenguaje (ácidos nucleicos) a otro (proteínas).
Sabemos que este proceso tiene lugar en los ribosomas. En ellos, la información de los ácidos nucleicos es leída por el orgánulo y utilizada para ir colocando sucesivos aminoácidos en la cadena de proteína. Este proceso de traducción es totalmente literal, es decir, se lleva a cabo "palabra a palabra", de modo que cada "palabra" contenida en la molécula de ácido nucleico equivale a una "palabra" en la proteína.
(El número de signos de los ácidos nucleicos es más pequeño que el de "palabras" necesarias para construir las proteínas: hay cuatro nucleótidos distintos para expresar veinte aminoácidos diferentes. Esto se resuelve combinando los signos, los nucleótidos, para formar "palabras", como hacemos en el lenguaje. En el caso de los ácidos nucleicos, todas las palabras tienen la misma longitud, tres nucleótidos, lo que hace un total de 64 palabras diferentes, más que suficientes para los veinte aminoácidos que forman las proteínas).
La expresión de la información genética, en todo caso, utiliza un intermediario: los ribosomas no leen directamente la información del ADN, sino que ésta se copia a una molécula de ARN llamada mensajero. Esta molécula, en los eucariotas, sale del núcleo a través de los poros y se asocia con los ribosomas, donde ocurre la traducción. La copia del ADN a ARN sigue los mismos principios que la duplicación del ARN, con la diferencia de que la base complementaria a la Adenina es el Uracilo (la Timina no forma parte del ARN).
Posiblemente, la explicación de que exista este intermedio sea de naturaleza evolutiva (el ARN apareció históricamente antes que el ADN), y ahora tiene ventajas para los seres vivos, ya que permite mantener protegido al ADN; el ARN mensajero, que es como se llama la molécula que lleva la información hasta los ribosomas, se degrada después de ser utilizado.
La expresión de la información genética
De acuerdo con lo anterior, podríamos decir que la expresión de la información genética es el conjunto de procesos que permite elaborar moléculas funcionales (proteínas) siguiendo las instrucciones contenidas en el ADN y dar lugar a nuevas células que posean la información genética de la original. Esto incluye varios subprocesos que tienen lugar de manera ordenada y organizada en la célula:
- La replicación o duplicación del ADN es el proceso mediante el cual una molécula de ADN se copia a sí misma para dar lugar a dos moléculas idénticas entre sí, pasando de una doble hélice a dos dobles hélices. Solo tiene lugar antes de que la célula se vaya a dividir.
- La transcripción es el proceso mediante el cual un fragmento de una molécula de ADN se copia para dar lugar a una molécula de ARN. El ARN, a diferencia del ADN, tiene una única cadena de nucleótidos, no forma dobles hélices. El proceso de transcripción ocurre en el núcleo de las células eucariotas, y tiene lugar cada vez que la célula necesita producir nuevas copias de una proteína específica, o cuando necesita formar nuevos ribosomas.
- La traducción es la producción de proteínas específicas según las instrucciones contenidas en una molécula de ARN. Ocurre en los ribosomas, que se encuentran en el citoplasma o asociados a las membranas del retículo endoplásmico rugoso, y se produce cada vez que la célula necesita elaborar una proteína específica.
Todos los procesos relacionados con la actividad de los ácidos nucleicos necesitan, además, la participación de proteínas que son las realmente encargadas de llevarlos a cabo. Es decir, tanto durante la replicación como en la transcripción y en la traducción intervienen, además de los ácidos nucleicos, un considerable número de proteínas diferentes, que no se han nombrado para no complicar más la explicación, pero sin cuya intervención no podrían tener lugar.