El último paso en la expresión de la información genética es la elaboración de proteínas, las moléculas que realizan la práctica totalidad de las funciones celulares. La célula tiene miles de proteínas distintas, cada una de las cuales es capaz de llevar a cabo un proceso biológico (catálisis de una reacción química, reconocimiento de señales, transporte de sustancias...) gracias a que su estructura tridimensional se adapta a dicho proceso y, a su vez, esa adaptación entre estructura y función es posible porque la estructura de cada proteína está perfectamente establecida, de modo que cuando se elabora una nueva molécula de esa sustancia existe la seguridad de que va a ser idéntica a todas las demás moléculas de ese tipo que existen en la célula.
Para que eso sea posible es necesario contar con dos elementos que garanticen el proceso: un sistema que almacene la información y la transmita de forma segura y fiable y otro que permita utilizar esa información, "leerla", para elaborar la proteína concreta. El primer sistema es la replicación del ADN. El segundo incluye, a su vez, dos pasos: la transcripción, que transfiere la información al ARN, y la traducción, que es el proceso concreto mediante el cual la célula utiliza la información contenida en el ARN mensajero para producir una proteína determinada.
El proceso de traducción, que "concluye" la expresión genética, resulta de importancia vital para el funcionamiento de los organismos. Cada célula necesita tener, en cada momento, un subconjunto concreto de las proteínas que es teóricamente capaz de producir, en una cantidad concreta, ni más ni menos, y cada una de esas proteínas debe poseer la secuencia precisa de aminoácidos para ser funcional. Cualquier error en ese proceso supone consecuencias negativas para la célula; en el rango más bajo, que la proteína errónea no sirva para nada, con lo que la célula habrá desperdiciado recursos y energía en la elaboración de una molécula inútil. En el peor de los casos, el mal funcionamiento de una o unas pocas proteínas puede hacer que la célula en su conjunto trabaje de forma errónea, lo que puede llevarle al suicidio celular (la apoptosis es un proceso programado mediante el cual una célula que funciona de modo incorrecto se autodestruye) o a su transformación en una célula maligna, que puede ser el inicio de un tumor.
Traducción e información
La síntesis de una proteína determinada necesita, como ya se ha comentado muchas veces, información. A diferencia de lo que ocurre con los homopolímeros, cada monómero que se incorpora a la cadena puede ser diferente. El proceso también es diferente a lo que ocurre en la formación de heteropolímeros "regulares", como los heteropolisacáridos, en los que existe una pauta que se repite regularmente. En su lugar, en la síntesis de proteínas es necesario que se incorpore en cada posición un aminoácido concreto, sin que exista ningún patrón regular que determine cuál debe ser para conseguir que la proteína alcance su estructura primaria correcta, de la que dependerán el resto de los niveles estructurales y, finalmente, su función. Por ello, hace falta un "modelo" cuya información seguir. Este modelo es, precisamente, el ácido ribonucleico mensajero.
La información que contiene el ARN mensajero está codificada en un lenguaje de cuatro símbolos, las cuatro bases que varían en él, mientras que cada proteína puede necesitar hasta veinte tipos distintos de aminoácidos para formarse. Los símbolos del ARN se agrupan de tres en tres formando "palabras", con lo que existen 64 combinaciones distintas, cada una de las cuales puede dar lugar a un único aminoácido. La relación que existe entre las diferentes "palabras" de ARN, más propiamente llamadas tripletes de bases o codones, y los aminoácidos a cuya incorporación en la proteína corresponden constituye el código genético.
Resumiendo: la célula utiliza dos lenguajes diferentes para gestionar su información: uno, el de los ácidos nucleicos, posee cuatro símbolos distintos combinados para formar "palabras" de tres unidades cada una, por lo que cuenta con un total de 64 elementos diferentes. El nombre que recibe cada uno de esos elementos es distinto en función de en qué molécula se encuentren: se denominan codógenos cuando hablamos del ADN, codones si nos referimos al ARN mensajero y sus moléculas complementarias en el ARN transferente reciben el nombre de anticodones. El otro lenguaje es el de las proteínas, que utiliza veinte "palabras" unitarias, los aminoácidos. Existe, por último, una relación, una "tabla de equivalencias" entre las palabras de los dos idiomas, que recibe el nombre de código genético.
La diferencia en el número de elementos entre los dos lenguajes no es demasiado grave; por una parte, tres de los codones no tienen "traducción" en el lenguaje de las proteínas, y reciben el nombre de codones "sin sentido", aunque en realidad juegan un papel fundamental: el de indicar que se ha alcanzado el final del mensaje, por lo que reciben también el nombre, mucho más apropiado, de "codones stop". Por otra parte, puede darse el caso de que varios codones "signifiquen" lo mismo en el lenguaje de las proteínas, por lo que se habla de "codones sinónimos". Hay que destacar que esto no "degrada" el mensaje, porque la información necesaria para llevar a cabo los procesos celulares es la que está codificada en las proteínas, y la existencia de codones sinónimos no supone ninguna ambigüedad. La existencia de codones sinónimos, es decir, de combinaciones diferentes de bases que dan lugar al mismo aminoácido, es una de las características del código genético. Para referirse a ella se suele decir que el código genético está degenerado.
El código tiene otras características fundamentales para comprender el funcionamiento de la expresión genética. Tales características son las siguientes:
- Es un código lineal, lo que significa que las "palabras" en lenguaje de ácidos nucleicos son leidas secuencialmente, y traducidas también secuencialmente al lenguaje de las proteínas. Esto establece una equivalencia "uno a uno": un codón es responsable de la inclusión de un aminoácido en la proteína en formación.
- Es continuo, lo que significa que no hay "espacios" entre palabra y palabra: todas las bases nitrogenadas de un fragmento de ARN mensajero se utilizan en la síntesis de proteínas, de modo que no queda ninguna entre la última de un codón y la primera del siguiente.
- Es universal (o casi): todos los seres vivos utilizan el mismo código genético. Esto es una muestra de la antigüedad y de la importancia del código. De su antigüedad, porque todos los seres vivos lo comparten, lo que significa que todos ellos proceden del mismo antepasado común que ya lo utilizaba. De su importancia, porque demuestra que las mutaciones que, a lo largo del proceso evolutivo, necesariamente ha tenido que sufrir, no han podido mantenerse en los organismos, debido a que sus efectos negativos lo impedían.
En realidad, el análisis de la degeneración del código, y de pequeñas modificaciones del mismo que se dan en bacterias, mitocondrias y cloroplastos, ha llevado a formular una hipótesis acerca de su posible evolución. Se supone que, en un pasado muy remoto, debieron existir organismos que necesitaban un menor número de aminoácidos para producir sus proteínas, por lo que el código genético podría haber sido más sencillo, concretamente de dos bases por aminoácido. Sin embargo, el incremento de la complejidad de los organismos debió forzarles a incorporar un mayor número de aminoácidos por proteína, razón por la cual el código debió pasar de tener dos bases por aminoácido a tener tres bases por aminoácidos. Esto explicaría el hecho de que prácticamente todos los codones sinónimos compartan las dos primeras bases (las que habrían servido para uno de los aminoácidos en la primera fase de la evolución) y difieran en la tercera.
Excelente información!
ResponderEliminar