|
Dar a conocer el Genoma Humano como el descubrimiento más importante para
lahumanidad. OBJETIVOS ESPECIFICOS 1) Conocer y dar a conocer los avances en medicina que los experimentos delos
genomas consigue día a día. 2) Encontrar la respuesta a porque el Genoma nos ayudaría a explicar
muchasenfermedades. 3) Conocer la forma en la cual los experimentos del Genoma Humano encontraríalas
soluciones y curas a los diferentes males que acechan nuestra humanidad. 4) Conocer como ha sido la evolución del Genoma Humano a lo largo del
tiempohasta el día de hoy. ORIGEN Y JUSTIFICACIÓN DEL PROYECTO El PGH es el primer gran esfuerzo
coordinadointernacionalmente en la historia de la Biología. Se propone
determinar lasecuencia completa (más de 3000 .106 pares de bases)
del genomahumano, localizando con exactitud (cartografía) los 100.000
genesaproximadamente y el resto del material hereditario de nuestra
especie,responsables de las instrucciones gen éticas de lo que somos desde el
punto devista biológico. Realmente, lo que llamamos Proyecto Genoma es el término
genéricocon el que designamos una serie de diversas iniciativas para conocer al
máximodetalle los genomas no sólo de humanos, sino de una serie de organismos
modelode todos los dominios de la vida, todo lo cual se espera que dé un
impulsoformidable en el conocimiento de los procesos biológicos (desde la
escalamolecular hasta la evolutiva) y de la fisiología y patología de los
sereshumanos, y que se traducirá en multitud de aplicaciones técnicas y
comercialesen ámbitos como el diagnóstico y terapia de enfermedades,
biotecnologías,instrumental, computación, robótica, etc. Hacia mediados de la década de los años 80 la metodología del
ADNrecombinante y sus técnicas asociadas (vectores de clonación, enzimas
derestricción, transformación artificial de células procariotas y
eucariotas,bibliotecas de genes, sondas moleculares, secuenciación, genética
inversa,PCR, etc.) habían alcanzado una madurez suficiente como para que se
plantearala pertinencia y viabilidad de un proyecto coordinado de caracterizacióndetallada
(hasta nivel de secuencia de nucleótidos) del genoma humano y degenomas de una
serie de organismos modelo. ¿Por qué cartografiar y secuenciar genomas? La biología pretende dar respuestas lo más completas y detalladas
posiblesde los fenómenos vitales. Al ser el ADN la molécula universal de la
herencia,y constituir la base gen ética de la vida, la tendencia natural ha
sidoterminar buscando explicaciones al nivel de ADN. Este conocimiento
molecularpuede dar la clave de muchos fenómenos que hoy entendemos a niveles
menosprofundos ya descritos por otras ciencias biológicas (fisiología, biologíacelular,
bioquímica, etc.). Ha llegado un momento en que se plantea que abordar el estudio detallado
delos genomas de los organismos es mucho menos costoso, y más
interesanteintelectualmente, logrando el conocimiento detallado de la secuencia.
Pero losProyectos Genoma no son más que un punto de arranque para
nuevosdescubrimientos en las ciencias biomédicas. Con los datos de secuencias
habráque trabajar para dar respuestas a cuestiones de expresión de genes,
deregulación gen ética, de interacción de las células con sus entornos, etc. La secuenciación de genomas de plantas y animales domésticos conducirá
anuevos avances en la mejora agronómica y ganadera. Para comprender la evolución será cada vez más esencial el disponer
dedatos de secuencias. La bioinformática permite comparar genes y
genomascompletos, lo que junto con otros datos biológicos y paleontológicos,
estádando nuevas claves de la evolución de la vida. La principal justificación del PGH de cara a la sociedad es la promesa
deavances importantes en Medicina. Aunque el estudio de las enfermedades
enhumanos se ha venido haciendo mayoritariamente en ausencia de su comprensióngen
ética, la disponibilidad de técnicas poderosas anima a emprender lasecuenciación
sistemática, lo que suministrará un formidable impulso sobretodo para las
enfermedades poligénicas y multifactoriales. Una de lasconsecuencias más
inmediatas del PGH (y que ya experimentamos desde hace unos años)es la de
disponer de sondas y marcadores moleculares para el diagnóstico deenfermedades
gen éticas, de cáncer y de enfermedades infecciosas. A plazosmayores. se
espera que a su vez la investigación genómica permita diseñarnuevas
generaciones de fármacos, que sean más específicos y que tiendan atratar las
causas y no sólo los síntomas. La terapia gen ética, aunque aúnen sus
balbucientes inicios, puede aportar soluciones a enfermedades, no sólohereditarias,
sino cáncer y enfermedades infecciosas. Uno de los principales objetivos es desarrollar a corto plazo tecnologías
devanguardia. Es decir, una de las principales justificaciones del PGH es
lanecesidad de impulsar poderosas infraestructuras tecnológicas que deben
deproporcionar a las instituciones, empresas y países implicados un lugar
deprivilegio en la investigación biomédica y en multitud de
aplicacionesindustriales (diagnósticos, terapias, instrumental de laboratorio,
robótica,hardware, software, etc.). Origen del Proyecto Genoma Aunque antes de los años 80 ya se había realizado la secuenciación degenes
sueltos de muchos organismos, así como de "genomas" deentidades
subcelulares (algunos virus y plásmidos), y aunque"flotaba" en el
entorno de algunos grupos de investigación la idea decomprender los genomas de
algunos microorganismos, la concreción institucionaldel PGH comenzó en los
EEUU en 1986 cuando el Ministerio de Energía (DOE), enun congreso en Santa Fe
(NM) planteó dedicar una buena partida presupuestaria asecuenciar el genoma
humano, como medio para afrontar sistemáticamente laevaluación del efecto de
las radiaciones sobre el material hereditario. El añosiguiente, tras un
congreso de biólogos en el Laboratorio de Cold SpringHarbor, se unió a la idea
el Instituto Nacional de la Salud (NIH), otroorganismo público con más
experiencia en biología (pero no tanta como el DOEen la coordinación de
grandes proyectos de investigación). El posterior debatepúblico tuvo la
habilidad de captar la imaginación de los responsables políticos,y ofrecer el
atractivo de que no sólo el PGH era el gran emblema tecnocientíficode finales
de siglo (como lo había sido el Proyecto Apolo en los años 60),sino que uno de
sus fines explícitos era desarrollar tecnologías de vanguardiay conocimiento
directamente aplicable (no sólo en el campo de la biotecnología)que asegurarían
la primacía tecnológica y comercial del país en el sigloXXI. En 1988 se
publicaron informes de la Oficina de Evaluación Tecnológicadel Congreso (OTA)
y del Consejo Nacional de Investigación (NRC), quesupusieron espaldarazos
esenciales para dar luz verde a la Iniciativa. Ese mismoaño se establece la
Organización del Genoma Humano (HUGO), como entidaddestinada a la coordinación
internacional, a evitar duplicaciones de esfuerzos,ya diseminar el conocimiento.
El comienzo oficioso del PGH corresponde a 1990, yse calcula que terminará el
2005. Sus objetivos eran elaborar en una primeraetapa mapas gen éticos y físicos
con suficiente resolución, mientras se poníana punto técnicas más eficientes
de secuenciación, de modo que en la fasefinal se pudiera abordar la secuenciación
de todo el genoma humano. Entre losobjetivos se cuentan igualmente la
caracterización y secuenciación deorganismos modelo, y la creación de
infraestructura tecnológica, entre la quedestacan nuevas herramientas de
hardware y software destinadas a automatizartareas, a procesar la enorme
cantidad de datos que se esperan, ya extraer la máximainformación biológica y
médicamente significativa. Aunque en un principio se calculó que el PGH .americano costaría unos
3000millones de dólares y duraría 15 años, tanto el coste como los plazos
hantenido que ser estimados a la baja, debido a innovaciones tecnológicas
queabaratan y acortan la investigación. Los fondos federales
estadounidensesdedicados hasta ahora (1998) al PGH ascienden a 1.9 mil millones
de dólares(casi 300.000 millones de pesetas). En 1993 los fondos públicos para el PGH fueron 170 millones de dólares,mientras
que la industria gastó 80 millones. Conforme pasa el tiempo, lainversión
privada se está haciendo más importante, e incluso amenaza conadelantarse a
los proyectos financiados con fondos públicos. Recientemente(mayo de 1998), la
empresa TIGR anunció la creación de un proyecto conjuntocon Perkin-Elmer
(fabricante de secuenciadores automáticos) que podríaconducir a terminar por
su cuenta la secuencia humana aun coste equivalente a ladécima parte del
proyecto público y con unos plazos más breves. Para hacerse una idea de las ventajas del PGH con relación a otros ámbitostradicionales
de investigación médica, se pueden dar algunas cifras: El aislamiento por clonación posicional del gen de la fibrosis quísticacostó
$ 30 millones. Se calcula que, de haber tenido un buen mapa como losactuales,
hubiera costado solamente $ 200.000. El desarrollar un nuevo medicamento cuesta como mínimo 50 millones de dólares. El gasto sanitario total estadounidense es de 600 mil millones de dólares. EI NIH está gastando un 2-3% de su presupuesto al PGH. Introducción a los Proyectos Genoma Lo que a finales de 1989 era un proyecto que algunos tachaban de loco, por
locaro, superfluo y utópico que parecía, es ahora una realidad deseada
yaceptada por todos, que se terminará probablemente antes de lo esperado
(2005)y que costará mucho menos de lo previsto. Veamos algunos hitos en el
avance delPGH: En 1987 se construyeron mapas genéticos de ligamiento usando polimorfismosde
tipo RFLP, con una resolución aún baja: 10-15 cM. El primer mapa genético de ligamiento del Génethon (1992), que ya recurrióa
microsatélites, supuso una revolución inmediata en el análisis deligamiento
de las enfermedades con base genética. Su resolución media ya erade 5 cM. La tercera versión del Génethon se publicó en 1996, y ya contenía
unos5000 marcadores microsatélites, separados los consecutivos una media de 0.7
cM(aprox. 700 kb), lo cual ya supera el nivel de detalle especificado en uno
delos objetivos para el primer lustro del PGH. En los últimos años se ha avanzado más en los mapas físicos. Enseptiembre
de 1995 Nature publicó un Directorio del Genoma Humano queincluía un
mapa de contigs de YACs que cubría 75% del genoma. Hudson et alpublicaron un
mapa físico preliminar del 94% del genoma, abarcado por unos15.000 marcadores. Un problema con los YACs es su elevado quimerismo. por lo que hay
quecomplementar los mapas de contigs. Es lo que hizo el Whitehead Institute
afinales de 1995, con la publicación en Science del mapa basado en
STSque incorpora datos de híbridos de radiación (RH). El PGH pretendía balizar el genoma humano con unas 30.000 STSs repartidas
demodo más o menos uniforme, de modo que cada par de STSs contiguas estánseparadas
por una medía de 100.000 pb. Este objetivo acaba de cumplirse, y señalael
punto de partida para la fase final del Proyecto, ya que a partir de aquí
lasecuenciación queda expedita de forma ordenada y significativa, y los
datospueden ser correlacionados con el mapa genético. Una consecuencia casi inmediata de estos avances en cartografía es que
lalocalización, aislamiento (por la llamada clonación del candidato
posicional)y caracterización de genes concretos relacionados con enfermedades
se acelera ysimplifica, haciendo que el coste presupuestario se abarate
notablemente encomparación con los esfuerzos tradicionales en que cada
laboratorio luchaba porseparado durante largos años para lograr clonar algún
gen de interés. Una vez completadas las dos primeras fases del PGH (mapas físicos y gen éticosde
suficiente resolución), el presente año de 1997 va a marcar el asentamientode
la fase clave del PGH, ya que la madurez de los mapas obtenidos hasta ahora ylos
avances y bajos costes en las tecnologías de secuenciación y procesamientode
datos suponen que se pueda dar luz verde a la obtención masiva de secuenciasde
forma sistemática y organizada. Las secuencias van siendo puestas de modo prácticamenteinmediato
a disposición de la comunidad investigadora por medio de varias basesde datos
entrelazadas dentro de Internet. Se espera que la secuenciavirtualmente completa
del genoma humano, está disponible antes del 2005 (sehabla del año 2002). El ritmo de acumulación de secuencias de ADN es vertiginoso, y ya se
doblacada pocos meses. Actualmente se estima que ya se ha secuenciado casi un 2%
degenoma humano, pero este dato no debe engañar: con las técnicas y
ritmosactuales, en los próximos años se obtendrá una tasa de 500 Mb por año. Los costes de secuenciación siguen bajando. En algunos laboratorios cada
parde bases de secuencia definitiva está en 30 centavos de dólar; y se espera
quepronto baje a 10 centavos. Ahora. el reto de la fase final del PGH es obtener secuencias del modo más rápido.barato
y preciso. Para ello, se están diseñando métodos de alto rendimiento, lomás
automatizados posibles. Tras las propuestas iniciales, que partieron del ministerio de energía delos
EEUU (DOE), al que enseguida siguieron los Institutos Nacionales de la
Salud(NIH), quedó claro que este magno proyecto no podía consistir en
lasecuenciación pura y dura, sino que habría de constar de varias
etapasencadenadas, comenzando por la elaboración de mapas gen éticos y físicos
deresolución cada vez mayor. Además, la secuenciación habría de centrarse
enprincipio en las zonas de ADN más interesantes a priori, como las regiones génicascodificadoras,
dejando para una etapa ulterior el análisis del enorme contenidode ADN
repetitivo de distintas clases que existe en el genoma. Simultáneamentehabía
que ir desarrollando toda una infraestructura de técnicas instrumentalesy de análisis
de la información generada (programas informáticos potentespara gestionar las
secuencias y extraer sentido biológico de ellas, nuevosalgoritmos, redes de
ordenadores interconectados, bases de datos entrelazados,etc.). Cartografías genómicas El PGH hace uso de dos tipos de cartografía para caracterizar el
genoma,aunque en última instancia los mapas emanados de los distintos métodos
han deser correlacionados e integrados: cartografía genética de ligamiento,
ycartografía física. Cartografía genética de ligamiento La cartografía genética se basa en el cálculo de la frecuencia a la que
secoheredan formas alternativas (alelos) de dos loci genéticos que están
ligadosformando parte de un mismo cromosoma. Hasta el advenimiento de las técnicasmoleculares,
los mapas genéticos de ligamiento en humanos eran bastanterudimentarios, ya que
en su elaboración no puede intervenir (por obvios motivoséticos) la
experimentación de laboratorio que se usa en animales, y porque losdatos habían
de basarse casi exclusivamente en la comparación de fenotiposnormales y los
mutantes correspondientes a determinadas enfermedades genéticas,y en el recurso
a análisis de familias, a ser posible con registros de variasgeneraciones y con
gran número de individuos. La revolución de la cartografía genética de ligamiento sobrevino cuando
afinales de los años 70 se recurre al análisis molecular de zonas de ADN
nocodificadoras y que son muy polimórficas: existen varios tipos de
secuencias(algunas de ellas de naturaleza repetitiva, como los VNTR, los
microsatélites,etc.), dispersos por el genoma, cada uno de ellos con varios
alelos en el ámbitopoblacional. Entre las ventajas de los microsatélites se
cuentan: contenidoinformativo muy alto, con lo que los análisis estadísticos
mejoran enfiabilidad; distribución abundante y relativamente uniforme por todo
el genoma;y que se pueden ensayar fácilmente mediante PCR. Además, estos loci
genéticossirven en genética clínica como marcadores útiles para localizar
genesrelacionados con enfermedades. Los polimorfismos moleculares han permitido
queen la actualidad el PGH haya generado detallados mapas gen éticos del
genomahumano aun nivel de resolución en torno a 1 centimorgan (cM) o incluso
menos.Esto ya se logró en 1994, un año antes de lo previsto, y en buena parte
conresoluciones mejores (0.7 cM). Cartografía física e integración de los mapas Los mapas físicos tienen como objetivo especificar distancias físicasmensurables
en pares de bases (pb) o alguno de sus múltiplos. Obviamente, elmapa físico de
mayor detalle es la propia secuencia del genoma. Pero antes dellegar a
obtenerla, hay que elaborar mapas físicos partiendo de resolucionesbajas y
avanzando hacia las resoluciones cada vez mayores. En cierta manera, losmapas físicos
de menor resolución son los propios cariotipos: la visualizaciónmicroscópica
de la dotación cromosómica haploide humana teñida con colorantede Giemsa nos
muestra un patrón alternante de bandas claras y oscuras, en elque cada banda
tiene una media de unos 7 millones de pares de bases. Si bien losmétodos
citogenéticos tienen sus limitaciones, no hay que olvidar queactualmente
existen novedosas herramientas de citogenética molecular (como lassondas
fluorescentes in situ o FISH, la "pintura decromosomas", etc.)
que permiten un mayor detalle y que, unidas a otras técnicasaumentan el arsenal
de enfoques para el estudio de los genomas, de su dinámicay de sus
alteraciones. Los mapas físicos de mayor resolución se suelen elaborar a partir
degenotecas (bibliotecas de genes) en las que el genoma a estudiar se
encuentrafragmentado en multitud de trozos aleatorios y desordenados, cada uno
de ellosclonado por separado en un vector adecuado: plásmido, cósmido,
cromosomasartificiales de levadura (YAC), cromosomas artificiales de bacteria
(BAC), etc..La idea para elaborar los mapas físicos es en cierto modo similar a
la deensamblar un rompecabezas: consiste en ordenar los fragmentos del genoma a
basede buscar grupos de fragmentos que tienen alguna zona en común, es decir,
irhallando conjuntos de pares de fragmentos parcialmente solapados. Ello
conduceal concepto de contig: un contig (o cóntigo, como algún autor
españolha traducido) es un conjunto de fragmentos de un genoma que se han
clonado porseparado, pero que son contiguos y que están parcialmente solapados.
Losactuales mapas físicos han de recurrir pues al ensamblaje de esos
fragmentosdentro de un contig, y ulteriormente, los distintos contigs
correspondientes almismo grupo de ligamiento han de ser ensamblados entre sí:
el objetivo final(ideal) sería obtener un gran contig por cada cromosoma, que
describieradetalladamente la posición y distancia física (en bases) de y entre
distintosmarcadores (representados, p. ej. , por dianas para enzimas de
restricción). La cartografía de contigs se puede realizar buscando la
"huelladactilar" común a distintos clones de una genoteca de ADN
humano. Dichahuella puede consistir en un patrón compartido de dianas de
enzimas derestricción (que se puede indagar ayudándose de algoritmos y
programascomputacionales adecuados). Las estrategias más recientes hacen uso de
ADNhumano en forma de unos 20.000 trozos independientes clonados en los
llamadoscromosomas artificiales de levadura (YAC, de sus iniciales inglesas), y
buscandola "huella dactilar común" entre clones a base de la detección
dedeterminadas secuencias repetitivas. Todo el procedimiento está
altamenteautomatizado, como en el famoso laboratorio francés del Génethon,
provisto devarios robots especializados en procesar y analizar las muestras. El último gran hito en cuanto a metodología de mapas físicos ha sido
eldesarrollo de una especie de "marcadores físicos universales", fácilmentegenerables,
que permiten que los datos obtenidos en un laboratorio sean rápidamentecompartidos
y asumidos por toda la comunidad investigadora: se trata de losllamados
"lugares etiquetados por su secuencia" (STS en inglés).Consisten en
trechos cortos de ADN (de entre 100 y 1000 pb) cuya secuenciaexacta se conoce y
se sabe que es única en todo el genoma. Su facilidad de usoy su aceptación
como "lenguaje común" estriba en que una vez que uninvestigador
descubre una STS, cualquier otro puede obtenerla por sí mismo (nisiquiera hace
falta el envío físico de muestras), simplemente fabricando invitro los
cebadores correspondientes a sus extremos y amplificando la STSpor reacción en
cadena de la polimerasa (PCR). Los STS definen puntos concretosúnicos del mapa
físico, y constituyen magníficos "mojones" obalizas fácilmente
detectables. Uno de los objetivos iniciales del PGH era la obtención de mapas físicoscon
unas 30.000 balizas repartidas de modo más o menos uniforme, de modo quecada
dos marcadores consecutivos estén separados una media de 100 kb. Esteobjetivo
se acaba de cumplir, en buena parte debido al empleo de los STS, quepermiten
elaborar mapas de contigs según el contenido de STS de los clonessolapados.
Estos mapas de STS permiten la integración de los mapas gen éticosy físicos,
hacen accesible la fase de secuenciación y facilitan la clonaciónde genes
implicados en enfermedades mediante la llamada estrategia del
candidatoposicional. Una vez que se construyen los mapas, hay que refinarlos y purgarlos
deposibles errores. Los errores suelen tener dos fuentes principales:
algunosclones YACs son en realidad híbridos o quimeras producidas por
artefactosdurante el proceso de elaboración de la genoteca, y por lo tanto su
mapa norefleja el orden genómico auténtico; y por otro lado, los programas
deensamblado de los mapas no son fiables al 100%. De ahí la importancia
deconfirmar normalizar los datos mediante estrategias aceptadas por todos
losinvestigadores. Dentro del PGH se está abordando un enfoque paralelo y
complementarioconsistente en secuenciar los denominados EST (lugares etiquetados
expresables).Se parte de muestras de ARN mensajero aisladas de los distintos
tipos de célulasy tejidos del cuerpo humano, se realiza por transcripción
inversa (conreversotranscriptasa) copias de ADN, y se procede a su secuenciación.
Ellorinde versiones no genómicas, desprovistas de las porciones intrónicas, de
losdistintos genes que se expresan en los diferentes tejidos. Los datos
obtenidosse integran en "mapas funcionales" que muestran el patrón de
expresióndiferencial según su localización anatomo-histológica. Métodos básicos de secuenciación Cada ddNTP se marca con un colorante fluorescente
diferente.Ello permite hacer la electroforesis en el mismo callejón del gel.
Las bandasde ADN son detectadas por su fluorescencia según pasan delante del
detector. Siel detector lo hacemos mover en horizontal, podrá leer varias
secuenciacionesal mismo tiempo. Los datos pasan aun sistema computerizado. Nuevos métodos de secuenciación Microscopías de efecto túnel (STM) y de fuerza atómica (AFM) Microscopía de barrido (scanning) de efecto túnel (STM). Una
finasonda se mantiene muy cerca del objeto (en este caso ADN), por medio de
unsistema de control basado en la detección de una minúscula corriente
inducidapor el efecto túnel entre la punta de la sonda y el ADN. Una técnica
muyparecida es la microscopía de fuerza atómica (AFM), en la que el control
sedebe a la medida de las fuerzas de van der Waals entre la sonda y la muestra.
Encualquiera de los dos casos, la punta se mueve a lo largo del objeto, de
modoque sus desplazamientos en vertical se miden y se registran, generando
unaimagen de la superficie del objeto. Aunque se han obtenido imágenes
delesqueleto azúcar-fosfato de ADN de cadena sencilla y de cadena doble, está
porver si se pueden "ver" las bases nitrogenadas. Si es así, la técnicapodría
secuenciar del orden de 1 Mb cada día. Secuenciación por hibridación: chip de hibridación Secuenciación por hibridación en chips con oligonucleótidos. Se basa
ensintetizar distintas sondas de oligonucleótidos, y unirlas en
disposicionesordenadas (arrays) a una fina pastilla de nylon o vidrio.
Este chip seprueba frente aun ADN marcado fiuorescentemente, de modo que el patrón
ycantidad de fluorescencia suministra información sobre la secuencia del ADN
encuestión. La última generación de este enfoque es la combinación de técnicasfolitográficas
(como la de los chips de silicio para computadores) con síntesisquímica en
fase sólida, que logra chips con ordenaciones de decenas e inclusocentenares de
miles de oligos distintos, que pueden usarse para identificarsecuencias marcadas
fluorescentemente en cuestión de minutos, por medio de unmicroscopio confocal
de fluorescencia totalmente automatizado, que registra losdatos. A modo de estudio piloto sobre sus posibilidades, la empresa Affimetrix
halogrado re-secuenciar por este método las 16 kb de AQN mitocondrial humano,
conun dispositivo formado por 135.000 oligonucleótidos. Con la tecnología
actualse puede llegar a sintetizar en un día 400.000 oligos de 20 bases cada
uno,dispuestos en un chip de 1 ,6 cm2. Pero el objetivo final es
lograrun chip con los 4 millones de sondas necesarias para secuenciar todo el
genomahumano en una sola hibridación (!). Estrategias de secuenciación Secuenciación genómica clásica Hasta hace muy poco, la secuenciación genómica dependía de la
previadisponibilidad de mapas físicos detallados, para que los
fragmentossecuenciados puedan ser ensamblados correctamente. Necesita manejar
una grancantidad de datos (a título de ejemplo, para generar 1 kb de secuencia
final,hay que secuenciar 10 kb en total), y no es totalmente automatizable. Resumamos brevemente (recapitulando algo de lo dicho para los mapas) cuál
esla estrategia habitual para secuenciar genomas: El ADN genómico se corta aleatoriamente en fragmentos, que se separan
endistintas clases de tamaños, y se insertan en distintos tipos de vectores,
cadauno con una capacidad media diferente (por ejemplo, los YACs portan
insertosentre 100 y 2000 kb, los cósmidos unas 40 kb). Se preparan mapas físicos de baja resolución a base de clones solapados
deinsertos de YACs. Se preparan mapas físicos de alta resolución, preparados para lasecuenciación,
por medio de la subclonación en cósmidos de fragmentosaleatorios de insertos
de YACs. Finalmente, se escoge un conjunto de clones de cósmidos con solapamientos mínimos,sus
insertos se rompen aleatoriamente y se subclonan en vectores para lasecuenciación
(derivados del fago M13, plásmidos de la serie pUC, etc.). Por cada cósmido hay que secuenciar unos 800 clones de fago M13, con un tamañomedio
de inserto de 400 pb, y la secuencia de 40 kb del inserto del cósmidooriginal
se ensambla computacionalmente. Este enfoque de secuenciaciónaleatoria (shotgun)
obliga a secuenciar muchas veces (unas 8 o 10) elmismo segmento de
secuencia, lo que tiene la ventaja de que asegura una mayorfiabilidad de los
datos obtenidos. Sin embargo, como ya dijimos, presenta variosinconvenientes:
hay que disponer previamente de buenos mapas; los YACs soninestables y muchos de
ellos son quimeras, artefactos de clonación que noreflejan el orden genómico
(identificarlos y descartarlos es una tarea quelleva tiempo y esfuerzo); y como
ya sabemos, esta metodología no se puedeautomatizar totalmente. Un tema importante es tener tasas de errores lo más bajas posibles: delorden
de 0.02-0.2%. Secuenciación de ADN complementario (ADNc) No es una alternativa, sino un complemento ala secuenciación genómica. Noes
el gen lo que estamos secuenciando, sino la "retrocopia" de su
ARNmobtenida por reversotranscripción, desprovisto de intrones y
secuenciasreguladoras no traducidas. Si bien la secuenciación de ADNc no nos da información de la estructura
delgen, sí nos la puede dar sobre su expresión: en qué tejidos se expresa,
bajoqué condiciones, etc., lo que permite iniciar mapas funcionales del
genomahumano. Nuevas estrategias de secuenciación genómica Recientemente (véase Venter et al., 1996) se ha propuesto una estrategia
desecuenciación genómica que no depende de previos mapas físicos, y que
enlugar de YACs emplea otro tipo de vectores, los cromosomas artificiales
debacteria (BACs), que aunque permiten insertos de entre 100 y 350 kb, tienen
lagran ventaja de aceptar insertos genómicos con gran fidelidad (sin
quimerismosni apenas reordenaciones del material insertado). La estrategia
consiste en losiguiente: Se crea una genoteca humana de BACs, con un tamaño medio de 150 kb, y
unaredundancia de 15 veces, de modo que consta de unos 300.000 clones. Los
clonesde la genoteca se reparten en pocillos de placas de microtitulación. Se secuencian unas 500 bases en cada uno de los dos extremos del inserto
decada clon. Esto significa que las 600.000 secuencias de los extremos de
losclones están repartidas a razón de una cada 5 kb de genoma, y constituyen
el10% de la secuencia genómica. A estas secuencias se las denomina STCs, acrónimo inglés
de"conectores" etiquetados por su secuencia", ya que permiten
quepor término medio cada clon BAC pueda ser conectado con otros 30 (un inserto
típicode 150 kb dividido por 5 kb, estará representado en otros 30 BACs).
Lassecuencias de las STCs se pondrían enseguida en Internet, a disposición de
lacomunidad investigadora. Se toma la "huella dactilar" de cada clon BAC, con una enzima
derestricción . Un clon BAC que actúa de semilla se secuencia por cualquier método, y
secompara con la base de datos de STCs para identificar los clones solapados. Se secuencian los dos clones BAC que muestren consistencia interna entre
lashuellas dactilares y solapamiento mínimo en ambos extremos con respecto al
BACsemilla. El proceso se va reiterando a ambos lados del BAC semilla (lo que podríamosllamar
"paseo genómico con BACs"). De esta manera, el genoma humano completo se podría secuenciar con sólo20.000
clones BAC. Aunque la estrategia es muy atractiva por su aparente rapidez y menor
costo(se estima que en dos años 30 secuenciadores de última generación podríanobtener
esas 600.000 STCs, con un desembolso de menos de 10 millones de dólares),tiene
varios inconvenientes, entre ellos el que obliga a mantener uno o varioscentros
depositarios de las placas con los clones BACs, y al envío de clonesentre
laboratorios. Dado que el PGH ha funcionado muy bien hasta ahora de
mododescentralizado, es posible que haya reticencias en grupos que vean
amenazada laactual cuasi-democracia investigadora. (No se puede olvidar quién
hace lapropuesta: el director de uno de los centros privados más
"agresivos"en investigación genómica). El papel de la informática en los proyectos genoma La informática ha sido uno de los objetivos esenciales del PGH, debido a
lagigantesca cantidad de datos que hay que recoger, analizar,
comparar,interpretar y distribuir. La informática aplicada a la biología
presenta dossubdisciplinas (véase Benton, 1996): la bioinformática en sentido
estricto,que se puede definir como el trabajo de investigación y desarrollo que
senecesita como infraestructura de información de la actual biología; y
labiología computacional, que es la investigación dependiente de computacióndedicada
a entender cuestiones biológicas básicas. El término bioinformática,en
sentido lato, comprende estos dos grandes aspectos. Estamos ante un nuevocampo
interdisciplinario, en la interfase entre ciencias de la computación,matemáticas
y biología. Las cuestiones de gestión de datos que plantea el PGH suponen un auténtico"revulsivo"
para la informática. Aunque para algunas de las tareas sepuede recurrir a
enfoques tradicionales, con sólo aumentar la escala delprocesamiento, para
otros problemas se necesitan arquitecturas y programasinformáticos totalmente
diferentes. Adquisición informatizada de datos biológicos La adquisición de datos experimentales por métodos digitales estáespoleando
a la industria a diseñar y fabricar aparatos cada vez mássofisticados, que
mejoran y aceleran la parte más rutinaria de la investigación.Para ello los
aparatos incorporan sistemas computerizados de análisis ytratamiento de imagen
visible. Piénsese en los secuenciadores automáticos deADN o en la tecnología
del chip de ADN. El ensamblaje automático de mapas y secuencias es otra tarea que
planteanumerosos e interesantes problemas a las ciencias de la computación, que
han dehacer uso de nuevos algoritmos y estrategias en las que tener en cuenta
losposibles errores. Predicción de secuencias codificadoras, dominios funcionales y otras
zonasinteresantes del genoma: Aunque disponemos de programas a tal efecto
(GRAIL,FASTA, etc.), se requieren nuevos algoritmos capaces de predecir
patronesespeciales de secuencia dentro de genomas completos. Se están
ensayandoaproximaciones derivadas de las redes neurales (neuromiméticas). Construcción de árboles filogenéticos: En principio se viene realizando
abase de comparar determinados genes entre pares de organismos,
mediantealgoritmos de alineamiento de secuencia, pero habrá que mejorar los métodos,incluyendo
una adecuada evaluación del grado de fiabilidad de los árboles. Bases de datos gen éticos y moleculares La gigantesca cantidad de datos generados en los proyectos genoma obliga
aabandonar la "Galaxia Gutenberg" a la hora de publicar los datos:
sudifusión se hace por medios electrónicos, depositándolos en bases de datos
públicos.El ritmo de acumulación de datos es vertiginoso, y actualmente se
duplican enmenos de un año. Los biólogos del siglo XXI usarán esas bases de
datos comoun recurso indispensable de su trabajo cotidiano. En la actualidad
funcionanprincipalmente dos tipos de bases de datos genómicos: El Consorcio Internacional de Bases de Datos de Secuencias está formado
porGenBank, el Banco de datos de ADN de Japón (DDBJ) y el del EMBL. Alberga
losdatos de secuencias. Las tres bases comparten y complementan la información.
EnEspaña existe un nodo de EMBL residente en el Centro Nacional de Biotecnología(CNB)
de Madrid. Genome Data Base (GDB) se estableció para albergar los datos de mapas
yrelacionados (sondas, marcadores, etc.). Actualmente la base de datos bibliográfica MEDLINE (mantenida por la
NMLestadounidense) está vinculada con las bases de datos genéticos y
desecuencias. Por ejemplo, se puede hacer una búsqueda desde MEDLINE con
palabrasclave de una enfermedad, lo que da acceso a OMIM (Herecia mendeliana
on-line),con referencias bibliográficas, y de ahí se puede saltar a los mapas
genéticos,físicos y las secuencias, si están disponibles. En 1993, un taller recomendó profundizar en la coordinación entre
losdistintos bancos informatizados. Las diferencias en la estructura de las
basesde datos y en su nomenclatura hacen que un investigador que trabaje con un
gen ouna proteína de una especie tenga difícil acceder a la información de
geneshomólogos de otras especies. Los expertos en bioinformática están
tratando dedesarrollar estándares y nombres comunes, y de establecer vínculos
entreellos, de modo que cuando los investigadores busquen información en una
base dedatos, automáticamente la encuentren vinculada con otras bases
depositarias deotros datos. Internet y los lenguajes informáticos dedicados al
WWW puedenvenir a ayudar, al hacer fácil crear vínculos entre bases de datos
diferentesha abierto el camino ala diseminación del enfoque basado en
"federacionesde pequeñas bases de datos". Basta definir hipervínculos
activos(hipertexto) para vincular datos relevantes entre distintas bases. Pero
parahacer frente al diluvio de datos tales hipervínculos tendrán que ser
creadosautomáticamente por el software de la base de datos. Ello obliga a
ponerse deacuerdo sobre la nomenclatura y los formatos compatibles. El famoso
lenguajeJava, creado para Internet, parece que puede desarrollarse en una
buenaherramienta para entrecruzar de modo inteligente todas las bases de datos
biológicos. Diagnóstico molecular: detección de mutaciones El avance en el PGH y en los mapas y secuencias ya disponibles impulsan
lanecesidad de disponer de técnicas capaces de rastrear ADN en busca
demutaciones asociadas con enfermedades humanas. En los próximos años se habráidentificado
la mayor parte de los genes implicados en importantes enfermedadeshumanas. En
las bases de datos se están introduciendo informaciones sobremutaciones y sus
implicaciones clínicas. Uno de los retos de la medicina seráhacer uso de esa
información para mejorar el diagnóstico y prognosis de lasenfermedades. Para detectar mutaciones en sitios previamente determinados se han diseñadouna
serie de métodos: Hibridación de oligonucleótidos específicos de alelos. Amplificación específica de alelos (con o sin PCR, o con reacción encadena
de la ligasa, LCR) Procedimientos que crean o destruyen sitios de restricción. La detección de mutaciones en lugares sin especificar o cuando no se
disponede información de secuencia es una tarea muy ardua, aunque se han
desarrolladoalgunas estrategias (rastreo de malos emparejamientos en el genoma). Sin embargo, lo más frecuente es la situación en que se trata deidentificar
mutaciones en múltiples sitios potenciales dentro de segmentos deADN de los que
se conoce la secuencia normal. Se han diseñado técnicas de tipo "multiplex" que permiten la búsquedade
diversos tipos de mutantes en un determinado gen. De modo ideal, el procedimiento tendría que ser fiable, rápido, barato,
yproporcionar información exacta sobre la posición y naturaleza de la mutación,así
como requerir poco esfuerzo, ser automatizable y no usar reactivospeligrosos.
Ninguno de los métodos actuales cumple este criterio. Lasecuenciación sería
el método definitivo, pero sigue requiriendo muchotrabajo, y los métodos
automatizados de alto rendimiento son caros. De todosmodos, debido a que hay
mucho interés y dinero puesto en el empeño, se puedecasi garantizar que
veremos importantes avances en breve. Por ejemplo, se está desarrollando un sistema que no usa electroforesis
engel (una de las fases más tediosas), llamado espectrometría de masas por láserde
desorción/ionización asistida por matriz La división Applied Biosystems de Perkin Elmer ha diseñado un análisis
dehasta 32 mutaciones diferentes de un gen por amplificación simultánea de
hasta15 segmentos de ADN, seguida por ligado multiplex de oligonucleótidos
específicosde alelos. La misma empresa ha creado un ensayo de micro-PCR que puede realizar
24ensayos de 2ml cada uno en un chip, y cuyos resultados se pueden leer en
tiemporeal por medio de la estrategia de TaqMan. Otro de los avances más prometedores son los "chips" de oligonucleótidos:ordenaciones
de diferentes oligos unidos a soportes semisólidos. AON
marcadofluorescentemente puede entonces hibridarse a los oligos del chip, de
modo queel patrón de hibridación se puede analizar por scaning de
fluorescencia. Comose conoce la secuencia y posición de cada oligo en el chip,
se puede determinarla posición y posiblemente la naturaleza de cada mutación. Este enfoque de microchips con oligos ha sido llevado a un avance
importantepor la empresa Affimetrix: usando técnicas fotolitográficas
similares a lasque emplea la fabricación de chips de silicio, se han podido
obtener chips con64.000 diferentes sondas de oligonucleótidos unidos a
superficies planas decristal. En 15 minutos el dispositivo puede detectar la
hibridación desecuencias diana marcadas fluorescentemente a oligos del chip. Otro caso notable de nuevas perspectivas que se pueden abrir con el diagnósticomolecular
es el Proyecto de Anatomía Genómica del Cáncer que pretenderealizar un catálogo
de todos los genes expresados en los distintos tipos de célulastumorales. Se
trata del último ejemplo de matrimonio entre ciencia genómica einformática,
con consecuencias trascendentales en el ámbito clínico. losinvestigadores
quieren determinar cómo cambia la expresión génica conformeprogresa el cáncer
y comprender cómo surgen los tumores. Se espera que sepueda obtener un índice
genético de los tumores, de modo que el clínico no sólodependa de anatomía
patológica convencional (microscopía), sino que el diagnóstico,pronóstico y
tratamiento de sus pacientes se pueda asentar en un conocimiento másadecuado a
base de la expresión génica y de las proteínas, la idea de que sepuedan
identificar todos los genes alterados en un cáncer determinado es muyatractiva.
Debería realmente suministrar información para clasificar tumores eidentificar
dianas para la terapia. "Las tres culturas" de la biología genómica En la biomedicina de la era genómica y postgenómica se requiere, como seestá
viendo, un alto grado de interdisciplinariedad e integración entredistintos
profesionales. Es lo que Benton (1996) ha llamado -parafraseando aC.P. Snow- el
problema de las tres culturas: los biólogos querrán que losinformáticos les
suministren soluciones a sus problemas de gestión de datos,los matemáticos y
expertos en computación andarán detrás de problemasintelectualmente
llamativos, y los ingenieros pedirán a los dos gruposanteriores que les
suministren especificaciones bien concretadas para que ellospuedan desarrollar
su trabajo. Los distintos expertos habrán de acostumbrarse aemplear
vocabularios y lenguajes comunes ya entender (sin minusvalorar) losproblemas de
los demás. En numerosas universidades empiezan a impartirse enseñanzas(de
pregrado o postgrado) de bioinformática y biocomputación. En muchos casosse
trata de que los estudiantes o profesionales de especialidades
tradicionalescompleten su formación con la parte con la que no están
familiarizados. Por lo que respecta a los biólogos, habrán de trabajar en
entornostremendamente ricos en información, manejarán con soltura las bases de
datos,y extraerán conocimiento biológicamente significativo. Los nuevos
datosobligarán a elaborar nuevas hipótesis en muchos ámbitos de las ciencias
de lavida, que sugerirán nuevos tipos de experimentos, estableciéndose
unaretroalimentación fructífera entre la biología in silico y
latradicional biología in vtvo e in vitro. Las Ciencias Biológicasdarán
un salto no sólo cuantitativo, sino que probablemente entraremos en unnuevo
paradigma de investigación, en el que contemplaremos los fenómenosvitales no sólo
desde un punto de vista molecular, sino de integración entresus diversos
niveles de complejidad. PROYECTO DE DIVERSIDAD DEL GENOMA HUMANO Lucca Cavalli-Sforza, un prestigioso genético especializado en estudio
depoblaciones humanas, está impulsando la idea de realizar una investigacióndestinada
a comprender la variación genética humana ya reconstruir la historiade las
poblaciones humanas en los últimos 100.000 años de nuestra especie.Este
Proyecto de Diversidad del Genoma Humano (PDGH) implicaría una diversidadde
disciplinas (genética, arqueología, lingüística, antropología, etc.)para
dar cuenta de la evolución reciente de la humanidad, reconstruir lasgrandes
migraciones de grupos, la distribución de las poblaciones y culturas,etc. Una
de las estrategias consistirá en la toma de muestras de ADN de unaserie de
poblaciones y etnias, con ulterior estudio comparativo de
polimorfismosmoleculares. Se pretende estudiar muestras correspondientes al 10%
de las 5000poblaciones lingüísticas diferenciadas que existen, con el objeto
de ver siexisten correlaciones (y en su caso, cómo se han producido) entre la
diseminacióncultural y la genética. Según sus impulsores, el PDGH daría una
rica visiónde la variedad de recursos gen éticos de nuestra especie, y junto
con los datosdel PGH convencional, facilitaría la comprensión del fundamento
genético dela susceptibilidad o resistencia a distintas enfermedades, incluidas
lasinfecciosas, comprender mejor el papel de la selección y el de la deriva gen
ética. Algunos colectivos y medios de comunicación han lanzado acusaciones
de"racismo" contra este Proyecto, pero para Cavalli-Sforza nada está
máslejos de sus propósitos. De hecho, piensa que con él se va a llamar la
atenciónlas reclamaciones de ciertas tribus para que se les ayude a sobrevivir
yconservar sus culturas. Ningún genético serio actual (y menos una autoridad
enla materia como Cavalli-Sforza) mantiene la idea de que la especie humana estéseparada
en razas, ni mucho menos que de los datos gen éticos se puedan derivarplanes
políticos. Un comité ad hoc de la UNESCO está emitiendoinformes para
que el PDGH se amolde a una serie de criterios éticos y sociales.Los
principales temas que se están evaluando son: Eugenesia y racismo. El racismo es una actitud mental, no unaconsecuencia
de ningún dato biológico. Hay que tomar medidas para evitar quenadie saque
conclusiones sociales y políticas de meros datos de polimorfismosgen éticos en
las poblaciones humanas. En la oposición contra el PDGH ha influido algún lamentable caso
de"bioprospección" (no relacionado con el Proyecto), que ha servido
demunición a ciertos grupos ecologistas y de apoyo a tribus. Por ejemplo el
RAFI(Fundación Internacional para el Avance de las comunidades Rurales)
hadesplegado una campaña para divulgar "los peligros de PDGH",
pidiendoque no se lleve a cabo. Los miembros de RAFI llamaron la atención del
hecho dela concesión de patente sobre unas células resistentes al virus
HTLV-1derivadas de la tribu Hagahai de Papúa-Nueva Guinea. Hay empresas farmacéuticas que están realizando "bioprospección"en
poblaciones aisladas, las cuales presentan la ventaja de que su
menorpolimorfismo gen ético puede ayudar a encontrar la explicación sobre base
deresistencias o sensibilidades a ciertas enfermedades. Por ejemplo, se estáintentado
identificar genes de sensibilidad al asma en una pequeña poblaciónaltamente
endogámica de la isla de Tristan da Cunha Genoma modelos Como ya apuntábamos anteriormente, habría que hablar más bien de
ProyectosGenoma (en plural), ya que en paralelo al estudio del genoma humano están
encurso la caracterización y secuenciación de genomas de organismos modelo,
cuyacomparación entre sí y con el acervo genético humano tendrán dos
notablesefectos: Acelerarán notablemente la obtención de importantes datos sobre
laorganización, función y evolución del ADN a lo largo de toda la
escalafilogenética. Se espera que la comparación de genomas completos de los
tresgrandes dominios de la vida (arqueas, bacterias y eucariotas) nos
suministraráclaves para comprender más de 3000 millones de años de evolución.
La biología(que como decía Dobzhanski, no tiene sentido si no es a la luz de
la evolucíón)profundizará aún más su interés filogenético. Ayudarán a determinar la función de numerosos genes (incluyendo
humanos).Habrá numerosas aplicaciones médicas. Servirán para emprender nuevos enfoques dentro de la Biotecnología y
laBiología industrial. Hasta el momento se dispone de la secuencia completa de al menos
unrepresentante de cada uno de los tres grandes dominios de seres vivos, y estánen
marcha o en proyecto unos 30 proyectos. (Para los proyectos de bacterias,véase
la web del TIGR). Eubacterias. Las siguientes eubacterias están totalmente secuenciadas:
Arqueas (arqueobacterias): Los genomas concluidos son los deMethanococcus jannaschii y Archaeoglobus fulgidus, ambos obtenidos por el TIGR,y el de M. Thermoautotrophicum. Muy avanzados están los de dos arqueobacteriashipertermofílicas (Pyrobaculum aerophilum, Pyrococcus furiosus).
El TIGR de Craig Venter está secuenciando decenas demicroorganismos tanto procariotas como eucariotas, muchos de ellos conimportancia clínica o industrial (entre las eubacterias: Enterococcus feacalis,Legionella pneumophila, Mycobacterium tuberculosis, Neisseria meningitidis,Salmonella typhimurium, Vibrio cholerae, Deinococcus radiodurans, etc.). Elcreciente número de secuencias bacterianas facilitará muchos estudios básicos,y por lo que respecta a las patógenas, permitirá aclarar sus mecanismos depatogenicidad y virulencia, 10 que podrá sugerir a su vez nuevos tratamientos. Hacia el inicio del siglo XXI se estima que dispondremos de las secuencias demás de 100 microorganismos. Como siempre, el problema será cómo vamos adigerir esa información (y quién se va a beneficiar de ella, pero esta es otrahistoria que tratamos en otro sitio). Aparte de los tradicionales (perorenovados) métodos de biología in silico, siempre hay que volver allaboratorio a comprobar hipótesis experimentalmente y recabar nuevos datos.Para ello se están diseñando nuevas estrategias. Por ejemplo, la llamada GEMS(selección multiplex manilada genómicamente), que consiste en medir simúltáneamentelos efectos sobre la supervivencia de una serie de delecciones en fase en muchosgenes, y bajo diferentes condiciones ambientales; de esta manera, se puederastrear el patrón de pérdida o selección de mutantes concretos.. Eucariotas En 1996 se terminó la secuencia de la levadura de panadería (Saccharomycescerevisiae), y ahora se va a emprender el de otra levadura muy diferente(Schyzosaccharomyces pombe). El proyecto genoma de levadura, que ha costado unos30 millones de dólares, ha sido un logro esencialmente europeo, con AndréGoffeau (Universidad Católica de Lovaina) como coordinador. Se evitó a todacosta la duplicación de esfuerzo, "repartiéndose" los cromosomas oregiones entre países y laboratorios. La Unión Europea secuenció el 55%, elCentro Sanger (UK), 17%, la Universidad Washington en St. Louis, 15%,Universidad de Stanford, 7%, Universidad McGi11 (Canadá), el 4%, y unlaboratorio japonés (RIKEN), el 2%. El genoma del nematodo Caenorhabditis elegans se terminará de secuenciar en1998, con una intervención esencial del Centro Sanger. El de la mosca del vinagre (Drosophila melanogaster) está muy avanzado Dentro de los mamíferos está en curso igualmente la cartografía ysecuenciación del genoma del ratón. Y no hay que olvidar que la biología Vegetal está muy interesada a su vezen descifrar los genomas de especies modelo tanto monocotiledóneas (arroz, maíz)como dicotiledóneas (de estas últimas, el modelo más avanzado es el deArabidopsis thaliana). IDENTIFICACION DE LOS GENES ASOCIADOS AFENOTIPOS Genes de rasgos mendelianos Clonación funcional Cuando se tiene información bioquímica sobre un rasgo monogénico, esposible en principio diseñar alguna estrategia para seleccionar el gencorrespondiente de la genoteca, lo que se ha llamado clonación funcional. Estees el caso del factor VIII de coagulación. Clonación posicional La clonación funcional no siempre es posible. Cuando, como ocurre con lagran mayoría de enfermedades genéticas, se desconoce la base bioquímica delrasgo, hay que recurrir a otras estrategias, a menudo laboriosas. Como ejemplo,la clonación posicional de genes de enfermedades: consiste en ir estrechando elcerco al gen a partir de su localización cromosómica (genética inversa). Laclonación posicional era una estrategia ya empleada antes del PGH:
Ejemplos de genes aislados por clonación posicional:
Análisis de genes candidatos Se han aislado muchos genes por clonación posicional, pero la mayoría deellos sobre la base de mutaciones de delección, translocación oamplificaciones de trinucleótidos. La clonación posicional a partir demutaciones puntuales es más ardua, y suele requerir muchos marcadores cercanosal gen y una cartografía fina de desequilibrio de ligamiento. Por ello, serecurre a otra estrategia: enfoque del candidato posicional: se usa informacióndisponible sobre función y posición en el mapa de genes previamente aislados,información que puede proceder de otros proyectos genoma o de ESTs/ADNc. Por ejemplo, una EST aleatoriamente aislada y homóloga con una glicerol-quinasa de S. subti¡is se cartografió en la región Xp21 humana. Trasobtener un ADNc más largo, se vio ese era el correspondiente al gen en cuestión.
Este tipo de estrategia se hará cada vez más importanteconforme avance el PGH. En el futuro, cuando se asigne un nuevo rasgo a unanueva posición específica del mapa, será posible interrogar a las bases dedatos genómicas, y obtener para esa porción genómica una lista de los otrosgenes asignados a esa región. Las características de los genes se compararánentonces con las características del rasgo para encontrar el candidato másverosímil. En resumidas cuentas, el PGH va a simplificar y abaratar la búsqueda degenes relativos a enfermedades mediante estrategias de clonación posicional.
La bioinformática tiene ante sí un formidable reto, dado el diluvio dedatos que está cayendo en las bases de datos. Habrá que desarrollar nuevos ypotentes algoritmos, y de aplicar buenas estrategias de ingeniería y gestiónde la información, capaces de sacar provecho a los datos e integrarlos paradarles sentido biológico, según los programas de investigación que cadacentro o grupo se plantee. Estudio de rasgos complejos y cuantitativos Los rasgos complejos (poligénicos) se pueden clasificar como rasgosdiscretos (medidos según un resultado específico: diabetes, infarto demiocardio) o como rasgos cuantitativos (medidos por una variable continua). Sonestos rasgos los que plantean más problemas a la hora de adscribirlos a losgenes correspondientes, pero ya hay varias estrategias para estudiarlos. Identificación de loci de rasgos cuantitativos (QTls) Sólo se ha vuelto posible con la llegada de los RFLPs. Las estrategiasconsisten en cruzar dos razas puras que difieran sustancialmente en un rasgocuantitativo. La progenie segregante se analiza tanto para el rasgo como para una serie demarcadores. Se emplea en animales y plantas domésticos. Análisis de rasgos complejos en humanos Uno de los mayores retos del PGH será identificar y caracterizar los genesresponsables de rasgos complejos, incluyendo las enfermedades poligénicas ymultifactoriales. Los rasgos poligénicos son difíciles de estudiar en humanos,y evidentemente no se puede recurrir a estudios de cruces controlados como enlos animales y plantas. Cosegregación en estudios familiares Se parte de familias con individuos afectados. Los genes de la enfermedad sepueden identificar por cosegregación con marcadores genéticos (p. ej.,microsatélites) estrechamente ligados, que mostrarán identidad pordescendencia en los individuos afectados. Este enfoque se está volviendo más cómodoy rápido gracias a las técnicas de genotipado rápido basado enfluorescencia, que permiten rastrear el genoma completo en poco tiempo. Medianteeste tipo de estrategia se han logrado varios éxitos: Genes responsables de mayor o menor susceptibilidad a enfermedadesinfecciosas, como la malaria. Además, ello abre nuevas vías al desarrollo devacunas. Genes de susceptibilidad a diabetes tipo 1 y tipo 2: algunos han resultadoser genes del complejo HLA-DR. También la porción 5' del mismo gen de lainsulina, y otros genes a caracterizar. Genes relacionados con susceptibilidad a osteoporosis: polimorfismos en genesde receptores de vitamina D. ¿Una puerta abierta al diagnóstico y prevenciónde la osteoporosis postmenopáusica? A principios de 1997 se creó en Baltimore el Centro de Investigación sobreEnfermedades Hereditarias (CIDR), por acuerdo entre los NIH y la UniversidadJohn Hopkins, y que se dedicará especialmente al genotipado de enfermedadescomplejas (diabetes, enfermedades neuropsiquiátricas, esclerosis múltiples,etc). Este centro está dotado de tecnologías informáticas y biológicas de últimageneración, y realizará genotipado de entre 2 y 4 millones de marcadores cadaaño. Pondrá aprueba nuevas tecnologías como genotipado basado en chips de ADNy en espectroscopía de masas. Métodos de rastreo de genomas Sería ideal contar con métodos capaces de rastrear genomas completos enbusca de secuencias relacionadas con un determinado rasgo complejo. Citemosalgunos intentos: Rastreo genómico de malos emparejamientos (GMS). Rastreo por rotura enzimática de malos emparejamientos (EMC) con resolvasasde fagos. LA ERA POSTGENÓMICA: LA PRÓXIMA REVOLUCIÓN DELA BIOLOGíA Desde el punto de vista de la práctica de la biología básica, el proyectogenoma está acentuando un par de tendencias que ya se dejaban sentir en los últimosaños: por un lado la necesidad de formar nuevos tipos de biólogos capaces detender puentes entre varias disciplinas, que se muevan con comodidad en unentorno de ordenadores, autopistas de información y gigantescas bases de datose imágenes; y por otro lado, la reorganización de los laboratorios einstitutos de investigación, donde interaccionen especialistas en diversos ámbitosde las Ciencias de la Vida, matemáticos, informáticos, químicos, etc. No hay que olvidar que lo que entendemos por Proyecto Genoma consiste enprincipio en la obtención de información estructural más o menos en bruto,pero lo realmente importante empieza después (en realidad, simultáneamente):dar sentido biológico, tanto funcional como evolutivo a tal cúmulo deinformación, es decir, extraer auténtico conocimiento. La "orgía dedatos" que se nos viene encima habrá de ser "digerida"adecuadamente, impulsando nuevos avances a base de sugerir nuevos enfoques,nuevos experimentos, renovadas hipótesis de trabajo, todo ello retroalimentándoseen un "circulo virtuoso" que abrirá las puertas de una nueva era enlas Ciencias Biológicas. Se habla por ello de una "Era Postgenómica",en la que se irán integrando los conocimientos acumulados en diversos"Atlas" del ser humano y de otros seres vivos, en los que se podráninterrelacionar de modo funcionalmente significativo diversos niveles decomprensión de la materia viva: génico, genómico, regulación, biologíacelular, fisiología, evolución, etc. El impacto real de todo ello no se puedeprever, pero no cabe duda que el PGH sienta las bases de un salto cualitativo ycuantitativo en nuestra visión del mundo vivo. En la era post-genómica habrá muchas tareas por hacer (véase p. ej.Lander, 1996): Identificación de las variantes alélicas más comunes de los genes humanos.Se trata de formar una especie de catálogo con las variantes alélicas másfrecuentes (denominadas isotipos) de los genes humanos. Se calcula que paraencontrarlas bastará re-secuenciar las regiones codificadoras de unos 100individuos tomados al azar, y ello se podría llevar a cabo rápidamente con latécnica del chip de ADN. Correlacionando esas variantes con la incidencia deenfermedades, se podrá dar un salto adelante para identificar genes desusceptibilidad a numerosas enfermedades (y esto, sin recurrir a los clásicos ycomplejos estudios con "sagas familiares"). Se abre un campo inmenso alo que podríamos llamar estudios epidemiológicos a base de genética depoblaciones, con la ayuda de las herramientas genómicas. Avances en los estudios evolutivos por comparación de genomas completos dediversos organismos. Tendremos a nuestro alcance la comprensión de multitud deaspectos insospechados de los más de 3000 millones de años de evolución. Seaclararán filogenias completas, se estudiarán familias de genes y proteínas,viendo cómo sus miembros varían y adquieren nuevas funciones en distintoslinajes; se aclararán mecanismos genéticos evolutivos, etc. Estudios de "transcriptoma", es decir, entender cómo, cuándo ypor qué se activan o se silencian distintos juegos de genes, en función deltipo celular, del tiempo, de los estímulos, etc. La comprensión de loscircuitos de regulación según la fase de desarrollo del organismo y el órgano/tejidoes uno de los retos de la fase post-genómica en la que ya estamos. Losproyectos genoma de ciertos organismos modelo (levadura, Caenorhabditis, moscadel vinagre, incluso ratón) prevén la obtención de miles de mutantes, de modoque virtualmente se disponga de razas inactivadas para cada gen concreto (razasnoqueadas genéticamente, K.O.); de ese modo se podrán comprobar los fenotiposresultantes, a distintos niveles, permitiendo aclarar la función genética.Igualmente se pueden emplear técnicas de disrupción transitoria de la funcióngenética (como los oligonucleótidos antisentido y las ribozimas) para estudiarla expresión de genes no susceptibles de analizar mediante la transgénesisinactivadora en línea germinal. Un ejemplo de este tipo de estudios está en un trabajo aparecidorecientemente (9 de abril de 1998) en "Nature" (vol. 392, pp.608-611). En él, miembro de la empresa Lexicon Genetics describen la aplicaciónde un método de mutagénesis en células madre embrionarias (ES) de ratón, quepermite obtener miles de mutantes "marcados" con una etiqueta genética,de modo que luego se puede identificar el gen alterado y estudiar su función. Estudios de "proteoma": seguimiento de la expresión al nivel detraducción y post-traducción en cada tipo celular, y en función de nuevo dela fase de desarrollo y de las señales recibidas por la célula. Uno de losretos es automatizar y hacer más sencilla la técnica de geles bidimensionales,y a ser posible fusionarla con alguna técnica espectroscópica paracaracterizar los cientos o miles de proteínas de cada muestra, e incluso lasinteracciones entre proteínas. Un atisbo de lo que puede ser esta era post-genómica del PGH la tenemos yacon la levadura, una vez finalizada la secuenciación de su genoma: Tras la finalización del proyecto genoma de levadura Generación de mutantes de delección específicos: Es perfectamente factibleemprender la delección sistemática de todos y cada uno de los 6000 genes. Paraello se ha diseñado una de disrupción génica dirigida por PCR y que aprovechala eficiencia y precisión del sistema de recombinación mitótica delorganismo. El método permite la sustitución de cualquier gen de la levadura,incluyendo las razas industriales. Se pretende obtener una biblioteca de 6000razas de delección, una por cada ORF o gen, y en la que cada cepa estarámarcada con un ologonucleótido, a modo de código de barras molecularidentificador. Análisis fenotípico cuantitativo: análisis de control metabólico (MCA) dearriba a abajo El transcriptoma El transcriptoma es el conjunto de genes expresados,junto con su nivel de transcripción, bajo un conjunto dado de condiciones. Seestán poniendo a prueba varias estrategias: Un enfoque que se está ensayando es el análisis en serie de la expresión génica(SAGE). Se trataría de determinar las condiciones fisiológicas y fases dedesarrollo en las que genes y grupos de genes concretos se expresan, y derelacionar estos patrones de expresión con los de los genes cuyas funciones seconocen bien. Otros enfoques distintos son el despliegue diferencial (differential display)y las tecnologías de hibridación en formación ordenada (hybridation-array).Esta ofrece buenas esperanzas de lograr un análisis a gran escala con buenosrendimientos. Recuérdese lo dicho sobre los microchips de oligonucleótidos. Lo que es cierto es que el análisis clásico tipo Northern no sirve paraesto. Se espera que incluso termine recurriéndose al uso de paneles solapadosde oligonucleótidose en hibridación en formación para la correlación entretranscritos individuales y las ORF correspondientes. También aquí será importante agrupar los genes en unidades funcionalmenterelacionadas, que es de esperar contengan genes de función ya conocida. El proteoma Se trata del conjunto de proteínas que se encuentran en unacélula bajo unas condiciones determinadas. El proteoma de levadura se estáestudiando mediante electroforesis bidimensional, usando espectrografía demasas para identificar las proteínas contenidas en las manchas del gel. Seráimportante caracterizar proteínas de complejos proteicos, que suministraríanun importante correlato bioquímico de los datos in vivo. Análisis funcionales de todo el genoma, recurriendo a novedosas tecnologíasgenéticas y bioinformáticas, incluyendo los chips de ADN. En general, los análisis genómicos globales funcionales suministran unaclasificación funcional más que una comprensión detallada de cada gen. Paraesto último habrá que volver a los estudios de corte más clásico, sobregenes o grupos de genes. Como dice Fred Sherman, uno de los líderes del Proyecto genoma de Levadura,tener la secuencia del genoma no es muy diferente a tener uno de los grandes catálogosde productos bioquímicos comerciales que tanto usan los biotecnólogos. Cadalaboratorio dispone de ese catálago, pero cada uno usa un conjunto limitado desus recursos, en función del tipo de investigación y del problema biológicoque quiera abordar. Disponer del atlas del genoma y de las herramientas deestudio de rasgos complejos impulsará la biología del siglo XXI de un modo queno podemos sospechar aún. Avances en la medicina El PGH influirá poderosamente en la Biomedicina de los próximos lustros:permitirá avanzar en el conocimiento de la base de muchas enfermedades(Medicina Molecular), y abrirá perspectivas nuevas en el diagnótico, pronósticoy tratamiento, aunque esto último, necesitado de mucha investigación de tipopost- genómico, vendrá con más retraso. Comprensión de la base molecular de las enfermedades Uso de los modelos de ratones transgénicos Los ratones se pueden manipular en línea germinal e inactivar de mododirigido genes. De esta forma se han logrado modelos de numerosas enfermedadeshumanas, sobre todo las que afectan al sistema inmune y al desarrolloembrionario. Actualmente existen unas 1000 razas de ratones K.O. (noqueados), yobtener cada una de ellas cuesta una media de $ 100.000 y unos 10 meses dedesarrollo. En 1997 el Instituto Merck de Investigación Genómica anució que iba afinanciar con $ 8 millones a la empresa Lexicon Genetics para crear 150 nuevasrazas de ratones K.O. usando una nueva tecnología desarrollada por esa compañía.La Merck pretende que las razas de ratón creadas en el proyecto quedendisponibles para los investigadores aun precio nominal. La estrategia de Lexiconconsiste en insertar un pequeño trozo de ADN aleatoriamente en células madreembrionarias. El ADN insertado inactiva la función del gen donde se inserta, yjunto con algunas secuencias adyacentes transcribibles del ratón, suministra unsitio-etiqueta único. Luego se recupera esa etiqueta, de modo que se puedeaveriguar la identidad del gen inactivado. Durante los próximos 3 años, Lexicon pondrá a trabajar robots de altorendimiento para generar unos 500.000 clones mutantes de células madreembrionarias de ratón, cantidad suficiente para que cada gen quede marcado einactivado una media de 5 veces. Las células clonadas se guardan en nitrógenolíquido. Para final de este año se espera disponer ya de 50.000 clones.Cualquier investigador con un gen clonado o secuenciado podrá consultar la basede datos OmniBank para localizar los clones que lleven una insercióninactivadora en el gen en que trabajan. Las células de ese clon o clones sedescongelan y se usan para crear el correspondiente ratón transgénco K.O., del.- que se estudiará el fenotipo a nivel anatomo-histológico, fisiológico,etc. (Volvemos a remitir al lector al artículo publicado en "Nature"(vol 392: 608-611 [1998])con un ejemplo de cómo esta empresa está aplicandoeste método prometedor. Desde el momento que se decidió introducir fragmentos de (ADN) en el Genomade un individuo que de un modo arrojo saldos positivos para los investigadores ysu función en vivo. El interés y preocupación de los investigadores empezó a aumentar ytranscender hacia otros sectores de la sociedad en el decenio de 1980, al tenerconciencia de la viabilidad y factibilidad de modificar genéticamente las células. Entendiendo la importancia del Genoma Humano debemos tomar en cuenta de cualpueden ser sus consecuencias en el ámbito social, éticas, jurídicas, etc. Los primeros resultados ya han estimulado un debate sobre si conviene o nopatentar para uso comercial, las secuencias de Genes Humanos y de poner lainformación sobre Genética Humana a disposición, así como corregir defectosGenéticos de forma que podría transmitirse de generación en generación, perohay que destacar la relevancia que tiene el proyecto Genoma Humano en cuanto aque traería conocimientos y abriría nuevas puertas ala ciencia del mañana,pero será necesario delimitar los procesos de estudio según el derecho aladignidad humana. En fin podemos decir que la realización de la investigación del GenomaHumano, permite asumir muchas consideraciones, entre las cuales podemos nombrara manera de conclusión: _Las investigaciones acerca del Genoma suponen un aporte importante en tornoal, futuro genético del hombre. _El aporte de las deducciones realizadas a partir del estudio de la cadena deADN permitirán mejorar la calidad de vida del hombre desde la perspectiva de lasalud. _Los estudios acerca del Genoma suponen una relación de carácter científicotecnológico. _Los estudios en tomo al Genoma supondrán la curación de enfermedades quehan estado afectando al hombre( cáncer, HIV) así como herejías genéticas. _Permitirá mejorar la estructura física del hombre. _Permitirá la escogencia de nuevos elementos y perfiles para el hombre delfuturo. -Enciclopedia Encarta 98 -Trabajo practico de Genoma, de Juan Andrés Toselli en wwwv.monografias.com -Declaraciones de la asociación medica Mundial sobre el proyecto GenomaHumano, en www.uma.net/s/policy/17-5-1_5.html. -Aplicaciones de la Ingeniería Genética en www.geocitees.com/genetica2000. -El Genoma Humano del Dr. Francisco Lenadro Loicano en www.alfinal.com -Biología I. Editorial Santillana -Química II. Editorial Santillana. -Diario la nación en www.lanacion.com.ar, Febrero-Agosto 2002-Clarín Digital en www.clarin.com .ar , Febrero-Agosto 2002
Realizado por: Maria A. Alcalá O. Rondón, Marvelis. Urbano, Yamilka PTO. LA CRUZ,
Enviado por Maria A. Alcalá O y Otros Autores
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||