asuntos críticos de  la genómica

Viejos y Nuevos Rompecabezas Genómicos
Por T. Ryan Gregory
Un artículo original de ActionBioscience.org (08/2006)
puntos principales del artículo
Entre los descubrimientos más sorprendentes en la historia de la genómica se encuentran los siguientes:
  • Hace cincuenta años aprendimos que la cantidad total de AND contenida en el genoma eucariótico es independiente de la complejidad del organismo en que se encuentra. (Los eucariotes son aquellos organismos cuyas células contienen núcleo y organelos).
  • Hace cinco años aprendimos que el número de genes y la complejidad organísmica están también desconectadas.
  • Ambos descubrimientos no son paradojas sino rompecabezas intrigantes, los cuales, al ser resueltos, nos llevarán a una mejor comprensión de la forma, función y evolución de los genomas.
  artículo

“La mayoría de los problemas tienen, o muchas soluciones, o ninguna. Solo unos pocos problemas tienen una sola solución.” Edmund C. Berkeley

La búsqueda de las diferencias genéticas entre las personas representa una de las áreas de investigación más activa, hecha posible gracias a la finalización de la secuencia del genoma humano. Sin embargo, la noción de que existe algo llamado “el genoma humano” trae consigo la implicación de que existen características genómicas fundamentales que son universales entre todos los miembros de una especie. La más obvia de éstas se refiere a la cantidad y al arreglo o distribución del material genético. Sabemos que:

  • Una copia del genoma humano contiene 3.5 picogramos (pg o 10-12 gramos) de ADN empacado en 23 cromosomas.
  • Los chimpancés, los parientes más cercanos a Homo sapiens, poseen un genoma un poco más pesado (3.75 pg) repartidos en 24 cromosomas.
  • En contraste, el genoma del cerdo hormiguero, oricteropo o “aardvark” (Orycteropus afer) está contenido en apenas 10 cromosomas pero pesa 5.8 pg.1

La idea básica que dice que la cantidad de ADN por juego de cromosoma puede ser consistente entre las células de un cuerpo y entre individuos de la misma especie fue avanzada desde 1885. Sin embargo, una “hipótesis de la constancia del ADN” explícita no fue desarrollada hasta mediados del Siglo XX.2 Ésta surgió de un informe publicado en 1948 sobre la “notable constancia en el contenido de ADN nuclear de todas las células en todos los individuos de una especie animal dada,”3 lo cual fue interpretado como evidencia a favor del ADN, en vez de proteínas, como las moléculas responsables de la herencia.

La hipótesis de la constancia del ADN

En términos simples, la hipótesis de la constancia del ADN que emergió a finales de la década de 1940 y a comienzos de la década de 1950 consistió de dos ideas centrales:

  • La cantidad de ADN por juego de cromosoma dentro de un organismo individual es constante.
  • El contenido de ADN de un juego de cromosomas es, por lo general, invariable entre miembros de la misma especie.

La noción que subraya a la constancia del ADN ha persistido hasta medio siglo después, a pesar de que se han encontrado excepciones interesantes para ambos postulados (las cuales están fuera del alcance de este artículo). De hecho, la constancia del ADN es una asunción importante en la investigación moderna sobre el tamaño de los genomas, debido a que los dos métodos dominantes en la cuantificación del ADN dependen del uso de estándares de contenido de ADN “conocido” para poder llevar a cabo ciertas conversiones.4-6

La paradoja del Valor C

Debido a esta constancia, la cantidad de ADN contenida dentro de un juego haploide de cromosomas recibió el nombre de “Valor C,” una expresión creada por Hewson Swift en 1950.7 Un año más tarde, los científicos proveyeron la primera evaluación taxonómica amplia de Valores C, notando que:

Al comparar al más grande con uno de los más pequeños ejemplos entre los vertebrados se descubre que una célula de la salamandra Amphiuma, un urodelo, contiene 70 veces más ADN que el que se encuentra en una célula de un ave de corral, un animal mucho más altamente desarrollado. Parece ser muy poco probable que la salamandra contenga 70 veces más genes diferentes que un ave de corral o que un gen de salamandra contenga 70 veces más ADN que un gen de ave de corral. Para hacer una comparación diferente: una célula de la salamandra Amphiuma contiene 170 veces más ADN que una célula de un pariente relativamente cercano, el pez ballesta o gatillo, mientras que la célula de éste último contiene solamente 9 veces más que la célula de una esponja, la cual es mucho más lejana filogenéticamente de cualquier vertebrado.8

No es difícil entender por qué las observaciones como éstas generaron una confusión considerable en las dos décadas siguientes. C. A. Thomas dijo en 1971, “Se argumentó que los mamíferos muestran una complejidad del desarrollo mayor que los peces primitivos y, por lo tanto, deben tener más genes que éstos. Sin embargo, ¿por qué pueden tener más ADN estas formas inferiores si el ADN es la base química de los genes?”9 Para los investigadores del pasado esto pareció totalmente paradójico, y de hecho, Thomas le dio el nombre de “la paradoja del Valor C” a la falta de conexión entre el tamaño del genoma y la complejidad del organismo.

La paradoja del Valor C ha sido tradicionalmente descrita en tres formas diferentes:

  • Los organismos más complejos no tienen necesariamente genomas más grandes que los organismos más simples. “La cantidad de ADN no parece estar relacionada al número de genes, dado que la cantidad de ADN no aumenta claramente con la complejidad y el número de caracteres hereditarios.”10
  • Cualquier genoma parece contener más ADN que la necesaria para el número predicho de genes. “Uno de los problemas de la genética de los eucariotes es que los organismos más avanzados poseen mucho más ADN en su genoma que el que necesitan como información genética.”11
  • Algunas especies cercanamente relacionadas exhiben contenidos de ADN divergentes. “La paradoja es el hecho de que organismos con el mismo nivel general de complejidad morfológica, la cual se presume que tiene el mismo requerimiento genético, a menudo poseen genomas cuyo contenido de ADN difiere en varios órdenes de magnitud.12

Considere por ejemplo el tamaño reportado de los genomas versus las nociones semi-subjetivas de complejidad de algunos organismos bien conocidos:

  • Nematodo (Caenorhabditis elegans): 0.1 pg
  • Berro común de pared (Arabidopsis thaliana): 0.16 pg
  • Mosca de la fruta (Drosophila melanogaster): 0.18 pg
  • Pez fugo o globo (Takifugu rubripes): 0.4 pg
  • Arroz (Oryza sativa): 0.5 pg
  • Humano (Homo sapiens): 3.5 pg
  • Rana leopardo (Rana pipiens): 6.7 pg
  • Cebolla (Allium cepa): 16.75 pg
  • Saltamontes de montaña (Podisma pedestris): 16.9 pg
  • Salamandra tigre (Ambystoma tigrinum): 32 pg
  • Azucena (Lilium longiflorum): 35.2 pg
  • Anguila pulmonada (Protopterus aethiopicus): 132 pg

El genoma humano, resulta ser, es completamente promedio en tamaño para un mamífero y significativamente más pequeño que el genoma de varias plantas, anfibios, insectos y hasta de algunos protozoarios unicelulares. Algunos autores aparentemente sintieron que esta revelación golpeaba al ego humano, tal y como se refleja en esta queja:

Dado que somos un poco chauvinistas acerca de nuestra propia especie, nos gustaría pensar que el hombre es con seguridad una de las especies más complicadas de la tierra y, por lo tanto, que requiere el número máximo de genes. Sin embargo, la humilde hepática de las fuentes (Marchantia polymorpha) tiene 18 veces más ADN que nosotros y la viscosa salamandra conocida como Amphiuma tiene 26 veces más ADN que nuestro complemento. Para añadir más al insulto, la unicelular Euglena tiene casi tanto ADN como un ser humano.13

ADN no codificador y el fin de la paradoja

A pesar de su nombre, la “paradoja” no fue tanto la falta de correlación con la complejidad por si misma sino en vez la inhabilidad de los investigadores tempranos de reconciliar la constancia del contenido del ADN dentro de una especie (la cual ocurre porque representa el material de los genes) con la variación en la cantidad de ADN entre las especies (la cual no se relaciona al número de genes). Hoy en día, la solución a la paradoja está ampliamente reconocida: La mayoría del ADN de los eucariotes no codifica proteínas, por lo cual no es de esperarse que un organismo complejo deba tener un genoma grande o que un organismo simple deba tener un genoma pequeño.

Para expresarlo brevemente, la paradoja del Valor C desapareció en el momento en que los geneticistas abandonaron el concepto de un genoma compuesto por genes, todos los genes, y nada más que los genes.

Hace 20 años, Stanley K. Sessions lo dijo mejor que nadie en una revisión editorial del libro de mucha influencia titulado La Evolución del Tamaño del Genoma,14:

La paradoja del Valor C es la observación de que el tamaño del genoma no corresponde a la cantidad de ADN necesaria para la codificación de proteínas. Esta observación es paradójica solo bajo la expectativa de que el tamaño del genoma debería ser igual o proporcional al número de genes y, por lo tanto, debería incrementar a medida que aumenta la “complejidad del organismo.” Esta paradoja, literalmente, desapareció con el descubrimiento de que los genomas contienen ADN “en exceso” (repetitivo) que no se transcribe en productos funcionales. Por lo tanto, no es ya misterioso que las salamandras, por ejemplo, puedan tener un genoma más grande que el de los humanos. El origen y la función precisa de este ADN “en exceso” (el cual puede constituir más del 99% del ADN genómico) continua siendo un problema sin resolver, aunque no es una paradoja.15

A pesar de ser comparativamente modesto en su tamaño, el genoma humano provee un ejemplo excelente sobre la abundancia extraordinaria del ADN no codificador y, por ende, una solución a la vieja “paradoja del Valor C.” En el año 2001, el Consorcio Internacional para la Secuenciación del Genoma Humano reveló que cada copia del genoma humano consiste de los siguiente:

  • 1.5% de genes codificadores de proteínas
  • 25.9% de intrones (regiones no codificadoras entre las secuencias de genes)
  • 20.4% elementos nucleares largos intercalados (“LINEs” en sus siglas en inglés),
  • incluyendo 516.000 copias de el elemento transportable conocido como LINE-1
  • 13.1% de elementos nucleares cortos intercalados (“SINEs” en sus siglas en inglés), incluyendo 1.090.000 copias del elemento Alu
  • 2.9% de transposones de ADN (elementos móviles de ADN)
  • 8.3% de repeticiones terminales largas (“LTRs” en inglés) retrotransposones (transposones copiados del ARN y flanqueados por secuencias repetidas)
  • 5% duplicaciones de segmentos
  • 3% repeticiones de secuencias simples
  • 11.6% secuencias únicas misceláneas
  • 8% misceláneo material de ADN, o heterocromatina.

El enigma del Valor C

Wendel L. Wilkie dijo una vez: “un buen eslogan puede impedir el análisis por 50 años.” A pesar de su obsolescencia obvia, y en un caso muy claro de inercia lingüística tomando precedencia sobre la precisión científica, el término “paradoja del Valor C” continúa teniendo un uso amplio, a menudo trayendo como resultado la confusión y los errores en la comunicación. La variación en el tamaño del genoma no es paradójica en lo más mínimo, sino tal y como lo han explicado Sessions y otros, un viejo rompecabezas que requiere una solución. Como una alternativa al término obsoleto de “paradoja del Valor C,” el cual tiende a inspirar intentos unidimensionales para su explicación, el término nuevo “enigma del Valor C” ha sido ofrecido en su lugar.17-19

Como un enigma, es decir, un rompecabezas complejo, el tema de la variación del tamaño del genoma puede ser dividido explícitamente en varias preguntas, cada una de las cuales debe ser respondida si uno quiere lograr una comprensión completa del tema:

  • ¿Cuáles son las fuentes de todo este ADN no codificador?
  • ¿En qué proporciones están representados los varios tipos de ADN no codificador en los genomas de especies diferentes?
  • ¿Por cuáles mecanismos se gana o se pierde ADN no codificador en la historia evolutiva?
  • ¿Cuáles son las implicaciones fenotípicas, o en unos casos hasta funcionales, del ADN no codificador?
  • ¿Por qué los genomas de ciertas especies, como los de los nematodos o el del arroz, son económicos y los de los peces pulmonados o las azucenas son positivamente enormes?

Desenredando el enigma

A pesar de que aún se debe llevar a cabo mucha investigación sobre cada una de estas preguntas del enigma del Valor C, las investigaciones de los últimos 50 años, desde el origen de la hipótesis de la constancia del ADN hasta la era moderna de la secuenciación de genomas completos, ha revelado mucha información importante sobre la naturaleza y los impactos del ADN no codificador. Entra los descubrimientos más notables se encuentran:

  • Una gran fracción de los genomas eucarióticos está compuesta de “parásitos genómicos” en forma de elementos transponibles; en los humanos, casi la mitad del genoma consiste de dicho “ADN egoísta”. Es más, los genomas grandes contienen una gran proporción de elementos transponibles y una proporción más baja de genes que codifican proteínas que los genomas más pequeños.
  • La abundancia y/o el largo de varios tipos tanto de ADN de copia simple como de ADN repetitivo que no codifica, parece aumentar junto con el tamaño del genoma, incluyendo todos los tipos de elementos transponibles, intrones, microsatélites (secuencias repetitivas cortas de nucleótidos) y genes ARN ribosomal. La amplificación y pérdida de estos tipos de secuencias varía, lo cual sugiere que puede haber un mecanismo general para la modulación del contenido de ADN que se aplica a través del genoma.

Existen mecanismos que son capaces de aumentar o disminuir el tamaño del genoma en escalas evolucionarias tanto cortas como largas. Por ejemplo, la transposición duplicativa de elementos transponibles y las duplicaciones a escalas pequeñas y grandes (desde un gen sencillo hasta genomas enteros) puede añadir ADN a los genomas, a veces en cantidades grandes y a menudo muy rápidamente en términos evolutivos. Otros procesos pueden ya sea añadir o remover ADN en un rango de escalas, como por ejemplo, la inserción o la eliminación desde uno a varios nucleótidos durante la replicación del ADN, los eventos de recombinación que llevan a la ganancia o pérdida de segmentos de cromosomas, y las ganancias o pérdidas de cromosomas enteros.

  • El tamaño del genoma en un gran rango de tipos de células y de organismos se correlaciona positivamente al tamaño de la célula y del núcleo y negativamente a la tasa de división celular. La preponderancia de evidencia indica que el tamaño del genoma ejerce una influencia causativa a estos parámetros celulares.
  • Dependiendo de la biología del grupo en cuestión, los efectos a nivel celular de la variación del tamaño del genoma pueden resultar en correlaciones entre el contenido de ADN y el tamaño del cuerpo, la tasa metabólica, la tasa de desarrollo, la complejidad de los órganos, la distribución geográfica y el nicho ecológico.

¿Una nueva paradoja?

La mayor parte de la discusión temprana sobre la paradoja del Valor C fue predicada bajo la asunción de que el número de genes y la complejidad del organismo debían estar estrechamente ligados. Debido a la extraordinaria complejidad del organismo que lo lleva, se esperaba que el genoma humano en particular contuviera un número excepcionalmente alto de genes codificadores de proteínas. Antes de que se completara el primer esbozo de la secuencia del genoma humano, se estimaban comúnmente unos 100.000 genes. En realidad, el genoma humano apenas contiene unos 20.000 a 25.000 genes.20 Al comparar esto con más de 3.000.000 copias de elementos transponibles presentes en cada genoma humano, incluyendo a más de un millón de copias del gen SINE Alu, no es sorprendente que W. Ford Doolittle sugirió una vez, medio en serio y medio en broma, que nuestros genomas “pueden irónicamente ser vistos como vehículos para la replicación de las secuencias de Alu.”21

La inspección de los genomas de otras especies muestra que, tal como el tamaño del genoma, el número de genes es un mal pronosticador de la complejidad de los organismos:

  • Mosca de la fruta (Drosophila melanogaster): 13.500 genes
  • Nematodo (Caenorhabditis elegans): 20.000 genes
  • Ser humano (Homo sapiens): 20.000 a 25.000 genes
  • Pez fugo o globo (Takifugu rubripes): 21.000 genes
  • Berro común de pared (Arabidopsis thaliana): 25.500 genes
  • Arroz (Oryza sativa): 40.000 a 50.000 genes

Al igual que con los Valores C, esta observación ha sido la fuente de mucha sorpresa entre los investigadores de genomas. Algunos se han preguntado, “¿Cómo puede nuestra supremamente sofisticada especie estar gobernada por solamente de un 50 a un 100% más genes que los de un nematodo?”22 Siguiendo la misma fórmula que la del tamaño del genoma (expectativa simplista + datos contradictorios = “paradoja”), esta disparidad entre el número de genes y la complejidad ha sido llamada la “paradoja del Valor G” o “paradoja del Valor N.”23-25

El enigma del Valor G

Quizás valga la pena decir que la “paradoja” del Valor G, tal como su predecesor el Valor C, no es paradójica en lo absoluto. Los datos que están emergiendo de los estudios de la genómica comparativa indican que los mecanismos por los cuales el genoma especifica la construcción de un organismo son complejos y, por ahora, desconcertantes, es decir, un “enigma del Valor G.” Tal y como el enigma del Valor C, este nuevo rompecabezas se podrá resolver cuando las piezas estén claramente delineadas. En este caso, algunas de las preguntas pertinentes incluyen a las siguientes:

  • ¿Cuáles son los mecanismos que regulan a los genes y cómo esto contribuye a la alta diversidad de tejidos que son construidos por un número bajo de genes? La sugerencia reciente de un segundo “código” no génico en el ADN basado en las posiciones de las estructuras empaquetadoras llamadas nucleosomas, provee un ejemplo estimulante del tipo de descubrimiento que se verá venir en esta área.26
  • ¿Qué papeles juega (si alguno) el ADN no codificador en el lazo entre el genoma y el fenotipo? Detalles interesantes que han resultado de los estudios generales sobre el tamaño del genoma, tales como los descritos anteriormente, tienen relevancia directa en este asunto, como también lo tienen otras influencias tales como la posición y configuración del ADN, los niveles de compactación del ADN y otros factores no génicos.
  • ¿De qué formas las interacciones entre los genes son responsables por la emergencia de unidades complejas completas a partir de un número relativamente limitado de partes?
  • ¿Cuántos productos proteínicos diferentes puede codificar una región simple de un gen a través de procesos tales como el empalme alternativo y hasta que punto esto puede explicar la diversidad de productos proteínicos que pueden resultar de un genoma codificador de proteínas relativamente simple?

Perspectivas futuras

A pesar de que no han sido aún reconocidas explícitamente como partes de un rompecabezas más grande, cada una de las preguntas componentes del enigma del Valor G es el sujeto de una cantidad ascendiente de estudios. Hasta el punto en que los elementos transponibles cooptados jueguen un papel en la regulación genética, en que el ADN no codificador influencie a la regulación genética, en que los intrones se encuentren involucrados en el empalme alternativo, y en que el contenido bruto de ADN ejerza un impacto en los fenotipos celulares y organísmicos, es claro que los enigmas del Valor C y el Valor G son, en si mismos, parte de una búsqueda mayor para comprender la forma, la función y la evolución de los genomas. Con el fin de avanzar esta causa, la comunidad científica podría tomar varios pasos clave:

  • Considerar los resultados que contradicen a las asunciones simplistas sobre los genomas, notablemente aquella que dice que uno o unos pocos parámetros genómicos lineares deben determinar la complejidad de los organismos, como retos interesantes, en vez de enmarcarlos como “paradójicos.”
  • Pensar sobre los genomas como entidades biológicas complejas con sus propiedades inherentes y sus historias evolutivas.
  • Caracterizar tanto a los componentes de los genomas codificadores como a los no codificadores y sus proporciones relativas en los proyectos de secuenciación completa.
  • Crear mejores enlaces entre los investigadores que estudian el tamaño de los genomas (el enigma del Valor C) con aquellos que trabajan con las secuencias y las funciones de los genes (el enigma del Valor G) y hacer un mayor esfuerzo en combinar los descubrimientos derivados del estudio de cada uno de los componentes mayores de seres vivientes y dirigirse más allá del molde actual de los organismos modelo.

La lección de los últimos 50 años, y el principio dirigente más productivo para la fase siguiente de la ciencia genómica, es que los genomas son complejos y fuertemente resistentes a las explicaciones unidimensionales. Para ponerlo de una manera más sencilla, aquellos que desean iluminar a las causas y a las consecuencias de la variación genética a cualquier nivel, deben tener lo siguiente en mente: las paradojas son frustrantes, pero los rompecabezas claramente definidos son estimulantes.


© 2006, American Institute of Biological Sciences. Los educadores tienen permiso de reimprimir artículos para su uso en salones de clase; otros usuarios por favor contactar al editor para obtener permiso de reimpresión. Favor ver políticas de reimpresión.

Sobre el autor: El Doctor T. Ryan Gregory es profesor asistente en el Departamento de Biología Integrativa de la Universidad de Guelph, Ontario, Canadá. Gregory ha recibido varias becas y premios de prestigio, incluyendo el Premio Post-doctoral Howard Alper en el 2003, el Premio Arch del MacMaster Alumni Association en el 2005 y el Premio “Joven Investigador” de la Asociación Norteamericana de Naturalistas en el 2006. Los intereses primarios de investigación de Gregory incluyen la evolución a gran escala del genoma, la diversidad biológica y genómica y la macroevolución. En el 2001 creó la Base de Datos del Tamaño del Genoma Animal y publicó en el 2005 el libro La Evolución del Genoma (The Evolution of the Genome, Elsevier).
http://www.genomesize.com/gregorylab/

 
 


  Ayuda de impresión:
hemos recibido comentarios sobre dificultades en imprimir artículos desde Netscape.
Si esto le ocurre a usted, por favor
use Internet Explorer.

Por favor vea el artículo original en inglés para enterarse más sobre el tópico del artículo o para tener acceso a la lección que lo suplementa. (Enlaces y lecciones no han sido traducidas.)

Este artículo en inglés          Directorio de artículos en español         la página principal

Referencias del artículo:
Estas referencias están en inglés. Las referencias no han sido traducidas al español dado que la mayoría de los artículos citan fuentes en el idioma inglés. 
1) Gregory, T. R. 2006. Animal Genome Size Database. http://www.genomesize.com (accessed Aug. 22, 2006)
2) Swift, H. 1950a. The desoxyribose nucleic acid content of animal nuclei. Physiological Zoology 23: 169–198.
3) Vendrely, R., and C. Vendrely. 1948. La teneur du noyau cellulaire en acide désoxyribonucléique à travers les organes, les individus et les espèces animales: Techniques et premiers résultats. Experientia 4: 434–436.
4) Price, H. J., and J. S. Johnston. 1996. Analysis of plant DNA content by Feulgen micro-spectrophotometry and flow cytometry. In P. Jauhur (ed). Methods of Genome Analysis in Plants, pp. 115–132. Boca Raton, FL: CRC Press.
5) Hardie, D. C., T. R. Gregory, and P. D. N. Hebert. 2002. From pixels to picograms: A beginners' guide to genome quantification by Feulgen image analysis densitometry. Journal of Histochemistry and Cytochemistry 50: 735–749.
6) DeSalle, R., T. R. Gregory, and J. S. Johnston. 2005. Preparation of samples for comparative studies of arthropod chromosomes: Visualization, in situ hybridization, and genome size estimation. Methods in Enzymology 395: 460–488.
7) Swift, H. 1950b. The constancy of desoxyribose nucleic acid in plant nuclei. Proceedings of the National Academy of Sciences of the USA 36: 643–654.
8) Mirsky, A. E., and H. Ris. 1951. The desoxyribonucleic acid content of animal cells and its evolutionary significance. Journal of General Physiology 34: 451–462.
9) Thomas, C. A. 1971. The genetic organization of chromosomes. Annual Review of Genetics 5: 237–256.
10) Vendrely, R. 1955. The deoxyribonucleic acid content of the nucleus. In E. Chagraff and J.N. Davidson (eds). The Nucleic Acids, volume 2, pp. 155–180. New York: Academic Press.
11) MacLean, N. 1973. Suggested mechanism for increase in size of the genome. Nature, New Biology 246: 205–206.
12) Gall, J. G. 1981. Chromosome structure and the C-value paradox. Journal of Cell Biology 91: 3s–14s.
13) Comings, D. E. 1972. The structure and function of chromatin. Advances in Human Genetics 3: 237–431.
14) Cavalier-Smith, T (ed). 1985. The Evolution of Genome Size. Chichester, UK: John Wiley & Sons.
15) Sessions, S. K. 1986. Thoughts on genome size: The controversy continues. Cell 45: 473–474.
16) International Human Genome Sequencing Consortium. 2001. Initial sequencing and analysis of the human genome. Nature 409: 860–921.
17) Gregory, T. R. 2001. Coincidence, coevolution, or causation? DNA content, cell size, and the C-value enigma. Biological Reviews 76: 65–101.
18) Gregory, T. R. 2004. Macroevolution, hierarchy theory, and the C-value enigma. Paleobiology 30: 179–202.
19) Gregory, T. R. 2005. Genome size evolution in animals. In T. R. Gregory (ed). The Evolution of the Genome, pp. 3–87. San Diego, CA: Elsevier.
20) International Human Genome Sequencing Consortium. 2004. Finishing the euchromatic sequence of the human genome. Nature 431: 931–945.
21) Doolittle, W. F. 1997. Why we still need basic research. Annals of the Royal College of Physicians and Surgeons of Canada 30: 76–80.
22) Harrison, P. M., A. Kumar, N. Lang, M. Snyder, and M. Gerstein. 2002. A question of size: The eukaryotic proteome and the problems in defining it. Nucleic Acids Research 30: 1083–1090.
23) Claverie, J.-M. 2001. What if there are only 30,000 human genes? Science 291: 1255–1257.
24) Betrán, E., and M. Long. 2002. Expansion of genome coding regions by acquisition of new genes. Genetica 115: 65–80.
25) Hahn, M. W., and G. A. Wray. 2002. The g-value paradox. Evolution & Development 4: 73–75.
26) Segal, E., Y. Fondufe-Mittendorf, L. Chen, A. Thastrom, Y. Field, I. K. Moore, J.-P. Z. Wang, and J. Widom. 2006. A genomic code for nucleosome positioning. Nature advance online publication (July 19, 2006). DOI: 10.1038/nature04979.