Frentes
02genómica adaptativaENSAMBLAJE

Genómica andina

Paleogenómica de linajes reales preincaicos e incaicos: aDNA de alta cobertura, imputación de haplotipos, GWAS ancestry-specific. Atlas de adaptación poligénica a hipoxia con sweeps selectivos sobre EPAS1, EGLN1, BHLHE40 (homólogos a la firma tibetana de Beall et al. 2010). Plataforma de VHH/nanobodies de camélidos siguiendo el linaje Hamers-Casterman-Muyldermans (VUB Brussels). Eje unificador: adaptación biológica a hipoxia y altitud extrema. Anclaje operativo en Arca Genome como capa de preservación y dataset civilizacional.

El genoma sudamericano es uno de los conjuntos genéticos más diferenciados del planeta. Más de 15,000 años de aislamiento bajo presión selectiva extrema produjeron una firma genómica con barridos selectivos en loci específicos del eje hipóxico. La población andina alta es, junto con tibetanos y etíopes amhara, uno de los tres únicos modelos humanos de adaptación a altitudes extremas en la literatura científica. Tres activos no replicables convergen aquí: linajes reales preincaicos preservados por aridez y temperatura, poblaciones vivas con sweeps documentados sobre EPAS1 y EGLN1, y camélidos productores de nanobodies de cadena pesada VHH.

Paleogenómica de linajes andinos

Las momias andinas (Inca, Chachapoya, Chinchorro, Wari) están preservadas por altitud y aridez con tasas de degradación de ADN órdenes de magnitud menores que las europeas. Lindo et al. (Science Advances 2018) secuenciaron 7 individuos pre-contacto del altiplano peruano-boliviano con cobertura promedio 4-12x, identificando continuidad genética entre Tiwanaku y Aymara contemporáneos. Posth et al. (Cell 2018) ampliaron a 49 individuos sudamericanos pre-Holoceno temprano. Métodos: extracción Dabney 2013 + Illumina NovaSeq con UDG-half para reparar damage, imputación con BEAGLE 5.4 sobre referencia 1000 Genomes Latino más panel andino propio, pipeline GLIMPSE para baja cobertura. Cohorte objetivo: 10,000 genomas pre-contacto secuenciados a 4-8x con consentimiento museo y comunidad descendiente verificada.

Adaptación poligénica a hipoxia: EPAS1, EGLN1, BHLHE40

Tres barridos selectivos diferenciales documentados en poblaciones andinas vs lowland, con homologías parciales a la firma tibetana de Beall (PNAS 2010). EPAS1 (HIF-2α) variante peruana descrita por Crawford et al. (American Journal of Human Genetics 2017): SNP rs56758636 con frecuencia 18% en Aymara vs <1% en europeos, asociado a saturación periférica de oxígeno preservada bajo hipoxia. EGLN1 (PHD2) variantes andinas (Bigham et al. PLoS Genetics 2010): rs186996510, regula HIF degradation. BHLHE40 (DEC1) sweep andino caracterizado por Crawford 2017: gen reloj circadiano y respuesta a hipoxia crónica. Trabajo abierto: GWAS ancestry-specific sobre fenotipos cardiopulmonares (presión arterial, hematocrito, edema pulmonar de altura HAPE) usando BOLT-LMM o REGENIE sobre cohortes de >50,000 individuos. Aplicaciones farmacológicas: roxadustat (FibroGen, HIF-PHD inhibitor aprobado en China 2018) define una clase con potencial anti-anemia y EPO-bypass.

Plataforma de nanobodies de camélidos

Hamers-Casterman et al. (Nature 1993, lab Muyldermans VUB Brussels) descubrieron que camélidos producen anticuerpos heavy-chain-only cuyo dominio variable VHH (~15 kDa) retiene afinidad y especificidad de IgG completo. Aplicaciones clínicas activas: caplacizumab (Sanofi/Ablynx, FDA 2019 para púrpura trombótica trombocitopénica), envafolimab (alpaca-derived anti-PD-L1, China 2021). Pipeline de plataforma: rebaño de 100 alpacas y vicuñas en altiplano puneño. Inmunización con antígenos rotativos (mitógenos, virales, oncológicos). Extracción de PBMCs, RT-PCR del repertoire VHH, librería de phage display 10⁹ clones. Selección por biopanning más validación Sanger. Fabricación E. coli o Pichia pastoris. Output objetivo: 50 candidatos VHH por año con KD < 10 nM. Costo plataforma anual ~3-5 millones USD.

Anclaje operativo en Arca Genome

Arca Genome (Network node #1) materializa la capa de preservación. Asociación Civil Arca Genome con sede en Lima y vault físico en el Batolito de Vilcabamba: cripta de samples bajo granodiorita Permo-Triásica con redundancia digital sobre cristales de sílice fundida en órbita lunar (PHASE OMEGA). Cada genoma secuenciado se preserva en duplicate físico (sample primario en Lima, replica en Vilcabamba) y triplicate digital (servidor primario en Lima, off-site Cusco, off-planet Lunar Pyramid). El frente Genómica andina opera la capa científica: secuenciación, análisis, publicación. Arca Genome opera la capa de preservación a horizonte multigeneracional, íntegramente bajo derecho peruano. Separación funcional necesaria: la ciencia avanza en años, la preservación opera en milenios.

Cronograma y costos

Fase 0 (2026-2027): pilot 500 genomas pre-contacto con tres museos (MN Arqueología y Antropología Lima, Larco Herrera, Brüning de Lambayeque). Acuerdo con Tübingen Krause lab para co-procesamiento. Costo ~5M USD. Fase 1 (2027-2030): expansión a 10,000 genomas más atlas farmacogenómico de adaptación de altura sobre 50,000 individuos contemporáneos vivos. Plataforma nanobodies operativa con primeros 5 candidatos clínicos. Costo ~80M USD. Fase 2 (2030-2034): atlas completo más 3 candidatos VHH en clinical trial fase II. Licensing a Big Pharma o IPO farmacológica. Generación de revenue para auto-financiamiento. Capital ~150M USD recuperable.

Riesgos: bioprospección extractivista vs soberanía

El riesgo central es de gobernanza. La técnica está resuelta; lo expuesto es la custodia. Los samples genómicos andinos sin protocolo de Estado son extractables por consorcios extranjeros (caso documentado: Stanford-Andean Genome Project 2003 generó controversia por no devolver datos a comunidades). Mitigación: protocolo Nagoya local más custodia bajo Arca Genome Foundation con material transfer agreements vinculantes. Riesgo regulatorio segundo: FDA y EMA exigen cohortes diversas para approval; un atlas andino se vuelve precondition para drug trials regionales. Convertir vulnerabilidad en moat operativo.