Stack cognitivo Kiranir es laboratorio privado de inteligencia artificial modelado sobre Mistral AI (París), Aleph Alpha (Heidelberg) y EleutherAI (originalmente colectivo distribuido, hoy organización 501(c)(3)). La doctrina operativa central es fine-tuning sobre modelos base open-weight (Llama 3.1/4 de Meta, Mistral 7B/Mixtral 8x22B, posibles bases futuras de DeepSeek, Qwen, Gemma) con datasets propios curados sobre dominios civilizacionales relevantes para Kiranir, sin entrenamiento desde cero. Esta decisión es estratégica: entrenar un modelo frontier desde scratch requiere capex 100-300 millones USD por entrenamiento más datacenter dedicado (10,000-25,000 GPUs H100/H200/GB200), horizonte que solo OpenAI, Anthropic, Google DeepMind, Meta, xAI, DeepSeek, Mistral pueden absorber. Fine-tuning sobre base abierta reduce capex a orden 5-25 millones USD por iteración mayor, manteniendo competitividad técnica en dominios verticales. Capacidades específicas para Sirius (extracción, scoring, generación de outreach personalizado, hipergrafo soberano embedding) constituyen el primer use case operacional. Headcount objetivo: 12-20 ML PhDs (alumni Anthropic, OpenAI, DeepMind, FAIR, DeepSeek con horizonte de retorno a Sudamérica vía Frente #25). Capex inicial 20-40 millones USD, opex steady state 15-30 millones USD/año.
Por qué soberanía cognitiva
La capa de inferencia sobre la que operan crecientemente las operaciones civilizacionales (detección, scoring, generación, traducción, search) está concentrada en 4-6 actores no-andinos: OpenAI, Anthropic, Google DeepMind, Meta, xAI, DeepSeek. Cada llamada API a Claude, GPT-4o, Gemini implica tres dependencias estructurales: (1) Disponibilidad continua del servicio, sujeta a decisiones unilaterales del provider (rate limits, model deprecation, terms-of-service changes con horizon ejemplificado por la deprecation de GPT-3.5 turbo en 2024). (2) Confidentiality de los datos enviados, sujeta a las políticas de retention del provider y a peticiones de subpoena bajo jurisdicción USA/UK (Stored Communications Act, CLOUD Act). (3) Cost stack, sujeto al pricing power del oligopolio (OpenAI redujo precios 6x entre 2023 y 2025 pero el floor permanece bajo control del provider). Para una operación que produce 100M+ tokens/día (Sirius scoring + Daimon outreach + Eye observation), el costo agregado a precios actuales es 500K-2M USD/año, escalable a 10-30M USD/año en steady state cohort-3+. La soberanía cognitiva no significa autarquía completa; significa optionality estructural: la capacidad de operar continuamente si el provider externo falla, sube precios, o restringe acceso. Modelos análogos: Mistral AI (Francia, soberanía cognitiva europea, valuación 6 mil millones EUR 2024), Aleph Alpha (Alemania, focus enterprise privacy), Cohere (Canadá, RAG enterprise), Qwen (Alibaba, soberanía china), DeepSeek (China, frontier capability con presupuesto inferior).
Modelo base + fine-tuning vs entrenamiento from scratch
La frontera entre opciones tiene tres puntos. (1) Entrenamiento from scratch de modelo frontier: requiere capex 100-300M USD por pre-training run sobre 10-25T tokens, datacenter dedicado con 10,000-25,000 GPUs clase H200/B200, equipo de 50-150 ML engineers senior con experiencia frontier (Anthropic, OpenAI, DeepMind alumni), horizonte 12-24 meses por iteración mayor. Solo factible para actores con scale de Anthropic, OpenAI, Google, Meta, xAI, DeepSeek, Mistral, Qwen. Kiranir no compite aquí. (2) Fine-tuning supervised sobre base open-weight (LoRA, QLoRA, full fine-tuning): capex 100K-2M USD por iteración mayor sobre dominios verticales con datasets propios. Performance en dominio específico puede superar al base model en 15-40% medido por benchmarks customizados, manteniendo capacidades generales (los fine-tuned model checkpoints retienen pre-trained knowledge). Esta es la zona operacional Kiranir. (3) Constitutional AI + RLHF customizado sobre base open-weight: capex 1-10M USD por iteración mayor con dataset de comparaciones humanas (10K-100K pairs), permite alignment doctrinal específico (output adapted a doctrina Kiranir, no a guidelines OpenAI/Anthropic genéricas). Esta es la zona expandida Kiranir año 3-5. Decisión arquitectónica: bases primarias Llama 3.1 405B + Mistral Large 2 + DeepSeek V3 (rotación según evolución del state-of-the-art open-weight). Fine-tuning con datasets verticales kiranir-propietarios. Quantization a 4-bit (AWQ, GPTQ) para deployment cost reduction 3-5x. Inference stack: vLLM + TensorRT-LLM + Triton Inference Server.
Capacidades específicas para Sirius
Sirius requiere cuatro capacidades AI con criticality operacional. (1) Extracción estructurada desde texto libre: parsing de CVs, perfiles LinkedIn, papers académicos, tweets, repositorios GitHub a esquemas JSON estructurados (campos: educación, experiencia, publicaciones, projects, skills weights, contribution patterns). Modelo base GPT-4o-mini equivalent costo ~0.15 USD/1M input tokens; fine-tuned model local sobre Mistral 7B o Llama 8B reduce costo a ~0.02 USD efectivo por unit equivalent post-amortización, accuracy en dominio específico superior 10-20%. Volumen: 1-3M perfiles/mes en steady state, 50M tokens/día. (2) Scoring AHP + Mahalanobis con justificación natural language: dado un perfil estructurado y una posición/frente target, generar score 0-100 + explicación en lenguaje natural de por qué (qué señales pesan más, qué falta, qué red flags). Output verificable por humano, audit trail completo. Modelo Claude Opus 4.6 equivalent fine-tuned. (3) Outreach generation personalizado: dado perfil + contexto frente + tono doctrinal, generar mensaje LinkedIn/email de 150-300 palabras con personalization no-genérica (no template fill, sino comprensión semántica del perfil y crafting situacional). Volumen: 50-200K mensajes/mes. (4) Embedding generation para hipergrafo soberano (Frente #26): vectorización de perfiles, frentes, decisiones, learnings en espacio de 1024-1536 dimensiones para nearest-neighbor search, clustering, similarity ranking. Modelos: Voyage AI voyage-3 equivalent, o nativo entrenado sobre BAAI/bge-large-en con domain adaptation.
Infraestructura de cómputo y partnerships
Compute requirements: 3 use cases con perfiles distintos. (1) Training/fine-tuning: bursty, requiere acceso a clusters de 256-1024 GPUs H100/H200 durante 2-8 semanas por iteración. Opciones: alquiler vía CoreWeave/Lambda Labs/RunPod (cost 2-4 USD/GPU-hora H100, total 1.5-12M USD por iteración mayor); reserva long-term con Crusoe Energy (cost 1.5-2.5 USD/GPU-hora, requiere commitment 6-12 meses); construcción propia bajo Frente #06 Frontier Datacenter (datacenter Lima/Trujillo con 2,000-5,000 GPUs B200, capex 200-400M USD, depreciation horizon 4 años). Decisión año 1-3: alquiler vía CoreWeave + reserva spot via Crusoe. Decisión año 4+: migración a Frente #06 dedicated compute. (2) Inference at scale: steady-state, requiere 50-200 GPUs A100/L40S deployment continuo. Opciones: deployment vía Modal/Replicate/Together AI (cost 0.001-0.005 USD/1K tokens output, total 500K-2M USD/año para volume Kiranir); deployment vía AWS/GCP enterprise tier (cost similar más egress fees); deployment dedicado vía Frente #06. (3) Edge inference: latency-sensitive (Oculus real-time observation, Sirius dashboard queries) requiere small-model deployment (Phi-3, Gemma 2 2B, Llama 3.2 1B) on-premise Lima/Trujillo. Partnerships estratégicos: Hugging Face (model hosting + dataset publication para output open-weights, Frente #20.5), Voyage AI (embedding co-development), MosaicML/Databricks (training infrastructure software stack), Anthropic Claude API (fallback durante años 1-2 antes de stack interno production-ready).
Liberación open-weights y posicionamiento
Doctrina de liberación de weights para tres tiers de modelos. (1) Base layer fine-tunes (Kiranir-Mistral-7B-Spanish-v1, Kiranir-Llama-8B-Andean-v1): liberación open-weights bajo Apache 2.0 sin restricciones de uso. Output benefit: contribución al ecosystem open-weights global, atrae ML researchers latam para colaboración, posicionamiento Kiranir como contribuidor serio (no extractivo) al campo. Riesgo: competencia se beneficia del fine-tuning kiranir-pagado; mitigación: el moat real es el dataset curado y el iteration cycle, no los weights estáticos. (2) Capacidad-vertical modelos (Sirius scoring model, hypergraph embedding model): liberación research-only (no commercial use sin licencia), permite reproducibilidad académica sin enable competencia directa. (3) Production modelos con datasets propietarios sensitive (perfiles humanos identificables, hipergrafo soberano embeddings): closed-weights, deployment solo interno. Posicionamiento: Mistral AI como modelo (Francia produjo soberanía cognitiva europea con valuación 6 mil millones EUR sin competir frontalmente con OpenAI/Anthropic). Aleph Alpha como modelo de focus en sectores sovereignty-sensitive (defensa, salud, gobierno). EleutherAI como modelo de contribución open-weights con credibilidad académica. Kiranir sintetiza los tres: open-weights baseline (atrae talento + visibility), vertical-specialized fine-tunes (capability competitive en dominios), closed production (data sovereignty preservation). Output esperado años 3-5: 6-12 papers en NeurIPS/ICML/ICLR firmados por Kiranir; 4-8 model releases en Hugging Face con 100K-1M downloads agregados; 2-4 collaborations con grupos académicos top (Stanford CRFM, MIT CSAIL, ETH Zurich, EPFL).