AI ENGINEER · MLOPS · COSMIC RAY PHYSICS
Soy Marlon Steve García. Ingeniero de IA y científico de datos con base en física. Diseño pipelines de Machine Learning, sistemas RAG y arquitecturas multi-agente — con la misma rigurosidad con la que proceso 42 millones de eventos de un observatorio de rayos gamma.
Soy físico de formación (Licenciatura, BUAP) y actualmente curso la Maestría en Ciencia de Datos, con una tesis sobre Machine Learning aplicado a la separación gamma-hadrón en el observatorio HAWC.
Profesionalmente trabajo como AI Engineer en Sharksia, construyendo una plataforma multi-agente de reclutamiento con RAG, MCP y Azure AI Search. Mi día a día combina Generative AI, MLOps y data engineering sobre sistemas reales en producción.
Tengo experiencia trabajando con grandes volúmenes de datos en entornos de alto cómputo — clusters GPU NVIDIA A100/V100, entrenamiento distribuido y procesamiento de datos de los observatorios HAWC y Pierre Auger.
Pipeline de separación de señales gamma del fondo hadrónico usando PU Learning y XGBoost sobre eventos de rayos cósmicos. Eliminación de data leakage y validación rigurosa.
Sistema de agentes inteligentes para reclutamiento con RAG, vectorización semántica (text-embedding-3-large), matching por similitud coseno y orquestación vía MCP.
Pipeline de análisis con CMS Open Data (Run2011B DoubleMu, NanoAOD). Reconstrucción de la masa invariante de dimuones a partir de datos reales del LHC.
Red neuronal para predecir el consumo energético por zonas usando datos abiertos de CENACE, con un pipeline de data scraping automatizado.
Fine-tuning de LLMs y sistema RAG para traducción y recuperación semántica en lengua indígena. Embeddings especializados para un dominio de bajos recursos.
Entrenamiento distribuido de GNNs con PyTorch Geometric sobre clusters GPU del LNS-BUAP, optimizado para NVLink y Tensor Cores.
Estoy abierto a proyectos de IA, consultoría en ML/MLOps y colaboraciones de investigación. Hablemos.