AI ENGINEER · MLOPS · COSMIC RAY PHYSICS

Construyo sistemas de IA escalables, desde rayos cósmicos hasta agentes inteligentes.

Soy Marlon Steve García. Ingeniero de IA y científico de datos con base en física. Diseño pipelines de Machine Learning, sistemas RAG y arquitecturas multi-agente — con la misma rigurosidad con la que proceso 42 millones de eventos de un observatorio de rayos gamma.

01

Sobre mí

Soy físico de formación (Licenciatura, BUAP) y actualmente curso la Maestría en Ciencia de Datos, con una tesis sobre Machine Learning aplicado a la separación gamma-hadrón en el observatorio HAWC.

Profesionalmente trabajo como AI Engineer en Sharksia, construyendo una plataforma multi-agente de reclutamiento con RAG, MCP y Azure AI Search. Mi día a día combina Generative AI, MLOps y data engineering sobre sistemas reales en producción.

Tengo experiencia trabajando con grandes volúmenes de datos en entornos de alto cómputo — clusters GPU NVIDIA A100/V100, entrenamiento distribuido y procesamiento de datos de los observatorios HAWC y Pierre Auger.

4+
años de experiencia
0.974
AUC en clasificador HAWC
42M
eventos procesados
+85%
precisión en sistemas RAG
02

Proyectos destacados

ML · PHYSICS

HAWC Gamma-Hadron Separation

Pipeline de separación de señales gamma del fondo hadrónico usando PU Learning y XGBoost sobre eventos de rayos cósmicos. Eliminación de data leakage y validación rigurosa.

PythonXGBoostuprootAwkward Array
AUC = 0.9741 · 42M eventos
↗ Ver en GitHub
MLOPS · AGENTS

Plataforma Multi-Agente de Reclutamiento

Sistema de agentes inteligentes para reclutamiento con RAG, vectorización semántica (text-embedding-3-large), matching por similitud coseno y orquestación vía MCP.

FastAPIMCPAzure AI SearchMongoDB
+85% precisión en matching
↗ Ver en GitHub
PHYSICS · DATA

Medición de la masa del bosón Z

Pipeline de análisis con CMS Open Data (Run2011B DoubleMu, NanoAOD). Reconstrucción de la masa invariante de dimuones a partir de datos reales del LHC.

uprootAwkward ArrayHEP
90.56 GeV medido · PDG: 91.19
↗ Ver en GitHub
ML · ENERGY

Predicción de demanda eléctrica

Red neuronal para predecir el consumo energético por zonas usando datos abiertos de CENACE, con un pipeline de data scraping automatizado.

PyTorchPandasScraping
↗ Ver en GitHub
NLP · LLMs

RAG Náhuatl–Español

Fine-tuning de LLMs y sistema RAG para traducción y recuperación semántica en lengua indígena. Embeddings especializados para un dominio de bajos recursos.

LangChainEmbeddingsFine-tuning
↗ Ver en GitHub
DEEP LEARNING · HPC

Graph Neural Networks — Auger / HAWC

Entrenamiento distribuido de GNNs con PyTorch Geometric sobre clusters GPU del LNS-BUAP, optimizado para NVLink y Tensor Cores.

PyTorch GeometricCUDASlurmMPI
↗ Ver en GitHub
03

Experiencia

09/2025 — Presente

Ssr AI Engineer

Sharksia · Remoto
  • Agentes inteligentes con MCP y sistemas RAG (+85% precisión)
  • Orquestación de pipelines con Apache Airflow y tracking con MLflow
  • Despliegue de servicios de IA con Docker y Kubernetes
01/2023 — Presente

Investigador Asociado

Laboratorio Nacional de Supercómputo (LNS-BUAP)
  • Entrenamiento distribuido de GNNs (PyTorch Geometric + DDP)
  • Clusters GPU NVIDIA A100/V100 · Slurm · CUDA · MPI
  • Optimización para NVLink y Tensor Cores
2024 — Presente

Data Scientist (Investigación)

CIIEC-BUAP
  • Procesamiento de Big Data para HAWC y Pierre Auger (Apache Spark)
  • NLP y Generative AI: fine-tuning de LLMs y RAG Náhuatl-Español
  • Computer Vision con YOLOv8 y HALCON sobre imágenes 12000×12000 px
06/2024 — 08/2025

Data Science Manager

Laboratorio Clínico DICLIVA · Remoto
  • Pipelines ETL y modelos de ML para datos clínicos
  • Sistemas de visualización para diagnóstico médico
  • Servidores internos para gestión segura de datos sensibles
04

Stack técnico

ML / AI

XGBoostPyTorchTensorFlowScikit-learnPU LearningGNN

GENERATIVE AI

LLMsRAGMCPLangChainEmbeddingsFine-tuning

MLOPS

MLflowAirflowDockerKubernetesGitHub Actions

DATA ENGINEERING

Apache SparkMongoDBPostgreSQLAzure AI SearchFastAPI

HPC / ASTROFÍSICA

CUDASlurmMPIuprootAwkward Array

COMPUTER VISION

YOLOv8HALCONCNNSegmentación

Trabajemos juntos

Estoy abierto a proyectos de IA, consultoría en ML/MLOps y colaboraciones de investigación. Hablemos.