Navegando el caos: un enfoque pragmático para evaluar sistemas LLM
Marco técnico para evaluar sistemas LLM con verificaciones deterministas, jueces basados en modelo, métricas de retrieval y revisión humana.
Constructor de IA y narrador con datos
Notas sobre sistemas de IA, modelación ambiental y ciencia de datos aplicada.
Marco técnico para evaluar sistemas LLM con verificaciones deterministas, jueces basados en modelo, métricas de retrieval y revisión humana.
Tutorial aplicado para crear un flujo de recomendación con retrieval-augmented generation y búsqueda vectorial.
Una mirada práctica a las inundaciones por aguas subterráneas en Baviera y cómo la inferencia bayesiana hace visible la incertidumbre en mapas de riesgo.