Vale.

Hoy no traigo prompt.

Los sábados me abre los mails menos gente (oh, qué sorpresa…), así que vamos a cambiar el enfoque.

Hoy te traigo el futuro. O mejor, el presente que parecía el futuro a 50 años vista hace 2.

OpenAI sacó antes de ayer (literalmente) un BENCHMARK. Ya hemos hablado de lo que son los benchmarks en el pasado.

Pero este lo sacan los de ChatGPT y... sorpresa, el mejor modelo no es de ellos. Es de la competencia (Claude Opus 4.1. -una maldita bestia en tareas de redacción-).

Pero es que eso da igual.

Lo importante es lo que se puede extraer del informe.

Un informe que por supuesto no te vas a leer ni de puta coña, pero que ya me lo he leído yo por ti para traducírtelo no solo al castellano sino al idioma que entienden los abogados.

Te dejo aquí el análisis que he hecho (sencillito, te lo les en 90 segundos).

Pero te resumo el tema...

Los mejores modelos de IA ya nos ganan casi en el 50% de las veces en tareas complejas.

Esto puede parecer un dato tonto.

Pero no lo es.

Significa que estamos en el punto de inflexión donde dejar de usar IA para tareas complejas es como seguir usando una máquina de escribir cuando ya existe Word.

¿Cuándo fue la última vez que viste una máquina de escribir en un despacho?

Pues eso.

Lee el análisis. En serio.

Buen finde.

PD: Mañana recopilatorio semanal como siempre.

Sigue leyendo

No posts found