Como un niño con zapatos nuevos...

Vale.

Hoy ha ocurrido algo que los que estamos malitos con la IA llevábamos tiempo esperando.

Google ha lanzado la previsualización de su nuevo modelo de IA GEMINI 3 PRO.

La gente estaba MUY expectante con ello…

Y parece que no va a decepcionar.

Por lo visto tiene mejoras porcentuales del 30% en benchmarks que no están overfitteados

(venga Julio, bien jugado. Aquí se te han dado de baja 50 personas, espero que estés orgulloso…)

Os lo traduzco. En tests nuevos para probar cuales son los mejores modelos de IA, está ganando en algunos casos por una diferencia del 30%.

Eso es demencial.

Y la verdad es que lo he probado y PINTA BASTANTE CAÑÓN, no te voy a mentir.

¿Que cómo lo sé?

Porque tengo mis propias pruebas para los modelos.

Cuando sale un modelo nuevo, le “doy de comer” ciertos prompts que tengo especialmente preparados para eso.

¿Qué tipo de prompts?

Son preguntas MUY finas de mi área de especialidad.

Donde sé distinguir perfectamente entre una respuesta de 8,5 y una de matrícula de honor.

Y además, hay dos o tres trampas que dependiendo de si las detecta o no, puedo verificar la calidad del modelo.

No os voy a dar mis prompts de BENCHMARKING.

No porque les tenga bastante aprecio (que algo sí porque llevo usándolos muchos meses).

Sino porque no funciona así.

Funciona creando los tuyos propios EN TU ÁREA DE ESPECIALIDAD.

Y cada uno tendréis una.

Lo que sí os animo hoy es a intentar “engañar” al mejor modelo que existe actualmente.

Y al que tenéis acceso de manera absolutamente gratuita desde esta tarde.

¿Cómo?

Te metes AQUÍ

Te metes con una cuenta de GMAIL cualquiera…

Y pinchas en PLAYGROUND:

Luego seleccionas este modelo:

Y luego haces que todos los parámetros que tiene estén así:

Y a partir de ahí, LE DAS SIN PIEDAD.

Recuerda, tienes acceso al modelo de IA más avanzado del mundo en acceso público.

Por supuesto, esto NO ES GRATIS.

(Pero si nos habías dicho que era gratis…)

O sea, no vas a pagar dinero, pero a cambio le vas a dar a Google TODOS los datos que metas.

Así que (y aquí me pongo serio de verdad) NI SE TE OCURRA LA FELIZ DE METER DATOS DE CLIENTES NI CONFIDENCIALES DE NINGÚN TIPO.

Esto es un campo de pruebas.

FIN.

Pero si logras “pillar” a este modelo. Ya tendrás un EJEMPLO para ser capaz de testear las nuevas herramientas y modelos más punteras que vayan saliendo.

Y por tanto, desarrollando un criterio para decidir con qué modelos de IA prefieres trabajar.

Como siempre.

¿Dudas? 👉 Me escribes.

Más cositas mañana.

Chao.

Como un niño con zapatos nuevos...

Sigue leyendo

Julio Huélamo