• GalaxIA
  • Posts
  • Gemini, la Nueva IA de Google Acusada de Mentir

Gemini, la Nueva IA de Google Acusada de Mentir

Diferencias con ChatGPT y como probar Gemini

Hola humano!🖐🏻

Acabas de llegar a

La Newsletter donde podrás aprender como aplicar los últimos avances de la Inteligencia Artificial en tu vida personal y profesional

En el correo de este Jueves:

Gemini, la Revolucionaría IA de Google, sus diferencias con ChatGPT y como probarla 💻👈🏻

¿Te han reenviado esta Newsletter?

¡Haz click y suscríbete!

El pasado 6 de diciembre Google presentaba al mundo su modelo de IA más avanzado hasta la fecha, Gemini.

Vamos a empezar explicando que Gemini es un modelo multimodal, que va a poder entender varios tipos de información, tanto textos, imágenes, audios y códigos de programación.

Como innovación, Gemini también introduce un nuevo sistema de generación de código llamado AlphaCode2. Este sistema mejora la comprensión de matemáticas complejas y la teórica de ciencias de la computación.

De esta manera Google busca liderar el competitivo mercado de la inteligencia artificial que hasta ahora encabeza OpenAI con ChatGPT.

Recientemente Google sorprendió en redes con Gemini, en su presentación veíamos cómo este modelo parecía responder a todo lo que hacía el usuario, como averiguar dónde el usuario escondía un objeto y jugar a piedra, papel o tijera.

Sin embargo cabe destacar que gran parte de lo que vimos en el vídeo de presentación no sucedía en tiempo real, lo que parecían múltiples formas de información, era la respuesta que Gemini daba a un simple prompt de texto, algo que no se veía en el vídeo y que confirmó un portavoz de Google.

Y es que al parecer, el vídeo se elaboró utilizando fotogramas de la grabación y usando estas imágenes para que Gemini pudiera responder vía texto a través de varios prompts.

Aquí hay una parte de la presentación 👇🏻

Para alimentar al modelo con la información que aparece en el vídeo se le proveía de algunas imágenes, de forma que Gemini pudiese responder a la pregunta de a qué juego estaba jugando.

En este sentido, es algo similar a lo que hace GPT-4 Vision, donde le podemos enviar una imagen a la IA para que la procese e interprete.

Oriol Vinyals, uno de los principales responsables de Gemini, admite que el vídeo demuestra como podrían ser las experiencias de usuario multimodales construidas con Gemini.

Esto nos indica que puede que todavía falte un buen tiempo hasta poder utilizar Gemini de esta manera.

Diferencias con GPT 🧐

Gemini tiene tres versiones diferentes: Ultra, Pro y Nano.

Gemini Ultra es la más avanzada y multimodal, la segunda es más limitada en capacidades y funciones, y la versión Nano está enfocada a dispositivos con menos capacidades de computación y memoria, y así poder funcionar en teléfonos móviles.

Aunque parezca la menos potente, Gemini Nano es una de las mayores revoluciones, ya que podrá ser utilizada como una IA que se implementa directamente dentro del dispositivo. Esto quiere decir que no tendrías que usar una app que se conecte a un servidor de IA como pasa con ChatGPT, sino que la IA podrá venir directamente en tu móvil y no necesitar conexión.

Gemini Ultra es el competidor de GPT-4, y supera a este otro lenguaje de IA en las pruebas actuales. Mientras Gemini Pro es el competidor de GPT 3.5, que es el que encontramos en ChatGPT gratuito. Sin embargo por el momento Gemini Nano no se puede comparar con ningún producto de OpenAI.

Otra de las cosas que debemos diferenciar es que Gemini es multimodal y GPT no. Esto quiere decir que de forma nativa o "de fábrica" podrá entender fotos, audios, texto y más tipos de entrada sin tener que buscar implementar ningún tipo de complemento.

Como probar Gemini

Tal y como anunció la propia Google, Gemini Pro está integrado en la versión disponible de Google Bard.

Eso sí, el último modelo sólo aparece en inglés y a quienes se encuentran físicamente en Estados Unidos; por lo que no hay más remedio que imitar ambas premisas si quieres acceder desde otros países.

Estos son los pasos que tienes que seguir para probar Gemini Pro desde un dispositivo Android:

  • Abre un navegador web en tu Android, como Google Chrome.

  • Accede a tu cuenta de Google y ve hasta «Información personal».

  • Desciende hasta «Preferencias generales para la Web» y entra en «Idioma».

  • Selecciona el inglés de Estados Unidos como idioma preferido. Alternativamente, puedes acudir a este enlace evitando los pasos anteriores.

  • Ahora necesitas un VPN para simular una conexión desde Estados Unidos, por ejemplo NordVPN.

  • Carga un servidor estadounidense y ve a la página de Bard. Te debería salir en inglés avisándote de que está usando el modelo Gemini Pro.

  • Una vez tengas Google Bard con el modelo Gemini Pro (puedes preguntárselo para asegurarte), éste se mantendrá operativo mientras sigas las dos premisas: debes hablarle en inglés y mantener activo el VPN.

    En el momento que no cumplas cualquiera de las dos pasarás a utilizar PaLM 2, el modelo anterior a Gemini.

🙃 ¡Esto es todo por hoy!

Gracias por llegar hasta aquí! ¿Qué te pareció el boletín de hoy?

Nos vemos por LinkedIn o Twitter si estáis por ahí ¡Hasta la próxima!