Cómo generar imágenes con Gemini: guía completa

En esta guía te cuento cómo generar imágenes con Google Gemini paso a paso, ya sea desde el ordenador o gracias a su aplicación para móviles

Cómo generar imágenes con Gemini: guía completa
Google Gemini generando una imagen de un gatito
Publicado en Google
Por por Edgar Otero

En esta guía te voy a explicar cómo generar imágenes con Gemini de Google. Actualmente, este chatbot es capaz de crear gráficos a partir de texto gracias a su modelo Imagen 3. Después de hacer muchas pruebas con la versión gratuita, puedo confirmar que la calidad de los resultados es bastante alta. En general, me ha resultado muy fácil generar imágenes con tan solo escribir algunos prompts e, incluso, agregar modificaciones a medida que iba obteniendo los resultados. ¿Cómo puedes hacerlo tú mismo? Sigue los pasos que te muestro a continuación y sácale más partido a Google Gemini.

Generar imágenes con Gemini paso a paso

Antes de nada, debo aclarar que todo lo que te explico aquí se basa en mi experiencia usando Gemini en la web, desde mi ordenador. Sin embargo, no importa en qué plataforma estés usando la IA de Google. Ya sea en el móvil o en el ordenador, en la web o en la app, la plataforma se comporta de manera muy similar.

Para empezar, solo tienes que pedirle a Gemini que imagine, genere o cree una imagen. Estos verbos son los más indicados para iniciar el prompt que activará el uso de Imagen 3, el modelo de generación de imágenes de Google, que está integrado en Gemini. Por ejemplo, puedes empezar por algo así:

  • Crea una imagen de un gatito comiendo helado en mitad de una ciudad europea
Cómo generar imágenes con Gemini: guía completa

Generando imágenes con Google Gemini

El resultado es bastante bueno. Antes de continuar, te cuento algo en lo que quizá no habías caído. ¿Cuál es la resolución de la imagen? Pues si la descargas en tu ordenador o dispositivo, verás que cuenta con unas dimensiones de 2048x2048 píxeles. Se trata de una imagen bastante grande, con una resolución muy buena para ser utilizada en distintos escenarios, como documentos de Word o portadas de artículos.

Bien, ya tienes una primera imagen de un gatito en medio de la ciudad comiendo un helado. Es verdad que el gato no parece estar disfrutando mucho, porque ni siquiera se le ve acercar el hocico al alimento. Lo bueno es que, a partir de esta creación, vas a poder agregar modificaciones de manera muy simple. Ahora bien, la imagen que se generará será totalmente nueva, aunque Gemini tendrá en cuenta el contexto. Yo le he pedido esto, justo después de obtener la imagen:

  • ¿Puedes hacer que sea de noche?
Cómo generar imágenes con Gemini: guía completa

Generando imágenes con Google Gemini

El resultado es bastante interesante. Ahora, en la imagen es de noche. El gato es muy parecido al anterior y el helado también. De igual modo, los coches que se ven en la parte posterior siguen siendo clásicos, aunque no están en la misma posición. Tampoco es idéntica la calle. Como te dije, a pesar de poder introducir cambios, lo que se obtiene con cada modificación es un trabajo efectuado desde cero por Imagen 3. Así que hay algunas cosas que van a cambiar.

Otra cosa que puedes hacer con Imagen 3 es añadir textos a tu imagen. Lo puedes hacer desde el principio, pero también añadir elementos de este tipo más adelante. Después de hacer que cayera la noche en nuestra ciudad europea, le he pedido a Google Gemini que haga esto:

  • Genial, añade un neón en alguna parte que diga "gatito lindo"
Cómo generar imágenes con Gemini: guía completa

Generando imágenes con Google Gemini

El resultado es una imagen que se ve bastante bien, con un neón que efectivamente dice exactamente lo que se le pidió a Google. El modelo no hace ningún extraño con la tipografía, sino que ha elegido una que es coherente con el soporte donde está escrito el texto, es decir, el neón.

Por cierto, todas estas imágenes se van a quedar guardadas en el chat. En la esquina superior derecha, aparece un botón de descarga. Solo tienes que pinchar sobre él para bajar cualquiera de las imágenes que has generado con la IA. Como te dije, tienen una resolución muy alta, aunque todas las imágenes son cuadradas. Esto puede ser un inconveniente en algunos casos, como cuando deseas usarlas como portada de YouTube. Para solucionar este problema, en la mayoría de los casos, basta con subir la imagen a Canva utilizando una plantilla con las dimensiones que necesitas.

Para terminar, le he pedido a Gemini que haga esto:

  • Vuelve a hacer que sea de día, por favor
Cómo generar imágenes con Gemini: guía completa

Generando imágenes con Google Gemini

Nuevamente, en la imagen aparece un gato en una escena diurna. Lo que pasa es que la imagen es distinta a la primera, aunque sigue pareciéndose mucho. Recuerda que puedes editar cualquier prompt si el resultado no te gusta. No es necesario ir enviando correcciones para cualquier detalle que no te convenza. Simplemente, presiona en el icono del lápiz que hay en cada petición que has enviado y añade los detalles que consideres oportunos. Lo malo es que la nueva respuesta sobrescribirá la anterior y perderás el acceso a la imagen generada previamente. Si deseas conservar cada una, antes de editar la petición, descarga la imagen en tu dispositivo.

Cómo generar imágenes con Gemini: guía completa

Generando imágenes con Google Gemini

Para terminar, aquí va un último truco. Puedes usar una imagen existente como base para generar una nueva imagen. En el siguiente ejemplo, he subido una de las imágenes que ha generado Imagen 3 en Gemini y le he pedido esto:

  • Crea una imagen similar, pero que pase en la luna
Cómo generar imágenes con Gemini: guía completa

Generando imágenes con Google Gemini

El resultado es muy bueno, pues ha tomado el gato y el helado y ha situado ambos elementos encima de la luna. Vale, las dimensiones son muy desproporcionadas, pero a partir de aquí es posible ir aplicando modificaciones y añadiendo detalles. Obviamente, no solo funciona con imágenes generadas por IA, sino con cualquier foto que tengas en tu equipo. Simplemente, súbela y pídele a Gemini que se base en lo que ve para generar una nueva imagen.

También tengo que decirte que he hecho muchas pruebas sin acceder a Gemini de pago, pero no han aparecido límites, como sucede en otros servicios similares. Parece que, por ahora, se pueden generar tantas imágenes como se desee o, al menos, en grandes cantidades.

Para ti
Queremos saber tu opinión. ¡Comenta!