The DeFi Report - Sponsor Image The DeFi Report - Industry-leading crypto research trusted by finance pros. Friend & Sponsor Learn more

Guía para principiantes sobre el arte de la IA con Midjourney

Una introducción a los principios básicos de los códigos de estilo y las instrucciones de Midjourney.
Guía para principiantes sobre el arte de la IA con Midjourney
4
0

Subscribe to Bankless or sign in

He estado experimentando con herramientas artísticas de IA desde 2019. Luego, realmente me metí en la madriguera del conejo en 2022 después de que saliera Stable Diffusion.

Dicho esto, me encanta Stable Diffusion, ya que he jugueteado con ella un montón.

Sin embargo, después de sumergirse en Midjourney este año, y aprender sus cuerdas, he encontrado que ofrece mucha más flexibilidad estética y control que lo que herramientas similares como Stable Diffusion y ChatGPT's DALL-E 3 pueden ofrecer.

Sin embargo, para sacar el máximo partido a Midjourney, es necesario dominar su sistema de estilos.

Esto implica 1) formatear tus mensajes correctamente, y 2) usar "códigos de referencia de estilo" para apuntar a estéticas únicas específicas. En esta guía, te guiaré a través de los fundamentos de estos dos elementos para que puedas empezar a crear tus propias obras maestras de Midjourney.


¿Qué es Midjourney?

Midjourney Midjourney es una herramienta de generación de imágenes de IA que utiliza técnicas de aprendizaje automático, incluyendo grandes modelos de lenguaje y modelos de difusión, para convertir "indicaciones" de texto en imágenes.

El aspecto del modelo de lenguaje ayuda a Midjourney a interpretar las indicaciones, mientras que los modelos de difusión se encargan de refinar gradualmente estas instrucciones hasta convertirlas en imágenes coherentes.

Se está desarrollando una plataforma web, pero en la actualidad Midjourney opera principalmente a través de su Discord, donde los usuarios pueden introducir instrucciones de texto en el servidor para generar imágenes de alta calidad sin necesidad de conocimientos especializados ni software.

A diferencia de competidores como DALL-E 3, que cuenta con una importante financiación de grandes empresas como Microsoft, Midjourney se autofinancia y no ha recibido financiación externa hasta la fecha.


Cómo empezar con Midjourney

Para empezar a usar Midjourney, necesitarás:

1) Unirte al Discord de Midjourney

Crear o iniciar sesión en una cuenta de Discord y únete al servidor Midjourney.

2) Suscríbete

Elige un plan de suscripción para empezar a generar imágenes. El plan básico cuesta a partir de 10 $ al mes.

via Midjourney

3) Avisos de entrada

Navega a una de las salas de avisos en el servidor Discord de Midjourney y utiliza los avisos de texto en el campo de mensaje para generar imágenes. Normalmente se tarda 1 minuto en generar 4 imágenes.

via Midjourney

Cómo navegar por Midjourney

Midjourney ofrece una enorme versatilidad estética mediante códigos de referencia de estilo (sref).

Hay más de 4.200 millones de códigos sref, y cada uno está vinculado a una estética única. Incluso puede combinar códigos sref para mezclar estéticas. Por ejemplo, escribiendo --sref 1000 1001 le pide a Midjourney que añada los estilos 1000 y 1001 juntos cuando genere imágenes.

El nombre del juego, entonces, es encontrar y usar buenos códigos sref para actualizar resultados consistentes de alta calidad con una estética que te guste. Preste especial atención a cómo encajan estos códigos en los siguientes ejemplos.

Entendiendo-prompts

La imagen de arriba es una salida que he creado con Midjourney. El mensaje que introduje en Discord para crear esta imagen era el siguiente:

Esta instrucción puede parecer un poco confusa al principio, así que he utilizado diferentes colores para resaltar las distintas partes de la instrucción. Vamos a desglosarlas:

  • 🟢 /imagine - Este es el comando de la Discordia que se escribe en una de las salas de instrucciones de la Discordia de Midjourney. Al escribirlo, aparecerá inmediatamente una burbuja en el campo de mensajes para que empieces a introducir una instrucción.
  • 🔵 una figura con capa sentada junto a una hoguera - Esta segunda parte es el principio de tu instrucción principal. Estas son las instrucciones visuales centrales que le das a Midjourney y que definirán tus salidas. Obtenga tan visualmente descriptivo aquí como desee, más detalles pueden conducir a mejores resultados.
  • 🟣 --ar 2:1 - Este código, que comienza con dos guiones simples, define la relación de aspecto deseada de sus salidas. Si desea salidas en forma de cuadrados perfectos, podría utilizar --ar 1:1, etc. A menudo uso --ar 2:1 para hacer gráficos destacados de estilo horizontal para Metaversal.
  • 🔴 --sref 3528972627 - Por desgracia, este es el código de referencia de estilo, que también comienza con dos guiones. Midjourney puede generar una escena de hoguera en literalmente miles de millones de estéticas diferentes, así que este código en particular activa una estética específica, dibujada a mano con aspecto de carboncillo.
  • 🟡 --sw 500 - Este es el código de peso del estilo. Es responsable de establecer la fuerza de la estilización de su código sref, con entradas posibles que van de 0 a 1000. Yo suelo ir justo en el medio aquí y dejar esto en 500, pero es una vía para jugar con si quieres experimentar con tus visuales.

Combinando Códigos-de-Estilo

Digamos que quieres combinar los visuales de la imagen de la hoguera de arriba con el estilo de la salida Midjourney de abajo para apuntar a un aspecto más púrpura sin dejar de mantener una estética rasposa, como el carbón.

Para ello, sólo necesitamos el código sref del segundo estilo al que queremos apuntar, así que veamos el mensaje de salida anterior:

Aquí, todo lo que necesitamos es el "783", que añadiremos a un nuevo prompt de fusión. En este punto para el nuevo prompt, coloca el segundo código sref directamente después de tu primer código sref con un solo espacio así:

Para ilustrar, a continuación se muestra un ejemplo de salida de este nuevo aviso fusionado que utiliza los códigos sref "3528972627" y "783". Fíjese en cómo mantiene el aspecto dibujado a mano del original, al tiempo que introduce efectos visuales más violáceos gracias al segundo código sref modificador:

Managing Your Outputs

Después de que hayas introducido un mensaje en Midjourney, la herramienta tardará ~1 minuto en generar 4 resultados iniciales para que los tengas en cuenta de la siguiente manera:

Si no estás satisfecho con tus 4 salidas iniciales, puedes pulsar el botón 🔄 para lanzar 4 salidas totalmente nuevas.

Si te gusta una de las salidas, puedes ampliarla para descargarla como imagen individual. Por ejemplo, en la captura de pantalla de arriba quería aumentar la escala y descargar la imagen superior izquierda, así que pulsé "U1". Si hubiera querido la imagen inferior derecha, habría pulsado "U4", etc.

Si en cambio desea obtener 4 nuevas variaciones de una única salida específica que ya ha generado, podría pulsar una de las opciones "V1" a "V4". Al pulsar "V3" para la tercera salida en la captura de pantalla anterior, obtuve estas nuevas variaciones basadas sólo en esa tercera salida:


Códigos de estilo de ejemplo

Encontrar buenos códigos sref para desbloquear estéticas específicas es la parte difícil.

Por supuesto, siempre puedes intentar introducir números aleatorios y encontrar espontáneamente nuevos códigos interesantes de esa manera. Personalmente, he encontrado muy útil el Midjourney wiz Nick St. Pierre's Discord, ya que tiene canales que trazan 2.500 códigos de estilo diferentes que puedes empezar a hojear.

Para demostrar la gran flexibilidad que hay aquí, he reunido un puñado de códigos de ejemplo a continuación, cada uno con una estética muy distinta.

sref 475

sref 843

sref 1000

sref 1739

sref 1924


William M. Peaster

Written by William M. Peaster

988 Articles View all      

William M. Peaster, Senior Writer, has been with Bankless since January 2021. Immersed in Ethereum since 2017, he writes the Metaversal newsletter on the onchain frontier, covering everything from AI projects to crypto games, as the team’s lead NFT analyst. With a background in creative writing, he writes fiction and publishes art on Ethereum in his free time.

No Responses
Buscar en Bankless