Los últimos LM son multimodales. ¡Pueden traducir texto a texto, texto a imágenes e incluso imágenes a imágenes!