Plus tôt cette semaine, OpenAI a publié leur «générateur d’images le plus avancé à ce jour» et l’a rendu disponible via Chatgpt en utilisant le modèle GPT-4O. Chatgpt s’appuyait auparavant sur Dall-E pour générer des images.
Selon OpenAI, le modèle 4O amélioré est capable de produire des résultats précis, précis et photoréalistes. Ils affirment qu’il est également particulièrement bon pour rendre le texte, suivre les instructions avec précision et même comprendre le contexte d’un chat. Tout cela comprend la transformation des images téléchargées ou l’utilisation d’images téléchargées comme inspiration visuelle.
GPT-4O peut également s’appuyer en permanence sur les images existantes pour s’assurer que le sujet reste cohérent entre les images. En plus de cela, GPT-4O est désormais en mesure de gérer 10 à 20 objets différents dans les images (par rapport à la plupart des autres générateurs d’images d’IA, qui ont du mal à inclure 5 à 8 objets différents).
Dans le même temps, Openai prévient que le GPT-4O peut avoir des problèmes avec les cultures, les hallucinations, trop d’éléments, des graphiques précis, le rendu du texte dans des alphabets non latins, l’édition précise et l’affichage de beaucoup de texte dense sur une petite surface.
Le nouveau générateur d’images 4O amélioré se déroule dès maintenant pour les utilisateurs de ChatGpt Free, Plus, Pro et Team. (Les utilisateurs de l’entreprise et de l’EDU auront accès plus tard.) Si vous pensez que Dall-E a fait de meilleures images, vous avez la possibilité de changer et de l’utiliser à la place.











