AI

OpenAI, Gelişmiş Metin ve Akıl Yürütme Yetenekleriyle ChatGPT Images 2.0'ı Tanıttı

21 Nisan 2026Kaynak: Engadget
OpenAI, Gelişmiş Metin ve Akıl Yürütme Yetenekleriyle ChatGPT Images 2.0'ı Tanıttı
Photo by Solen Feyissa / Unsplash
Kemal Sivri

Kemal Sivri

Siber Güvenlik & Bilim Muhabiri

OpenAI, yapay zeka görsel üretme modelini önemli ölçüde geliştiren ChatGPT Images 2.0'ı duyurdu. Yeni sürüm, Latin alfabesi dışındaki dillerdeki metinleri daha iyi işleme ve daha güvenilir, doğru çıktılar için akıl yürütme yetenekleri sunuyor.

Reklam

OpenAI, yapay zeka görsel üretme yeteneklerinde önemli bir sıçrama olan ChatGPT Images 2.0'ı kullanıma sunuyor. Bu güncellenmiş sistem, özellikle detaylı komutları takip etme, metinleri ayrıntılı bir şekilde işleme ve sahnelerdeki nesnelerin yerleşimini sağlama konusunda "adım niteliğinde bir değişim" vaat ediyor. OpenAI, ilk kez görsel modeline akıl yürütme yetenekleri entegre ederek, web aramaları ve çıktı doğrulama gibi görevleri yerine getirmesini sağlıyor. Bu sayede doğruluk, tutarlılık ve görsel bütünlük açısından daha fazla güvenilirlik hedefleniyor.

Images 2.0'ın önemli odak noktalarından biri, Latin alfabesi dışındaki metinlerin anlaşılması ve işlenmesindeki iyileştirmeler. OpenAI, Japonca, Korece, Çince, Hintçe ve Bengalce metinleri işleme konusunda önemli ilerlemeler kaydettiğini belirtiyor. Şirket ayrıca yeni modelin farklı görsel dillerin inceliklerini daha doğru bir şekilde yakalayabildiğini iddia ediyor, bu da onu oyun prototipleme ve storyboard hazırlama gibi görevler için daha uygun hale getiriyor. Metin yeteneklerinin yanı sıra, model en boy oranlarında daha fazla esneklik sunarak 3:1 genişliğinden 1:3 yüksekliğine kadar görseller üretebiliyor, 2K'ya kadar çözünürlükte çıktılar verebiliyor ve aynı anda sekiz adede kadar görsel oluşturabiliyor.

Kullanıcıya sunulmadan önce yapılan bir ön incelemede, Images 2.0 Pokémon'un üçüncü nesil oyunlarının piksel sanat stilinde bir tekir kedi görseli üreterek yeteneklerini sergiledi. Bu tür görevler genellikle yapay zeka modelleri için zorlayıcıdır. Model ayrıca görseli şeffaf bir PNG'ye dönüştürmeyi ve bir kedi hakkında dört sayfalık bir manga oluşturmayı başardı. Üretilen görsellerden biri komuttan biraz sapma gösterse de, genel performans, özellikle şeffaf PNG'ler gibi karmaşık istekleri yerine getirme konusundaki başarısı takdire şayandı.

ChatGPT Images 2.0, bugün itibarıyla Free ve Go katmanlarındaki kullanıcılar dahil olmak üzere tüm ChatGPT kullanıcıları için erişilebilir durumda. Plus ve Pro aboneleri daha gelişmiş özelliklere erişebilecek. Model ayrıca OpenAI'nin API hizmeti ve Codex kodlama uygulaması aracılığıyla da sunuluyor. Bu lansman, Anthropic'in kendi tasarım asistanını piyasaya sürmesinden kısa bir süre sonra gerçekleşti ve yapay zeka destekli görsel tasarım alanındaki rekabeti kızıştırdı.

Reklam

Yorumlar (0)

Görüşünü Bildir

Yükleniyor...

İlk yorumu siz yapın.