Yapay zeka dünyasındaki yenilik hız kesmeden devam ediyor.
Görsel üretimi konusunda uzun süredir yaşanan rekabete OpenAI’dan çok güçlü bir hamle geldi. Şirketin "dönüm noktası" olarak nitelendirdiği ChatGPT Images 2.0, klasik bir görsel üreticisinden çok, profesyonel bir tasarım asistanı olarak öne çıkıyor.
Sosyal medya platformlarında şimdiden gündem olan model; verilen komutu anlama, karakter tutarlılığı ve görsel içi metin yazımı konularında çok başarılı olarak karşımıza çıkıyor.
SADECE ÇİZEN DEĞİL, "DÜŞÜNEN" BİR SİSTEM
Yeni sürümün en önemli özelliği, temelini yeni GPT Image 2 modelinden alan "thinking" (düşünme) altyapısı oldu. Sistem en gelişmiş altyapı ile kullanıcının isteğini körü körüne işlemek yerine; isteği analiz ediyor, eksik ve mantıksal boşlukları dolduruyor, hatta gerekirse internetten gerçek zamanlı bilgi alarak doğru olanı öğrenebiliyor.
KARAKTER TUTARLILIĞI SORUNU TARİHE KARIŞIYOR
Yapay zeka ile görsel üretenlerin en büyük kabusu olan "bir sonraki karede değişen yüzler" sorunu Images 2.0 ile büyük ölçüde çözülüyor. Yeni model, tek bir komut ile aynı karakterin 8 farklı varyasyonunu, yüz hatlarını ve ortam tarzını bozmadan üretebiliyor.
Bu gelişme ile birlikte; manga, çizgi roman, storyboard hazırlığı gibi çizim sektörü, oyun karakteri prototipleme ile oyun teknolojileri ve sosyal medya içerikleri ile reklam kampanyalarını da etkileyerek medyanın birçok alanına tek başına hakim olabilecek bir teknoloji olarak karşımıza çıkıyor.
GÖRSELLERDE OKUNABİLİR VE MANTIKLI METİNLER
Önceki nesil yapay zeka modellerinde, görsel içindeki tabelalar veya afiş yazıları anlamsız harf yığınlarına dönüşüyordu. ChatGPT Images 2.0, bu kronik sorunu aşarak reklam afişlerinden YouTube küçük resimlerine (thumbnail), menü tasarımlarından infografiklere kadar her alanda kusursuz metinler üretebiliyor.
Ayrıca modelin sadece İngilizce ile sınırlı kalmadığı; Türkçe, Japonca, Korece ve Çince gibi dillerde de oldukça doğal, tipografik açıdan uyumlu ve hatasız yazılar çıkarabildiği görülüyor.
2K ÇÖZÜNÜRLÜK VE SINIRSIZ FORMAT ÖZGÜRLÜĞÜ
Teknik kapasitesini de artıran model, yeni güncelleme ile 2K çözünürlüğe kadar destek sunuyor. İşin en dikkat çekici yanı ise format esnekliği.
Sistem; 3:1 ultra geniş sinematik oranlardan, 1:3 dikey mobil ekran formatlarına kadar geniş bir yelpazede çalışabiliyor. Bu sayede kullanıcılar aynı platform üzerinden hem Instagram Reels kapağı hem de web sitesi hero görseli tasarlayabiliyor.
NANO BANANA İLE REKABETTE SON DURUM NE?
Son dönemde Google Gemini altyapısıyla çalışan Nano Banana, özellikle hız ve mobil cihaz optimizasyonuyla pazarın güçlü oyuncularından biri haline gelmişti. Ancak Images 2.0'ın piyasaya sürülmesiyle ibrenin yeniden OpenAI'a döndüğü konuşuluyor.
Kullanıcı geri bildirimlerine göre; Nano Banana hız konusunda hala avantajlı olsa da ChatGPT Images 2.0; komut anlama doğruluğu, karakteri koruma, derinlik hissi ve metin üretme kalitesinde rakibini geride bırakmış durumda.
SEEDANCE İLE BİRLEŞİNCE FİLM YAPILABİLİYOR
Ayrıca ChatGPT Images 2.0 ile üretilen birden fazla film karesi, son zamanların en popüler video yapay zekası olan Seedance 2.0 ile muazzam bir uyumla çalışıyor. Images 2.0 ve Seedance 2.0 uyumunu deneyen kullanıcılar, kısa filmler, animeler ve reklam filmleri oluşturabiliyorlar.
KİMLER KULLANABİLİR?
Açıklanan bilgilere göre ChatGPT Images 2.0, tüm ChatGPT kullanıcılarının erişimine açılmış durumda. Ancak en yüksek kaliteli çıktılar Plus, Pro, Business ve Enterprise abonelerine özel olarak sunuluyor. Ayrıca geliştiriciler, OpenAI API ve Codex üzerinden de bu yeni modele erişebilecekler.