Yapay ZekaTeknoloji

Stable Diffusion: Metin-Görsel Endeksli Yapay Zekâ Modellerine Ücretsiz Alternatif!

Metin tanımları üzerinden, kendine özgü görseller yaratabilen birçok yapay zekâ modeli bulunuyor.

En popüler örnekler olan, kurucuları arasında Elon Musk‘ın da bulunduğu araştırma ve dağıtım şirketi OpenAI’nin DALL·E servisi ve Google’ın, görselleri daha gerçekçi oluşturan Imagen modeli bulunuyor.

Bahsettiğimiz yapay zekâ modellerinin kullanımı oldukça basit. Hayal gücünüze dayalı bir metin öbeği oluşturduktan sonra, servisin metni algılayıp betimlediği görseli sunmasını bekliyorsunuz.

Ancak modellerde, görsellerin internette kötüye kullanımını engellemek amacı ile bazı kısıtlamalar bulunuyor. Oluşturulan görseller henüz halka açık değil ve site içerisinden görselleri almanıza izin yok. Ayrıca Bahsedilen servisler maalesef ücretsiz değil.

Stable Diffusion
Stable Diffusion

Stable Diffusion da bahsettiğimiz modeller gibi metinleri görsele dönüştürüyor.

DALL·E servisi ile hemen hemen aynı işlevlere sahip ancak filtrelerinde çok çeşit bulunmayan tamamen ücretsiz bir alternatif. Stability AI‘nin projesi olan Stable Diffusion modelinin eğitim sürecinde, beta test kullanıcıları tarafından 1.7 milyon görsel oluşturuldu.

Oxford’dan matematik ve bilgisayar bilimlerinde yüksek lisans derecesi ile mezun olan Emad Mostaque, 2020 yılında, yapay zekâya olan kişisel hayranlığı sebebi ile Stability AI‘yi kurdu. Kurucunun, yoksul toplumda yaşayan insanlara akıllı telefon ve internet erişimi maliyetini düşürmeyi amaçlayan bir projesi de bulunuyor.

Proje, halka açmanın ilk adımı olarak, geçtiğimiz hafta araştırmacılara duyuruldu.

DALL·E 2’ye açık kaynaklı bir alternatif olarak konumlandırılan Stable Diffusion, milyarlarca insanın birkaç saniye içinde ücretsiz olarak sanat üretmesini sağlayacak.

Stable Diffusion yapay zeka modeli
Stable Diffusion yapay zeka modeli

Stable Diffusion nasıl çalışıyor?

Edindiğimiz bilgilere göre model, Google Imagen’da olduğu gibi, metinleri koşullandırmak için, CLIP ViT-L/14 metin kodlayıcı kullanıyor. En az 10 GB VRAM’li bir GPU, 860M UNet ve 123M metin kodlayıcı kullanan model, rakiplerine oranla nispeten daha hafif.

Model, çalışma sürecinde görseli difüzyon sürecine ayırıyor yani, parazit görsel ile başlayıp, görseli gitgide parazitlerden arındırarak yepyeni bir görsel oluşturuyor.

Ürünün üreticisi Stability AI, rakip modeller gibi ünlü isimleri görselleştirmeye karşı katı politikalar sunmuyor. Bazı önlemler alınmaması, kullanıcıların rahatsız edici görseller oluşturmasına da olanak tanıyabilir.

Halka açılmadan önce potansiyel zararları azaltmaya yönelik güvenlik önlemleri alınması daha iyi olabilir.

https://www.yzlm.com.tr/

 

 

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu