Paylaş

20 Mayıs 2025

Toonsutra ile Çizgi Romanlara Hayat Verin: Gemini API, Gemini 2.5 Pro Önizleme ve Lyria 2 ile Desteklenen Etkileyici Bir Okuma Deneyimi

Sharad Devarajan | Vishal Anand

Toonsutra'nın kurucuları

Avneet Singh

Ürün Yöneticisi, Google İş Ortağı İnovasyonu

Cartwheel vitrin hero'su

Hindistan'ın web çizgi romanları ve grafik romanlar için en büyük platformu olan Toonsutra, dünya çapındaki kitleleri web çizgi romanlarının geniş anlatı evreniyle buluşturmayı ve özellikle Hint dillerinde dünya standartlarında hikayeler sunmayı amaçlıyor. Toonsutra, izleyici etkileşimini artırmak için şu soruyu sordu: Geleneksel çizgi roman okuma deneyimini, sesin, müziğin ve hikayenin okuyucuların hayal ettiği dilde doğal bir şekilde aktığı etkileyici bir sinematik yolculuğa nasıl dönüştürebiliriz?

İnteraktif Hikaye Anlatımında Yeni Bir Sayfa

Bu soru, Toonsutra'nın temel odak noktası haline geldi. Topluluklarından gelen geri bildirimlerde, daha derin bir etkileşim ve daha geniş bir erişim istendiği belirtildi. Yapay zekanın muazzam potansiyelini fark eden ve Google'ın AI Futures Fund tarafından desteklenen Toonsutra, Google'daki Labs ve Partner Innovation ekipleriyle iş ortaklığı yaptı. İkisi birlikte, Gemini 2.5 Pro Önizleme'nin yer aldığı Gemini API ve Lyria 2'yi (Google DeepMind'ın müzik üretme modeli) kullanarak dünya genelindeki hayranlar için web çizgi romanı deneyimini yeniden tasarlıyor.

Google I/O'da tanıtılan iş ortaklığı, hikayelerin yalnızca sayfada yer almadığı, yanıt verip etkileşim kurduğu ve statik görüntüleri dinamik sesli anlatılara dönüştürdüğü yapay zeka destekli bir çizgi roman deneyimi sunuyor:

  • Uyarlanabilir yapay zeka anlatımı: Gemini 2.5 Pro Önizleme, okuma hızına uygun yapay zeka anlatımı oluşturarak karakterleri farklı seslerle canlandırır. Bu, özellikle dilin kültürel inceliklerinin büyük farklılık gösterdiği Hindistan'daki okuyucular için önemlidir. Gemini 2.5 Pro'nun uyarlanabilir ve çok dilli özellikleri, Toonsutra'nın tescilli karakter bağlam motoruyla birleşerek tutarlı ve ayrıntılı hikaye anlatımı sağlar.
  • Dinamik ses manzaraları: Gemini 2.5 Pro Önizleme'nin çok formatlı anlayışı, Lyria ve Gemini'ın yerleşik ses üretme özellikleri sayesinde platform, özel müzikler, seslendirmeler ve hareket sesleri (ör. kılıç sesi, kalabalık bir pazarın ortam sesi) dahil olmak üzere etkileyici ses manzaraları oluşturur.
  • Gelişmiş etkileşim: Gemini 2.5 Pro Önizleme destekli öğeler, okuyucuların benzersiz diyaloglar başlatmasına, gizli ayrıntıları keşfetmesine veya anlatı akışlarını ince bir şekilde etkilemesine olanak tanıyarak çeşitli okuma deneyimleri sunar.

Teknik Ayrıntılar

Bu proje, dijital çizgi romanlar için senkronize edilmiş mekansal meta verilerle birlikte sürükleyici sesleri otomatik olarak oluşturmaya yönelik yeni bir yaklaşım sunar. Gemini 2.5 Pro Preview üzerine kurulu çoklu aracı mimarisi, Comic Context Extractor, Narrator, Music Composer, Music Director ve Sound Effects Agents gibi uzmanlaşmış aracıları içerir.

İş akışı, Comic Context Extractor Agent'ın kapsamlı bir özet, tür ve karakter özellikleri için birden fazla çizgi roman bölümünü analiz etmesiyle başlar. Ardından paneller, tanımlanmış sınırlar dahilinde çıkarılır. Anlatıcı Aracısı, transkriptlerdeki diyalogları bu panellerle eşleştirir. Karakter bağlamıyla zenginleştirilen bu paneller, Gemini Native Audio ile seslendirilir. Aynı anda, film müziklerinden ilham alan Music Composer Agent, bölümlerdeki temaları ve duyguları ayırt etmek için Gemini 2.5 Pro Preview'u kullanır ve bunları Lyria'nın arka plan müzikleri oluşturması için müzik istemlerine dönüştürür. Müzik Yönetmeni Aracısı bu müziği belirli panellerle eşlerken Ses Efektleri Aracısı, panelleri bir veritabanından alınan ilgili ses efekti etiketleriyle eşler.

Bu iş akışı, Toonsutra'nın ön ucuna teslim edilen ve panel koordinatları, seslendirmeler, ses efektleri ve senkronize müzik hakkında ayrıntılı bilgi veren bir JSON dosyasıyla sonuçlanır.

Gemini'ın, Hintçe başta olmak üzere Hint dillerinde bu sinematik sesi yerel olarak üretebilmesi, Toonsutra'nın erişilebilirlik misyonunu destekleyen önemli bir başarıdır.

"Bu, Gemini'ın çok formatlı ve çok dilli özelliklerinden yararlanmak için çok eğlenceli ve heyecan verici bir kullanım alanı oldu. Google'ın güçlü büyük dil modellerini kullanarak resimleri, karakterleri, çizimleri ve temaları anlamsal olarak anlamak, giriş medyasını temel unsurlarına indirgemek için harika bir mekanizma oldu. Lyria'nın güçlü müzik oluşturma ve Gemini'ın özellikle Hindistan dillerindeki doğal konuşma özellikleri, Toonsutra ile iş ortaklığı yaparak sunduğumuz nihai deneyimi daha da iyi hale getirdi."

- Avneet (PM, Google Partner Innovation)

Google I/O'dan Genel Kullanıma

Google I/O'daki tanıtım, yapay zekanın dijital içeriği temelden nasıl iyileştirebileceğini gösteren inanılmaz bir dönüm noktası oldu. Toonsutra için bu sadece ilk bölüm.

Ekibimizin sıkça söylediği gibi: "Toonsutra'daki vizyonumuz, çizgi romanları her yerde herkes için daha ilgi çekici ve erişilebilir kılmaktır. Google ile yapılan bu iş ortaklığı, bu vizyona doğru atılmış büyük bir adımdır. Bu etkileyici ve yapay zeka destekli okuma deneyimlerini oluşturma özelliği, topluluğumuzun geri bildirimlerine doğrudan yanıt veriyor ve yeniliklerimizi hızlandırıyor. I/O'daki tepkilerden çok memnunuz ve bu özelliği Toonsutra uygulamasına entegre etmeyi, hatta diğer içerik üreticileri desteklemek için potansiyel bir API'yi keşfetmeyi sabırsızlıkla bekliyoruz."

Toonsutra, topluluk geri bildirimlerini yakından takip ederek bu özellikleri ana uygulamasına aşamalı olarak entegre etmeye odaklanıyor. Bu iş ortakları, yalnızca platformlarını zenginleştirmekle kalmayıp yapay zeka destekli içerikler için yeni bir plan oluşturmaya yardımcı olduklarına inanıyor.

Derlemeye hazır mısınız? Gemini API belgelerini inceleyin ve Google AI Studio'yu bugün kullanmaya başlayın.

Toonsutra, Google'ın Yapay Zeka Gelecek Fonu'nun bir katılımcısıdır. Bu fon, yapay zekada bir sonraki yeniliği geliştiren iddialı startup'lara yatırım yapar ve onlarla işbirliği yapar.