Yapay Zeka ile Çözünürlük Yükseltmek

yolbulduran

Onursal Üye
16 Nis 2011
355
1,130
@cizgicicocuk bazı çizgi romanlardaki düşük çözünürlük nedeniyle, konuşma balonu içindeki metinlerin (özellikle İngilizce değilse), yapay zeka tarafından OCR (optik karakter tanama) yöntemiyle tanınıp çevrilmesinde güçlük yaşandığından bahsetti.

Konu şurada, https://www.cizgidiyari.com/forum/k...ri-yapabilecek-arkadaslara-ihtiyac-var.184635

Yapay zekanın gerek oyunlarda, gerekse fotoğraflarda, çözünürlüğü arttırdığını, resim ve videoları netleştirdiğini biliyorum. Bu konuda ne yapabilirm diye araştırdım.
ChatGPT ve Google Gemini'ye bu resimleri netleştirmesi için verdim, ama yapamadılar.

Konuyu araştırdım, ve şu yöntemle iyi bir netice aldım. Ancak resim dosyalarının kapladığı boyut çık fazla oldu, bu konuda belki sizlerden öneriler gelebilir.

Kullandığım program şurada:


bunu önce MacOS işletim sistemli MacMini-M4'de denemeye çalıştım, ancak python ile kurulum yaptığımda çok yavaştı. hazır derlenmiş programı da, MAcOS güvenli bulmayıp çalıştıramadı.

işletim sistemlerine göre hazır kurulu dosyalar şurada:


Ben de, NVidia RTX 3070 kartımın kurulu olduğu windows 11 makinamı açtım, hazır kurulu dosyayı indirip kullandım.

windows kurulum dosyası şurada:



portable klasörüme zipli dosyayı açtım

çizgi romanın jpeg resimlerini, luckyluke klasörüne koydum, sonuçları results klasöründe aldım. PowerShell / Komut Satırı / Konsol'da şu komutu çalıştırdım, birkaç dakikada sonucu aldım

./realesrgan-ncnn-vulkan.exe -i luckyluke -o results -n realesrgan-x4plus -s 4
veya
./realesrgan-ncnn-vulkan.exe -i luckyluke -o results -n realesrgan-x4plus -s 4 -f jpg
 
Son düzenleme:

yolbulduran

Onursal Üye
16 Nis 2011
355
1,130
düşük çözünürlüklü çizgi roman şurada

(dosya boyutu 15 MB, her bir resim 200 - 400 kb, resim çözünürlüğü 1024x1326 pixel, 96 dpi)

benim çevirdiğim yüksek çözünürlüklü çizgi roman şurada

(600 MB, her bir resim boyutu 10-23 MB, çözünürlük 4096x5304 pixel, 96 dpi)

dosya boyutu çok büyük, bu haliyle gemini veya chatgpt'ye al çevir diye vermek kolay olmaz. buna da bir çzöüm bulunur sanırım
 
Son düzenleme:

yolbulduran

Onursal Üye
16 Nis 2011
355
1,130
kalite farkını göstermek için, iki resmi windows photo-viewer ile açtım, birlikte ekran görüntüs aldım.
yapaz Zeka ile enhance edilmiş görünüt farkı böyle

hem yazılar, hem karakterler çok düzeldi. yapay zeka'nın balonları çevirmesine faydası olur mu bilmiyorum. fontun kendisi çok ince, büklümlü.

 
Son düzenleme:

yolbulduran

Onursal Üye
16 Nis 2011
355
1,130
not jpg formatıyla kayda zorlayınca resim dosya boyutu 10-13 MB'a, arşiv boyutu 600 MB'a iniyor gene de yüksek. bunun için kullanılacak komut:

./realesrgan-ncnn-vulkan.exe -i luckyluke -o results -n realesrgan-x4plus -s 4 -f jpg
 
Son düzenleme:

Logic

Çeviri & Balonlama
3 Kas 2021
485
7,317
Evren
Bence çok başarılı bir iyileştirme yapmış. Ben buradan veya netten edindiğim kitapları önce faststone image resize ile boyut eşitlemesi (dpi ile oynamadan) filtre kullanarak (genellikle ışık:3 kontrast:6) png dosyası haline getiriyorum ve tüm balonlama, temizleme, kadraj vs işlemlerini bu png dosyalarının üzerinde yapıyorum. Sonra yin aynı programla sayfa numaralarını veriyorum, tüm işlemler bitince %90 kalite ile jpg dosyalarına çeviriyorum. Program çoklu dosya ile çalışmaya izin verdiği ve windows arayüzüyle çalıştığı için çok pratik oluyor.

Orjinal jpg dosyalarını ise yarıyarıya boyutlarını düşürüp online ocr sitesine öyle yüklüyorum. Dediğiniz gibi çözünürlülüğü düşük yada flu taranmış resimlerde ocr hataları olabiliyor, örnek verdiğiniz program ilgimi çekti, ilk fırsatta deneyeceğim. Verdiğiniz bilgiler için teşekkür ederim.
 
Üst