Otomatik kelime veya cümle çevirisi yapan programlar son yıllarda hayatımıza iyiden iyiye girmeye başladı. Peki bu programlar yüzlerce dilde yazılmış karmaşık cümleleri nasıl oluyor da usta bir çevirmenden yüzbinlerce kat daha hızlı bir şekilde başka bir dile çevirebiliyor? Bu yazıda cümle çeviri hizmetlerinin ardında yatan teknolojiyi kısaca anlatmaya ve bu teknolojinin sınırlarını ortaya koymaya çalışacağız.

Bugün "Google Translate", "Bing Translator", "Yandex Çeviri" gibi isimler altında arama motorlarıyla birlikte duymaya alıştığımız "makine çevirisi", yüzlerce biliminsanının 1950'lerden bu yana üzerinde kafa patlattığı, çok büyük insan emeği ve para harcanmış (ve hala da harcanmakta olan) bir alandır. "Otomatik çeviri" veya "cümle çevirisi" gibi isimlerle de anılan "makine çevirisi", kısaca, bir dildeki bir metin veya konuşmanın hiçbir insan müdahalesi olmaksızın çok kısa bir süre içinde bir başka dile çevrilmesi anlamına gelir. Makine çevirisi aslında yapay zekanın, ve dolayısıyla bilgisayar bilimi ve matematiğin bir alt dalıdır.

Bilgisayarlara farklı dillerin gramerini öğretmeye yönelik "kurala dayalı" (rule-based) yaklaşımların büyük ölçüde başarısız olması sonucunda, otomatik çeviri son yıllarda tamamen istatistiğe dayalı bir teknoloji haline gelmiştir. Otomatik çeviri yapan bir bilgisayar programı, çevirdiği dillerin kelime yapısı ve grameri hakkında hiçbir şey bilmez. Programın veritabanında, birbirinin çevirisi olan çok büyük miktarda metin bulunur. Bu metinler robot programlar kullanılarak internetten ve herkese açık metin arşivlerinden toplanır. Program bu metinleri analiz ederek birtakım tekrar eden kelime dizileri bulmaya çalışır.

Bu yöntemin çeşitli sakıncaları vardır:

(1) Programın veritabanında sizin o anda çevirmeye çalıştığınız cümleye benzer hiçbir cümle yoksa, hiçbir çeviri yapılamaz. Yüzlerce kaynağı tarayarak "sigara içmeyin" cümlesinin İngilizceye "do not smoke" şeklinde çevrildiğini tespit eden program, bu cümleyi rahatlıkla çevirir. Oysa aynı veritabanında buna çok benzeyen "puro içmeyin" cümlesinin hiçbir örneği olmadığı için, program eşleştirme yapmakta başarısız olur ve "the cigar" gibi anlamsız bir çeviri önerebilir.

(2) Programın veritabanı, insanlar tarafından yapılmış çevirilerin internetten toplanması yoluyla oluşturulmuştur. Bu nedenle, eğer toplanan çeviriler kalitesiz ve yanlışsa, ortaya çıkan makine çevirisi de kalitesiz ve yanlış olacaktır. Örneğin "vergi iadeleri" ifadesi internette pek çok sitede "tax returns" şeklinde tamamen yanlış bir şekilde çevrilmiş olabilir ("tax return" ifadesi "vergi iadesi" anlamına değil, "vergi beyannamesi" anlamına gelir!). Otomatik çeviri programının tek yapabildiği şey, hafızasındaki çevirilere bakarak kelime ve cümle parçacıklarını birbiriyle eşleştirmekten ibaret olduğu için, program size Türkiye'de son derece yaygın ama yanlış bir çeviri olan "tax returns" ifadesini önerebilir.

(3) Çeviri programının "hammaddesi" büyük ölçüde internetten toplanmış çeviri metinlerden oluştuğu için, program internette sık rastlanmayan çok yeni veya çok eski ifadelerle karşılaştığında tamamen başarısız olur. Örneğin 17. yüzyılda yaşamış Türk seyyah Evliya Çelebi'nin kendine verdiği lakap olan "seyyah-ı alem" (dünyayı gezen kişi) ifadesinin İngilizce karşılığıyla birlikte internette defalarca yayinlanmış olması çok düşük bir ihtimaldir. Bu ifadeyle daha önce hiç karşılaşmayan çeviri programı, size "bildiği" kısımları birleştirerek" "pilgrim-orgy" gibi gülünç bir çeviri önerebilir! Benzer bir şekilde, nispeten eski ve ünlü bir film olan "Kuzuların Sessizliği"nin İngilizcesinin "Silence of the Lambs" olduğunu gayet başarılı bir şekilde bilen çeviri programı, yeni vizyona giren bir Türk filmiyle karşılaştığında tamamen iflas edebilir. Çeviri programının düzgün çalışması için, birilerinin bu yeni filmin Türkçe ve İngilizce isimlerini yanyana koyarak internette yayınlaması şarttır.

(4) Dünyadaki tüm diller için geçerli olan bu genel sorunlara ek olarak, Türkçe, otomatik çeviri açısından büyük zorluklar içeren bir dildir. Bunun temel sebebi, Türkçe köklerin sonuna takılan eklerin milyonlarca farklı kombinasyonu olmasıdır. İngilizce bir cümledeki kelimeleri Almanca, İtalyanca, Fransızca gibi benzer yapıya sahip dillerdeki kelimelerle eşleştirirken pek zorlanmayan otomatik çeviri programı, Türkçe kelimelerin içindeki son derece karmaşık ekleri İngilizce çevirideki kelimelerle eşleştirmek konusunda ise bir o kadar başarısızdır. Ek sayısı arttıkça durum daha da vahim hale gelir. Örneğin "evde yedik" cümlesini "I ate at home" şeklinde gayet güzel çeviren program, "evdekilerle yedik" cümlesiyle karşılaştığında `domesticated" gibi tamamen anlamsız bir çeviri önerebilir.

Yine Türkçe kelimelerin son derece karmaşık bir iç yapıya sahip olması nedeniyle, bir otomatik çeviri programı "şirket sözleşmeyi imzalayamamaktan korktu" gibi nispeten basit bir cümleyi, "the company is afraid to sign the contract" şeklinde çevirmek gibi çok ağır hatalar yapabilir. Burada bilgisayarın bu kadar büyük bir hata yapmasının sebebi, "imzalayamamaktan" kelimesinin içine gömülmüş olan eklerle başa çıkamaması, ve arşivinde bulduğu en "yakın" cümlenin çevirisini önermesidir.

Bu ciddi sorunlarına rağmen, otomatik çeviri programları hayatımızın ayrılmaz bir parçası haline gelmiştir ve bazı durumlarda son derece faydalı olabilir. Bize göre en doğru yöntem, otomatik çeviriyi sadece bir metnin neden bahsettiği hakkında çok genel bir fikir edinmek amacıyla kullanmak, ve ardında yatan teknolojinin bilincinde olarak bu hizmeti dikkatli bir şekilde kullanmaktır. Makineler bir gün insanlar kadar iyi çeviri yapar hale gelebilir, ama o gün henüz gelmemiş gibi görünüyor.

Zargan Ekibi