Oluşturulma Tarihi: Ekim 23, 2020 07:18
Nvidia, çoğunuzun da bildiği gibi ekran kartları üreten bir teknoloji şirketi. Ama yakın zamanda farklı bir ürün tanıttı: Maxine. Yeni ürününü tanıttığında video konferans platformlarına bir yenisi daha mı ekleniyor diye düşünmedim değil. Ama tanıtımı izleyince, doğrudan kullanıcıya hitap etmeyen ama video konferans platformlarının arka planda kullanacağı bir yapay zekâ sistemi olduğunu gördüm. Bugün, Maxine’nin biz kullanıcılara ne gibi yenilikler sunduğuna bakmak, sizinle paylaşmak istedim.
Maxine nedir?
Maxine, video konferans hizmetlerinin geliştiricileri için tasarlanmış bulut tabanlı, yapay zekâ ile güçlendirilmiş bir yazılım geliştirme kitidir. Bu yeni sistemle, video konferans görüşmelerinde video için kullanılan bant genişliğinin kullanımının 1/10’e ineceği söyleniyor. Bu elbette maliyetlerin de aşağı çekilmesi anlamına geliyor. Özellikle, internet kotalarının sınırlı olduğu durumlar düşünüldüğünde son kullanıcılara oldukça önemli bir tasarruf imkânı sunuyor. Bu özellik, tasarruf sağlamasının yanında düşük bant genişliklerinde yüksek çözünürlük sunması açısından da önemli bir gelişme. Bu sistemin ardındaki mekanizma aslında basit bir şekilde işliyor. Diğer video konferans sistemlerinde olduğu gibi ilk başta bir referans görüntü karşı tarafa gönderiliyor (bunu sadece bir fotoğraf göndermek gibi düşünebilirsiniz). Bundan sonra, görüntü piksellerinin gönderilmesindense (asıl bant genişliğinin çoğunu kullanan kısım) yüz ifadesinin temel hareketleri algılanıp karşı tarafa gönderildikten sonra ilk başta gönderilen referans görüntüsünün canlandırılması yapılıyor. Aslında, çekilen fotoğrafınız ile yeni bir animasyon oluşturuluyor diyebilir. Aşağıdaki şekilde ise sistemin temel çalışma prensibi basit bir şekilde anlatılmakta.
Bant genişliği problemine karşı üretilen bir başka çözüm ise düşük kalitede gönderilen videoların yapay zekâ ile çözünürlüklerinin artırılması. Örneğin, internet hızınız iyi olmadığı için video konferans görüşmenizde sizin gönderebildiğiniz maksimum çözünürlük 360p olsun. Bu görüntü karşı tarafa ulaştırılırken bulut tabanlı çalışan yapay zekâ 720p’ye yükselterek daha kaliteli bir görüntü sunma imkânı tanıyor. Çok hızlı bir internetiniz olmasa da eskisine göre çok daha kaliteli görüntü sunmuş olacaksınız.
Video konferans görüşmelerinde karşılaştığımız bir başka problem ise göz teması kuramama. Hem diğer katılımcılar hem de sunular ekranda yer aldığı için kameradan ziyade ekrana baktığınızda gözünüz ve yönünüz çoğunlukla kamera ile eşleşmiyor. Yani, karşımızdaki kişilere değil de uzaklara, yukarıya, aşağıya bakıyor gibi oluyoruz. Dahili kameraların kullanılmadığı durumlarda bu ayrım daha da dikkat çekici hale geliyor. Bu sorun için sunulan özellik ise yüzünüz yapay zekâ algoritması ile döndürülerek karşınızdaki kişilere bakıyormuş gibi gösterilmesi. Aşağıdaki görüntüde, soldaki orijinal bakış açısı
yapay zeka algoritması kullanılarak sağdaki hale anlık olarak dönüştürülüyor.
Sunulan bir başka özellik ise arka plan sesinin kısılması. Bu yeni bir özellik olmamakla birlikte oldukça iyileştirilmiş bir örneğini bulacaksınız. Bu özelliği test etmek için yazının sonunda bütün özelliklerin tanıtıldığı video bağlantısına tıklamanız yeterli olacaktır.
Bu ürün henüz piyasaya çıkmadı. Bu ürün ve daha iyilerinin bir an önce çıkması eğitimde bizim işimizi bir nebze de olsa kolaylaştıracaktır. İletişimde yaşanan uzakta olma sorununa video ve ses kalitesindeki düşüklük, hattan düşme gibi sorunlar da eklenince bizler için çözülmesi çok daha zor hale geliyordu. Önümüzdeki teknik sorunların azalması ve ortadan kalkması bize temel problemlere daha fazla eğilebilme imkânı sunacaktır.
Doç. Dr. Serkan Özel
Boğaziçi Üniversitesi
@serkanozeltx