Paylaş
Para ve güce ulaşmak dışında her şeyi anlamsız bulduğunu söyleyen Fransız kumandan Napolyon Bonapart şimdiki teknoloji çağında yaşasa “Veri, veri, veri” derdi diye düşünürüm paraya ek olarak. Veri, çağımızın en kıymetli varlıklarından biri... İnsan, dünya ve çevre hakkındaki bilgilerin kategorize edilmiş, tanımlanmış, süzülebilir ve işlenebilir haline veri diyoruz. En basit tanımıyla veri; gerçek olguları, istatistikleri ve bilgi öğelerini içerir. Hemen her konuda referans almak ve analiz yapabilmek için veriye ihtiyaç duyarız. Günlük hayatta, basit konularda bile karar almamız gerektiğinde ne kadar veriye/bilgiye sahipsek işimiz o kadar kolaylaşır.
İnsan bilinci, kavramlarüstü kavram yaratabildiği için elindeki veriler kısıtlı olsa bile yaşam deneyimiyle gelen büyük bilgisi ve sezgileri aracılığıyla doğru karar verebilme yetisine sahiptir. Sezgisellik ve kavram üretebilme gibi iki önemli kabiliyetten mahrum olan ‘yapay zekâysa’ karar verebilmek için tek bir kaynağı kullanır: ‘Veri, veri, veri’. Herhangi bir amaçla yapay zekâ kullanıyorsanız, ona dünyanızı öğretebilmek için yüklü miktarda veriye ihtiyaç duyarsınız.
Ürünlerini geliştirmek ve hizmetlerini iyileştirebilmek için sürekli bir şeyleri referans alıp analizler gerçekleştirmesi gereken hizmet sektörleri, sağlık, teknoloji, perakende ve iletişim şirketleriyle start-up’lar verinin en büyük müşterileri arasında. Ancak gerçek veriye ulaşmak öyle kolay değil... Google, Meta gibi şirketlerin gerçek verileri çok çeşitli yollarla, büyük efor sarf ederek topladıklarını biliyoruz. Etik yönleri ayrı bir tartışma konusu. Kişisel verileri koruma kanununun varlığı bile verinin kıymetini anlatmaya yetiyor...
“Bilgi mahremiyeti zor konu. Burada imdada gerçeğe eşdeğer veriler tasarlayan sentetik vericiler yetişiyor.”
Para kadar değerli ve geçerli bir varlığın elbette sahtesinin de olacağını düşünebiliriz. İşin ilginci, verinin sahtesi bile çok para ediyor! Öyle ki kendi sektörü var: ‘Sentetik veri’. Son yıllarda öne çıkan sentetik veri kavramı, gerçek dünya ve kişiler nezdinde karşılığı olmayan, yapay olarak üretilmiş veri anlamına geliyor. Konuyu gündeme taşıyansa dünyanın önde gelen teknolojik araştırma ve danışmanlık kurumu Gartner oldu. Gartner’ın yapay zekâ biriminin başındaki Erick Brethenoux, 2024 itibariyle dünyadaki tüm yapay zekâ verilerinin yüzde 60’ının sentetik olacağını öngörüyor.
Sentetik verinin başlıca müşterileri arasında yer alan bankalar, sigorta şirketleri, telekomünikasyon ve sağlık şirketlerinin ortak noktaları, müşteri bilgilerinin yüksek derecede mahremiyeti. Yapay zekâ ve makine öğrenimi sistemlerini kişisel verilerle eğiten kurumsal yapılarda bilgi mahremiyeti, yazılım geliştiricilerin ayağına dolanabilen bir konu. İşte bu noktada sentetik veri üreten bilişim şirketleri imdada yetişiyor. Gerçeğe eşdeğer veriler tasarlayan Mostly AI, Datagen, Synthesis AI gibi şirketler, sadece bu yıl şirket başına 50 milyon dolara ulaşan yatırımlar aldı. Öyle ki Gartner ‘Gerçek verinizi unutun, yapay zekânın geleceği sentetik veride’ başlığıyla bir makale bile yayımladı.
Yapay zekânın geleceği denince radarları açılan teknoloji yatırımcıları para musluklarını açmaya başlamış. LDV Capital ortağı Evan Nisselson ise sentetik verinin teknoloji endüstrisini ‘demokratize edeceğini’ öne süren etkili bir isim. Start-up şirketleri sentetik veri sayesinde, önceden sadece teknoloji devlerinin erişebildiği büyük veriye gerek duymadan makine öğrenimi sistemleri geliştirebilecekler. Böylece ulaşım, nakliye ve depolama gibi gelecekte tamamen otomatize olacak sistemlerin gelişimi hızlanacak. Küçük şirketlere büyük sistemler geliştirebilme yolu açılacak. Büyük kurumlarsa gerçek verinin hassas, tutarsız veya erişilmez olduğu durumlara karşı esneklik kazanarak yapay zekâ atılımlarını rahatça gerçekleştirebilecekler.
Siber karakterler, avatarlar...
Kişisel ve sayısal bilgiler, sentetik verilerin ‘tanımlı’ kanadını oluşturuyor. Bir de son tüketici için daha anlamlı olan ‘tanımsız’ kanadı var. Gerçeğin benzeri mahiyetindeki siber karakterler, avatarlar, metaverse objeleri, hatta deepfake’ler bile sentetik veri kapsamına giriyor. Görüntü ve ses içerikli sentetik veriler dijital pazarlama, reklam, elektronik eğitim, sanal hizmetler gibi pek çok sahada yer buluyor. Görsel ve işitsel sentetik veri üreten Synthesia, sektörün başarılı örneklerden biri. Synthesia.io sitesinde, beyaz yakalı gerçek insan avatarlarını etnik kökenine göre seçip sadece metin girişi yaparak canlı sunum videoları hazırlayabiliyorsunuz. Küresel şirketler, Synthesia’yı farklı ülkelerdeki müşteri ve çalışanlarına kendi dillerinde eğitim veya hizmet vermek için tercih ediyor.
KISA KISA
Kendrick Lamar’dan ‘deepfake’ klip
Gerçek insan yüzü ve sesini manipüle ederek insanlara söylemedikleri şeyleri söyletebilen deepfake teknolojisi sonunda müzik kliplerinde yer buldu. ABD’nin ünlü hip-hop sanatçılarından Kendrick Lamar son klibinde deepfake marifetiyle Will Smith, Kanye West, Kobe Bryant, O.J. Simpson gibi siyah kültürünün ikonik isimlerine dönüştü. ‘Bilinçli rap’ türünün öncülerinden Kendrick Lamar’ın ‘The Heart Part 5’ isimli şarkısının klibinde verdiği mesaja paralel olarak kusursuz biçimde yüzünün değiştiği ve yeni yüzüyle şarkıyı söylemeye devam ettiği görülüyor.
Paylaş