Güncelleme Tarihi:
Sofistike dil teknolojileri üzerinde çalışan Xerox’un Fransa Grenoble’daki Avrupa AR-GE Merkezi’nde geliştirilen ve “TrueMatch” adı verilen yeni Xerox teknolojisi, gelişmiş arama özellikleri ile kişilerekağıt bir dokümanın elektronik ortamdaki orijinal kopyasını, önceki ve sonraki versiyonlarını kolayca bulma imkanı veriyor. Dolayısıyla TrueMatch, kişilere basılı bir dokümanın, en son haline sahip olup olmadıklarını da öğrenme fırsatı veriyor.
Kağıt dokümanlarla dijital dokümanlar arasında bir köprü oluşturmaya çalışan TrueMatch teknolojisi laboratuvar ortamında test işlemleri tamamlandıktan sonra Xerox’un bu ay piyasaya sürdüğü FreeFlow SMARTsend Pro 2.0 adlı tarama yazılımının içine dahil edildi. Bu yazılım Xerox’un doküman yönetim yazılımı DocuShare ve Microsoft ortamında güvenli bir şekilde akıllı doküman tarama, doküman araştırma ve eşleme imkanı sunuyor.
Tarayıcı cihazları veya çok fonksiyonlu ofis makinaları üzerinden çalışan TrueMatch programını kullanabilmek için kağıt dokümanı makinanın tarayıcı ünitesine koymak ve TrueMatch fonksiyonunu seçip düğmeye basmak yeterli oluyor, kısa bir süre içinde sistem bire bir eşleme yaparak orijinal elektronik dosyayı buluyor, bilgisayar ekranı üzerinde o dosyanın hangi dizin ve dosya altında yer aldığını yazılı olarak gösteriyor.
“TrueMatch” nasıl çalışıyor ?
TrueMatch, ilk önce kağıt dokümanı tarama ve Optik Karakter Tanımlama (OCR) işleminden geçirerek içeriğini analiz ediyor. TrueMatch, öncelikle metin içinde geçen anahtar unsurları, kelimeleri, başlıkları, çoklu kelime tanımlamalarını analiz ediyor. En çok kullanılan bu kelime tanımlamalarından parametreler oluşturuyor. Bu parametreler, metni tanımlamak için kullanılacak sorgu tanımlamasının (query) oluşmasını sağlıyor. Daha sonra TrueMatch bilgisayardaki dokümanları oluşturulan bu sorgulama kriterleri çerçevesinde inceliyor ve aranan dokümanı buluyor.
True Match araştırmasını “mükemmel eşleme” yada “revizyon” tanımlamaları ile sonuçlandırıyor. Mükemmel eşleme diye tanımladığı sonuç kağıt dokümanın bilgisayar ortamındaki bire bir kopyasının bulunduğu anlamına geliyor. Revizyon tanımlaması ile bulunan sonuçlar ise eldeki kağıt dokümanın basılmadan önceki veya sonraki revizyona uğramış versiyonlarını temsil ediyor.
Çok sayfalı kağıt dokümanların bulunmasında, bu dokümanın içeriğini temsil etmeye yetecek sayıda sayfanın TrueMatch işleminden geçirilmesi gerekiyor. Örneğin orijinali 10 sayfa olan bir dokümanı arıyorsunuz ama elinizde sadece o dokümanın bir kaç sayfası bulunuyor. Bu durumda elinizde olan eksik doküman, bütün içeriği temsil edecek kadar bir veri taşıyorsa TrueMatch zorluk yaşamadan orijinal dosyayı buluyor. Teknolojiyi geliştiren bilim adamları, ne kadar çok veri ve içerikle sistem desteklenirse o kadar kolay ve hızlı sonuç almanın mümkün olduğunu belirtiyorlar.
Eskimiş, bozuk ve zayıf görüntülü kağıtlarla yapılan TrueMatch işlemlerinde de başarılı sonuç alabilmek için sistem üzerinde bir tolerans düzeyi bulunuyor. Bozuk görüntülü kağıt dokümanlara OCR’lama yapıldığında çok fazla hatalı karakter tanımlama riski ortaya çıkmasına rağmen, TrueMatch teknolojisinin akıllı algılama ve parametre oluşturma tekniği ile belli bir tolerans düzeyine kadar doğru eşleme ve orijinal dosyayı bulma işlemi yapılabiliyor.
Geliştirilen bu teknolojinin bilgi ve doküman aramanın dışında özellikle iş hayatında geniş kullanım alanları bulacağı söyleniyor. Örneğin sürekli fiyat güncellemesinin olduğu mağaza ve marketlerde en güncel fiyat listeleri, eski fiyat listesinin TrueMatch işleminden geçirilmesi ile elde edilebiliyor olacak. Böylece geniş bayi ve şube ağı ile çalışan firmaların e-posta veya kargo yolu ile yenilenen fiyat listelerini tek tek herkese göndermelerine gerek olmayacak.