Bilgisayarlı görü sistemleri, insan beyninin nesneleri tanımak ve sınıflandırma yeteneklerini taklit etmek için yapay zekâ teknolojisini kullanır.
Yapay zekânın en heyecan verici ve hızlı gelişen alanlarından biri olan bilgisayarlı görü, makinelerin insan gözünün algıladığı dünyayı anlayabilmesini sağlamak amacıyla geliştirilmiş bir teknolojidir. Bilgisayarlı görü, görsel verileri işleyerek, bu veriler üzerinden anlam çıkarmayı ve kararlar almayı hedefler.
İnsanlar için oldukça kolay bir beceri olan görsel algılama, makineler için karmaşık bir süreçtir.
İnsanoğluna verilen görme sistemleri, bir resimdeki her bir yaprağın şeklini ve yarı saydamlığını yüzeyinde oynayan ince ışık ve gölgelendirme desenleri aracılığıyla anlayabilir ve her çiçeği arka planından kolayca ayırabilir. Ancak son yıllarda, YZ ve derin öğrenme teknolojilerindeki gelişmeler sayesinde, bilgisayarlı görü alanında kayda değer ilerlemeler görünmektedir.
BİLGİSAYARLI GÖRÜ NEDİR?
Bilgisayarlı görü, bilgisayarın görsel dünyayı anlamasını sağlayan bir alan olarak tanımlanabilir. Bu süreç, görüntülerin sayısal veriler olarak analiz edilmesini ihtiva eder. Gözlemler, sensörler veya kameralar aracılığıyla elde edilen görüntüler (örneğin; fotoğraflar, videolar) işlenir, yorumlanır ve bu bilgilerle makineler çeşitli görevler gerçekleştirir.
Bilgisayarlı görü, derin öğrenme, makine öğrenimi ve görüntü işleme tekniklerini birleştirerek, görüntüleri tanıma, sınıflandırma ve analiz etme yeteneği sağlar.
TEMEL ÇALIŞMA PRENSİPLERİ
Bilgisayarın gördüğü aslında resmin büyüklüğüne göre boyutları değişen bir matristen ibarettir. Matrisin her bir hücresine piksel denir. Piksel, dijital bir görüntünün satır ve sütün şeklindeki iki boyutlu matrisin her elemanını tanımlar. Renkli resim için kırmızı, yeşil ve mavi renkleri belirten 3 adet matris kullanılır.
Bilgisayarda görüntü işlenirken, özellikle renkle ilgili bir sonuç beklenmiyorsa hem zaman hem de depolama alanından tasarruf etmek için resimler gri tonlamalı forma dönüştürülür. Bu şekilde tek matris kullanılır. Bilgisayarlı görünün temel işleyişi, görüntülerin (matrislerin) matematiksel modellerle işlenmesidir. Bu modeller, makinelerin görsel verilerden anlam çıkarabilmesine imkan sağlar. İşlem aşamaları beklentiye göre farklılaşmakla beraber genellikle şu şekildedir:
GÖRÜNTÜ ELDE ETME VE ÖN İŞLEM
Kamera veya sensörler aracılığıyla elde edilen görüntüler, işlemlerin daha verimli olması için ön işlemden geçirilir. Bulanıklığın giderilmesi, kontrastın artırılması gibi hazırlık işlemleri yapılır. Yapılan her işlemin aslında matris’in ya tüm elemanları ya da seçili elemanları üzerinde yapılan matematiksel işlem olduğunu hatırlayalım. Bu nedenle yapay zeka sistemleri grafik işlemcileri yoğun olarak kullanır.
ÖZNİTELİK ÇIKARTMA:
Görüntülerden anlamlı bilgiler elde edilmesi amacıyla, kenarlar, köşeler, renkler gibi temel öznitelikler çıkarılır. Bir yüz tanıma yapılması bekleniyorsa, öncelikle kareleme yapılarak özellik aranacak olan belirlenir. Görüntüde alın, burun, göz, dudak vb. özellikler belirlenir. İki göz arasındaki mesafe değerlendirilir. Tahmin edileceği üzere bu işlemler için renkli bir görüntüye ihtiyaç yoktur. 3 matris yerine rahatlıkla tek Matris üzerinde çalışılarak sonuca ulaşılabilir.
MODELLEME VE SINIFLANDIRMA
Derin öğrenme modelleri, bu öznitelikler üzerinden analiz yaparak, nesneleri tanımlar. Sınıflandırmalar yapar ya da nesnelerin yerlerini belirler. Tanımlanan beklentiye göre yapılan işlemler çeşitlenir. İnsan veya başka bir canlı mı? Canlı ise, tasnif edilmesi beklenen nedir? Kedi mi, köpek mi veya başka bir canlı mı?
Örnek: Fotoğraf çekerken kameranın fotoğraftaki yüzleri tanıyabilmesi ve onlara odaklanabilmesi.
KARAR ALMA: Sonuçlar, görüntülerdeki nesnelerin etkileşimlerini anlamak ve ona göre karar almak amacıyla kullanılır. Mesela; iş yerinde ek yetki ile girilebilecek bir alana girişte yüz tanıma kullanılıyorsa, girmek isteyen kişinin izin verilenler arasında olduğundan emin olduktan sonra kapının açılması gibi.
UYGULAMA ALANLARI
Bilgisayarlı görü teknolojisinin başlıca uygulama alanları şunlardır:
1-YÜZ TANIMA: Yüz tanıma, bilgisayarlı görü teknolojisinin en bilinen ve yaygın kullanılan alanlardan biridir. Güvenlik sistemleri, sosyal medya platformları ve telefonlarda kullanılan yüz tanıma yazılımları, kullanıcıların kimliklerini doğrulamak için görsel verileri işler. Yüz tanıma, kişinin yüz özelliklerini analiz eder ve veri tabanındaki diğer yüzlerle karşılaştırarak bir kimlik doğrulama işlemi yapar. Bankaların dijital bankacılık uygulamalarında kimlik kartının yanında yüz tanımayı kullanması gibi.
2- OTONOM ARAÇLAR: Otonom araçlar, çevrelerini algılayarak kararlar alabilen araçlardır. Bu araçlar, bilgisayarlı görü teknolojisi sayesinde, yol üzerindeki engelleri, diğer araçları, yayaları ve trafik işaretlerini algılar. Bu sayede, sürücüsüz bir şekilde güvenli bir yolculuk yapılabilir. Bu alandaki en büyük zorluklardan biri, araçların karmaşık çevresel koşullarda doğru ve hızlı kararlar alabilmesidir. Yoldaki yayanın kim olduğu bilgisine dolayısıyla yüz tanımaya bu uygulamada ihtiyaç yoktur. Ancak trafik işaretlerini algılamak hayati öneme sahiptir.
3- OPTİK KARAKTER TANIMA: Çok eski bir uygulama olarak uzun zamandır kullanımda. Ancak bilgisayarda görü yöntemleri ile artık çok daha başarılı sonuçlar elde edilebiliyor.
Aynı şekilde otomatik plaka tanıma sistemlerinde de karakter tanıma öncesinde kullanılan yöntemlerle artık daha iyi tanıma yapılabiliyor.
4- TIBBİ GÖRÜNTÜ ANALİZİ: Tıpta, bilgisayarlı görü teknolojisi, hastalıkların teşhis edilmesinde önemli bir rol oynamaktadır. Özellikle MR, röntgen ve ultrasyon gibi görüntüleme yöntemlerinden elde edilen verilerin analizi, bilgisayarlar tarafından yapılabilir. Bu, doktorların hastalıkları daha hızlı ve doğru bir şekilde teşhis etmelerine yardımcı olur. Örneğin, kanserli hücrelerin veya kalp hastalıklarının tesbiti, YZ destekli görüntü işleme sistemleri ile daha hassas hale gelmiştir.
5- ENDÜSTRİYEL OTOMASYON: Fabrikalarda üretim süreçlerinde, ürünlerin kalite kontrolü için bilgisayarlı görü teknolojisi kullanılır. Görüntüler, hatalı ürünlerin tespit edilmesine, üretim hatalarının belirlenmesine yardımcı olur. Ayrıca, robotlar tarafından taşınan ürünlerin doğru şekilde yerleştirilmesi ve sınıflandırılması için de bu teknoloji kullanılır.
ETİK ZORLUKLAR VE GELECEK PERSPEKTİFLERİ
Bilgisayarlı görü teknolojisinin gelişimi ile birlikte etik zorluklar da gündeme gelmektedir. Bu teknoloji ile ilgili başlıca endişeler şunlardır:
GİZLİLİK VE GÜVENLİK: Yüz tanıma gibi uygulamalar, bireylerin izinsiz bir şekilde izlenmesine yol açabilir. Bu, kişisel özgürlüklerin ihlali olarak algılanabilir.
ÖN YARGI VE ADALET: Bilgisayarla görü teknolojisi, verilerdeki ön yargılardan etkilenebilir. Özellikle yüz tanıma yazılımları, farklı etnik grupların tanınmasında sorunlar oluşturulabilir.
Gelecekte, bilgisayarlı görü teknolojisinin daha da gelişmesi beklenmektedir. Derin öğrenme algoritmalarının ve yapay zekanın ilerlemesiyle, bu teknolojinin doğruluğu ve kapsamı artacaktır. Bununla birlikte, etik sorunların çözülmesi ve düzenleyici çerçevelerin oluşturulması büyük önem taşımaktadır.
SONUÇ: Bilgisayarlı görü, yapay zekanın gözleri olarak nitelendirilebilecek bir teknolojidir ve giderek daha fazla alanda kullanımı yaygınlaştırmaktadır. Yüz tanıma, otonom araçlar, tıbbi görüntüleme gibi uygulamaları, bu teknolojinin gücünü ve potansiyelini gözler önüne sermektedir. Ancak, bu teknolojinin etik sorunlar ve toplumsal etkileri göz önünde bulundurularak geliştirilmesi, gelecekteki başarıyı belirleyecektir.