Jump to content

Bilgisayarlı Görü Teknolojisi


hayal@_kny

Recommended Posts

HERMES, insan davranışlarını analiz etmek amacıyla oluşturulmuş yeni bilgisayarlı görü sistemidir.

Sistem, insan davranışlarını tanımlamak ve anlatılan hareketlerden bu davranışları tahmin etmek amacıyla doğal dili (insan dilini) kullanır.

UAB’nin (Universitat Autònoma de Barcelona- Autonomous University of Barcelona) CVC (Computer Vision Centre) birimi tarafından koordine edilen bir Avrupalı araştırmacılar topluluğu HERMES’i geliştiriyor. HERMES, video kameralar ve insan davranışlarını tanıyan ve tahmin eden, bunun yanı sıra bunları insan dilinde tanımlayabilen bir yazılımdan oluşan, bilişsel bir sistem.

17562_292728735881_47312660881_4071354_4

HERMES (Human Expressive Graphic Representation of Motion and their Evaluation in Sequences), davranışlarımızı analiz ederken 3 farklı odaksal adım kullanıyor. İncelediği kişiye X kişisi dersek X’in uzaktaki bir nesne olarak görülmesi, X’in vücudunun tamamının incelenmesi, böylece tüm vücut duruşlarının analizinin yapılması ve X’in yüzünün tüm detaylarıyla incelenmesi, böylece mimik hareketlerinin analizinin yapılması.

17562_292730375881_47312660881_4071355_8

Proje iki ana konuyu hedef alıyor: Bunlardan ilki, tanımlamak ya da analiz edilmiş hareket modellerine dayalı kavramsal tanımlamaları üretmek. Diğeri ise görselleştirmeyi kullanarak iletişimi sağlamak ya da yazılı tanımlamalara dayalı yapay hareket modelleri üretmek.

İlk olarak, insan dilinde yazı üretimi aşağıdaki faktörlere dayanarak HERMES ile uyumlu hale getirilecek:

*

Semantik tanımlamalar araştırmacılara kavramsal veri tabanında bulunan ayrıntıları kontrol olanağı sunacak.

*

Semantik tanımlamalar en doğal tanımlama şekliyle HERMES’in diğer uçtaki kullanıcısıyla iletişime izin verecek.

*

Semantik tanımlamalar kavramsal birtakım durumları ayırt edecek, böylelikle kısa mesajların ya da temel detayların iletilmesine olanak tanıyacak. Mesela; uçtaki kullanıcıya cevaplar kayıt yapan kameranın yanındaki bir mikrofondan ya da 3G teknolojisine sahip bir telefondan gönderilebilecek. (Görme engelli insanlar için düşünülmüş.)

HERMES izlediği hareketleri eş zamanlı olarak yazı diline dökecek. Yani görsel bilginin otomatik olarak dönüşümü söz konusu.

Sisteme bilgi alımı, bilgisayarlı görü ve sisteme hareket modellerini öğrenme ve tanıma yetisi kazandıran yapay zeka algoritmaları tarafından sağlanıyor.

17562_292732205881_47312660881_4071361_8

HERMES, bilgisayarlı görü dünyasına 2 önemli inovasyon sağlıyor. Birincisi; önceki görü araçlarına karşılık HERMES hareketleri fotoğraflardan değil direkt olarak videodan sağlıyor. Yani olay basit ve net bir şekilde gerçek zamanlı olarak bilgisayarda kare kare (demek istediğim her hareketin ayrı ayrı karelenmesi) görülüyor. Sistem, konuşma ve bilgiyi farklı dillerde tanımlama amaçlı bir de avatar kullanıyor.

İkinci yenilik ise sistemin, beklenmedik davranışları – tabii ki tanıdığı davranışlar çerçevesinde – analiz edip belirleme ve ekstra olarak uyarı sinyalleri verme imkanı sağlaması. Bu, sosyal arenada nasıl bir yarar sağlayabilir diye düşünürsek birkaç örnek verelim: HERMES, trafikte araç sollayan bir aracın görüntüsünü yakalayıp polis merkezine uyarı gönderebilir veya yalnız yaşayan yaşlı insanların acil durumlarını hastanelere uyarı olarak gönderebilir. Bu ve bunun gibi birçok örnek aklınıza gelmiştir eminim ki. HERMES sayesinde birçok sosyal sorun çözüme kavuşabilir gibi gözüküyor, özellikle insanı sinir hastası yapan “trafik” problemleri.

HERMES üzerinde çalışan araştırmacılar tarafından gerçekleştirilen ve HERMES’in tamamlanan parçaları olan 7 alt projeye bir göz atalım:

1- Kamera sistemi: Statik kameralar, tam görüntü ve yüksek çözünürlük elde etme amaçlı kullanılırken aktif kameralar – pan-tilt (yatay ve dikey olarak panoramik görüntüleme) yakınlaştırıcı sensörler- otomatik izleme ve tekil olarak yakın çekim yapma amaçlı kullanılıyor. HERMES’teki bu sistemi gerçekleştirmek için optimizasyon teknikleri görüntülerdeki bilgilere uygulandı.

2- Resimdeki nesne ve bireylerin hareket analizleri: Sistemde; alınan bilgi, aktif kameraların, hareketin nerede gerçekleştiğini bulup o yöne yönelmesi için rehber olarak kullanılır. Bu özellikler farklı izleme tekniklerinin kullanılmasıyla sağlandı.

3-Vücudun farklı bölümlerinden bilgi almak amacıyla insan vücudunun hareketlerinin analizi ve bu analizi gerçekleştirip davranışları tahmin etmek ya da tanımlamak: Bu konuda model ve siluet tanımaya dayalı teknikler kullanıldı.

4-Bireyin duygusal durumunun anlaşılması için mimiklerinin analizi: Bu alt projede, izleme ve yüzün 2D – 3D modellerini hizalama işlemleri için yeni teknikler oluşturuldu.

5-Görüntü karelerinde neler olduğunu tanımlama ve tarif etme amaçlı, yazılımın ve doğal dilin entegrasyonu, kavramsal bir temsil düzeni kullanılarak kaydedildi.

6-Sistemin tüm entegrasyonu (yazılım&donanımın gerçek zamanlı ve gerçek nesneler ya da bireylerle çalışabilmesi) : Sistem, işleyişini test etmek amacıyla gerçek hayat “durumlarında” kullanılmak için dizayn edildi.

7-Gerçek&sanal dünyaların etkileşimine ve davranışları insan dilinde tarif etmeye dayalı sanal basamakların üretimi için yüksek gerçeklik teknikleri kullanıldı.

HERMES’in avantajları açık: Özellikle milli istihbarat alanlarında ve kaza ya da suçların önlenmesinde kullanımı birçok sorunun üstesinden gelebilir. Bununla birlikte, araştırmacılar bu sistemin kullanımının pazarlama ve psikoloji gibi sektörlerde de büyük fayda sağlayacağını düşünüyor.

Alıntı : http://www.bilisimdergi.com/Bilgisayarli-Goru-Teknolojisi-11-1.html

Kaynaklar:

* http://www.hermes-project.eu/view.php?keyword=approach

* http://www.eurekalert.org/pub_releases/2010-01/uadb-hnc011310.php

Link to comment
Share on other sites

Archived

This topic is now archived and is closed to further replies.

  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...