» Çok Katmanlı Yapay Sinir Ağları-1

Yayınlanma Zamanı: 2012-12-25 12:51:00

Çok Katmanlı Yapay Sinir Ağları-1 |  görsel 1


 

Giriş

Yapay sinir ağları, "biyolojik sinir sisteminde olduğu gibi, gerçek yaşam nesneleriyle etkileşmeyi amaçlayan basit elemanların ve onların hiyerarşik düzenlemelerinin paralel, içice bağlantılı ağları" olarak tanımlanabilir (Kohonen 1987). Şekil 1'de görüldüğü gibi, genel sinir ağı modeli, işlem elemanları ile karakterize edilir. Bir işlem elemanı, beş elemandan oluşur. Bunlar;

a)   Bilgiyi işlem elemanına getiren girdiler: Bilgi, diğer işlem elemanları veya ağ dışı kaynaklardan sağlanır. Bazen, işlem elemanları, kendi kendine bilgi verebilir.

b)  Belirli bir girdinin işlem elemanı üzerindeki etkisini tanımlayan ağırlıklar: Bu ağırlıklar, doğru çıktıyı üretmek üzere, ağın optimum ağırlık değerlerini bulmak için öğrenme esnasında değişirler. Başka bir deyişle, bu ağırlıklar öğrenme esnasında optimize edilirler.

c)  İşlem elemanının ağırlıklı girdilerini birleştiren birleştirme fonksiyonu: Şekil 2'de verildiği gibi, birçok birleştirme fonksiyonu vardır. Bunlardan en yaygın olanı, ağırlıklı girdileri toplayan toplama fonksiyonudur.

d)  Birleştirme fonksiyonunun sonucunu değerlendiren transfer veya aktivasyon fonksiyonu:Birleştirme fonksiyonunda olduğu gibi, birçok transfer fonksiyonu vardır. Yine Şekil 2'de gösterildiği gibi, en yaygın olarak kullanılanlar, sigmoid fonksiyonu, lineer fonksiyon ve step fonksiyonudur.

e)  Transfer fonksiyonunun sonuçlarını alan ve bu sonuçları bağlantılı olduğu işlem elemanlarına veya ağ dışı kaynaklara gönderen çıktılardır.

İşlem elemanlarının bir grubu, katman olarak adlandırılan bir yapıyı oluşturur. Genellikle, bir katmandaki her bir işlem elemanı, aynı birleştirme ve transfer fonksiyonu ile aynı öğrenme kuralına sahiptir. Tipik bir sinir ağı, Şekil 3'de gösterildiği gibi, birbirine bağlanan üç katmandan oluşur. Bunlar, dışarıdan bilgiyi kabul eden bir girdi katmanı, bilgiyi işleyen ve özellikler çıkaran bir ara katman ve sorgulanan problem üzerinde ağın kararı hakkında ağ dışı kaynakları bilgilendiren bir çıktı katmanıdır. Bilgi, bu katmanlar arasındaki bağlantılarda yayılır. Ağ, öğrenme kuralı vasıtasıyla kendi zekasını geliştirir ve bu zeka, ağın ağırlık değerleri olarak bağlantılarda saklanır.

 

Şekil 1. Bir İşlem Elemanının Genel Yapısı.

 

1. Genel Özellikler

Yapay sinir ağı modellerini klasik sistemlerden ayıran çeşitli özellikler vardır. Bu özellikler, ağın algoritmik olmayan, paralel ve yayılı bilgi işleme yeteneklerine dayanır. Bu yetenekler ise, yapay sinir ağlarının herhangi bir zorlukla karşılaşmaksızın karmaşık ve lineer olmayan hesaplamaları yürütmesini ve hızlı bir şekilde yanıt vermesini mümkün kılar. Sözü edilen özelliklerden bazıları şunlardır:

Örneklerden öğrenme: Yapay sinir ağları, sadece öğrenmek zorunda olduğu girdi/çıktı ilişkilerinin örneklerini gerektirir. Bu örnekleri kullanarak genellemeler yaparlar.

Örnekleri tanıma ve sınıflandırma: Yapay sinir ağları, örnekleri girdiler olarak alır ve örneklerden oluşturulan girdi/çıktı eşleşmeleri ile ilgili bilgiyi depoladığı yerdeki yayılı belleğini kullanarak karşılık gelen çıktıyı üretir.

Örnekleri yeniden oluşturma: Ağın eksik bir örneği yeniden oluşturma yeteneğini ifade eder. Ağ, eksik bir örneği alır ve eksik örnekteki kayıp olan bilgiyi belleğinde bulunan ve tam örneklerle oluşturulan bilgilerden yararlanarak eksik örnekteki kayıp bilgiye karşılık gelen tam örnekteki bilgiyi bulabilir.

Kendi kendine adapte olabilme: Bazı yapay sinir ağları, kendi kendine organize olabilme ve öğrenme yeteneğine sahiptir. Ortamda bazı değişiklikler olduğunda, bu tür sinir ağları bu yeni duruma kendilerini kolaylıkla adapte edebilirler.

Hata toleransı: Bazı işlem elemanlarının bazı nedenlerle ağdan çıkarılması veya yokedilmesi, yapay sinir ağlarının başarısız olmasına neden olmayacaktır. Bilgi, bütün ağ boyunca yayılı olduğundan bazı bilgilerin kayıp oluşu veya yok edilişi, ağın performansını fazla etkilemeyecektir. Bu durum, çok kötü sonuçlar doğurmayacak şekilde yeteneklerin azalımına yol açmasına rağmen sistemin toplam performansının tamamiyle başarısız olmasına neden olmayacaktır. Bu özellik, hesaplama ekipmanındaki ufak bir eksikliğin faciaya yol açacağı uzay araştırmaları, enerji üretimi, askeri durumlar vs. gibi kritik ortamlarda çok yararlı olacaktır.

Bulanık Girdilere Direnç: Bu özellik de önemlidir. Bulanık veya eksik bilgiler ağa sunulduğu zaman yayılı bellek girdi için en uygun veya bağdaşır olan çıktıyı seçer. El yazısı karakterleri tanıma, bu özelliğe güzel bir örnektir. Sinir ağı, eksik girdideki önemli özellikleri saptayabildiği için el yazısı karakterleri tanıyabilir.

Bu özellikler, yapay sinir ağlarının araştırmacılar tarafından kullanımını cazip hale getirmektedir. Özellikle, polinomsal zamanda çözüm bulunamayan problemlere yakın-optimal çözüm bulma çabalarına öğrenme yeteneği yüzünden büyük katkısı olabileceği düşünülmektedir.

Birleştirme İşlevleri Aktarma İşlevleri

Ençok:

Netj = ençok(XiWij)

Sigmoid İşlevi:

F(X)=1/(1+e-x)

Enaz:

Netj = enaz(XiWij)

Doğrusal İşlev:

F(X)=X

Toplama:

Netj = TOPLAMi(XiWij)

Hiperbolik Tanjant İşlevi:

F(X)=(ex-e-x)/(ex+e-x)

Artan (kümülatif) Toplam:

Netyeni = NETeski + TOPLAMi(XiWij)

Adım İşlevi (step function):

            1 eğer X >= e ik değeri
F(X) = 
            0 eğer X < e ik değeri

Şekil 2. Birleştirme ve Transfer Fonksiyonları.

 

2. Öğrenme

Sinir ağlarının en önemli özelliği, öğrenme yeteneğidir. Bir sinir ağında öğrenmenin anlamı, ağın belirli bir probleme ait doğru çıktıları üretmesini sağlayacak optimum ağırlık değerlerinin bulunmasıdır. Bilgi, ağ boyunca bağlantılarda ağırlıklar şeklinde dağıtıldığı için tek bir bağlantı herhangi bir anlamlı bilgiyi ifade etmez. Daha doğrusu, anlamlı bir bilgi oluşturmak için işlem elemanları olan bir grup bağlantıyı tasarlamak gerekmektedir. Problemin çözümü için ağın, bağlantılarına ait doğru ağırlık değerlerine sahip olması gerekmektedir. Bu öğrenme veya eğitme olarak adlandırılan bir işlem vasıtasıyla gerçekleştirilir. Öğrenme, ağırlık değerlerinin nasıl değiştirilmesi gerektiğini ifade eden bir öğrenme kuralına dayanır. Geliştirilen birçok öğrenme kuralı vardır (Wasserman 1989). Bir öğrenme kuralının temel ilkesi, benimsenen öğrenme stratejisi ile tanımlanır. Literatürde, üç tip öğrenme stratejisinden söz edilir:

Denetimli Öğrenme: Burada, ağı eğitmek için bir öğretici gerekir. Öğretici, basitçe, çıktı katmanında ağın ne üretmesi gerektiğini söyler. Bir girdi/ çıktı örneği ağa verilir. Ağ, girdiyi süzgeçten geçirir, çıktıyı üretir ve üretilen çıktıyı doğru çıktı ile karşılaştırır. Bağlantılardaki ağırlıklar, daha iyi çıktıyı üretmek için yeniden ayarlanır ve bu işlem, kabul edilebilir bir hata seviyesine erişinceye dek devam eder.

Destekli Öğrenme: Destekli öğrenme de bir öğretici gerektirir. Ancak, çıktının ne olması gerektiği ağa söylenmez. Bunun yerine, üretilen çıktının doğru veya yanlış olduğu ağa söylenir.

Denetimsiz Öğrenme: Denetimsiz öğrenme, bir öğreticiye gerek duymaz. Bu stratejide ağ, girdi/çıktı eşleştirmesini düzenlemek için kendi ölçütlerini geliştirir. Bu nedenle, denetimsiz öğrenme stratejisini kullanan ağlar, kendi kendine organize olan ağlar olarak adlandırılır.

Kaynak: Yrd. Doç. Dr. M. Fatih Taşgetiren                                                                                 Sakarya Üniversitesi, Endüstri Mühendisliği Bölümü


Duyuru
Sitemizde güncelleme çalışmaları devam etmektedir.
Görüş ve önerilerinizi bizimle paylaşabilirsiniz !