Yapay Zeka - Model Oluşturma 1
–Bu yazı yapay zeka konusunun üçüncü yazısıdır–
Model derken, çok zor bir şey değil bu, gözümüz korkmasın. Ayrıca, konuyu hiç bilmeyen arkadaşlarımı (ve açıkcası kendimi!) düşünerek detaylı yazdım:) Dolayısıyla, konuyu bilenler okursa, yazının bayıltıcı etkisine maruz kalabilirler.
Şimdi, önce ortada bir sorun var, ben de bu sorunu çözmek için bir model oluşturacağım. Öncesinde gözlem yaptım, veri topladım, ya da birilerinden veri aldım. Sonra yapay zekâya bana yardımcı olması için bir şeyler öğreteceğim. Yapacağımız iş kabaca bu.
Makine öğrenmesi dedik ya (bakınız), supervised (yönlendirmeli) öğrenme regresyonla ilgilidir demiştik hani, şimdi o konuya bir açıklık getirelim.
Regresyon; çok meraklı insanın merhemi, ilişki çözücü, arabulucu, çöpçatıcıdır. Mesela ki, “benim sınavda aldığım notlar, babamın bana verdiği harçlık artınca artıyor olabilir mi?” sorusunu soran zeki gencin dermanı regresyondadır. Veya “Cebimdeki param arttıkça daha çok kız tavlıyor olabilir miyim?” sorusunun da cevabı regersyondadır. Siz veri toplarsınız, x-y grafiği çizer excel sizin için, sonra da o verileri en iyi anlatan fonksiyon çizgisini çizer sağolsun. Bu işlemin sonucunda bir regresyon katsayısı çıkar, bir fonksiyon denklemi çıkar bir de, sana cevabı verirler. Ancak; regresyonu yapabilmek için onun dilinden konuşmak gerekiyor, bu soruları böyle düşüncesizce sorarsan olmaz.
Regresyonla iletişim kurmak için hipotez kurmak gerekir! x’e: cebindeki para, y’ye de tavladığın kız sayısı dersen; (biliyorum x ve y ile bir sorununuz olabilir, her yerde onlar var ama onları sevmemizin vakti geldi artık) o zaman hipotezin (sıfır hipotezi) : “x ile y arasında ilişki yoktur” olur.
Bunu neden böyle yazdık? Neden “x ile y arasında ilişki vardır” demedik? Daha çok feminist, hümanist duygularla, kadınları doğrudan suçlamamış olmak için böyle yazmış olabilir miyiz? “Paraya gelen kadın yoktur” diye ciddi bir savunma içine mi girdik?
Gırgır bir yana, Ho (haş sıfır diye seslenmedikçe bakmaz kendileri) gerçekten de “etkilemez”, “ilişki yoktur” şeklinde yazılıyor, beta hatası yapmamak için. Beta hatası dediğimiz de işte bu; ilişki var dersen, sonra da ilişki çıkmazsa beta hatası oluyor, regresyon da bu hataya çok bozuluyor, kısacası hipotezi böyle yazacaksın arkadaş!
Kişisel görüşüm, bir hatanın diğerinden daha kıymetli veya değersiz olmayacağı yönünde, ama bu işin bir kuralı var, ben de bayılırım kurallara, bir kuralla daha karşılaşsam da neşemi bulsam diyorum :) işte oldu.
Bu arada, x ‘in göbek adı: bağımsız değişken oldu. y’nin göbek adı ise bağımlı değişken.
Çünkü y, her zaman x’in etkisi altında yaşamaya mecburdur, bir kere x çok daha nezihtir, ingiliz kanı türk kalbi vardır onda. y ise çok eski ve herkesin kullanıp attığı bir harftir. x’in y’yi etkilediğini düşünüyoruz, y: etkilenen taraf olduğu için, x’e bağımlı şekilde bir hayat sürüyor. Hayat mı bu be, ha y? Biraz kendin ol!
Hem, belki y aslında gizli bir liderdi, x’i önüne katıp sürükleyecekti, ne malum? Bırakmadınz ki!
Olayları olduğu gibi kabullenelim şimdilik: x: bağımsız değişken, y: bağımlı değişken olarak kalsın.
Bir de elimde veriler var; hiç üşenmedim, biraz da takıntılı bir manyağım; gün içinde harcadığım para ve tavladığım kız sayısının kaydını tuttum, hem de 40 gün! Demek 40 gün örnek aldım, buna da örneklem (sample) diyelim.
Veri (data), Bağımlı(dependent), bağımsız(independent) değişkenler (variable) ve hipotez(hypothesis) konusunu anlattıkan sonra nemiz kaldı? regresyon (regression) yapacağız.
İşte bu nerede başladığı belli olmayan grafik üzerindeki kırmızı noktalar benim o üşenmeden yazdığım gözlemlerim, x cebimdeki para, y ekseni de tavladığım kız sayısı. Baktım böyle güzel bir gidiş var, sanki sonsuz param olsa sonsuz sayıda kız tavlayacakmışım gibi, doğrusal bir artış var orada, çok sevindim.
Ama şimdi burada korelasyon katsayısına da bir göz kırpalım, o da -1 ile 1 arasında oluyor, bizimki de işte 0,8 çıksın, iyi yani şahane. Hem korelasyon geniş bir insandır; x mi y yi etkilemiş, yoksa y mi x i ? umurunda değildir. İlişki varsa var, yoksa yok, net! bu tavrından ötürü severim kendisini.
Ama regresyon öyle miydi ya? illa ki bağımlı, bağımsız değişken ister o, huysuz, napsın?
Ve karşınızda “basit regresyon denklemi”:
y= bo + b1 x + e
y=ax+b denkleminin bir cinsi..
Bu denklemin aslında b harfi gibi gözüken ama çoğunlukla “beta” olan katsayılar (parametre), yukarıdaki grafikte çizili mavi çizginin başlangıç noktası ve eğimine göre belirlenir. Biz uğraşmayalım, excel bu tür işleri seve seve yapıyor.
İşte böyle.. bağımlı - bağımsız değişkeni, korelasyon katsayısını, regresyon deklemini anladık az çok, bu yazı burada bitsin, bir sonrakinde işin programlama kısmına bakalım. Ama şu kısmı açıklayayım, burada supervised öğrenmeden bahsettik ya, gördüğünüz gibi paramdaki değişikliğin nelere sebep olduğuyla ilgili elimde veriler var ve bu verileri bilgisayar programına gireceğim. Yani örneklem aldım, gerçekleşen sonuçlar belli, yapay zeka da bana bu modele uygun şekilde, ileride gerçekleşebilecekleri öngörecek.
Bu arada aynı örneği, kızların erkek tavlaması için de verebilirdik: o zaman da etek uzunluğu ve tavlanan erkek sayısı arasında bir ilişki kurabilirdik mesela ama bu sefer ters orantılı olurdu tabi: etek uzunluğu az iken, tavlanan erkek sayısı artardı. O zaman da regresyon denkleminin eğimi, korelasyon katsayısı negatif bir değer olurdu.
Evla
0 Yorum:
Yorum Gönder
Kaydol: Kayıt Yorumları [Atom]
<< Ana Sayfa