Burak IŞIKLI

Computer scientist living in Istanbul, Turkey. Data scientist at Turkcell, Traveller, Rower, Sailor

Twitter Github Linkedin Mail

Karar Ağaçları(Decision Trees) ile Sınıflandırma-1

Verinin içerdiği ortak özelliklere göre ayrıştırılması işlemi sınıflandırma olarak adlandırılır. En çok bilinen veri madenciliği tekniklerinden birisidir. Resim, örüntü tanıma, hastalık tanıları, dolandırıcılık tespiti, kalite kontrol çalışmaları ve pazarlama konuları sınıflandırma algoritmaları tekniklerinin bolca kullanıldığı alanlardır. “Bayesyen sınıflandırma algoritması”, “karar ağaçlarına dayalı algoritmalar”, “yapay sinir ağları” temelli algoritmalar ve “k en yakın komşu algoritması” gibi birçok sınıflandırma algoritmaları vardır. Karar ağaçları da bunlardan biridir. Karar ağaçları oluşturmak için temel olarak entropiye dayalı algoritmalar, sınıflandırma ve regresyon ağaçları, bellek tabanlı sınıflandırma modelleri biçiminde birçok farklı yöntem geliştirilmiştir.

Sınıflandırma bir öğrenme algoritmasına dayanır. Örnek veriler kullanılarak eğitme işi yapılır. Burada amaç belirgin 2 veya daha fazla sınıfa ayırmaktır. Fatura ödemesini 3 gün sonra yapanlar veya ödemesini 3 gün içinde yapanlar bu sınıflandırmaya basit bir örnek olarak verilebilir. Basit kredi değerlendirmesi için yapılacak işlemler şemadaki gibidir:

Classification

Decision 
Tree (Karar Ağaçları)

Karar ağaçları akış şemalarına benzeyen yapılardır. Her bir nitelik bir düğüm tarafın­dan temsil edilir. Dallar ve yapraklar ağaç yapısının elemanlarıdır. En son yapı “yaprak”, en üst yapı “kök” ve bunların arasında kalan yapılar ise “dal” olarak isimlendirilir.

Karar ağaçlarında en önemli sorunlardan birisi herhangi bir ekökten itibaren bölümlemenin veya bir başka deyişle dallanmanın hangi kıstasa göre yapılacağıdır. Söz konusu algoritmaları:
Entropiye dayalı algoritmalar (ID3, C4.5 gibi)
Sınıflandırma ve regresyon ağaçlan (CART)
Bellek tabanlı sınıflandırma algoritmaları

Karar ağaçları oluşturulurken kullanılan algoritmanın ne olduğu önemlidir. Kullanılan algoritmaya göre ağacın şekli değişebilir. Değişik ağaç yapıları da farklı sınıflandırma sonuçları ve farklı karar kuralları verecektir.

Slide 4

Karar ağaçları akış şemalarına benzeyen yapılardır. Her bir nitelik bir düğüm tarafın­dan temsil edilir. Dallar ve yapraklar ağaç yapısının elemanlarıdır. En son yapı **”yaprak”,** en üst yapı **”kök”** ve bunların arasında kalan yapılar ise **”dal”** olarak isimlendirilir

Comments !