Pohon keputusan adalah
gambaran skematik dari alternatif yang rersedia bagi pengambil keputusan dan
kemungkinan hasilnya. Istilah pohon keputusan diambil dari bentuk diagramnya
yang memiliki cabang dan ranting seperti halnya suatu pohon. Pohon Keputusan memiliki
fungsi yang sama dengan tabel keputusan, namun biasanya lebih sesuai untuk
ssituasi analisis yang memiliki keputusan berjenjang.
Pohon keputusan merupakan
salah satu metode yang digunakan pada data
mining. Metode pohon keputusan mengubah fakta yang sangat besar menjadi
pohon keputusan yang merepresentasikan
rule. Pohon keputusan
adalah salah satu
metode klasifikasi yang paling
populer karena mudah untuk diinterpretasikanoleh manusia. Konsep dari
pohon keputusan adalah
mengubah data menjadi model pohon keputusan(decision tree) dan aturan-aturan
(rule).
Data dalam
pohon keputusan biasanya
dinyatakan dalam bentuk
tabel dengan atribut dan record.
Atribut menyatakan suatu
parameter yang dibuat
sebagai kriteria dalam pembentukan tree. Misalkan,untuk menentukan bermain tenis atau
tidak, kriteria yang diperhatikan
adalah cuaca, angin
dan temperatur. Salah
satu atribut merupakan atribut
yang menyatakan data
solusi per-item data
yang disebut dengan target atribut. Atribut memiliki
nilai-nilai yang dinamakan dengan instance. Misalkan atribut cuaca mempunyai
instances berupa cerah, berawan,dan hujan.
Pohon keputusan
merupakan himpunan aturan
IF...THEN. Setiap path dalam tree
dihubungkan dengan sebuah aturan, dimana premis terdiri atas sekumpulan
node-node yang ditemui, dan
kesimpulan dari aturan terdiri atas
kelas yang terhubung
dengan leaf dari path.
Bagian awal dari pohon
keputusan ini adalah titik akar (root), sedangkan setiap cabang dari
pohon keputusan merupakan
pembagian berdasarkan hasil
ujidan titik akhir (leaf)
merupakan pembagian kelas yang dihasilkan. Pohon keputusan mempunyai tiga (3) tipe
simpul, yaitu:
- Simpul akar(root): tidak memiliki cabang yang masuk dan memiliki cabang lebih dari satu, terkadang tidak memiliki cabang sama sekali. Simpul ini biasanya berupa atribut yang paling memiliki pengaruh terbesar pada suatu kelas tertentu.
- Simpul internal(node): hanya memiliki satu cabang yang masukdan memiliki lebih dari satucabang yang keluar.
- Simpul daun(leaf): simpul akhir yanghanya memiliki satu cabang yang masukdan tidak memiliki cabang sama sekali sekaligusmenandai bahwa simpul tersebut merupakan label kelas.