Itu perbedaan utama antara klasifikasi dan pohon regresi adalah itu dalam klasifikasi variabel dependen adalah kategoris dan tidak teratur sedangkan dalam regresi variabel dependen adalah nilai keseluruhan kontinu atau dipesan.
Klasifikasi dan regresi adalah teknik pembelajaran untuk membuat model prediksi dari data yang dikumpulkan. Kedua teknik secara grafis disajikan sebagai pohon klasifikasi dan regresi, atau lebih tepatnya diagram alur dengan pembagian data setelah setiap langkah, atau lebih tepatnya, "cabang" di pohon. Proses ini disebut partisi rekursif. Bidang seperti Penambangan menggunakan teknik pembelajaran klasifikasi dan regresi ini. Artikel ini berfokus pada pohon Klasifikasi dan pohon regresi.
1. Ikhtisar dan Perbedaan Utama
2. Apa itu Klasifikasi
3. Apa itu Regresi
4. Perbandingan Berdampingan - Klasifikasi vs Regresi dalam Bentuk Tabular
5. Ringkasan
Klasifikasi adalah teknik yang digunakan untuk sampai pada skema yang menunjukkan organisasi data dimulai dengan variabel prekursor. Variabel dependen adalah apa yang mengklasifikasikan data.
Gambar 01: Penambangan Data
Pohon klasifikasi dimulai dengan variabel independen, yang bercabang menjadi dua kelompok sebagaimana ditentukan oleh variabel dependen yang ada. Ini dimaksudkan untuk menjelaskan tanggapan dalam bentuk kategorisasi yang ditimbulkan oleh variabel dependen.
Regresi adalah metode prediksi yang didasarkan pada nilai output numerik yang diasumsikan atau diketahui. Nilai output ini adalah hasil dari serangkaian partisi rekursif, dengan setiap langkah memiliki satu nilai numerik dan kelompok variabel dependen lain yang bercabang ke pasangan lain seperti ini.
Pohon regresi dimulai dengan satu atau lebih variabel prekursor dan berakhir dengan satu variabel hasil akhir. Variabel dependen adalah variabel numerik kontinu atau diskrit.
Klasifikasi vs Regresi | |
Model pohon tempat variabel target dapat mengambil set nilai diskrit. | Model pohon tempat variabel target dapat mengambil nilai kontinu biasanya bilangan real. |
Variabel tak bebas | |
Untuk pohon klasifikasi, variabel dependen adalah kategorikal. | Untuk pohon regresi, variabel dependen adalah numerik. |
Nilai-nilai | |
Memiliki jumlah nilai unordered yang ditetapkan. | Memiliki nilai yang diskrit namun terurut atau nilai yang tidak diskrit. |
Tujuan Konstruksi | |
Tujuan membangun pohon regresi adalah agar sesuai dengan sistem regresi untuk setiap cabang penentu dengan cara nilai output yang diharapkan muncul. | Pohon klasifikasi bercabang sebagaimana ditentukan oleh variabel dependen yang berasal dari simpul sebelumnya. |
Pohon regresi dan klasifikasi adalah teknik yang sangat membantu untuk memetakan proses yang menunjukkan hasil yang dipelajari, baik dalam klasifikasi atau nilai numerik tunggal. Perbedaan antara pohon klasifikasi dan pohon regresi adalah variabel dependen mereka. Pohon klasifikasi memiliki variabel dependen yang kategorikal dan tidak berurutan. Pohon regresi memiliki variabel dependen yang merupakan nilai kontinu atau nilai keseluruhan terurut.
1. "Pembelajaran Decision Tree." Wikipedia, Wikimedia Foundation, 13 Mei 2018. Tersedia di sini
1. 'Data Mining'By Arbeck - Pekerjaan sendiri, (CC BY 3.0) melalui Commons Wikimedia