Pembelajaran terawasi dan pembelajaran tanpa pengawasan adalah dua konsep inti pembelajaran mesin. Supervised Learning adalah tugas Pembelajaran Mesin untuk mempelajari fungsi yang memetakan input ke output berdasarkan contoh pasangan input-output. Pembelajaran tanpa pengawasan adalah tugas Machine Learning untuk menyimpulkan suatu fungsi untuk menggambarkan struktur tersembunyi dari data yang tidak diberi label. Itu perbedaan utama antara pembelajaran mesin diawasi dan tanpa pengawasan adalah itu pembelajaran yang diawasi menggunakan data berlabel sementara pembelajaran yang tidak diawasi menggunakan data yang tidak berlabel.
Machine Learning adalah bidang dalam Ilmu Komputer yang memberikan kemampuan bagi sistem komputer untuk belajar dari data tanpa diprogram secara eksplisit. Hal ini memungkinkan untuk menganalisis data dan memprediksi pola di dalamnya. Ada banyak aplikasi pembelajaran mesin. Beberapa di antaranya adalah pengenalan wajah, pengenalan gerakan tubuh dan pengenalan suara. Ada berbagai algoritma yang terkait dengan pembelajaran mesin. Beberapa di antaranya adalah regresi, klasifikasi dan pengelompokan. Bahasa pemrograman yang paling umum untuk mengembangkan aplikasi berbasis pembelajaran mesin adalah R dan Python. Bahasa lain seperti Java, C ++ dan Matlab juga dapat digunakan.
1. Ikhtisar dan Perbedaan Utama
2. Apa itu Pembelajaran yang Dibimbing
3. Apa itu Pembelajaran Tanpa Pengawasan
4. Kesamaan Antara Pembelajaran Mesin yang Diawasi dan yang Tidak Diawasi
5. Perbandingan Berdampingan - Pembelajaran Mesin Supervised vs Unsupervised dalam Bentuk Tabular
6. Ringkasan
Dalam sistem berbasis pembelajaran mesin, model bekerja sesuai dengan algoritma. Dalam pembelajaran terawasi, model diawasi. Pertama, diperlukan untuk melatih model. Dengan pengetahuan yang diperoleh, dapat memprediksi jawaban untuk contoh di masa depan. Model dilatih menggunakan dataset berlabel. Ketika data sampel keluar diberikan ke sistem, itu dapat memprediksi hasilnya. Berikut ini adalah ekstrak kecil dari dataset IRIS populer.
Menurut tabel di atas, panjang Sepal, lebar Sepal, panjang Patel, lebar Patel dan Spesies disebut atribut. Kolom dikenal sebagai fitur. Satu baris memiliki data untuk semua atribut. Karena itu, satu baris disebut pengamatan. Data dapat berupa angka atau kategori. Model diberi pengamatan dengan nama spesies yang sesuai sebagai input. Ketika pengamatan baru diberikan, model harus memprediksi jenis spesies yang dimilikinya.
Dalam pembelajaran terawasi, ada algoritma untuk klasifikasi dan regresi. Klasifikasi adalah proses klasifikasi data berlabel. Model menciptakan batas-batas yang memisahkan kategori data. Ketika data baru disediakan untuk model, itu dapat dikategorikan berdasarkan di mana titik itu ada. K-Nearest Neighbors (KNN) adalah model klasifikasi. Bergantung pada nilai k, kategorinya diputuskan. Misalnya, ketika k adalah 5, jika titik data tertentu mendekati delapan titik data dalam kategori A dan enam titik data dalam kategori B, maka titik data akan diklasifikasikan sebagai A.
Regresi adalah proses memprediksi tren data sebelumnya untuk memprediksi hasil data baru. Dalam regresi, output dapat terdiri dari satu atau lebih variabel kontinu. Prediksi dilakukan menggunakan garis yang mencakup sebagian besar titik data. Model regresi paling sederhana adalah regresi linier. Cepat dan tidak memerlukan parameter penyetelan seperti di KNN. Jika data menunjukkan tren parabola, maka model regresi linier tidak cocok.
Itulah beberapa contoh algoritma pembelajaran terawasi. Secara umum, hasil yang dihasilkan dari metode pembelajaran yang diawasi lebih akurat dan dapat diandalkan karena input data dikenal dan diberi label. Karena itu, mesin harus menganalisis hanya pola yang tersembunyi.
Dalam pembelajaran tanpa pengawasan, model tidak diawasi. Model bekerja sendiri, untuk memprediksi hasil. Menggunakan algoritma pembelajaran mesin untuk sampai pada kesimpulan pada data yang tidak berlabel. Secara umum, algoritma pembelajaran yang tidak diawasi lebih sulit daripada algoritma pembelajaran yang diawasi karena hanya ada sedikit informasi. Clustering adalah jenis pembelajaran tanpa pengawasan. Ini dapat digunakan untuk mengelompokkan data yang tidak diketahui menggunakan algoritma. K-mean dan clustering berbasis kepadatan adalah dua algoritma clustering.
algoritma k-mean, menempatkan k centroid secara acak untuk setiap kluster. Kemudian setiap titik data ditugaskan ke pusat massa terdekat. Jarak Euclidean digunakan untuk menghitung jarak dari titik data ke pusat massa. Poin data diklasifikasikan ke dalam kelompok. Posisi untuk k centroid dihitung lagi. Posisi centroid baru ditentukan oleh rata-rata semua titik dalam grup. Sekali lagi setiap titik data ditugaskan ke pusat massa terdekat. Proses ini berulang hingga centroid tidak lagi berubah. k-mean adalah algoritma pengelompokan cepat, tetapi tidak ada inisialisasi tertentu dari titik pengelompokan. Juga, ada variasi tinggi model pengelompokan berdasarkan inisialisasi titik-titik klaster.
Algoritma pengelompokan lain adalah Clustering berbasis kepadatan. Ini juga dikenal sebagai Aplikasi Clustering Spasial Berbasis Kepadatan dengan kebisingan. Ia bekerja dengan mendefinisikan sebuah cluster sebagai set maksimum titik yang terhubung dengan kepadatan. Mereka adalah dua parameter yang digunakan untuk pengelompokan berbasis kepadatan. Mereka adalah Ɛ (epsilon) dan poin minimum. Ɛ adalah radius maksimum dari lingkungan tersebut. Poin minimum adalah jumlah minimum poin di lingkungan Ɛ untuk mendefinisikan sebuah cluster. Itulah beberapa contoh pengelompokan yang jatuh ke dalam pembelajaran tanpa pengawasan.
Secara umum, hasil yang dihasilkan dari algoritma pembelajaran tanpa pengawasan tidak banyak akurat dan dapat diandalkan karena mesin harus mendefinisikan dan memberi label data input sebelum menentukan pola dan fungsi tersembunyi..
Pembelajaran Mesin Supervised vs Unsupervised | |
Supervised Learning adalah tugas Pembelajaran Mesin untuk mempelajari fungsi yang memetakan input ke output berdasarkan contoh pasangan input-output. | Pembelajaran tanpa pengawasan adalah tugas Machine Learning untuk menyimpulkan suatu fungsi untuk menggambarkan struktur tersembunyi dari data yang tidak berlabel. |
Fungsi Utama | |
Dalam pembelajaran terawasi, model memprediksi hasil berdasarkan data input berlabel. | Dalam pembelajaran tanpa pengawasan, model memprediksi hasil tanpa label data dengan mengidentifikasi pola itu sendiri. |
Akurasi Hasil | |
Hasil yang dihasilkan dari metode pembelajaran yang diawasi lebih akurat dan dapat diandalkan. | Hasil yang dihasilkan dari metode pembelajaran tanpa pengawasan tidak banyak akurat dan dapat diandalkan. |
Algoritma Utama | |
Ada algoritma untuk regresi dan klasifikasi dalam pembelajaran yang diawasi. | Ada algoritma untuk pengelompokan dalam pembelajaran tanpa pengawasan. |
Supervised Learning dan Unsupervised Learning adalah dua jenis Machine Learning. Supervised Learning adalah tugas Pembelajaran Mesin untuk mempelajari fungsi yang memetakan input ke output berdasarkan contoh pasangan input-output. Pembelajaran tanpa pengawasan adalah tugas Machine Learning untuk menyimpulkan suatu fungsi untuk menggambarkan struktur tersembunyi dari data yang tidak berlabel. Perbedaan antara pembelajaran mesin terawasi dan tidak terawasi adalah bahwa pembelajaran terawasi menggunakan data berlabel sementara kecenderungan tanpa pengawasan menggunakan data tanpa label.
1.TheBigDataUniversity. Pembelajaran Mesin - Pembelajaran Superupervisi Tanpa pengawasan VS, Kelas Kognitif, 13 Maret 2017. Tersedia di sini
2. “Pembelajaran tanpa pengawasan.” Wikipedia, Wikimedia Foundation, 20 Maret 2018. Tersedia di sini
3. "Pembelajaran yang Dibimbing." Wikipedia, Wikimedia Foundation, 15 Maret 2018. Tersedia di sini
1.'2729781 'oleh GDJ (Public Domain) melalui pixabay