Pembelajaran mendalam dan penguatan sangat terkait dengan kekuatan komputasi kecerdasan buatan (AI). Mereka adalah fungsi pembelajaran mesin otonom yang membuka jalan bagi komputer untuk menciptakan prinsip mereka sendiri dalam menghasilkan solusi. Kedua jenis pembelajaran ini juga dapat hidup berdampingan dalam beberapa program. Secara umum, pembelajaran yang mendalam menggunakan data saat ini sementara pembelajaran penguatan menggunakan metode trial and error dalam mencari tahu prediksi. Diskusi-diskusi berikut ini lebih jauh menggali perbedaan-perbedaan tersebut.
Pembelajaran mendalam juga disebut sebagai pembelajaran terstruktur yang mendalam atau pembelajaran hierarkis. Ini pertama kali diperkenalkan pada tahun 1986 oleh Rina Dechter, seorang profesor ilmu komputer. Itu menggunakan informasi saat ini dalam algoritma pengajaran untuk mencari pola terkait yang penting dalam peramalan data. Sistem seperti itu menggunakan berbagai tingkat jaringan saraf tiruan yang mirip dengan susunan saraf otak manusia. Dengan bantuan tautan yang rumit, algoritme mungkin dapat memproses jutaan informasi dan zona dalam prediksi yang lebih spesifik.
Pembelajaran semacam ini dapat diterapkan ketika pengembang ingin perangkat lunak untuk menandai violet warna pada berbagai gambar. Program kemudian akan diisi dengan sejumlah gambar (karenanya, "mendalam" belajar) dengan dan tanpa warna ungu. Melalui pengelompokan, program ini akan dapat mengidentifikasi pola dan belajar kapan untuk menandai warna sebagai ungu. Pembelajaran mendalam digunakan dalam berbagai program pengenalan seperti analisis gambar dan tugas perkiraan seperti dalam prediksi deret waktu.
Pembelajaran penguatan biasanya memperkirakan prediksi melalui trial and error. Mengenai sejarahnya dari perspektif AI, dikembangkan pada akhir 1980-an; itu didasarkan pada hasil percobaan hewan, konsep kontrol optimal, dan metode perbedaan temporal. Selain pembelajaran yang diawasi dan tidak diawasi, penguatan adalah salah satu paradigma mendasar dalam pembelajaran mesin. Seperti namanya, algoritma dilatih melalui penghargaan.
Misalnya, AI dikembangkan untuk bermain dengan manusia dalam game seluler tertentu. Setiap kali AI hilang, algoritma direvisi untuk memaksimalkan nilainya. Jadi, teknik semacam ini belajar dari kesalahannya. Setelah banyak siklus, AI telah berkembang dan menjadi lebih baik dalam mengalahkan pemain manusia. Pembelajaran penguatan diterapkan dalam berbagai teknologi mutakhir seperti meningkatkan robotika, penambangan teks, dan perawatan kesehatan.
Pembelajaran mendalam mampu mengeksekusi perilaku target dengan menganalisis data yang ada dan menerapkan apa yang telah dipelajari ke set informasi baru. Di sisi lain, pembelajaran penguatan mampu mengubah responsnya dengan mengadaptasi umpan balik yang berkelanjutan.
Pembelajaran mendalam bekerja dengan data yang sudah ada karena sangat penting dalam melatih algoritma. Adapun pembelajaran penguatan, itu bersifat eksplorasi dan dapat dikembangkan tanpa set data saat ini karena belajar melalui trial and error.
Pembelajaran mendalam digunakan dalam pengenalan gambar dan ucapan, pra-jaringan yang dalam, dan tugas pengurangan dimensi. Sebagai perbandingan, pembelajaran penguatan digunakan dalam berinteraksi dengan rangsangan eksternal dengan kontrol yang optimal seperti dalam robotika, penjadwalan lift, telekomunikasi, permainan komputer, dan perawatan kesehatan AI.
Pembelajaran mendalam juga dikenal sebagai pembelajaran hierarkis atau pembelajaran terstruktur dalam, sedangkan pembelajaran penguatan tidak memiliki istilah lain yang dikenal luas.
Pembelajaran mendalam adalah salah satu di antara banyak metode pembelajaran mesin. Di sisi lain, pembelajaran penguatan adalah bidang pembelajaran mesin; ini adalah salah satu dari tiga paradigma mendasar.
Dibandingkan dengan pembelajaran dalam, pembelajaran penguatan lebih dekat dengan kemampuan otak manusia karena kecerdasan jenis ini dapat ditingkatkan melalui umpan balik. Pembelajaran mendalam terutama untuk pengakuan dan kurang terkait dengan interaksi.
Pembelajaran mendalam pertama kali diperkenalkan pada tahun 1986 oleh Rina Dechter, sedangkan pembelajaran penguatan dikembangkan pada akhir 1980-an berdasarkan konsep eksperimen hewan, kontrol optimal, dan metode perbedaan temporal..