Penambangan Data vs OLAP
Penambangan data dan OLAP adalah dua teknologi Business Intelligence (BI) yang umum. Business intelligence mengacu pada metode berbasis komputer untuk mengidentifikasi dan mengekstraksi informasi yang berguna dari data bisnis. Penambangan data adalah bidang ilmu komputer yang, berkaitan dengan penggalian pola menarik dari set besar data. Ini menggabungkan banyak metode dari kecerdasan buatan, statistik dan manajemen basis data. OLAP (pemrosesan analitik online) seperti namanya adalah kompilasi cara untuk melakukan query database multi-dimensi.
Penambangan data juga dikenal sebagai Knowledge Discovery in data (KDD). Seperti disebutkan di atas, ini adalah bidang ilmu komputer, yang berkaitan dengan ekstraksi informasi yang sebelumnya tidak diketahui dan menarik dari data mentah. Karena pertumbuhan data yang eksponensial, terutama di bidang-bidang seperti bisnis, penambangan data telah menjadi alat yang sangat penting untuk mengubah kekayaan data yang besar ini menjadi intelijen bisnis, karena ekstraksi pola secara manual menjadi tidak mungkin dilakukan dalam beberapa dekade terakhir. Misalnya, saat ini telah digunakan untuk berbagai aplikasi seperti analisis jejaring sosial, deteksi penipuan dan pemasaran. Penambangan data biasanya berkaitan dengan empat tugas berikut: pengelompokan, klasifikasi, regresi, dan asosiasi. Clustering mengidentifikasi kelompok serupa dari data yang tidak terstruktur. Klasifikasi adalah aturan pembelajaran yang dapat diterapkan pada data baru dan biasanya akan mencakup langkah-langkah berikut: preprocessing data, merancang pemodelan, pemilihan pembelajaran / fitur dan evaluasi / validasi. Regresi adalah menemukan fungsi dengan kesalahan minimal untuk memodelkan data. Dan asosiasi mencari hubungan antar variabel. Data mining biasanya digunakan untuk menjawab pertanyaan seperti apa produk utama yang mungkin membantu untuk memperoleh laba tinggi tahun depan di Wal-Mart.
OLAP adalah kelas sistem, yang memberikan jawaban atas pertanyaan multidimensi. Biasanya OLAP digunakan untuk pemasaran, penganggaran, perkiraan dan aplikasi serupa. Tak perlu dikatakan bahwa database yang digunakan untuk OLAP dikonfigurasi untuk permintaan kompleks dan ad-hoc dengan kinerja cepat dalam pikiran. Biasanya sebuah matriks digunakan untuk menampilkan output dari OLAP. Baris dan kolom dibentuk oleh dimensi kueri. Mereka sering menggunakan metode agregasi pada beberapa tabel untuk mendapatkan ringkasan. Misalnya, dapat digunakan untuk mencari tahu tentang penjualan tahun ini di Wal-Mart dibandingkan tahun lalu? Bagaimana prediksi penjualan di kuartal berikutnya? Apa yang bisa dikatakan tentang tren dengan melihat perubahan persentase?
Meskipun jelas bahwa penambangan data dan OLAP serupa karena mereka beroperasi pada data untuk mendapatkan intelijen, perbedaan utama berasal dari bagaimana mereka beroperasi pada data. Alat OLAP memberikan analisis data multidimensi dan memberikan ringkasan data, tetapi sebaliknya, penambangan data berfokus pada rasio, pola, dan pengaruh dalam rangkaian data. Itu adalah kesepakatan OLAP dengan agregasi, yang bermuara pada operasi data melalui "penambahan" tetapi penambangan data sesuai dengan "divisi". Perbedaan penting lainnya adalah bahwa sementara alat penambangan data memodelkan data dan mengembalikan aturan yang dapat ditindaklanjuti, OLAP akan melakukan teknik perbandingan dan kontras di sepanjang dimensi bisnis secara real time.