Perbedaan Antara data mining dan Data Warehousing

Penambangan data vs Data Warehousing

Penambangan Data dan Penyimpanan Data adalah teknik yang sangat kuat dan populer untuk menganalisis data. Pengguna yang condong ke arah statistik menggunakan Penambangan Data. Mereka menggunakan model statistik untuk mencari pola tersembunyi dalam data. Penambang data tertarik untuk menemukan hubungan yang bermanfaat antara berbagai elemen data, yang pada akhirnya menguntungkan bagi bisnis. Tetapi di sisi lain, para ahli data yang dapat menganalisis dimensi bisnis secara langsung cenderung menggunakan gudang data.

Penambangan data juga dikenal sebagai Knowledge Discovery in data (KDD). Seperti disebutkan di atas, ini adalah bidang ilmu komputer, yang berkaitan dengan ekstraksi informasi yang sebelumnya tidak diketahui dan menarik dari data mentah. Karena pertumbuhan data yang eksponensial, terutama di bidang-bidang seperti bisnis, penambangan data telah menjadi alat yang sangat penting untuk mengubah kekayaan data yang besar ini menjadi intelijen bisnis, karena ekstraksi pola secara manual menjadi tidak mungkin dilakukan dalam beberapa dekade terakhir. Misalnya, saat ini telah digunakan untuk berbagai aplikasi seperti analisis jejaring sosial, deteksi penipuan dan pemasaran. Penambangan data biasanya berkaitan dengan empat tugas berikut: pengelompokan, klasifikasi, regresi, dan asosiasi. Clustering mengidentifikasi kelompok serupa dari data yang tidak terstruktur. Klasifikasi adalah aturan pembelajaran yang dapat diterapkan pada data baru dan biasanya akan mencakup langkah-langkah berikut: preprocessing data, merancang pemodelan, pemilihan fitur / pembelajaran dan Evaluasi / validasi. Regresi adalah menemukan fungsi dengan kesalahan minimal untuk memodelkan data. Dan asosiasi mencari hubungan antar variabel. Data mining biasanya digunakan untuk menjawab pertanyaan seperti apa produk utama yang mungkin membantu untuk memperoleh laba tinggi tahun depan di Wal-Mart?

Seperti yang disebutkan di atas, pergudangan data juga digunakan untuk menganalisis data, tetapi oleh kelompok pengguna yang berbeda dan tujuan yang sedikit berbeda. Misalnya, ketika datang ke sektor ritel, pengguna pergudangan data lebih peduli dengan jenis pembelian apa yang populer di kalangan pelanggan, sehingga hasil analisis dapat membantu pelanggan dengan meningkatkan pengalaman pelanggan. Tetapi Penambang data pertama-tama menduga hipotesis seperti pelanggan membeli jenis produk tertentu dan menganalisis data untuk menguji hipotesis. Pergudangan data dapat dilakukan oleh pengecer besar yang pada awalnya menyimpan stok tokonya dengan ukuran produk yang sama untuk kemudian mengetahui bahwa toko-toko di New York menjual inventori ukuran yang lebih kecil jauh lebih cepat daripada di toko-toko Chicago. Jadi, dengan melihat hasil ini, pengecer dapat memasok toko New York dengan ukuran lebih kecil dibandingkan dengan toko Chicago.

Jadi, seperti yang bisa Anda lihat dengan jelas, kedua jenis analisis ini tampaknya memiliki sifat yang sama dengan mata telanjang. Keduanya peduli tentang peningkatan laba berdasarkan data historis. Tetapi tentu saja, ada perbedaan utama. Dalam istilah sederhana, Penambangan Data dan Penyimpanan Data didedikasikan untuk menyediakan berbagai jenis analitik, tetapi pasti untuk berbagai jenis pengguna. Dengan kata lain, Data Mining mencari korelasi, pola untuk mendukung hipotesis statistik. Namun, Data Warehousing menjawab pertanyaan yang relatif lebih luas dan mengiris dan memotong data dari sana dan seterusnya untuk mengenali cara-cara perbaikan di masa depan..