Data Mining vs Data Warehousing
Istilah "data mining" dan "data warehousing" terkait dengan bidang manajemen data. Ini adalah program pengumpulan data yang terutama digunakan untuk mempelajari dan menganalisis statistik, pola, dan dimensi dalam sejumlah besar data.
Penambangan Data
Istilah "data mining" digunakan untuk proses yang melibatkan analisis data dalam berbagai perspektif dan meringkas data tersebut menjadi informasi yang berguna. Perangkat lunak penambangan data memproses informasi sehingga dapat mengatur data baik dalam pemotongan biaya atau untuk peningkatan pendapatan atau keduanya.
Prosedur penambangan data mengikuti studi mendalam dan pengumpulan informasi dengan mengidentifikasi tren tertentu berdasarkan data dan pertanyaan yang dihasilkan oleh pengguna. Tujuan utama dari perangkat lunak penambangan data adalah untuk mengidentifikasi pola yang tidak biasa, menemukan penipuan yang terkait dengan keuangan pada khususnya, dan menghasilkan program yang diarahkan untuk meningkatkan pemasaran.
Perangkat lunak penambangan data terutama digunakan karena besarnya jumlah data yang dikumpulkan. Data mengalir melalui pemindai, respons surat langsung, mesin ATM, log server Web, data demografis, kamera sirkuit tertutup, transaksi kartu kredit, dan banyak sumber tambahan. Semua informasi ini harus divalidasi dan diringkas sebelum analisis apa pun harus dilakukan. Proses ini dikategorikan sebagai pergudangan data. Langkah selanjutnya adalah memilah informasi ini melalui berbagai prosedur yang terintegrasi dalam penambangan data.
Perangkat lunak penambangan data menggunakan berbagai langkah. Langkah pertama adalah pra-pemrosesan data yang melibatkan: pemilihan data, pembersihan data, penghapusan kebisingan, dan transformasi data. Setelah unit informasi umum ini dibuat, bidang baru dihasilkan. Langkah selanjutnya adalah pembangunan model data mining. Di sini model prospektif dihasilkan untuk merangkum informasi yang berguna. Langkah terakhir adalah evaluasi model data mining.
Data mining diperlukan saat ini terutama karena meningkatnya persaingan dalam bisnis. Perusahaan bersaing dalam hal layanan, personalisasi, keamanan, dan perusahaan real-time.
Pergudangan Data
Pergudangan data adalah proses mengumpulkan dan menyimpan data yang nantinya dapat dianalisis untuk penggalian data. Gudang data adalah sistem komputer yang rumit dengan kapasitas penyimpanan yang besar. Data dari semua sumber diarahkan ke sumber ini di mana data dibersihkan untuk menghapus informasi yang bertentangan dan berlebihan. Proses pergudangan data memungkinkan akses data terpusat.
Teknik pengambilan dan pengolahan data yang rumit dan rumit adalah sumber utama bagi organisasi untuk membangun fasilitas pergudangan data yang efektif dan efisien. Ini adalah aset penting bagi perusahaan untuk mempertahankan keuntungan, efisiensi, dan keunggulan kompetitif mereka. Data yang dikumpulkan dilewatkan melalui proses yang disebut Manajemen Siklus Hidup Data.
Pergudangan data menggunakan teknik untuk sistem manajemen basis data relatif seperti ekstraksi, pemuatan, transformasi, dan pemrosesan aplikasi online relasional. Ada empat karakteristik teknik pergudangan data. Mereka adalah: desain berbasis subjek, integrasi dengan data, gambar keadaan yang tidak mudah menguap, tampilan data dan varian waktu data.
Ringkasan: