Perbedaan Antara Skema Bintang dan Snowflake

Pergudangan data adalah sistem yang dirancang untuk menyimpan dan mengatur data dalam repositori pusat termasuk data dari sumber lain. Ini adalah konsep inti intelijen bisnis dalam model basis data relasional yang menggunakan teknik analitis untuk mengintegrasikan data bisnis ke dalam basis data pusat.

Ada dua model arsitektur yang umum digunakan dalam pergudangan data:

  • Skema Bintang
  • Skema Snowflake

Keduanya adalah model basis data multidimensi umum yang digunakan untuk menjawab kebutuhan basis data besar untuk keperluan analisis di gudang data nyata.

Kami menyajikan perbandingan yang tidak bias antara keduanya untuk lebih memahami mana yang lebih baik dari yang lain.

Apa itu Skema Bintang?

Ini adalah model arsitektur yang paling umum dan diterima secara luas yang digunakan untuk mengembangkan gudang data dan data mart di mana data disusun menjadi fakta dan dimensi. Ini adalah model arsitektur paling sederhana di mana satu tabel fakta digunakan untuk merujuk ke beberapa tabel dimensi, meniru pola bintang.

Seperti namanya, diagram menyerupai bintang dengan tabel fakta di pusat dan beberapa tabel dimensi memancar darinya, menciptakan pola seperti bintang.

Ia juga dikenal sebagai Skema Star Join dan menyimpan semua atribut dimensi ke dalam satu tabel fakta yang didenormalisasi untuk menavigasi cepat melalui set data multidimensi besar yang menyumbang waktu respons kueri cepat.

Apa itu Snowflake Schema?

Ini adalah perpanjangan dari skema bintang dengan fungsionalitas tambahan. Tidak seperti skema bintang, tabel dimensi dalam skema kepingan salju dinormalisasi menjadi beberapa tabel terkait.

Model arsitektural mewakili susunan tabel yang logis dalam hierarki hubungan banyak-ke-satu di mana tabel multi-dimensi dinormalisasi menjadi tabel sub-dimensi, menyerupai pola seperti kepingan salju, maka dari itu namanya.

Ini adalah versi yang lebih kompleks dari skema bintang dengan lebih banyak gabungan antara tabel dimensi yang menyumbang waktu pemrosesan yang lambat untuk mengambil data yang berarti waktu respons kueri yang lambat. Ini meminimalkan redundansi data yang pada gilirannya meningkatkan kinerja kueri.

Perbedaan antara Skema Star dan Snowflake

Arsitektur Skema Bintang dan Kepingan Salju

Dalam database relasional, skema bintang adalah model arsitektur paling sederhana yang digunakan untuk mengembangkan gudang data dan data mart multidimensi. Seperti namanya, modelnya menyerupai bintang dengan titik-titik yang memancar dari pusat yang berarti tabel fakta adalah pusat dan titik adalah tabel dimensi. Seperti model dimensi lainnya, itu terdiri dari data dalam bentuk fakta dan dimensi. Skema Snowflake, di sisi lain, adalah model arsitektur yang lebih kompleks yang mengacu pada basis data multidimensi dengan susunan tabel yang logis dalam bentuk kepingan salju..

Tabel Dimensi

Skema kepingan salju sangat mirip dengan skema bintang kecuali dapat memiliki lebih dari satu tabel dimensi yang selanjutnya dinormalisasi menjadi beberapa tabel terkait yang disebut sebagai tabel sub-dimensi. Ini mewakili berbagai tingkat hubungan yang bercabang menjadi pola kepingan salju. Namun, skema bintang menyimpan semua atribut terkait dari suatu dimensi ke dalam satu tabel dimensi denormalized yang membuatnya mudah untuk dipahami dan menangani kueri yang lebih sederhana.

Model Bisnis Skema Star dan Snowflake

Tabel dimensi tidak dapat berisi baris duplikat dalam model database relasional karena fakta sederhana bahwa itu bisa membuat ambiguitas dalam pengambilan. Setiap tabel harus memiliki kolom atau kombinasi kolom yang disebut kunci utama yang secara unik mengidentifikasi semua catatan tabel. Kunci asing adalah kolom atau grup kolom yang menyediakan tautan antara dua tabel. Dalam skema bintang, setiap tabel dimensi memiliki kunci utama yang terkait dengan kunci asing di tabel fakta. Hirarki bisnis dalam skema kepingan salju diwakili oleh kunci utama / hubungan kunci asing antara tabel dimensi.

Integritas Data dalam Skema Star dan Snowflake

Perbedaan utama antara dua model basis data relasional adalah normalisasi. Tabel dimensi dalam skema bintang tidak dinormalisasi, artinya model bisnis akan menggunakan ruang yang relatif lebih banyak untuk menyimpan tabel dimensi dan lebih banyak ruang berarti lebih banyak catatan yang berlebihan yang pada akhirnya akan menyebabkan ketidakkonsistenan. Skema Snowflake, di sisi lain, meminimalkan redundansi data karena tabel dimensi dinormalisasi yang menyumbang catatan redundan yang jauh lebih rendah. Hirarki bisnis dan dimensinya dilestarikan melalui integritas referensial yang berarti hubungan dapat diperbarui secara independen di gudang data.

Performa Permintaan

Skema bintang memiliki lebih sedikit gabungan antara tabel dimensi dan tabel fakta dibandingkan dengan skema kepingan salju yang memiliki banyak gabungan yang menyumbang kompleksitas kueri yang lebih sedikit. Karena dimensi dalam skema bintang dihubungkan melalui tabel fakta pusat, ia memiliki jalur gabungan yang jelas yang berarti waktu respons kueri cepat dan waktu respons cepat berarti kinerja yang lebih baik. Skema Snowflake memiliki jumlah gabungan yang lebih tinggi sehingga waktu respons kueri yang lebih lama yang menghasilkan kueri yang lebih kompleks yang pada akhirnya mengganggu kinerja.

Skema Bintang vs. Skema Snowflake: Bagan Perbandingan


Ringkasan sajak Bintang Skema Snowflake

Keduanya adalah model arsitektur yang paling umum dan banyak diadopsi yang digunakan untuk mengembangkan gudang database dan data mart. Namun, setiap model bisnis memiliki pro dan kontra yang adil. Sementara skema bintang adalah model multidimensi paling sederhana yang digunakan untuk mengatur data menjadi fakta dan dimensi, sangat ideal untuk mengembangkan data mart yang melibatkan hubungan yang kurang kompleks. Skema Snowflake adalah representasi logis dari tabel dalam database multidimensi di mana dimensi disimpan dalam tabel sub-dimensi. Perbedaan utama antara keduanya adalah normalisasi. Tabel dimensi dalam skema kepingan salju sepenuhnya dinormalisasi menjadi beberapa tabel pencarian, sedangkan dalam skema bintang, tabel dimensi didenormalisasi menjadi satu tabel fakta pusat.