Perbedaan antara varians Sampel & varians populasi

Penjelasan

Dalam Statistik, istilah sampling mengacu pada pemilihan bagian dari data statistik agregat untuk tujuan memperoleh informasi yang relevan tentang keseluruhan. Kumpulan atau seluruh informasi statistik tentang karakter khusus dari semua anggota yang dicakup oleh penyelidikan disebut 'populasi' atau 'alam semesta'. (Das, N.G., 2010). Bagian yang dipilih dari populasi yang digunakan untuk mendapatkan karakteristik populasi atau alam semesta disebut sebagai 'sampel'. Populasi diambil untuk dibuat dari unit individu atau anggota, dan beberapa unit termasuk dalam sampel. Jumlah total unit populasi disebut ukuran populasi, dan jumlah sampel disebut ukuran sampel. Populasi dan sampel dapat terbatas atau tidak terbatas dan sama mereka dapat ada atau hipotetis.

Perbedaan: Varians adalah nilai numerik yang menunjukkan seberapa luas angka-angka individu dalam satu set data mendistribusikan diri mereka sendiri tentang rata-rata. Itulah sejauh mana setiap angka dari rata-rata, dan dengan demikian dari satu sama lain. Varian nilai nol berarti semua data identik. Semakin varians, semakin banyak nilai yang tersebar tentang mean, maka dari satu sama lain. Semakin sedikit varians, semakin sedikit nilai yang tersebar tentang mean, maka dari satu sama lain, dan varians tidak boleh negatif.

Perbedaan antara varians populasi dan varians sampel

Perbedaan utama antara varians populasi dan varians sampel berkaitan dengan perhitungan varians. Varians dihitung dalam lima langkah. Rata-rata pertama dihitung, lalu kami menghitung penyimpangan dari rata-rata, dan ketiga penyimpangan dikuadratkan, keempat penyimpangan kuadrat diringkas dan akhirnya jumlah ini dibagi dengan jumlah item yang varians sedang dihitung. Jadi varians = Σ (xi-x -) / n. Di mana xi = ith. Angka, x- = rata-rata dan n = jumlah item ...

Sekarang, ketika varians dihitung dari data populasi, n sama dengan jumlah item. Jadi jika varians dalam tekanan darah dari semua 1000 orang harus dihitung dari data tekanan darah dari semua 1000 orang, maka n = 1000. Namun ketika varians dihitung dari data sampel 1 harus dikurangkan dari n sebelum membagi jumlah penyimpangan kuadrat. Jadi dalam contoh di atas jika data sampel memiliki 100 item, penyebutnya 100 - 1 = 99.

Karena ini, nilai varians yang dihitung dari data sampel lebih tinggi dari nilai yang bisa ditemukan dengan menggunakan data populasi. Logika melakukan itu adalah untuk mengkompensasi kurangnya informasi kami tentang data populasi. Tidak mungkin menemukan perbedaan ketinggian pada manusia, karena kurangnya informasi kita tentang ketinggian semua manusia hidup, untuk tidak membicarakan masa depan. Sekalipun kita mengambil satu contoh moderat, seperti data populasi tentang ketinggian semua manusia yang hidup di AS, secara fisik dimungkinkan, tetapi biaya dan waktu yang terlibat dalam hal ini akan mengalahkan tujuan perhitungannya. Inilah alasan mengapa data sampel diambil untuk sebagian besar keperluan statistik, dan ini disertai dengan kurangnya informasi tentang sebagian besar data. Untuk mengkompensasi ini, nilai varians dan standar deviasi, yang merupakan kuadrat akar varians lebih tinggi dalam hal sampel data daripada varians dari data populasi.

Ini bertindak sebagai perisai otomatis bagi analis dan pembuat keputusan. Logika berlaku untuk keputusan tentang penganggaran modal, keuangan pribadi dan bisnis, konstruksi, manajemen lalu lintas, dan banyak bidang yang berlaku. Ini membantu pemegang pasak untuk berada di sisi yang aman saat mengambil keputusan atau untuk kesimpulan lainnya.

Ringkasan: Varians populasi mengacu pada nilai varians yang dihitung dari data populasi, dan varians sampel adalah varians yang dihitung dari data sampel. Karena nilai penyebut dalam rumus untuk varians dalam kasus data sampel adalah 'n-1', dan itu adalah 'n' untuk data populasi. Akibatnya baik varians dan standar deviasi yang berasal dari data sampel lebih dari yang ditemukan dari data populasi.