Standar Deviasi vs Varian

Simpangan baku dan perbedaan adalah ukuran statistik dispersi Standar deviasiPerbedaanFormula Matematika Akar kuadrat dari Variance Rata-rata kuadrat penyimpangan dari setiap nilai dari rata-rata dalam sampel. Simbol Huruf Yunani sigma - σ Tidak ada simbol khusus; dinyatakan dalam standar deviasi atau nilai-nilai lainnya. Nilai dalam kaitannya dengan set data yang diberikan Skala yang sama dengan nilai dalam set data yang diberikan; oleh karena itu, dinyatakan dalam unit yang sama. Skala lebih besar dari nilai dalam kumpulan data yang diberikan; tidak dinyatakan dalam unit yang sama dengan nilai-nilai itu sendiri. Apakah Nilai Negatif atau Positif? Selalu tidak negatif Selalu tidak negatif Aplikasi Dunia Nyata Sampling populasi; mengidentifikasi outlier Rumus statistik, keuangan.

Isi: Standar Deviasi vs Varian

  • 1 Konsep Penting
  • 2 Simbol
  • 3 Formula
  • 4 Contoh
    • 4.1 Mengapa Menyamakan Penyimpangan?
  • 5 Aplikasi Dunia Nyata
    • 5.1 Menemukan outlier
  • 6 Contoh Standar Deviasi
  • 7 Referensi

Konsep Penting

  • Berarti: rata-rata semua nilai dalam satu set data (tambahkan semua nilai dan bagi jumlahnya dengan jumlah nilai).
  • Deviasi: jarak masing-masing nilai dari nilai tengah. Jika mean adalah 3, nilai 5 memiliki penyimpangan 2 (kurangi rata-rata dari nilai). Penyimpangan bisa positif atau negatif.

Simbol

Rumus untuk deviasi standar dan varians sering dinyatakan menggunakan:

  • x̅ = rata-rata, atau rata-rata, dari semua titik data dalam masalah
  • X = titik data individual
  • N = jumlah titik dalam kumpulan data
  • ∑ = jumlah [kuadrat dari penyimpangan]

Formula

Varian dari satu set n nilai-nilai yang kemungkinan sama dapat ditulis sebagai:

Simpangan baku adalah akar kuadrat dari varians:

Rumus dengan huruf Yunani memiliki cara yang terlihat menakutkan, tetapi ini tidak sesulit kelihatannya. Untuk memasukkannya ke dalam langkah-langkah sederhana:

  1. temukan rata-rata semua titik data
  2. cari tahu seberapa jauh setiap titik jauh dari rata-rata (ini adalah penyimpangan)
  3. kuadratkan setiap deviasi (mis. perbedaan setiap nilai dari rata-rata)
  4. bagilah jumlah kuadrat dengan jumlah poin.

Itu memberikan varians. Ambil akar kuadrat dari varians untuk menemukan standar deviasi.

Video istimewa dari Khan Academy ini menjelaskan konsep varians dan standar deviasi:

Contoh

Katakanlah set data mencakup ketinggian enam tanaman liar: 3 inci, 4 inci, 5 inci, 4 inci, 11 inci, dan 6 inci.

Pertama, temukan rerata poin data: (3 + 4 + 5 + 4 + 11 + 7) / 6 = 5.5

Jadi tinggi rata-rata adalah 5,5 inci. Sekarang kita membutuhkan penyimpangan, jadi kita menemukan perbedaan masing-masing tanaman dari rata-rata: -2.5, -1.5, -.5, -1.5, 5.5, 1.5

Sekarang kuadratkan setiap deviasi dan temukan jumlahnya: 6.25 + 2.25 + .25 + 2.25 + 30.25 + 2.25 = 43.5

Sekarang bagi jumlah kuadrat dengan jumlah titik data, dalam hal ini tanaman: 43.5 / 6 = 7.25

Jadi varians dari kumpulan data ini adalah 7,25, yang merupakan angka yang cukup arbitrer. Untuk mengubahnya menjadi pengukuran dunia nyata, ambil akar kuadrat dari 7,25 untuk menemukan standar deviasi dalam inci.

Simpangan baku sekitar 2,69 inci. Itu berarti bahwa untuk sampel, setiap dandelion dalam 2,69 inci dari rata-rata (5,5 inci) adalah 'normal'.

Mengapa Menyelesaikan Penyimpangan?

Penyimpangan dikuadratkan untuk mencegah nilai negatif (penyimpangan di bawah rata-rata) dari membatalkan nilai-nilai positif. Ini berfungsi karena angka negatif kuadrat menjadi nilai positif. Jika Anda memiliki kumpulan data sederhana dengan penyimpangan dari rata-rata +5, +2, -1, dan -6, jumlah penyimpangan akan keluar sebagai nol jika nilai tidak dikuadratkan (yaitu 5 + 2 - 1 - 6 = 0).

Aplikasi Dunia Nyata

Varians dinyatakan sebagai dispersi matematika. Karena ini adalah angka arbitrer relatif terhadap pengukuran asli dari kumpulan data, sulit untuk memvisualisasikan dan menerapkannya dalam arti dunia nyata. Menemukan varians biasanya hanya langkah terakhir sebelum menemukan standar deviasi. Nilai varians kadang-kadang digunakan dalam formula keuangan dan statistik.

Deviasi standar, yang dinyatakan dalam unit asli dari kumpulan data, jauh lebih intuitif dan lebih dekat dengan nilai-nilai dari kumpulan data asli. Ini paling sering digunakan untuk menganalisis sampel demografi atau populasi untuk mengetahui apa yang normal dalam populasi.

Menemukan pencilan

Distribusi normal (Bell curve) dengan pita yang sesuai dengan 1σ

Dalam distribusi normal, sekitar 68% dari populasi (atau nilai-nilai) berada dalam 1 standar deviasi (1σ) dari rata-rata dan sekitar 94% berada dalam 2σ. Nilai yang berbeda dari rata-rata oleh 1.7σ atau lebih biasanya dianggap sebagai pencilan.

Dalam praktiknya, sistem kualitas seperti Six Sigma berupaya mengurangi tingkat kesalahan sehingga kesalahan menjadi outlier. Istilah "proses enam sigma" berasal dari gagasan bahwa jika seseorang memiliki enam standar deviasi antara rata-rata proses dan batas spesifikasi terdekat, praktis tidak ada item yang akan gagal memenuhi spesifikasi..[1]

Contoh Standar Deviasi

Dalam aplikasi dunia nyata, set data yang digunakan biasanya mewakili sampel populasi, bukan seluruh populasi. Formula yang sedikit dimodifikasi digunakan jika kesimpulan seluruh populasi harus diambil dari sampel parsial.

'Sampel standar deviasi' digunakan jika semua yang Anda miliki adalah sampel, tetapi Anda ingin membuat pernyataan tentang standar deviasi populasi dari mana sampel diambil.

Satu-satunya cara sampel standar deviasi berbeda dari rumus standar deviasi adalah "-1" dalam penyebut.

Dengan menggunakan contoh dandelion, formula ini akan diperlukan jika kita hanya mengambil sampel 6 dandelion, tetapi ingin menggunakan sampel itu untuk menyatakan standar deviasi untuk seluruh bidang dengan ratusan dandelion.

Jumlah kuadrat sekarang akan dibagi dengan 5 bukannya 6 (n - 1), yang memberikan varian 8,7 (bukan 7,25), dan sampel standar deviasi 2,95 inci, bukannya 2,69 inci untuk standar deviasi standar. Perubahan ini digunakan untuk menemukan margin kesalahan dalam sampel (9% dalam kasus ini).

Referensi

  • Contoh Sederhana Menghitung Deviasi Standar - AppSpot
  • Formula Deviasi Standar - Matematika itu Menyenangkan
  • Penyimpangan Absolut & Varian - Statistik Laerd
  • Deviasi dan Varians Standar - Matematika itu Menyenangkan
  • Wikipedia: Deviasi standar
  • Wikipedia: Variance # Properties
  • Rentang, varian, dan standar deviasi sebagai ukuran dispersi - Akademi Khan
  • Mode, Median, dan Sarana: Perspektif Yang Menyatukan