Perbedaan antara Standar Deviasi dan Kesalahan Standar

pengantar

Standar Deviation (SD) dan Sstandar Error (SE) adalah terminologi yang tampaknya serupa; Namun, mereka secara konseptual sangat bervariasi sehingga mereka digunakan hampir secara bergantian dalam literatur Statistik. Kedua istilah biasanya didahului oleh simbol plus-minus (+/-) yang menunjukkan fakta bahwa mereka mendefinisikan nilai simetris atau mewakili berbagai nilai. Kedua istilah selalu muncul dengan rata-rata (rata-rata) dari serangkaian nilai yang diukur.

Menariknya, SE tidak ada hubungannya dengan standar, dengan kesalahan, atau dengan komunikasi data ilmiah.

Pandangan rinci tentang asal dan penjelasan SD dan SE akan mengungkapkan, mengapa ahli statistik profesional dan mereka yang menggunakannya dengan kursor, keduanya cenderung salah.

Deviasi Standar (SD)

SD adalah a deskriptif statistik yang menggambarkan penyebaran suatu distribusi. Sebagai metrik, berguna saat data terdistribusi secara normal. Namun, itu kurang berguna ketika data sangat miring atau bimodal karena tidak menggambarkan dengan baik bentuk distribusi. Biasanya, kami menggunakan SD ketika melaporkan karakteristik sampel, karena kami bermaksud menggambarkan berapa banyak data bervariasi di sekitar rata-rata. Statistik berguna lainnya untuk menggambarkan penyebaran data adalah rentang antar-kuartil, persentil ke-25 dan ke-75, dan rentang data.

Gambar 1. SD adalah ukuran penyebaran data. Ketika data merupakan sampel dari distribusi yang terdistribusi normal, maka seseorang mengharapkan dua pertiga dari data berada dalam 1 standar deviasi dari rata-rata.

Varians adalah a deskriptif statistik juga, dan itu didefinisikan sebagai kuadrat dari standar deviasi. Biasanya tidak dilaporkan saat menggambarkan hasil, tetapi ini adalah formula yang lebih mudah ditelusur secara matematis (a.k.a. jumlah penyimpangan kuadrat) dan berperan dalam perhitungan statistik.

Misalnya, jika kita memiliki dua statistik P & Q dengan varian yang dikenal var(P) & var(Q), maka varians dari penjumlahan P + Q sama dengan jumlah varians: var(P) +var(Q). Sekarang jelas mengapa ahli statistik suka berbicara tentang varian.

Tetapi standar deviasi membawa arti penting untuk penyebaran, terutama ketika data terdistribusi secara normal: Interval rata-rata +/ - 1 SD dapat diharapkan untuk menangkap 2/3 sampel, dan interval rata-rata +- 2 SD dapat diharapkan untuk menangkap 95% sampel.

SD memberikan indikasi seberapa jauh tanggapan individu terhadap pertanyaan bervariasi atau "menyimpang" dari rata-rata. SD memberi tahu peneliti bagaimana menyebar tanggapannya - apakah mereka terkonsentrasi di sekitar rata-rata, atau tersebar jauh & luas? Apakah semua responden Anda menilai produk Anda di tengah-tengah skala Anda, atau apakah ada yang menyetujuinya dan beberapa tidak menyetujuinya?

Pertimbangkan eksperimen di mana responden diminta untuk memberi peringkat pada produk pada serangkaian atribut pada skala 5 poin. Rata-rata untuk kelompok sepuluh responden (diberi label 'A' hingga 'J' di bawah) untuk "nilai terbaik untuk uang" adalah 3,2 dengan SD 0,4 dan rata-rata untuk "keandalan produk" adalah 3,4 dengan SD 2,1.

Pada pandangan pertama (hanya melihat pada sarana) tampaknya keandalan dinilai lebih tinggi dari nilai. Tetapi SD yang lebih tinggi untuk keandalan dapat menunjukkan (seperti yang ditunjukkan dalam distribusi di bawah) bahwa respons sangat terpolarisasi, di mana sebagian besar responden tidak memiliki masalah keandalan (memberi peringkat atribut "5"), tetapi segmen responden yang lebih kecil, tetapi penting, masalah keandalan dan memberi nilai atribut “1”. Melihat kejengkelan itu sendiri hanya menceritakan sebagian dari cerita, namun, lebih sering daripada tidak, inilah yang menjadi fokus peneliti. Distribusi tanggapan penting untuk dipertimbangkan dan SD memberikan ukuran deskriptif yang berharga untuk hal ini.

Termohon Nilai Baik untuk Uang Keandalan Produk
SEBUAH 3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G 3 5
H 3 5
saya 3 5
J 3 5
Berarti 3.2 3.4
Std. Dev. 0,4 2.1

Survei Pertama: Responden memberi peringkat produk pada skala 5 poin

Dua distribusi respons yang sangat berbeda terhadap skala peringkat 5 poin dapat menghasilkan rata-rata yang sama. Pertimbangkan contoh berikut ini yang menunjukkan nilai respons untuk dua peringkat yang berbeda.

Dalam contoh pertama (Peringkat "A"), SD adalah nol karena SEMUA tanggapan persis nilai rata-rata. Respons individu tidak menyimpang sama sekali dari mean.

Dalam Rating "B", meskipun rata-rata grup adalah sama (3.0) dengan distribusi pertama, Penyimpangan Standar lebih tinggi. Deviasi Standar 1,15 menunjukkan bahwa respons individu, rata-rata *, sedikit di atas 1 poin dari rata-rata.

Termohon Peringkat “A” Peringkat “B”
SEBUAH 3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3
G 3 3
H 3 4
saya 3 4
J 3 5
Berarti 3.0 3.0
Std. Dev. 0,00 1.15

Survei Kedua: Responden memberi peringkat produk pada skala 5 poin

Cara lain untuk melihat SD adalah dengan merencanakan distribusi sebagai histogram tanggapan. Distribusi dengan SD rendah akan ditampilkan sebagai bentuk sempit tinggi, sedangkan SD besar akan ditunjukkan oleh bentuk yang lebih luas.

SD umumnya tidak menunjukkan "benar atau salah" atau "lebih baik atau lebih buruk" - SD yang lebih rendah belum tentu lebih diinginkan. Ini digunakan murni sebagai statistik deskriptif. Ini menggambarkan distribusi dalam kaitannya dengan mean.

Tdisclaimer echnical terkait dengan SD

Memikirkan SD sebagai "penyimpangan rata-rata" adalah cara yang bagus untuk secara konseptual memahami maknanya. Namun, itu sebenarnya tidak dihitung sebagai rata-rata (jika ya, kita akan menyebutnya "penyimpangan rata-rata"). Alih-alih, itu adalah "standar," metode yang agak rumit menghitung nilai menggunakan jumlah kuadrat.

Untuk tujuan praktis, perhitungannya tidak penting. Sebagian besar program tabulasi, spreadsheet, atau alat manajemen data lainnya akan menghitung SD untuk Anda. Yang lebih penting adalah memahami apa yang disampaikan statistik.

Kesalahan Standar

Kesalahan standar adalah inferensial statistik yang digunakan ketika membandingkan rata-rata sampel (rata-rata) di seluruh populasi. Ini adalah ukuran presisi dari mean sampel. Sampel rata-rata adalah statistik yang berasal dari data yang memiliki distribusi yang mendasarinya. Kami tidak dapat memvisualisasikannya dengan cara yang sama seperti data, karena kami telah melakukan percobaan tunggal dan hanya memiliki nilai tunggal. Teori statistik memberi tahu kita bahwa mean sampel (untuk sampel "cukup" besar dan dalam beberapa kondisi keteraturan) kira-kira terdistribusi normal. Deviasi standar dari distribusi normal ini adalah apa yang kita sebut kesalahan standar.

Gambar 2. Distribusi di repre terbawahmengirim distribusi data, sedangkan distribusi di atas adalah distribusi teoretis dari mean sampel. SD 20 adalah ukuran penyebaran data, sedangkan SE 5 adalah ukuran ketidakpastian di sekitar mean sampel.

Ketika kita ingin membandingkan rata-rata hasil dari eksperimen dua sampel Pengobatan A vs Pengobatan B, maka kita perlu memperkirakan seberapa tepat kita telah mengukur rata-rata.

Sebenarnya, kami tertarik pada seberapa tepatnya kami mengukur perbedaan antara dua cara. Kami menyebut ukuran ini sebagai kesalahan standar perbedaan. Anda mungkin tidak terkejut mengetahui bahwa kesalahan standar dari perbedaan dalam mean sampel adalah fungsi dari kesalahan standar dari mean:

Sekarang setelah Anda memahami bahwa kesalahan standar mean (SE) dan standar deviasi distribusi (SD) adalah dua binatang yang berbeda, Anda mungkin bertanya-tanya bagaimana mereka menjadi bingung. Sementara mereka berbeda secara konseptual, mereka memiliki hubungan sederhana secara matematis:

,di mana n adalah jumlah titik data.

Perhatikan bahwa kesalahan standar tergantung pada dua komponen: standar deviasi sampel, dan ukuran sampel n. Ini masuk akal secara intuisi: semakin besar standar deviasi sampel, semakin kurang tepat perkiraan kita tentang rata-rata sebenarnya.

Juga, semakin besar ukuran sampel, semakin banyak informasi yang kita miliki tentang populasi dan semakin tepat kita dapat memperkirakan rata-rata sebenarnya.

SE adalah indikasi keandalan rata-rata. SE kecil adalah indikasi bahwa mean sampel adalah cerminan yang lebih akurat dari rata-rata populasi aktual. Ukuran sampel yang lebih besar biasanya akan menghasilkan SE yang lebih kecil (sementara SD tidak secara langsung dipengaruhi oleh ukuran sampel).

Sebagian besar penelitian survei melibatkan pengambilan sampel dari suatu populasi. Kami kemudian membuat kesimpulan tentang populasi dari hasil yang diperoleh dari sampel itu. Jika sampel kedua diambil, hasilnya mungkin tidak akan sama persis dengan sampel pertama. Jika nilai rata-rata untuk atribut peringkat adalah 3,2 untuk satu sampel, itu mungkin 3,4 untuk sampel kedua dengan ukuran yang sama. Jika kita menggambar jumlah sampel yang tak terbatas (dengan ukuran yang sama) dari populasi kita, kita bisa menampilkan sarana yang diamati sebagai distribusi. Kami kemudian dapat menghitung rata-rata semua rata-rata sampel kami. Mean ini akan sama dengan mean populasi sebenarnya. Kami juga dapat menghitung SD dari distribusi mean sampel. SD dari distribusi mean sampel ini adalah SE dari setiap mean sampel individu.

Kami, dengan demikian, memiliki pengamatan kami yang paling signifikan: SE adalah SD dari rata-rata populasi.

Sampel Berarti
1 3.2
Ke-2 3.4
Ke-3 3.3
4 3.2
Ke 5 3.1
... . ... .
... . ... .
... . ... .
... . ... .
... . ... .
Berarti 3.3
Std. Dev. 0,13

Tabel yang menggambarkan hubungan antara SD dan SE

Sekarang jelas bahwa jika SD distribusi ini membantu kita untuk memahami seberapa jauh rata-rata sampel dari rata-rata populasi sebenarnya, maka kita dapat menggunakan ini untuk memahami seberapa akurat setiap sampel rata-rata individu dalam kaitannya dengan rata-rata sebenarnya. Itulah esensi dari SE.

Pada kenyataannya, kami hanya mengambil satu sampel dari populasi kami, tetapi kami dapat menggunakan hasil ini untuk memberikan perkiraan keandalan rata-rata sampel yang diamati..

Faktanya, SE memberi tahu kita bahwa kita dapat 95% yakin bahwa rata-rata sampel yang diamati adalah plus atau minus kira-kira 2 (sebenarnya 1,96)..

Tabel di bawah ini menunjukkan distribusi tanggapan dari sampel pertama kami (dan satu-satunya) yang digunakan untuk penelitian kami. SE dari 0,13, karena relatif kecil, memberi kita indikasi bahwa rata-rata kita relatif dekat dengan rata-rata sebenarnya dari populasi kita secara keseluruhan. Margin of error (pada kepercayaan 95%) untuk rata-rata kami adalah (kira-kira) dua kali nilai itu (+/- 0,26), memberi tahu kami bahwa mean sebenarnya kemungkinan besar antara 2,94 dan 3,46.

Termohon Peringkat
SEBUAH 3
B 3
C 3
D 3
E 4
F 4
G 3
H 3
saya 3
J 3
Berarti 3.2
Std. Berbuat salah 0,13

Ringkasan

Banyak peneliti gagal memahami perbedaan antara Standar Deviasi dan Kesalahan Standar, meskipun mereka umumnya dimasukkan dalam analisis data. Sementara perhitungan aktual untuk Standar Deviasi dan Kesalahan Standar terlihat sangat mirip, mereka mewakili dua langkah yang sangat berbeda, namun saling melengkapi. SD memberi tahu kami tentang bentuk distribusi kami, seberapa dekat nilai data individu dari nilai rata-rata. SE memberitahu kita seberapa dekat rata-rata sampel kita dengan rata-rata sebenarnya dari keseluruhan populasi. Bersama-sama, mereka membantu memberikan gambaran yang lebih lengkap daripada yang bisa diceritakan oleh kami.