Sabtu, 28 Mei 2011

UKURAN PENYEBARAN DATA

UKURAN PENYEBARAN DATA

1. Pengertian dan Kegunaan

Penyebaran atau dispersi adalah pergerakan dari nilai observasi terhadap nilai rata-ratanya. Rata-rata dari serangkaian nilai observasi tidak dapat diinterpretasikan secara terpisah dari hasil dispersi nilai-nilai tersebut sekitar rata-ratanya. Makin besar variasi nilai , makin kurang representatif rata-rata distribusinya.

Contoh
Diberikan tabel hasil test mahasiswa A dan B :

Mahasiswa Hasil Tes
A 60 65 50 60 65 60
B 30 90 50 70 60 60

Mahasiswa A : , variasi nilai dari 50 sampai 65.
Mahasiswa B : , variasi nilai dari 30 sampai 90.
Bisa kita lihat .

Meskipun rata-rata hasil tes mereka sama, tetapi dispersi hasil tes mahasiswa B lebih besar dari pada mahasiswa A. Nilai A lebih konsisten (stabil) dari pada nilai B. Sedang nilai B kadang baik, kadang jelek. Hal ini berarti prestasi nilai A lebih baik (stabil) dari pada B.

Berdasarkan besar kecilnya penyebaran, kelompok data dibagi menjadi dua, yaitu :
a. Kelompok data homogen
Penyebaran relatif kecil; jika seluruh data sama, maka disebut kelompok data homogen 100%.
b. Kelompok data heterogen
Penyebarannya relatif besar.

Kegunaan ukuran penyebaran antara lain sebagai berikut :
a. Ukuran penyebaran dapat digunakan untuk menentukan apakah nilai rata-ratanya benar-benar representatif atau tidak. Apabila suatu kelompok data mempunyai penyebaran yang tidak sama terhadap nilai rata-ratanya, maka dikatakan bahwa nilai rata-rata tersebut tidak representatif. Perhatikan contoh berikut :
Karyawan Upah (Rp)
A 40000
B 50000
C 55000
D 65000
E 390000
Jumlah 600000

Rata-rata upah karyawan = Rp Rp 120.000,00
Jelas nilai rata-rata ini tidak representatif, karena ada 4 karyawan yang upahnya dibawah rata-rata. Hal ini diakibatkan oleh sebaran data yang sangat heterogen.
b. Ukuran penyebaran dapat digunakan untuk mengadakan perbandingan terhadap variabilitas data.
c. Ukuran penyebaran dapat membantu penggunaan ukuran statistika, misalnya dalam pengujian hipotesis, apakah dua sampel berasal dari populasi yang sama atau tidak.

2. Pengukuran Jangkauan ( Range )

Penentuan jangkauan atau rentang sebuah distribusi merupakan pengukuran dispersi yang paling sederhana. Jangkauan sebuah distribusi frekuensi dirumuskan sebagai beda antara pengukuran nilai terbesar dan nilai terkecil yang terdapat dalam sebuah distribusi.

Rumus : , dengan :
R = Range
= Nilai tertinggi
= Nilai terendah
Contoh 6.2. :
1. Pandang tabel nilai ujian mahasiswa FE UI :

Tabel nilai mahasiswa FE UI
53,53 63,14 49,03 55,15 67,79
63,49 58,63 50,84 51,77 41,22
73,55 50,74 56,00 46,98 46,33
62,66 66,60 59,16 50,37 44,82
52,49 53,35 61,61 55,54 50,94

Jangkauan distribusi dari nilai mahasiswa FE UI adalah = Nilai tertinggi – nilai terendah = 73,33 – 41,22 = 32,33.


2. Diberikan tabel distribusi frekuensi dari nilai 111 mahasiswa FE UI.

Nilai Ujian Jumlah Mahasiswa
20,00-27,49 3
27,50-34,99 5
35,00-42,49 7
42,50-49,99 23
50,00-57,49 40
57,50-64,99 20
65,00-72,49 10
72,50-79,99 3

Bila nilai-nilai observasi telah dikelompokkan ke dalam distribusi frekuensi, maka jangkauan distribusi dirumuskan sebagai beda antara pengukuran nilai titik tengah kelas pertama dan nilai titik tengah kelas terakhir.

Jangkauan distribusi nilai mahasiswa FE UI adalah :
Nilai titik tengah kelas pertama = = 24,995
Nilai titik tengah kelas terakhir = = 74,995
Jangkauan distribusi = nilai titik tengah kelas pertama – nilai titik tengah kelas terakhir = 74,995 – 24,995 = 50,00.

Beberapa statistisi cenderung menggunakan beda antara tepi bawah kelas pertama dengan tepi atas kelas terakhir :
Tepi bawah dari kelas pertama = 20,00
Tepi atas kelas terakhir = 79,99
Jangkauan distribusi = 79,99 – 20,00 = 60,00

3. Tentukan jangkauan dari tabel distribusi frekuensi berikut :
Interval Kelas Fi
97 - 103 4
104 - 110 8
111 - 117 15
118 - 124 35
125 - 131 25
132 - 138 6
139 - 145 4
146 - 152 3
100

Jawab :
Nilai titik tengah kelas pertama =
Nilai titik tengah kelas terakhir =
Jangkauan distribusi = nilai titik tengah kelas pertama – nilai titik tengah kelas terakhir = 149 – 100 = 49.
Atau :
Jangkauan = 152 – 97 = 55.


3. Pengukuran Deviasi Kuartil

Median didefinisikan sebagai nilai yang membagi seluruh rentang nilai menjadi dua bagian yang sama.

Dengan cara yang sama, kuartil didefinisikan sebagai nilai yang membagi seluruh rentang nilai menjadi empat bagian yang sama. Ketiga nilai tersebut dinamakan nilai-nilai kuartil dan dilambangkan dengan :
= kuartil pertama
= kuartil kedua
= kuartil ketiga.
Pada distribusi kuartil, 50% dari semua nilai observasi seharusnya terletak di antara dan . Jangkauan antara dan dinamakan jangkauan inter-kuartil ( inter-quartile-range ). Makin kecil jangkauan tersebut, makin tinggi tingkat konsentrasi distribusi tengah seluas 50% dari seluruh distribusi. Rumus jangkauan kuartil adalah :
.
Pengukuran dispersi atas dasar jangkauan inter-kuartil dinamakan deviasi kuartil atau simpangan kuartil ( quartile deviation ) :
.
Contoh 6.3. :
1. Pandang tabel tingkat kematian karena bunuh diri laki-laki usia 25-34 tahun (per 100.000 orang) pada tahun 1971 :




Negara Jumlah Negara Jumlah
Kanada 22 Italia 7
Israel 9 Belanda 8
Jepang 22 Polandia 26
Austria 29 Spanyol 4
Perancis 16 Swedia 28
Jerman 28 Swiss 22
Hongaria 48 Inggris 10
Italia 7 Amerika Serikat 20
Data tersebut kita urutkan dari yang terkecil menuju yang terbesar :
Negara Jumlah
Hongaria 48
Austria 29
Swedia 28
Jerman 28 Kuartil ketiga =
Polandia 26
Swiss 22
Kanada 22
Jepang 22 Kuartil kedua =
Amerika Serikat 20
Perancis 16
Inggris 10
Israel 9 Kuartil pertama =
Belanda 8
Italia 7
Spanyol 4

Jangkauan kuartil :
= .
Deviasi kuartil ( rentang antar kuartil ) :


2. Pandang data jumlah penduduk Kanada tahun 1851-1961 (dalam jutaan) :
Tahun Sensus Penduduk
1851 2.44
1861 3.23
1871 3,69
1881 4,32
1881 4.32
1891 4.83
1901 5,37
1911 7,21
1911 7.21
1921 8.79
1931 10,38
1941 11,51
1941 11.51
1951 14.01
1961 18.24

Jangkauan kuartil :
= .

Deviasi kuartil :
.

4. Rata-rata Simpangan

Rata-rata simpangan adalah suatu simpangan nilai untuk observasi terhadap rata-rata. Rata-rata simpangan sering disebut simpangan rata-rata atau mean deviasi, yang dilambangkan dengan “SR”. Untuk data tunggal, rata-rata simpangan ditentukan dengan rumus :

.

Untuk data berkelompok, rata-rata simpangan ditentukan dengan rumus :

.


Contoh 6.4. :

1. Tentukan simpangan rata-rata dari 7, 5, 8, 4, 6, dan 10 !
Jawab :
x

7 0,33
5 -1,67
8 1,33
4 -2,67
6 -0,67
10 3,33
40 10
6.67

= .

2. Tentukan simpangan rata-rata dari distribusi frekuensi berikut :




5 1
6 4
7 8
8 2






Jawab :






5 1 5 1.73 1.73
6 4 24 0.73 2.92
7 8 56 0.27 2.16
8 2 16 1.27 2.54
15 101 9.35
6.73
= .

5. Pengukuran Variansi dan Deviasi Standar

Rumus variansi dan deviasi standar populasi adalah :

.
dengan :
N = Jumlah observasi dalam populasi
 = Rata-rata populasi.

Untuk populasi yang berjumlah besar, sangat tidak mungkin untuk mendapatkan nilai  dan . Untuk mengestimasi ( menaksir ) nilai  dan  , diambil sampel data. Nilai  diestimasi oleh dan  diestimasi oleh .

6. Variansi dan deviasi standar dari data data tunggal

Simpangan baku atau deviasi standar (Standard Deviation) merupakan ukuran penyebaran yang paling baik, karena menggambarkan besarnya penyebaran tiap-tiap unit observasi. Karl Pearson menamakannya deviasi standar dan dirumuskan sebagai :
.
Kuadrat dari deviasi standar dinamakan variansi :
.

Contoh 6.6. :
Pandang tabel jumlah pemakaian tenaga listrik per bulan di DKI Jakarta tahun 1978.



Bulan Jumlah Pemakaian dalam Juta Kw H = X


Januari 111 -8,67 75,11
Februari 109 -10,67 113,78
Maret 105 -14,67 215,11
April 118 -1,67 2,78
Mei 117 -2,67 7,11
Juni 125 5,33 28,44
Juli 123 3,33 11,11
Agustus 123 3,33 11,11
September 126 6,33 40,11
Oktober 120 0,33 0,11
Nopember 128 8,33 69,44
Desember 131 11,33 128,44
 1436 0 702,67

119,67


.

7. Rumus Fisher dan Wilks

Untuk distribusi sampel dengan n < 100, Fisher, Wilks dan beberapa statistisi memberi perumusan tentang variansi dan deviasi standar sebagai berikut :



.

Deviasi standar sampel di atas sebetulnya digunakan sebagai penaksir tak bias ( unbiased estimate ) bagi deviasi standar populasi . Banyak statistisi yang menganjurkan penggunaan pembagi n-1 dalam menghitung deviasi standar sampel guna menaksir deviasi standar populasi. Bila jumlah n tidak besar, hasil penggunaan kedua rumus mungkin mempunyai perbedaan yang berarti. Tapi jika jumlah n besar sekali, beda kedua rumus di atas tidak berarti.

8. Rumus Alternatif bagi Variansi dan Deviasi Standar Sampel

.
Contoh 6.8. :

Pandang kembali tabel jumlah pemakaian tenaga listrik per bulan di DKI Jakarta tahun 1978.

Bulan Jumlah Pemakaian dalam Juta Kw H = X

Januari 111 12321
Februari 109 11881
Maret 105 11025
April 118 13924
Mei 117 13689
Juni 125 15625
Juli 123 15129
Agustus 123 15129
September 126 15876
Oktober 120 14400
Nopember 128 16384
Desember 131 17161
1436 172544
119.67

=
.

9. Cara Menghitung Variansi dan Deviasi Standar Secara Singkat


dengan : = titik asal deviasi secara arbriter.

Contoh 6.9. :

Pandang kembali tabel jumlah pemakaian tenaga listrik per bulan di DKI Jakarta tahun 1978.





Bulan Jumlah Pemakaian dalam Juta Kw H = X


Januari 111 -12 144
Februari 109 -14 196
Maret 105 -18 324
April 118 -2 4
Mei 117 -6 36
Juni 125 2 4
Juli 123 0 0
Agustus 123 0 0
September 126 3 9
Oktober 120 -3 9
Nopember 128 5 25
Desember 131 8 64
1436 -37 815
119.67

=
.

10. Variansi dan Deviasi Standar dari Data yang Telah Dikelompokkan

Bila variansi dan deviasi standar dihitung dari sebuah distribusi frekuensi, maka titik tengah tiap-tiap kelas umumya dianggap sebagai nilai tunggal yang cukup representatif bagi semua nilai-nilai observasi yang dikelompokkan ke dalam kelas-kelas yang bersangkutan. Rumus variansi dan deviasi standar dari distribusi frekuensi sedemikian itu dapat diberikan sebagai :


dengan :
= titik tengah tiap-tiap kelas
= jumlah frekuensi kelas.

Contoh 6.9. :

Nilai Ujian




0 - 9,99 4.99 2649.16 1 2649.16
10 - 19,99 14.99 1719.76 4 6879.04
20 - 29,99 24.99 990.36 7 6932.53
30 - 39,99 34.99 460.96 31 14289.79
40 - 49,99 44.99 131.56 42 5525.56
50 - 59,99 54.99 2.16 54 116.69
60 - 69,99 64.99 72.76 33 2401.11
70 - 79,99 74.99 343.36 24 8240.66
80 - 89,99 84.99 813.96 22 17907.14
90 - 99,99 94.99 1484.56 8 11876.49
226 76818.16

=
.

10. Cara Menghitung Variansi dan Deviasi Standar Secara Singkat

.


Contoh 6.10. :

Nilai Ujian






0 - 9,99 4.99 1 -5 25 -5 25
10 - 19,99 14.99 4 -4 16 -16 64
20 - 29,99 24.99 7 -3 9 -21 63
30 - 39,99 34.99 31 -2 4 -62 124
40 - 49,99 44.99 42 -1 1 -42 42
50 - 59,99 54.99 54 0 0 0 0
60 - 69,99 64.99 33 1 1 33 33
70 - 79,99 74.99 24 2 4 48 96
80 - 89,99 84.99 22 3 9 66 198
90 - 99,99 94.99 8 4 16 32 128
226 33 773
= .

11. Pengertian Distribusi Normal

Distribusi normal merupakan distribusi teoritis. Pada abad permulaan 19, sebagian besar sarjana beranggapan bahwa distribusi hasil observasi mengikuti hukum normal tersebut. Sebetulnya tidak semua distribusi hasil observasi bersifat normal, karena para sarjana mulai menemukan distribusi lain (seperti distribusi Poisson, Fisher, dll.). Meskipun demikian, kenyatan menunjukkan bahwa distribusi-distribusi hasil observasi memilki kurva frekuensi yang bermodus tunggal dengan kedua ujung yang mendatar ke arah kiri dan kanan serta cenderung simetris. Kurva simetris itu dekat sekali persamaannya dengan kurva normal yang biasa disebut kurva Gauss.

Distribusi normal dengan  = 0 dan  = 1 dinamakan distribusi normal standar atau distribusi normal baku. Nilai distribusi normal baku sudah dibuat tabelnya, sehingga kita dapat menghitung nilai standar dengan mudah, dengan membakukan nilai observasi. Caranya adalah sebagai berikut :
Misalkan adalah nilai observasi dengan rata-rata dan deviasi standar . Nilai observasi dapat diubah menjadi nilai standar, dinotasikan dengan , dengan menggunakan rumus :


Nilai standar mempunyai  = 0 dan  = 1.

Contoh 6.11 :

1. Suatu kelompok data mempunyai rata-rata 25 dan simpangan standar 4. Salah satu datanya bernilai 30. Nyatakan nilai mentah itu ke dalam nilai standar.
Jawab :

Diketahui : = 30,  = 25 dan  = 4
.

2. Seorang siswa SMK mendapat nilai ujian akhir Matematika 85. Rata-rata ujian Matematika 76 dan simpangan bakunya 9. Untuk bidang studi akuntansi, siswa tersebut mendapat nilai 90 dengan rata-rata ujian akuntansi 80 dan simpangan baku 15. Dalam mata pelajaran manakah ia mendapat kedudukan lebih baik ?

Jawab :

Nilai standar untuk matematika :
Nilai standar untuk akuntansi : .
Nilai tersebut menggambarkan bahwa siswa tersebut mendapat satu simpangan di atas rata-rata nilai matematika dan mendapat 0,67 simpangan di atas rata-rata nilai akuntansi. Hal itu berarti kedudukan siswa tersebut lebih tinggi dalam mata pelajaran matematika.


12. Pengukuran Dispersi Relatif
12.1. Pengertian

Pengukuran jangkauan, deviasi kuartil, deviasi rata-rata dan deviasi standar merupakan pengukuran yang absolut. Pengukuran demikian itu sebetulnya hanya dapat digunakan bagi penggambaran dispersi nilai-nilai observasi sebuah distribusi secara definitive. Bila kita ingin melakukan perbandingan tingkat dispersi antara dua atau beberapa distribusi dan bila jumlah nilai-nilai observasi dari dua atau beberapa distribusi di atas tidak sama, maka pengukuran dispersi secara absolut sebagai metode guna membandingkan dispersi akan memperoleh hasil yang menyesatkan.
Contoh 6.12.1. :

Seorang pengusaha bangunan ingin membandingkan variasi gaji buruh ekstranya dengan variasi gaji stafnya. Gaji buruh dibayar secara harian, sedangkan gaji staf dibayar sebulan sekali. Rata-rata gaji buruh Rp 500,00 dengan deviasi standar Rp 150,00 ; sedangkan gaji rata-rata staf Rp 30.000,00 dengan deviasi standar Rp 15.000,00.

Perbandingan langsung dari hasil perhitungan deviasi standar tentu tidak memungkinkan. Gaji staf dibayar per bulan tentu jumlahnya lebih besar dari pada gaji buruh yang dibayar harian, sehingga dispersi gaji staf lebih besar dari dispersi gaji buruh.

12.2. Cara Menghitung Ko-efisien Variansi

Dalam membandingkan tingkat variasi dua atau lebih distribusi hendaknya rata-rata distribusi digunakan sebagai dasar pengukuran variasinya secara relatif dan dinamakan ko-efisien variasi ( co-efficient of variation ) :




dengan :
= deviasi standar sampel
= rata-rata hitung sampel
Contoh 6.12.2. :

1. Sepeda motor jenis A dapat dipakai dalam kondisi prima rata-rata selama 40 bulan dengan simpangan baku 8 bulan. Jenis B 36 bulan dengan simpangan standar 6 bulan. Tentukan koefisien variasi dari masing-masing jenis sepeda motor tesebut dan interpretasinya.
Jawab :

= x 100 % = 20 %.
= x 100 % = 16,7 %.
Nilai tersebut berarti masa pakai sepeda motor B dalam kondisi prima lebih seragam ( uniform ) bila dibandingkan dengan masa pakai kondisi prima sepeda motor A.

2. Tentukan koefisien variasi dari data tabel berikut :






Interval Kelas fi
97-103 4
104-110 8
11-117 15
118-124 35
125-131 25
132-138 6
139-145 4
146-152 3
100

Jawab :

Dari hasil perhitungan diperoleh :
dan .
Jadi, x 100% = 8,35%.

12.3. Cara Menghitung Ko-efisien Variasi Kuartil

Salah satu rumus yang paling sering digunakan adalah :
.

Bila nilai md tidak diperoleh, maka niali md dapat dicari dengan rumus : , sehingga rumus di atas menjadi :
.

Contoh 6.12.3. :

Dari contoh 6.3. soal nomor 2 :
Jika diberikan : = 3,46; = 6,29; = 10,95, maka

= .



















DAFTAR PUSTAKA



Dinoyudha. 2010. Statistika Deskriftif . http://osaliana.wordpress.com /category/ materi-perkuliahan/ di akses selasa 06-04-2010

Himasta. 2009. Statistika Deskriftif. http:// statistika/STATISTIKA DESKRIPTIF SCC HIMASTA.htm/ di akses 06-04-2010

Lesmoko, Agung. 2007. Statistika Deskriftif. http://www.teknokrat.ac.id/ di akses 02-04-2010

Soemartini. 2007. Pencilan (Outlier) jurusan Statistika. Universitas Padjajaran-Jatinangor

Tidak ada komentar:

Poskan Komentar