Statistika Deskriptif
Statistika deskriptif adalah sebuah cabang ilmu statistika yang berkaitan dengan pengelolaan data, peringkasan data, dan visualisasi data. Artinya dengan statistika deskriptif dapat diperoleh gambaran informasi data, yang mana akan memudahkan pemahaman kita tentang data. Secara umum ada 3 cara untuk mendeskripsikan data, yaitu :
- Measure of Central Tendency
- Measure of Variability
- Measure of Position
Measure of Central Tendency
Measure of Central Tendency adalah pengukuran aritmatik yang digunakan untuk merepresentasikan suatu nilai yang mewakili nilai pusat atau nilai sentral dari suatu himpunan data. Adapun tiga jenis pengukuran yang sering digunakan.
- Mean : Mean dapat didefinisikan sebagai rasio jumlah seluruh data hasil pengamatan terhadap banyaknya data. Mean juga sering dikenal sebagai rata-rata.
- Median : Median adalah titik tengah dari himpunan data yang telah diurutkan. Untuk himpunan data dengan jumlah entri ganjil, nilai median dapat diperoleh dari nilai yang tepat berada di tengah. Untuk himpunan data dengan jumlah entri genap, nilai median diperoleh dari rerata dua nilai yang berada di tengah
- Mode : Mode atau modus adalah nilai yang paling sering muncul dalam suatu himpunan data. Dalam suatu himpunan data bisa saja terdapat lebih dari satu mode, disebut dengan multi-mode. Dan dalam suatu himpunan data bisa juga tidak memiliki mode, ketika frekuensi kemunculan setiap datanya sama.
Berikut adalah contoh perhitungan Measure of Centreal Tendency dengan himpunan data x = {13, 17, 10, 15, 19, 17, 11, 21}.
- Mean - berikut perhitungan rata-rata himpunan data
- Median - dalam menghitung median, pertama kita urutkan terlebih dulu. x = {10, 11, 13, 15, 17, 17, 19, 21}, karena jumlah himpunan data genap, maka median diperoleh dari rerata dua nilai tengah.
- Mode - Dalam hal ini nilai mode adalah 17, karena merupakan nilai yang paling sering muncul, yaitu sebanyak 2 kali.
Measure of Variability (atau Dispersion)
Measure of Variability adalah suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan keberagaman atau sebaran data.
- Range : Range adalah selisih antara nilai Maksimum dan nilai Minimum dalam himpunan data.
- Variance : Variance menyatakan seberapa jauh titik persebaran data terhadap mean. Semakin tinggi nilai variance maka titik persebaran data semakin luas, sedangkan semakin kecil nilai variance maka titik persebaran data semakin dekat atau sempit.
- Standard Deviation : Standard deviasi merupakan akar kuadrat dari variance. Standard Deviasi dapat digunakan untuk membandingkan keberagaman/sebaran data antar himpunan data yang memiliki satuan pengukuran yang sama dengan nilai mean yang mirip.
- Coefficient of Variation : Coefficent of Variation dapat digunakan untuk membandingkan suatu distribusi data yang mempunyai satuan yang berbeda atau nilai mean yang jauh berbeda.
Measure of Position
Measure of Position adalah suatu pengukuran nilai yang digunakan untuk menentukan posisi relatif dari suatu entri data (data point) pada himpunan data.
- Quartile : Quartile adalah nilai yang membagi suatu himpunan data yang telah diurutkan menjadi 4 bagian yang sama.
- Interquartile Range (IQR) : IQR merupakan selisih nilai dari nilai quartile ketiga dengan quartile pertama. Dengan IQR bisa kita ketahui data mana pada suatu himpunan data yang termasuk sebagai outlier. Data termasuk outlier apabila lebih kecil dari batas bawah atau lebih besar dari batas atas.
- Percentile : Percentile adalah nilai yang membagi suatu himpunan data yang telah diurutkan menjadi 100 bagian yang sama. Nilai percentile tersebut berjumlah 99, mulai dari P1 hingga P99. Dalam percentile data termasuk outlier apabila lebih kecil dari P5 atau lebih besar dari P95.
- Standard Score : Standard score merupakan representasi nilai simpangan suatu entri data terhadap mean dari dataset yang diukur berdasarkan standard deviation.