Memulai R : Menggambar Bidang dengan Fungsi Rect

Kali ini kita masih bermain dengan bidang dan kotak. Membuat kotak pada bidang plot, seperti barplot misalnya dapat menggunakan fungsi rect(). Fungsi ini memiliki parameter letak koordinat, warna kotak dan warna batas. Berikut ini contoh R Script sederhana menggunakan fungsi rect().

plot(0,0,type=”n”,xlim=c(-5,5),ylim=c(-5,5))
rect(-4,-4,4,4,col=”blue”,border=”black”)

Hasilnya disajikan seperti berikut ini :


Gambar 1. Contoh penggunaan fungsi rect()

Dengan membuat fungsi baru, kita dapat menyusun kotak sesuai dengan kebutuhan grafis visualisasi statistik kita. Sebagaimana dalam contoh berikut :


Gambar 2. Pengembangan fungsi rect() dengan membuat fungsi baru

Ide dari fungsi polygon() dan rect() dapat dikembangkan dengan menggunakan image. Tentu kita dapat memberikan sebuah soal kombinasi peluang sederhana dalam menyusun 2-4 motif tegel melalui permainan statistika dan grafis sederhana. Sebagaimana disajikan dalam gambar berikut.


Gambar 3. Menyusun ‘tegel’ motif

Selamat bermain bidang menggunakan R. (unung@enciety.com)

Memulai R : Menggambar Bidang dengan Fungsi Polygon

Fungsi polygon() di R cukup menarik dalam visualisasi data. Fungsi ini digunakan untuk membuat bidang dan batas. Polygon sebagai bidang dan batas biasa digunakan untuk menjelaskan area penolakan dalam sebuah distribusi normal, area titik potong dalam fungsi linear dan kuadratik dan sebagainya.

Berikut ini R Script dalam membangun bidang dengan fungsi polygon().

plot(0,0,type=”n”,xlim=c(-5,5),ylim=c(-5,5))
x < - c(0,4,2,-2,-4)
y <- c(-4,0,4,4,0)
polygon(x,y,col="blue",border="black")

Hasilnya disajikan seperti berikut ini :

Kita dapat menggunakan fungsi ini untuk membangun berbagai bidang sesuai dengan fungsi matematis yang kita buat. Berikut ini contoh penggunaan fungsi polygon.

Selamat bermain dengan bidang dan warna menggunakan R. (unung@enciety.com)

Outlier : Haruskah dipangkas ?

Dalam distribusi data mungkin kita akan menjumpai outlier, sebuah data yang jauh di atas atau di bawah nilai batas atas / nilai batas bawah rerata distribusi. Pada saat menemukan data outlier, ada dua kemungkinan awal yaitu data dihasilkan dari sebuah kesalahan pengukuran atau sebuah kejadian aktual yang harus diketahui penyebabnya. Dalam pengujian parametrik, tentu outlier ini akan mempengaruhi nilai ukuran kesetimbangan atau ukuran pemusatan yang terjadi. Penghitungan rerata (mean) untuk menghilangkan pengaruh outlier pun dilakukan seperti winsorized mean atau trimmed mean.

Bagaimana melakukan identifikasi terhadap outlier. Kita dapat melakukannya dengan bantuan visualisasi data. Scatter plot dan box plot cukup bagus menemukan data outlier.

Adanya outlier bukan sekedar dihilangkan sehingga data dapat di”uji” agar memenuhi asumsi normalitas. Namun ide dasar utama adalah menemukan adanya nilai data yang jauh di atas atau di bawah batas atas / batas bawah rerata distribusi tersebut. Sehingga dapat ditemukan solusi, tindakan atau kebijakan yang tepat. Bukan untuk memangkas atau menghilangkannya.

Pada kasus tertentu, memangkas atau menghilangkan outlier akan membuat kita ‘abai’ terhadap adanya outlier itu sendiri. Statistics hendaknya tetap harus memberikan tampilan yang utuh, sehingga outlier dapat diketahui dengan benar letak dan posisinya. Apabila terdapat outlier dalam data statistics kita, tentu tidak elok kita hanya memangkasnya. Karena kewajiban kita memberikan makna sehingga posisi itu mampu masuk dalam ruang distribusi normal yang ada. Khususnya untuk data outlier yang memiliki nilai jauh di bawah batas bawah rerata distribusi, sehingga minimal memiliki nilai sama dengan nilai batas bawah, sebagaimana diformulakan dalam winsorized mean. Namun tentu tidak semua jenis data dapat menggunakan gagasan ini. Bagaimana menurut Anda ? (unung@enciety.com)