Archive for the ‘Data & Statistics’ Category

Outlier : Haruskah dipangkas ?

Dalam distribusi data mungkin kita akan menjumpai outlier, sebuah data yang jauh di atas atau di bawah nilai batas atas / nilai batas bawah rerata distribusi. Pada saat menemukan data outlier, ada dua kemungkinan awal yaitu data dihasilkan dari sebuah kesalahan pengukuran atau sebuah kejadian aktual yang harus diketahui penyebabnya. Dalam pengujian parametrik, tentu outlier ini akan mempengaruhi nilai ukuran kesetimbangan atau ukuran pemusatan yang terjadi. Penghitungan rerata (mean) untuk menghilangkan pengaruh outlier pun dilakukan seperti winsorized mean atau trimmed mean.

Bagaimana melakukan identifikasi terhadap outlier. Kita dapat melakukannya dengan bantuan visualisasi data. Scatter plot dan box plot cukup bagus menemukan data outlier.

Adanya outlier bukan sekedar dihilangkan sehingga data dapat di”uji” agar memenuhi asumsi normalitas. Namun ide dasar utama adalah menemukan adanya nilai data yang jauh di atas atau di bawah batas atas / batas bawah rerata distribusi tersebut. Sehingga dapat ditemukan solusi, tindakan atau kebijakan yang tepat. Bukan untuk memangkas atau menghilangkannya.

Pada kasus tertentu, memangkas atau menghilangkan outlier akan membuat kita ‘abai’ terhadap adanya outlier itu sendiri. Statistics hendaknya tetap harus memberikan tampilan yang utuh, sehingga outlier dapat diketahui dengan benar letak dan posisinya. Apabila terdapat outlier dalam data statistics kita, tentu tidak elok kita hanya memangkasnya. Karena kewajiban kita memberikan makna sehingga posisi itu mampu masuk dalam ruang distribusi normal yang ada. Khususnya untuk data outlier yang memiliki nilai jauh di bawah batas bawah rerata distribusi, sehingga minimal memiliki nilai sama dengan nilai batas bawah, sebagaimana diformulakan dalam winsorized mean. Namun tentu tidak semua jenis data dapat menggunakan gagasan ini. Bagaimana menurut Anda ? (unung@enciety.com)

ENCIETY – Data Management & Services

Keterlibatan data dan pengolahan sistem informasi yang cepat dan tepat merupakan kebutuhan bagi industri, dunia usaha dan lembaga pemerintahan dalam mengembangkan strategi bisnis-nya dan dalam upaya peningkatan kualitas pelayanan kepada masyarakat. Integrasi sistem yang menghubungkan antar bagian dan melakukan upaya dalam “penyelamatan” aset informasi bagi dunia usaha dan lembaga pemerintahan merupakan satu hal yang menjadi titik utama, selain pada pengembangan kompetensi dunia usaha dan lembaga pemerintahan itu sendiri.

Dalam rangka mempersiapkan manajemen data yang mampu memberikan dukungan terhadap proses pengambilan keputusan / pengambilan strategi dan fungsi perencanaan maka diperlukan model pengembangan yang terintegrasi dengan dukungan teknologi informasi.

Pengembangan sistem yang terintegrasi antar bagian tersebut merupakan alternatif dalam memberikan solusi dalam dunia bisnis dan lembaga pemerintahan. Pengembangan sistem ini diawali dengan menerapkan pola baru dalam dunia pengembangan teknologi informas yang berbasiskan Object Oriented Design and Analysis dan Aspect Oriented Design and Analysis. Pembuatan pola-pola rancangan sistem, khususnya manajemen data yang dapat reusable merupakan pilihan yang terbaik sehingga dokumentasi sistem menjadi hal utama.

Enciety – Data Management & Services

Strategi pengembangan Enciety – Data Management & Services ini diawali dengan melakukan pemetaan user requirement atau kebutuhan dasar bagi dunia usaha dan lembaga pemerintahan dalam usaha pengembangan sistem informasi-nya.

Case Study

Model user requirement manajemen data secara mudah dapat digambarkan dalam Model 1.

Berdasarkan Model 1 tersebut dapat dirinci secara detail kebutuhan user, yang meliputi pada bagaimana melakukan identifikasi data, melakukan sistem pengolahan terstruktur, pengembangan model pengambilan keputusan berdasarkan data warehouse, kemampuan integrasi sistem, sistem pengelompokan / kategorisasi informasi dan layanan informasi terpadu.

Detail user requirement tersebut dapat digunakan untuk menggambarkan bagaimana struktur kebutuhan dan sistem yang akan dibangun dalam manajemen data dan services.

Meta model proses bisnis dari manajemen data dan services dapat digambarkan dalam Model 2.


Inspirasi

Akhirnya bagaimana problem data dan informasi ini dapat menjadi inspirasi dan pencerahan dalam mempersiapkan strategi dan perencanaan yang lebih baik di masa mendatang. Tentunya, dengan prasyarat, ketersediaan sumber daya manusia yang kompeten, kelengkapan perangkat lunak dan yang tak kalah penting adalah sebuah niatan awal untuk membangun data dan informasi dengan lebih bijak dan cerdas.

Oleh : Unung Istopo H, SSi

R – Membuat Statistik semakin Menarik

Seri Pembahasan Aplikasi Statistik Berbasis R

Memulai sesuatu yang baru dan lain dari yang biasa kita lakukan
adalah sesuatu yang sulit.
Namun alangkah terkejutnya kita ketika mengetahui
bahwa keseriusan dan ketekunan itu membuahkan hasil yang sangat signifikan ke arah perubahan yang lebih baik di masa depan.
Mencoba dan benar adalah sangat baik,
namun mencoba dan salah adalah lebih baik daripada kita tidak pernah melakukan kesalahan karena tidak pernah berbuat.

Ada perbincangan yang cukup menarik pada Juni 2004 di milis R, yaitu ada seorang konsultan di Selandia Baru, yang joint research dengan konsultan lain untuk memberikan presentasi tentang DSS kepada para pengusaha property dan finance. Konsultan pertama, cewek, ia kebagian mempresentasikan model pengambilan keputusan di property dengan menggunakan R, dan ia dapat sambutan yang cukup meriah. Konsultan kedua kemudian kebagian yang di Finance, asyiknya karena ia belum pernah menggunakan R dan masih sering menggunakan SPSS, ia bingung musti dengan cara apa membuat orang Finance ngeh / paham dengan R hanya dengan waktu 1-2 menit .Milis yang bertajuk “How to Describe R to Finance People” inipun mendapat tanggapan yang cukup meriah dari members.Menariknya di sono orang terbiasa diskusi dan memberikan ide tentang bagaimana kita mampu membuat orang lain yang sebelumnya tidak paham menjadi mengerti, kenal dan mau mencoba dalam waktu yang singkat.

Itulah sedikit sekelumit cerita tentang perkembangan ilmu statistik dan aplikasi yang menyertainya.

Artikel ini akan secara bertahap membahas tentang bagaimana kita mampu melakukan pengolahan data dan analisis statistik dengan menggunakan R.

Tingginya tuntutan inovasi dalam analisis data yang mencoba menyajikan visualisasi grafik dalam bentuk yang mudah dipahami membawa konsekuensi logis pada ketepatan kita memilih aplikasi pengolahan data yang sesuai. Tingginya pula kolaborasi antara ICT dan statistik semakin membuat ilmu ini menarik untuk diikuti dan dikuasai, apalagi Data Mining Based DSS sudah menjadi keniscayaan.

Terlepas dari itu, artikel sederhana ini akan mencoba secara berurutan memandu bagaimana pengolahan data statistik itu dapat dikerjakan dengan mudah dan disajikan dengan indah, semudah kita ber YM dan ber chat-ria.

Salam,

Unung Istopo
Yahoo!: unung95

Download Artikel