Cleaning Data


Ayam berkokok tidak membangunkan pagiku lagi memang, karena kali ini aku sudah kembali ke Kota Padang setelah liburan idul fitri kemarin. Tapi kedatanganku ini bukan untuk kembali belajar pada semester baru, melainkan karena aku ikut SP (semester pendek) komputer.Jadi setelah bangun pagi, aku bersiap sholat dan langsung mandi dan tidak lupa menggosok gigi, seperti lagu anak-anak saja.

Setelah sarapan dan membersihkan kamar kosku, aku bersiap berangkat ke kampus bersama dua temanku yang lainnya yang kebetulan juga ikut SP ini. Karena kebetulan hari ini adalah hari ulang tahun negaraku, jadi kami berangkat setelah upacara di kampus diadakan. Dirgahayu Indonesiaku....

Saat memasuki labor, akupun memilih lokasi komputer yang lumayan strategis untuk memudahkanku memahi pelajaran kali ini. Yap, tepat di meja bertuliskan nomor 09 disanalah aku duduk. Materi kami kali ini berhubungan dengan pengolahan data dengan menggunakan SPSS.

Dimulai dari menggabungkan data yang telah dikumpulkan menggunakan Epidata, dengan cara klik menu Data in/out-append/merge-pilih data yang dua data yang akan digabungkan-Beri nama hasil gabungan begitu seterusnya hingga semua data terkumpul.

Setelah itu dilanjutkan dengan mengexport data ke SPSS yang jumlah record datanya berjumlah 82.034.  Record data yang telah diexport tadi dibuka di SPSS dengan klik
File- open - Syntax record data terakhir.

Setelah data dibuka, kami ditugaskan untuk cleaning data kategorik. Cleaning data kategorik ini tidak akan memusingkan kita, karena cukup mudah untuk diaplikasikan. Caranya
Klik menu Analyze - Descriptive statistic - frequencies - masukan variabel kategorik yang akan di cleaning seperti Pendidikan Formal ibu - Ok. Setelah didapati data yang missing maka kita klik kanan lalu Clear.

Setelah variabel kategorik yang dibutuhkan di-cleaning, maka kamipun melanjutkan ke cleaning data numerik. Dari data numerik ini, kita pilih variabel numerik yang akan di cleaning contohnya BB Ibu yang rentangnya 40-70 maka kita mulai dengan Klik Menu Data - Sort Casses - masukan variabel BB Ibu - Ascending - OK. Maka akan didapat record data yang tidak sesuai dengan rentang penelitian yang kecil dfari 40 . Clear data yang tidak sesuai tersebut. Lanjutkan langkah diatas dengan mengganti Ascending menjadi Descending, maka varaiabel BB yang lebih dari 70 akan tersortir. Clear data variabel yang lebih dari 70.

Waktunya kami masuk untuk meng-cleaning data logika. Dapat dimisalkan dengan variabel Pemeriksaan Kehamilan dengan variabel Frekuensi Pemeriksaan Kehamilan. Jika jumlah frekuensinya lebih besar daripada yang mengaku pernah memeriksakan kehamilan, berarti ada yang tidak pernah memeriksakan kehamilan tapi memberikan frekuensi pemeriksaan kehamilan.



Cara mengetahuinya adalah dengan mensort cases dua data field secara bersamaan. Yaitu dengan sort cases – masukkan dua variabel- sort field pernah dengan sort decsending agar yang tidak pernah memeriksakan kehamilan terletak di atas dan semua yang tidak pernah harusnya kalinya missing, agar yang tidak pernah tapi memberikan data kali di atas sort order field kali dengan sort decsending juga – Ok.
Perintahnya Data-sort cases – pernah decsending – dan kali decsending – OK delete recode missing.
 

Komentar

Postingan populer dari blog ini

DAMPAK PAKAIAN KETAT TERHADAP KESEHATAN

Berat Lahir, Pertumbuhan Postnatal, dan Usia pada Menarche