Jumat, 14 Juni 2013

Analisis Regresi Linier dengan SPSS


Pendahuluan

Regresi linier adalah langkah lanjut setelah korelasi. Analisis ini digunakan bila kita ingin memprediksi nilai suatu variabel berdasar pada nilai variabel lainnya. Variabel yang ingin kita prediksi nilainya disebut sebagi variabel terikat atau variabel bergantung (kadang-kadang disebut juga variabel outcome atau variabel capaian).  Variabel yang kita gunakan untuk memprediksi nilai variabel lain disebut variabel bebas (variabel independen, atau juga disebut sebagai variabel prediktor). Misalnya, kita dapat menggunakan regresi linier untuk memmahami apakah kinerja/nilai ujian dapat diprediksi berdasarkan banyaknya waktu yang tersedia untuk ujian atau panjang waktu jeda antara akhir semester dengan saat ujian, atau apakah konsumsi rokok dapat diprediksi berdasar pada durasi waktu merokok, dan sebagainya. Jika kita memiliki dua atau lebih variabel bebas, kita perlu menggunakan regresi ganda (multiple regression).
Untuk mulai menggunakan analisisi regresi, kita perlu memahami asumsi-asumsi yang harus dipenuhi oleh data agar regresi linier memberikan hasil yang valid atau dapat dipercaya.

Asumsi

Jika Anda memilih menganalisis data dengan menggunakan regresi linier, bagian dari proses itu meliputi pemeriksaan untuk memastikan data yang ingin Anda analisis benar-benar dapat dianalisis dengan menggunakan regresi linier. Anda perlu melakukan ini karena analisis regresi hanya tepat digunakan bila data yang Anda miliki lulus 6 persyaratan atau asumsi yang diperlukan untuk regresi linier agar dapat memberikan hasil yang valid. Dalam praktiknya, menguji 6 asumsi hanya menambah sedikit waktu saja, hanya beberapa kali klik tombol-tombol kerja SPSS, sama sekali bukan merupakan langkah yang sulit.
 
Asumsi #1
Kedua variabel yang akan Anda analisis harus merupakan variabel yang berskala atau berlevel interval atau  rasio (artinya, keduanya merupakan variabel kontinyu. Misalnya, waktu atau lamanya waktu libur menjelang ujian (diukur dalam satuan jam), inteligensi (diukur dengan skor IQ), kinerja atau skor ujian (diukur dengan nilai 0 – 100), bobot (diukur dalam kilogram), dan sebagainya.
 
Asumsi #2

Asumsi kedua adalah hubungan kedua variabel adalah hubungan yang linier. Ada banyak cara untuk memeriksa apakan hubungan kedua variabel linier atau tidak, meskipun demikian, dalam handout ini disarankan membuat scatterplot menggunakan SPSS. Scatterplot ayau plot sebaran dapat digunakan untuk memeriksa linieritas. Scatterplot data Anda mungkin terlihat seperti gambar berikut ini:


Jika hubungan yang ditunjukkan oleh scatterplot tidak linier, Anda harus menjalankan regresi non-linier atau melakukan transformasi terhadap data tersebut, yang bisa juga Anda lakukan dengan SPSS. Pada langkah lanjut nanti, akan ditunjukkan bagaimana : (a) membuat scatterplot untuk memeriksa linieritas bila akan melakukan regresi linier dengan SPSS, (b) menginterpretasi hasil scatterplot yang berbeda, dan (c) melakukan transformasi data menggunakan SPSS apabila tidak ada hubungan linier di antara dua variabel.
 
Asumsi #3
Harus tidak ada data pencilan (outlier) yang signifikan. Pencilan adalah satu data di dalam kelompok data yang tidak mengikuti pola yang umum. Misalnya, dalam studi mengenai skor IQ mahasiswa, dengan populasi 100 mahasiswa diperoleh rerata skor 108 dengan hanya variasi kecil antar mahasiswa, satu mahasiswa memiliki skor IQ=156, artinya sangat tidak biasa. Scatterplot berikut ini menunjukkan dampak potensial dari data pencilan.



Masalah yang ditimbulkan oleh data pencilan adalah adanya efek negatif pada persamaan regresi yang digunakan untuk memprediksi nilai variabel terikat atau variabel bergantung berdasar nilai variabel bebas (atau prediktor). Data pencilan ini akan mengubah keluaran yang dihasilkan SPSS dan mengurangi akurasi prediksi pada data Anda. Untungnya, bila menggunakan SPSS untuk menghitung regresi linier terhadap data Anda, dengan mudah Anda bisa memasukkan kriteria untuk membantu mendeteksi adanya data pencilan. Pada panduan lanjut mengenai regresi linier akan ditunjukkan (a) bagaimana mendeteksi data pencilan menggunakan “casewise diagnostics”, yang merupakan proses sederhana bila menggunakan SPSS, dan (b) mendiskusikan beberapa opsi yang Anda miliki untuk menangani data pencilan.
 
Asumsi #4
Anda harus memiliki independensi observasi, yang dengan mudah dapat diperiksa dengan statistika Durbin-Watson, yang merupakan tes sederhana untuk dilakkan dengan SPSS. Akan dijelaskan bagaimana memaknai hasil statistika Durbin-Watson dalam panduan lanjur menggunakan analisis regresi.
 
Asumsi #5
Data yang Anda miliki harus menunjukkan homokedastisitas (homocedasticity), yakni varians-varians sepanjang garis regresi terbaiknya tetap sama sepanjang garis. Perhatikan dua scatterplot berikut ini untuk memahami homokedastisitas. Data pada plot kiri adalah data yang memenuhi syarat homokedastisitas, sedangkan yang kanan tidak.


Saat menganalisis data Anda, akan sangat beruntung apabila scatterplotnya menyerupai salah satu dari gambar di atas. Data yang sebenarnya seringkali lebih berantakan. Meskipun demikian, dalam panduan lanjut akan dijelaskan: (a) beberapa hal yang perlu diperhatikan dalam memaknai data, dan (b) cara yang memungkinkan untuk melanjutkan analisis apabila data yang Anda miliki tidak memenuhi persyaratan di atas.
 
Asumsi #6
Terakhir, Anda perlu memeriksa bahwa residu (galat) pada kedua variabel yang dianalisis mendekati distribusi normal (masalah ini akan dijelaskan pada panduan lanjutnya). Dua metode yang berbeda untuk memeriksa asumsi ini termasuk di dalamnya menggunakan histogram (yang ditumpangtindihkan pada kurve normal) atau dengan menggunakan Normal P-P Plot. Dalam panduan lanjut akan ditunjukkan (a) bagaimana cara memeriksa asumsi ini dengan menggunakan SPSS, baik dengan cara menggunakan histogram yang ditumpangtindih dengan kurve normal atau dengan Normal P-P Plot, (b) penjelasan cara memaknai diagram tersebut, dan (c) memberikan solusi yang mungkin jika data Anda tidak memenuhi asumsi ini.
Anda dapat memeriksa asumsi #2, #3, #4, #5 dan #6 menggunakan SPSS. Asumsi #2 dan #3 harus diperiksa lebih dahulu sebelum memeriksa asumsi #4, #5, dan #6. Disarankan menguji asumsi-asumsi ini secara berurutan karena jika ada pemaksaan terhadap asumsi yang tidak dapat diperbaiki lagi, Anda tidak dapat lagi menggunakan regresi linier tunggal ini (meskipun Anda mungkin bisa melakukan analisis statistik lainnya).  Juga, periksa asumsi #4, #5, dan #6 pada saat bersamaan dengan prosedur regresi linier dalam SPSS, sehingga lebih mudah menangani ini setelah memeriksa asumsi #2 dan #3. Hanya perlu diingat bahwa jika Anda tidak menganalisis tanpa memenuhi asusmsi-asumsi tersebut, hasil yang Anda dapatkan tidak akan valid.  


1 komentar:

  1. transformasi untuk data yang non-linier menjadi linier menggunakan transformasi apa ya ? terima kasih

    BalasHapus