Pendahuluan
Regresi linier adalah langkah lanjut setelah korelasi.
Analisis ini digunakan bila kita ingin memprediksi nilai suatu variabel
berdasar pada nilai variabel lainnya. Variabel yang ingin kita prediksi
nilainya disebut sebagi variabel terikat atau variabel bergantung
(kadang-kadang disebut juga variabel outcome
atau variabel capaian). Variabel yang
kita gunakan untuk memprediksi nilai variabel lain disebut variabel bebas
(variabel independen, atau juga disebut sebagai variabel prediktor). Misalnya,
kita dapat menggunakan regresi linier untuk memmahami apakah kinerja/nilai
ujian dapat diprediksi berdasarkan banyaknya waktu yang tersedia untuk ujian
atau panjang waktu jeda antara akhir semester dengan saat ujian, atau apakah
konsumsi rokok dapat diprediksi berdasar pada durasi waktu merokok, dan
sebagainya. Jika kita memiliki dua atau lebih variabel bebas, kita perlu
menggunakan regresi ganda (multiple
regression).
Untuk mulai menggunakan analisisi regresi, kita perlu
memahami asumsi-asumsi yang harus dipenuhi oleh data agar regresi linier
memberikan hasil yang valid atau dapat dipercaya.
Asumsi
Jika Anda memilih menganalisis data dengan menggunakan
regresi linier, bagian dari proses itu meliputi pemeriksaan untuk memastikan
data yang ingin Anda analisis benar-benar dapat dianalisis dengan menggunakan
regresi linier. Anda perlu melakukan ini karena analisis regresi hanya tepat
digunakan bila data yang Anda miliki lulus 6 persyaratan atau asumsi yang
diperlukan untuk regresi linier agar dapat memberikan hasil yang valid. Dalam
praktiknya, menguji 6 asumsi hanya menambah sedikit waktu saja, hanya beberapa
kali klik tombol-tombol kerja SPSS, sama sekali bukan merupakan langkah yang
sulit.
Asumsi #1
Kedua variabel yang akan Anda analisis harus merupakan
variabel yang berskala atau berlevel interval atau rasio (artinya, keduanya merupakan variabel
kontinyu. Misalnya, waktu atau lamanya waktu libur menjelang ujian (diukur
dalam satuan jam), inteligensi (diukur dengan skor IQ), kinerja atau skor ujian
(diukur dengan nilai 0 – 100), bobot (diukur dalam kilogram), dan sebagainya.
Asumsi #2
Asumsi kedua adalah hubungan kedua variabel adalah hubungan
yang linier. Ada banyak cara untuk memeriksa apakan hubungan kedua variabel
linier atau tidak, meskipun demikian, dalam handout
ini disarankan membuat scatterplot
menggunakan SPSS. Scatterplot ayau plot sebaran dapat digunakan untuk memeriksa
linieritas. Scatterplot data Anda mungkin terlihat seperti gambar berikut ini:
Jika hubungan yang ditunjukkan oleh scatterplot tidak linier,
Anda harus menjalankan regresi non-linier atau melakukan transformasi terhadap
data tersebut, yang bisa juga Anda lakukan dengan SPSS. Pada langkah lanjut
nanti, akan ditunjukkan bagaimana : (a) membuat scatterplot untuk memeriksa
linieritas bila akan melakukan regresi linier dengan SPSS, (b) menginterpretasi
hasil scatterplot yang berbeda, dan (c) melakukan transformasi data menggunakan
SPSS apabila tidak ada hubungan linier di antara dua variabel.
Asumsi #3
Harus tidak ada data pencilan (outlier) yang signifikan. Pencilan adalah satu data di dalam
kelompok data yang tidak mengikuti pola yang umum. Misalnya, dalam studi
mengenai skor IQ mahasiswa, dengan populasi 100 mahasiswa diperoleh rerata skor
108 dengan hanya variasi kecil antar mahasiswa, satu mahasiswa memiliki skor
IQ=156, artinya sangat tidak biasa. Scatterplot berikut ini menunjukkan dampak
potensial dari data pencilan.
Masalah yang ditimbulkan oleh data pencilan adalah adanya
efek negatif pada persamaan regresi yang digunakan untuk memprediksi nilai
variabel terikat atau variabel bergantung berdasar nilai variabel bebas (atau
prediktor). Data pencilan ini akan mengubah keluaran yang dihasilkan SPSS dan
mengurangi akurasi prediksi pada data Anda. Untungnya, bila menggunakan SPSS
untuk menghitung regresi linier terhadap data Anda, dengan mudah Anda bisa
memasukkan kriteria untuk membantu mendeteksi adanya data pencilan. Pada
panduan lanjut mengenai regresi linier akan ditunjukkan (a) bagaimana mendeteksi
data pencilan menggunakan “casewise diagnostics”, yang merupakan proses
sederhana bila menggunakan SPSS, dan (b) mendiskusikan beberapa opsi yang Anda
miliki untuk menangani data pencilan.
Asumsi #4
Anda harus memiliki independensi observasi, yang dengan
mudah dapat diperiksa dengan statistika Durbin-Watson, yang merupakan tes
sederhana untuk dilakkan dengan SPSS. Akan dijelaskan bagaimana memaknai hasil
statistika Durbin-Watson dalam panduan lanjur menggunakan analisis regresi.
Asumsi #5
Data yang Anda miliki harus menunjukkan homokedastisitas (homocedasticity), yakni varians-varians
sepanjang garis regresi terbaiknya tetap sama sepanjang garis. Perhatikan dua
scatterplot berikut ini untuk memahami homokedastisitas. Data pada plot kiri
adalah data yang memenuhi syarat homokedastisitas, sedangkan yang kanan tidak.
Saat menganalisis data Anda, akan sangat beruntung apabila
scatterplotnya menyerupai salah satu dari gambar di atas. Data yang sebenarnya
seringkali lebih berantakan. Meskipun demikian, dalam panduan lanjut akan
dijelaskan: (a) beberapa hal yang perlu diperhatikan dalam memaknai data, dan
(b) cara yang memungkinkan untuk melanjutkan analisis apabila data yang Anda
miliki tidak memenuhi persyaratan di atas.
Asumsi #6
Terakhir, Anda perlu memeriksa bahwa residu (galat) pada
kedua variabel yang dianalisis mendekati distribusi normal (masalah ini akan
dijelaskan pada panduan lanjutnya). Dua metode yang berbeda untuk memeriksa
asumsi ini termasuk di dalamnya menggunakan histogram (yang ditumpangtindihkan pada
kurve normal) atau dengan menggunakan Normal P-P Plot. Dalam panduan lanjut
akan ditunjukkan (a) bagaimana cara memeriksa asumsi ini dengan menggunakan
SPSS, baik dengan cara menggunakan histogram yang ditumpangtindih dengan kurve
normal atau dengan Normal P-P Plot, (b) penjelasan cara memaknai diagram
tersebut, dan (c) memberikan solusi yang mungkin jika data Anda tidak memenuhi
asumsi ini.
Anda dapat memeriksa asumsi #2, #3, #4, #5 dan #6
menggunakan SPSS. Asumsi #2 dan #3 harus diperiksa lebih dahulu sebelum
memeriksa asumsi #4, #5, dan #6. Disarankan menguji asumsi-asumsi ini secara
berurutan karena jika ada pemaksaan terhadap asumsi yang tidak dapat diperbaiki
lagi, Anda tidak dapat lagi menggunakan regresi linier tunggal ini (meskipun
Anda mungkin bisa melakukan analisis statistik lainnya). Juga, periksa asumsi #4, #5, dan #6 pada saat
bersamaan dengan prosedur regresi linier dalam SPSS, sehingga lebih mudah
menangani ini setelah memeriksa asumsi #2 dan #3. Hanya perlu diingat bahwa
jika Anda tidak menganalisis tanpa memenuhi asusmsi-asumsi tersebut, hasil yang
Anda dapatkan tidak akan valid.
Contoh analisis regresi sederhana dapat diunduh dari tautan berikut ini.
transformasi untuk data yang non-linier menjadi linier menggunakan transformasi apa ya ? terima kasih
BalasHapus