Pengantar
Regresi ganda adalah perluasan dari regresi linier sederhana. Analisis
regresi ganda digunakan apabila kita bermaksud memprediksi nilai suatu variabel
berdasar nilai dari dua atau lebih variabel lainnya. Variabel yang nilainya
kita prediksi disebut variabel terikat (kadang disebut variabel bergantung,
variabel dependen, variabel hasil, variabel kriteria, atau variabel target).
Variabel yang kita gunakan untuk memprediksi nilai variabel terikat disebut
variabel bebas (atau kadang-kadang disebut prediktor, variabel penjelas/explanatory, ata variabel regresor).
Misalnya, kita dapat menggunakan regresi ganda untuk memahami apakah nilai
ujian dipengaruhi oleh lamanya waktu belajar, kecemasan, kehadiran dosen dalam
perkuliahan, dan jenis kelamin. Kita juga dapat menggunakan regresi ganda untuk
memahami apakah konsumsi rokok harian dapat diprediksi berdasarkan durasi
merokok, umur mulai merokok, jenis perokok, pendapatan, dan jenis kelamin.
Regresi ganda juga memungkinkan kita menentukan mencocokkan model dan sumbangan/kontribusi
relatif masing-masing prediktor. Misalnya,
mungkin kita ingin mengetahui berapa banyak variasi dalam nilai ujian
dapat dijelaskan oleh lamanya waktu belajar, kecemasan, kehadiran dosen, dan
jenis kelamin mahasiswa, tetapi juga “sumbangan relatif” masing-masing variabel
bebas dalam menjelaskan varians.
Panduan ini menunjukkan pada Anda bagaimana melakukan analisis regresi
ganda menggunakan SPSS, menginterpretasi dan melaporkan hasilnya. Sebelum itu,
perlu dipahami mengenai asumsi-asumsi yang harus dipenuhi oleh data agar
analisis regresi memberikan hasil yang valid.
Asumsi
Bila Anda memilih menganalisis data Anda dengan regresi ganda, sebagian
dari proses analisis adalah untuk memastikan bahwa data yang akan Anda analisis
memang boleh dianalisis menggunakan regresi ganda. Anda perlu melalui tahapan
ini karena kita hanya dapat menggunakan regresi ganda apabila data yang
dianalisis memenuhi 8 asumsi yang diperlukan agar hasil analisisnya valid. Dengan
SPSS, uji asumsi itu dapat dilakukan hanya dengan melakukan beberapa klik
tombol.
Bukan hal yang mengejutkan apabila data yang Anda peroleh tidak bisa
memenuhi satu atau lebih syarat atau asumsi. Meskipun demikian, tidak perlu
khawatir. Meski data yang Anda peroleh tidak memenuhi asumsi tertentu, selalu
ada jalan keluar.
Delapan asumsi yang diperlukan untuk melakukan analisis regresi ganda
adalah:
- Asumsi #1: Vaiabel
terikat harus diukur dengan skala kontinyu yakni merupakan variabel interval
atau ratio). Contoh variabel yang memenuhi kriteria ini adalah waktu
belajar (diukur dalam jam), kecerdasan (diukur menggunakan skor IQ), nilai
ujian (diukur dengan angka 0 sampai 100), bobot atau berat badan (diukur
dalam kg), dan sebagainya.
- Asumsi #2: Anda memiliki
dua atau lebih variabel bebas, yang merupakan variabel kontinyu (misalnya, variabel interval
atau ratio) atau kategori (misalnya, variabel ordinal atau nominal).
Sebagai contoh variabel kontinyu, lihat penjelasan sebelumnya. Contoh
variabel ordinal meliputi skala Likert (misalnya skala 7-poin dari sangat setuju sampai sangat tidak setuju), perangkingan
(misalnya, skala 3-poin menjelaskan
tingkat ketertarikan konsumen pada produk tertentu, mulai dari "tidak
tertarik", "cukup
tertarik", sampai "sangat tertarikt"). Contoh variabel nominal misalnya jenis kelamin (pria dan wanita), etnis (misalnya:
Kaukasoid, Afro-Amerika dan Hispanik), tingkat aktivitas fisik (misalnya,
4 kelompok: diam, aktivitas rendah, aktivitas sedang dan aktivitas tinggi),
profesi paramedis (misalnya 5 kelompok: ahli bedah, dokter umum, perawat, dokter
gigi, terapis), dan sebagainya.
- Asumsi #3: Harus memiliki independensi observasi atau independence of observations
(yakni independence of residuals), yang dapat diperiksa dengan
mudah menggunakan statistika Durbin-Watson, yang dapat dilakukan dengan SPSS.
Akan dijelaskan bagaimana menginterpretasi hasil statistika Durbin-Watson.
- Asumsi #4: Harus ada hubungan linier antara (a) variabel terikat dengan masing-masing variabel bebas, dan (b) variabel terikat dengan vaiabel bebas secara kolektif. Ada beberapa cara untuk menguji linieritas hubungan, diantaranya dengan membuat scatterplots dan partial regression plots menggunakan SPSS, dan kemudian secara visual memeriksa kelinieran scatter plot atau partial
regession plot tersebut. Jika hubungannya tidak linier, Anda harus mempertimbangkan untuk menggunakan analisis regresi non-linier atau melakukan transformasi data Anda.
- Asumsi #5: Data Anda harus memenuhi syarat homoskedastisitas, yang cirinya adalah varians sepanjang garis-cocok (line of best fit) tetap sama. Ketika Anda menganalisis data Anda, Anda perlu membuat plot studentized
residuals terhadap unstandardized predicted values.
- Asumsi #6: Data Anda harus menunjukkan multikolineritas, yang terjadi bila Anda memiliki dua atau lebih variabel bebas yang berkorelasi tinggi satu sama lain. Ini akan menimbulkan masalah dalam memahami variabel bebas manakah yang berkontribusi kepada varians yang dijelaskan dalam variabel terikat.
- Asumsi #7: Harus tidak ada outlier (kadang disebut high leverage points, atau highly inflential points). Outliers, leverage dan influential point adalah istilah-istilah yang menggambarkan pengamatan terhadap data yang tampak tidak biasa. Masing-masing ketidakbiasaan itu memiliki dampak yang berbeda terhadap garis regresi. Data-data tidak biasa tersebut memiliki efek negatif terhadap persamaan regresi yang dihasilkan, padahal persamaan regresi merupakan alat utama untuk memprediksi nilai variabel terikat berdasar nilai-nilai pada variabel bebas.
- Asumsi #8: Terakhir, Anda perlu memeriksa bahwa residuals (errors) kira-kira berdistribusi normal. Dua metode umum untuk memeriksa asumsi ini adalah menggunakan (a) histogram (yang digambar berimpitan dengan kurva normal) dab Normal P-P
Plot; atau (b) a Normal Q-Q Plot dari studentized residuals.
Anda dapat menguji asumsi #3, #4, #5, #6, #7 dan #8 menggunakan SPSS. Asumsi #1 dan #2 harus diperiksa terlebih dahulu sebelum memeriksa asumsi #3, #4, #5, #6, #7 dan #8. Perlu diingat bahwa bila asumsi-asumsi tidak dipenuhi akan berakibat pada tidak validnya hasil analisis.
Contoh soal dan penyelesaian untuk regresi ganda silahkan unduh pada file berikut ini.