Apakah Variabel Kategorik Dapat Dimasukkan dalam Persamaan Regresi Linier Berganda?
Kamu mungkin sebelumnya pernah membaca teori analisis regresi linear berganda. Pada teori tersebut kamu akan menemukan bahwa regresi linear berganda merupakan salah satu uji asosiatif yang bertujuan untuk mengetahui pengaruh lebih dari dua variabel bebas terhadap satu variabel terikat.
Analisis regresi linear berganda yang sering kita gunakan, umumnya menggunakan metode kuadrat terkecil. Agar diperoleh hasil estimasi yang konsisten dan tidak bias, maka kamu perlu melakukan serangkaian uji asumsi yang dipersyaratkan pada uji regresi tersebut. Tentunya agar kamu dapat memenuhi sejumlah asumsi tersebut, maka skala pengukuran data sebaiknya minimal menggunakan skala data interval atau skala data rasio.
Namun muncul pertanyaan, Bagaimana kalau kita memasukkan variabel kategorik dalam persamaan regresi, apakah hal ini benar dan boleh dilakukan? Selanjutnya, apakah dengan kehadiran variabel kategorik dalam persamaan regresi linear tersebut akan mengganggu pada pemenuhan uji asumsi yang dipersyaratkan? Oke, pada artikel ini saya akan menulis mengenai bagaimana jika kita memasukkan variabel kategori dalam persamaan regresi linear berganda.
Teori Regresi Linier Berganda
Sebelum kita membahas lebih lanjut alangkah lebih baiknya kita memahami dulu mengenai teori dasar analisis regresi linier berganda. Seperti sudah kita ketahui bersama bahwa dalam analisis regresi linier itu terdapat dua jenis variabel yaitu variabel dependen (variabel terikat) dan variabel independen (variabel bebas).
Perbedaan diantara keduanya yaitu bahwa variabel terikat merupakan variabel yang dipengaruhi dan sering dinotasikan dengan variabel Y. Adapun variabel bebas merupakan variabel yang mempengaruhi dan sering dinotasikan dengan variabel X.
Selanjutnya, kenapa kita menyebut regresi linear berganda? Hal ini disebabkan karena jumlah variabel bebas yang digunakan untuk menyusun persamaan regresi minimal terdiri dari dua variabel. Misalkan kita menyusun persamaan regresi linear berganda dengan dua variabel bebas maka persamaannya dapat disusun sebagai berikut:
Y = b0 + b1X1 + b2X2 + e
Di sini kita melihat bahwa b0 menunjukkan nilai intersep, selanjutnya b1 dan b2 menunjukkan koefisien regresi dari variabel X1 dan variabel X2. Adapun e merupakan galat yang menampung variabel-variabel lain yang diduga mempengaruhi variabel Y namun tidak dimasukkan ke dalam persamaan regresi linear berganda.
Uji asumsi klasik dalam regresi linier berganda
Seperti yang sudah saya sampaikan di awal artikel ini, bahwa untuk memperoleh hasil estimasi yang konsisten dan tidak bias, maka kita perlu memenuhi serangkaian asumsi yang dipersyaratkan. Uji asumsi ini sering disebut dengan uji asumsi klasik atau uji asumsi Gauss Markov. Lalu mungkin kamu akan bertanya uji asumsi apa saja yang harus kita lakukan dalam menganalisis regresi linear berganda?
Kalau kamu merujuk pada buku teori dasar ekonometrika yang ditulis oleh Koutsoyiannis (1977), sebetulnya ada sekitar 14 asumsi agar diperoleh Best Linear Unbiassed Estimator. Namun demikian, untuk memenuhi asumsi tersebut, kalau kita sudah melakukan 4 sampai 5 uji asumsi maka asumsi yang lain umumnya akan terpenuhi.
Kalau kamu melakukan penelitian menggunakan data survei maka uji asumsi yang setidaknya wajib kamu kerjakan yaitu uji normalitas, uji heteroskedastisitas, uji multikolinearitas, dan uji linearitas. Adapun kalau kamu menggunakan data sekunder berupa data time series maka dari keempat uji tersebut, maka kamu perlu menambahkan uji autokorelasi.
Kamu perlu memastikan asumsi-asumsi yang dipersyaratkan pada regresi linier tersebut dapat terpenuhi. Lalu kamu akan bertanya, bagaimana cara melakukan analisis dan cara interpretasi dari semua uji asumsi tersebut? Jangan khawatir, Saya telah banyak membuat video tutorial mengenai uji asumsi dan cara interpretasinya di video YouTube "KANDA DATA".
Variabel Kategorik Dalam Analisis Regresi Linier
Pada judul artikel ini saya menuliskan bahwa Apakah variabel kategori dapat dimasukkan ke dalam persamaan regresi linear berganda? Kalau kita meninjau kembali materi pelajaran statistika, maka kita akan mengingat-ingat mengenai skala pengukuran data.
Pemahaman mengenai skala pengukuran data ini sangat penting karena akan menentukan pilihan uji statistik yang tepat sesuai dengan skala pengukuran data dari variabel yang kita gunakan. Skala pengukuran data dalam statistik dapat dibagi menjadi skala data nominal, skala data ordinal, skala data interval, dan skala data rasio.
Umumnya variabel yang diukur menggunakan skala interval dan skala rasio lebih berpotensi untuk memenuhi uji asumsi klasik. Namun demikian, bagaimana kalau kita ingin memasukkan satu variabel kategorik yang berskala nominal pada persamaan regresi linear berganda?
Contoh sederhananya seperti ini, misalkan kita melakukan analisis regresi linear berganda menggunakan data time series yang bertujuan untuk mengetahui pengaruh luas lahan dan modal terhadap produksi padi domestik. Pada persamaan regresi ini, peneliti ingin juga mengetahui bagaimana dampak kebijakan kenaikan tarif impor terhadap produksi padi domestik.
Dari data time series yang dikumpulkan dari tahun 2000 sampai 2024 di misalkan mulai tahun 2015 ada kebijakan peningkatan tarif impor. Lalu kita ingin mengetahui bagaimana dampaknya terhadap produksi domestik. Maka kita bisa membuat variabel kategorik meliputi kondisi eksisting dan kebijakan setelah kenaikan tarif impor.
Variabel kategorik skala nominal ini dapat kita jadikan sebagai variabel dummy untuk kita masukkan dalam persamaan regresi linier berganda. Setelah kita tambahkan variabel dummy, maka persamaan regresi linier yang telah kita susun sebelumnya berubah menjadi sebagai berikut:
Y = b0 + b1X1 + b2X2 + b3D + e
Berdasarkan persamaan di atas, kita telah menambahkan variabel dummy yang kita masukkan bersamaan dengan variabel bebas yang lain. Selanjutnya kamu bisa melakukan serangkaian uji asumsi klasik telah kita menambahkan variabel Kategorik (dummy biner).
Teknik pemberian skor pada variabel kategorik
Kamu mungkin akan bertanya, setelah kita menentukan variabel kategorik biner, lalu Bagaimana teknik pemberian skornya? Pada prinsipnya pemberian skor pada variabel kategorik ini kita hanya perlu memberikan skor 0 dan skor 1.
Variabel kategorik yang diberi skor 1 sebaiknya kita berikan pada variabel yang sesuai dengan yang kita hipotesiskan agar cara interpretasinya lebih mudah. Contohnya pada yang telah saya sampaikan sebelumnya, misal di hipotesiskan dengan adanya kenaikan tarif impor maka akan meningkatkan produksi padi domestik, maka teknik scoringnya adalah kondisi eksisting diberikan skor 0 dan setelah terjadi kenaikan tarif impor diberikan skor 1. Hal ini akan memudahkan kita dalam melakukan interpretasi hasilnya mengenai bagaimana dampak kenaikan tarif impor terhadap produksi padi domestik.
Baik, ini artikel yang dapat saya tulis pada kesempatan ini. Semoga bermanfaat dan memberikan wawasan tambahan bagi kamu yang sedang mempertimbangkan untuk menambahkan variabel kategorik dalam persamaan regresi linear berganda metode kuadrat terkecil. Terima kasih atas perhatiannya, tunggu update artikel berikutnya dari priyono.id di pekan berikutnya.
Posting Komentar untuk "Apakah Variabel Kategorik Dapat Dimasukkan dalam Persamaan Regresi Linier Berganda? "