Memahami Interpretasi Koefisien Determinasi (R Square) pada Regresi Linier Metode OLS
Sudah bukan rahasia umum jika analisis regresi linier metode ordinary least square (OLS) sering digunakan oleh peneliti. Melalui analisis regresi linier, peneliti dapat mengelaborasi pengaruh suatu variabel terhadap variabel yang lain.
Dalam analisis regresi linier terdiri dari variabel bebas (variabel independent) dan variabel terikat (variabel dependent). Jumlah variabel bebas akan menentukan apakah yang kita gunakan itu regresi linear sederhana atau regresi linier berganda.
Pada regresi linear sederhana hanya terdiri dari satu variabel bebas dan satu variabel terikat. Sementara itu, untuk linier berganda terdiri dari minimal dua variabel bebas dan satu variabel terikat.
Uji asumsi klasik regresi linear metode OLS
Seperti yang sudah kita ketahui bersama bahwa untuk regresi linier metode OLS, uji asumsi klasik perlu dilakukan oleh peneliti. Mengapa peneliti perlu melakukan uji asumsi klasik?
Uji asumsi klasik ditujukan untuk menghasilkan best linear unbiassed estimator. Kalau dengan bahasa mudahnya yaitu untuk memastikan bahwa hasil estimasi tidak bias dan konsisten.
Kemudian, uji asumsi klasik apa saja yang perlu lakukan? Ada beberapa uji asumsi klasik yang perlu dilakukan peneliti untuk menghasilkan best linear unbiassed estimator.
Uji asumsi klasik tersebut diantaranya uji heteroskedastisitas, normalitas, linieritas, multikolinearitas, dan autokorelasi. Perlu diketahui bahwa tidak semua model menggunakan uji asumsi klasik yang telah saya sebutkan tadi.
Contohnya ketika kita menggunakan persamaan regresi linear sederhana, kita tidak perlu melakukan uji multikolinearitas. Mengapa? Karena uji multikolinearitas itu dilakukan untuk mengetahui apakah ada korelasi yang sangat kuat antar variabel bebas.
Dengan demikian, uji multikolinearitas dilakukan pada persamaan regresi linier berganda. Selain itu, untuk uji autokorelasi juga tidak dilakukan pada semua model.
Penelitian yang menggunakan data time series perlu melakikan uji autokorelasi, sebaliknya untuk data cross section tidak perlu dilakukan uji autokorelasi. Apakah anda sudah tahu perbedaan data time series dan data cross section?
Perbedaan data time series dan cross section
Data time series merupakan data runtun waktu. Data ini umumnya diperoleh dari data sekunder, misalnya dari lembaga penyedia data pemerintah.
Ciri khas data time series yaitu terdiri dari beberapa periode waktu. Periode waktu ini bisa tahunan, bulanan, mingguan, bahkan harian. Misalnya seorang peneliti mengamati konsumsi beras penduduk Indonesia dari tahun 1990 sampai 2022.
Ini merupakan contoh dari data time series. Contoh lainnya yaitu data harga daging ayam 1 tahun terakhir, ini juga dinamakan dengan data time series.
Sampai sini sudah paham kan apa itu data time series? Baik kita sekarang bedakan dengan data cross section. Untuk data cross section ini sering disebut dengan data kerat lintang.
Data cross section ini umumnya dapat kita peroleh langsung dari lapang. Sumber data cross section diperoleh dari data primer. Untuk memperoleh data primer, kita harus turun ke lapang melakukan wawancara, observasi, dan penggalian data.
Contohnya yaitu data pendapatan petani yang dikumpulkan dari 100 orang petani anggota KUD Tani Makmur. Disini kita melihat bahwa pada data cross section menggunakan periode waktu yang sama.
Berdasarkan yang telah saya tulis sebelumnya bahwa data cross section ini terdiri dari banyak objek dan pada periode waktu yang sama. Sementara itu, data time series terdiri dari satu objek dan beberapa periode waktu.
Koefisien determinasi pada regresi linier metode OLS
Setelah kita memahami uji asumsi klasik yang perlu dilakukan peneliti dan juga perbedaan antara data cross section dan data time series, selanjutnya kita perlu memahami interpretasi hasil analisisnya.
Berdasarkan hasil analisis metode OLS, koefisien determinasi merupakan salah satu output analisis yang memiliki peran penting. Melalui nilai koefisien determinasi, dapat diketahui apakah model sudah baik atau belum.
Umumnya kalau kita melakukan analisis regresi linier menggunakan SPSS, kita akan menemukan nilai koefisien determinasi dengan nama R Square. Nilai R-square ini kita temukan di model summary.
Bagaimana cara membaca atau interpretasi koefisien determinasi? Sudah banyak artikel maupun video yang menjelaskan mengenai interpretasi koefisien determinasi.
Baik, di sini saya akan mencoba merefresh kembali mengenai interpretasi koefisien determinasi. Misalkan nilai koefisien determinasi sebesar 0,78 dapat diinterpretasikan bahwa keragaman variabel bebas sebesar 78% mampu menjelaskan keragaman variabel terikat, sisanya sebesar 22% dijelaskan oleh variabel lain yang tidak masuk dalam persamaan.
Apakah nilai koefisien determinasi harus mendekati 1?
Nilai koefisien determinasi berada di angka 0 dan 1. Peneliti dapat melihat nilai koefisien determinasi untuk menentukan goodness of fit dari sebuah model.
Semakin tinggi nilai koefisien determinasi menunjukkan bahwa keragaman variabel bebas mampu menjelaskan keragaman Variabel terikat semakin baik. Dengan demikian, dapat kita katakan bahwa semakin besar nilai koefisien determinasi maka model akan semakin baik.
Oleh karena itu, nilai koefisien determinasi yang semakin mendekati 1 akan semakin baik. Sebaliknya nilai koefisien determinasi yang kecil atau bahkan mendekati 0 menunjukkan model yang perlu dilakukan respesifikasi persamaannya.
Interpretasi ini diasumsikan bahwa persamaan regresi linier metode OLS telah diuji asumsi klasik. Umumnya skala pengukuran data akan mempengaruhi hasil dari uji asumsi klasik.
Skala pengukuran data dibagi menjadi skala data nominal, ordinal, interval, dan rasio. Ketika kita menggunakan skala pengukuran interval/rasio, umumnya akan memenuhi minimal salah satu dari uji asumsi klasik yang dipersyaratkan.
Penggunaan skala pengukuran data ini juga berpengaruh pada nilai koefisien determinasi. Silakan dibuktikan sendiri jika anda menggunakan skala rasio dibandingkan dengan skala ordinal, silakan lihat perbedaan nilai koefisien determinasinya. Mana yang lebih tinggi?
Apakah nilai koefisien determinasi harus mendekati 1? Kalau nilai koefisien determinasi mendekati 1 menunjukkan bahwa keragaman variabel bebas dalam menjelaskan keragaman Variabel terikat semakin baik.
Apakah data time series memiliki koefisien determinasi yang lebih tinggi dibandingkan cross section?
Berdasarkan yang telah saya tulis pada paragraf sebelumnya, bahwa data time series terdiri dari satu objek dengan beberapa periode waktu. Sedangkan data cross section terdiri dari beberapa objek dengan satu periode waktu.
Berdasarkan hasil-hasil penelitian yang telah dipublikasikan pada jurnal ilmiah baik di dalam negeri maupun luar negeri, nilai koefisien determinasi pada data time series umumnya lebih tinggi dibandingkan data cross section.
Kemudian yang menjadi pertanyaan berapa idealnya koefisien determinasi? Saya belum bisa menjawab ini dengan pasti, namun disini saya akan memberikan beberapa pendekatan.
Untuk data time series setidaknya jika nilai koefisien determinasi minimal 0,8 model sudah dikatakan baik. Selanjutnya untuk data cross section setidaknya nilai koefisien determinasi minimal 0,6 sudah dikatakan model cukup baik.
Namun demikian, ini bukan merupakan angka patokan. Namun lebih didasarkan pada beberapa jurnal hasil penelitian sebelumnya yang telah dibaca. Silakan jika ada yang harus dikoreksi, anda bisa tinggalkan pesan di kolom komentar.
Pada intinya ketika model mampu menghasilkan nilai koefisien determinasi yang lebih tinggi, model akan lebih baik. Namun perlu diingat dalam metode OLS ini, uji asumsi klasik harus dipenuhi sehingga dihasilkan estimasi yang tidak bias dan konsisten.
Saya rasa bahasan kita mengenai koefisien determinasi sudah cukup banyak. Semoga dapat memantik untuk diskusi lebih lanjut di kolom komentar. Demikian dapat saya tulis untuk anda, semoga bermanfaat! Terimakasih.
Posting Komentar untuk "Memahami Interpretasi Koefisien Determinasi (R Square) pada Regresi Linier Metode OLS"