Berapa nilai koefisien determinasi (R square) yang ideal?
Kalau kamu menggunakan analisis regresi linier, dalam hasil analisis datamu pasti akan muncul nilai koefisien determinasi atau R Square. Koefisien determinasi merupakan metrik yang penting yang akan menggambarkan bagaimana variabel independen dalam menjelaskan variabel dependen.
Nilai koefisien determinasi ini tentu akan bervariasi tergantung dari karakteristik data yang dianalisis. Banyak sekali yang bertanya pada saya, berapa sih angka ideal untuk nilai koefisien determinasi? Hal ini melatarbelakangi saya untuk menulis sebuah artikel yang membahas mengenai angka ideal untuk nilai koefisien determinasi pada output analisis regresi linier.
Kamu mungkin tentu juga sudah tahu bahwa nilai koefisien determinasi berada di antara range 0 sampai dengan 1. Mungkin nilai koefisien determinasi bisa saja mendekati 1 atau bahkan mendekati 0. Lalu sebaiknya di kisaran angka berapa dapat dikatakan bahwa koefisien determinasi yang dihasilkan merepresentasikan dari model regresi yang baik?
Memahami teori koefisien determinasi
Kalau kamu membaca buku teori ekonometrika atau buku statistika, terutama yang membahas terkait analisis regresi umumnya akan dijelaskan mengenai koefisien determinasi. Nilai koefisien determinasi menjadi salah satu ukuran nilai yang menjelaskan bagaimana varians dari variabel bebas dalam menjelaskan varians dari variabel terikat.
Nilai koefisien determinasi berkisar antara 0 sampai dengan 1. Semakin mendekati 1, maka menunjukkan bahwa kemampuan variabel bebas dalam menjelaskan variabel terikat semakin tinggi. Adapun semakin mendekati 0, maka nilai koefisien determinasi tersebut dapat diinterpretasikan bahwa kemampuan variabel bebas dalam menjelaskan variabel terikat semakin kecil.
Umumnya peneliti akan mengharapkan memperoleh nilai koefisien determinasi yang tinggi atau mendekati 1. Namun demikian, pada kenyataannya nilai koefisien determinasi pada analisis regresi linier tidak selalu tinggi. Bahkan ada yang nilainya sangat kecil.
Lalu bagaimana sikap kita ketika kita memperoleh nilai koefisien determinasi hasil penelitian kita, apakah nilai ini sudah menunjukkan angka koefisien determinasi yang ideal? Ini akan kita bahas lebih lanjut pada artikel ini. Namun sebelum itu, saya akan jelaskan mengenai interpretasi koefisien determinasi terlebih dahulu.
Contoh interpretasi nilai koefisien determinasi
Sekarang kita perlu memahami mengenai cara interpretasi nilai koefisien determinasi. Sebagai contoh, misalkan ada seorang peneliti yang melakukan analisis regresi linear berganda yang bertujuan untuk mengestimasi pengaruh tingkat inflasi dan tingkat pengangguran terhadap pertumbuhan ekonomi.
Berdasarkan hasil analisis dari penelitian tersebut diperoleh nilai koefisien determinasi sebesar 0,85. Nilai ini dapat diinterpretasikan bahwa sebesar 85% variasi variabel pertumbuhan ekonomi mampu dijelaskan oleh variasi variabel tingkat inflasi dan tingkat pengangguran. Adapun sisanya sebesar 15% variasi variabel pertumbuhan ekonomi dijelaskan oleh variabel lain yang tidak dimasukkan dalam persamaan regresi linear atau model.
Adapun pada hasil analisis dengan nilai koefisien determinasi yang kecil artinya variabel terikat hanya dapat dijelaskan oleh variabel bebas dengan persentase yang kecil. Oleh karena itu, memang betul banyak peneliti yang mengharapkan nilai koefisien determinasi yang diperoleh mendekati 1.
Hal ini dikarenakan mereka dianggap telah memilih variabel bebas yang tepat karena dapat memprediksi bariabel terikat dengan baik yang ditunjukkan dengan nilai koefisien determinasi yang besar atau mendekati 1.
Namun, peneliti juga perlu berhati-hati. Karena kalau nilai koefisien determinasi hampir sempurna mendekati 1, ini juga akan menjadi pertanyaan. Lalu seberapa ideal angka koefisien determinasi pada analisis regresi?
Berapa nilai koefisien determinasi yang ideal?
Berapa nilai koefisien determinasi dari hasil analisis regresi yang ideal? Pertanyaan ini sebenarnya agak sulit untuk dijawab. Namun saya akan mencoba melihat dari salah satu pendekatan.
Pendekatan utama yang akan saya lihat yaitu dari penggunaan jenis data. Tentu kamu sudah paham dengan baik mengenai jenis data cross-section dan jenis data time series.
Jenis data cross-section ini umumnya kita peroleh dari hasil survei di lapangan. Adapun pada data time series kita dapat memperolehnya dari data sekunder yang telah dikumpulkan dalam periode waktu yang kita tentukan.
Berdasarkan pengalaman saya dalam melakukan analisis data, terdapat perbedaan yang cukup signifikan untuk nilai koefisien determinasi antara data cross-section dan data time series. Nilai koefisien determinasi pada data time series, umumnya nilainya lebih besar dibandingkan dengan data cross-section.
Kalau merujuk dari beberapa buku yang saya baca dan beberapa artikel ilmiah yang terbit di jurnal nasional maupun jurnal internasional, untuk data time series, jika nilai koefisien determinasi lebih besar dari 0,80 umumnya dianggap sudah merepresentasikan model regresi yang baik.
Adapun untuk nilai koefisien determinasi pada data cross-section, setidaknya jika nilai koefisien determinasi lebih dari 0,60 sudah cukup lumayan baik dalam menggambarkan model regresi yang cukup baik.
Namun demikian, jika nilai koefisien determinasi lebih besar dan mendekati 1, tentu ini akan menjadi lebih baik lagi. Namun, teman-teman juga perlu waspada jika menggunakan data cross-section namun memperoleh nilai koefisien determinasi yang hampir sempurna misalkan 0,99.
Ini perlu dicek kembali apakah datanya memang benar-benar merupakan data observasi langsung dari lapang. Namun jika menggunakan data time series, jika nilai koefisien determinasi melebihi 0,90, saya kira ini masih cukup wajar karena karakteristik dari data time series ini memang berpotensi menghasilkan nilai koefisien determinasi yang lebih tinggi.
Nilai koefisien determinasi sangat kecil (<0.10)
Terkadang ada beberapa mahasiswa yang bertanya mengenai nilai koefisien determinasi yang sangat kecil. Nilai koefisien determinasinya lebih kecil dari 0,10 dan bahkan ada juga kasus di mana nilai-nilai koefisien determinasinya hanya 0,023.
Sebetulnya, apa penyebabnya. Mengapa nilainya sangat kecil? padahal jika dilihat dari spesifikasi persamaan dan jumlah variabelnya juga cukup mencukupi yang terdiri dari satu variabel terikat dan 4 variabel bebas.
Berdasarkan pengalaman yang saya peroleh, ketika membaca hasil riset jika kita menggunakan variabel-variabel non parametrik dan menggunakan analisis regresi linier metode OLS ini umumnya akan menghasilkan nilai koefisien determinasi yang kecil.
Misalnya kita mengamati pengaruh variabel bebas terhadap variabel terikat di mana semua variabel yang diukur menggunakan skala ordinal, ini umumnya akan memperoleh nilai koefisien determinasi yang kecil. Oleh karena itu, dalam memilih metode analisis data kita perlu hati-hati dan memperhatikan asumsi-asumsi yang dipersyaratkan agar hasil estimasinya konsisten dan tidak bias.
Kesimpulan
Kini tibalah saatnya kita untuk menyimpulkan apa yang telah kita bahas dalam artikel ini. Memang tidak ada angka baku yang menunjukkan berapa sih minimal nilai koefisien determinasi yang menunjukkan model regresi yang baik.
Namun, berdasarkan pendekatan yang saya lakukan, kalau nilai koefisien determinasi lebih besar dari 0,80 untuk data time series dan lebih dari 0,60 untuk data cross-section, saya kira variabel independen sudah cukup baik dalam menjelaskan variasi variabel dependen. Namun, kamu juga perlu memastikan uji asumsi yang dipersyaratkan pada analisis regresi tersebut sudah terpenuhi.
Baik, ini artikel yang dapat saya tulis pada kesempatan ini. Semoga bermanfaat dan menambah wawasan untuk kita semuanya. Jika ada hal-hal yang ingin didiskusikan bersama, silakan jangan ragu untuk meninggalkan pesan di kolom komentar di bawah artikel ini. Baik, sampai jumpa pada artikel Priyono.id di kesempatan yang lain.
Posting Komentar untuk "Berapa nilai koefisien determinasi (R square) yang ideal? "