Perbedaan antara residual dan error yang perlu kamu pahami
Ketika kita menulis persamaan regresi linier, pada akhir persamaan tersebut kita akan menuliskan residual/error. Apa definisi residual dan error? Selanjutnya apa yang membedakan di antara keduanya?
Pada kesempatan ini, saya tertarik untuk mengulas mengenai perbedaan residual dan error yang perlu kita pahami dengan baik. Dalam analisis regresi apa yang akan kita hitung, apakah nilai residual atau nilai error? Hal ini bergantung pada metode penelitian yang kita pilih.
Sebelum lebih lanjut membahas lebih dalam mengenai perbedaan antara residual dan error, kita perlu memahami dulu mengenai estimasi persamaan regresi linier. Hal ini dikarenakan untuk menghitung nilai residual atau error, kita membutuhkan intercept dan koefisien estimasi persamaan regresi.
Koefisien estimasi persamaan regresi linier
Pada berbagai penelitian, regresi linier sudah sangat sering digunakan oleh para peneliti untuk mengamati fenomena pengaruh suatu variabel terhadap variabel yang lain. Oleh karena itu, dalam analisis regresi kita mengenal ada variabel yang mempengaruhi dan ada juga variabel yang dipengaruhi.
Variabel yang mempengaruhi disebut dengan variabel bebas atau variabel independent, sedangkan variabel yang dipengaruhi disebut dengan variabel terikat atau variabel dependent. Dalam penulisan persamaannya, variabel dependent sering dirotasikan dengan variabel Y, sedangkan variabel independent dirotasikan dengan variabel X.
Jika dalam persamaan regresi terdiri dari satu variabel dependent dan satu variabel independent maka kita sebut dengan regresi linier sederhana. Adapun jika jumlah variabel bebas terdiri dari dua atau lebih, maka disebut dengan regresi linier berganda.
Uji asumsi dalam regresi linear
Regresi linier yang sering digunakan oleh para peneliti menggunakan metode kuadrat terkecil. Metode ini familiar disebut dengan metode Ordinary Least Square.
Agar diperoleh hasil estimasi yang tidak biasa dan konsisten, maka kita perlu melakukan sejumlah pengujian yang dikenal dengan uji asumsi klasik. Uji asumsi ini perlu dilakukan dan dipastikan bahwa seluruh asumsi yang dipersyaratkan pada regresi linier metode kuadrat terkecil tersebut dapat terpenuhi.
Menghitung nilai prediksi variabel dependent
Seperti yang sudah saya sampaikan pada paragraf sebelumnya, untuk menghitung nilai residual maka sebelumnya perlu dilakukan perhitungan estimasi persamaan regresi terlebih dahulu. Hal ini dilakukan karena kita akan menghitung nilai prediksi dari variabel dependent.
Nilai prediksi dari variabel dependent ini akan kita gunakan untuk menghitung nilai residual. Selanjutnya yang perlu kita pahami adalah bagaimana cara kita menghitung nilai prediksi dari variabel dependent tersebut?
Sebelum kita melakukan perhitungan nilai prediksi dari variabel dependent, berdasarkan hasil estimasi kita akan memperoleh nilai intercept dan koefisien estimasi dari variabel bebas.
Untuk memudahkan memahaminya, marilah kita ambil sebuah contoh penelitian. Seorang peneliti bermaksud untuk mengamati bagaimana biaya iklan dan jumlah staff marketing mempengaruhi jumlah penjualan produk.
Berdasarkan contoh kasus ini, kita dapat menggunakan regresi linear berganda di mana variabel biaya iklan dan jumlah staff marketing kita jadikan sebagai variabel independent. Adapun variabel penjualan produk kita jadikan sebagai variabel dependent.
Berdasarkan hasil estimasi kita peroleh persamaan regresi sebagai berikut:
Y = 20.567 + 4.3X1 + 2.3X2
Berdasarkan persamaan tersebut, kita sudah memperoleh nilai intercept sebesar 20.567 dan koefisien estimasi variabel X1 sebesar 4.3 dan koefisien estimasi variabel X2 sebesar 2.3.
Langkah selanjutnya adalah kita menghitung nilai prediksi dari variabel dependent berdasarkan persamaan hasil estimasi regresi yang telah kita tulis tersebut. Langkahnya adalah kita perlu melakukan operasi matematika dengan memasukkan nilai X1 dan X2 aktual pada persamaan tersebut.
Nilai prediksi dari variabel dependent dihitung untuk semua obervasi yang ada. Misalkan kita memiliki jumlah sampel 150, maka kita perlu menghitung persamaan estimasi tersebut sesuai dengan jumlah n yaitu sebanyak 150 sampel. Nilai prediksi dari variabel dependent ini akan kita gunakan untuk menghitung nilai residual.
Definisi residual
Setelah membaca beberapa pengantar pengantar yang saya tulis pada paragraf sebelumnya, kini kita perlu memahami mengenai definisi residual. Residual adalah selisih antara nilai sebenarnya dari variabel dependent dengan nilai prediksi dari variabel dependent.
Lebih mudahnya kita dapat mendefinisikan residual sebagai selisih antara Y aktual dengan Y predicted. Nilai Y aktual merupakan nilai observasi yang sebenarnya atau data yang telah kita peroleh berdasarkan hasil penelitian. Adapun nilai Y predicted merupakan nilai prediksi dari variabel dependent berdasarkan hasil estimasi regresi.
Hal yang perlu kita garis bawahi di sini bahwa residual digunakan untuk data sampel. Maksudnya adalah mengambil sampel dari populasi yang diamati. Jika data yang kita gunakan merupakan data sampel, maka selisih antara nilai variabel dependent yang sebenarnya dengan variabel dependent prediksi disebut dengan residual. Selanjutnya apa perbedaannya dengan error?
Definisi error
Pada prinsipnya error adalah selisih antara variabel dependent dari observasi yang sebenarnya dengan prediksi variabel dependent hasil estimasi regresi. Jika kita lihat definisinya, antara error dan residual memiliki kesamaan.
Namun demikian terdapat perbedaan yang mendasar diantara keduanya. Perbedaan utamanya adalah terletak pada apakah menggunakan data populasi atau data sampel. Jika menggunakan data populasi maka disebut dengan error.
Dengan demikian dapat kita pahami apa perbedaan antara variabel dependent aktual dengan variabel dependent prediksi pada data sampel dan populasi.
Kesimpulan
Berdasarkan artikel yang saya tulis pada kesempatan ini, kita dapat menarik kesimpulan perbedaan antara residual dan error. Perbedaan intinya adalah terletak pada penggunaan data sampel atau data populasi.
Jika menggunakan data sampel maka selisih Y aktual dan Y predicted disebut dengan residual. Adapun jika menggunakan data populasi maka selisih antara Y aktual dengan Y predicted disebut dengan error.
Baik, demikian artikel yang dapat saya tulis pada kesempatan ini. Semoga memberikan manfaat dan nilai tambah pengetahuan bagi teman-teman yang membutuhkan. Tunggu update artikel dari Priyono id pada kesempatan berikutnya, terima kasih.
Posting Komentar untuk "Perbedaan antara residual dan error yang perlu kamu pahami"