Partial least square (PLS) adalah suatu tekhnik statistik multivariat yang bisa menangani banyak variabel respon dan variabel eksplanatori sekaligus. PLS merupakan alternatif yang baik untuk metode analisis regresi berganda dan regresi komponen utama karena metode PLS bersifat lebih robust, artinya parameter model tidak banyak berubah ketika sampel baru diambil dari total populasi (Geladi dan Kowalski, 1986).
PLS pertama kali dikembangkan pada tahun 1960-an oleh Herman O. A. Wold dalam bidang ekonometrik. PLS merupakan suatu tekhnik prediktif yang bisa menangani banyak variabel independen, bahkan sekalipun terjadi multikolinieritas diantara variabel-variabel tersebut (Ramzan dan Khan, 2010).
Analisis regresi berganda sebenarnya bisa digunakan ketika terdapat variabel prediktor yang banyak. Namun, jika jumlah variabel tersebut terlalu besar (misal lebih banyak dari jumlah observasi) akan diperoleh model yang fit dengan data sampel, tapi akan gagal memprediksi untuk data baru. Fenomena ini disebut overfitting. Dalam kasus seperti itu, meskipun terdapat banyak faktor manifes, mungkin saja hanya terdapat sedikit faktor laten yang paling bisa menjelaskan variasi dalam respon. Ide umum dari PLS adalah untuk mengekstrak faktor-faktor laten tersebut, yang menjelaskan sebanyak mungkin variasi faktor manifes saat memodelkan variabel respon.
No comments:
Post a Comment