Showing posts with label Analisa Data. Show all posts
Showing posts with label Analisa Data. Show all posts

Monday, March 23, 2020

tahapan dalam peramalan ARIMA-QR (skripsi dan tesis)

tahapan dalam penelitian yang dilakukan untuk peramalan ARIMA-QR: 1. Persiapan Data a. Membagi data menjadi 70% training set dan 30% testing set 2. Peramalan menggunakan ARIMA a. Identifikasi Model Pada tahap identifikasi model dilakukan pembuatan plot data time series. Kemudian dilakukan uji stasioner ragam dan uji stasioner rataan. Jika data belum stasioner dalam ragam, maka perlu dilakukan proses transformasi. Jika data belum stasioner terhadap mean, maka dilakukan proses differencing. Identifikasi model ARIMA dapat dilakukan dengan menggunakan fungsi ACF maupun PACF dari data yang sudah stasioner untuk menentukan model awal (penentuan orde AR dan MA). b. Estimasi Parameter Parameter dikatakan signifikan jika memiliki nilai pvalue < α atau p-value < 0,05. Jika telah menemukan parameter yang sesuai, maka dilanjutkan dengan proses uji diagnosa c. Uji Diagnosa Uji diagnosa dapat dilakukan dengan membuat plot ACF dan PACF untuk residualnya. Uji diagnosa dapat dilihat dari nilai p pada correlogram q-statistic dan squared residual. Nilai p > 0,05 pada q-statistic menandakan bahwa residual atau sisaan bersifat random atau acak, yang berarti model dapat diterima. Nilai p > 0.05 pada squared residual menandakan bahwa sisaan bersifat homogen. Model yang telah memnuhi kriteria dapat digunakan untuk melakukan peramalan. d. Peramalan Setelah mendapatkan model terbaik dari hasil uji parameter dan uji diagnosa, maka proses selanjutnya adalah melakukan peramalan dengan menggunakan model tersebut.   3. Peramalan menggunakan metode Quantile Regression (QR) a. Menentukan quantile quantile yang digunakan dalam penelitian ini adalah 0.25, 0.50, dan 0.75. b. Menganalisis variabel Menganalisis variabel yaitu terkait variabel independen dan regressor (variabel bebas), termasuk menganalisis hubungan antar variabel. c. Mencari nilai prediksi d. Menghitung kesalahan peramalan 4. Analaisa Hasil dan penarikan kesimpulan Menganalisa dan membandingkan metode antara ARIMA saja dan metode campuran ARIMA-QR.

Time Series (skripsi dan tesis)


 Metode analisis yang telah dibicarakan hingga sekarang analisis terhadap data mengenai sebuah karakteristik atau atribut (jika data itu kualitatif) dan mengenai sebuah variabel, diskrit ataupun kontinyu (jika dta itu kuantitatif) tetapi sebagaimana disadari banyak persoalan atau fenomenayang meliputi lebih dari sebuah variabel(Sudjana,1995). Pemodelan data deret waktu merupakan bagian yang cukup penting dalam berbagai riset. Masalah pemodelan deret waktu seringkali dikaitkan dengan ptroses peramalan suatu karakteristik tertentu pada periodeke depan dan untuk mengendalikam suatu proses atau mengenali pola perilaku sistem. Model analisis telah menyediakan suatu metode peramalan yang sederhana yang mampu .menggambarkan pola dan kecenderungan data deret waktu. Namun model tersebut akan mempunyai tingkat kesesuaian yang tinggi apabila perilaku data deret waktu tidak terlalu kompleks dan kondisis awal terpenuhi dengan baik

Forecasting (skripsi dan tesis)


Dalam melakukan analisis kegiatan usaha perusahaan haruslah diperkirakan apa yang akan terjadi dalam usaha yang akan datang, sebagaimana yang dikemukakan oleh Martiningtyas (2004) dalam bukunya statistik bahwa kegiatan untuk memperkirakan apa yang akan terjadi dimasa yang akan datang disebut peramalan atau forecasting.
Persamaan y=a+bx dapat digunakan untuk meramalkan respon nilai tengah pada x = X0. Dalam hal ini X0 tidak harus sama dengan nilai x yang lain. Persamaan itu dapat juga digunakan untuk meramalkan
nilai tunggal y0 bagi peubah acak bila x = Xo .Tentu saja kita dapat membayangkan bahwa galat peramalannya akan lebih tnggi pada peramalan nilai tunggal dibandingkan dengan peramalan nilai tengahnya. Pada gilirannya ini akan mempengaruhi panjang selang kepercayaan bagi nilai ramalan
tersebut(walpole,1993)

tahapan dalam ARIMA-QR (skripsi dan tesis)

tahapan dalam penelitian yang dilakukan
untuk peramalan ARIMA-QR:
1. Persiapan Data
a. Membagi data menjadi 70% training set dan
30% testing set
2. Peramalan menggunakan ARIMA
a. Identifikasi Model
Pada tahap identifikasi model dilakukan pembuatan
plot data time series. Kemudian dilakukan uji
stasioner ragam dan uji stasioner rataan. Jika data
belum stasioner dalam ragam, maka perlu dilakukan
proses transformasi. Jika data belum stasioner
terhadap mean, maka dilakukan proses differencing.
Identifikasi model ARIMA dapat dilakukan dengan
menggunakan fungsi ACF maupun PACF dari data
yang sudah stasioner untuk menentukan model
awal (penentuan orde AR dan MA).
b. Estimasi Parameter
Parameter dikatakan signifikan jika memiliki nilai pvalue < α atau p-value < 0,05. Jika telah menemukan
parameter yang sesuai, maka dilanjutkan dengan
proses uji diagnosa
c. Uji Diagnosa
Uji diagnosa dapat dilakukan dengan membuat plot
ACF dan PACF untuk residualnya. Uji diagnosa
dapat dilihat dari nilai p pada correlogram q-statistic
dan squared residual. Nilai p > 0,05 pada q-statistic
menandakan bahwa residual atau sisaan bersifat
random atau acak, yang berarti model dapat
diterima. Nilai p > 0.05 pada squared residual
menandakan bahwa sisaan bersifat homogen.
Model yang telah memnuhi kriteria dapat digunakan
untuk melakukan peramalan.
d. Peramalan
Setelah mendapatkan model terbaik dari hasil uji
parameter dan uji diagnosa, maka proses
selanjutnya adalah melakukan peramalan dengan
menggunakan model tersebut.
3. Peramalan menggunakan metode Quantile
Regression (QR)
a. Menentukan quantile
quantile yang digunakan dalam penelitian ini adalah
0.25, 0.50, dan 0.75.
b. Menganalisis variabel
Menganalisis variabel yaitu terkait variabel
independen dan regressor (variabel bebas),
termasuk menganalisis hubungan antar variabel.
c. Mencari nilai prediksi
d. Menghitung kesalahan peramalan
4. Analaisa Hasil dan penarikan kesimpulan
Menganalisa dan membandingkan metode antara
ARIMA saja dan metode campuran ARIMA-QR.

Regresi (skripsi dan tesis)


Regresi merupakan teknik statistika untuk menentukan
persamaan garis atau kurva dengan meminimumkan
penyimpangan antara data pengamatan dan nilai-nilai
dugaannya [9]. Secara luas, analisis regresi diartikan sebagai
suatu analisis ketergantungan antara variabel tergantung
(independent variable) kepada variabel bebas (dependent
variable). Analisis regresi diartikan sebagai analisis variabel
bebas dalam rangka membuat estimasi atau prediksi dari nilai
variabel tergantung dependent variable) dengan diketahuinya
nilai variabel bebas [10].

Box Jenkins (ARIMA) (skripsi dan tesis)


ARIMA (Autoregressive Integrated Moving Average) atau
Model Box-Jenkins merupakan salah satu teknik model
peramalan timeseries yang hanya berdasarkan perilaku data
variabel yang diamati. ARIMA memiliki sifat yang fleksibel
(mengikuti pola data), memiliki tingkat akurasi peramalan yang
cukup tinggi. Mengikuti pola data disini maksudnya adalah jika
data tidak stasioner, data tersebut dapat disesuaikan menjadi
JURNAL TEKNIK ITS Vol. 7, No. 1 (2018) 2337-3520 (2301-928X Print) A134
data stasioner dengan melakukan differencing. Adapun
langkah-langkah yang harus diambil dalam menganalisis data
dengan teknik Box-Jenkins atau ARIMA adalah sebagai
berikut [8]:
Langkah 1. Identifikasi Model
Pada tahap ini, kita memilih model yang tepat yang bisa
mewakili deret pengamatan. Identifikasi model dilakukan
dengan:
a. Membuat plot data time series agar dapat
diketahuiapakah data mengandung trend, musiman,
outlier, variansi tidak konstan. Jika data time series tidak
stasioner maka data harus distasionerkan terlebih
dahulu. Jika data tidak stasioner dalam varians dan
mean, maka langkah pertama harus menstabilkan
variansinya.
b.Menghitung dan mencocokkan sampel ACF dan PACF
dari data time series yang asli. Sampel ACF dan PACF
dari data time series yang asli dapat digunakan untuk
menentukan tingkat differencing yang sebaiknya
digunakan.
c. Menghitung dan mencocokkan sampel ACF dan PACF
dari data time series yang telah ditransformasikan dan
didiferencing.
Langkah 2. Estimasi Parameter
Pada tahap ini, kita memilih taksiran model yang baik dengan
melakukan uji hipotesis untuk parameter.
Hipotesis :
H0 : parameter tidak signifikan
H1 : parameter signifikan
Level toleransi () = 5% = 0,05
Kriteria uji : Tolak H0 jika p-value <.
Langkah 3. Uji Diagnosis
Setelah mendapatkan estimator ARIMA, langkah
selanjutnya adalah memilih model yang mampu menjelaskan
data dengan baik. Caranya adalah dengan melihat apakah
residual bersifat random sehingga merupakan residual yang
relatif kecil. Jika tidak, maka harus kembali ke langkah pertama
untuk memilih model yang lain.
Langkah 4. Prediksi (Peramalan)
Setelah didapatkan model terbaik yang sesuai, maka langkah
selanjutnya adalah menggunakan model tersebut untuk
melakukan peramalan

Peramalan (skripsi dan tesis)


Peramalan adalah proses memperkirakan nilai di masa
mendatang dengan menggunakan data yang ada di masa
lampau. Data di masa lampau secara sistematis dikombinasikan
dan diolah untuk memperkirakan suatu nilai di masa
mendatang. Terdapat dua pendekatan untuk melakukan
peramalan, yaitu dengan pendekatan kualitatif dan pendekatan
kuantitatif [7].
a. Metode peramalan kualitatif yang menggabungkan faktorfaktor seperti intuisi pengambilan keputusan, emosi,
pengalaman pribadi
b.Metode peramalan kuantitatif yang menggunakan satu atau
lebih model matematis dengan data masa lalu dan variabel
sebab akibat untuk meramalkan permintaan. Pada dasarnya
metode peramalan kuantitatif dibagi menjadi dua, yaitu model
deret waktu (time series), dan model kausal.
Metode peramalan kuantitatif juga dapat dikelompokkan
menjadi dua jenis, yaitu :
1) Model deret waktu/time series
Pada model ini, suatu variabel diramalkan berdasarkan
nilai variabel itu sendiri di periode sebelumnya
2) Model kausal/explanatory
Pada model ini, suatu variabel diramalkan berdasarkan
nilai dari satu atau lebih variabel lain yang berpengaruh.
Atau dengan kata lain model kausal adalah memasukkan
dan menguji variabel-variabel yang diduga akan
mempengaruhi variabel dependen. Model ini biasanya
menggunakan analisis regresi untuk menentukan mana
variabel yang signifikan mempengaruhi variabel
dependen. Selain menggunakan analisis regresi, model
kausal juga dapat menggunakan metode ARIMA atau
Box-Jenkins untuk mencari model terbaik yang dapat
digunakan dalam peramalan
Secara umum, dalam melakukan peramalan terdiri dari
beberapa tahapan khususnya jika menggunakan metode
kuantitatif [8].Tahapan tersebut adalah:
a) Mendefinisikan tujuan dari peramalan
b) Membuatdiagram pencar (Plot Data)
c) Memilih model peramalan yang tepat sesuai dengan
plot data
d) Melakukan peramalan
e) Menghitung kesalahan ramalan (forecast error)
f) Memilih metode peramalan dengan kesalahan yang
terkecil
g) Melakukan verifikasi peramalan

Autoregressive Integrated Moving Average (ARIMA) (skripsi dan tesis)


Metode Autoregressive Integrated Moving Average (ARIMA) yang biasa disebut dengan metode Box-Jenkins merupakan metode yang dikembangkan oleh George Box dan Gwilym Jenkins pada tahun 1970 [1]. Metode ARIMA (Autoregressive Integrated Moving Average) adalah metode yang digunakan untuk peramalan jangka pendek. Penggunaan metode ARIMA dalam peramalan jangka pendek sangat tepat digunakan karena metode ARIMA memiliki ketepatan yang sangat akurat. Dan juga menentukan hubungan statistik yang baik antar variabel yang akan diramal dengan nilai yang digunakan untuk peramalan. Sedangkan untuk peramalan jangka panjang
ketepatan peramalannya kurang baik. Biasanya nilai peramalan akan cenderung konstan untuk periode yang cukup panjang.
Model Autoregresiive Integrated Moving Average (ARIMA) adalah model yang secara penuh mengabaikan variabel independen dalam membuat peramalan. Nilai yang digunakan oleh ARIMA untuk peramalan yaitu menggunakan nilai masa lalu dan sekarang dari variabel dependen untuk
menghasilkan peramalan jangka pendek yang akurat [4]. Kelompok model yang termasuk dalam metode Autoregressive Integrated Moving Average (ARIMA) yaitu:
• Autoregressive (AR)
Model Autoregresive (AR) diperkenalkan pertama kali oleh Yule pada tahun 1926 dan kemudian dikembangkan oleh Walker pada tahun 1931. Asumsi yang dimiliki oleh model ini adalah data periode sekarang dipengaruhi oleh data pada periode sebelumnya. Disebut model Autoregressive dikarenakan pada model ini diregresikan terhadap nilai-nilai sebelumnya dari
variabel itu sendiri. Model Autoregressive dengan ordo p disingkat menjadi AR(p) atau ARIMA(p,0,0) [5].
Model :
Zt =μ +ϕ 1 Zt-1 + ϕ 2 Zt-2 + ... + ϕ p Zt-p – at (1)
dimana,
Zt = deret waktu stasioner
μ = konstanta
Zt-p= variabel bebas
ϕ p = koefisien parameter autoregressive ke-p
at = sisaan pada saat ke-t
Model diatas disebut sebagai model Autoregressive (regresi diri sendiri) karena model tersebut mirip dengan persamaan regresi pada umumnya, hanya saja yang menjadi variabel independen bukan variabel yang berbeda dengan variabel dependen melainkan nilai sebelumnya (lag) dari variabel dependen (Zt) itu sendiri.
• Moving Average (MA)
Model Moving Average (MA) pertama kali diperkenalkan oleh Slutzky pada tahun 1973, dengan orde q ditulis MA (q) atau ARIMA (0,0,q) dan dikembangkan oleh Wadsworth pada tahun 1989 [5].
Model :
Zt = μ + at – θ1 at-1–... – θq at-q (2)
dimana,
Zt = deret waktu stasioner
μ = konstanta
at-1 = variabel bebas
θq = koefisien parameter moving average ke-q
at = sisaan pada saat ke-t
• Autoregressive Moving Average (ARMA)
Model Autoregressive Moving Average (ARMA) merupakan model gabungan dari Autoregresive (AR) dan Moving Average (MA). Dan model ini memiliki asumsi bahwa data periode sekarang dipengaruhi oleh data periode sebelumnya dan nilai sisaan dari periode sebelumnya [6]. Model :
Zt = μ +ϕ 1Zt-1+ ... + ϕp Zt-p + at - θ1 at-1 - ... – θq at-q (3)
dimana,
Zt = deret waktu stasioner
μ = konstanta
Zt-p = variabel bebas
ϕp = koefisien parameter autoregressive ke-p
at-1 = variabel bebas
θq = koefisien parameter moving average ke-q
at = sisaan pada saat ke-t
• Autoregressive Integrated Moving Average (ARIMA)
Model Autoregressive Integrated Moving Average (ARIMA) digunakan berdasarkan asumsi bahwa data deret waktuyang digunakan harus stasioner yang artinya rata-rata variasi dari data yang dimaksud adalah konstan. Namun, ada beberapa hal yang terjadi ketika suatu data tidak stasioner. Dalam mengatasi ketidakstasioneran data ini dilakukan proses differencing agar
data menjadi stasioner. Karena model Autoregressive (AR), Moving Average (MA), Autoregressive Moving Average (ARMA) tidak mampu menjelaskan arti dari defferencing, maka digunakan model campuran yang disebut Autoregressive Integrated Moving Average (ARIMA) atau ARIMA (p,d,q) sehingga menjadi lebih efektif dalam menjelaskan proses
differencing. Pada model campuran ini series stasioner merupakan fungsi linier dari nilai lampau beserta nilai sekarang dan kesalahan lampaunya.
Model :
Φp (B) Dd Zt = μ + θq (B) at (4)
dimana,
Φp = keofisien parameter autoregressive ke-p
θq = koefisien parameter moving average ke-q
B = operator backshift
D = differencing
μ = konstanta
at = sisaan pada saat ke-t
p = derajat autoregressive
d = tingkat proses differencing
q = derajat moving average

Metode ARIMA (Autoregressive Integrated Moving Average) (skripsi dan tesis)

ARIMA (Autoregressive Integrated Moving Averageadalah metode yang pertama kali dikembangkan oleh George Edward Pelham Box dan Gwilym Meirion Jenkins yaitu metode peramalan untuk menyelesaikan deret berkala untuk menganalisis runtun waktu. Metode ARIMA juga dikenal dengan sebutan metode Box-Jenkins. Data yang digunakan dalam peramalan menggunakan metode ARIMA adalah data stationer. Model Box-Jenkins dikelompokkan ke dalam tiga kelompok, yaitu [1]:
  1. Model Autoregressive (AR)
Model Autoregressive (AR) menunjukkan bahwa nilai peubah  merupakan fungsi linier dari peubah  sebelumnya [2].
      2. Model Moving Average (MA)
Model Moving Average (MA) merupakan nilai deret waktu pada waktu t yang dipengaruhi oleh unsur kesalahan pada saat ini dan unsur kesalahan terbobot pada masa lalu [3]. Sehingga model MA menunjukkan bahwa nilai peubah  dipengaruhi oleh sisaan pada periode sebelumnya [4].
      3. Model Campuran
  • Model Moving Average Moving Average (ARMA)
Model ini merupakan gabungan antara model Autoregressive (AR), dan Moving Average (MA). Model ARMA telah stasioner tanpa proses differencing (d = 0) yang dinotasikan dengan model ARIMA (p,0,q) atau ARMA(p,q).
  •  Model Moving Average Integrated Moving Average (ARIMA)
Jika data deret waktu tidak stasioner, maka model Box-Jenkins disebut model Autoregressive Integrated Moving Average (ARIMA). Model dinotasikan dengan ARIMA(p,d,q).

TAHAPAN ARIMA (Box-Jenkins) (skripsi dan tesis)


Langkah-langkah penerapan metode ARIMA secara berturut-turut adalah identifikasi model, pendugaan parameter model, pemeriksaan diagnosa dan penerapan model untuk peramalan
Model umum dan uji stasioneritas
Stasioneritas berarti tidak terdapat pertumbuhan atau penurunan pada data. Data secara kasarnya harus horizontal sepanjang sumbu waktu. Dengan kata lain, fluktuasi data berada di sekitar suatu nilai rata-rata yang konstan, tidak tergantung pada waktu dan varians dari fluktuasi tersebut atau tetap konstan setiap waktu. Untuk mengetahui stasioner tidaknya data dapat diamati dari time. Penggunaan model untuk peramalan. Pemeriksaan (uji) diagnosa estimasi parameter model indentifikasi model tentatif (sementara) dengan memilih (p,d,q). Rumuskan model umum dan uji stasioneritas data ya atau tidak. Series plot data tersebut, autocorrelation function data atau model trend linier data terhadap waktu.
Suatu data time series yang tidak stasioner harus diubah menjadi data stasioner, karena aspek-aspek AR dan MA dari model ARIMA hanya berkenaan dengan data time series yang stasioner. Salah satu cara yang paling sering dipakai adalah metode pembedaan (differencing) yaitu menghitung perubahan atau selisih nilai observasi. Nilai selisih yang diperoleh dicek lagi apakah stasioner atau tidak. Jika belum stasioner maka dilakukan differencing lagi.
2) Identifikasi model
Setelah data time series yang akan diolah langkah berikutnya adalah penetapan model ARIMA (p,d,q) yang sekiranya cocok. Jika data tidak mengalami differencing, maka d bernilai 0, jika data menjadi stasioner setelah differencing ke- 1 maka d bernilai 1 dan seterusnya. Dalam memilih dan menetapkan p dan qdapat dibantu dengan mengamati pola Autocorrelation Function (ACF) dan Partial Autocorrelation Function (PACF)
Kesalahan yang sering terjadi dalam penentuan p dan q bukan merupakan masalah besar pada tahap ini, karena hal ini akan diketahui pada tahap pemeriksaan diagnosa selanjutnya.
3) Pendugaan parameter model
Ada dua cara yang mendasar untuk mendapatkan parameter-parameter
tersebut:
Ø  Dengan cara mencoba-coba (trial and error), menguji beberapa nilai yang berbeda dan memilih satu nilai tersebut (atau sekumpulan nilai, apabila terdapat lebih dari satu parameter yang akan ditaksir) yang meminimumkan jumlah kuadrat nilai sisa (sum of squared residual).
Ø  Perbaikan secara iteratif, memilih taksiran awal dan kemudian penghitungan dilakukan Box-Jenkins Computer Program untuk memperhalus penaksiran tersebut secara iteratif.
4) Pemeriksaan diagnosa
Dalam pemeriksaan terhadap model ada beberapa metode yang bisa
dilakukan, antara lain adalah:
  1. Pengujian model secara keseluruhan (Overall F test) dan pengujian masing masing parameter model secara parsial (t-test), untuk menguji apakah koefisien model signifikan secara statistik atau tidak baik secara keseluruhan maupun parsial
b.Model dikatakan baik jika nilai error bersifat random, artinya sudah tidak mempunyai pola tertentu lagi. Dengan kata lain model yang diperoleh dapat menangkap dengan baik pola data yang ada. Untuk melihat kerandoman nilai error dilakukan pengujian terhadap nilai koefisien autokorelasi dari error, dengan menggunakan salah satu dari dua statistik
Pemilihan model terbaik
Untuk menentukan model yang terbaik dapat digunakan standard error estimate 
Model terbaik adalah model yang memiliki nilai standard error estimate (S) yang paling kecil. Selain nilai standard error estimate, nilai rata-rata persentase kesalahan peramalan (MAPE) dapat juga digunakan sebagai bahan pertimbangan dalam menentukan model yang terbaik yaitu:

6) Penggunaan model untuk peramalan
Jika model terbaik telah ditetapkan, maka model siap digunakan untuk peramalan. Untuk data yang mengalami differencing, bentuk selisih harus dikembalikan pada bentuk awal dengan melakukan proses integral karena yang diperlukan adalah ramalan time series asli. Notasi yang digunakan dalam ARIMA adalah notasi yang mudah dan umum. Misalkan model ARIMA (0,1,1)(0,1,1)9 dijabarkan menjadi sebuah persamaan regresi yang lebih umum
Nilai et+1 tidak akan diketahui, karena nilai yang diharapkan untuk kesalahan random pada masa yang akan datang harus ditetapkan sama dengan nol. Akan tetapi dari model yang disesuaikan (fitted model) kita boleh mengganti nilai eet-8 dan et-9 dengan nilai nilai mereka yang ditetapkan secara empiris (seperti yang diperoleh setelah iterasi terakhir algoritma Marquardt). Tentu saja bila kita meramalkan jauh ke depan, tidak akan kita peroleh nilai empiris untuk “e” sesudah beberapa waktu, dan oleh sebab itu nilai harapan mereka akan seluruhnya nol. Untuk nilai pada awal proses peramalan, kita akan mengetahui nilai ZtZt-8Zt-9. Akan tetapi sesudah beberapa saat, nilai Z akan berupa nilai ramalan (forecasted value), bukan nilai-nilai masa lalu yang telah diketahui. Teknik peramalan dengan menggunakan ARIMA juga memberikan confidence interval. Jika peramalan dilakukan jauh ke depan, maka confidence interval umumnya juga akan makin melebar. Namun tidak demikian untuk confidence interval moving average model murni. Peramalan merupakan never ending process yang berarti jika data terbaru muncul, model perlu diduga dan diperiksa kembali.

KLASIFIKASI MODEL ARIMA (skripsi dan tesis)


Metode ARIMA dibagi kedalam tiga kelompok model time series linier, yaitu  autoregressive model (AR), moving average model (MA) dan model campuran yang memiliki karakteristik kedua model di atas yaitu autoregressive integrated moving average (ARIMA).
1) Autoregressive Model (AR)
Suatu persamaan linier dikatakan sebagai autoregressive model jika model tersebut menunjukkan 𝑍𝑡 sebagai fungsi linier dari sejumlah 𝑍𝑡 actual kurun waktu sebelumnya bersama dengan kesalahan sekarang. Bentuk model ini dengan ordo p atau AR (p) atau model ARIMA (p,d,0) secara umum adalah:
2) Moving Average Model (MA)
Berbeda dengan moving average model yang menunjukkan 𝑍𝑡 sebagai
fungsi linier dari sejumlah 𝑍𝑡 aktual kurun waktu sebelumnya, moving average
model menunjukkan nilai 𝑍𝑡 berdasarkan kombinasi kesalahan linier masa lalu
(lag).
Terlihat dari model bahwa 𝑍𝑡 merupakan rata-rata tertimbang kesalahan sebanyak q periode lalu yang digunakan untuk moving average model. Jika pada suatu model digunakan dua kesalahan masa lalu maka dinamakan moving average model tingkat 2 atau MA (2).
3) Autoregressive Integrated Moving Average (ARIMA)
Sebuah model time series digunakan berdasarkan asumsi bahwa data time series yang digunakan harus stasioner yang artinya rata-rata variasi dari data yang dimaksud konstan. Tapi hal ini tidak banyak ditemui dalam banyak data time series yang ada, mayoritas merupakan data yang tidak stasioner melainkan integrated. Data yang integrated ini harus mengalami proses random stasioner yang seringkali tak dapat dijelaskan dengan baik oleh autoregressive model saja atau moving average model saja dikarenakan proses tersebut mengandung keduanya. Oleh karena itu campuran kedua model yang disebut autoregressive integrated moving average (ARIMA) menjadi lebih efektif menjelaskan proses itu. Pada model campuran ini series stasioner merupakan fungsi linier dari nilai lampau beserta nilai sekarang dan kesalahan lampaunya. Bentuk umum model ini adalah:

Proses autoregressive integrated moving average secara umum dilambangkan dengan ARIMA (p,d,q), dimana:
Ø  p menunjukkan ordo/derajat autoregressive (AR)
Ø  d adalah tingkat proses differencing
Ø  q menunjukkan ordo/derajat moving average (MA).

     ARIMA (skripsi dan tesis)


Autoregressive Integrated Moving Average (ARIMA) atau biasa disebut dengan metode Box-Jenkins. ARIMA sangat baik ketepatannya untuk peramalan jangka pendek, yang tidak membentuk suatu model struktural baik itu persamaan tunggal atau simultan yang bebasis kepada teori ekonomi atau logika, namun dengan menganalisis probabilistik atau stokastik dari data deret waktu (time series) dengan menggunakan nilai masa lalu dan sekarang dari variabel dependen untuk menghasilkan peramalan jangka pendek yang akurat dengan mengabaikan variabel independennya. Hal ini terjelaskan dengan prinsip dari metode ini yaitu “let the data speak for themselves”.
read more
Metode peramalan dengan menggunakan ARIMA dapat kita jumpai dalam peramalan ekonomi, analisis anggaran, kontrol terhadap proses dan kualitas, analisis sensus, perubahan struktur harga industri, inflasi, indeks harga saham, perkembangan nilai tukar terhadap mata uang asing dsb.
Beberapa keuntungan yang dapat diperoleh dengan menggunakan ARIMA:
1) Merupakan model tanpa teori karena variabel yang digunakan adalah nilai-nilai lampau dan kesalahan yang mengikutinya.
2) Memiliki tingkat akurasi peramalan yang cukup tinggi karena setelah mengalami pengukuran kesalahan peramalan mean absolute error, nilainya mendekati nol.
3) Cocok digunakan untuk meramal sejumlah variabel dengan cepat, sederhana, akurat dan murah karena hanya membutuhkan data variabel yang akan diramal.
Model ARIMA menggunakan pendekatan iteratif dalam indentifikasi terhadap suatu model yang ada. Model yang dipilih diuji lagi dengan data masa lampau untuk melihat apakah model tersebut menggambarkan keadaan data secara akurat atau tidak. Suatu model dikatakan sesuai (tepat) jika residual antara model dengan titik-titik data historis bernilai kecil, terdistribusi secara acak dan bebas satu sama lainnya.
Pemilihan model terbaik dapat dilakukan dengan membandingkan distribusi koefisien-koefisien autocorrelation (otokorelasi) dari data time series tersebut dengan distribusi teoritis dari berbagai macam model.

Tahapan Metode ARIMA (Skripsi dan tesis)


Metode ARIMA menggunakan pendekatan iteratif dalam mengidentifikasi suatu model yang paling tepat dari berbagai model yang ada. Model sementara yang telah dipilih diuji lagi dengan data historis untuk melihat apakah model sementara yang terbentuk tersebut sudah memadai atau belum. Model sudah dianggap memadai apabila residual (selisih  hasil peramalan dengan data historis) terdistribusi secara acak, kecil dan independen satu sama lain. Langkah-langkah penerapan metode ARIMA secara berturut-turur adalah : identifikasi model, estimasi parameter model, diagnostic checking, dan peramalan (forecasting).
a.   Identifikasi model
Seperti yang dijelaskan sebelumnya bahwa model ARIMA hanya dapat diterapkan  untuk deret waktu yang stasioner. Oleh karena itu, pertama kali yang harus dilakukan adalah menyelidiki apakah data yang kita gunakan sudah stasioner atau belum. Jika data tidak stasioner, yang perlu dilakukan adalah memeriksa pada pembedaan beberapa data akan stasioner, yaitu menentukan berapa nilai d. Proses ini dapat dilakukan dengan menggunakan koefisien ACF(Auto Correlation Function), atau uji akar-akar unit (unit roots test) dan derajat integrasi. Jika data sudah stasioner sehingga tidak dilakukan pembedaan terhadap data runtun waktu maka d diberi nilai 0.
Disamping menentukan d, pada tahap ini juga ditentukan berapa jumlah nilai lag residual (q) dan nilai lag dependen (p) yang digunakan dalam model. Alat utama yang digunakan untuk mengidentifikasi q dan p adalah ACF dan PACF (Partial Auto Correlation Funtion / Koefisien Autokorelasi Parsial), dan correlogram yang menunjukkan plot nilai ACF dan PACF terhadap lag.
Koefisien autokorelasi parsial mengukur tingkat keeratan hubungan antara Xt dan Xt-k sedangkan pengaruh dari time lab 1,2,3,…,k-1 dianggap konstan. Dengan kata lain, koefisien autokorelasi parsial mengukur derajat hubungan  antara nilai-nilai sekarang dengan nilai-nilai sebelumnya (untuk time lag tertentu), sedangkan pengaruh nilai variabel time lab yang lain dianggap konstan. Secara matematis, koefisien autokorelasi parsial berorde m didefinisikan sebagai koefisien autoregressive terakhir dari model AR(m)

Estimasi
Setelah menetapkan model sementara dari hasil identifikasi, yaitu menentukan nilai p, d, dan q, langkah berikutnya adalah melakukan estimasi paramater autoregressive dan moving average yang tercakup dalam model (Firmansyah, 2000). Jika teridentifikasi proses AR murni maka parameter dapat diestimasi dengan menggunakan kuadrat terkecil (Least Square). Jika sebuah pola MA diidentifikasi maka maximum likelihood atau estimasi kuadrat terkecil, keduanya membutuhkan metode optimisasi non-linier(Griffiths, 1993),  hal ini terjadi karena adanya unsur moving average yang menyebabkan ketidak linieran parameter (Firmansyah, 2000). Namun, saat ini sudah tersedia berbagai piranti lunak statistik yang mampu menangani perhitungan tersebut sehingga kita tidak perlu khawatir mengenai estimasi matematis.
c.      Diagnostic Checking
Setelah melakukan estimasi dan mendapatkan penduga paramater, agar model sementara dapat digunakan untuk peramalan, perlu dilakukan uji kelayakan terhadap model tersebut. Tahap ini disebut diagnostic checking, dimana pada tahap ini diuji apakah spesifikasi model sudah benar atau belum. Pengujian kelayanan ini dapat dilakukan dengan beberapa cara.
(1)   Setelah estimasi dilakukan, maka nilai residual dapat ditentukan. Jika nilai-nilai koefisien autokorelasi residual untuk berbagi time lag tidak berbeda secara signifikan dari nol, model dianggap memadai untuk dipakai sebagai model peramalan.
(2)  Menggunakan statistik Box-Pierce Q, yang dihitung dengan formula :

(3)  Menggunakan varian dari statistik Box-Pierce Q, yaitu statistik Ljung-Box(LB), yang dapat dihitung dengan :
Sama seperti Q statistik, statistik LB mendekati c2 kritis dengan derajat kebebasan m. Jika statistik LB lebih kecil dari nilai ckritis, maka semua koefisien autokorelasi dianggap tidak berbeda dari nol, atau model telah dispesifikasikan dengan benar. Statistik LB dianggap lebih unggul secara statistik daripada Q statistik dalam menjelaskan sample kecil.
(4) Menggunakan t statistik untuk menguji apakah koefisien model secara individu berbeda dari nol. Apabila suatu variabel tidak signifikan secara individu berarti variabel tersebut seharusnya dilepas dari spesifikasi model lain kemudian diduga dan diuji. Jika model sementara yang dipilih belum lolos uji diagnostik, maka proses pembentukan model diulang kembali. Menemukan model ARIMA yang terbaik merupakan proses iteratif.
d.       Peramalan (forecasting)
Setelah model terbaik diperoleh, selanjutnya peramalan dapat dilakukan. Dalam berbagai kasus, peramalan dengan metode ini lebih dipercaya daripada peramalan yang dilakukan dengan model ekonometri tradisional. Namun, hal ini tentu saja perlu dipelajari lebih lanjut oleh para peneliti yang tertarik menggunakan metode serupa.
            Berdasarkan ciri yang dimilikinya, model runtun waktu seperti ini lebih cocok untuk peramalan dengan jangkauan sangat pendek, sementara model struktural lebih cocok untuk peramalan dengan jangkauan panjang (Mulyono, 2000 dalam Firmansyah, 2000)

Stasioneritas Data Dalam Arima (skripsi dan tesis)


     Data yang tidak stasioner memiliki rata-rata dan varian yang tidak konstan sepanjang waktu. Dengan kata lain, secara ekstrim data stasioner adalah data yang tidak mengalami kenaikan dan penurunan. Selanjutnya regresi yang menggunakan data yang tidak stasioner biasanya mengarah kepada regresi lancung. Permasalahan ini muncul diakibatkan oleh variabel (dependen dan independen) runtun waktu terdapat tren yang kuat (dengan pergerakan yang menurun maupun meningkat). Adanya tren akan menghasilkan nilai R2 yang tinggi, tetapi keterkaitan antar variabel akan rendah (Firmansyah, 2000).
       Model ARIMA mengasumsikan bahwa data masukan harus stasioner. Apabila data masukan tidak stasioner perlu dilakukan penyesuaian untuk menghasilkan data yang stasioner. Salah satu cara yang umum dipakai adalah metode pembedaan (differencing). Metode ini dilakukan dengan cara mengurangi nilai data pada suatu periode dengan nilai data periode sebelumnya.
         Untuk keperluan pengujian stasioneritas, dapat dilakukan dengan beberapa metode seperti autocorrelation function (correlogram), uji akar-akar unit dan derajat integrasi.
a.       Pengujian stasioneritas berdasarkan correlogram

Suatu pengujian sederhana terhadap stasioneritas data adalah dengan menggunakan fungsi koefisien autokorelasi (autocorrelation function / ACF). Koefisien ini menunjukkan keeratan hubungan antara nilai variabel yang sama tetapi pada waktu yang berbeda. Correlogram merupakan peta / grafik dari nilai ACF pada berbagai lag. Secara matematis rumus koefisien autokorelasi adalah (Sugiharto dan Harijono, 2000:183) :


Untuk menentukan apakah nilai koefisien autokorelasi berbeda secara statistik dari nol dilakukan sebuah pengujian. Suatu runtun waktu dikatakan stasioner atau menunjukkan kesalahan random adalah jika koefisien autokorelasi untuk semua lag secara statistik tidak berbeda signifikan dari nol atau berbeda dari nol hanya untuk berberapa lag didepan. Untuk itu perlu dihitung kesalahan standard dengan rumus :
Dimana n menunjukkan jumlah observasi. Dengan interval kepercayaan yang dipilih, misalnya 95 persen, maka batas signifikansi koefisien autokorelasi adalah :
Suatu koefisien autokorelasi disimpulkan tidak berbeda secara signifikan dari nol apabila nilainya berada diantara rentang tersebut dan sebaliknya. Apabila koefisien autokorelasi berada diluar rentang, dapat disimpulkan koefisien tersebut signifikan, yang berarti ada hubungan signifikan antara nilai suatu variabel dengan nilai variabel itu sendiri dengan time lag 1 periode.

Pengertian ARIMA (skripsi dan tesis)


Teknik analisis data dengan metode ARIMA dilakukan karena merupakan teknik untuk mencari pola yang paling cocok dari sekelompok data (curve fitting), dengan demikian ARIMA memanfaatkan sepenuhnya data masa lalu dan sekarang untuk melakukan peramalan jangka pendek yang akurat (Sugiarto dan Harijono, 2000). ARIMA seringkali ditulis sebagai ARIMA (p,d,q) yang memiliki arti bahwa p adalah orde koefisien autokorelasi, d adalah orde / jumlah diferensiasi yang dilakukan (hanya digunakan apabila data bersifat non-stasioner) (Sugiharto dan Harijono, 2000) dan q adalah orde dalam koefisien rata-rata bergerak(moving average).

Penaksiran Parameter Dalam Arima (skripsi dan tesis)

Ada dua cara yang mendasar untuk mendapatkan parameter-parameter tersebut: a. Dengan cara mencoba-coba (trial and error), menguji beberapa nilai yang berbeda dan memilih satu nilai tersebut (atau sekumpulan nilai, apabila terdapat lebih dari satu parameter yang akan ditaksir) yang meminimumkan jumlah kuadrat nilai sisa (sum of squared residual). b. Perbaikan secara iteratif, memilih taksiran awal dan kemudian membiarkan program komputer memperhalus penaksiran tersebut secara iteratif.

Musiman dan Model ARIMA (skripsi dan tesis)

 Musiman didefinisikan sebagai suatu pola yang berulang-ulang dalam selang waktu yang tetap. Untuk data yang stasioner, faktor musiman dapat ditentukan dengan mengidentifikasi koefisien autokorelasi pada dua atau tiga time-lag yang berbeda nyata dari nol. Autokorelasi yang secara signifikan berbeda dari nol menyatakan adanya suatu pola dalam data. Untuk mengenali adanya faktor musiman, seseorang harus melihat pada autokorelasi yang tinggi. Untuk menangani musiman, notasi umum yang singkat adalah: ARIMA (p,d,q) (P,D,Q) S Dimana (p,d,q) = bagian yang tidak musiman dari model (P,D,Q) = bagian musiman dari model S = jumlah periode per musim 

Stasioneritas dan Nonstasioneritas Dalam ARIMA (skripsi dan tesis)

 Hal yang perlu diperhatikan adalah bahwa kebanyakan deret berkala bersifat nonstasioner dan bahwa aspek-aspek AR dan MA dari model ARIMA hanya berkenaan dengan deret berkala yang stasioner. Stasioneritas berarti tidak terdapat pertumbuhan atau penurunan pada data. Data secara kasarnya harus horizontal sepanjang sumbu waktu. Dengan kata lain, fluktuasi data Tahap 1 : Identifikasi Tahap 2 : Penaksiran dan Pengujian Tahap 3 : Penerapan Rumuskan kelompok modelmodel yang umum Penetapan model untuk sementara Penaksiran parameter pada model sementara Pemeriksaan diagnosa (apakah model memadai) Gunakan model untuk peramalan tidak ya berada di sekitar suatu nilai rata-rata yang konstan, tidak tergantung pada waktu dan varians dari fluktuasi tersebut pada pokoknya tetap konstan setiap waktu. Suatu deret waktu yang tidak stasioner harus diubah menjadi data stasioner dengan melakukan differencing. Yang dimaksud dengan differencing adalah menghitung perubahan atau selisih nilai observasi. Nilai selisih yang diperoleh dicek lagi apakah stasioner atau tidak. Jika belum stasioner maka dilakukan differencing lagi. Jika varians tidak stasioner, maka dilakukan transformasi logaritma

Prinsip Dasar ARIMA (skripsi dan tesis)

Prinsip Dasar ARIMA sering juga disebut metode runtun waktu Box-Jenkins. ARIMA sangat baik ketepatannya untuk peramalan jangka pendek, sedangkan untuk peramalan jangka panjang ketepatan peramalannya kurang baik. Biasanya akan cenderung flat (mendatar/konstan) untuk periode yang cukup panjang. Model Autoregresif Integrated Moving Average (ARIMA) adalah model yang secara penuh mengabaikan independen variabel dalam membuat peramalan. ARIMA menggunakan nilai masa lalu dan sekarang dari variabel dependen untuk menghasilkan peramalan jangka pendek yang akurat. ARIMA cocok jika observasi dari deret waktu (time series) secara statistik berhubungan satu sama lain (dependent)

Pengukuran Kesalahan Prakiraan (skripsi dan tesis)


2.6.1 Rata-rata kesalahan (average/mean error)
Kesalahan atau error menunjukkan besar selisih antara nilai aktual
dengan nilai yang diramalkan, et = Xt - Ft . Maka nilai kesalhan dapat
bernilai positif ataupun negatif. Bernilai negatif apabila nilai prakiraan
melebihi dari nilai aktual dan bernilai positif apabila nilai prakiraan
lebih kecil dari yang aktual.
Namun mean error sulit untuk menentukan kesalahan error secara
keseluruhan, karena penjumlahan nilai positif dan negatif akan saling
melemahkan dan dapat menambah kesalahan.
2.6.2 Mean Absolute Deviation (MAD)
Berbeda dengan mean error, pada mean absolute deviation nilai
kesalahan dari prakiraan dengan aktual diubah kedalam nilai mutlak
positif. Hal ini bertujuan untuk mengantisipasi adanya nilai positif dan
negatif yang akan saling melemahkan atau menambah perhitungan
kesalahan pada penjumlahan dengan begitu akan didapat berapa besar
nilai penyimpangan dari hasil prakiraan.
2.6.3 Mean Percentage Error (MPE) dan Mean Absolute Percentage Error
(MAPE) MPE adalah rata-rata dari presentase kesalahan (selisih nilai
aktual dan prakiraan).
Sedangkan MAPE juga merupakan nilai rata-rata kesalahan, namun
memberikan nilai absolute pada selisih nilai aktual dengan nilai hasil
prakiraan. MAPE merupakan nilai indikator yang biasa digunakan
untuk menunjukkan performance atau keakuratan pada hasil proses
prakiraan.