Prediksi Tingkat Polusi Udara Dengan Data Mining

##plugins.themes.academic_pro.article.main##

Hikmah Dwiyanti Nasir
Dahlia Nur
Zawiyah Saharuna

Abstract

Polusi udara di kota besar menjadi masalah bagi lingkungan. World Health Organitation (WHO) menyimpulkan bahwa 4,2 juta orang meninggal setiap tahun karena polusi udara. Polusi udara tidak hanya berdampak buruk pada manusia tetapi juga pada lingkungan yang dapat menyebabkan hujan asam, kabut asap, memburuknya lapisan ozon dan pemanasan global. Oleh karena itu, salah satu upaya pencegahan yang dapat dilakukan adalah memprediksi polusi udara. Pada penelitian ini, dilakukan prediksi polusi udara dengan memanfaatkan data historis parameter PM2.5 dan PM10 untuk kota Jakarta Pusat dari tahun 2015-2020 milik Air Quality Index (AQICN). Data kemudian diproses melalui tahap preprocessing dengan mengisi nilai yang kosong (null). Data diproses ke dalam Model Autoregressive Integrated Moving Average (ARIMA) menggunakan metode Time Series Analysis. Proses ARIMA melalui beberapa tahap yang perlu dilakukan untuk mendapatkan model yang paling sesuai, dengan melakukan differencing, melihat plot ACF dan PACF, dan menguji beberapa model. Sehingga diperoleh akurasi tertinggi pada prediksi PM2.5 tahun 2020 dan 2021 dengan model SARIMA(5,1,5)(1,1,1)12 yaitu 90,05% dan 94.67%, sedangkan untuk PM10 prediksi pertama menggunakan model SARIMA(5,1,4)(1,1,1)12 dengan akurasi 85,36 % dan prediksi kedua dengan model SARIMA(4,1,4)(1,1,1)12 dengan akurasi 88,49%. Dari penelitian ini disimpulkan bahwa model ARIMA terbaik akan didapatkan dengan melakukan “multipel hipotesis†dengan menguji beberapa model yang memiliki skor AIC terkecil.

##plugins.themes.academic_pro.article.details##

References

  1. M. A. Esfandani and H. Nematzadeh, “Predicting air pollution in Tehran : Genetic algorithm and back propagation neural network,†vol. 4, no. 1, pp. 49–54, 2016.
  2. K. G. Ri, R. Manimegalai, G. D. M. Si, R. Si, U. Ki, and R. B. Ni, “Air Pollution Analysis Using Enhanced K-Means Clustering Algorithm for Real Time Sensor Data,†no. August 2006, pp. 1945–1949, 2016.
  3. R. Raturi and J. R. Prasad, “Recognition of Future Air Quality Index Using Artificial Neural Network,†pp. 3–6, 2018.
  4. H. Widowati, “Berapa Jumlah Kendaraan di DKI Jakarta?,†2019. [Online]. Available: https://databoks.katadata.co.id/datapublish/2019/08/02/berapa-jumlah-kendaraan-di-dki-jakarta. [Accessed: 19-Jul-2020].
  5. S. G. A. J. H. Sulistyarso, “Strategi Pengembangan Kebijakan Penurunan Emisi Kendaraan di Kawasan Senayan, Jakarta,†vol. 8, no. 2, 2020.
  6. S. Taneja, N. Sharma, K. Oberoi, and Y. Navoria, “Predicting trends in air pollution in Delhi using data mining,†India Int. Conf. Inf. Process. IICIP 2016 - Proc., pp. 1–6, 2017.
  7. S. Barak and S. S. Sadegh, “Forecasting energy consumption using ensemble ARIMA-ANFIS hybrid algorithm,†Int. J. Electr. Power Energy Syst., vol. 82, pp. 92–104, 2016.
  8. S. Siami-Namini and A. S. Namin, “Forecasting Economics and Financial Time Series: ARIMA vs. LSTM,†pp. 1–19, 2018.
  9. C. M. Davis, J. M. Hardin, T. Bohannon, and J. Oglesby, “Data mining applications in higher education,†Data Min. Methods Appl., pp. 123–148, 2007.
  10. S. S. N. A. S. Namin, “Forecasting Economic And Financial Time Series: ARIMA Vs. LSTM,†pp. 1–19, 2018.
  11. D. Hatidja, “Penerapan Model ARIMA untuk memprediksi Harga Saham PT. Telkom Tbk.,†2011.
  12. J. Brownlee, “How to Decompose Time Series Data into Trend and Seasonality,†2017. [Online]. Available: https://machinelearningmastery.com/decompose-time-series-data-trend-seasonality/. [Accessed: 04-Jun-2020].
  13. M. As’ad, S. S. Wibowo, and E. Sophia, “Peramalan Jumlah Mahasiswa Baru Dengan Model Autoregressive Integrated Moving Average (Arima),†J I M P - J. Inform. Merdeka Pasuruan, vol. 2, no. 3, pp. 20–33, 2017.
  14. Aasim, S. N. Singh, and A. Mohapatra, “Repeated wavelet transform based ARIMA model for very short-term wind speed forecasting,†Renew. Energy, vol. 136, pp. 758–768, 2019.
  15. A. I. M. Keith W. Hipel, Ed., “Chapter 12 seasonal autoregressive integrated moving average models,†in Developments in Water Science, 1994, pp. 419–462.
  16. P. M. Swamidass, Ed., “MAPE (mean absolute percentage error)Mean Absolute Percentage Error (MAPE),†in Encyclopedia of Production and Manufacturing Management, Boston, MA: Springer US, 2000, p. 462.
  17. P. Ramos, N. Santos, and R. Rebelo, “Performance of state space and ARIMA models for consumer retail sales forecasting,†Robot. Comput. Integr. Manuf., pp. 1–13, 2015.