• 文件
  • 知识库

ARIMA和混合ARIMA-LSTM模型对颗粒物浓度的预测性能评估

原标题:Predictive Performance Evaluation of ARIMA and Hybrid ARIMA-LSTM Models for Particulate Matter Concentration

Johanes Dian KurniawanH. ParhusipSuryasatria Trihandaru

(2024)

|

5

关键词

ARIMA
Hybrid ARIMA-LSTM
Particulate Matter
Prediction
Air Quality
PM1.0
PM2.5
RMSE
Error Ratio
Long Short-Term Memory

摘要

本研究通过比较ARIMA和混合ARIMA-LSTM模型对工业环境空气质量数据的预测,客观评估了工业利益相关者颗粒物政策预测性能模型。在PM 1.0浓度的情况下,ARIMA模型的RMSE值为8.29,误差比为0.45,而混合ARIMA-LSTM模型的RMSE值为3.54,误差比为0.22。同时,对于PM 2.5浓度,ARIMA模型的RMSE值为6.61,误差比为0.66,而混合ARIMA-LSTM模型的RMSE值为2.68,误差比为0.19。根据这项研究,自动ARIMA中找到的最佳ARIMA模型为PM1.0的(2,0,1)和PM2.5的(1,0,1)。混合ARIMA-LSTM模型在预测准确性方面优于ARIMA模型,这从RMSE和误差比值中可以看出,分别提高了约57.30%和51.11%(针对PM1.0),以及59.46%和71.21%(针对PM2.5)。这是因为混合ARIMA-LSTM模型能够适应可变长度序列并捕捉长期关系,从而具备抗噪能力,使得更高的预测准确性成为可能。

AI理解论文

图片加载中
预览
图片加载中
预览
图片加载中
预览
图片加载中
预览
图片加载中
预览
图片加载中
预览
图片加载中
预览

该文档是一篇关于ARIMA(自回归积分滑动平均)和混合ARIMA-LSTM(长短期记忆)模型在预测工业环境中空气质量数据中的颗粒物浓度(PM1.0和PM2.5)的预测性能评估的研究论文。以下是对该论文的详细总结:

引言

论文首先指出,随着城市化进程的加快,空气质量问题日益成为公共健康和环境可持续性的重要议题。**颗粒物(PM)**是空气污染的一个关键因素,因其微小的固体和液体颗粒能够进入人体呼吸系统,导致健康问题,如肺癌、心脏病、中风和呼吸系统疾病。因此,监测环境中的PM1.0和PM2.5水平并限制人们的暴露量至关重要。

研究目的

本研究的主要目的是通过比较ARIMA模型混合ARIMA-LSTM模型,找出更优的预测模型,以便为工业利益相关者提供关于颗粒物政策的客观评估。ARIMA模型是一种单变量时间序列预测技术,适用于短期预测,而LSTM是一种能够捕捉长期依赖性和非线性关系的递归神经网络,适用于处理复杂和噪声较大的序列数据。

方法

研究采用了多阶段的方法来创建ARIMA和混合ARIMA-LSTM模型。具体步骤包括:

  1. 数据收集:从传感器收集数据,使用PM1.0和PM2.5属性来预测空气质量值。数据收集时间为2023年11月至2024年2月,共计310,080条数据。

  2. 数据预处理:清理和准备原始数据以输入统计模型或机器学习算法。预处理技术包括删除多余的数据列、索引日期时间数据、将数据重新采样为每小时数据、去除异常值以及去除零值和NaN值。

  3. 数据标准化:确保不同属性的数值在相似的尺度上,以支持机器学习模型的可解释性、效率和稳定性。

  4. 创建监督数据集:为监督学习方案创建数据集,以预测未来的空气质量数据。

模型构建

  • ARIMA模型:通过差分、平稳性测试和参数选择来构建ARIMA模型。
  • 混合ARIMA-LSTM模型:结合ARIMA的线性建模能力和LSTM处理可变长度序列及长期依赖的能力,提供更准确和适应性更强的颗粒物浓度预测方法。

结果与讨论

研究结果表明,混合ARIMA-LSTM模型在预测PM1.0和PM2.5浓度方面优于单独的ARIMA模型。具体表现为:

  • 对于PM1.0浓度,ARIMA模型的**均方根误差(RMSE)**为8.29,误差比为0.45,而混合模型的RMSE为3.54,误差比为0.22。
  • 对于PM2.5浓度,ARIMA模型的RMSE为6.61,误差比为0.66,而混合模型的RMSE为2.68,误差比为0.19。

混合模型在PM1.0和PM2.5的RMSE和误差比上分别提高了约57.30%和51.11%,以及59.46%和71.21%。这种优越性能归因于混合模型能够处理可变长度序列并捕捉长期关系,使其对噪声更具抵抗力并提高预测准确性。

结论

论文结论指出,混合ARIMA-LSTM模型由于其在处理复杂和噪声较大的序列数据中的优势,成为预测工业环境中空气质量数据的更优选择。该模型不仅能够有效处理短期趋势,还能捕捉长期模式,为工业利益相关者提供更准确的颗粒物浓度预测。

专业术语解释

  • ARIMA:一种用于时间序列预测的统计模型,适合线性和短期预测。
  • LSTM:一种递归神经网络,擅长处理长期依赖和非线性关系。
  • 均方根误差(RMSE):用于评估模型预测性能的指标,值越低表示模型质量越高。
  • 误差比:通过将RMSE除以特征数据的标准差来评估模型误差的指标。

通过这篇论文,读者可以全面了解ARIMA和混合ARIMA-LSTM模型在预测空气质量数据中的应用及其性能比较。

Chat Paper

当前问答基于全文

转入私有库对话