2022, 39(2):75-82.
摘要:针对时间序列分析方法和神经网络对于股价预测具有一定局限性的问题,将基于Attention机制的LSTM模型应用于股价预测;以2014-01-02—2020-09-22日的上证工业指数、上证环保指数等相关数据为样本,在LSTM模型中引入Attention机制,使模型聚焦于重要的股价特征信息,预测股票第二日的最高价;实证研究发现,相较于MLP,RNN和LSTM模型,基于Attention机制的LSTM模型的RMSE值比基准模型平均降低了3%-45%左右,4种模型对环保企业的预测精度均高于污染企业;随后将空气质量指数,温度和湿度纳入特征,提升反映污染企业和环保企业股价规律相关特征的数据质量,实证结果发现在加入新的特征以后,4种模型在预测上证工业指数和上证环保指数波动趋势时,RMSE值均下降了1%左右。
2021, 38(2):56-63.
摘要:针对具有高复杂性与非平稳性的空气质量指数(AQI)时间序列,提出一种融合非结构数据的EMD-WTS二层分解组合预测模型;首先,筛选百度指数关键词并提取对应数据,运用局部线性嵌入算法(LLE)对之降维;其次,对AQI历史序列与降维结果进行经验模态分解(EMD)与重构;接着,对所得高频项进行小波分解(WT)与重构;然后,运用Holt指数平滑法、支持向量回归(SVR)与人工神经网络(ANN)分别对二层分解结果与原始低频、趋势项进行组合预测并运用BP神经网络集成;最后,叠加集成结果得到AQI预测值;对比实验说明预测方法充分利用了多源数据信息,具有较高的预测精度。
2021, 38(3):94-99.
摘要:针对长期存在的空气污染问题,提出将空气质量的污染指标和治理指标相结合来进行分析,在一定程度上对改善我国的空气质量有一定的现实意义;以2008—2019年我国31个主要城市的面板数据为基础,从分位数回归的角度将空气质量污染指标(NO2)、经济增长(人均GDP)以及公共交通(年末实有公共汽电车运营数)对我国空气质量的影响程度进行分析;结果表明:NO2在低分位点时对空气质量产生的负向影响较大,在高分位点时较低,与之相反,人均GDP在高分位点时与空气质量的负相关程度大于低分位点,而公共交通利用率的增加对我国空气质量的改善有着正向的推动作用,且在高分位点的正向影响大于低分位点。
2021, 38(6):118-124.
摘要:为有效进行城市空气质量预测、推进城市空气污染防治, 弥补传统统计学模型在大数据时代背景下对城市空气质量预测准确率低、容错能力差等问题,提出利用随机森林回归构建城市空气质量预测模型;综合考量污染物浓度、气象参数、时间参数等多方面影响因素,通过网格搜索法调整参数的最优组合,构建基于随机森林回归算法的城市空气质量预测模型;基于重庆市2017-01-01—2020-07-31的指标数据,对重庆市空气质量进行预测分析,结果表明:在模型下训练集与测试集的确定性系数R2均在99%以上,均方误差DMSE和平均绝对误差D MAE在训练集和测试集上的取值均在可接受范围内,证实模型具有运行速度快、预测误差小、具有较高的预测精度等优点,具备较好的学习能力与泛化能力。
2020, 37(5):88-93.
摘要:基于重庆市2014—2018年的六大气体污染源PM2.5、PM10、SO2、CO、NO2、O3的月均浓度数据以及AQI(空气质量指数),对污染物的月度变化、季度变化、年度变化特征进行了描述性的分析,再根据收集的7个变量数据,运用多元回归分析,建立AQI与六大污染物之间的回归方程,运用分位数回归,对主要污染源在各个分位点上的变化进行分析。
2018, 35(3):30-34.
摘要:为有效防治大气污染,依据大气污染的各项指标值来预测城市空气质量级别并给出起主导作用的因素,提出基于随机森林的空气质量等级分类预测方法;随机森林模型直接给出影响空气质量指标的重要性评分以便于找出最重要的影响因素,比较不同的数据挖掘方法,结果显示:随机森林分类预测的准确率最高,因此该模型可广泛应用于空气质量预测中;测试集结果显示随机森林方法不易受噪声影响且泛化误差较低,重要性评分给出细颗粒物和可吸入颗粒影响为最重要的两个因素,并以保定市为例有针对性地给出提高空气质量的建议。
2018, 35(5):78-82.
摘要:针对近年来空气质量问题,利用重庆市2013-12到2017-12的空气质量资料,提出采用Ridit分析法与描述性统计相结合的方法对重庆市空气质量的变化趋势进行特征分析。结果表明:近4年来,重庆市的空气质量有逐渐变好的趋势。其中,从月份变化的角度来看,空气质量以12个月为一个周期发生变化且有逐渐变好的趋势;从季节变化的角度来看,重庆市的空气质量存在比较明显的季节性差异,其中夏季的空气质量是全年中最好的,其次是秋季与春季,冬季的空气质量最差;从年度变化的角度来看,空气质量有逐年变好的趋势。
2017, 34(3):82-87.
摘要:利用机器学习和多元线性回归模型对西安市近一年的空气质量指数进行了研究, 首先利用随机森林思想对数据进行了补齐, 然后运用交叉验证对神经网络模型选取最优的隐层节点数和训练周期数,最后,通过比较两种模型的拟合效果发现,神经网络模型在对空气质量指数的预测效果明显好于多元线性回归模型。