亮点:集成思想(但是没看懂)
基于RNNS和XGBOOST集成模型的出租车需求预测
目前已有一些预测出租车需求的工作。很少有研究考虑诸如医院面积、百货商场面积、居住区和游客吸引力。
一个预测模型可能不适合所有类型的区域。我们使用一个兴趣点(POI)来匹配出租车需求和地点。
研究不同功能地区的出租车需求。
利用7种区域面积函数对出租车每小时需求进行预测
这个实验选择的模型是LSTM、GRU和xgBoosting。然后,我们提出了集成模型可以预测所有类型区域
真实世界的数据集,由泰国曼谷的5,000多辆出租车产生,为期4个月。
关键词:时空数据
前人工作:(省略各种几把废话)
提出了一种多层次的出租车需求预测模型集中方法和领先的出租车预订数据应用于印度班加罗尔市。
应用了很多线性预测模型,如Holt-Winters(HW)模型,季节性幼稚,STL分解,ARIMA,TBATS。表明STL具有最佳性能。
we aggregated demand of taxi within 200 meter radius of a point of interest (POI) which is a place such as a
hospital, an airport, and a subway.
我们在200米范围内汇总了出租车的需求,兴趣点(POI)的半径
此次采样率数据集是5秒。
对于曼谷的历史天气数据,我们使用openweathermap.org中的每小时数据采样率。
我们将天气数据重新分类为清晰\多雨
时间戳 采样点的时间戳
纬度/经度 样本点的GPS位置
速度 采样点的出租车当前速度
角度 采样点处的出租车的当前方向
仪表 指示出租车是否是的状态是否被占用(状态为0,可用时,占用时成为1
特征
预测模型有6个主要特征。
1)提货数量
2)一天中的小时
3)星期几
4)一个月的日子
5)天气
6)国定假日
我们还应用了滚动窗口技术拾音器数量。 设n(t)为挑选的数量 -时间步t和w是我们想要的窗口大小回顾一下,如果我们想要预测n(t),我们也会使用n(t-1),n(t-2),..,n(t-w)作为额外的特征。 窗口尺寸w是24英寸这项研究。
集成模型
隐藏层包含150个神经元。 系数分别为0.7,0.2和0.1。滑动窗口大小为3
对称均值绝对错误(sMAPE):
对于独立模型,LSTM在低出租车中提供最准确的预测
需求区域,如住宅区,医院和教育区。 LSTM在所有类型中都比GRU获得更好的结果
区。 XGBOOST模型比其他模型提供更好的结果在高的出租车需求区域,如百货商店,地铁和机场区域。
这项研究表明,单一的预测模型无法在所有领域提供最佳预测。结合各种模型的预测可以改善性能