Azure机器学习服务正式推出时间序列预测功能

人工智能2021-02-22 06:04:42
最佳答案

微软云端机器学习服务,推出多项时间序列新功能,包括了新的预测函式、时间序列交叉验证(Rolling Origin Cross Validation)以及时间视窗聚合功能等,除了能减少预测模型可能发生的误差外,也套用新的模型特徵增加预测精準度。

用户在处理时间序列资料时,根据预测应用的情境不同,需要更缜密地考量资料的状态,像是可能需要针对每个预测重新训练模型,或是克服历史资料存在断层的状况(下图),而微软新加入的预测函式,是一种检索预测值的新方法,能够解决以上的问题。

物联网的应用常会遇到训练与预测资料存在差距的状况,而使得训练出来的模型变得不精準,微软解释,资料的变化应该反映在模型训练上,但对于物联网这类高频率的应用,感测器的资料不断变化,且受外部影响甚巨,因此即时重新训练模型显得不切实际。而新的预测函式则可以让用户新增近期预测上下文(Prediction Context),自动修正因资料断层带来的模型预测误差,内插必要的训练与预测上下文。

在时间序列资料验证上,微软为用户提供了时间序列交叉验证功能,微软表示,交叉验证是量测和减少模型採样错误的重要程序,但当资料进行分区(Partitioning)却不考量时间因素,可能导致预测错误,因为在时间序列资料上,必须确保测试的资料仅能使用过去的值。

而使用时间序列交叉验证作为评估时间序列资料的机器学习标準方法,会使用一个原始时间点(Origin Time Point)切开训练和验证资料,藉由滑动原始时间点产生交叉验证折叠,以确保资料正确的顺序。时间序列交叉验证会在预测功能中自动应用,用户只需要传递训练和验证资料,以及想要进行交叉验证的折数即可。

时间序列推荐功能中,也增加了滞后(Lags)和时间视窗聚合以增加预测的精确度,在Azure机器学习服务中的自动化机器学习,用户现在可以指定目标滞后作为模型的一种特徵,并设定资料滞后的时间区间长度。另外,用户可能可以需要设定一个时间视窗,以聚合时间视窗中的数值,对于预测能源需求的这类应用特别有用,用户可以将时间视窗设定为三天(下图),将不同的影响因素都纳入考量。微软提到,滞后与累加功能,能提供额外的资料特徵,因此可在提升模型的準确性。

针对销售等容易受假日影响的预测应用,微软新增了假日功能,系统可以在现存的资料集中,为每一个假日创建一个视窗,用于精确的预测假日对模型的影响,微软表示,由于假日对于特定应用影响很大,行为模式甚至与平常日子完全不同,因此现在支援110个国家超过两千个节日,用户只要在时间序列设定中,输入国家代码,系统便会自动修正模型在假日中的行为。

免责声明:本文由用户上传,如有侵权请联系删除!