GNSS坐标时间序列异常值检测文献综述

 2023-04-16 10:41:11

文献综述

近年来,对于GNSS坐标时间序列异常值检测,国内外在该领域的理论研究已有一定的成果[16]。

通过文献整理,从多维角度来说将其归纳为两种主流路,第一种是将原始多维时间序列经过数据预处理之后转换为单维的时间序列,然后利用单维时间序列异常检测的相关理论发现异常;第二种是通过研究新的算法或者改进算法直接对预处理后的多维时间子序列进行异常检测。

目前对于第一种思路的理论研究相对成熟,但是该思路比较适合对于小型数据的异常检。

第二种思路目前虽处在初步研究阶段,但是该思路理论上能够满足更大规模时间序列的异常检测,因此本文认为今后的发展研究方向将侧重于第二种思路的理论研究[1][2]。

异常检测是指在数据中发现与期望行为不符的数据模式[14][15]。

异常检测方法中,直接投影法适用于简单的分析任务,或者是做结果展示,但是对于大规模多维异构数据,很难找到合适的手段去应对,需要背景知识和专家经验.聚类方法适用正常数据偏多、与异常数据差距较大的数据分析任务中,而不同聚类方法的选择和调参没有一个很好的指导方法。

机器学习算法适合于大规模数据且有标注数据的异常检测任务,但是人工数据标注引入的误差、时间和人力成本带来了许多局限性[12][13][14]。

广泛深入的文献研究结果显示,当前主流的时间序列异常值检测方法基本上都是针对 ARMA 或 ARIMA 模型的,即假定变量为一元连续型的随机变量,对现实生活中广泛存在的不是一元连续型的时间序列数据,特别是对整值时间序列或多元时间序列数据的异常值检测研究严重不足。

非线性 GNSS 坐标时间序列中存在异常值探测困难的问题,因此需要引入局部异常因子 LOF 算法,能够对数据中的局部异常值进行准确的探测,并将该算法与经典的 IQR 方法相结合,从而提升了 LOF 算法的灵活性和适用性。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。