前言

上上周的组会主要是确定了数据集的问题,老师安排了来自字节跳动和挑战赛的两份数据集。

学长让我处理挑战赛的数据集,学长本人处理字节跳动的数据集。

上周的组会的内容主要就是我们两人汇报自己的处理结果。

老师认为挑战赛的数据比较适合研究,再加上由于我知识有限,处理的不太到位,以及学长需要本人了解数据集的结构,所以上周学长再次处理了挑战赛的数据集,就没给我安排其他工作。

由于我自己处理,得出了对这份数据集一个初步的认知,今天组会学长和老师再根据这份数据集进行了讨论,让我有了更多的收获。

正文

数据集来源是一个集群,里面有node-1~node-6六个节点(物理机)。

我们需要研究的是部署在其上的服务(service),多个服务共同构成一个微服务架构。

实际上部署服务的节点主要是node-5和node-6。

不同的服务分散在这两个节点上(二者有共同的服务),并且每个service有三个实例(封装成container)。

服务之间有相对复杂的调用关系和拓扑结构。

因此各个服务的时间序列异常也许会有较强的关联。

每个service约有40+个指标(KPI)。

因此实际上会有成百上千个时间序列。

目标是在微服务的层次上进行多指标时间序列异常检测。

总结

实际上在上周处理AIOps挑战赛复赛数据集的时候就已经对此有一个大致的认知了,但是这个认知是模糊的。此前对于课题组的大致方向也不是很理解。

但是经过学长重新整理了一遍数据框架,以及听了学长和老师的讨论之后,不管是对数据集还是对研究方向都有了更深的认知。