大三上第十二周组会回顾

上上周的组会主要是确定了数据集的问题，老师安排了来自字节跳动和挑战赛的两份数据集。

学长让我处理挑战赛的数据集，学长本人处理字节跳动的数据集。

上周的组会的内容主要就是我们两人汇报自己的处理结果。

老师认为挑战赛的数据比较适合研究，再加上由于我知识有限，处理的不太到位，以及学长需要本人了解数据集的结构，所以上周学长再次处理了挑战赛的数据集，就没给我安排其他工作。

由于我自己处理，得出了对这份数据集一个初步的认知，今天组会学长和老师再根据这份数据集进行了讨论，让我有了更多的收获。

数据集来源是一个集群，里面有node-1~node-6六个节点（物理机）。

我们需要研究的是部署在其上的服务（service），多个服务共同构成一个微服务架构。

实际上部署服务的节点主要是node-5和node-6。

不同的服务分散在这两个节点上（二者有共同的服务），并且每个service有三个实例（封装成container）。

服务之间有相对复杂的调用关系和拓扑结构。

因此各个服务的时间序列异常也许会有较强的关联。

每个service约有40+个指标（KPI）。

因此实际上会有成百上千个时间序列。

目标是在微服务的层次上进行多指标时间序列异常检测。

实际上在上周处理AIOps挑战赛复赛数据集的时候就已经对此有一个大致的认知了，但是这个认知是模糊的。此前对于课题组的大致方向也不是很理解。

但是经过学长重新整理了一遍数据框架，以及听了学长和老师的讨论之后，不管是对数据集还是对研究方向都有了更深的认知。