一种流量预测方法和装置与流程

文档序号：11253766阅读：702来源：国知局

本申请涉及通信领域，尤其涉及到一种流量预测方法和装置。

背景技术：

无线网络系统、是指电信运营商在某一地区广泛部署，为用户提供数据传输服务的通信系统。通常，无线网络系统包括两大组成部分，基站子系统以及网络子系统。其中，基站子系统直接为附近用户的终端设备提供网络接入服务。对于一个电信运营商来讲，基站的数量可达上万甚至数十万，分散地部署在各个区域，为区域进行全面覆盖。网络子系统则通过线缆将基站连接起来，为接入网络的终端设备提供数据收发服务。

在无线网络系统的规划与调整中，由于用户人流的变化、终端设备升级等因素，电信运营商会根据网络流量使用的变化，对基站、小区的数量进行适应的增减，以适应不同的流量需求。而这种增减调整是需要综合考虑未来可能的网络流量的具体使用情况，因为当网络流量使用洪峰到来时，再去采购并部署相关的基站，已经为时已晚。因此，为了适应上述未来可能的网络流量的具体使用情况，依据具体情况，需要对不同粒度(例如预设范围内的部分小区或全部小区)在不同周期(例如1或6，或12个月后)的使用流量进行预测。

现有技术中，提供了一种基于分组方式进行预测的方法，在预置范围内，先是按照小区的历史使用流量相近的原则对小区进行分组，在对某个小区的使用流量进行预测时，以该某个小区的分组下所有小区的历史使用流量作为参考数据对该某小区的使用流量进行预测。那么可以看出，基于分组方式可以抑制预测模型复杂度，但对该分组下的某个小区的使用流量进行预测时，则未考虑该部分小区与其他分组的其他相关性，只考虑了历史使用流量相近这个因素，使得在对小区进行预测时，未充分考虑到所有相关小区的信息，导致最终小区的使用流量的预测值误差较大。

技术实现要素：

本申请实施例提供了一种流量预测方法，用于解决现有技术中，对小区的使用流量进行预测时预测出来的预测值误差比较大的问题。

为了解决上述问题，本申请实施例提供以下技术方案：

第一方面，本申请实施例提供了一种流量预测方法，先获取预置范围内，所有小区的历史总使用流量数据，该历史总使用流量数据是指预置范围内所有小区之前的一些历史使用流量的总和所构成的数据，接着以获得到的所有小区的历史总使用流量数据作为输入，使用第一预测模型对预置范围内所有小区的总使用流量进行预测以获得目标预测值，最后根据目标预测值对目标小区，即预置范围内所有小区中的任意一个小区的使用流量进行预测得到目标小区的使用流量预测值。

由此可见，对于任意一个待预测小区而言，在对每个待预测小区进行预测时，根据计算出来的预置范围下所有小区的使用流量的目标预测值进行预测即可，抑制了对小区预测时的预测模型复杂度，且该目标预测值考虑到了预置范围内所有小区预测得到的，不是将小区进行分组，将预测参考小区的数目局限在部分小区，有效地减少了小区的使用流量的预测值误差。

在一种可能的实现中，根据所述目标预测值对目标小区的使用流量进行预测得到所述目标小区的使用流量预测值，包括：根据树形层级结构中，第一节点下所有小区的使用流量预测值以及第二节点下所有小区的历史总使用流量数据，使用第二预测模型对第二节点下所有小区的总使用流量进行预测，第二节点为第一节点的下级节点，其中，当第一节点为根节点时，第一节点下所有小区的总使用流量预测值为目标预测值；当确定了第三节点下所有小区的使用流量预测值后，根据第三节点下所有小区的使用流量预测值以及目标小区的历史总使用流量数据，使用第二预测模型对目标小区的使用流量进行预测得到目标小区的使用流量预测值，目标小区为第三节点下的小区。由此可以看出，在本实现中，对于树形层级结构中的顶层节点，即根节点而言，只需要训练出一个模型，利用根节点下的所有小区的历史使用总流量预测出在该根节点下所有小区的使用流量；而对于树形层级结构的中间节点，和底层节点，只需要本层下的所有小区，以及上层节点的使用流量预测值作为输入，进行预测，而不是上层节点的历史使用流量作为输入，对参数进行了有效地压缩，实测效果更好，可以使得最终的目标小区的使用流量预测值更准。

在一种可能的实现中，对预置范围内的小区进行分层以获得树形层级结构可以有多种获得方式，其中一种方式是，先获取小区工程参数；再利用获得的小区工程参数确定预置范围内小区的网络拓扑结构，最后将网络拓扑结构作为本申请实施例中的树形层级结构。即在本实现中，提出了一种获得树形层级结构的方式，提高了方案的可实施性。

在一种可能的实现中，对预置范围内的小区进行分层以获得树形层级结构还可以通过以下方式获得：先获取小区工程参数；利用获取的小区工程参数确定预置范围内各个小区的拟位置，即利用获取的小区工程参数为预置范围内的各个小区重新拟定一个位置参数，在本申请实施例中定义为拟位置，最后根据各个小区的拟位置对预置范围所有小区进行分层以获得树形层次结构。由此可见，在本实现提出了另一种获得树形层级结构的方式，提高了方案的多样性。示例性的，在一种可能的实现中，根据小区工程参数确定各个小区的拟位置，可以依据下述公式确定确定各个小区的拟位置(xcell、ycell)：

xcell＝xsite*(λ*ptrx)*h*sin(α)*cos(θ)；

ycell＝ysite*(λ*ptrx)*h*sin(α)*sin(θ)；

其中，xsite、ysite分别为各个小区对应基站的经度、维度；xcell、ycell分别为各个小区的经度、维度，λ为预设数据，ptrx为基站的发射功率，h为各个小区的天线高度，α、θ分别为各个小区对应的天线下倾角、方向角。

在一种可能的实现中，根据各个小区的拟位置对预置范围内所有小区进行分层以获得树形层级结构可以通过对各个小区的拟位置进行层次化聚类，从而获得预置范围内所有小区的树形层级结构。

在一种可能的实现中，对各个小区的拟位置进行层次化聚类以获得树形层级结构，可以使用k-mean聚类(也称为k均值聚类)方式对各个小区的拟位置进行层次化聚类以获得树形层级结构。当然，这里只是以k-mean聚类为例，实际应用中，可以根据经验采用其他的层次化聚类方式获得，这里不做限定。

在一种可能的实现中，根据话单记录对预置范围内的小区进行分层以获得树形层级结，包括：获取话单记录；根据话单记录获取训练样本；将训练样本展开为目标根向量；对目标根向量进行层次化聚类以获得树形层级结构。在本实现中，具体提出了一种怎么利用话单记录获得预置范围内小区的树形层级结构的方式，提高了方案的可实施性。

在一种可能的实现中，所述根据所述话单记录获取训练样本，包括：查询所述话单记录得到在所述预设范围内的每个小区中，所有终端设备的流量记录信息；将所述流量记录信息作为所述训练样本。

在一种可能的实现中，对目标根向量进行层次化聚类以获得树形层级结构，包括：使用bi-clustering聚类(也称双聚类)方式对目标根向量进行层次化聚类以获得树形层级结构。

在一种可能的实现中，本申请实施例所提供的流量预测方法包括：基于第一树形层级结构、二树形层级结构以及第三树形层级结构对目标小区的使用流量进行预测以分别获得第一预测值、第二预测值和第三预测值，其中，第一树形层级结构为根据网络拓扑结构获得的树形层级结构，第二树形层级结构为根据拟位置获得的树形层级结构，第三树形层级结构为根据话单记录获得的树形层级结构；根据第一预测值、第二预测值和第三预测值得到目标小区的使用流量预测值。即在本实现中，当利用上述第一方面所获取的树形层级结构预测得到预测值时，可以利用算法以确定出目标小区的使用流量的最佳的预测值，可以有效地提高本申请实施例对目标小区的使用流量的预测准确度。

在一种可能的实现中，根据第一预测值、第二预测值和第三预测值得到目标小区的使用流量预测值之前，该方法还包括：确定预设时段内目标小区的历史使用流量数据的加权平均值，接着以所述第一预测值、第二预测值、第三预测值以及所述小区工程参数为输入，所述加权平均值为标签，基于随机森林算法进行融合，得到所述目标小区的使用流量预测值。在本实现中，在对不同树形层级结构下所得到的目标小区的使用流量预测值进行综合判定以确定出最终的目标小区的使用流量预测值，即还综合考虑了小区工程参数，因为，上述三种树形层级结构在不同网络制式、不同频段的网络上的预测值可能是不一样的，因此，在进行融合时，考虑具体的小区工程参数，可以使得最终的目标小区的使用流量预测效果更佳。

在一种可能的实现中，确定预设时段内目标小区的历史使用流量数据的加权平均值，可以通过以下方式进行：对预设时段内的目标小区的n个历史使用流量数据点进行异常检测，n为正整数，n大于或等于2；通过异常检测后获得预设时段内，历史使用流量数据点的n个异常系数；根据n个异常系数确定n个历史使用流量数据点对应的权重；根据n个历史使用流量数据点对应的权重确定目标小区在预设时段内的历史使用流量的加权平均值。

在一种可能的实现中，所述根据所述n个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值，包括：将所述n个历史使用流量数据点对应的权重进行加权平均以得到所述目标小区在预设时段内的历史使用流量数据的加权平均值。

第二方面，本申请实施例提供了一种流量预测装置包括获取模块、第一预测模块以及第二预测模块。其中，获取模块，用于获取预置范围内，所有小区的历史总使用流量数据；第一预测模块，用于将所有小区的历史总使用流量数据作为输入，使用第一预测模型对获取模块获取的预置范围内所有小区的总使用流量进行预测以获得目标预测值；第二预测模块，用于根据第一预测模块预测的目标预测值对目标小区的使用流量进行预测得到目标小区的使用流量预测值，其中，目标小区为预置范围内的任意一个小区。

在本申请的第二方面中，上述流量预测装置的组成模块还可以执行前述第一方面中各种可能的实现方式中所描述的步骤，详见前述对第一方面中各种可能的实现方式中的说明，具体此处不再做赘述。

第三方面，本申请实施例还提供另一种流量预测装置，该流量预测装置具有实现上述方法中流量预测装置的行为的功能，上述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块。在一种可能的设计中，流量预测装置的结构中包括可以包括存储器和处理器，和存储在存储器上并可在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述第一方面/第一方面中各种可能的实现方式，这里不再赘述。

第四方面，本申请提供了一种计算机可读存储介质，计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面/各实现所描述的方法，具体可参阅前述描述，这里不再进行赘述。

从以上技术方案可以看出，对于任意一个待预测小区而言，在对每个待预测小区进行预测时，根据计算出来的预置范围下所有小区的使用流量的目标预测值进行预测即可，抑制了对小区预测时的预测模型复杂度，且该目标预测值考虑到了预置范围内所有小区预测得到的，不是将小区进行分组，将预测参考小区的数目局限在部分小区，有效地减少了小区的使用流量的预测值误差。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍。

图1为本申请实施例一种流量预测方法的一个系统框架示意图；

图2为本申请实施例一种流量预测方法的一个实施例流程示意图；

图3为本申请实施例一种小区工程参数示意图；

图4为本申请实施例一种流量预测方法中一种树形层级结构示意图；

图5为本申请实施例一种流量预测方法的另一实施例流程示意图；

图6为本申请实施例一种流量预测装置一个实施例结构示意图；

图7为本申请实施例一种流量预测装置另一实施例结构示意图；

图8为本申请实施例一种流量预测装置另一实施例结构示意图；

图9为本申请实施例一种计算机设备一个实施例结构示意图。

具体实施方式

本申请实施例提供了一种流量预测方法，用于有效地减少了小区的使用流量预测值的预测误差。

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，描述本申请实施例中的技术方案。显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请实施例所提供的流量预测方法可以应用于各种各样的通信系统中，示例性的，可以应用于全球移动通信系统(globalsystemformobilecommunication，gsm)、码分多址(codedivisionmultipleaccess，cdma)系统、宽带码分多址(widebandcodedivisionmultipleaccess，wcdma)系统、通用分组无线业务(generalpacketradioservice，gprs)、通用移动通信系统(universalmobiletelecommunicationssystem，umts)、时分长期演进(timedivisionlongtermevolution，td-lte)、频分长期演进(frequencydivisionlongtermevolution，fdd-lte及未来的第五代移动通信技术(5rd-generationmobilecommunicationtechnology，5g)等各种各样的通信系统中，具体此处不做限定。

首先，先对本申请实施例所提供的一种流量预测方法的系统框架进行一个介绍，请参阅图1，图1为本申请实施例一种流量预测方法一个系统框架示意图，包括终端设备和基站，终端设备基站和终端设备之间可以通过空中接口实现数据或信令的收发。该终端设备可被称为接入终端、用户设备(userequipment，ue)、用户单元、用户站、移动站、移动台、远方台、远程终端移动设备等设备或装置，具体此处不做限定。图1所示的系统框架图在这里只是举例说明，并不对本申请实施例构成限定。

基站是指与终端设备进行通信的网络设备，该基站可以是gsm系统的基站(basetransceiverstation，bts)，也可以是wcdma系统中的基站(nodeb，nb)，还可以是指lte系统中的演进型基站(evolutionnodeb，enb或enodeb)，或者可以是指未来5g等通信系统中的基站设备，具体此处也不做限定。

基站可以对应一个或多个小区，在终端设备通过小区与基站实现交互的过程中，每个小区都会生产使用流量，在本申请实施例提出了一种对小区的使用流量进行预测的方法，其核心思想在于，获取预置范围内，所有小区的历史总使用流量数据；将所述所有小区的历史总使用流量数据作为输入，使用第一预测模型对所述预置范围内所有小区的总使用流量进行预测以获得目标预测值，根据所述目标预测值对目标小区的使用流量进行预测得到所述目标小区的使用流量预测值，其中，所述目标小区为所述预置范围下所有小区中的任意一个小区。在本申请实施例中，在利用目标预测值对目标小区的使用流量预置值进行预测时，有多种方式进行预测，详见下述实施例。

现针对上述核心思想，对本申请实施例一种流量预测方法进行详细描述。

请参阅图2，图2为本申请实施例一种流量预测方法一个实施例流程示意图，包括：

步骤101、对预置范围内的小区进行分层以获得树形层级结构。

其中，上述预置范围可以根据实际应用情况进行选择，当然，在具体实现中，可以根据一些预测经验圈定上述预设范围，该预置范围内包括待预测的目标小区。

另外，在本申请实施例中，可以有多种预置分层方式对上述预置范围的所有小区进行分层，这里不做限定，下面将示例性的对本申请实施例提供的一些对预置范围内的小区进行分层的方式进行描述：

在本申请的一些实施例中，对所述预置范围内的小区进行分层以获得树形层级结构，包括：获取小区工程参数；根据所述小区工程参数确定所述预置范围内小区的网络拓扑结构；将所述网络拓扑结构作为所述树形层级结构。

应理解，小区工程参数表中保存有各种各样的小区工程参数信息，包括小区的网络拓扑结构的具体分层情况，其中，小区工程参数包含有区域码(area)、位置区码(locationareacode，lac)、基站识别码(site_id)以及小区识别码(cell_id)，根据上述小区工参参数可以对应得到预置范围内小区的网络拓扑结构。为了便于理解，以一个实际的例子为例进行说明，具体参阅图3所示，图3为一个小区工程参数一个示意图，可以看出，区域码为arbsc01的区域被分为位置区码为3031和3033两个位置区域，3031下又分为aru001和aru002的，aru001和aru002下再分具体的小区。根据图3所示的示意图，可以确定出图3所示所有小区的网络拓扑结构，应理解，小区的网络拓扑结构呈现树形层次关系，在本申请中，可以确定的小区的网络拓扑结构作为本申请实施例中的树形层级结构。另外需要说明的是，图3在这里只是举例说明，不对本申请做限定。

除了上述分层方式外，在本申请的一些实施例中，对所述预置范围内的小区进行分层以获得树形层级结构，包括：获取小区工程参数；根据所述小区工程参数确定所述预置范围内各个小区的拟位置；根据所述各个小区的拟位置对所述预置范围所有小区进行分层以获得所述树形层次结构。

在本方案中，为了使得对小区的分层结果更加合理，在本申请实施例的一些实施例，提出了另外一种分层方式，具体根据小区工程参数为预置范围内的每个小区定义一个拟位置，利用定义的每个小区的拟位置生成小区的树形层级结构。

其中，在本申请的一些实施例中，确定所述各个小区的拟位置，包括：

依据以下公式确定所述各个小区的拟位置(xcell、ycell)：

xcell＝xsite*(λ*ptrx)*h*sin(α)*cos(θ)；

ycell＝ysite*(λ*ptrx)*h*sin(α)*sin(θ)；

其中，所述xsite、ysite分别为所述各个小区对应基站的经度、维度；所述xcell、ycell分别为所述各个小区的经度、维度，所述λ为预设数据，所述ptrx为所述基站的发射功率，所述h为所述各个小区的天线高度，所述α、θ分别为所述各个小区对应基站的天线下倾角、方向角。应理解，上述预设数据为经验数据，具体由实际应用情况所获得的经验数据决定，这里不做限定。

经过上述公式，可以确定出预置范围内各个小区的拟位置。

在本申请的一些实施例中，所述根据所述各个小区的拟位置对所述预置范围内的小区进行分层以获得所述树形层级结构，包括：对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构。即在对各个小区的拟位置进行分层时，具体可以利用一些层次化聚类算法对生成的各个小区的拟位置进行分层以获得树形层级结构。需要说明的是，可以有多种层次化聚类算法对各个小区的拟位置进行分层以获得树形层级结构，这里不做限定。

示例性的，在本申请的一些实施例中，可以使用k-mean聚类方式对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构。示例性的，以一个实际例子为例，可以按照以下步骤进行聚类：

1、可以先设置需要的树形层级结构的层数为l和分组数为n，其中，l和n都为正整数，首先使用k-mean聚类方式将小区的拟位置分为n组；

2、针对上述步骤获得的n组中的每一组，继续使用k-mean聚类方式分为n组，其中，如果某组内小区的数目小于n，则不再进行划分；

3、重复步骤2，直至达到总的层数l获得预置范围内小区的树形层级结构。

在本申请的一些实施例中，还可以使用谱聚类方式对所述各个小区的拟位置进行分层以获得所述树形层级结构，具体此处不限定，也不赘述。

上述提出了两种根据预置分层方式对所述预置范围内的小区进行分层以获得树形层级结构的方式，其中一种是基于小区的位置关系进行分层的方式，在本申请实施例中，还可以通过以下分层方式进行分层：

根据话单记录对所述预置范围内所有小区进行分层以获得所述树形层级结构。

在本申请的一些实施例中，根据话单记录记录对所述预置范围内所有小区进行分层以获得所述树形层级结，包括：获取话单记录；根据所述话单记录获取训练样本；将所述训练样本展开为目标根向量；对所述目标根向量进行层次化聚类以获得所述树形层级结构。举例说明，应理解，话单记录中的记录为形如<time，user，cell，traffic>的元组，在本申请实施例中，可以聚合为形如<user，cell，traffic>的记录，其中，聚合后的traffic字段表示在某段时间内，某一终端设备在某一小区发生的历史总使用流量。这里，可以聚合获得的预置范围内各个小区的<user，cell，traffic>的记录作为训练样本，在本申请中，可以对获得的训练样本进行预处理得到最终的训练样本。其中，上述预处理可以包括以下至少一种处理方式：1、删除聚合获得的训练样本中，traffic过低的训练样本，示例性的，可以去掉traffic小于1mb(兆)的训练样本，具体不做限定；2、对聚合获得的训练样本中，对每个训练样本的traffic加1后再取对数处理。在获得了训练样本后，将所述训练样本展开为目标根向量<cell，traffic_of_user_1，traffic_of_user_2，…，traffic_of_user_n>，再对获得的目标根向量进行层次化聚类以获得所述树形层级结构。

在本申请的一些实例中，所述对所述目标根向量进行层次化聚类以获得所述树形层级结构，包括：使用bi-clustering聚类方式对所述目标根向量进行层次化聚类以获得所述树形层级结构。需要说明的是，这里是基于目标根向量进行聚类，主要是用于把预置范围内，把小区和终端设备分为若干簇，并且这两者之间的簇，呈一一对应关系。举例说明，假设存在a终端设备簇，a小区簇，a终端设备簇和a小区簇为一一对应关系，那么说明a终端设备簇的下的终端设备会频繁出现在该a小区簇下的小区中。

另外需要说明的是，在本申请实施例中，可以有多种层次化聚类算法对目标根向量进行分层以获得树形层级结构，这里不做限定，例如，还可以使用谱聚类方式对目标根向量进行分层以获得树形层级结构。

步骤102、确定所述树形层级结构中，根节点下所有小区的历史总使用流量数据。

在本申请实施例中，在按照步骤101所描述的分层方式对预置范围内的小区进行分层获得树形层级结构后，可以确定该树形层级结构中，根节点下所有小区的历史总使用流量。可以理解，确定该树形层级结构中，根节点下所有小区的历史总使用流量数据，实际就是确定预置范围内所有小区的历史总使用流量数据。

这里需要说明的是，这里所描述的根节点下所有小区的历史总使用流量数据是指先前某段预设时间内，根节点下所有小区的历史使用流量总量数据。示例性的，这个预设时间可以是一个月前，或3个月前，或6个月前，或者一年前，具体此处不做限定。在实际应用中，可以根据需求确定需要获取所需的根节点下所有小区的历史使用流量数据。

步骤103、根据所述根节点下所有小区的历史总使用流量数据，使用第一预测模型对所述根节点下所有小区的总使用流量进行预测以获得目标预测值。

在获得了根据所述根节点下所有小区的历史总使用流量后，可以使用第一预测模型对所述根节点下所有小区的总使用流量进行预测以获得目标预测值。

其中，第一预测模块可以是时间序列模型进行预测，常见的时间序列模型有自回归模型(autoregressive，ar)和向量自回归模型(vectorautoregressive，var)，通过上述时间序列模型可以寻找时间序列前后数值之间的相关性，可以从过去推测未来，从而可以根据之前的流量使用情况推测出未来的流量使用情况。因此，在本申请实施例中，可以使用上述预测模型进行预测得到目标预测值。当然，除了使用时间序列模型，还可以有其他的回归模型，具体此处不做限定。

步骤104、根据所述目标预测值对目标小区的使用流量进行预测得到目标小区的使用流量预测值，其中，所述目标小区为所述根节点下所有小区中的任意一个小区。

其中，在本申请的实施例中，根据所述目标预测值对目标小区的使用流量进行预测得到目标小区的使用流量预测值，包括：

根据所述树形层级结构中，第一节点下所有小区的总使用流量预测值以及第二节点下所有小区的历史总使用流量数据，使用第二预测模型对第二节点下所有小区的总使用流量进行预测，所述第二节点为所述第一节点的下级节点，这里需要说明的是，这里所说的第一节点，是指第二节点上的所有上级节点，包括与第二节点相连的每一级节点，为了便于理解，这里以一个树形层级结构为例对第一节点和第二节点的关系进行说明，请参阅图4所示。其中，当所述第一节点为所述根节点时，所述第一节点下所有小区的总使用流量预测值为所述目标预测值；当确定了第三节点下所有小区的总使用流量预测值后，根据所述第三节点下所有小区的总使用流量预测值、和所述第三节点的上级节点中各个节点下所有小区的总使用流量预测值以及所述目标小区的历史总使用流量数据，使用所述第二预测模型对所述目标小区的使用流量进行预测以得到目标小区的使用流量预测值，所述目标小区为所述第三节点下的小区。

示例性的，第二预测模型可以采用时间序列模型，例如，可以是ar预测模型、var预测模型，这里不做限定。当然，除了使用时间序列模型，还可以有其他的回归模型，具体此处不做限定。

为了便于理解上述预测过程，下面以根据网络拓扑获得的树形层级结构为例，以一个实际的例子，对上述根据所述目标预测值对目标小区的使用流量(设为1个月后的使用流量)进行预测的过程进行描述：假设现有小区aru001a，其对应的基站为aru001，位置区码为3031，区域码为arbsc01。先从顶层(根节点)开始，基于arbsc01的所有小区的历史使用流量(假设arbsc01下有10000个小区)，利用时间序列模型预测aru001a在一个月后的使用流量得到目标预测值。完成后，基于3031下的所有小区流量(假设3031下有500个小区)，再加上刚刚得到的arbsc01的目标预测值，预测3031在一个月后的使用流量。完成后，基于aru001下的所有小区的历史使用流量(假设有10个)，在加上目标预测值、3031下所有小区的使用流量的预测值，使用时间序列模型预测aru001下所有小区在一个月后的使用流量，完成后，基于小区aru001a的历史使用流量，再加上目标预测值、3031和aru001下所有小区的在一个月后的使用流量的预测值，接着再使用时间序列模型再对小区aru001a的使用流量进行预测，得到小区aru001a在一个月后的使用流量预测值。

需要说明的是，在本申请实施例中，还提供了另一种流量预测方法，请参阅图5，该方法包括：

步骤201、对所述预置范围内的小区进行分层以分别获得第一树形层级结构、第二树形层级结构以及第三树形层级结构。

其中，上述第一树形层级结构、第二树形层级结构以及第三树形层级结构分别为根据不同的分层方式得到。在本申请的一些实施例中，上述第一树形层级结构、第二树形层级结构以及第三树形层级结构分别可为前束实施例描述的预置分层方式对预置范围内的小区进行分层以获得。具体可以参阅前述实施例的描述，这里不再一一重复赘述。示例性的，这里为了便于描述，假设第一树形层级结构为根据预置范围内的小区的网络拓扑结构得到的树形层级结构，第二树形层级结构为根据预置范围内各个小区的拟位置得到的树形层级结构，而第三树形层级结构为根据话单记录得到的树形层级结构。

另外，上述预置范围可以根据实际应用情况进行选择，当然，在具体实现中，可以根据一些预测经验圈定上述预设范围，该预置范围内包括待预测的目标小区。

步骤202、基于所述第一树形层级结构、第二树形层级结构以及第三树形层级结构对目标小区的使用流量进行预测以分别获得第一预测值、第二预测值和第三预测值，所述目标小区为所述预置范围内的任意一个小区。

具体的关于第一树形层级结构、第二树形层级结构以及第三树形层级结构中，每种树形层级结构下，怎么对目标的使用流量进行预测的过程可以参阅前述描述，这里不再赘述。

203、根据第一预测值、第二预测值和第三预测值得到目标小区的使用流量预测值。

在本申请实施例中，在分别根据上述树形层级结构第一预测值、第二预测值以及第三预测值这3个预测值后，可以对这三者进行融合，以获得最终的目标小区的使用流量预测值，目的在于选出一个预测误差最小的预测值作为目标小区的使用流量预测值。这里，可以有多种确定方式，只要使得能选出一个预测误差最小的预测值作为目标小区的使用流量预测值即可，具体的方式这里不做限定。

根据所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值之前，所述方法还包括：

确定预设时段内所述目标小区的历史使用流量数据的加权平均值；

其中，预设时段可以根据实际情况进行选择，示例性的，可以是一个月前，、或3个月前，或6个月前，或者一年前，具体此处不做限定。

确定预设时段内所述目标小区的历史使用流量数据的加权平均值，包括：

以所述第一预测值、第二预测值、第三预测值以及所述小区工程参数为输入，所述加权平均值为标签，基于随机森林算法进行融合，得到所述目标小区的使用流量预测值。其中，示例性的，在基于随机森林算法进行融合时小区工程参数可以取频点信息作为输入，具体此处不做限定。

在本申请实施例的一些实施例中，所述确定预设时段内所述目标小区的历史使用流量数据的加权平均值，包括：对所述预设时段内的目标小区的n个历史使用流量数据点进行异常检测，所述n为正整数，所述n大于或等于2；通过所述异常检测后获得所述预设时段内，所述历史使用流量数据点的n个异常系数；根据所述n个异常系数确定所述n个历史使用流量数据点对应的权重；根据所述n个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值。

其中，在本申请的一些实施例中，通过所述异常检测后获得所述预设时段内，每个历史使用流量数据点的异常系数是指对每个历史使用流量数据点的大小进行异常检测每个历史使用流量数据点的异常系数e。异常系数e，表示该历史使用数据点的大小有多么异常(例如离均值远)，越异常，则异常系数也越大。

在本申请的一些实施例中，根据所述每个历史使用流量数据点的异常系数确定每个历史使用流量数据点的权重可以通过以下公式确定：权重＝异常系数e，或权重＝异常系数e*可解释比例r。

其中，该可解释比例可以通过以下方式获得：以每个历史使用流量数据点的传输速率为输入，进行线性回归，对应得到每个历史使用流量数据点的误差百分比f，设1-f为每个历史使用流量数据点的范围为0-1之间的解释比例r。由此可见，可解释比例定义了历史使用流量数据点的异常与传输速率变化有没有关系，越有关系，则越应该关注，对应计算的权重则越大。通过可解释比例r计算每个历史使用数据点的权重，这里要生成的加权平均值，实际为预设时段内流量值的加权平均。w定义了权重的分布。如果直接取平均，以预设时段为一个月为例，那么每天的权重均为1/30；如果直接取最大，则只有某一天为1，而其他都是0。这里的通过可解释比例的做法为两种做法的折衷。

在本申请实施例的一些实施例中，所述根据所述n个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值，包括：将所述n个历史使用流量数据点对应的权重进行加权平均以得到所述目标小区在预设时段内的历史使用流量数据的加权平均值。

从以上技术方案可以看出，还提出了一种根据不同树形层级结构的目标小区的使用流量预测值确定出最佳预测值的方法，更加有效地减少了小区的使用流量的预测误差。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于示例性实施例，所涉及的动作和模块并不一定是本申请所必须的。

为便于更好的实施本申请上述实施例中所描述的方案，下面还提供用于实施上述方案的相关装置。

请参阅图6，本申请实施例提供了一种流量预测装置，包括获取模块101、第一预测模块102以及第二预测模块103。

其中，获取模块101，用于获取预置范围内，所有小区的历史总使用流量数据；

第一预测模块102，用于将所述所有小区的历史总使用流量数据作为输入，使用第一预测模型对所述获取模块101获取的所述预置范围内所有小区的总使用流量进行预测以获得目标预测值；

第二预测模块103，用于根据所述第一预测模块102预测的所述目标预测值对目标小区的使用流量进行预测得到所述目标小区的使用流量预测值，其中，所述目标小区为所述预置范围内的任意一个小区。

请参阅图7，在本申请实施例的一些实施例中，所述装置还包括：

分层模块104，用于对所述预置范围内的小区进行分层以获得树形层级结构；

第二预测模块103用于根据所述第一预测模块102预测的所述目标预测值对目标小区的使用流量进行预测得到所述目标小区的使用流量预测值，包括：

所述第二预测模块103，用于根据所述树形层级结构中，第一节点下所有小区的总使用流量预测值以及第二节点下所有小区的历史总使用流量数据，使用第二预测模型对所述第二节点下所有小区的总使用流量进行预测，所述第二节点为所述第一节点的下级节点，其中，当所述第一节点为所述根节点时，所述第一节点下所有小区的总使用流量预测值为所述第一预测模块102预测的所述目标预测值；

当确定了第三节点下所有小区的使用流量预测值后，用于根据所述第三节点下所有小区的总使用流量预测值、和所述第三节点的上级节点中各个节点下所有小区的总使用流量预测值以及所述目标小区的历史总使用流量数据，使用所述第二预测模型对所述目标小区的使用流量进行预测得到所述目标小区的使用流量预测值，所述目标小区为所述第三节点下的小区。

在本申请的一些实施例中，所述分层模块104用于对所述预置范围内的小区进行分层以获得树形层级结构包括：

所述分层模块104用于：

获取小区工程参数；

根据所述小区工程参数确定所述预置范围内小区的网络拓扑结构；

将所述网络拓扑结构作为所述树形层级结构。

在本申请的一些实施例中，所述分层模块104用于对所述预置范围内的小区进行分层以获得树形层级结构包括：

所述分层模块104用于：

依据以下公式确定所述预置范围内各个小区的拟位置(xcell、ycell)：

xcell＝xsite*(λ*ptrx)*h*sin(α)*cos(θ)；

ycell＝ysite*(λ*ptrx)*h*sin(α)*sin(θ)；

其中，所述xsite、ysite分别为所述各个小区对应基站的经度、维度；所述xcell、ycell分别为所述各个小区的经度、维度，所述λ为预设数据，所述ptrx为所述基站的发射功率，所述h为所述各个小区的天线高度，所述α、θ分别为所述各个小区对应基站的天线下倾角、方向角；

根据所述各个小区的拟位置对所述预置范围内所有小区进行分层以获得所述树形层级结构。

在本申请的一些实施例中，所述分层模块104用于根据所述各个小区的拟位置对所述预置范围内所有小区进行分层以获得所述树形层级结构，包括：

所述分层模块104，用于对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构。

在本申请的一些实施例中，所述分层模块104用于对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构，包括：

所述分层模块104，用于使用k-mean聚类方式对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构。

在本申请的一些实施例中，所述分层模块104用于根据预置分层方式对所述预置范围内的小区进行分层以获得树形层级结构包括：

所述分层模块104具体用于：

获取话单记录；

根据所述话单记录获取训练样本；

将所述训练样本展开为目标根向量；

对所述目标根向量进行层次化聚类以获得所述树形层级结构。

在本申请的一些实施例中，所述分层模块104用于根据所述话单记录获取训练样本，包括：

所述分层模块104用于：

查询所述话单记录得到在所述预设范围内的每个小区中，所有终端设备的流量记录信息；

将所述流量记录信息作为所述训练样本。

在本申请的一些实施例中，所述分层模块104用于对所述目标根向量进行层次化聚类以获得所述树形层级结构，包括：

所述分层模块104，用于使用bi-clustering聚类方式对所述目标根向量进行层次化聚类以获得所述树形层级结构。

请参阅图8，在本申请的一些实施例中，所述第二预测模块103用于：

基于第一树形层级结构、二树形层级结构以及第三树形层级结构对所述目标小区的使用流量进行预测以分别获得第一预测值、第二预测值和第三预测值，其中，所述第一树形层级结构为根据所述网络拓扑结构获得的树形层级结构，所述第二树形层级结构为根据所述拟位置获得的树形层级结构，所述第三树形层级结构为根据所述话单记录获得的树形层级结构；

所述装置还包括：

第三预测模块105，用于根据所述第二预测模块103预测的所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值。

在本申请的一些实施例中，所述装置还包括确定模块106；

所述确定模块106，用于在所述第三预测模块根据所述第二预测模块103预测的所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值之前，确定预设时段内所述目标小区的历史使用流量数据的加权平均值；

所述第三预测模块105用于根据所述第二预测模块103预测的所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值，包括：

所述第三预测模块105，用于以所述第一预测值、第二预测值、第三预测值以及所述小区工程参数为输入，所述加权平均值为标签，基于随机森林算法进行融合，得到所述目标小区的使用流量预测值。从以上技术方案可以看出，还提出了一种根据不同树形层级结构的预测值进行融合以确定出最佳预测值的流量预测装置，更加有效地有效地减少了小区的使用流量的预测误差。

在本申请的一些实施例中，所述确定模块106用于确定预设时段内所述目标小区的历史使用流量数据的加权平均值包括：

所述确定模块106具体用于：

对所述预设时段内的目标小区的n个历史使用流量数据点进行异常检测，所述n为正整数，所述n大于或等于2；

通过所述异常检测后获得所述预设时段内，所述历史使用流量数据点的n个异常系数；

根据所述n个异常系数确定所述n个历史使用流量数据点对应的权重；

根据所述n个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值。

在本申请的一些实施例中，所述确定模块106用于所述根据所述n个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值，包括：

将所述n个历史使用流量数据点对应的权重进行加权平均以得到所述目标小区在预设时段内的历史使用流量数据的加权平均值。

需要说明的是，上述装置各模块/单元之间的信息交互、执行过程等内容，由于与本申请实施例中的方法实施例基于同一构思，其带来的技术效果与本申请方法实施例相同，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

本申请实施例还提供一种计算机存储介质，其中，该计算机存储介质存储有程序，该程序被计算机执行时能实现上述方法实施例中记载的部分或全部步骤。

请参阅图9，本申请实施例提供一种计算机设备，该计算机设备可以作为上述流量预测装置，实现上述流量预测装置的方法，该计算机设备300包括：

处理器301、存储器302、和存储在存储器上并可在处理器上运行的计算机程序(其中，计算机设备300中的处理器301的数量可以一个或多个，图9中以一个处理器为例)。在本申请的一些实施例中，该计算机设备还可以包括通信端口303、其中，通信端口303、处理器301和存储器302可通过总线或其它方式连接，具体此处不做限定，其中，图8中以通过总线连接为例进行示例说明。

存储器302还可以包括只读存储器和随机存取存储器，并向处理器301提供指令和数据。存储器302的一部分还可以包括非易失性随机存取存储器(non－volatilerandomaccessmemory，nvram)。存储器302存储有操作系统和操作指令、可执行模块或者数据结构，或者它们的子集，或者它们的扩展集，其中，操作指令可包括各种操作指令，用于实现各种操作。操作系统可包括各种系统程序，用于实现各种基础业务以及处理基于硬件的任务。

处理器301控制计算机设备300的操作，处理器301还可以称为中央处理单元(centralprocessingunit，cpu)。具体的应用中，计算机设备的各个组件通过总线系统耦合在一起，其中总线系统除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都称为总线系统。

上述本申请实施例揭示的方法可以应用于处理器301中，或者由处理器301实现。处理器301可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器301中的计算机程序完成。上述的处理器301可以是通用处理器、数字信号处理器(digitalsignalprocessing，dsp)、专用集成电路(application-specificintegratedcircuit，asic)、现场可编程门阵列(field－programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器302，处理器301读取存储器302中的计算机程序，结合其硬件完成上述方法的步骤。

通信端口303可用于接收或者发送信令/信息，例如用于接收小区工程参数。

本申请实施例中，处理器301，用于执行前述流量预测方法。

还需要说明的是，在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，dvd)、或者半导体介质，例如固态硬盘(solidstatedisk，ssd)等。

另外需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本申请提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，模块和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用cpu、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、u盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张迪;黄琛灿;肖冬
技术所有人：华为技术有限公司
我是此专利的发明人

上一篇：一种虚拟机集群的故障监控方法及装置与流程
上一篇：基于EMS的自动化管理海量设备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。