基于发送方的流量控制的随机控制优化的利记博彩app

文档序号:7694306阅读:200来源:国知局
专利名称:基于发送方的流量控制的随机控制优化的利记博彩app
技术领域
本发明 一 般涉及改善的数据处理系统,并且特别地涉及用于发 现在分布式流处理中控制消息流量的优化策略的计算机实现的方 法、数据处理系统和计算机程序产品。
背景技术
信息分发系统提供了分布式网络上的多种类的信息服务。信息 分发系统的示例为有状态发布-订阅系统。在这样的系统中,多个 服务提供商向不同的服务订户连续递送感兴趣的信息。这样的信息 服务的示例包括实时股市行情、基于公路交通的智能路线选择、新 闻递送、监视等。在该系统中的每个服务提供商通常维持大量的数 据项并且及时向服务订户传播关于这些数据项的更新。
现有的信息分发系统遇到的问题是确定在分布式系统中的服务 器之间或者服务器与服务订户之间的传播更新的频率。虽然在更新 发生之后立即传播更新将增加订户侧数据的及时性,但更新的传播 需要使用系统资源,例如服务提供商和订户之间的通信网络内的带 宽。传播更新的极端的策略包括(1 )传播每一个更新,这保证了及
时递送但可能产生过度的消息通信量,和(2)不定地停止发送 (withhold)更新,这最小化了消息通信量但使订户得不到及时的信 息。因此,可以更频繁地发送更新从而提供增强的数据及时性但系 统使用成本较大,或者可以不太频繁地发送更新从而降低了及时性 但有较好的系统利用。此外,更新的成本可以包括多个部分。例如, 尽管有每个消息发送的直接系统成本,但还有间接成本,因为较多
的消息意味着较多的拥塞和最终较多的延迟。

发明内容
示例性实施例提供了用于发现在分布式流处理中优化流量控制 策略的计算机实现的方法、数据处理系统和计算机程序产品。示例 性实施例识别具有每个数据陈旧度值 一 个状态的马尔可夫模型。确 定在马尔可夫模型中状态变换的概率,以决定使用期望的消息速率 从信息提供商向信息订户发送包括数据更新的新消息以及决定从信 息提供商停止向信息订户发送新消息。使用成本函数为马尔可夫模 型中的每个状态变换注释状态变换成本,以决定发送新消,l和决定 停止发送新消息。为每个状态确定指示是否向信息订户发送新消息 或者停止为信息订户发送新消息的传播策略。然后部署传播策略。
示例性实施例还通过确定是否在流失的时间单位期间从信息提 供商接收到包括数据更新的新消息来控制消息流量。如果在时间单 位期间接收到新消息,则由信息订户保留的和与新消息相关联的数 据的陈旧度值被增加。使用传播策略来确定是否向信息订户发送新 消息或停止向其发送。如果确定发送新消息,则向信息订户传播新 消息并且由信息订户保留的和与新消息相关联的数据的陈旧度值被 复位。


本发明的新颖的特征和特性在所附权利要求书中说明。当结合 附图参考下面所示实施例的详细描述阅读时,本发明本身以及所使
用的优选模式、另外的目标及其优势将会得到更好的理解,附图中: 图1说明了可以在其中实现示例性实施例的信息分发系统的示
图2说明了可以在其中实现示例性实施例的数据处理系统的框
图3是说明根据示例性实施例的数据项的陈旧度如何基于到订
户的更新的递送或不递送而变化的曲线;
图4是说明根据示例性实施例的使用马尔可夫模型的状态变换和状态变换成本的示图;以及
图5是用于根据示例性实施例确定在分布式流处理中的优化流 量控制策略的离线处理和用于在信息分发系统中执行该策略的在线 处理的流程图。
具体实施例方式
示例性实施例提供了用于确定在分布式流处理中优化流量控制 策略的计算机实现的方法、数据处理系统和计算机程序产品。示例 性实施例提供的解决方案在向订户发送每个信息更新可能导致过度 使用例如CPU的系统资源和通信网络的情况下可能是有利的,并且 其中停止发送某些更新不会严重地损害信息处理的及时性。使用随 机控制理论来计算优化控制策略以便选择性地发送更新,使得订户 可以接收关于系统资源使用的最新信息和关于不同数据项的订户的 兴趣。
在示例性实施例中的信息分发环境(此后称为"系统")包括向系 统递送事件的多个信息提供商和维持包括数据项组(例如股票价格 和成交量的表)的状态并且选择性地向其他计算节点或服务订户传 播关于这些数据项的更新的计算节点。当订户未接收到最新信息时, 这些订户向系统提交描述针对每个订户的服务质量下降的情况的目 标数据。如实际数据通常可知,每个数据项可以具有不同的更新速 率和对系统整体服务质量不同的影响。
在示例性实施例中,称为"陈旧度"的度量定义为服务质量的第一 度量。如果信息提供商停止发送数据项的更新,则提供商侧的数据 项的值将不再与订户侧的值相同。在此情况下,订户将具有陈旧的 数据。因此,术语"陈旧度"表示订户侧的数据与及时发送更新的理 想情况相比较陈旧的程度。例如,如果订户具有数据项的最新值, 则数据的陈旧度为零;否则,陈旧度为自从由信息提供商计算最新 值以来经历的滴答(tick)数(时间增量)。
基于由订户提供的目标服务质量描述,每个信息提供商创建捕获消息通信量和信息陈旧度之间的期望的折衷的效用函数。效用函 数首先将时间期间分解为称为"滴答"的时间增量。然后,效用函数
基于(1)在该滴答期间是否向订户递送数据项的更新,和(2)在 该滴答处的数据的陈旧度来计算每个滴答的状态变换成本。为计算 状态变换成本,信息提供商创建包括定义陈旧度的演变的参数的马 尔可夫模型,其中的参数为下列的函数(l)当前的陈旧度,(2) 新消息将在当前的滴答期间到达的概率,以及(3)是否在当前滴答 期间发送最新消息的决定。在该马尔可夫模型中的每个状态变换标 注有成本,该成本是用户确定的加权的组合,即(l)向订户传播关 于数据项的更新的成本,和(2 )具有陈旧数据的订户的损失的组合。 已知效用函数和马尔可夫模型的参数,系统管理员则可以基于随机 控制理论执行算法以为可以发送更新消息的每个计算节,泉计算控制 或传播策略并且为具体计算节点部署该策略。基于当前的陈旧度和 预先计算的传播策略,该节点在每个滴答处确定是否递送数据项的 更新值或是否延迟发送更新。做出该递送或停止发送的确定是关于 提供的效用函数优化每滴答平均状态变换成本。
现在参考附图,特别是参考提供了在其中实现示例性实施例的 数据处理环境的示图,图1和图2。应当理解,图1和图2只是示例 性的,而不旨在断言或暗示关于在其中实现不同的实施例的环境的 任何限制。可以对所描述的环境的许多修改。
图1说明了在其中可以实现示例性实施例的信息分发系统的示 图。信息分发系统100是在其中可以实现示例性实施例的计算机网 络。信息分发系统100包括网络102,其是用于在信息分发系统100 中连接到一起的各种设备和计算机之间提供通信链路的介质。网络 102可以包括例如电线、无线通信链路或光纤电缆的连接。
在描述的示例中,信息提供商104、 106和108连接到网络102。 此外,订户110、 112和114连接到网络102。订户110、 112和114 例如可以是个人计算机、网络计算机、电话设备等等。网络102包 括在信息分发系统100的计算机中实现的计算节点116。计算节点
7116在信息提供商104、 106和108与订户110、 U2和114之间。例 如,信息提供商可以提供股票交易事件。计算节点116可以基于例 如平均卖出价或总交易额的股票交易历史来计算数据。订户110、 112 和114订阅可以被发送或被停止发送的该数据。信息提供商104、 106 和108通常维持大量的数据项并且及时地向订户110、 112和114传 播关于这些数据项的更新。例如,信息提供商104可以向订户110、 112和114提供例如实时股市行情、基于公路交通的智能路线选择、 新闻递送、监视等的感兴趣的信息。在系统中,可以有计算节点116。 计算节点116获取由信息提供商104、 106和108提供的信息,并且 将其聚类、滤波或相反处理成对订购的客户感兴趣的信息。例如, 在股票交易系统中,信息提供商104、 106和108可以提供原始股票 行情并且计算节点116可以计算按发行分组售出的总分配额。在此 示例中,订户110、 112和114是计算节点116的订户。网络数据处 理系统IIO可以包括另外的信息提供商、订户、计算节点和其他未 示出的设备。
信息分发系统IOO可以是具有网络102的互联网,其表示在使 用传输控制协议/网际协议(TCP/IP)协议组彼此进行通信的计算机 之间的网络和网关的全球集合。在互联网的中心处,是在包括路由 数据和消息的数以千计的商业、政府、教育和其他计算机系统的主 节点或主机计算机之间的高速数据通信线路的骨干线。当然,信息 分发系统IOO还可以实现为许多不同类型的网络,例如,内联网、 局域网(LAN)或广域网(WAN)。图l是不同的示例性实施例的 示例而不是其体系结构的限制。
统的框图。数据处理系统200是例如图1中的信息提供商104或订 户IIO的计算机的示例,其中实现该处理的计算机可用程序代码或 指令可以在示例性实施例中。
在描述的示例中,数据处理系统200采用包括北桥和存储器控 制器集线器(NB/MCH) 202以及南桥和输入/输出(I/O)控制器集线器(SB/ICH) 204的集线器体系结构。处理单元206、主存储器 208和图形处理器210耦合到北桥和存储器控制器集线器202。处理 单元206可以包括一个或多个处理器并且甚至可以使用一个或多个 各种各样的处理器系统来实现。图形处理器210可以例如通过加速 的图形端口 ( AGP )耦合到NB/MCH。
在描述的示例中,局域网(LAN)适配器212耦合到南桥和I/O 控制器集线器204,并且音频适配器216、键盘和鼠标适配器220、 调制解调器222、只读存储器(ROM) 224、通用串行总线(USB) 和其他端口 232以及PCI/PCIe设备234通过总线238耦合到南桥和 1/0控制器集线器204,并且硬盘驱动器(HDD)226和CD-ROM 230 通过总线240耦合到南桥和1/0控制器集线器204。 PCI/PCIe设备可 以包括例如用于膝上型计算机的以太网适配器、插入卡和PC卡。PCI 使用卡总线控制器,而PCIe则不是。ROM224可以例如是闪速二进 制输入/输出系统(BIOS )。硬盘驱动器226和CD-ROM 230可以例 如使用集成的驱动器电子器件(IDE)或串行高级技术配件(SATA) 接口。超级1/0 (SIO)设备236可以耦合到南桥和I/0控制器集线 器204。
操作系统在处理单元206上运行并且协调和提供图2的数据处 理系统200中的各种部件的控制。操作系统可以是例如Microsoft Windows XP的商业上可用的操作系统(Microsoft和Windows是微 软(Microsoft)公司在美国和其他国家的商标)。例如JavaTM编程 系统的面向对象的编程系统可以结合操作系统运行并且提供从 JavaTM程序或在数据处理系统200上执行的应用对操作系统的调用。 JavaTM和基于JavaTM的商标是升阳微系统(Sun Microsystems )公司
在美国和其他国家的商标。
操作系统、面向对象的编程系统和应用或程序的指令位于例如 硬盘驱动器226的存储设备上并且可以加载进主存储器208中以便 由处理单元206执行。示例性实施例的处理可以由处理单元206使 用计算机实现的指令来执行,该指令可以位于例如主存储器208、只读存储器224的存储器中或一个或多个外围设备中。
图1和图2中的硬件可以根据实现方式而改变。除图1和图2 描述的硬件之外或替代图1和图2描述的硬件,也可以使用例如闪 速存储器、等效非易失性存储器或光盘驱动器等等的其他内部硬件 或外围设备。同样,示例性实施例的处理还可以应用于多处理器数 据处理系统。
在某些示例性示例中,数据处理系统200可以是个人数字助理 (PDA),其通常配置为具有闪速存储器以提供用于存储操作系统 文件和/或用户生成的数据的非易失性存储器。总线系统可以包括例 如系统总线、1/0总线和PCI总线的一个或多个总线。当然,总线系 统可以使用任何类型的通信构造或体系结构实现,其提供连接到该 构造或体系结构的不同部件之间的数据传输。通信单元可以包括一 个或多个设备,用于传输和接收数据,例如调制解调器或网络适配 器。存储器可以例如是主存储器208或例如北桥和存储器控制器集 线器202中的緩沖存储器。处理单元可以包括一个或多个处理器或 CPU。图1和图2中描述的示例和上述的示例不旨在暗示体系结构 的限制。例如,数据处理系统200还可以是除PDA形式之外的平板 计算机、膝上型计算机或电话设备。
定义的陈旧度
如前所述,数据项的"陈旧度"描述与计算节点的数据相比较最新 的订户数据情况。图3是说明根据示例性实施例数据项的陈旧度如 何基于到订户的更新的递送或不递送而变化的曲线。特别地,图3 说明根据在先前状态处采取的行动,在订户侧的lt据项可以如何进 入不同的状态。
在此示例性示例中,在时间2处的计算节点观察到新的数据项 302。节点立即向订户递送数据项302(在时间2处的箭头304)。由于 现在订户具有最新数据,如在时间3和时间4处的方框306所示, 陈旧度维持在O,直到时间5之前发生更新(数据项308 )。如果节点停止发送更新,则订户侧数据变得陈旧。在此情况下,因为订户
侧数据在时间4之前为最新数据,所以数据在时间5为1时间单位 的陈旧,如方框310所示。
在此示例中,数据项的陈旧度随时间的流失而增加。在时间8 处的数据项的后续更新312不影响陈旧度,除非将更新312递送到 订户。在时间9处,节点向订户递送(在时间9处的箭头314)最新 的更新(即,由提供商在时间8处观察到的数据项312),现在订户 具有最新的数据。然而,如果紧接着先前更新的递送之后发生另一 个更新316(即,在时间10处),则订户将再次具有陈旧数据,如方 框318所示。
基于在图3中的观察,在时间f处数据项d的陈旧度id(t)(以订 户的视角)可以定义如下
「0如果d在时间t处是最新的
其中为当d为最新时,t,(d)为最后的时间。 状态变换和状态变换成本
图3说明如何根据订户侧数据的陈旧度来定义数据项的状态, 以及根据在先前状态处采取的行动,在订户侧的数据可以如何进入 不同的状态。采取这些行动将导致向订户递送数据项的更新的成本。 该成本已知为状态变换成本。状态变换成本可以包括两种类型的成 本(1)更新传播成本otd和(2)陈旧度损失Sd(i)。更新传播成本 是向订户递送数据项的更新的资源利用成本。陈旧度损失表示具有 数据项的陈旧值(时间单位陈旧值i)的订户的不满。当数据项d是 i时间单位陈旧时,采取向订户发送最新更新的行动涉及更新传播成 本(Xd。该行动不导致关于陈旧度的任何成本,因为订户将获得最新
的信息。相反,采取停止发送更新的行动不导致更新传播的成本CXd。
然而,停止发送更新将允许陈旧度损失Sd(i)增加。因此,针对数据 项d (假设d是i时间单位陈旧)采取行动u的状态变换成本gd(i,u)可以定义为
,、如果u<formula>formula see original document page 12</formula> 其他
图4是说明根据本发明示例性实施例的状态变换和状态变换成 本的示图。特别地,图4是马尔可夫模型,其总结了根据状态及其 之间的变换的更新、陈旧和采取的行动(即,发送和/或停止发送) 之间的关系。状态i402表示数据项为i时间单位陈旧的状态。状态 0 404暗示数据项根据订户的视角为最新。
当订户侧数据是i时间单位陈旧时(i〉0),数据项的陈旧度在 下一个时间滴答处增加1时间单位,除非计算节点向订户递送最新 更新。该情况在本示例性示例中表示为从状态i402移动到状态i+l 408的停止发送箭头406。相反,如果提供商发送更新,则订户侧数 据的陈旧度将立即进入状态0 404,如发送箭头410和412所示。然 而,取决于是否发生更新和是否递送更新,数据的陈旧度在下一个 时间滴答处可以是状态1 414或状态0404。在该附图中,p表示提 供商在下一个时间滴答之前观察到更新的概率,并且从状态i402到 状态1 414的箭头416表示其中更新传播被紧紧跟随的更新所推迟的 情况(注意,该箭头与概率p相关联)。该情况对应于在图3中具 有在时间10处的1的陈旧度的情况。图4还示出了发出更新(箭头 410和412)将导致具有概率l-p的O的陈旧度。
如前所述,示例性实施例在资源利用和递送到订户的信息的及 时性之间进行平衡。为达到该目标,示例性实施例最小化状态变换 成本函数,该函数结合(1)向订户递送数据项d的更新的成本(Xd 和(2)具有针对数据项d的i时间单位陈旧值的订户的损失Sd(i)。 针对向订户递送数据项d的更新的成本ad,可以使用每个数据项的 固定的成本以使问题简单化,但该条件也可以放宽到应付不同的系 统条件。针对具有针对数据项d的i时间单位陈旧值的订户的损失 Sd(i),考虑两种类型的损失,每一种定义为陈旧度的函数。陈旧度损失的一个类型是陈旧度的线性损失函数。在此情况下, 假设订户不满的增长与信息的陈旧度成比例。作为陈旧度的线性函
数的损失的类型如下
其中,i是数据项d的陈旧度,并且13d表示关于服务的整体质量 的陈旧度的负效应。
陈旧度损失的另一个类型为逻辑函数的形式。该逻辑模型用于 描述时间关键的情况,其中订户将超过某一点的陈旧度假设为服务 失败。例如,如果订户对具有1秒陈旧的信息完全不满意,则超过l 秒的任何陈旧度具有失去所有的订户的相同效应。作为陈旧度的逻 辑函数的损失类型如下
其中,i是数据项d的陈旧度,并且其中Md,Td,md和tid为数据 项d特有的常数。 控制策略
已知图4中描述的状态变换概率和状态变换成本,确定优选的 控制策略,其在平均的意义上最小化状态变换成本gd(i,u)。控制策略 用于确定在每个滴答处是否递送或停止是否信息,以此优化地平衡 资源利用和递送信息的及时性。
发现最佳控制策略的一个可能的方法是使用贝尔曼方程。贝尔 曼方程是由理查德贝尔曼开发的优化方程,其允许确定优化策略。 贝尔曼方程表示为以下形式
针对每个状态i ,
,* +/z * (/) = min action [g(/,") + : a (举* (力
其中,g(i,u)是在状态i采取行动u的成本,并且pij(u)是当在状 态i采取行动u时,从状态i移动到状态j的概率。注意,V和M(i)在方程中未知,并且有为其发现值的迭代方法 和最小化方程的右手侧的针对每个状态i的行动U。这暗示了解该方 程将导致获得针对每个情况采取的最佳行动(即,发现优化控制策
略)。然而,已知n状态,该方法需要解1+n未知数的方程系统。 发现优化控制策略的更经济的解决方案是假设典型控制策略并
且发现平均状态变换成本可以表示为策略的函数。然后,可以发现
最小化平均状态变换成本的控制策略。
考虑在其中当在时间单位中数据项d的陈旧度达到e时,优化控
制策略决定向订户递送最新的更新的情况。由于控制策略的优化确
所有大于e的陈旧度,控制策略将决定递送更新(因为随着陈旧度的 增加,更新传播的获益不会降低,而成本保持不变)。因此,优化 策略将具有如下典型的形式
如果陈旧度&e,则 发送最新更新
应当注意,控制策略仅由e参数化。该参数化暗示了现在发现优 化策略的问题减轻为发现典型控制策略的优化阈值0* 。
如下定理说明了可以如何计算这样的典型策略的平均状态变换 成本。已知典型控制策略由陈旧度阈值e和陈旧度损失函数Sd(i)参数
化,数据项d的平均状态变换成本可以表示为
其中,(1 ) cid是传播数据项d的更新的成本,(2) Sd(i)是为i 时间单位陈旧的数据项d的损失,以及(3) &=丄-1 。
由于该定理中的成本函数Cd(e)表示为e的一维函数,所以可以在 许多实际情况中通过使用已知的最小化算法之一来发现优化陈旧度 阈值e气因此,可以发现优化地进行在资源利用和信息陈旧度之间 的平衡的控制策略。此外,针对前述线性陈旧度损失函数和逻辑陈旧度损失函数,
现在可以确定每个损失函数特有的优化陈旧度阈值e。如上所述,线
性陈旧度损失的形式为Sd(i)==iVi。已知典型控制策略由陈旧度阈值
e和线性陈旧度损失Sd(i)-ivi参数化,数据项d的平均状态变换成
本可以表示为
<formula>formula see original document page 15</formula>
,其中 4=1—1
此外,在如下情况处,成本函数Cd(e)最小化
逻辑陈旧度损失的形式为
1 + e -'/rrf ^7"
1 + "Z
已知典型,制策略由陈旧度阈值e和逻辑陈旧度损失

参数化,数据项d的平均状态变换成本可以表示
<formula>formula see original document page 15</formula>
,其中
<formula>formula see original document page 15</formula>
图5是用于根据示例性实施例确定在分布式流处理中的优化流 量控制策略的两个处理的流程图。图5中描述的处理可以在例如图1 中的信息分发系统100的数据处理系统中实现。处理包括用于确定 在分布式流处理中的优化流量控制策略的离线处理和用于在信息^ 发系统中执行该策略的在线处理。
在离线处理中,创建马尔可夫模型,其使用某些时间单位为每个陈旧度值包括一个状态(步骤502 )。信息分发系统使用来自信息 提供商的期望的消息速率,以针对向信息订户发送包括数据更新的 新消息和针对停止发送来自信息订户的新消息两者,确定马尔可夫 模型中的状态变换概率(步骤504 )。状态变换概率是取决于在先前 状态处由信息提供商采取的行动,数据项可以进入的可能的状态。 然后,信息分发系统使用成本函数利用状态变换成本来注释在上述 马尔可夫模型中的每个变换(步骤506)。状态变换成本包括向订户 递送数据项的更新的成本(更新传播成本)和具有数据项的i时间单 位陈旧值的订户的损失。陈旧度损失是基于数据项的陈旧度水平描 述订户的不满的目标函数。
将随机优化算法应用于马尔可夫模型以为每个状态确定传播策 略(步骤508 )。该传播策略指定信息分发系统是应当向信息订户发 送新消息或是从信息订户停止发送新消息。然后,对容纳发送消息 的部件(例如,计算节点)的机器部署传播策略(步骤510)。
在线处理在嵌入到机器的消息发送层之内的"控制器"中执行,其 中该机器主控图1中的计算节点116,该计算节点需要发送控制。控 制器等待滴答已经流失的通知(步骤512)。如果接收到这样的通知, 则用l来更新数据的陈旧度值,除非陈旧度为O并且在最后的滴答 中没有新的消息到达(步骤514)。然后,控制器观察数据的陈旧度 并且使用先前在步骤510期间部署的传播策略以确定是向信息订户 发送新消息或是从信息订户停止发送新消息(步骤516)。
如果控制器确定发送新消息(步骤516的"是"输出),则将最后 的未发送消息发送到信息订户并且将数据的陈旧度值复位为0(步骤 518)。处理循环回到步骤512并且等待下一个滴答。
返回到步骤516,如果控制器确定停止发送新消息(步骤516的 "否,,输出),则处理循环返回到步骤512并且等待下一个滴答。
本发明可以采取完全硬件实施例的形式、完全软件实施例的形 式或包括硬件和软件元件两者的实施例的形式。在优选实施例中, 本发明以软件实现,这包括但不限制为固件、驻留软件、微代码等。此外,本发明可以采取可从计算机可用或计算机可读介质访问 的计算机程序产品的形式,其中计算机可用或计算机可读介质提供 可以由计算机或任何指令执行系统使用的或者与其相关联的程序代 码。为了本说明的目的,计算机可用或计算机可读介质可以是任何 有形的装置,其可以包含,存储,通信,传播或传输用于由指令执 行系统、装置或设备使用的或者与其相关联的程序。
该介质可以是电子、^磁的、光的、电》兹的、红外或半导体系统 (或装置或设备)或传播介质。计算机可读介质的示例包括半导体
或固态存储器、磁带、可移除计算机磁盘、随机存取存储器(RAM)、 只读存储器(ROM)、硬磁盘和光盘。光盘的当前的示例包括致密 盘只读存储器(CD-ROM)、读写致密盘(CD-R/W)和DVD。
适合于存储和/或执行程序代码的数据处理系统将包括通过系统 总线直接或间接地耦合到存储器元件的至少 一个处理器。存储器元
存储器和为在执行期间降低必须从大容量存储器检索代码的次数而 提供至少某些程序代码的临时存储的緩沖存储器。
输入/输出或1/0设备(包括但不限于键盘、显示器、指示设备 等)可以直接地或通过介入的1/0控制器耦合到系统。
网络适配器还可以耦合到系统以使得数据处理系统能够通过介 入的专用或公共网络被耦合到其他数据处理系统或远端打印机或存 储设备。调制解调器、有线调制解调器和以太网卡仅为当前可用的 几种类型的网络适配器。
已经出于示例性和描述的目的对本发明进行了描述,该描述不 旨在以其公开的形式穷举或限制本发明。许多修改和变形对本领域 技术人员是显而易见的。为了最佳地解释本发明和实际应用的原理 以及为使本领域的其他技术人员理解本发明而选择和描述了实施 例,利用各种修改的各种实施例适合于所遇到的特定使用。
权利要求
1.一种计算机实现的方法,用于生成用于在信息分发环境中控制消息流量的传播策略,该计算机实现的方法包括识别具有每个数据陈旧度值一个状态的马尔可夫模型;确定在马尔可夫模型中状态变换概率,以决定使用期望的消息速率从信息提供商向信息订户发送包括数据更新的新消息以及从信息提供商决定停止向信息订户发送新消息;使用成本函数为马尔可夫模型中的每个状态变换注释状态变换成本,以决定发送新消息和决定停止发送新消息;为每个状态确定传播策略,其中该传播策略指定是否向信息订户发送新消息或者停止为信息订户发送新消息;以及部署该传播策略。
2. 根据权利要求1所述的计算机实现的方法,其中为每个状态确 定传播策略包括应用随机优化算法来确定是否向信息订户发送新消 息或者停止为信息订户发送新消息。
3. 根据权利要求2所述的计算机实现的方法,其中该随机优化算 法最小化在不定的期间内每个滴答的平均成本。
4. 根据权利要求1所述的计算机实现的方法,其中该状态变换概 率从估计的或先前观察的关于更新速率的统计导出。
5. 根据权利要求2所述的计算机实现的方法,其中使用成本函数 为马尔可夫模型中的每个状态变换概率注释状态变换成本进一步包 括使用朝向该信息订户传播该新消息的传播成本和针对数据的陈 旧度的函数的损失,来计算该状态变换成本。
6. 根据权利要求1所述的计算机实现的方法,其中该马尔可夫模 型包括(a)定义作为当前陈旧度的函数的陈旧度值的参数、(b) 在当前时间单位期间新消息将到达的概率、和(c)决定是否在当前 时间单位期间发送最新消息或停止发送最新消息的每个值的变换的成本。
7. —种计算机实现的方法,用于控制在分布式流处理中的消息流 量,该计算机实现的方法包括响应于时间单位的流失,确定在该时间单位期间是否从信息提 供商接收到包括数据更新的新消息;响应于确定在该时间单位期间^"收到新消息,增加由信息订户 保留的和与新消息相关联的数据的陈旧度值;基于传播策略确定是否向信息订户发送新消息或停止向其发 送;以及响应于确定发送该新消息,向信息订户传播新消息并且对由信 息订户保留的和与新消息相关联的数据的陈旧度值进行复位。
8. 根据权利要求7所述的计算机实现的方法,其中该陈旧度值是 从接收到未发送的更新的状态以来经过的时间单位的数量。
9. 根据权利要求7所述的计算机实现的方法,其中该传播策略规 定,如果该陈旧度值超过阈值,则发送该新消息,以及如果该陈旧 度值在阈值以下,则停止发送该新消息。
全文摘要
一种在分布式流处理中控制消息流量的方法和系统。确定在每个数据陈旧度值具有一个状态的马尔可夫模型中的状态变换概率,以使用期望的消息速率从信息提供商向订户发送或停止发送数据更新。成本函数利用每个决定“发送”或“停止发送”的状态变换成本来注释在模型中的每个状态变换。为每个状态确定指定是否发送或停止发送消息的传播策略。然后,部署传播策略。如果在流失的时间单位期间接收到包括数据更新的新消息,则由订户保留的数据的陈旧度值被增加。使用传播策略来确定是否发送或停止发送消息。如果应当发送消息,则消息得以传播并且数据的陈旧度值被复位。
文档编号H04L12/58GK101321189SQ200810109388
公开日2008年12月10日 申请日期2008年6月6日 优先权日2007年6月7日
发明者C·多雷, J-H·黄, R·E·斯特罗姆 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1