专利名称:使用来自移动数据源的数据估算道路交通状况的利记博彩app
技术领域:
以下的公开文本总体上涉及一种从各种数据源获取的数据来估算道路交通状况的技术,例如通过基于反映了感兴趣道路上的实际行驶的数据样本来推断这些道路上有关交通的信息。
背景技术:
由于道路交通以比道路容量更大地速率持续增加,激增的交通拥堵已经对商业和政府运作以及个人幸福感产生恶劣的影响。因此,以各种方式进行了各种努力来抗击激增的交通拥堵,诸如通过获取当前交通状况的信息并将信息提供给个人和组织。可以通过各种方式(例如,经由射频广播、互联网网站,互联网网站显示了地理区域的地图,其中该地理区域的一些主要道路上当前的交通拥堵由彩色编码信息表示,信息可以发送到蜂窝式移动电话和其它便携式消费设备等)将这样的当前交通状况信息提供给感兴趣方。获取有关当前交通状况信息的一种来源包括人工提供的观测(例如,提供有关交通流量和事故一般信息的交通直升机,由司机经由移动电话发来的报告等),而在一些更大型的都市区域中,另一种来源是交通传感器网络,其能在区域中测量各种道路的交通流量 (例如,通过嵌入在道路路面内的传感器)。尽管人工提供的观测可以在有限的情况下提供一些值,这样的信息通常每次仅限于少数区域并且通常缺乏足以使用的足够细节。在一些情况下,交通传感器网络可以提供一些道路交通状况的更详细的信息。但是这样的信息以及由其它类似的来源所提供的信息存在各种问题。例如,很多道路没有道路传感器(例如,没有道路传感器的地理区域和/或并未足够大到具有道路传感器而作为临近网络一部分的干道),甚至具有道路传感器的道路也可能经常不能提供精确的数据,这极大地削弱了交通传感器所提供的数据值。非精确和/或非可靠数据的一种原因包括交通传感器损坏,从而不能提供数据,或提供间断数据,或不能正确读取数据。非精确和/或非可靠数据的另一种原因包括在一个或多个传感器进行数据暂时传输的问题,导致间断传送,或延迟传送,或不传送数据。此外,很多传感器没有配置或设计来报告有关驾驶者状态 (例如,他们机能是否正常),即便报告了驾驶者的状态信息也可能不正确(例如,报告驾驶者机能正常但实际上却并非如此),这样就很难或不可能确定由交通传感器所提供的数据是否精确。此外,有关交通的信息仅能以原始和/或离散的形式得到,从而使用有限。隐藏,提供一种改进的技术来获取并估算有关交通的信息并提供各种相关附加的能力是很有益处的。
图1是图示了用于至少部分地基于从车辆和其它移动数据源所获取的数据来估
8算道路交通状况的系统的实施例的组件之间的数据流的方框图。图2A-2E图示了至少部分地基于从车辆和其它移动数据源获取的数据来估算道路交通状况的实例。图3是图示了适于执行所描述的数据样本管理系统(DataSample Manager System)实施例的计算系统的方框图。图4是数据样本过滤器例程的示例性实施例的流程图。图5是数据样本异常值去除器(Outlier Eliminator)例程的示例性实施例的流程图。图6是数据样本速度估算器例程的示例性实施例的流程图。图7是数据样本流量估算器例程的示例性实施例的流程图。图8是移动数据源信息提供例程的示例性实施例的流程图。图9A-9C图示了获取并提供有关道路交通状况中移动数据源的动作实例。图10A-10B图示了修正从道路交通传感器获取的数据样本的实例。图11是传感器数据读取错误检测器例程的示例性实施例的流程图。图12是传感器数据读取错误校正器例程的示例性实施例的流程图。图13是传感器数据读取收集器例程的示例性实施例的流程图。图14是交通流量估算器例程的示例性实施例的流程图。
具体实施例方式基于获取的交通相关的数据,以各种方式来描述估算道路交通状况的技术,诸如来自在道路上行驶的车辆和其它移动数据源和/或来自交通传感器(例如,嵌入在道路内或附近的物理传感器)。此外,在至少一些实施例中,从移动数据源来的数据样本可以用从一个或多个其它来源的数据补充,诸如通过获取在道路附件或道路内的物理传感器读取的数据。基于所获取的数据样本(例如,从道路交通传感器,从各个移动数据源或收集数据点读取的数据)对道路交通状况的估算可以包括数据样本和读数的各种过滤和/或调整,以及感兴趣的交通相关特征的各种推断和概率确定。如所述,在一些实施例中所获取的道路交通状况信息数据可以包括由移动数据源 (例如,车辆)提供的多个数据样本,来自基于道路的交通传感器(例如嵌入在道路路面内的环形传感器)的数据读数,和来自其它数据源的数据。数据可以以诸如估算的平均交通速度和所感兴趣的道路的特定部分内估算的总车辆总量等的各种方式分析以便于确定所感兴趣的交通状况特征,以便以实时或近于实时(例如在接收底层数据样本和/或读数) 的方式执行交通状况的确定。例如,所获取的数据可以以各种方式调整以检测和/或校正在数据中的错误。如果所获取的道路交通状况信息是不精确的或不能代表所感兴趣的实际交通状况特征,则在各个实施例中还可以以各种方式进行过滤以去除数据,包括通过将至少部分基于道路的非感兴趣的数据样本与根据其它数据样本关联的数据样本和/或作为统计异常值的数据样本视为相同,在一些实施例中,过滤还可以包括执行将数据样本与特定道路的关联。过滤后的数据样本还可以包括其它反映车辆位置或非感兴趣的行为(例如,停泊的车辆,车辆在停车场或建筑中打转等)的数据样本和/或其它不能代表在感兴趣的道路上实际车辆行驶的数据样本。在至少一些实施例中估算所获取的数据可以包括至少部分地基于所获取的数据样本确定用于在特定地理区域中道路网络各个部分的交通状况 (例如,交通流量和/或平均交通速度)。接着可以使用所估算的数据来执行涉及分析、预测,预报,和/或提供交通相关信息的其它功能。在至少一些实施例中,数据样本管理系统使用至少一些所描述的技术来准备由交通数据客户端所使用的数据,诸如在未来多个时间产生交通状况的多个预报的预测交通信息提供系统,这将在以下详细描述。在一些实施例中,所获取数据样本的调整可以包括修正错误的数据样本,诸如通过以各种方式检测和/或校正当前数据中的错误(例如,从道路交通传感器接收的数据读数)。具体地,诸如基于由这些数据源提供的数据样本的分析,描述用于估算特定数据源 (例如基于道路的交通传感器)的“健康”的技术以便确定数据源是否工作正常并可靠地提供精确数据样本。例如,在一些实施例中,将由给定的交通传感器提供的当前数据读数与该交通传感器提供的以前的数据读数(例如,历史平均数据)进行比较,以确定当前交通数据读数是否与以前通常的数据读数显著不同,例如这可以由该交通传感器非正常工作和/或数据中的其它问题所导致,和/或可以替换来反映异常的当前交通状况。在各个实施例中可以以各种方式来执行对特定数据源和/或当前交通数据读数中可能错误的这种检测和分析,这将在以下更详细讨论,包括至少部分基于诸如使用神经网络、贝叶斯分类器、决策树等的分类技术。在检测诸如到来自未正常工作的受损数据源的不可靠数据样本后,可以以这种方式校正或修正这种不可靠数据样本(以及丢失的数据样本)。例如在一些实施例中,可以通过使用相关信息的一个或其它来源来修正一个或多个数据源(例如,交通传感器)的丢失数据和不可靠数据,例如通过来自临近或其它正常工作的相关交通传感器的同时数据样本 (例如,通过对由相邻交通传感器提供的数据读数取平均数),通过涉及丢失和不可靠数据样本的预见性信息(例如,通过使用这些数据源的预见性和/或预报性交通状况信息来确定一个或多个数据源的期望数据读数),经由一个或多个数据源的历史信息(例如,通过使用历史平均数据读数),经由使用有关一致偏差或导致错误能得以补偿的其它错误类型来调整以校正数据样本等。涉及修正丢失和不可靠数据样本的其它细节将在以下详细描述。此外,描述的技术还用于以各种其它方式估算交通状况信息,诸如在当前可用的数据允许可靠地执行特定数据源(例如,特定交通传感器)的数据样本的修正的情况。例如,多个未正常工作的不健康交通传感器的存在可能导致没有足够数据来对这些交通传感器中的各个充分可信地估算交通流量信息。在这种情况中,交通状况信息可能以各种其它方式来估算,包括基于相关交通传感器组和/或涉及道路网络结构的其它信息。例如,如以下要更详细描述地,每个感兴趣的道路可以通过使用多个道路段来建模或表示,每个道路段可以有多个关联的交通传感器和/或从一个或多个其它数据源(例如,移动数据源)得到的数据。假如这样的话,可以以各种方式针对特定道路段(或多个相关交通传感器的其它组)来估算道路交通状况信息,例如通过使用用于估算相邻道路段的交通状况信息、用于特定道路段的预测信息(例如,在诸如三小时等有限的未来时间段内产生,至少部分地基于当前和预定时间内近来的情况),对特定道路段的预报信息(例如,在诸如两周或更长时间的未来时间段内产生,以便不使用用于预测的当前和近来状况信息的一些或全部)、特定道路段的历史平均状况等。通过使用这样的技术,即便在只有少量或没有一个或多个临近传感器或其它数据源的当前交通状况数据时也能提供交通状况信息。涉及这样的交通状况信息估算的其它细节将在以下详细描述。如前所述,在各种实施例中有关道路交通状况的信息可以从移动数据源以各种方式获得。在至少一些实施例中,移动数据源包括道路上的车辆,其每个包括一个或多个提供有关车辆移动数据的计算系统。例如,每部车辆可以包括GPS (“全球定位系统”)设备和/或其它能确定地理位置、速度、方向和/或其它表征或涉及车辆行驶的数据的地理定位设备, 并且有时车辆上的一个或多个设备(无论是否为地理定位设备或相异通信设备)可以将这样的数据(例如,通过无线链路)提供给一个或多个能使用这样的数据的系统(例如,数据样本管理系统,将在以下更详细描述)。例如,这样的车辆可以包括由各个不相关的用户操作的车辆的分布式网络、车队(例如,用于快递公司(delivery company)、出租车和公交车公司、运输公司、政府部门或代理,车辆租赁服务的车辆等)、隶属提供相关信息(例如, OMtar服务)的商业网络的车辆、被操作来获取这样的交通状况信息的车辆组(例如,通过行驶预定的路线,或行驶在道路上动态改变方向,以获取有关所感兴趣的道路的信息)、装载有移动电话设备的车辆(例如,作为内置设备和/或拥有车载物(vehicle occupant)) 能提供位置信息(例如,基于设备的GPS能力和/或基于由移动网络提供的地理定位能力)寸。在至少一些实施例中,移动数据源可以包括或基于计算设备和道路上行驶的用户的其它移动设备,诸如用户是道路上车辆的驾驶者和/或乘客。这样的用户设备可以包括具有GPS能力的设备(例如,移动电话和其它手持设备),或在其它实施例中位置和/或移动信息替换地也可以以其它方式产生。例如,在车辆和/或用户设备中的设备可以与能检测和跟踪有关设备信息的外部系统进行通信(例如,通过系统操作的网络中的多个发射机 /接收机各自通过的设备),从而使得设备的位置和/或移动信息以具有各种细节水平的各种方式被确定,或者这样的外部系统还能检测和跟踪有关车辆和/或用户的信息而不与设备交互(例如,能观测并识别驾驶牌和/或用户面部的相机系统)。例如,这样的外部系统可以包括移动电话塔和网络,其它无线网络(例如,Wi-Fi热点),使用各种通信技术的车辆换能器的检测器(例如,RFID,或“射频标识”),车辆和/或用户的其它检测器(例如,使用红外线,声纳,雷达或激光测距设备以确定车辆的位置和/或速度)等。可以以各种方式使用从移动数据源获得的道路交通状况信息,无论单独还是与来自一个或多个其它来源(例如,从道路交通传感器)的其它道路交通状况信息一起使用。 在一些实施例中,使用这样的从移动数据源获得的道路交通状况信息,来提供信息类似于来自道路传感器的数据,但对于没有运行的道路传感器的道路(例如,对于缺少传感器的道路,诸如对于没有道路传感器网络的地理区域和/或没有大到足以有传感器的干道,对于损坏的道路传感器等),以校验从道路传感器或其它来源接收的复制信息,从而识别提供非精确数据的道路传感器(例如,由于临时或当前问题)等。而且,道路交通状况可以以一种或多种方式测量或表示,无论是基于来自移动数据源和/或交通传感器数据读数的数据样本,例如在绝对方面中(例如,平均速度;所指示的时间段中的交通量;一个或多个交通传感器或道路上的其它位置的平均占用时间,例如以表示车辆通过或激活传感器时间的平均百分数;一个或多个道路拥堵的计算等级,例如基于一个或多个其它交通状况测量的; 等等)和/或在相对方面(例如,表示与通常情况或最大情况的差异)。在一些实施例中,一些道路交通状况信息可以采取由各种数据源提供的数据样本的形式,例如与车辆关联的数据源以报告车辆的行驶特征。各个数据样本可以包括变化的信息量。例如,由移动数据源提供的数据样本可以包括一个或多个来源标识符、速度标识符、方位或方向指示、位置指示、时间戳和状态标识符。来源标识符可以是标识作为数据源的车辆(或人和其它设备)的数字或串。在一些实施例中,移动数据源标识符可以与移动数据源永久或暂时关联(例如,对于移动数据源的寿命;对于一个小时;对于当前使用的会话,例如以便每一次开启车辆或数据源设备就分配一个新的标识符)。在至少一些实施例中,来源标识符与移动数据源关联,以使涉及来自移动数据源的数据的私密关系最小化 (无论是永久还是暂时关联),例如通过以阻止基于标识符来识别与该移动数据源与标识符关联的移动数据源的方式来创建和/或操作源标识符。速度指示可以反映以各种方式表示的移动数据源的即时或平均速度(例如,英里每小时)。方位可以反映行驶的方向,并且是以“度”表示的角度或其它度量(例如,基于罗盘的方位或弧度)。位置指示可以反映以各种方式表示的物理位置(例如纬度/经度对或Universal Transverse Mercator坐标)。 时间戳可以指示移动数据源记录给定时间样本的时间,例如以本地时间或UTC(“Universal Coordinated Time”)时间。状态标识符可以表示移动数据源的状态(例如,车辆在移动、 停止、引擎运转着停止等)和/或感测、记录和/或发射设备的至少一些状态(例如,电量低、信号强度弱等)。在一些实施例中,在给定地理区域内的道路网络可以通过使用多个道路段来建模或表示。每个道路段可以用于表示道路(或多个道路)的一部分,例如通过将给定的物理道路分割成多个道路段(例如,每个道路段具有特定的长度,诸如一英里长的道路,或选择反映出类似的交通状况特征的道路部分作为道路段),这样的多个道路段可以是道路连续的部分,或替换地在一些实施例中,它们可以重叠或任何道路段都没有相互干扰的部分。此外,道路段可以表示给定物理道路上的一个或多个行驶车道。因此,在两个方向的每个上都有一个或多个行驶车道的特定多车道可以与至少两条道路段关联,其中至少一个道路段与一个方向上的行驶关联,而至少另一个与另一方向上的行驶关联。此外,在一些情况中,在单一方向上行驶的单一道路的多个车道可以由多个车道段表示,例如如果车道具有不同的行驶状况特征。例如,给定的高速公路系统可以具有快速或高占用率(”H0V”)车道,其可以由与表示相同方向上行驶的常规(例如,非H0V)车道迥然不同的方式表示以作为快速或 HOV车道。车道段还可以连接到其它相邻的道路段或与其它相邻的道路段关联,从而形成道路段网络。图1是图示了用于至少部分地基于从车辆和其它移动数据源获取的数据估算道路交通状况的系统的实施例的组件之间的数据流的流程图。所示的数据流程图意欲反映在数据源,即数据样本管理系统的实施例的组件,和交通数据客户端之间的数据流的逻辑表示。也就是说,实际的数据流可能经由各种机制而发生,包括直接流(例如,由通过参数实现或诸如消息的网络通信)和/或经由一个或多个数据库系统或其它诸如文件系统的存储系统的间接流。所示的数据样本管理系统100包括数据样本异常值去除组件106、数据样本速度估算组件107、数据样本流估算组件108和可选传感器收集组件110。在所示的实施例中,数据样本管理系统100的组件104-108和110从各种数据源获取数据样本,这包括基于车辆的数据源101、道路交通传感器103和其它数据源102。基于车辆的数据源101可以包括在一个或多个道路上行驶的多个车辆,其每个都可以包括一个或多个计算系统和/或能提供有关车辆行驶数据的其它设备。如另外所要更详细描述地,每部车辆可以包括GPS和/或能确定有关车辆行驶的位置、速度和/或其它数据的地理定位设备。这样的数据可以由所述数据样本管理系统的组件通过无线数据链路(例如,卫星上行链路和/或移动电话网络)或其它方式(例如,在车辆到达某个物理位置后,例如在车队回到其基地后进行物理有线/电缆连接)获得。道路交通传感器102可以包括安装在各个街道、高速公路或其它道路内、上或附近的多个传感器,例如嵌入在路面内的环形传感器能测量每单位时间通过该传感器上的车辆数量、车辆速度和/或涉及交通流量的其它数据。数据可以类似地从道路交通传感器102经由基于有线或无线的数据链路获得。其它数据源103可以包括各种其它类型的数据源,包括提供有关道路网络信息的地图服务和/或数据库,例如道路间的链接以及涉及该道路的交通控制信息(例如,交通控制信号的存在和/或位置和/或限速区域)。虽然在该实例中所示的数据源101-103将数据样本直接提供给数据样本管理系统100的各个组件104-108和110,但在其它实施例中数据样本也可以在被提供给这些组件之前先进行处理。这样的处理可以包括基于时间、位置、地理区域和/或单个数据源的身份(例如,车辆、交通传感器等)组织和/或收集数据样本到逻辑集合中。此外,这样的处理可以包括合并或组合数据样本到更高级的逻辑数据样本或其它值。例如,从多个地理上协同定位的道路交通传感器获得的数据样本可以通过平均或其它收集方式合并入单个的逻辑数据样本。此外,这样的处理可以包括基于一个或多个所获得的数据样本而导出或合成数据样本或数据样本的元素。例如,在一些实施例中,至少一些基于车辆的数据源的每个可以提供仅包括来源标识符和地理位置的数据样本,假如这样的话,那么以特定时间间隔或其它时间段而周期性提供的多个相异数据样本组就能与另一个关联而作为特定车辆所提供的。还可以进一步处理这样的数据样本组来确定其它有关行驶的信息,例如每个数据样本的方位(例如,通过计算在数据样本的位置和先前和/或后继数据样本的位置间的角度)和/或每个数据样本的速度(例如,通过计算在数据样本的位置和先前和/或后继数据样本的位置之间的距离,并将距离除以相应的时间)。在所示的实施例中,数据样本过滤组件104从基于车辆的数据源101和其它数据源102获取数据样本,并在将它们提供给数据样本异常值去除组件106以及可选地在提供给数据样本流估算组件108之前对所获取的数据样本过滤。如在别处将更详细讨论地,这样的过滤可以包括将数据样本与相应于在地理区域中道路的道路段关联,和/或识别不相应于所感兴趣的道路段或反映不感兴趣的车辆位置或行为的数据样本。将数据样本与道路段关联可以包括使用每个数据样本的报告位置和/或方位来确定该位置和方位是否相应于先前限定的道路段。识别不相应于所感兴趣的道路段的数据样本可以包括去除或识别这样的数据样本以便不对它们建模、考量或由数据样本管理系统100的其它组件处理, 要去除的这样的数据样本可以包括那些相应于不感兴趣的特定功能的道路类的道路(例如,居住区街道)的数据样本、那些相应于不感兴趣的道路的部分或区域的数据样本(例如,坡道和采集器/分流车道/告诉公路道路)等。识别数据样本是否反映不感兴趣的车辆位置或行为可以包括识别与处于空闲状态(例如,引擎开着停车)、在停车库驾驶(例如,以非常低的速度打转)等的车辆相对应的数据样本。此外,在一些实施例中,过滤可以包括为呈现或进一步分析而识别道路段是(或不是)感兴趣的。例如,这样的过滤可以包括分析在特定时间段(例如,小时、天、星期)内交通流量的可变性和/或各条道路段的拥堵的程度,以便从进一步分析中排除具有低时间段内(intra-time period)可变性和/或低拥堵的一些或全部道路段(例如,对于传感器数据读数不可用或它们的功能性的道路类别表示更小或更少行驶道路的道路段)作为不感兴趣的道路和道路段。传感器数据调整器105辅助修正错误的数据样本,例如通过检测和校正从道路交通传感器103获得的读数的错误。在一些实施例中,由传感器数据调整组件检测为不可靠的数据样本并不转发到其它组件来使用(或提供特定数据样本的非可靠表示,以便其它组件能处理这些数据样本),例如,不转发到数据样本异常值去除器106。假如这样的话,数据样本异常值去除组件接着可以确定是否有足够的可靠数据样本可用,如果不是的话,则发起校正行为。替换地,在一些实施例和环境中,传感器数据调整组件还可以对数据样本执行一些校正,正如以下将要更详细讨论地,接着将校正后的数据提供给传感器收集组件 110(并可选地提供给其它组件,例如数据样本异常值去除组件和/或数据样本流估算组件)。检测错误数据样本可以使用各种技术,包括统计测量,将由给定的道路交通传感器报告的当前数据样本的分布与在相应的时间段(例如,相同的星期天数和一天内相同的时间)内由该道路交通传感器报告的数据样本的历史分布进行比较。实际和历史分布范围的差异可以由统计测量值计算,例如Kullkick-Leibler散度,其提供了在两个概率分布间的相似度的凸度测量,和/或统计信息熵。此外,一些道路传感器可以报告传感器健康的指示,还可以使用这样的指示来检测所获得的数据样本的错误。如果在所获得的数据样本中检测出错误,则可以以各种方式修正出错的数据样本,包括利用来自确定无错的相邻/旁边道路传感器的相邻(例如,旁边)的数据样本的平均值来替换这样的数据样本。此外,可以通过使用诸如由预测交通信息系统提供的先前或同时预测和/或预测的值进行替换,来修正出错的数据样本。涉及预测交通信息提供的其它细节将另外提供。数据样本异常值去除组件106从数据样本过滤组件104获得过滤后的数据样本和/或从传感器数据调整组件105获得调整或修正后的数据样本,接着识别并考虑去除那些不代表所感兴趣的道路和道路段上的实际车辆行驶的数据样本。在所示的实施例中,对于每个所感兴趣的道路段,组件分析在特定时间段内所记录并与道路段关联的数据样本组 (例如,通过数据样本过滤组件104),以确定如果要去除,应当去除哪个。可以以各种方式执行这样的对非代表性数据样本的确定,包括基于以下技术相对于数据样本组中的其它数据样本,检测数据样本是统计异常值。涉及数据样本异常值去除的其它细节将另外提供。数据样本速度估算组件107从数据样本异常值去除组件106获得数据样本,以便在所示实施例中获得的数据样本表示在所感兴趣的道路和道路段上的实际车辆行驶。数据样本速度估算组件107接着分析所获得的数据,以基于已经与该道路段(例如,通过数据样本过滤组件104,或通过从道路段部分的传感器来的读数)和时间段关联的数据样本组,估算在至少一个所感兴趣的时间段内所感兴趣的道路段的一个或多个速度。在一些实施例中,所估算的速度可以包括该组多个数据样本的速度平均值,也可以由数据样本的一个或多个属性加权(例如,年龄(age),以便给较新的数据样本较大的加权;和/或数据样本的来源或类型,以便从移动数据源或从道路传感器改变数据样本的加权来给具有较高预期可靠性或可用性的来源更大的加权)。涉及从数据样本进行的速度估算的更多细节将在别处提供。
数据样本流估算组件108在至少一个所感兴趣的时间段为所感兴趣的道路段估算交通流信息,以估算交通量(例如,表示为在诸如每分钟或每小时的特定时间量内到达或经过道路段的车辆总量或平均数)、估算交通密度(例如,表示为诸如每英里或公里等的每单位距离的车辆平均数或总量)和估算交通占用率(例如,表示为在例如每分钟或每小时等的特定时间量车辆占用特定点或区域的平均或总的时间量)等。在所示的实施例中, 对交通流信息的估算至少部分地基于由数据样本速度估算组件107和数据样本异常值去除组件106提供的涉及交通速度的信息,可选地可以基于由传感器数据调整组件105和数据样本过滤组件104提供的交通数据样本信息。涉及交通样本流估算的其它细节将在别处提供。如果存在,则诸如在传感器数据调整组件已经去除了任何不可靠的数据样本和/ 或已经修正了任何丢失和/或非可靠数据样本后,传感器数据收集组件110收集由传感器数据调整组件105提供的基于传感器的交通状况信息。替换地,在其它实施例中,传感器数据收集组件可以替代地执行这种丢失和/或不可靠数据样本的去除和/或校正。在一些情况中,传感器数据收集组件110可以通过收集(例如,平均)由与每个道路段关联的多个单独交通传感器提供的信息为这些道路段的每个提供交通流信息。同样地,如果存在,传感器数据收集组件110可以提供信息,以补充由例如数据样本速度估算组件107和/或数据样本流估算组件108等的组件提供的估算交通状况,或可以在来自移动数据源的数据样本根本不可靠或没有足够量的可靠数据样本来允许诸如数据样本速度估算组件107和数据样本流估算组件108等的其它组件提供精确的估算道路交通状况信息的情况下替换地使用。在所示的实施例中一个或多个交通数据客户端109获得由数据样本速度估算组件107和/或数据样本流估算组件108提供的估算的道路交通状况信息(例如,速度和/或流数据),并可以以各种方式使用这样的数据。例如,交通数据客户端109可以包括其它组件和/或由数据样本管理系统100的操作者操作的交通信息系统,例如预见性交通信息提供系统,使用交通状况信息来产生在多个未来时间的未来交通状况预报的交通状况信息; 和/或实时(或近于实时)的交通信息呈现系统获或提供系统,向终端用户和/或第三方客户端提供实时(或近于实时)的交通状况信息。此外,交通数据客户端109可以包括由第三方操作的计算系统以向其客户提供交通信息。此外,在一些环境中(例如,在当不能为数据样本速度估算组件和/或数据样本流估算组件得到足够的数据来执行精确的估算,和/ 或当从基于车辆或其它数据源不能得到数据的情况下)该一个或多个交通数据客户端109 可选地获得由传感器数据收集组件110提供的道路交通状况信息,可以替代来自数据样本速度估算组件和/或数据样本流估算组件来的数据,或在此之外额外获得。为了图示的目的,一些实施例在以下描述,其中以特定的方式估算特定类型的道路交通状况,并且以各种特定的方式使用这样的估算交通信息。但,应当理解的是,可以以其它方式并使用在其它实施例中其它类型的输入数据产生这样的交通状况估算,所描述的技术可以在非常广泛的其它情况中使用,并且本发明并不限于所提供的示例性细节。图2A-2E图示了基于从车辆和其它移动数据源获取的数据估算道路交通状况的实例,正如由所描述的数据样本管理系统所执行的那样。具体地,图2A图示了数据样本过滤的实例,用于具有数条道路201、202、203和204并具有指示朝北方向的图例指示309的实例区域200。在该实例中,道路202,诸如高速公路或交汇公路的受限进入道路(limited
15access road),被分成在西向和东向上分别行驶车辆的相异车道组20 和202b。车道组 202a包括HOV车道202a2和多个其它常规车道20加1,车道组202b类似地包括HOV车道 202b2和多个其它常规车道202bl。道路201是穿行道路202 (例如,经由天桥或桥),道路 204是斜坡弯道,其将道路201的北行车道201b连接到道路202的东行车道组202b。道路 203是相邻道路202的当地沿街道路。可以以各种方式表示在图2A中所示的道路,以用于所描述的数据样本管理系统。 例如,一个或多个道路段可以与每个物理道路关联,例如将北行和南行道路段分别与北行车道201a和南行车道202b关联。类似地,至少一个西行道路段和至少一个东行道路段可以分别与道路202的西行车道组20 和东行车道组202b关联。例如,道路201的东行车道组202b东的部分可以是与道路201的西行车道组202b西的部分相独立的道路段,例如基于一般的道路交通状况或经常在道路段间改变(例如,由于通常车辆显著从斜坡弯道204 流入到道路201的车道组202b,这样一般来说导致在到道路201东向的车道组202b上更大的拥堵)。此外,可以将一个或多个车道组分解到多个道路段中,例如如果不同的车道一般或经常具有不同的道路交通状况特征(例如,基于这些享有类似交通状况特征的车道将车道组202b的给定部分作为相应于车道202bl的第一道路段,而将由于其具有不同交通状况特征因而作为相应于HOV车道202b2的第二车道段)-在其它这种情况中,只有单个道路段可以用于这样的车道组,但在估算该车道组的的道路交通状况时一些数据样本(例如,相应于HOV车道的202b2的那些)可以从使用中排除(例如通过数据样本过滤组件和 /或数据样本异常值去除组件)。替换地,一些实施例可以将多个给定道路的多个车道表示为单条道路段,即便该车道是在相反方向上行车,例如在两个方向上通常道路交通状况类似时——例如,沿街道路20 可以具有两个相反的行车车道,但可以由一个道路段来表示。 在至少一些实施例中道路段至少部分地可以以其它方式来确定,例如与地理信息关联(例如,物理维度和/或方位和/或交通相关信息(例如,限速)。图2A还描述了在特定时间间隔或其它时间段(例如,1分钟,5分钟,10分钟,15 分钟等)期间行驶在区域200内的多个移动数据源(例如,车辆,未示出)所报告的多个数据样本20fe-k。在由多个移动数据源的一个报告时,数据样本的每个都被演示为箭头,其表示数据样本的方位。数据样本以这样的方式叠加在区域200上以便反映每个数据样本所报告的位置(例如,以维度和精度单位表示,诸如基于GPS读数),其在记录数据样本时可以与车辆的实际位置不同(例如,由于不精确或错误的读数,或由于所使用的位置传感机制固有的变量精度)。例如,数据样本205g显示了道路202b略北的位置,其可以反映被拖到车道202 北侧的车辆(例如,由于机械故障),或它可以反映在车道202b2 或其它车道的东行方向上实际行驶的车辆的非精确位置。此外,单个移动数据源可以是比所示的数据样本更多的数据样本的来源,例如如果样本205i和样本20 都由在时间段内沿道路202东向行驶的单部车辆所报告(例如,通过包含用于多个先前时间点的多个数据样本的单一传输,以便每5分钟或每15分钟报告数据样本)。有关存储和提供多个所获取数据样本的更多细节将包括在以下的内容中。在一些实施例中所述的数据样本管理系统可以过滤所获得的数据样本,以便将数据样本映射到预定的道路段和/或识别并不相应于所感兴趣的道路段的数据样本。在一些实施例中,如果报告位置在与道路段相对应的道路和/或车道的预定距离(例如,5米)内,并且其方位在与该道路段相对应的道路和/或车道的方位的预定角度(例如正或负15度) 内,则数据样本与道路段关联。虽然在其它实施例中对道路段的数据样本的关联可以在数据样本可用于数据样本管理系统之前执行,所示实施例中的道路段与足够的基于位置的信息(例如,道路段的方位,道路段的物理范围等)关联,以作出这样的确定。如所示的实例,数据样本20 可以与相应于道路203的道路段关联,因为其报告位置落在道路203的范围内并且其方位与关联道路203的至少一个方位相同(或近于相同)。在一些实施例中,当使用单条道路段来表示在相反的方向上行驶的多个车道时,可以将数据样本的方位与道路段的两个方位比较以确定数据样本是否可以与该道路段关联。例如,数据样本20 具有大致与数据样本20 相反的方位,但如果使用道路段来表示道路 203的两个相反车道,则它也可以与相应于道路203的道路段关联。然而,由于道路203与车道组20 接近,还可能的是,由于数据样本20 的方位与车道组20 的方位相同,则数据样本20 反映在车道组20 上行驶的车辆,例如如果数据样本20 的报告位置在车道组20 的一个或多个车道中行驶的车辆位置错误的空白处。在一些实施例中,多个可能的道路段用于一个数据样本的情况可以基于与该数据样本关联的其它信息来去除。例如,在这种情况中,数据样本20 的报告速度的分析可以有助于这种去除,例如如果车道组20 相应于65mph限速的高速公路,道路203为具有30mph 限速的当地沿街道路,并且数据样本所报告的速度为75mph(导致与高速公路车道的关联比与当地沿街道路关联的可能性要大)。一般地说,如果数据样本20 的报告速度相比车道组20 的观测或发送速度更类似于道路203的观测或发送速度,则这样的信息可以用于部分地确定将数据样本与道路203关联而不是车道组202a。替换地,如果数据样本20 的报告速度相比于观测或发送的道路203的速度更类似于车道组20 的观测或发送速度,则它就与车道组20 关联而不是道路203。其它类型的信息类似地也可作为于这种去除的一部分(例如,位置 ’方位;状态;其它涉及数据样本的信息,例如从相同移动数据源来的其它新近数据样本等),例如作为加权分析的部分来反映数据样本信息类型与候选道路段的匹配程度。例如,对于将数据样本20 与适合的道路段关联,它所报告的位置出现在车道 201b和车道组20 重叠的部分,并且它临近车道201a和其它道路。但,数据样本所报告的方位(大致北行)相比于其它候选车道/道路的方位与车道201b的方位(北行)更接近, 因此在这个实例中它很可能与相应于车道201b的道路段关联。类似地,数据样本205c包括可以匹配多个道路/车道(例如车道201a,201b,和车道组202a)的报告位置,但它的方位(大致西行)可以用于选择用于车道组20 的道路段作为用于该数据样本最合适的道路段。还是这个实例,数据样本205d可以不与任何道路段关联,因为它的方位(大致东行)与相应于该数据样本的报告位置的车道组20 (西行)的处于相反方向。如果没有其它合适的候选道路段,其与数据样本205d所报告的位置足够近(例如,在预定的距离内), 例如如果具有类似方位的车道组202b太远,则在从该数据样本的分析的后续使用过滤期间排除该数据样本。数据样本20 可以与相应于车道组20 的诸如相应于HOV车道202a2的道路段的道路段关联,这是因为它的报告位置和方位相应于该车道的位置和方位,例如如果用于该数据样本的位置的基于位置的技术具有足够的分辨率来区分车道(例如,不同的GPSjl 外线,声纳或雷达测距设备)。数据样本还可以基于除了基于位置信息外的因素而与多车道道路的特定车道关联,例如如果车道具有不同的交通状况特征。例如,在一些实施例中,可以使用数据样本的报告速度来通过对用于每个这样的候选车道的数据样本所观测的速度 (或交通流量的其它测量)的预期分布(例如,通常或高斯分布)建模,而将数据样本与特定车道相符或匹配。例如,由于该数据样本所报告的速度相比于在常规车道202al上行驶的车辆的观测、推断或历史平均速度更接近于HOV车道202a2上行驶的车辆的观测、推断或历史平均速度,因此数据样本20 可以与相应于HOV车道202a2的道路段关联,例如通过基于其它数据样本来确定观测或推断速度(例如,使用由一个或多个道路交通传感器提供的数据读数)和/或其它相关的当前数据的分析。以类似的方式,数据样本205f,205h, 205 和205 j可以分别与相应于车道201a,车道20加1,车道202bl和斜坡204的道路段关联,因为它们所报告的位置和方位相应于这些道路或车道的位置和方位。即便它的报告位置在所示道路的范围外,数据样本205g也可以与相应于车道组 202b的道路段关联(例如,用于HOV车道202 的道路段),这是因为报告位置可以在道路的预设距离(例如5米)内。替换地,如果数据样本20 的报告位置远离道路,则它也可以不与任何道路段关联。在一些实施例中,可以给由不同数据源提供的数据样本使用不同的预设距离,以便反映数据源公知或期望的精确度水平。例如,由使用未校正GPS信号的移动数据源提供的数据样本可以使用相对高(例如,30米)的预设距离,而由使用差异校正 GPS设备的移动数据源提供的数据样本可以相比较而言使用低(例如,1米)的预设距离。此外,数据样本过滤可以包括识别不与所感兴趣的道路段相对应的数据样本和/ 或不能代表在道路上行驶的实际车辆的数据样本。例如,可以根据考量去除一些数据样本, 因为它们与数据样本管理系统不考虑的道路关联。例如,在一些实施例中,与次要功能道路类的道路(例如,居民区街道和/或干道)关联的数据样本可以被过滤掉。再返回图2A, 例如,可以滤除数据样本20 和/或20 ,因为道路203是位于非常低的功能分类的当地临街道路而不被数据样本管理系统所考虑,或者也可以滤除数据样本205j,因为斜坡弯道太短而并不与高速路分离。过滤还可以基于其它因素,例如在一个或多个道路段上其它移动数据源的推断或报告行为。例如,与道路段关联并由单个移动数据源提供的全部都表示相同位置的一系列数据样本有可能表示该移动数据源已经停止了。如果与相同道路段关联的所有其它数据样本都表示移动的移动数据源,则相应于停止的移动数据源的数据样本可以由于不能表示在该道路段上行驶的实际车辆而被滤除,例如由于移动数据源是停泊的车辆。而且,在一些实施例中,数据样本可以包括车辆驱动状态的报告指示(例如,车辆传输为引擎开动的“泊车”,车辆停止以进行发送),如果这样的话,类似地可以使用这样的指示来滤除这样的不能表示实际行驶车辆的数据样本。图2B图示了与在特定时间间隔或其它时间段内从多个数据源获得与一个道路段关联的多个数据样本的视图,其中数据样本标出在曲线210上,并且χ轴210b是测量的时间,y轴210a是测量的速度。在这个实例中,从多个移动数据源以及一个或多个与道路段关联的道路交通传感器获得所示的数据样本,并在所示的图例中以不同的形状显示(即, 黑实心菱形“ ”用于从道路交通传感器获得的数据样本,而空心方形“ 口 ”用于从移动数据源获得的数据样本)。如参考图2A所述,所示的从移动数据源来的数据样本可以与道路段关联。示例性的数据样本包括道路交通传感器数据样本211a_c和移动数据源数据样本 21h-d。给定的数据样本的报告速度和记录时间可以通过其在曲线图上的位置确定。移动数据源数据样本212d具有(或其它速度单位)15英里每小时的报告速度并相对于一些开始点在大约37分钟(或其它时间单位)被记录。如以下要更详细描述地,一些实施例可以在所示时间段内的特定时间窗中分析或处理所获得的数据,例如时间窗213。在这个实例中,时间窗213包含从时间30分钟到40分钟的10分钟的时间间隔内所记录的数据样本。此外,一些实施例还可以将在特定时间窗内产生的数据样本组分成两个或多个组,例如,组21 和组214b。例如,应当注意的是,所示的数据样本表现为反映了报告速度的双模型(bi-modal)分布,其具有成批数据样本,报告在25-30英里每小时范围或0-8英里每小时范围内的速度。可能产生速度的这种双模型或其它多模型(multi-modal)分布是因为, 例如底层交通流量模式是非均一的,这里由于例如使得交通以停-走模式流动的交通控制信号,或道路段包括多个以不同速度移动的交通车道(例如,HOV车道或快速车道具有比其它非HOV车道相对高的速度)。在存在速度数据的这种多模型分布中,一些实施例可以将数据样本分成两个或多个组来处理,以便产生提高的处理精确度或分辨率(例如,通过计算更精确地反映各个交通流量速度的平均速度)以及所感兴趣的附加信息(例如,在HOV交通和非HOV交通间差异的速度),或识别数据样本组来排除(例如,不包括HOV交通作为后续分析的一部分)。虽然这里没有图示,但数据样本的这种相异的组可以以各种方式识别, 包括通过为每组观测速度的差异分布建模(例如正常或高斯分布)。图2C图示了对过滤器执行数据样本异常值去除或考量将不表示在特定道路段上行驶的车辆的数据样本排除的实例,在该实例中其基于用于数据样本的报告速度(虽然在其它实施例中数据样本的一个或多个可以替换来用作分析的一部分,而不论是替换还是排除所报告的速度)。具体地,图2C显示了表220,其图示了对于十个数据样本的实例组执行数据样本异常值去除(在实际使用中,被执行分析的数据样本的数量可以更大)。所示的数据样本可以,例如,是在特定时间窗(例如图2B的时间窗213)内发生的所有数据样本,或替换地可以包括特定时间窗的数据样本的子集(例如在图2B的组21 或214b中所包括的)或者可以包括更长时间段内可以得到的所有数据样本。在本实例中,在所确定的数据样本组中,通过从组中的其它数据样本的平均速度来确定数据样本组中每个速度样本的速度偏差,将非代表性的数据样本识别为相对于其它数据样本的统计异常值。可以测量每个速度样本的偏差,例如相对于在组中的其它数据样本的平均速度相差的标准差的数值,其偏差比预定阈值(例如2个标准差)大的数据样本被识别为异常值,并从进一步的处理中排除(例如,通过丢弃)。表220包括方位行222,其描述了多个列221a_f的内容。表220的每行223a_j图示了对于十个数据样本中一个相异数据样本的异常值去除分析,列221a表示要为每行分析的数据样本,由于要分析每行数据样本,因此将它从该组的其它样本中排除以确定该结果的差异。行223a的数据样本可以参考为第一数据样本,行22 的数据样本可以参考为第二数据样本等。列221b包含每个数据样本的报告速度,其以多少英里每小时测量。列221c 列出了相对于要被比较的给定行的数据样本的、组中的其它数据样本,列221d列出了由列221c指示的数据样本组的大致平均速度。列221e包含了在从列221b排除的数据样本的速度和列出在列221d中的其它数据样本的平均速度之间的大致偏差,其以标准差测量。基于在列221e中列出的偏差是否比为该实例目的的1.5个标准差要大,列221f指示给定数据样本是否应当被去除。此外,用于所有10个数据样本的平均速度2M显示为大约25. 7英里每小时,而所有10个数据样本的标准差225显示为大约14. 2。这样,例如,行223a图示了数据样本1的速度为沈英里每小时。接下来,计算其它数据样本2-10的平均速度为大约25. 7英里每小时。接着计算数据样本1的速度与其它数据样本2-10的平均速度的偏差大约为.02个标准差。最后,由于数据样本1的偏差低于
1.5个标准差的阈值,因此确定数据样本1不是异常值。此外,行223c图示了数据样本3的速度为0英里每小时,而其它数据样本1-2和4-10的平均速度被计算为大约28. 6英里每小时。接着计算数据样本3的速度与其它数据样本1-2和4-10的平均速度的偏差大约为
2.24个标准差。最后,由于数据样本3的偏差高于1. 5个标准差的阈值,因此确定数据样本 3是异常值。更形式化地,给定N个数据样本Vtl,V1, V2, ... , Vn,在给定的时间段内记录并与给定的道路段关联,当前的数据样本Vn将被去除,如果_ σ,其中,Vi为被分析的当前数据样本的速度;K为其它数据样本(ν。, Vi+1,...,vn)的平均速度;Oi为其它数据样本的标准差;c为恒定阈值(例如,1.5)。此外, 作为处理可能存在的除以零的特殊情况,如果其它数据样本的标准差σ i为零并且当前数据样本的速度并不等于其它数据样本的平均速度,则去除当前的样本 。对每个Vi要注意的是,并不一定要迭代所有的其它数据样本(Vtl,...,Vi^1, Vi+1, ...,vn)来计算平均K和标准差σ i。其它数据样本V(l,...,Vi^1, vi+1, ...,Vn的平均K 也可以如下表示V.=N~V~V'并且其它数据样本Vtl,...,Vi^1, vi+1, ...,Vn的标准差ο i可以如下表示其中,N为数据样本的总数(包括当前的数据样本);Γ为所有数据样本Vo,V1, 力,...,\的平均数%是当前数据样本,而σ是所有数据样本ν。,Vl,v2,...,Vn的标准差。 通过使用上述公式,可以高效地计算平均值和标准差,并且具体地可以以恒定时间计算。由于上述的运算法则为每个道路段上的每个数据样本计算了平均值和标准差,因此该法则运行O(MN)时间,其中M是道路段数,N是每个道路段的数据样本数。在其它实施例中,也可以使用其它异常值去除和/或数据去除运算法则,可以替代或是附加所描述的异常值检测,例如基于神经网络分类器,自然贝叶斯分类器,和/或回归模型技术,以及多个数据样本组一起考虑(例如,如果至少一些数据样本并不与其它数据样本独立)的技术。
图2D图示了使用数据样本执行平均速度估算的实例,并显示了类似于在图2B中所描述的用于特定道路段和时间段的实例数据样本。数据样本已在曲线图230中标出,其在χ轴230b测量时间在y轴230a测量速度。在一些实施例中,给定道路段的平均速度可以按周期性基准(例如,每5分钟)计算。每次计算可以在诸如10分钟或15分钟的预定时间窗(或间隔)内考虑多个数据样本。如果在这样的时间窗上计算平均速度,例如在时间窗的末端或近于末端处,则当收集数据样本的速度时,在时间窗内的数据样本可以以各种方式加权,例如考虑数据样本的“年龄”(例如,基于对由于交通状况的改变,因此较老的数据样本不像在更接近当前时刻处记录的较新的数据样本那样能够提供关于时间窗末端或其他当前时刻的实际交通状况的精确信息这样的直觉或预期,而对较老的数据样本打折扣)。类似地,在一些实施例中,当加权数据样本时可以考虑其它数据样本属性,例如数据源的类型或用于数据样本的特定数据源(例如,如果数据样本来自于比其它数据源更精确的或者能提供比其它数据源更好的数据的数据源类型或特定数据源,则对其的加权就更重), 以及一个或多个其它加权因素类型。在所示的实例中,用于实例道路段的平均速度在15分钟的时间窗上每五分钟计算一次。该实例描述了两个图示的数据样本231a和231b的相对权重,因为它们对两个时间窗23 和23 每个所计算的平均速度有贡献。时间窗23 包括在时刻30和45之间记录的数据样本,而时间窗23 包括在时刻35和50之间记录的数据样本。数据样本231a 和231b都落在时间窗235a和235b内。在所示的实例中,在给定时间窗内的每个数据样本都与其年龄成比例加权。也就是说,较老的数据样本相比于较新的数据样本权重较小(因此对平均速度的贡献较小)。具体地,在这个实例中给定数据样本的权重根据年龄指数性减少。这个衰变的加权功能通过分别相应于时间窗23 和23 的两个权重曲线23 和232b图示。每个权重曲线23 和 232b在χ轴(水平)标出数据样本记录时间,在y轴(垂直)标出权重。在时间上较后(例如,更接近时间窗末端)记录的样本权重大于在时间上较早(例如,更接近时间窗开始)记录的样本。给定数据样本的权重可以通过在曲线230上从数据样本向下绘垂直线到它与相应于所感兴趣的时间窗的权重图曲线相交的地方而看出。例如,权重图23 相应于时间窗 23 ,根据数据样本231a (较老)和231b (较新)的相对年龄,数据样本231a的权重233a 少于数据样本231b的权重23北。此外,权重图232b相应于时间间隔235b,并且类似地可以看出数据样本231a的权重23 小于数据样本231b的权重234b。此外,很明显,对于后续时间窗,给定数据样本的权重随时间衰变。例如,在时间窗23 中的数据样本231b的权重23 大于在后来的时间窗23 中的相同数据样本231b的权重234b,因为数据样本231b 在时间窗23 期间相比于在时间窗23 期间相对更新。更正规地,在一个实施例中,对于相对于时刻T处的时间末端的时刻t所记录的数据样本的权重可以如下表示w(t)=[…)其中,e是公知的数学常量,α是可变的参数(例如,0.2)。给定以上,则在于时刻 T处结束的时间间隔中N个数据样本Vtl,V1, V2,..., Vn的加权平均速度可以如下表述,其中 、为数据样本Vi表示的时间(例如,其被记录的时间)
权利要求
1.一种计算机执行的方法,用于从在一个或多个道路上的道路交通传感器提供有关交通状况的可靠数据读数,所述方法包括对于每个在关联道路上具有关联位置的一个或多个道路交通传感器,在时间段内接收由所述道路交通传感器采集的多个数据读数的信息,每个数据读数具有关联时间,并反映了所述道路交通传感器的关联道路的关联位置、在关联时间处的交通状况的一个或多个测量值;和针对所述一个或多个道路交通传感器的每个,自动确定在所述时间段内由所述道路交通传感器采集的多个数据读数是否可能不可靠,所述确定至少部分地基于将这些多个数据读数的至少一些的信息与由所述道路交通传感器先前采集的多个其它数据读数的信息进行自动比较;如果所述时间段内由所述道路交通传感器采集的多个数据读数没有被确定为可能不可靠,则提供指示,以使用这多个数据读数来代表在所述时间段内所述道路交通传感器的关联道路的关联位置处的实际交通状况;和如果所述时间段内由所述道路交通传感器采集的多个数据读数被确定为可能不可靠, 则自动提供指示,以使用其它估算数据代替这多个数据读数来代表所述时间段内所述道路交通传感器的关联道路的关联位置处的实际交通状况,所述其它估算数据至少部分地基于与这些多个数据读数相关的其它道路交通数据,从而通过自动去除可能不可靠的道路交通传感器数据读数来辅助在一个或多个道路上的行驶。
2.根据权利要求1的方法,还包括,针对一个或多个所述道路交通传感器中的至少一个的每个,确定所述时间段内所述道路交通传感器的传感器健康状态至少部分地基于将这些多个数据读数的至少一些的信息与由所述道路交通传感器先前采集的多个其它数据读数的信息进行自动比较,并提供用于所述道路交通传感器的所确定的传感器健康状态的指示。
3.根据权利要求2的方法,其中,在确定了所述时间段内所述道路交通传感器的传感器健康状态是不健康之后,在一个或多个后续的时间段内对由所述道路交通传感器在这些后续时间段内采集的数据读数是否可能不可靠的自动确定还至少部分地基于所述时间段内所确定的不健康状态。
4.根据权利要求1的方法,其中,对于所述一个或多个道路交通传感器的至少一个的每个,自动确定由所述道路交通传感器在所述时间段内采集的多个数据读数是否可能不可靠包括基于所述道路交通传感器的多个数据读数的至少一些,确定所述道路交通传感器的当前数据读数分布,以反映所述时间段内的交通状况,并基于由所述道路交通传感器先前采集的多个其它数据读数来确定平均历史数据读数分布,以反映一个或多个先前时间段内的平均交通状况。
5.根据权利要求4的方法,其中,对于所述至少一个道路交通传感器的每个,将这些多个数据读数的至少一些的信息与由所述道路交通传感器先前采集的多个其它数据读数的信息进行比较包括将用于当前和平均历史数据读数分布的信息熵的统计度量进行比较。
6.根据权利要求4的方法,其中,对于所述至少一个道路交通传感器的每个,将这些多个数据读数的至少一些的信息与由所述道路交通传感器先前采集的多个其它数据读数的信息进行比较包括确定在当前和平均历史数据读数分布之间相似度的统计度量。
7.根据权利要求6的方法,其中,对于所述至少一个道路交通传感器的每个,确定的当前和平均历史数据读数分布之间相似度的统计度量基于Kullhck-Leibler散度计算。
8.根据权利要求1的方法,其中,对于所述一个或多个道路交通传感器的至少一个的每个,将至少一些多个数据读数的信息与由所述道路交通传感器先前采集的多个其它数据读数的信息进行比较还包括对至少一些多个数据读数的信息进行分类。
9.根据权利要求8的方法,其中,对于至少一个道路交通传感器的每个,通过神经网络、决策树和贝叶斯分类器的至少一个执行所述分类。
10.根据权利要求1的方法,其中,对于所述一个或多个道路交通传感器的至少一个的每个,用于代替所述时间段内由所述道路交通传感器采集的多个数据读数的其它估算数据还至少部分地基于与这些多个数据读数相关的至少一些其它道路交通传感器数据读数的组合。
11.根据权利要求10的方法,其中,对于至少一个道路交通传感器的一个,所述至少一些其它道路交通传感器数据读数包括由位于所述道路交通传感器的关联道路上的一个或多个临近的道路交通传感器采集的数据读数。
12.根据权利要求11的方法,其中,所述一个道路交通传感器是与所述一个道路交通传感器的关联道路中多个道路段之一相关联的多个交通传感器中的一个,所述一个或多个临近的道路交通传感器是所述多个道路段之一的一部分。
13.根据权利要求11的方法,其中,所述一个道路交通传感器是与所述一个道路交通传感器的关联道路中多个道路段之一相关联的多个交通传感器中的一个,所述一个或多个临近的道路交通传感器是与所述一个道路段相邻的一个或多个其它道路段的一部分。
14.根据权利要求10的方法,其中,对于至少一个道路交通传感器的一个,所述至少一些其它道路交通传感器数据读数包括在一个或多个在前时间段内由所述道路交通传感器采集的数据读数,所选的一个或多个在前时间段至少部分地匹配于与所述时间段关联的时间类别。
15.根据权利要求10的方法,其中,对于一个或多个道路交通传感器中的至少一个的每个,所述至少一些其它道路交通传感器数据读数包括数据样本,所述数据样本来自所述时间段内在所述道路交通传感器的临近关联位置的关联道路上行驶的移动数据源。
16.根据权利要求1的方法,其中,对于一个或多个道路交通传感器中的至少一个的每个,用于代替所述时间段内由所述道路交通传感器采集的多个数据读数的其它估算数据还至少部分地基于预测信息,所述预测信息反映了所述时间段内被预测要在与所述道路交通传感器关联的道路的关联位置处出现的交通状况,至少部分地基于所述时间段内产生预测信息的时间处当前的交通状况数据,紧接在所述时间段之前产生所述预测信息。
17.根据权利要求1的方法,其中,对于一个或多个道路交通传感器中的至少一个的每个,用于代替所述时间段内由所述道路交通传感器采集的多个数据读数的其它估算数据还至少部分地基于预报信息,所述预报信息反映了所述时间段内被预报要在与所述道路交通传感器关联的道路的关联位置处出现的交通状况,在所述时间段之前较早地产生所述预报信息,从而产生预报信息时的当前交通状况数据不被用作为产生所述时间段的预报信息的一部分。
18.根据权利要求1的方法,还包括,对于所述道路交通传感器的一个,不能接收所述时间段内由所述一个道路交通传感器采集的至少一些丢失的数据读数的信息,并且自动提供指示,以使用其它估算数据代替丢失的数据读数来表示所述时间段内所述一个道路交通传感器的关联道路的关联位置处的实际交通状况。
19.根据权利要求1的方法,还包括,对于所述一个或多个道路交通传感器中的至少一个的每个,至少部分地基于由所述道路交通传感器在所述时间段内采集的多个数据读数是否被确定为可能不可靠,来自动确定所述道路交通传感器的操作状态,并提供所述操作状态的指示。
20.根据权利要求1的方法,还包括,对于所述一个或多个道路交通传感器中的至少一个的每个,自动确定由所述道路交通传感器在所述时间段内采集的多个数据读数是否被确定为可能不可靠还基于以下内容的多个与所述时间段关联的一周中的周几 (day-of-week)、与所述时间段关联的一天中的时刻(time-of-day)、由所述道路交通传感器提供的操作状态的指示、一个或多个先前时间段内所述道路交通传感器是否可能提供可靠的数据读数、以及由所述道路交通传感器正常采集的数据读数的缺失。
21.根据权利要求1的方法,还包括,对于所述一个或多个道路交通传感器中至少一个的每个,所述道路交通传感器的多个数据读数每个包括在所述数据读数的关联时间处由所述道路交通传感器采集的车辆行驶的报告速度。
22.根据权利要求1的方法,还包括,对于所述一个或多个道路交通传感器中至少一个的每个,所述道路交通传感器的多个数据读数的每个包括由所述道路交通传感器在时间段内采集的车辆行驶的报告数量和/或所述道路交通传感器的操作状态的指示。
23.根据权利要求1的方法,还包括,对于所述一个或多个道路交通传感器中至少一个的每个,向一个或多个交通数据客户端提供所述道路交通传感器的可靠数据读数,所述可靠数据读数包括多个数据读数的至少一些和/或其它估算数据。
24.根据权利要求1的方法,其中,所述一个或多个道路交通传感器中至少一个的每个包括嵌入在所述道路交通传感器的关联道路内的至少一个环形传感器;与所述道路交通传感器的关联道路相邻安装的移动传感器;与所述道路交通传感器的关联道路相邻安装的雷达测距设备;以及与所述道路交通传感器的关联道路相邻安装的射频识别设备,至少一些道路交通传感器的每个被配置成在所述道路交通传感器的关联道路的关联位置处测量交通状况。
25.根据权利要求1的方法,其中,每天多次执行所述方法,以便为该天的多个部分的每个提供所述一个或多个道路交通传感器的至少一些的可靠数据。
26.一种被配置成从交通传感器提供有关关联道路的交通状况的可靠数据的计算设备,包括存储器;第一模块,被配置成在时间段内多个相异时间处,接收与道路关联的交通传感器产生的反映了关联道路的交通状况的一个或多个测量值的信息之后,至少部分地基于将所产生的信息与由所述交通传感器先前产生的其它信息进行比较,自动确定所产生信息在表示所述时间段内关联道路上实际交通状况方面的可靠性,所述其它信息反映了一个或多个其它时间段内关联道路上的交通状况的一个或多个测量值;和第二模块,被配置成提供对所产生信息在表示所述时间段内关联道路上实际交通状况方面的可靠性的确定的指示,以便通过使用可靠地表示关联道路上的实际交通状况的信息来辅助所述关联道路上的行驶。
27.根据权利要求沈的计算设备,其中,自动确定表示所述时间段内关联道路上实际交通状况的所产生信息的可靠性还包括确定所产生信息是否反映了在所述时间段提供足够的可靠度的最少数量的测量值,只有在所产生信息反映了最少数量的测量值时才执行所产生信息与其它信息的比较。
28.根据权利要求沈的计算设备,其中,如果所产生信息没有反映最少数量的测量值而不能提供所述时间段内足够的可靠度,则至少部分地基于与所述交通传感器相对应的道路部分的其它道路交通数据,使用其它估算的数据替换所产生的信息,所提供的所产生信息的可靠性确定的指示包括提供所述其它估算数据的指示。
29.根据权利要求沈的计算设备,其中,所提供的所产生信息的可靠性确定指示包括 如果所产生信息被确定是可靠的,则提供指示来使用所产生信息表示所述时间段内道路的实际车辆行驶状况,如果所产生的信息被确定是不可靠的,则提供指示来使用其它估算的数据表示在所述时间段内道路的实际车辆行驶状况。
30.根据权利要求沈的计算设备,其中,所述第一和第二模块包括在存储器中的供执行的软件指令。
31.根据权利要求沈的计算设备,其中,所述第一模块包括装置,用于在所述时间段的多个相异时间处接收与道路关联的交通传感器产生的反映关联道路上的交通状况的一个或多个测量值的信息之后,至少部分地基于将所产生信息与由所述交通传感器先前产生的其它信息进行比较,自动确定表示所述时间段内关联道路上实际交通状况的所产生信息的可靠性,所述其它信息反映了一个或多个其它时间段内在关联道路上的交通状况的一个或多个测量值,所述第二模块包括装置,用于提供所确定的所产生信息在代表所述时间段内在关联道路上实际交通状况方面的可靠性的指示。
32.—种计算机执行方法,其通过以精确地反映在道路上的实际车辆行驶状况的方式提供与道路关联的道路交通传感器的可靠的数据读数,从而辅助道路行驶,所述方法包括接收对一个或多个道路的多个道路段的指示,每个道路段具有一个或多个关联的道路交通传感器,并由所述道路交通传感器提供有关车辆行驶速度的数据;和通过以下步骤为所述道路交通传感器的至少一些的每个在新近时间段内自动提供可靠的车辆行驶速度数据从所述道路交通传感器接收多个数据读数,所述多个数据读数的每个都包括在新近时间段内的关联时间处由所述道路交通传感器报告的一个或多部车辆的行驶速度;基于所接收的数据读数,确定所述道路交通传感器的当前数据读数分布,以反映在新近时间段内所报告的车辆行驶速度;确定所述道路交通传感器的平均历史数据读数分布,以反映在与新近时间段相对应的一个或多个先前的时间段内的平均车辆行驶速度,所述平均历史数据读数分布基于在一个或多个先前的时间段内从所述道路交通传感器接收的多个数据读数;至少部分地基于为当前和平均历史数据读数分布的每个确定的熵的统计度量和确定的当前和平均历史数据读数分布间相似度的统计度量,产生所述道路交通传感器的当前和平均历史数据读数分布的比较;至少部分地基于所产生的比较是否指示所述交通传感器的当前和平均历史数据读数分布间的足够的差,确定新近时间段内所述道路交通传感器是否可能提供可靠的数据读数以反映所述道路交通传感器的可能故障;和如果确定所述道路交通传感器有可能不能提供在新近时间段内的可靠的数据读数,则以并不基于在新近时间段内接收的数据读数的方式为与所述道路交通传感器关联的道路段的至少一部分估算新近时间段内的可靠的车辆速度,并提供估算车辆速度作为新近时间段内接收的数据读数的替换,以便通过提供有关车辆行驶状况的可靠数据来辅助一个或多个道路上的行驶。
33.根据权利要求32的方法,还包括为至少一些所述道路交通传感器的一个或多个的每个,至少部分地基于所述道路交通传感器在所述新近时间段内是否被确定为可能提供可靠的数据读数,来确定所述道路交通传感器的传感器健康状态,并提供对所述道路交通传感器的所确定的传感器健康状态的指示。
34.根据权利要求32的方法,其中,针对所述至少一些道路交通传感器的一个或多个的每个,对与所述道路交通传感器关联的道路段的至少一部分的新近时间段内的可靠车辆速度的估算是基于与所述道路交通传感器所关联的道路段有关的第二道路段的报告车辆行驶速度、反映所预测的在新近时间段内在与所述道路交通传感器关联的道路段上出现的车辆行驶速度的预测信息、和与所述道路交通传感器关联的道路段的历史平均车辆行驶速度中的至少一个。
35.根据权利要求32的方法,其中,对于所述至少一些道路交通传感器的一个或多个的每个,确定所述交通传感器是否可能提供在所述新近时间段内的可靠的数据读数还至少部分地基于使用以下度量来对可能的可靠性进行自动分类,所述度量是所确定的所述道路交通传感器的当前和平均历史数据读数分布的每个的熵的统计度量,以及所确定的所述道路交通传感器的所述当前和平均历史数据读数分布之间的相似度的统计度量,所述自动分类由神经网络执行。
36.根据权利要求35的方法,其中,对于所述至少一些道路交通传感器的一个或多个的每个,确定所述交通传感器是否可能提供在所述新近时间段内的可靠的数据读数还至少部分地基于由所述道路交通传感器所提供的操作状态指示,以及所述道路交通传感器在先前的时间段是否可能提供可靠的数据读数。
37.根据权利要求36的方法,其中,对于所述至少一些道路交通传感器的一个或多个的每个,相应于新近时间段的一个或多个在前的时间段包括多个选择来匹配与新近时间段关联的周几(day-of-week)和与最近时间段关联的钟点时刻(time-of-day)中的至少一个的多个时间段。
38.根据权利要求32的方法,其中,所述至少一些道路交通传感器的每个是嵌入在道路内的环形传感器、相邻于道路安装的移动传感器、相邻于道路安装的雷达测距设备、相邻于道路安装的射频识别设备中的一个,并且其中所述至少一些道路交通传感器的每个被配置来由所述道路交通传感器测量车辆行驶速度。
39.根据权利要求32的方法,其中,对于所述至少一些道路交通传感器的一个或多个的每个,从所述道路交通传感器接收的多个数据读数的至少一些的每个还包括在时间段内由所述道路交通传感器采集的行驶车辆的报告数量和/或所述道路交通传感器的操作状态指示。
40.根据权利要求32的方法,其中,对于所述至少一些道路交通传感器的一个或多个的每个,所确定的在所述当前和平均历史数据读数分布间的相似度的统计度量基于在所述当前和平均历史数据读数分布间的Kullkick-Leibler散度。
41.根据权利要求32的方法,其中,所述新近时间段是一天的一个部分,并且其中自动提供所述至少一些道路交通传感器的一个或多个的每个的可靠的车辆行驶速度数据被每天执行多次,以便在全天的每个连续时间段提供可靠的车辆行驶速度数据读数。
全文摘要
所描述的技术用于基于所获得的交通相关数据以各种方式估算道路交通状况,例如,所述交通相关数据是来自在道路上行驶的车辆和其它移动数据源来的数据样本,以及在一些情况下来自一个或多个其它来源(例如道路附件或嵌入在道路内的物理传感器)的数据。基于所获得的数据样本的道路交通状况的估算可以包括数据样本的各种过滤和/或调整,以及来自数据样本的对所感兴趣的交通相关特征的各种推测和概率性确定。在一些实施例中,推断包括重复地在所感兴趣的时间段内针对所感兴趣的道路段确定交通流量特征,例如确定平均交通速度、交通量和/或占用率,并包括以各种方式对各种数据样本进行加权(例如,基于数据样本的等待时间和/或数据样本的来源)。
文档编号G08G1/01GK102289936SQ201110221620
公开日2011年12月21日 申请日期2007年3月2日 优先权日2006年3月3日
发明者亚历克·巴克, 克雷格·H·查普曼, 奥利弗·B·唐斯, 斯科特·R·兰弗, 杰西·S·赫奇, 米切尔·A·小博恩斯, 罗伯特·C·卡恩 申请人:因瑞克斯有限公司