实时交通流运行状态的高速公路逐渐成为重要的信息高速公路用户和管理者。事实上,电子收费(等)事务数据有效地记录操作信息的车辆在高速公路上,它提供了一种新方法来估计高速公路的旅行速度。首先,分析等事务数据的结构和数据预处理过程。然后,建立了双级旅行速度计算模型下不同程度的样本大小。为了确保足够的样本大小等数据的不同enter-leave收费站对包含多个路段被用来计算每一条路的旅行速度段。减少系数<我talic> α我talic>和可靠的重量<我talic> θ我talic>示例介绍了车辆速度的模型。最后,模型验证了特殊设计的几种高速公路上进行了田间试验,在不同的时间在北京。实验结果表明,平均相对误差约为6.5%,这意味着公路旅行速度可以通过该模型准确地估计。该模型有助于促进高速公路运行监控和高速公路管理水平,以及为高速公路旅客提供有用的信息。
自动检测方法目前用于城市交通流收集通常包括雷达、激光、循环技术基于固定检测器集合,或基于GPS浮动车(FC)方法技术。然而,固定探测器与高成本和复杂的结构安装和维护不便,只能捕获截面的操作条件。虽然基于浮动车数据的收集系统可以得到更精确的旅行速度的道路段,仍存在一些问题,如浮动车数量不足和有限覆盖的区际和长途高速公路。Zarrillo等人指出,自动车辆识别(AVI)技术是一种可能的解决方案来收集和测量交通拥堵在现有道路设施
前等事务数据的研究主要集中在高速公路旅行时间预测和交通流量统计数据。翁等人探索的应用可行性等历史交易数据高速公路OD数据,交通流、层速度,等等和分析事务数据和数据特性的相关问题(
近年来,研究人员提出了一些技术来估计车辆速度。Cathey提出了一种新颖的自动计算方法和Dailey足够的校准信息交通监控摄像头被部署在拥堵的高速公路监控,这样他们可以生产可靠的速度估计(
目前,研究了高速公路交通信息实时采集模型主要是基于GPS技术和循环探测器数据执行。Ferman等人提出的车辆全球定位卫星(GPS)设备作为探测汽车公司将获得更准确和及时的信息,和没有大型基础设施建设和维护费用。他们开发了一个分析模型,可以检查关键系统参数之间的关系(
本文旨在分析等数据特点,建立高速公路速度等数据预处理过程基于等事务数据的提取。本文使用高速公路段为计算对象的速度和考虑模型的适用性在不同水平的样本大小,建立了分段高速公路旅行速度计算模型,为高速公路旅行速度提取提供创新的解决方案。
原始等事务数据包含74个字段,记录车辆进出的详细信息高速公路。领域的数据表主要包括出入境广场ID号,旅游方向,出入境时间,和车辆类型,它提供重要的数据库计算车辆的速度。这是显示在表
等事务的描述性数据。
字段 | PLAZAID | 方向 | ENTRY_EXIT | CAR_SERIAL | 创建 | EN_PLAZAID | EN_TIME |
---|---|---|---|---|---|---|---|
注释 | 退出广场ID | 1:; |
0:条目; |
车牌 | 退出时间 | 入口广场ID | 入境时间 |
样本数据 | 100124年 | 1 | 0 | PA1234 | 2013/9/1 0:08:01 | 100122年 | 2013/9/1 0:01:23 |
100433年 | 0 | 0 | FZ1234 | 2013/9/1 0:17:18 | 100711年 | 2013/9/1 0:11:01 |
除了等事务数据表等事务率表格还用在这项研究中,它包含出入境广场ID号的字段;收费里程代表高速公路收费站的位置信息。任意两个收费站之间的距离可以根据等事务率计算表,如表中所示
长途车站之间的距离。
S.N. | 退出广场ID | 入口广场ID | 路径标识 | 距离(米) | 退出广场的名字 | 入口广场的名字 |
---|---|---|---|---|---|---|
1 | 100016年 | 100017年 | 43800001 | 4320年 | Liuyuanqiao退出 | 顺义条目 |
2 | 100012年 | 100017年 | 43800002 | 8610年 | Zhangxizhuang退出 | 顺义条目 |
由于系统原因,可以找到一些错误和异常数据在原始等数据,主要包括以下场景:(1)的存在异常事务时间数据:例如,出入境广场之间的时间间隔太短或太长。(2)“卡”、“负平衡,”和其他特殊情况可能发生,当车辆通过收费站。(3)不完整等事务,只有部分由等巷”等/矿渣MTC条目和矿渣MTC /等出口。“(4)有一些异常数据的速度过高或低由于车辆停止的情况或错误的系统时钟。
等原始数据的预处理可以提供一个有用的模型构建的基础。数据预处理的目的主要是以下几点:(1)高质量的数据可以通过删除了错误数据和无意义的数据;(2)它可以获得一个样本车辆的车辆旅行时间相应的出入境记录。为此,等数据预处理的算法流中提取旅行的速度在高速公路上包括关键字段提取、删除的错误数据,筛选有效数据,数据时间分割和汽车旅行速度计算。
无意义的或错误的数据在原始交易数据等将严重影响计算模型的准确性。数据筛选的主要目的是摒弃不合理的,错误的数据的基础上,以下标准:
事务数据的入口和出口之间的时间间隔超过86400秒(24小时)或不到60秒应该被删除;
如果退出时间早于条目,这些事务数据应该被删除;
事务数据相同的入口和出口的网站应该被删除;
事务数据包括open-charged高速公路数据应该被删除;
过滤数据异常数据与“工作模式(意味着正常记录和特殊事件)”字段填“0”(只有“0”代表正常的价值数据);
过滤掉的数据与“DEALSTATUS”字段填“0 x02”这意味着汽车的“入口等和退出等”;
过滤掉的数据与“ENTRY_EXIT”字段填“1”,这意味着退出数据;
考虑到速度阈值,计算车辆旅行速度低于5公里/小时或超过120 km / h是丢弃。
等事务数据的时间间隔部门应该是依靠高速公路交通状况的变化程度,以及样本容量在一个单一的分析时间。根据交通流的稳定性,研究旨在选择10 - 15分钟最初作为分析。为了确定其合理性,随机选择一整个工作日包含所有OD数据在整个网络。15分钟和10分钟的时间间隔,分别。和纸计算样本大小的数量同样的OD,如图
样本大小分布在不同的时间间隔。
图通常表明,在10分钟的时间间隔下,样本容量较低(小于6)占78%以上。然而,这个比例急剧下降到54%时,时间间隔15分钟。因此,本文建议15分钟的时间间隔在早上6:00相当于1小时,其余时间下午11点分析区间由于车辆速度在午夜时间的小波动。
车辆平均旅行速度计算基于等数据,还有两个步骤如下。
旅行时间的计算样本车辆,车辆旅行时间可以计算时差的入境时间和退出时间。
样本车辆之间旅行的旅行速度可以计算某些高速公路OD对出入境人数之间的旅行时间和距离车站等费率表可以获得。
为了更准确地反映交通状态信息高速公路,高速公路应该尽可能最小的单位。收费站是高速公路网络的重要节点;公路段部门可以采取收费站为主要节点。本文定义了相同的部分高速公路方向之间的两个相邻收费公路段,旅行速度计算的基本单位。
特别是,作为高速公路的部分区域只有一个出口或入口收费站在特殊情况下,会有一些差距,如果按照上面定义的高速公路的部分分工。针对这种特殊情况,介绍了虚拟收费站的研究补充入口或出口收费站。
考虑到道路段的样本量等可能无法满足的最小样本量的要求在一个时期,本文建立了双级旅行速度根据样本容量计算模型。这两种情况下被孤立样本容量阈值在一个计算周期内(15分钟)。旅游公路段的速度是所有样本的平均值相应的车辆OD对样本容量大于阈值时的条件。然而,当样本低于阈值条件下,样本车辆外延OD对的旅行速度包含计算道路段被带进计算。模型建立如下:
随后,本文将具体介绍最小样本容量的确定方法,换算系数,可靠的OD体重速度。
等样本大小道路段的时间间隔影响认真监控旅行速度的准确性和有效性。等的数据量是足够的,等车辆速度可以代表旅游公路段的速度准确。与高速公路相比,高速公路交通流更加连续和速度的波动要小得多。根据熊等人在北京这个城市高速公路浮动车辆每公里5分钟的最小样本量7 - 9和被认为是研究研究了Ferman和Tu等人提出,浮动车的比例应不低于3%,以满足高速公路速度监控的准确性(
因为车辆的旅行速度可能受不同交通量和道路条件,OD速度包含一个以上的道路段不能直接用于计算某些路段的速度。为了减少之间的差距OD速度和速度的道路,OD速度应该修改。
研究发现,相邻路段的交通流运行状态有很强的相关性,以及它们之间的关系是相当稳定的(图
图的道路段和OD对之间的关系。
研究训练减速系数在不同的时期,结果见表
结果训练速度换算系数<我talic> α我talic>。
减速系数 | 高峰时期 | 非高峰时间 | 整天 | ||||||
---|---|---|---|---|---|---|---|---|---|
测试数据组 | 的平均值<我talic>
|
方差 | 样本大小 | 的平均值<我talic>
|
方差 | 样本大小 | 的平均值<我talic>
|
方差 | 样本大小 |
1 | 0.83 | 0.02 | 6 | 0.84 | 0.02 | 8 | 0.83 | 0.02 | 14 |
2 | 0.95 | 0.04 | 6 | 0.94 | 0.03 | 8 | 0.94 | 0.03 | 14 |
3 | 0.95 | 0.07 | 6 | 0.94 | 0.02 | 8 | 0.94 | 0.05 | 14 |
4 | 0.86 | 0.03 | 6 | 0.87 | 0.02 | 8 | 0.87 | 0.02 | 14 |
OD速度之间的相对误差和公路段速度计算速度降低系数的计算方法,前面所提到的,和表中所示的结果
减少的速度误差比较之前和之后。
公路段 | 没有减少 | 与减少 | 样本大小 | ||
---|---|---|---|---|---|
平均绝对误差(公里/小时) | 误差方差(公里/小时) | 平均绝对误差(公里/小时) | 误差方差(公里/小时) | ||
1 | 8.92 | 6.15 | 3.57 | 3.45 | 84年 |
2 | 14.98 | 8.69 | 5.36 | 3.51 | 84年 |
尽管<我nline-formula>
可靠性可以给出的重量<我nline-formula>
提出旅游速度计算模型的准确性进行了测试,通过比较计算速度与观察到的速度在高速公路上。温和的司机被选中进行田间试验,他们开车经过实验路段交通流的平均速度。研究选定的12路部分,分别属于Beijing-Harbin高速公路,Beijing-Kaifeng高速公路,和北京西藏公路日常交通量的不同层次。验证实验两个高峰时段(17:30-19:00)和非高峰(14:00-15:30)小时。
计算模型的误差和预测精度评估由三个指标包括平均绝对误差(MAE)、平均相对误差(绝笔)和均方根误差(RMSE)。前两个指标用于描述的基本误差计算速度和实际速度。第三个指标是用来描述离散程度的计算速度和实际的数据。
误差评价指标的计算公式如下所示:
根据每个指标的计算公式,结果如表所示
速度计算模型的误差分析结果。
误差分析 | 平均绝对误差(公里/小时) | 平均相对误差(%) | 误差的均方误差(公里/小时) |
---|---|---|---|
高峰时期 | 4.11 | 6.42 | 2.38 |
非高峰时间 | 4.93 | 6.74 | 3.39 |
结果表明,整体的误差模型,研究很小,和模型具有更高的精度。在高峰期和非高峰期期间,平均绝对误差小于5公里/小时,分别4.11公里和4.93公里/小时,平均相对误差约为6.5%。两个指标是错误的可接受的水平。分别平均平方偏差是2.38公里和3.39公里/小时,而结果表明它的精度保持稳定。旅行速度模型提出的研究更好的适用性;它可以满足高峰期和非高峰期旅行速度的需求收集,特别是均方根误差更小的高峰时间;它表明的波动速度在高峰时间计算误差较小。
基于等事务的分析数据挖掘应用程序和高速公路信息提取,可以得出一些重要结论如下。
等交易数据为高速公路旅行提供了一个可行的方法提取速度。考虑的状况等交易比率,通常是一个适当的时间间隔15分钟发现披露和分析动态交通的高速公路。
考虑到等样本容量的道路段在一个时间段不同,研究建立了一个双级旅行速度计算模型在不同样品的水平。等交易数据的研究使用OD对包含计算道路段计算旅行道路段的速度。和创建速度换算系数和速度可靠性重量;他们可以使OD速度计算的更精确的旅行速度的道路。
基于收集的高速公路路段旅行速度,本文提出的计算模型进行验证。结果表明,高峰期和非高峰期的平均绝对误差约4.5公里/小时,平均相对误差平均相对误差约为6.5%,与均方偏差是2.38公里/小时和3.39公里/小时。这表明旅行速度计算模型是可行的,适合高峰期和非高峰期期间,和旅行速度无显著影响的错误计算。
等交易数据只能记录进入和离开高速公路的车辆。在未来的研究中,等事务和其他数据源的数据可以利用一起提取高速公路交通流的操作信息,如固定检测器数据、浮动车数据和视频数据。基于多源数据融合算法将进一步加强高速公路的准确性和可靠性运行状态集合。
作者宣称没有利益冲突有关的出版。
作者想要表示感谢的支持从中国的国家自然科学基金(NFSC)(没有。51108012)和中国工业和信息化部根据国家科技(没有的主要程序。2013年zx01045003 - 002)。