“ 写在前面
写在前面
回顾既有交通模型依赖数学优化求解而对实际出行活动解析不足,以及现状与未来互相独立的缺陷,提出利用大数据方法改进的可能性。建立了包含基础年人口合成模型、人口发展模型和职住变迁模型等模块的扩展的人口时空推演模型,实现个体属性在时空上的延续,为出行需求结果继承城市现状提供了条件。设计了包含出行链生成模型、目的地选择模型、个人活动组织模型和家庭成员活动协同模型等多个子模块的基于个体属性和城市活动模式的活动模拟器,实现对个人出行活动的模拟。实证研究表明,基于大数据的个体属性和城市活动模式的引入增强了出行活动的因果推断能力,避免了大规模的数学优化求解计算,模型结果更加符合城市实际;同时实现了未来对现状的继承,体现城市发展的延续性。
陈先龙
广州市交通规划研究院有限公司交通规划三所副所长 教授级高级工程师
研究背景
交通模型是交通规划研究工作最重要的量化分析工具。自20世纪50年代以来,随着计算机技术进步和应用实践,交通模型理论和技术不断发展,从集计的四阶段模型 [1-2] (Four-Step Model, FSM)到出行链模型(Tour-Based Model, TBM)再到非集计的活动模型 [3] (Activity-Based Model, ABM)和智能体模型 [4] (Agent-Based Model, AgBM),建模的精细化程度和解释能力逐步提升。从实践应用来看,目前交通模型处于以上多种模型理论和方法并行发展阶段,模型精度普遍不尽人意,这也使交通模型广受诟病 [5] ,究其原因还是因为数据基础和理论方法都存在着难以回避的缺陷 [6] 。数据方面,依托抽样调查和统计数据揭示城市交通整体特征的分析方法并不完备。理论方法方面,无论是FSM,TBM,ABM还是AgBM,其本质均为基于最优化理论的求解方法,对出行活动解释为给定约束条件的数学最优解而非因果关系。此外,既有交通需求建模方法各个特征年的出行主体互相独立,而随着城市进入存量发展时代,城市发展越来越稳定,现状和未来的脱节显然不利于交通模型精度的提升。
随着手机信令等基于位置的服务(Location Based Service, LBS)数据的广泛应用,获取职住OD矩阵已经是最基础功能,对出行时空行为挖掘的技术方法也日趋成熟,数据基础和理论方法的进步使得还原城市个体居住—就业的变迁演化成为可能。大规模长周期时空位置数据也为交通需求建模注入了新的血液,为从个体到城市整体的职住、出行活动等特征挖掘带来了新的可能。在交通模型中引入职住等属性指标能够直接增强对出行活动的因果推断能力;建立现状和未来之间联系可增加交通模型对城市的“记忆”,能够更好地实现对城市现状的继承,提高交通模型对城市的解读能力。
为此,本文提出以大规模的个体级连续时空位置数据、出行特征调查数据等为核心的城市运行数据驱动建模方法。首先,以扩展的人口时空推演模型实现对城市基础年职住联系的复现,实现对近期人口属性结构和人口—就业迁移的预测,进而对个体级出行活动在时间和空间上的动态迁移进行模拟及预测。其次,结合人口的就业特征、出行活动矩阵及特征,建立基于个体属性和城市活动模式的活动模拟器对城市活动和出行进行模拟及预测,实现交通模型对出行者活动在时间和空间的推演。所建立的基于时空推演的城市活动模型,从对出行个体的社会人口属性、居住—职业的变迁追踪入手,在海量个体活动模式学习和分类基础上,实现对城市活动的整体模拟和推演。
文献综述
自20世纪50年代“底特律都会区交通研究” [7] (Detroit Metropolitan Area Traffic Study, DMATS)和“芝加哥区域交通研究” [8] (Chicago Area Transport Study, CATS)项目开展以来,FSM作为集计模型的典型代表被广泛应用于交通需求预测分析。但FSM的集计特征使得其在理论上饱受诟病,例如各次出行互相独立,且未考虑家庭成员之间的活动关联;模型以交通小区和小区形心作为出行的起终点,空间解析度较为粗糙;交通分配以1 h为分析单元,难以准确模拟道路网络状态变化的动态过程,即时间解析度不足。为了克服FSM的局限性,自20世纪70年代末以来学术界陆续提出了TBM和ABM理论,后续的实践应用中TBM通常作为ABM的一个重要构成。M. S. Hasnine 等 [9] 对1995—2020年的ABM研究进行了总结,将其归纳为7种类型并给出了相关的定义。配合ABM理论,活动模拟器也不断涌现,包括DAYSIM [10] ,CEMDAP [11] ,CARLA [12] ,STARCHILD [13] ,ALBATROSS [14] ,TASHA [15] ,FEATHERS [16] 和ActivitySim [17] 等。
从对出行活动的解析来看,FSM每个阶段都直观回答了一个基础性问题:去做什么(出行产生),目的地是哪里(出行分布),采用何种交通方式(方式划分),选择哪条路线(交通分配),以及出行时刻的选择。TBM的工作过程则是将FSM的单目的出行变成了出行链。而ABM(AgBM)则是增加了人的社会经济、职住分布等属性信息。从对活动解释的详细程度来比较,ABM>TBM>FSM,TBM和ABM相比FSM进步的核心在于增加了更多的出行者个体属性和活动模式属性,但对出行活动解析本身而言并没有本质区别(见表1)。
表1 不同类型交通模型对出行活动解析过程的比较
对活动解析的一致性使得FSM中存在的问题在TBM和ABM中依然存在。例如,FSM中出行分布计算是基于产生吸引和广义成本矩阵的重力模型;参数标定是基于广义成本阻抗分布;出行分布模型的求解方法既非相关又非因果,其结果仅仅是给定条件的数学最优解,甚至可以说接近于不完全确定条件下的数学计算的猜谜。事实上,出行联系存在一定的因果关系,例如某人居住在交通小区 i ,在交通小区 j 工作,则会产生从 i 到 j 的工作出行。ABM模型虽然通过人口合成和选址模型建立了人口和就业岗位之间的对应关系,但其理论基础仍然是基于特征指标的最优化求解,并不是个体在时间维度连续的选择结果。当前,可利用的数据资源已经有了新的改变,基于手机信令和其他LBS的个体连续时空数据可以追踪不同个体空间迁移尤其是职住选择的连续演化过程,这使得基于个体属性的活动模式建模能力得到了极大拓展,有助于提升交通模型的可解释性。
更进一步,既有交通规划模型理论支持下的各特征年的交通需求互相独立。然而现实中的城市是一个连续演化的系统,既有系统的惯性对演化有着巨大影响力。不同年份的城市属性和人的活动有着紧密的关联和可预期的稳定性(即城市活动模式),具体表现为居住地稳定性、工作地稳定性、活动目的地稳定性以及城市空间的稳定性(例如交通枢纽、各级商业中心、社区生活圈等)。这些特征使得交通模型对基础年(现状)的继承尤为重要,特别是在城市发展相对稳定阶段,现状交通运行状况对近期交通预测具有决定性影响。另外,城市活动具有统计上的稳定性和随机性,例如0.1%的人可能会生病,在统计上的稳定性具体到某个人会生病则具有随机性或偶然性,某些病人会选择到同一个医院看病,则呈现群体的稳定性。群体的稳定性可以理解为城市活动模式。手机信令等LBS数据资源为挖掘个体稳定性和城市活动模式建立了条件。通过调查和建模分析,针对搬家、重新选择就业类型及就业地的人群进行建模,可以实现对城市变化的推演模拟。因此,更加充分的个体属性和城市活动模式挖掘及科学的时空推演建模,能够实现对城市出行活动的高质量复刻并实现在时间和空间上的继承和延续。
综上所述,小样本抽样调查数据支持下的既有交通规划模型理论对城市出行活动的解释存在一定的局限性,大数据资源的引入将带来新的改变,有助于更加全面地理解城市活动演化的连续性。同时,个人属性和城市活动模式的引入也将进一步增强交通模型对出行行为建模的因果推断能力。
基于时空推演的
城市活动模型设计
1
模型总体设计
基于时空推演的城市活动模型设计思路为:基于基础年的城市人口结构数据,构建拓展的人口时空推演模型,实现城市人口从现状到未来(近期)的推演;进一步建立基于基本出行链的活动分析模型,得到所有出行者各特征年的活动列表,从而实现对城市活动的模拟。
模型结构如图1所示,主要由两个部分构成:一是扩展的人口时空推演模型,二是基于个体属性和城市活动模式的活动模拟器。1)扩展的人口时空推演模型以居民出行调查获得的户属性和个体属性为种子,以人口普查、互联网位置数据等获得的人口总量、职住OD矩阵为主要输入条件,运用基础年人口合成模型模拟生成基础年家庭和个体属性,再结合人口发展模型和职住变迁模型预测各特征年的家庭属性和个体属性表,并以此为基础实现未来对现状的继承。2)基于个体属性和城市活动模式的活动模拟器是利用基于居民出行调查和手机信令等LBS数据建立的原始出行链库,并结合家庭属性和个体属性采用概率抽样模型完成个人出行链初始化;根据出行链、个体属性、城市活动模式完成出行目的地选择和活动时间初始化;根据家庭成员出行活动列表进行活动同步和时间表重排,最终得到个人出行活动列表。
图1 基于时空推演的城市活动模型结构
2
扩展的人口时空推演模型
扩展的人口时空推演模型是以城市现状人口空间分布和职住联系为基础,运用基础年人口合成模型 [18-19] 模拟基础年家庭和个人信息表,基于现状职住OD矩阵采用概率抽样模型对工作人口进行工作地分配,完成个体属性和工作地属性初始化;人口发展模型基于基础年个体属性,运用生命周期与生育模型、人口移民模型进行人口自然增长和机械增长预测;职住变迁模型利用相关的特征参数和模型,对家庭和个人的搬家、换工作等行为进行预测,最终实现人口、就业及职住联系在时间和空间上的推演(见图2)。有别于传统的人口合成模型仅考虑人口的空间分布,扩展的人口时空推演模型引入个人的工作地(就学地)信息,进一步明确了个体通勤和通学的空间位置信息,是同时具有时间和空间信息的扩展人口推演模型。该模型主要包含3个部分,各部分主要功能如下。
图2 扩展的人口时空推演模型结构
1)基础年人口合成模型:以人口普查数据和LBS数据为基础确定人口数量及空间分布;以经济普查数据和LBS数据为基础确定就业人口总体规模和空间分布;基于LBS数据建立职住空间关联;以居民出行调查家庭为种子,使用PopulationSim [20] 进行人口合成并生成家庭信息和个人信息数据库;建立个人职住空间联系关系数据库,利用基于职住OD矩阵的随机抽样模型给就业人口进行工作地赋值,添加个人职住空间信息到个人数据库。
2)人口发展模型:建立生命周期与生育模型,对人口自然增长进行预测;建立人口移民模型预测人口的机械增长。二者共同实现对未来人口的预测。
3)职住变迁模型:基于居住地和工作地的搬迁特征调查数据,建立基于概率抽样的居住地选择模型和工作地选择模型,追踪人口居住地和工作地的空间位置变迁,最终实现对职住空间关系的变迁预测。
基础年人口合成模型是整个工作的基础,是人口发展模型和职住变迁模型的主要输入,同时人口发展模型和职住变迁模型两个模块是一个交互的模型系统。扩展的人口时空推演模型在解决从现状到未来的人口、就业和职住关系预测问题的同时实现了人口时空分布演化的连续性。此外,人口职住属性的添加进一步明确了个体出行活动的空间位置信息。
3
基于个体属性和城市活动模式的活动模拟器
基于个体属性和城市活动模式的活动模拟器模型结构见图3,其工作机理是根据出行者的居住地和工作地(就学地)信息锚固通勤和通学活动位置,并基于城市活动模式进行概率抽样代替传统交通规划模型的最优化求解。本文提出的模型主体结构中没有迭代反馈过程,主要因为某类出行活动的发生通常只与个体属性有关,而与出行阻抗无关。模型的优点是能够更好地利用个体属性和城市现状的空间活动特性。模型的挑战在于两点:一是对数据完整度和质量要求较高;二是核心数据源是基础年数据,虽然通过扩展的人口时空推演模型做了一些弥补,但对中长期的城市活动预测仍然存在较大的不确定性。
图3 基于个体属性和城市活动模式的活动模拟器模型结构
数据基础与关键模型
1
数据基础
在传统数据资源的基础上,基于时空推演的城市活动模型更依赖对多源数据的利用,包括基于手机信令数据获得的人口和就业分布、职住OD矩阵,以及不同出行目的活动矩阵、活动驻点的停留时间分布等。其中出行目的活动矩阵由4类驻点构成 [21] ,包括居住地(H)、工作地/就学地(W/S)、日常生活驻点(L)和其他驻点(O)。这些驻点两两组合形成13类出行目的,分别为基家工作(HW)、基家工作返程(WH)、基家生活(HL)、基家生活返程(LH)、基家其他(HO)、基家其他返程(OH)、基工作的生活(WL)、基工作生活返程(LW)、基工作其他(WO)、基工作其他返程(OW)、基生活其他(LO)、基生活其他返程(OL)、其他出行活动(OO)。此外,基于居民出行调查获得的不同类型个体的出行模式偏好也是模型的重要输入条件,表2为主要数据源及用途说明。
表2 数据需求表
2
基于随机抽样的工作地分配模型
基于随机抽样的工作地分配模型是指从城市职住OD矩阵中获得交通小区 i 工作人口的工作地列表 M i ,列表中的对象为交通小区编号。例如,某交通小区有5个工作人口,其中在1号交通小区就业有3人,在2号交通小区就业有2人,则列表为[1, 1, 1, 2, 2],通过无放回随机抽样来分配交通小区 i 工作人口的工作地小区,实现职住OD矩阵与人口属性之间的关联。与传统基于效用最大化的工作地选择模型不同,随机抽样模型是基于城市真实的职住OD矩阵,而城市职住OD矩阵的获取已经成为手机信令等LBS数据分析中的成熟模块。
3
融合位置数据和居民出行调查数据的出行链生成模型
出行目的链的生成与融合是简化活动模型的关键工作。首先,居民出行调查数据中存在一定比例的沉默出行,且夜间出行几乎完全缺失,这也使得直接从居民出行调查数据中获得的出行目的链存在缺漏。而LBS数据获取的出行目的链由于使用的是模糊地址,准确度也存在问题,且LBS数据对低龄儿童难以覆盖,即不能识别就学出行。本文的研究案例中按照出行量占比超过0.05%作为约束条件,基于居民出行调查数据创建45条出行链,基于LBS数据创建78条出行链。针对不同类型个体的出行活动特征,按照中小学生、大学生、工作人口、非工作活跃人口(年龄<65岁的非工作成人)和非活跃人口(65~75岁,>75岁)进行分类,融合手机信令出行链和居民出行链。对于学生和非活跃人口,采用居民出行调查出行链作为种子库;对于工作人口和非工作活跃人口,考虑手机信令数据对活跃人口活动分析的优势,采用居民出行调查出行链和手机信令数据出行链1:1混合形成种子库。出行链生成模型步骤如图4所示。
图4 出行链生成模型框架
4
基于城市活动模式的目的地选择模型
与个体属性关联的活动信息,如居住地、工作地和就学地的位置信息已经在个体属性中得到确定表达,但对于其他两类目的地——生活性活动目的地和其他活动目的地则通过概率抽样方法来确定。概率抽样方法对应的假设是接受城市活动的稳定性,例如某商场一天的顾客数是2万人,这个数量是相对稳定的,但具体到这2万人的来源则利用基础年顾客来源空间分布通过概率抽样进行模型计算。模型输入分为早间、早高峰、平峰、晚高峰和夜间5个时段的生活出行矩阵和其他活动出行矩阵。对应的假设是同一区域同一类活动的出行目的地选择具有相似性。概率抽样模型计算流程如下:
1)根据出行目的在出行分布概率矩阵 P m 中选择出发交通小区 i 所在的行 P m , i ;
2)以出发时间预算范围内可达为约束条件,将有该出行目的的交通小区作为目标交通小区序列 X ,并得到概率列表子集 P' m , i ;
3)对概率列表子集 P' m , i 进行归一化处理,得到新的概率列表 U ,∑ U =1;
4)根据列表 U 对目标交通小区序列 X 中的目标交通小区编号进行概率抽样,并获得目标交通小区编号作为目的地交通小区,程序结束。
5
时间预算与时间窗双约束下多目的出行的个人活动组织模型
出行活动生成的结果是一个多目的出行活动序列,包含出行的起始时间和活动的驻留时间。个人活动组织模型中考虑以下约束机制(见图5):1)一天只有24 h的约束,即出行目的链中的活动需要在24 h内完成,本文研究案例中进一步设置18 h为活动完成时间;2)上学活动的开始时刻是完全刚性的,以确保不迟到;3)非弹性工作的上班时间也存在工作时间窗限制。本文研究案例中将工作类型分为白天10 h、白天12 h、3班工作制和弹性上班4种类型,并设置工作时间窗作为约束条件;4)两个活动驻点之间有在途时间约束。
图5 活动计划与时间窗示意
活动时间更新过程为:
1)用最后一次出行到达时间 T last , arr 减去初次出行出发时间 T 0, dep ,得到总活跃时间 T activetime , total ,如果总活跃时间在18 h以内则不更新活动序列,否则下一步;
2)进行工作出行链判断,否,进入下一步;是,判断总工作时间 T worktime , total 是否≤12 h,如超过12 h则按分段等比例折减,并更新工作时间,下一步;
3)若计算新总活跃时间 T' activetime , total 仍大于18 h,则等比例折减非工作活动逗留时间并保持单次活动驻留时间 T staytime , i ≥15 min,更新非工作驻留时间,下一步;
4)输出活动时间序列,流程结束。
6
基于时间窗同步的家庭成员活动协同模型
家庭成员活动时间窗协同匹配主要是针对需要接送上学的儿童而言。根据儿童的年龄划分为住校、双程接送和上学单程接送3种类型,并结合家庭成员结构考虑全职妈妈、75岁以下退休成员、单亲成员以及居住地—就学地—工作地的位置关系等因素,判定负责接送的家庭成员,实现过程如图6所示。
图6 基于时间窗同步的家庭成员活动协同模型框架
实证研究
本文选择广州市黄埔区作为实证案例,基础年为2020年。研究案例包含约46万户132.9万人,其中男性68.1万人,女性64.8万人,就业人员约80.7万人。基于扩展的人口时空推演模型计算,在未来5年内,该地区既有人口的搬家人数为79 796人,约占5.9%;更换工作的人数为82 643人,约占既有就业人口的10.2%;既搬家又更换工作的人口约32 549人,约占既有人口的2.5%。从居住、就业的变化人数占比来看,城市的演化是一个相对稳定的过程,基础年状态对近期具有决定性影响。
1
交通需求特征
运行活动模拟器,对全部家庭和个人进行活动模拟计算,最终获得3 691 345条出行记录数据,模拟结果的各项特征指标如下。
1)出行目的。
从出行目的组成来看(见表3),以非稳定的其他类出行驻点为端点的活动约占17.9%,稳定驻点的相关出行约占82.1%,这也体现了出行活动稳定性的假设,城市是一个整体稳定加部分随机的演化系统。
表3 出行目的组成
2)出行时刻。
各出行目的的出行时刻分布如图7所示。早高峰时段,基家工作出行占比最大,约占25%;晚高峰时段则为工作地往其他类驻点和从工作地回家占比最高,前者甚至超过后者;凌晨1:00左右出现了另一个局部时段性高峰,这是既有四阶段模型难以刻画的。连续时空数据支持跨天出行活动建模,实现了全天24 h出行活动的分析。
图7 分目的的出行时刻分布
2
出行活动空间分布
通勤活动在城市出行活动中占主导地位,高峰时段占比更大,且与职住OD矩阵直接相关,方便检验。因此,本文以基家工作出行为例分析基于时空推演的城市活动模型结果,同时与传统模型进行比较。尽管两种模型得到的不同出行距离的出行量分布相近(见图8),但对比图9a和图9b可以发现,二者得到的OD矩阵存在明显差异,基于时空推演的城市活动模型的OD矩阵离散度更高,重力模型则呈现较为规律的集聚特征。
图8 两种模型基家工作OD矩阵与职住OD矩阵出行距离分布比较
图9 基家工作出行OD矩阵等高线对比
从基家工作出行PA矩阵和职住OD矩阵的相关关系来看(见图10),交通小区级基家工作出行PA矩阵与基于LBS数据获得的职住OD矩阵呈强线性相关关系,且几乎没有异常值出现,这在传统交通规划模型方法中是几乎不可能做到的。这也体现了基于时空推演的城市活动模型对个体属性的继承,个体属性对出行活动具有更好的解释性、更能体现出行活动的因果逻辑。而类似于重力模型的传统模型虽然可以在出行距离分布上逼近,但在出行活动空间分布上存在一定疑问。
图10 基家工作出行PA矩阵与职住OD矩阵相关性对比
3
模型运行效率
本文提出的基于时空推演的城市活动模型具有远超同类模型的效率。案例研究包含46万户132.9万人,使用ubuntu20.04服务器版并配置46线程(1万户·线程 -1 )并行计算,运用活动模拟器对出行活动进行模拟,共获得全日出行记录369万条,运行耗时约63 min,最大内存消耗不超过30 G。
写在最后
本文提出的基于时空推演的城市活动模型力图将个体属性嵌入出行活动分析和模拟过程,包括将个人稳定的居住地、工作地、就学地和城市空间稳定的生活出行驻点纳入活动模拟过程中,增强了对出行活动解析的因果推断能力。这是本文提出的模型与经典四阶段模型、既有的出行链模型和活动模型等利用部分已知条件基于数学最优化求解来建立个人与活动驻点之间关系模型的本质区别。
更进一步,在确定职住地点和生活驻点等个体稳定驻点的基础上,利用连续时空位置数据对个体非稳定驻点活动进行解析,发现个体的随机性在城市层面呈现群体的稳定性。利用“个体随机而群体稳定”的活动特征规律开展其他类出行目的地选择,让各类出行活动不再是盲目的数学最优化匹配,而是真正继承了城市出行活动的基因。
实证研究也证明了基于时空推演的城市活动模型较传统交通模型在出行活动空间分布上具有更好的解释性。
需要说明的是,本文在扩展的人口时空推演模型的基础上重点讨论了出行链生成模型和基于出行者个体属性及城市活动模式的目的地选择模型,即出行分布模型,而对于方式划分模型没有做补充说明。这是因为在解决了出行生成和出行分布两个关键问题后,方式划分模型仍可以采用传统的离散行为选择模型,还可以使用神经网络、决策树等机器学习方法。这也体现了基于时空推演的城市活动模型具有一定的可扩展性。
本文提出的模型有两个方面需要继续改进。一方面,模型对数据的连续性和时空粒度要求较高,因此数据处理技术和建模流程还需要更加标准化和模块化。另一方面,人口迁移预测和活动模拟更大程度上受到基础年的影响,尽管模型可以开展每年的演化预测,但对突发性的干预战略和外部因素的适应能力还有待提高,因此面向中长期的模拟预测能力可能缺乏适应性。最后需要强调的是,随着中国城市逐渐从增量规划走向存量规划发展阶段,城市外部边界和内部结构趋于稳定,城市发展将处于局部更新和动态再均衡的过程。在此发展背景下,本文所建立的基于时空推演的城市活动模型加上日益丰富的多源数据,能够更好地解析城市现状和近期发展态势,尤其是面向既有基础设施改善和出行服务优化的出行需求预测分析。