“ 写在前面:
写在前面:
加快新城建设是上海市推进“十四五”规划建设的重要抓手。对新城通勤人群出行分布特征进行分析,可更全面理解上海市城市空间联系。选取上海市主城区以及嘉定、青浦、奉贤、松江、南汇5个新城,基于居民出行调查数据与手机信令数据对通勤人群进行识别,并分析其工作日出行特征。定义通勤人群非工作日的出行为非通勤出行,利用K-Means聚类算法将非通勤出行划分为高频日常生活型出行与低频非日常生活型出行,并进一步分析其出行特征。结果表明,5个新城之间居民通勤与非通勤出行较为独立;嘉定、青浦、奉贤新城居民通勤用时较松江、南汇新城居民更短,且南汇新城存在较多的长距离通勤出行,居民就业辐射范围更广;非通勤出行的空间分布特征表明5个新城基本可以满足高频日常生活型出行需求,但低频非日常生活型出行的设施供给较弱。研究结论可为上海市新城规划与建设提供一定的理论实证。
杨超
同济大学城市交通研究院 教授 博士研究生导师
研究背景
新城建设是优化大城市市域空间结构、实现城市可持续发展的重要手段。为推动上海市组团式发展,形成多中心、多层级、多节点的网络型城市群结构的重要战略空间,上海市围绕“人民城市人民建,人民城市为人民”的重要理念,以独立的综合性节点城市为定位,根据《关于本市“十四五”加快推进新城规划建设工作的实施意见》(沪府规〔2021〕2号) [1] 及《上海市新城规划建设导则》 [2] ,按照产城融合、功能完备、职住平衡、生态宜居、交通便利、治理高效的要求,重点聚焦空间品质提升,加快构建“中心辐射、两翼齐飞、新城发力、南北转型”的空间新格局,把嘉定、青浦、松江、奉贤、南汇5个新城培育成为长三角城市群具有辐射带动作用的独立综合性节点城市,共同支撑上海都市圈空间结构的进一步优化。
通勤出行需求是城市客运交通保障的主体。通勤与非通勤构成了通勤人员的基本出行,从通勤与非通勤的角度可以全方位透视城市空间结构,理解城市居民的居住、就业及非通勤出行规律,促进城市就业和商业功能的空间改善。在过去,居民出行信息获取最有效的方法是居民出行调查,但该方式在实际操作中受被调查者主观意识影响,出现漏报、错报的现象,影响调查数据的质量,同时存在成本高、工作量大、回收率低和处理周期长等问题,影响后续的城市规划和管理工作。由于通勤和非通勤出行在居民日常出行中高度混合,受限于传统数据的缺点,过往研究更多关注居民通勤出行特征,较少有研究从居民的非通勤出行特征角度进一步理解城市空间结构。
近期出现的手机信令数据提供了新途径来识别这两种类型的出行。由于手机信令数据具有覆盖人群广,数据实时生成且采样周期长的优点,能够大规模、客观、长期地记录城市居民活动的时空特征,因此学术界认为其具有持续有效地支撑大规模居民出行特征分析的潜力 [3-7] 。Song C.等 [8] 通过对1 000万名手机用户为期3个月数据的分析,发现93%的人类移动行为能够被预测。G. Di Lorenzo等 [9] 基于手机数据对用户两周的时空轨迹进行分析,发现居民的出行行为在空间上表现出强规律性。Chen C.等 [10] 基于手机数据识别用户居住地与工作地,并通过对比居民调查数据论证了此方法的可行性。Yang C.等 [11] 结合居民调查数据与手机信令数据识别用户活动目的以提取居民通勤与非通勤活动,并构建时空聚类模型对居民活动的时空模式进行分析。杨超 等 [12] 通过手机数据对深圳市居民的通勤行为进行了描述,结果表明居民通勤距离、通勤时长及通勤开始时刻的分布均遵循一定规律。钮心毅 等 [13] 采用核密度分析法生成不同时刻的手机用户密度图,依此识别城市公共中心体系和居住、就业、游憩等功能分区。钟炜菁 等 [14] 通过手机数据对城市不同活动场所的活动强度、人群行为目的、活动停留时长、出行频率等特征进行描述和分析,总结了不同类型城市空间的活动模式;同时,基于手机数据分析了居民不同类型活动与人口空间分布动态变化之间的关系 [15] 。
本文基于居民出行调查数据与手机信令数据,对上海市5个新城的居民通勤与非通勤出行开展研究,重点从空间维度解析新城现状的居民通勤与非通勤出行特征,为上海市新城规划与建设提供一定的理论实证。
研究范围、数据与框架
1
研究范围和空间单元
本文研究范围为嘉定新城、青浦新城、松江新城、奉贤新城、南汇新城以及上海市主城区边界围合区域(见图1),按照《上海市城市总体规划(2017—2035年)》 [16] 及《上海市新城规划建设导则》 [2] 划定得来。考虑到手机信令数据的精度,将上海市划分为500 m×500 m的栅格,每一个栅格作为一个单独的空间研究单元,共记29 063个空间单元。
图1 研究范围
2
数据来源和预处理
采用中国电信网络运营商2018年10—12月去除法定节假日后共计85天(含工作日和双休日)的手机信令数据,市场份额约占20%,空间范围覆盖上海市全市域。本文使用的手机信令数据集,平均每天采集超过500万匿名用户的数据,日数据总量超过1 TB;平均每天产生约70亿条数据记录,平均每个用户每天产生1 400条数据记录。不同位置基站共有16 541个,由于获取的数据涵盖2G,3G,4G基站,基站密度相对较高,能够更连续地描述个体的时空行为,从而更有效地刻画个体的活动和出行特征。
手机信令数据往往存在噪声和偏差,用户在一个基站停留或者移动时,移动设备的信号可能会跳到几个附近的基站上,这种现象被称为“乒乓效应”。现有的大多数解决方案是空间的重采样,即使用一个空间范围约束来合并相邻的基站 [17-18] ,通过这种方法降低定位信号的扰动,然而简单提升空间会导致有用信息的缺失。为了解决这个问题,采用基于时空约束的轨迹平滑方法(Spatial-Temporal Constrained Smoothing Method, STCS) [11] 对手机信令数据进行过滤,得到完整用户出行-停留链。
3
研究框架
利用手机信令数据,从个体时空行为的视角,对上海市5个新城居民的通勤与非通勤出行特征进行分析,总结出行规律,剖析出行空间分布特征,为新城规划落实提供建议。对于通勤出行特征的分析,参考《2020年度全国主要城市通勤监测报告》 [19] 以及《住房和城乡建设部关于开展2021年城市体检工作的通知》(建科函〔2021〕44号) [20] 中的评价指标,最终选定平均通勤时耗、45 min通勤可达人口比例、通勤时耗超过60 min人口比例、平均通勤距离以及通勤距离小于5 km(幸福通勤)人口比例作为评价指标。对于非通勤出行,将其分为高频日常生活型出行与低频非日常生活型出行。
用户识别方法
首先需要识别居家、工作及其他活动停留情况,从而识别通勤与非通勤出行。过往研究进行用户职住地与居民活动识别的方法大多为基于规则的方法 [12-13, 21-23] ,也存在使用机器学习与深度学习等方法进行活动目的推断 [11, 18, 24] 。考虑到本文仅进行用户职住地与非通勤活动识别,基于规则的方法更为稳定,因此采用结合居民调查数据进行规则识别的方法。
1
用户职住地识别
识别规则
1.1
由于上学活动具有跟上班活动类似的规律,本文将这两种活动统一为通勤类活动。手机信令数据可以获取用户长期的出行、停留信息,基于居家活动和工作活动的强规律性,其在判断用户居住地和工作地上有着天然的优势。
由于居民的通勤出行主要集中在工作日,为得到更为精确的结果,在职住地的识别中以用户85天中的工作日出行数据为识别基础。首先将用户有效的夜间居家停留时间范围设定为20:00—次日8:00。根据居民出行调查数据,95%的居家活动时间超过260 min(见图2a),计算用户在各停驻点的停驻时间,提取出大于260 min的停驻点。计算这些停驻点的累计访问频次,过滤出访问频次大于工作日总天数60%的点作为居住地备选集。最后取停留时长最大的区域作为居住地识别的结果。
在识别到有固定居住地的用户中,将该类用户有效的白天工作停留时间范围设定为9:00—18:00。根据居民出行调查数据,95%的工作活动时间超过180 min(见图2b),计算用户在各停驻点的停驻时间,提取出大于180 min的停驻点。计算这些停驻点的累计访问频次,过滤出访问频次大于工作日总天数60%的点作为工作地备选集。最后取停留时长最大的区域作为工作地识别的结果。
图2 居民居家、工作活动时间累积频率分布
结果验证
1.2
以往多数研究均采用统计公布的常住人口进行验证对比 [25-28] ,也有部分研究利用居民出行调查数据扩样后进行验证对比 [21] 。限于同年份的居民出行调查数据较难获取,本文采用人口统计数据进行人口识别验证。
上海市市域面积为6 340.5 km 2 ,2018年常住人口为2 423.78万人。通过上海市电信手机信令数据提取出的用户数量为5 308 005个,识别出居住地点的用户为2 362 689人,其中识别出工作地点的用户为1 088 315人,占已识别出居住地点用户的46.06%。每一个研究范围内均存在一个居住或就业人数最多的栅格,其余栅格的居住或就业人数与该区域中最多人数的栅格的比值作为图形展示的依据,结果如图3所示。根据《上海市第四次经济普查主要数据公报(第一号)》 [29] ,2018年末,上海市第二产业和第三产业法人单位从业人员1 170.9万人,工作人群比例为48.4%。手机信令数据识别出来的上海市域就业人口比例与之匹配度较好。
图3 识别居民职住地空间分布
5个新城的现状常住人口分别为:嘉定 48.60万人 [30] ,青浦45.00万人 [31] ,松江64.14万人 [32] ,奉贤24.87万人 [32] ,南汇29.98万人 [32] 。由手机信令数据识别到的用户依次为6.13万人,5.19万人,8.10万人,3.59万人,2.92万人。各大新城占全市实际常住人口的比例与识别出的比例基本一致;各大新城识别到的常住人口的渗透率(识别常住人口÷实际常住人口)也基本保持在同一个水平(见表1)。综上,人群识别结果较为准确与可靠。
表1 实际人口与识别人口对比
2
用户非通勤出行识别
据中活动类型,除掉居家与工作类型的活动,将余下的购物、娱乐、业务和其他类型活动归为非通勤活动,得到非通勤活动停驻时间的10%分位数为30 min,90%分位数为315 min(见图4)。为识别出更为准确的非通勤活动,提取停驻时间为30~315 min的出行作为非通勤出行备选集。3)对从步骤2中得到的非通勤出行备选集再次筛选,筛选出8:00—23:00的出行作为非通勤出行。最终一共识别了21 480 179次非通勤出行,后文将在所识别的非通勤出行的基础上进行研究。
图4 非通勤活动停驻时间累积频率分布
为进一步剖析非通勤出行的规律,假设居民的非通勤出行中存在满足日常生活需求的高频次出行和满足娱乐、大型购物与业务等非日常生活需求的低频次出行。为验证这一假设,利用K-Means聚类算法对识别的居民非通勤出行进行聚类,选取居民在非通勤出行时对栅格的访问频次为聚类特征指标。结果表明,2为最佳聚类数。最终聚类结果为:当居民在85天内的非通勤出行对栅格的访问频次超过11次,则将这一系列的非通勤出行定义为高频日常生活型出行,低于或等于11次则定义为低频非日常生活型出行。
出行特征分析
1
居民通勤出行评价指标
手机信令数据仅能获取到出行起终点之间的空间直线距离,为更好地表征真实通勤距离与通勤时耗,利用高德地图API中的路径规划功能进行爬取,获得各大新城及主城区的居民单向通勤出行时耗与出行距离分布(见图5和图6)。各区域的分布趋势基本一致且符合实际情况,大部分通勤出行时耗在30 min范围内,出行距离在20 km范围内。此外,南汇新城存在小部分长时耗、长距离通勤,这可能因为其距离上海其他新城及主城区空间距离较远。
图5 通勤出行时耗分布
图6 通勤出行距离分布
嘉定、青浦、奉贤新城的居民较其他新城的居民在平均通勤时耗上更优,约为25 min;在通勤距离上也表现出同样的结果,嘉定、青浦、奉贤新城居民平均通勤距离更短,与主城区居民通勤距离接近,约为11 km(见表2)。借鉴纽约市发布的《一个纽约:规划一个强大而公正的城市》(One New York-The Plan for a Strong and Just City),规划中提出将45 min以内通勤人口比例达到90%作为城市繁荣、公平、可持续发展的目标[33]。此外,伦敦、新加坡也提出将45 min以内通勤人口比例达到80%~90%作为城市发展目标 [34-35] 。在45 min通勤可达人口比例指标上,嘉定、青浦、奉贤新城均超过了85%。此外,通勤距离小于5 km人口比例指标代表着该区域的居民“幸福通勤”的比例,结果表明嘉定、青浦、奉贤新城及主城区有接近一半的居民可以达到“幸福通勤”。从通勤时耗超过60 min人口比例来看,南汇新城比例较高,人口占比超过20%,意味着南汇新城仍然存在较多的长时耗通勤者,与图5、图6展示结果一致。
表2 居民通勤出行评价指标
2
居民通勤出行空间分布特征
各大新城的居民就业出行范围基本都集中在内部与周边,同时也存在部分就业出行分布在主城区内部(见图7)。嘉定、奉贤新城的居民相对于其他新城居民的就业出行范围更窄,南汇新城的居民就业出行范围较广。主城区的居住人口内部就业率达到87.04%,基本可以实现职住均在区域内;5个新城中除了奉贤新城之外,其余新城的居住人口内部就业率均在60%以上(见表3)。
图7 居住人口的工作地空间分布
表3 居住人口就业分布比例(单位:%)
区域工作人口居住地分布可以表征该区域内的就业吸引力。在5个新城工作的人员居住地基本分布在5个新城内部及周边,但奉贤新城的就业吸引范围相对更窄;与区域内居住人口的工作地空间分布相比,工作人口的居住地辐射范围均较窄(见图8)。从5个新城居民去主城区工作的比例与主城区居民去5个新城工作的比例中可以发现,南汇新城二者最高,而青浦新城最低,这表征了南汇新城与主城区的联系较强,而青浦新城联系较弱(见表3和表4)。5个新城之间的联系较少,这表明5个新城居民通勤交通相对较为独立。各新城居住人口内部就业率与工作岗位内部居住率基本一致,超过一半的居民可实现内部居住与就业。
图8 工作人口的居住地空间分布
表4 工作人口居住分布比例(单位:m)
3
非通勤出行空间分布
本文通过计算居住人口非通勤出行分布比例,表征各新城及主城区之间居民非通勤出行的联系情况。从各大新城的非通勤出行空间分布可以发现(见图9和图10),高频日常生活型出行基本分布在各大新城内部,而低频非日常生活型出行辐射范围更广,大部分分布在各大新城外部,并且向主城区集中,这也与常识一致。高频日常生活型出行是满足居民日常生活所产生的基本出行活动,基本围绕居住地展开,出行范围较窄。低频非日常生活型出行是满足居民娱乐、购物与业务等需求而产生的出行,出行目的地常分布在大型购物中心及商圈,出行范围更广,且向主城区集中。
图9 居住人口高频日常生活型出行空间分布
图10 居住人口低频非日常生活型出行空间分布
从表5可以看出,除奉贤新城外,其余新城的居住人口在新城内部的高频日常生活型出行的占比均维持在70%左右,并且与主城区的联系较弱(5%~13%),说明这些新城日常生活型设施的配套基本可以满足内部居民的需求。结合图9d来看,虽然奉贤新城内部高频日常生活型出行的比例仅为59.66%,但空间分布上还是主要集中在奉贤内部及周边区域。而对于居住人口低频非日常生活型出行,5个新城与主城区的联系均较强,并且在新城内部的低频非日常生活型出行比例低于高频日常生活型出行(见表6)。此外,不论是从高频日常生活型出行还是低频非日常生活型出行来看,5个新城相互之间的非通勤出行联系基本独立,这与通勤出行规律保持一致。
表5 居住人口高频日常生活型出行分布比例(单位:m)
表6 居住人口低频非日常生活型出行分布比例(单位:m)
结论与讨论
本文结合手机信令数据与居民出行调查数据,利用基于规则的方法识别出上海市5个新城通勤人群的职住地分布与非通勤出行。在此基础上利用K-Means聚类算法,将居民非通勤出行分为高频日常生活型出行与低频非日常生活型出行。基于识别的结果,定量评价了居民的通勤出行特征,并剖析了居民的通勤与非通勤出行的空间分布规律。对于本文的数据、方法以及划分结果,有几点值得讨论。
1)相比于新城,上海市主城区的通勤与非通勤出行基本集中在区域内部,超过80%的居民可以实现内部居住、就业、购物、娱乐及其他活动。
2)嘉定、青浦、奉贤居民平均通勤时耗较主城区更低,平均通勤距离与主城区差异更小,同时45 min通勤可达人口比例均在80%以上,并且接近一半的居民可以达到“幸福通勤”。
3)5个新城居民通勤出行相对较为独立。南汇新城存在较多的长距离出行,且居民就业辐射范围更广。嘉定、奉贤新城就业辐射范围更窄,奉贤新城就业吸引力相对其他新城更弱。除奉贤新城外,其他新城超过60%的居民可实现内部居住与就业。5个新城与主城区的联系中,南汇新城最高,青浦新城最低,这与新城的产业功能定位有较大关系。
4)5个新城相互之间的居民非通勤出行联系基本独立,高频日常生活型出行集中在新城内部。新城发展现状基本可以满足居民的高频日常生活型出行,但低频非日常生活型出行仍有大量在主城区与其他区域,且与主城区的联系均较强。为达到建成“独立综合性”节点城市的规划目标,5个新城在满足居民娱乐、大型购物与业务等需求的功能上仍有待提高。
5)值得注意的是,在通勤出行特征部分,本文部分结论与过往研究 [21, 36] 不一致。例如南汇新城与主城区联系最强,张天然 [21] 认为嘉定新城与中心城区(外环内)联系度最高,造成此差异的原因是主城区范围大于中心城区范围。再如文献[36]综合运用居民出行调查数据、人口普查数据、经济普查数据、百度大数据进行分析,得到松江新城与南汇新城的居民工作地分布占新城内部的比例分别为70.2%与76.7%。本文主要用手机信令数据结合居民出行调查数据进行人群识别,计算得到该数据分别为64.92%与66.48%。
此外,研究本身还存在其他不足。受限于手机信令数据的时间稀疏性 [12, 37-40] ,难以准确反映居民出行时耗。虽然高德地图路径规划计算的通勤时耗与手机信令数据计算的通勤时耗相比较为可靠,但面对采用多种交通方式的居民出行,并不能精确地衡量居民出行时耗。未来将尝试获取更加精确的数据对居民出行时耗进一步进行分析。最后,5个新城的非通勤出行与通勤出行定量评价相比仍有较大的研究潜力,这也是后续研究的方向。