本作业连续7天每5min抓取北京地铁各站、站间列车拥挤度数据,统计绘制可视化数据呈现
本作业主要数据来源:map.bjsubway.com与metrodb.org
随着城市建设的迅速发展,轨道交通的拥挤问题日益显现。地铁拥挤是这一问题的最重要的方面。总体上,北京地铁拥挤呈现集中于工作日早晚高峰的特点,拥挤强度大,密度分布不均,高峰时候车、换乘、乘车体验十分不适,更有着潜在的安全问题。
截止至2021年底, 北京地铁运营17条线路,运营里程538公里,运营车站330座,换乘车站69座。
研究北京地铁这些车站、线路拥挤的时空分布特点可以更清晰的解析工作交通高峰的特征,进而指导交通和城市建设的规划,优化公共交通出行体验。于个人也可以合理选择路线,使得出行更加舒适高效
使用了jieba库分词统计地铁站命名的特点,可以发现命名成分中以方向和标志性建筑为主
统计每5min不拥挤、轻度拥挤、拥挤、严重拥挤的车站和车站间列车段数量所占总数的比例随时间的变化,可以显著看出在晚高峰,以及周末高峰的减少。
统计每日220余次爬取中每个车站为不拥挤、轻度拥挤、拥挤、严重拥挤的次数和所占每日爬取次数的比例,可以看出那些车站在人们的通勤中起到最重要的作用
筛选每天220余次爬取中每次拥挤的车站,利用爬取的地理经纬度信息绘制,可以看出人们主要的工作和居住区的分布