章大數據條件下軌道交通網絡化客流組織理論 隨著城市軌道交通線網的拓展與延伸,網絡通達性,城市軌道交通從可選項逐步發展成市民出行的必選項。截至年底,全國(不含港澳臺)共有45個城市開通城市軌道交通運營線路233條,運長度達7918.79公裡。以北京為例,19年全年累計完成客運量39.6億人次,每天均運量超過1100萬人次,客流強度超過1.8(客運量/運營裡程)。特大城市依靠大規模修建地鐵線路新增的路網運力遠不能滿足客流的劇峰時段部分線路及車站能力不足已成為北京、上海、廣州等大城市地鐵運營的常態。因此,如何組織超大規模軌道交通路網的客流已經成為地鐵管理者迫切需要解決的關鍵問題。 隨著新技術的快速發展,在互聯網+、物聯網、大數據、雲計算等科技不斷發展的背景下,城市軌道交通數據爆炸式增長,5G網絡作為新型基建的底層技術,為整個信息基礎設施建設帶來革命性轉變,給軌道交通智能化升級、海量數據資源連接帶來新的基礎能力。各大城市紛紛提出智慧軌道交通運營理念。廣州地鐵將精準把握新一代技術發展方向,利用多層領域感知、人工智能、移動互聯、主動協調等技術,聚焦智慧服務、智慧運行等領域,軌道交通網絡向網聯化、協同化、智慧化發展。上海地鐵提出基於5G技術的城市軌道交通智慧運營服務體繫,從多源數據采集與自由流轉的數字化,逐漸升級到數據價值流動的智能化,以一步創造經濟與社會價值的智慧化三化升級路線,*終實現新技術、新生態合作共築下的業務智能聯動、資源智慧匹配。同時,利用更加豐富、完善的多源信息和服務引導、方便乘客出行,試圖解決超大規模軌道交通的客流組織問題。但這些智慧運營成果還處於起步階段,有效性尚需驗證。是,這些多源信息對客流組織的影響效果缺乏相應理論和方法的支撐。 面向超大規模軌道線網乘客出行行為特征和巨量客流演化規律問題,既有研究在多場景個體、群體行為的變化機理(如擁擠乘客反常和突發下乘客超常行為)刻畫等方面可能失效。同時,超大規模軌道線網存在非受控和受控兩類客流,即兼具道路客流的隨機性和鐵路客流的確定性(人、路、列車的匹配),導致這些多尺度(點線網不同層次)客流的演化機理難掌握。此外,既有的軌道線網供需匹配方法難以適應服務和不均衡需求的要求,無法實現超大規模軌道線網的精準供需匹配。 綜上所述,在交通強國戰略及軌道交通一體化(如粵港澳大灣區、京津冀等)運營背景下,掌握多源信息作用下超大規模超大運量軌道交通乘客出行行為特征及巨量客流的多尺度動態演化機理,揭示乘客出行信息與供需匹配的作用機理,實現客流誘導和客流控制的協同優化,滿足乘客的個性出行需求和提升軌道交通的運營,軌道交通從群體發展為個性化定制的精準服務,不但對保障超大型城市運行效率具有重要的應用價值,而且對豐富發展智慧軌道交通客流組織理論和方法也具有重要價值。 1.1大數據條件下軌道交通網絡化客流組織理論框架 針對軌道交通線網多源運營數據復雜,乘客反常、超常行為識別難,需求把握不準和供需匹配粗放等問題,本書研究超大規模、超大運量軌道線網下客流大數據分析、乘客出行行為決策、需求演化和供需匹配評估機理的科學問題,提出超大規模軌道線網的多場景乘客出行行為建模、多尺度客流演化和不均衡供需匹配理論和方法。 第二章從宏觀和微觀角行軌道交通客流大數據挖掘。在宏觀分析方面,面向城市軌道交通自動售檢票(auto fare collection,AFC)數據的旅行時間異常分析,首先提出標準時間帶構建方法,並以正常的出行時間範圍為標準消除異常數據。然後,提出基於集成算法的旅行時間異常檢測算法,識別封站時段旅行時間異常的客流量。在路網客流量異常分析方面,提出識別封站情況下異常的地鐵車站客流的方法。*後,介紹面向地理數據的多源數據采集方法括城市全域的住宅小區數據、建築面積數據、軌道站點路網可達性數據,以及路網密度數據等,從微觀角度對乘客個行深入分析挖掘,構建乘客用戶畫像體繫,以滿足不同的運營組織需求。 第三章闡述數據驅動的乘客出行行為分析和建模方法。首先,建立封站條件下乘客出發車站選擇行為模型;研究不同客流特征的旅行時間可靠性,基於累積前景理論建立考慮旅行時間可靠性的乘客出發時間選擇模型;對擁擠大客流情況下的乘客乘車班次比例、擁擠大客流情況下的乘客反向乘車行為、擁擠條件下的路徑選擇行行研究,並對提出的模行驗證。 第四章提出面向大數據的軌道交通客流預測方法,解決多場景、多粒度、高精度客流預測的問題括面向土地利用數據的軌道交出站量預測、時空短時客流預測、客流控制下軌道交通出站量預測和封站場景下軌道交出站量預測方法。在面向土地利用數據的軌道交出站量預測方法中,提出一種新的融合循環的圖卷積網絡(graph convolutional networks and gate recurrent unit,GCGRU)模型精準預測軌道交通的短時客流。該模型可以通過循環提取時間特征,通過圖卷積網絡(graph convolutional networks,GCN)提取空間特征,具有較好的精度和可解釋性。同時,為了解決客流控制下的客流預測問題,我們提出利用列車時刻表、客流、客流控制數據對車站出站流行預測的神經網絡模型。該模型對調整客流控制策略、緩解擁堵問題具有重要意義。在封站場景下的軌道交出站量預測方法中,我們提出基於新的封站情況下的軌道交通客流預測方法。與其他機器學achine learning,ML)模型相比,該方法預測精度較高,能較好地預測封站情況下軌道交通客流的情況。 第五章提出面向數據驅動的軌道交通路網狀態識別方法,建立車站擁堵的評估指標。通過軌道交通路網、車站的歷史數據對路網和車站狀態分級,並結合預測交通狀態評價指標判別路網預測狀態的擁擠等級。根據OD(origin destination)量對車行關聯度分析,形成關鍵區域一步識別關鍵車站。 第六章提出基於強化學道交通路網協同限流方法,深入探討線網各車站協同客流組織的機理,明確各車站的關聯和互動關繫,構建適應超大規模路網擁擠客流管控的求解模型和算法。 第七章針對供需匹配衡,介紹數據驅動的軌道交通精準誘導方法及繫統。具體而言,提出乘客出行前、中、後過程中結合乘客畫像的精準誘導信息發布策略,提出基於Q-learning的結合乘客偏好的誘導信息發布優化方法。 本書在新技術條件下開展超大規模軌道客流組織研究,具有如下科學意義和應用價值。 (1)探索超大規模軌道線網乘客反常和超常行為的作用機理,圍繞超大規模線網服務失效下乘客行為機理未知的科學問題,提出考慮乘客旅行時間可靠性的乘客出發時間選擇行為模型,封站場景下基於決策場理論的乘客出發車站選擇行為模型,反向乘客及其反常行為的分析理論和突發情況下乘客超常行為決策方法,解決超大規模、超大運量軌道線網擁擠和突發情況下的乘客軌跡估計不、斷面客流量估計不準的難題。 (2)圍繞受控和非受控客流在超大規模軌道線網的演化機理難掌握的難題,構建滿足多場景日、客流控制、大型活動等)、多尺度的短時客流預測方法,克服外部因素考慮少和預測結果可解釋性差的缺點,實現線網客流的精準估計,彌補既有研究估計不的缺陷。 (3)面向軌道交通路網和車站狀態數據多、閾值難以確定的問題,提出基於數據驅動的聚類分級方法,解決海量數據的挖掘和點線網狀態的內在關繫挖掘等難題,利用數據驅動方法構建路網關鍵車站時空關聯度的分析和計算方法,一步協同客流組織提供支撐。 (4)提出能力受控下的軌道交通區域多站協同限流方法和考慮實時信息作用的誘導策略優化方法,深入刻畫限流策略、誘導策略與乘客行為、線網客流狀態演化之間的互饋關繫,滿足不同服務需求的超大規模線網不均衡運輸組織理論,實現大規模線網的精準復合客流組織理論。 (5)嘗試解決長期以來軌道交通領域無法利用多源信行客流組織的難題,在提高軌道交通運營效率、乘客出行服務品質等方面帶來間接的社會及經濟效益。 本書涉及的多場景、多尺度需求和新技術+軌道交通客流組織是各軌道交通企業響應國家新技術在行業應用戰略,構建智慧地鐵迫切需要掌握的基礎理論。 1.2國內外綜述 1.2.1大數據條件下的乘客行為特性建模 結合本書研究的目標和內容,主結實時感知下的乘客出發車站、出發時間及路徑選擇行為的變化規律。 地鐵乘客出行時間和出發車站選擇行為的研究正在日益興起,建模方法主要有多項logit(multinomial logit,MNL)模型、交叉嵌套logit(cross nested logit,CNL)模型等離散選擇模型[1]。Thorhauge等[2]考慮出行者時間的靈活性因素,基於混合logit模型構建出行時間選擇模型。Li等[3]研究高峰時段乘客的出發時間選擇行為,采用兩階段控制函數方法構建解決價格內生性的乘客出發時間選擇行為模型,分析社會經濟和乘客個體特性對不同乘客的出發時間影響,為早高峰制定個性化的需求控制策略提供理論依據。乘客路徑選擇行為方面的研究相對較多,常見的方法有數學建模和數據挖掘兩大類。Fosgerau等[4]采用MNL模型描述乘客的路徑選擇問題,並在大規模地鐵網絡應用中驗證。Raveau等[5]考慮換乘主觀感知、列車擁擠程度、網絡拓撲和社會人口因素構建基於地鐵網絡的乘客路徑選擇logit模型,結合倫敦地鐵和亞哥地鐵數據對模型參行校驗和比較分析。Mai等[6]在此基礎一步構建動態規劃的方法,解決大規模路網下的路徑選擇問題,並以嵌套logit(nested logit,NL)模型為基準驗證模型算法的有效性年來,數據挖掘方法成為乘客行為研究的熱點。Kusakabe等[7]通過構建樸素貝葉斯概率模型估計乘客的出行行為特性,行目的的挖掘分析。Minseo等[8]利用貝葉斯方法和馬爾可夫鏈蒙特卡羅法估計乘客選擇路徑行為。Xu等[9]考慮列車擁擠程度對乘客路徑選擇的影響,建立乘客出行選擇行為的logit模型,並利用AFC數據、列車時刻表和滿載率數行建模的參數標定。然而,這些研究乘客出行行為的模型均未考慮動態信息對乘客的影響,利用感知信息研究地鐵乘客出行行為還處於起步階段。 信息感知對出行者行為影響的研究在軌道交通領域不多,大多集中在道路和公共交通領域。很多研究都假設每名出行者可以根據收到的信息自動做出理性的選擇。然而,個體並是采納或服從收到的信息,隻有一小部分乘客的出行路徑是按照信息建議選擇的年來,Ben-Elia等[12]使用混合logit模型研究道路旅行時間的不確定的性對駕駛員路徑選擇的影響。Van Essen等[13]從個人和路網繫統角度綜述出行信息對出行者行為的潛在影響,並強調有限理性和非自私行為在路徑選擇和信息反饋中的作用。對基於道路的出行信息繫統,不少學者行了相關研究。Dell’Orco等[14]提出一種基於模糊數據融合的駕駛員動態選擇行為模型,根據當前網絡狀況動態模擬用戶對旅行時間變化的感知。Ma等[15]利用強化學葉斯學出行者的日常路徑選擇模型,考慮內在的信息繫統可靠性、外在的多源信息、用戶歷史經驗,以及心理因素。案例結果表明,信息繫統的可靠性越高,出行者越遵循繫統的。 隨著互聯網和移動大數據的發展,利用社交媒體和智能手機第三方應用程序(application,APP行道路相關信息感知的研究也相繼出現。Rashidi等[16]綜述了如何將社交媒體的各種資源和數據用於分析乘客出行特性,如出行目的、出行方式、活動時間、目的地選擇,以及社會屬性等。Zhang等[17]基於社交網分享的實際路線旅行時間、每條路線選擇的 |