中国大学生在线首页 设为首页 在线投稿 实名注册指南
官方微博

2015D1-天津大学2015年“深圳杯”数学建模夏令营优秀论文下载

我要评论(0) 字号:T T 2015年12月04日 来源:夏令营组委会

【导读】未经组委会书面许可,严禁转载。

 

夏令营2015D1.docx


 

 

航班延误问题的现状及改进

——2015“深圳杯数学建模夏令营论文

 

 
 

 

 

姓名:郭亚超   学校:天津大学   专业:电气自动化

姓名:佘步鑫   学校:天津大学   专业:电气自动化

    姓名:李     学校:天津大学   专业:数学与应用数学

 

 

 

 

 

摘 要

随着我国航空运输量的迅速增加,航班延误问题已经引起人们的重视。本文旨在建立合理的数学模型,来综合评估航班延误的严重程度,并深入分析延误原因,同时提出合理可行的解决方案。

针对问题一,本文从国内外统计标准不一致出发,选取延误率、延误时长和延误损失作为航班延误的统计指标,采用模糊综合评价法,建立了航班延误等级评估模型。模型检验发现,题中仅用延误率一个指标来评估航班延误的严重程度是不正确的。

针对问题二,本文验证了飞机的起飞和到达时间服从泊松分布,延误时间符合指数分布。通过建立航班延误动态排队模型,基于机场数据的仿真分析,可知引起航班延误的主要因素是航空公司和流量原因。

针对问题三,根据航班延误的主要原因,本文建立了基于时间序列的延误预测模型,分别采用三次指数平滑法和马尔可夫链的方法进行数据的处理及分析。为研究不正确航班恢复求解的问题,本文将遗传算法引入匈牙利算法,从减少航班延误经济损失角度出发,分别给出了使总延误时间、延误成本和延误人数最小化的三个方案,方便工作人员根据实际情况进行调配。

另外,为使航空公司在治理延误时的投入能取得最大回报率,本文结合采用了层次分析法和物元法,分析发现:管理执行力度和管理标准失察时对航班延误影响最大,应重点治理。同时,通过对数据的分析,针对航班延误的变化规律,本文分别为政府和乘客提出相应的建议,以减少航班延误的发生。

 

 

 

 

 

关键词:航班延误;模糊综合评价;动态排队;时间序列预测;治理途径

 

 

 

 

 

目录

一、问题重述... 1

二、问题分析... 1

三、模型假设... 2

四、符号说明... 3

五、模型的建立与求解... 4

5.1模型一:模糊综合评估模型... 4

5.1.1   模型分析. 4

5.1.2   模型建立. 9

5.1.3   模型求解. 12

5.1.4   模型检验. 12

5.1.5   模型结论. 14

5.1.6       模型优缺点... 14

5.2模型二航班延误动态排队模型... 15

5.2.1   模型建立. 15

5.2.2   模型求解. 19

5.2.3   模型结论. 21

5.2.4   模型评价. 22

5.3问题三:航班延误的综合治理... 22

5.3.1   治理角度一:基于时间序列预测法的航班延误预测. 22

5.3.2   治理角度二:航班调度和延误成本优化模型. 26

5.3.3   治理角度三:管理部门角度. 33

5.3.4   治理角度四:政府航班扩建计划. 37

5.3.5   治理角度五:乘客出行建议. 41

六、模型总结... 44

七、模型评价... 45

参考文献... 46

附录... 47

.. 52

 

 

 


一、问题重述

近年来,我国的航空运输业飞速发展。自2005年起,中国航空运输总周转量在国际民航组织各缔约国中排名第二位,我国已然成为名副其实的航空运输大国。然而我国航空运输业的发展受到人口众多,民航使用空域面积有限等客观因素的限制,航班延误率居高不下

根据flightstats.com 的统计显示:国际上航班延误最严重的10个机场中,中国占了7个。其中包括上海浦东、上海虹桥、北京国际、杭州萧山、广州白云、深圳宝安、成都双流等机场。香港南华早报网由此称:中国的航班延误最严重。

为深入研究航班延误现象背后的原因和治理方法,本文将解决以下问题:

1)搜集不同机场的数据,选取合适的统计指标,建立航班延误的综合评价指标,与该网站所得结论进行对比,来验证题中结论的片面性。

2)对数据进行分析,分析出航班延误的主要原因。

3)针对航班延误的成因,建立相应的数学模型,从而对航班延误问题进行有效的预防和治理。充分考虑航班延误引发的社会问题,对社会各界提出相应的建议。

二、问题分析

随着我国航空运输量的迅速增加,航班延误问题已经引起人们的重视。近年来,由于航班延误导致的经济损失和人事纠纷频频发生。因此,建立更加全面的航班延误评估模型,深入探究航班延误原因,并对航班延误问题进行有效治理已经迫在眉睫。

针对问题一,在评判航班延误程度时,香港南华早报网仅仅考虑了航班延误率一个指标,便得出中国航班延误最为严重的结论,有一定的片面性。本文从收集和分析数据出发,选取延误率、延误时长和延误损失作为航班延误的统计指标,采用模糊综合评价法,建立了航班延误等级评估模型。并选取成都双流为例,进行模型检验,与题设结论进行对比。

针对问题二,根据数据显示,导致航班延误的原因主要分为两大类:可控因素与不可控因素。其中,可控因素包括航空公司原因、流量原因、机场保障原因、旅客自身原因等;不可控因素包括天气、军事活动等。经验证可知,航班到达和起飞时间符合泊松分布,而航班延误时间符合指数分布。本文对于由可控因素引起的航班延误问题,以一个航班运行闭环为例,通过建立航班延误动态排队模型和仿真分析,可知引起航班延误的主要因素是航空公司和流量原因。

针对问题三,根据航班延误的主要原因,本文建立了基于时间序列的延误预测模型,分别采用三次指数平滑法和马尔可夫链的方法进行数据的处理及分析,从而实现对航班延误的有效预测。为研究不正确航班恢复求解的问题,本文采用了基于匈牙利算法和遗传算法的混合优化算法,从减少航班延误经济损失角度出发,分别给出了使总延误时间、延误成本和延误人数最小化的三个方案,方便工作人员根据实际情况进行调配。

另外,考虑到航空公司的治理,为使其投入能取得最大回报率,本文结合采用了层次分析法和物元法,分析发现管理执行力度和管理标准失察时对航班延误影响最大,应重点治理。同时,通过对数据的分析,针对航班延误的变化规律,本文为政府部门以及乘客提出尽可能避免航班延误的出行建议。

三、模型假设

1)        所有收集到的数据均真实可靠;

2)        采取的措施即刻生效;

3)        所有决策者都是理性的,且各个决策者相互独立;

4)        航班延误只受客观因素影响,此处排除蓄意破坏因素;

5)        航班到达和起飞时间服从泊松分布,航班延误时间服从指数分布;

6)        机场作为公共基础设施,一般实行超前设计建设,在相对较长的时间内,其跑道数量基本固定不变;

7)        航班延误多发生在大中型枢纽机场,因而这里分析统一采用双跑道模式,且排队规则为“先到先服务”;

8)        将机场看做一个整体进行分析,而并非对一个航班在机场中的到达和起飞单独进行分析;

9)        闭环内的每个机场的起飞和到达分布、服务能力均相同;(此处均为大中型枢纽机场);

10)    闭环内的航班运行过程中包含了所有影响航班延误的因素。

 

四、符号说明

符号

定义

飞机起飞的泊松分布

飞机到达的泊松分布

乘客到达机场的泊松分布

飞机起飞所用时间的负指数分布

飞机降落所用时间的负指数分布

乘客进行安检过程中所消耗时间的负指数分布

飞机起飞排队延误

初始延误

以后每个阶段的波及延误

飞机排队队长

平均服务时间

时间平稳序列

马尔科夫链

马尔科夫链预测函数

物元

事物

事物的特征

层次分析标度

飞机的指示

航班的下标

 

所有航班的总延误经济损失

 

所有的航班集合

 

所有可执行飞行任务的航班集合

 

航班原计划起飞时间

 

航班恢复时间

 

航班延误时间,由计划起飞时间T和恢复时间R决定

 

航班总延误时间

取消航班的因子,当航班取消时为1,不取消时为0

航班替换因子。当航班f的飞行任务由航班e代替时取值为1,否则取0

航班f延误成本

旅客损失

飞机e执行飞机f飞行任务时的调机成本

航班客座率

 

航班最大载客人数

 

航班的平均票价

 

旅客的失望溢出成本

 

把航班f指派给备用飞机e的成本

时间从ij的航班

 

五、模型的建立与求解

5.1模型一:模糊综合评估模型

5.1.1  模型分析

国内外对于航班延误的统计标准存在差异。国际上,将航班到达时间超过公布的航班计划到达时间15分钟或以上定义为延误;而在中国,2013年将计划时刻前后5分钟内撤轮档或不晚于计划时刻挡轮挡的航班判定为正常,且将提前5分钟以上撤轮档的航班判定为不正常。相比较看来,中国对于准点率的要求更为严格,并不利于与国际的航班准点率水平进行横向比较。

除国内外统计标准不一外,根据《民航发展统计公报》可知,我国航空运输量增长迅速。改革开放以来,中国民航运输总周转量、旅客运输量和货邮运输量分别以17.5%15.9%14.9%的平均速度增长,远高于其他运输方式和中国GDP的平均增长水平。下图显示了2009-2013年民航运输吞吐量以及周转量的变化趋势。

 

图一:2009-2013年民航旅客运输量

 

图二:2009-2013年民航运输机场货邮吞吐量

图三:2009-2013年民航运输机场旅客吞吐量

 

从图中2009-2013年民航运输机场吞吐量和运输量的走势可以看出,近五年来,我国民航机场吞吐量和运输量持续走高,这也成为我国的基本国情之一。

基于我国民航吞吐量如此之大,我们通过查阅资料了解到国内吞吐量分布,如下图所示:

图四:国内航空集团吞吐量

 

图中分布数据表明:我国民航承载量最大的航空公司有中航集团,南航集团以及东航集团。通过查阅资料,我们了解到这三大航空公司的主要下属机场分别为:

 

东航集团

上海虹桥机场,上海浦东机场,

南京禄口国际机场,昆明长水国际机场,西安咸阳国际机场

南航集团

广州白云国际机场,北京首都国际机场,郑州新郑国际机场

中航集团

北京首都国际机场,成都双流国际机场

表一:三大航空公司的主要下属机场

 

从主要机场分布不难看出,在承载量最大的航空公司的主要下属机场中,有5个都出现在了flightstats.com所给出的航班延误最严重的十大机场榜单上,分别是上海虹桥机场,上海浦东国际机场,广州白云国际机场,北京首都国际机场和成都双流国际机场。这也表明,我国民航运输量和吞吐量大也是影响航班延误严重程度的因素之一。

另外,通过2007年和2012年美国同中国的航班总量以及航班正点率的对比,可以发现,在美国,随着航班总量的减少,航班正点率也在升高,因此我们提出猜想:航班准点率和航空公司的繁忙程度存在一定关系。

 

国家

年份

航班总量

航班正点率

 

美国

2007

745.5

73.42%

2012

596.4

81.85

中国

2007

167.2

83.19

2012

269.3

74.83%

表二:中美航班数量和正点率对照表

 

同时,通过收集到的2013年我国主要机场的旅客吞吐量排名以及起降飞机架次排名,不难看出,完成旅客吞吐量最大的机场和起降飞机架次最多的机场都是航班延误程度较严重的机场,这也印证了上述猜想。

 

 

旅客吞吐量(人)

机场

名次

本期完成

上年同期

比上年增减%

合计

 

754,308,682

679,772,088

11.0

北京/首都

1

83,712,355

81,929,352

2.2

广州/白云

2

52,450,262

48,309,410

8.6

上海/浦东

3

47,189,849

44,880,164

5.1

上海/虹桥

4

35,599,643

33,828,726

5.2

成都/双流

5

33,444,618

31,595,130

5.9

深圳/宝安

6

32,268,457

29,569,725

9.1

昆明/长水

7

29,688,297

23,979,259

23.8

西安/咸阳

8

26,044,673

23,420,654

11.2

重庆/江北

9

25,272,039

22,057,003

14.6

杭州/萧山

10

22,114,103

19,115,320

15.7

厦门/高崎

11

19,753,016

17,354,076

13.8

长沙/黄花

12

16,007,212

14,749,701

8.5

武汉/天河

13

15,706,063

13,980,527

12.3

乌鲁木齐/地窝堡

14

15,359,170

13,347,188

15.1

南京/禄口

15

15,011,792

14,001,476

7.2

青岛/流亭

16

14,516,669

12,601,152

15.2

大连/周水子

17

14,083,131

13,337,184

5.6

郑州/新郑

18

13,139,994

11,673,612

12.6

三亚/凤凰

19

12,866,869

11,343,387

13.4

沈阳/桃仙

20

12,106,952

11,011,800

9.9

表三:国内大型机场旅客吞吐量

 

 

 

起降架次(次)

机场

名次

本期完成

上年同期

比上年增减%

合计

 

7,315,440

6,603,207

10.8

北京/首都

1

567,757

557,159

1.9

广州/白云

2

394,403

373,314

5.6

上海/浦东

3

371,190

361,720

2.6

上海/虹桥

7

243,916

234,942

3.8

成都/双流

6

250,532

242,658

3.2

深圳/宝安

4

257,446

240,055

7.2

昆明/长水

5

255,546

201,338

26.9

西安/咸阳

8

226,041

204,427

10.6

重庆/江北

9

214,574

195,333

9.9

杭州/萧山

11

190,639

166,340

14.6

厦门/高崎

13

166,837

146,183

14.1

长沙/黄花

15

137,843

127,041

8.5

武汉/天河

14

148,524

132,417

12.2

乌鲁木齐/地窝堡

16

135,874

118,701

14.5

南京/禄口

17

134,913

128,440

5.0

青岛/流亭

18

129,751

116,176

11.7

大连/周水子

20

107,709

100,231

7.5

郑州/新郑

19

127,835

109,249

17.0

三亚/凤凰

25

90,748

81,456

11.4

沈阳/桃仙

24

92,300

82,294

12.2

表四:国内大型机场旅客起降架次

 

因此,在各国机场繁忙程度不对等的情况之下,仅仅依靠延误率一个指标来评价航班延误程度,这显然对客流量较大的机场并不公平。同时,评价航班延误严重程度需要基于多角度综合考虑,所以我们选择建立模糊综合评价模型解决此问题。

毕竟,航班起飞是一个系统而又复杂的过程,只有确保各个环节无误,才能保证航班运行的安全。

 

说明: C:\Users\yachao\Desktop\图片1.png

图五:航班起飞准备过程

 

实际情况显示,准点率并非越高越好,我们应时刻谨记安全第一的原则。仅仅使用准点率数据来衡量航空公司的延误,并不利于航空事业的长期发展。

马来西亚航空公司在准点率记录上表现良好,还曾连续6年获得亚洲准点排行榜前20名的荣誉。然而,事故接连发生,让我们不得不在处理航班延误问题时,时刻保证航班的安全性。

国内外很多关于航班延误严重程度的判别都仅仅依靠航班延误率,但是,我们认为延误并不等于延误率。根据之前关于该问题的调研,综合考虑我国的国情以及面临的社会压力等方面,通过查阅文献,我们选择最能反映航班延误严重程度的三个指标进行模糊综合评价,分别是延误率,延误时长和延误损失。

本文从系统分析航班运行全过程入手,选取了航班延误率、航班延误时长和航班延误损失三个统计指标,采用模糊综合评价的方法,建立模糊综合评价模型,对上述指标统计得到的航班延误情况进行延误等级的综合评价。

5.1.2  模型建立

目前对于航班延误的统计依然沿用的是以前针对空管调度室运行而设计的统计方法,并没有考虑机场和航空公司的实际运行情况。随着社会公众旅客对航空运输的日益关注,需要我们从新的角度重新建立更加全面的航班延误统计指标体系。

本文在充分分析和调研的基础上,充分考虑中国航班数据统计的现状,最终选取了航班延误率,延误时长,延误经济损失三个指标来建立航班延误统计指标体系,再将每个指标细化,如图1所示。

 

航班延误统计指标

                                                   

延误率             延误时长         延误损失

 

                           
   
     
         
   
   
 
 
 
 
  航空公司间接损失航空公司信誉损失旅客经济损失延误航班盈利损失航班着陆延误时间航班运行延误时间航班起飞延误时间航班总数延误航班总数
 

 

 

 

 

 

 


1 航班延误统计指标

 

根据上图划分的统计指标,给出每个统计指标的具体计算方法如表1所示:

 

统计指标

计算方法

延误航班总数

历年数据

航班总数

历年数据

航班起飞延误时间

 

航班运行延误时间

   

航班着陆延误时间

   

延误航班盈利损失

    

旅客经济损失

   

航空公司信誉损失

民意调查结果

航空公司间接损失

暂无明确计算方法

1 统计指标的计算方法

 

另外,围绕航班运行的整个过程,各个统计指标对于航班延误程度的影响不尽相同,对于航班延误等级的综合评价是一个多目标决策问题,往往需要考虑多个目标的相对重要性即各个指标在航班延误中的影响程度。一般情况下,其相对影响程度是由一组规范化的优先权重来给定的,在本文中,共有9个统计指标,一组权是 ,它们之间的关系满足

      i=1,2,3,,9

       

最后,进行二级评判延误,具体步骤如下:

Step 1确定评判因素集U

根据航班延误统计指标对给定的因素集合U进行划分,分为,,三个子集,其中,  

划分的结果如下:

第一层:={延误率,延误成本,延误损失}

第二层:={延误航班数目,航班总数}

        ={航班运行延误时间,航班着陆延误时间,航班起飞延误时间}

={延误航班盈利损失,旅客经济损失,航空公司信誉损失,间接损失}

Step 2确定延误指数如表2

 

延误指数

延误特点

1

低级延误

2

一般延误

3

中级延误

4

高度延误

2 延误指数及延误特点

 

Step 3确定评价集

根据航班运行的方式结合延误的特点,确定模型中各因素对于延误的等级为4个,分别是:低级延误等级1;一般延误等级2;中度延误等级3;高度延误等级4

Step 4确定各统计指标的权重

采用层次分析法,由于本问题侧重描述模糊综合评价模型的应用,所以对于层次分析法求统计指标权重的过程不再赘述,直接呈现计算结果分别为

Step 5建立第二层因素模糊评判矩阵R

此处可由专家评价法确定各个评判矩阵分别表示为:

5.1.3  模型求解

模糊综合评价的顺序是由低层次向高层次逐层进行的,因此其评价顺序是先进行第二层评价,然后进行第一层评价。

第二层评价的计算公式为*,由此可得第一层的评判决策矩阵为 

第一层评价的计算公式为* 

依据最大隶属度原则,取隶属度最大的评估作为最终的结果,可得到机场的延误综合等级以及相应的延误指数。

5.1.4  模型检验

为了论证这个问题,我们再次从国外航班统计网站上查询到最近一周和一月的航班延误数据,发现成都双流机场的排名和题目中所给结论出入较大,因此我们决定选择成都双流机场作为验证。

首先,我们根据flightstats.com给出的最近一周和一月的航班延误统计数据进行航班延误情况的初步预判。如表3和表4所示。

 

排名

机场名称

延误数量

1

广州白云国际机场

2608

3

北京首都机场

1948

4

上海浦东国际空港

1876

7

深圳宝安机场

1698

11

杭州萧山机场

1290

12

香港国际机场

1284

13

上海虹桥国际机场

1216

17

咸阳机场

973

22

重庆机场

898

25

昆明长水国际机场

877

26

成都双流机场

865

近一周航班延误机场排行榜(中国机场部分)

 

排名

机场名称

延误数量

1

上海浦东国际空港

9123

2

北京首都机场

8710

5

广州白云国际机场

8308

7

深圳宝安机场

6045

8

杭州萧山机场

6034

9

香港国际机场

5913

11

上海虹桥国际机场

5792

21

昆明长水国际机场

3960

23

咸阳机场

3924

24

成都双流机场

3903

27

重庆机场

3630

4 近一月航班延误机场排行榜(中国机场部分)

 

根据上述表格可知,上海浦东,上海虹桥,北京国际,杭州萧山,广州白云,深圳宝安机场都在航班延误排行榜前十左右,而成都双流机场的排行差别较大,根据大数定律,我们有理由怀疑成都双流机场不在延误情况最高的十个机场之内。

模糊综合评价的顺序是由低层次向高层次逐层进行的,因此评价顺序是先进行第二层评价,然后进行第一层评价。第二层的计算采用评估模型:加权平均模型,经过合成计算可以得到第二层次的综合评判结果如表5所示:

 

准则

航班平均延误率

航班平均延时

航班平均延误损失

总排序权值

标准权值

0.3150

0.6026

0.0823

 

香港国际机场

0.3795

0.3815

0.2162

0.3672

咸阳机场

0.2987

0.3426

0.3587

0.3301

成都双流机场

0.3218

0.2759

0.4251

0.3026

5 第二层次的综合评判结果

 

根据最大隶属度原则,取隶属度最大的评估作为最终结果,本文可以根据上述数据得出以下两个结论:

1、成都双流机场的最终航班延误综合等级为一般延误等级状态,对应的延误指数为2

2、成都双流机场的航班延误率低于香港国际机场和咸阳机场,而香港国际机场和咸阳机场均不在延误最严重的十大机场排名中,因此,我们有理由认为成都双流机场并不是航班延误最严重的十大机场之一。

5.1.5  模型结论

根据最大隶属度原则,取隶属度最大的评估作为最终结果,本文可以根据上述数据得出以下两个结论:

1、成都双流机场的最终航班延误对应的延误指数为2,仅为一般延误等级状态。

2、成都双流机场的航班延误率低于香港国际机场和咸阳机场,而香港国际机场和咸阳机场均不在延误最严重的十大机场排名中,因此,我们有理由认为成都双流机场并不是航班延误最严重的十大机场之一。

综上所述,题目所给出的结论存在不合理之处。在评判航班延误程度时,仅仅考虑航班延误率一个指标,是片面的。应选取合理的统计指标,建立相对全面的统计指标体系,从而可使用模糊综合评价模型来评判航班延误的程度。

题中仅用延误率一个指标来评估航班延误的严重程度是不正确的。

 

5.1.6  模型优缺点

1)优点:

① 该模型有着航班延误统计指标体系设计的理论依据,为航班延误统计指标体系的建立奠定了一定的理论基础。

② 建立统计指标体系来对航班延误状况进行综合评估,比仅用延误率一个指标来评判更具客观性和说服力。

2)缺点:

①指标体系的建立需要更加深入地研究,指标体系的内容需要更加完善,统计标准也需要进一步完善。

②由于各个专家的知识结构,个人喜好以及认识水平有差异,因此他们对于不同因素的重要性的判断可能会偏离客观事实。

5.2模型二:航班延误动态排队模型

5.2.1  模型建立

(一)航班延误原因的初步划分

实际生活中,为了提高飞机的运行效率,航空公司的同一架飞机的运行路线往往不是点对点的往返飞行,而是由连续的不同航段组成的一个闭环。在航班运行闭环中,按照航班延误的表现形式,可以把航班延误分为以下三类:

第一类:旅客延误:

旅客晚到;

登记时旅客不辞而别;

旅客证件问题耽误时间;

旅客因航班延误等其他服务问题霸占飞机或拒绝登机;

旅客随身携带过多行李;

旅客突发疾病等。

第二类:排队延误:

安检排队延误;

飞机起飞降落排队延误。

第三类:航空公司原因导致的延误

①机械故障

②航线排班不合理等

其中,因旅客原因导致的航班延误比例占到3%,已成为航班延误新的增长点。而现阶段,波及延误是占比例最高的延误,特别是起飞排队延误。安检排队延误是由于机场的服务能力有限或是旅客在一段时间内太过密集而造成的安检不畅,形成很长的排队等待,这与安检站台的服务容量和安检服务效率密切相关,发生的概率相对较低。

飞机起飞降落排队延误,是由于起飞或降落航班过多,或是天气、军事活动和流量控制,或者是低效率的地面服务,造成飞机难以立即起飞的地面排队或不能在机场找到降落位置而不得不停留在空中继续盘旋等待排队。这种延误会引起连锁反应,对后续飞机产生较长的排队时间,如果不及时采取措施,就会导致后续所有飞机都延迟起飞或降落,不断累积,形成更大更强的延误波。

航空公司造成的延误,多是因航空公司自身的运营管控能力或机械故障造成的航班计划安排不当引起的航班延误。其管理不畅,服务不周等情况也有可能间接导致排队延误,应予以重视。

引发上述三种航班延误的因素按照可控与否,可分为不可控因素和可控因素。不可控因素包括流量控制、军事活动、天气等;可控因素包括安检、旅客、机械故障、机场原因和公共安全等。其中可控因素是航班延误研究和治理的重点。

根据民航总局2005-2013年航班延误统计数据,造成中国航班延误的关键因素包括流量控制、航空公司、天气、军事活动、机场因素、机械故障以及旅客等因素,综合主要航空公司和主要机场的相关数据,得到各因素引发的延误比例结构见表6

 

年份

流量控制

航空公司

天气

军事活动

机场

旅客

2005

0.16

0.46

0.18

0.03

0.04

0.03

2006

0.22

0.48

0.23

0.02

0.02

0.02

2007

0.28

0.47

0.15

0.07

0.02

0.01

2008

0.19

0.43

0.27

0.06

0.04

0.01

2009

0.23

0.39

0.19

0.11

0.05

0.03

2010

0.24

0.41

0.23

0.09

0.02

0.01

2011

0.28

0.37

0.20

0.12

0.01

0.02

2012

0.22

0.36

0.21

0.17

0.02

0.02

6 航班延误影响因素比例结构表

 

(二)航班延误的指数分布验证

排队模型的前提是到达对象的时间序列符合指数或泊松分布,所以模型建立前要进行必要的理论准备。

泊松分布适用于描述单位时间(或空间)内随机事件发生的次数。机场作为提供航空运输服务的公共基础设施,单位时间内到达和起飞的飞机数量符合泊松分布特征,可以假设机场飞机的起飞和到达都是服从泊松分布。如果一个序列服从泊松分布,那么它的序列间隔服从负指数分布,即如果飞机到达和起飞呈现出泊松分布,可以推导出起飞和到达延误时间服从均值为方差为的指数分布。当然,反过来,只要验证到达延误分布服从指数分布,就可得证飞机到达分布服从泊松分布,并且求出相应的值。

根据收集到的20133月咸阳机场和首都机场四个样本时间段航班延误时长和数,通过分析航班延误样本的实际分布和理论指数分布之间的拟合度,来验证航班延误的指数分布假设,验证结果见表7

 

延误时长(min

样本1

样本2

样本3

样本4

北京

咸阳

北京

咸阳

北京

咸阳

北京

咸阳

5

270

148

273

149

267

146

263

147

10

152

83

154

84

151

83

149

78

15

78

43

79

43

78

43

76

42

20

38

21

38

21

38

21

40

21

25

31

17

31

17

30

17

31

15

30

17

9

17

9

17

9

17

10

35

14

8

14

8

14

8

14

8

40

6

3

6

3

6

6

7

4

45

5

3

5

3

5

3

6

3

50

3

2

3

2

3

2

5

3

55

4

2

4

2

4

2

3

2

60

2

1

2

1

2

1

4

2

65

1

1

1

1

1

1

3

2

>65

8

4

8

4

8

4

11

8

                   

7 北京首都机场和咸阳机场到达间隔统计表

 

 

变量

系数

标准差

T

P

北京

咸阳

北京

咸阳

北京

咸阳

北京

咸阳

常数项

0.2133

0.1793

0.0939

0.0785

2.2714

0.2837

0.0423

0.0414

系数

0.9437

0.9437

0.0309

0.0309

30.5804

30.5804

0.0000

0.0000

R-squared

0.9873

0.9873

 

 

 

 

 

 

Adjusted R-Squared

0.9863

0.9863

 

 

 

 

 

 

S.D.dependent var

1.5370

1.5371

 

 

 

 

 

 

8 航班延误实际分布与理论指数分布拟合度分析结果

 

8检验结果表明,航班延误理论指数分布和实际分布的拟合程度超过98%,验证了航班到达和起飞符合泊松分布,航班延误符合指数分布。

 

(三)建立单一到多因素的动态排队模型

安检排队是一个典型的M/M/D模型,乘客到达服从泊松分布,每个乘客接受安检的时间服从负指数分布。

起飞排队和降落排队模型会因飞机起飞和降落模式的不同而不同。主要分类如下:

1、起飞和降落相分离,各自使用不同的专用跑道,排队模型为M/M/1;

2、起飞和降落按照“先到先服务”原则,共用一条跑道,排队模型为2M/M/1;

3、起飞和降落按照“先到先服务”原则,混合排队使用两条跑道,排队模型为2M/M/2

基于国内大型机场,采用的是双跑道混合模式,故其基本排队模型为2M/M/2模式。此时,排队模型相当于一个飞机来源服从()的泊松分布,这里的服务时间仍然是U1U2,因为每天进出一个机场的飞机数量基本相同,可选用(U1+U2/2作为服务时间所服从的指数分布;服务台数是双跑道——双服务台,排队规则是先到先服务。

将上面的三个可控延误模型以及航班延误波及模型结合,可建立单一因素的可控制延误模型如下图所示。

 

 
 
 

 

 

 

 

 

 

 

 


在一个延误波闭环圈中加入其他因素,就构成了多因素动态排队模型。

 

 

 

 

 

 

 

 
 
 

 

 

 

 

 

 

 


1:可控因素引起的航班延误示意图

 

该模型仅考虑一次意外所造成的延误以及由此而产生的波及效应。并且在此基础上进行推广,得到多因素闭环延误波。假设在其他情况正常时,由于一次意外的天气状况或者突然的军事活动造成在航班运行过程中的任意一个环节的初始延误及飞机某一排队的意外增加,接着会因航班延误的波及效应影响到飞机运行其他一系列环节。当不考虑由不可控因素引起的航班延误时,各个机场的延误相互独立,波及航班延误也不再是一个连续的过程。此时,各个环节的排队队长就是在原有正常队长的基础上加一个因波及延误而产生的波及队长。

5.2.2  模型求解   

航班延误的波及效应呈现平稳递减,则假设出事延误=每个阶段延误波及被缓冲消除该阶段延误的一半,故有

故总的波及效应= 

在初始机场中有:飞机起飞排队延误=飞机排队队长*平均服务时间+延误时间,由此则有:

初始机场: 

相关联的第一个机场: 

相关联的的第n个机场: 

以北京首都国际机场为初始出发机场,基于北京—上海—杭州—云南—北京四个机场组成的航班运营闭环,利用半年内该闭环中航班延误的数据,模拟仿真分析各个关键影响因素对于航班延误的影响程度。

根据以上分析,我们建立matlab仿真的示意图。图见下:

 

 

 
 
 

 

 

 

 

 

 

 

 

 

 


利用MATLAB软件对数据进行模拟,表7显示出了各关键因素对航班延误影响大小仿真模拟结果。

 

影响因素

发生频率

影响平均时间

是否可控

航空公司

29.2%

0(航班取消)

机械故障

7%

140min

军事活动

12%

185min

天气

20%

55min

流量控制

28%

60min

未知

机场

3%

32min

旅客

0.8%

10min

9 各关键因素对航班延误影响大小仿真模拟结果表

 

对各个影响因素对航班延误影响的大小和发生频率高低进行排序可得表10

 

影响排序

影响因素

备注

1

航空公司

频率高,影响大

2

流量原因

频率较高,影响大

3

天气原因

频率较高,影响较大

4

军事活动

频率一般,影响大

5

机械故障

频率较低,影响较大

6

机务问题

频率较低,影响较小

7

旅客问题

频率低,影响小

10 航班延误影响因素排序

 

10的仿真模拟结果显示:

仿真结果与官方统计的历史数据排序相似,由此可见官方统计从历史数据角度较为准确地反映了各关键因素引发航班延误的频率,但各因素的影响程度和频率并不完全一一对应。这说明航班延误服务补救措施的制定,不能仅依据各影响因素的发生频率,还必须考虑其影响程度。

模拟结果显示,航空公司因素引发的航班延误不仅发生频率高,而且影响程度大,延误时长往往不可预测。这进一步说明应继续深入研究航空公司导致航空延误的原因,并采取相应的治理措施,通过航班计划的合理安排和运力的合理分配,积极应对减少航班延误。

流量控制和天气因素引发的航班延误频率高,影响程度也大,针对这两个不可控因素,一方面应做好延误的服务补救,减少其震荡延误;另一方面是进行空域改革,提高空域流量。

值得关注的是军事活动和机械故障因素,虽然它们引发的航班延误发生频率一般,但对延误平均时长的影响程度却很大,远远超过了旅客的等待时限,是航班延误服务补救的重点和难点。

由机场和旅客因素引发的航班延误频率较低,影响程度也较低,但是因为航班延误引起的冲突经常发生在机场。旅客的非理性行为已经成为航班延误新的增长点和社会的关注点,这说明延误服务补救中,关注服务旅客始终是航空运输的核心。

5.2.3  模型结论

本模型基于航班运行流程,通过识别航班延误的原因及其主要发生的环节,对航班延误的泊松分布进行了验证,构建了航班延误的动态排队模型,并运用样本机场的数据,对动态模型进行模拟分析,得到以下结论:

在识别的七个主要影响因素中,航空公司因素发生频率最高,影响最大;流量控制因素排名第二,发生频率较高,影响大;天气因素发生较高,影响较大;军事活动发生频率一般,但影响大;机械故障频率较低,影响较大;机场因素频率较低,影响较小。其具体情况如下表所示:

 

不同因素

频率

影响度

航空公司因素

最高

最大

流量控制因素

较高

天气因素

较高

较大

军事活动

一般

较大

机械故障

较低

较大

机场因素

较低

较大

11 各种因素影响度

本模型仿真的结果以及分析所得的结论,为下文航班延误的治理提供了明确的方向。

5.2.4 模型评价

优点:

本文考虑航班运行闭环内的延误状况,通过一段时间内该闭环中各个机场的延误率以及影响因素来进一步识别和剖析航班延误的各关键影响因素及其影响程度,相比于仅考虑点对点的飞机运行,更符合实际情况,因此得到的结论也更具有说服力。

缺点:

该模型对数据依赖较大,如若数据有误则会引起较大误差。因此,在选取数据时,应当确保数据的可信性。

5.3问题三:航班延误的综合治理

5.3.1  治理角度一:基于时间序列预测法的航班延误预测

模型分析

准确的预测结果对决策具有导向性作用。

通过上述模型的分析,我们知道导致航班延误的主要原因有:航空公司原因,流量原因。但在实际生产生活中,预测不能面面俱到去包络系统的一切属性和价值,所以我们在进行预测时,仅针对主要问题,选取有代表性的综合指标和主要指标来预测。

基于此目的,我们把每个因素数据化,在时间轴上标出其对应的数值。通过对大量历史数据的分析与处理,我们总结提炼出“负因子”这个变量。每个因素都对应有相应“负因子”变量,它对每天的航班是否延误起决定性作用。

时间是各种延误发生的轴线,因此我们建立了基于时间序列的航班延误预测模型。

预测的关键在对数据的处理,数据处理有两种不同的方法,累加三次指数平滑法和马尔科夫链法,这两种方法都基于时间序列来处理数据,预测结果。区别在于,累加三次指数平滑法只能对单一因素数据进行预测,而马尔科夫链预测可以综合多种因素而得到综合结果。所以,两种方法能够互补使用,使得预测结果更加准确。

模型建立

步骤一:建立样本数据化标准

在对航班延误进行预测之前,需要对查询到的影响因素数据化,建立每个因素的数据化标准:以影响航班延误的严重程度为梯度打110分,分值越高,表示导致航班延误的可能性越大,10分表示一定会导致航班延误。

具体的细化标准如下表所示:

天气

 

多云

阴天

阴有雨

小雨

中大雨

沙尘暴

雷雨

极端天气

1

2

2

3

3

5

6

8

9

10

流量

 

<19000

19000-21000

21000-23000

23000-25000

>25000

1

2

3

4

5

航空公司管理:

 

人事异常变动

签派不可靠

人员违纪

群体离心力

管理标准失察

1

2

3

4

5

航线安排不合理

安全管理失误

管理标准失察

安全管理失误

信息沟通失真

6

7

8

9

10

12:不同因素的细化标准

 

步骤二:根据标准数据化样本。并检验样本数据是否是平稳时间序列,如果不是则进行修正处理。

(1)检验方法:应用Eviews软件输入数据的序列趋势图,如果得到的曲线平滑则是平稳序列,反之,则需要修正。

(2)修正方法:利用多次差分法。差分的次数称作齐次的阶。

                                  ……

由于有:

                      ……

所以可以推导出

若序列{}是一个d阶几次非平稳序列,则经过d次差分后就产生新序列

步骤三:利用处理好的数据进行预测。

a.累加三次指数平滑法

传统的移动平均值不可能应用于现有的数据集边缘的数据,因为它们的窗口宽度是有限的,所以我们采用三次指数平滑法来处理。

三次指数平滑法需要更新上一时间步长的计算结果,并使用当前时间步长的数据中包含的新信息。它们通过“混合”新信息和旧信息来实现,而相关的新旧信息的权重由一个可调整的拌和参数来控制。

累加三次指数平滑法:

si=α(xi-pi-k)+(1-α)(si-1+ti-1)

ti=ß(si-si-1)+(1-ß)ti-1

pi=γ(xi-si)+(1-γ)pi-k  其中k为周期

累加三次指数平滑的预测公式为:

xi+h=si+hti+pi-k+(h mod k)  

α,ß,γ的值都位于[0,1]之间,可以多试验几次以达到最佳效果。

当时间序列呈稳定的水平趋势时,取较小值,如0.10.3

当时间序列波动较大时,取中间值,如0.30.5

当时间序列具有明显的上升或下降趋势时,取较大值,如0.60.8

 s,t,p初始值的选取对于算法整体的影响不是特别大,通常的取值为s0=x0,t0=x1-x0, p=0

 b.马尔科夫链处理

马尔科夫链是一种基于当前历史状态预测将来状态的模型,我们将马尔科夫模型的计算结果与我们的模型相比较。基于时间序列的马尔科夫模型是一种离散状态的条件概率转移模型。 …马尔可夫链(Markov Chain),描述了一种状态序列,其每个状态值取决于前面有限个状态。

马尔可夫链是具有马尔可夫性质的随机变量的一个数列。这些变量的范围,即它们所有可能取值的集合,被称为状态空间,而的值则是在时间n的状态。如果对于过去状态的条件概率分布仅是的一个函数,则:说明: http://upload.univs.cn/2015/1204/1449218412324.jpg

这里x为过程中的某个状态。根据概率公式的迭代得到最终的预测结果。

模型检验

Step 1模型自检验:利用残差分析,检验残差e

[责任编辑:刘宇宏]
分享到:
复制链接 打印

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
查看网友评论网友评论( 网友评论仅供其表达个人看法,并不表明本站同意其观点或证实其描述。)
用户名: 快速登录

推荐活动