跳转到主要内容

原始研究的文章

前面。未来的透明。,17April 2023
秒。交通系统建模
卷4 - 2023 | https://doi.org/10.3389/ffutr.2023.1070533

巴西航空运输法律行动:机器学习和多项逻辑回归分析

  • 1航空技术研究所、圣荷西dos坎波斯,巴西
  • 2教师管理经济学、管理部门,会计和公共管理,巴西利亚大学巴西利亚,巴西

在巴西,一个航空公司的成本是最有害的针对他们的诉讼。这是一个可以影响其操作的问题,减少新竞争者的进入和创建的法律不确定性。这项工作旨在突出因素最有助于司法赔偿的崛起,最相关的问题进行讨论并确定最好的技术来预测补偿值。目标是为航空公司提供补贴来减轻法律行动的数量通过使用机器学习模型。本研究的贡献,讨论最相关的科目之一,巴西航空运输和机器学习模型的性能进行比较。这项研究是基于2016年和2021年之间的诉讼使用公司的数据。朴素贝叶斯的性能,随机森林,支持向量机,和多项逻辑回归模型评估精度,ROC曲线下的面积,混淆矩阵。结果显示随机森林和逻辑回归更好的预测能力。后者显示航班延误、取消和航空公司的缺点对赔偿有负面影响。高于平均水平的薪酬是一个趋势在一些州,被道德损害授予客户更高薪酬的主要原因。

1介绍

航空运输行业,狭窄的利润率,取决于外部因素,不仅是在公司的控制,但也很难控制,如燃料的价格(Doganis 2019)。其他因素,如天气、航空基础设施、空中交通的问题,和意想不到的飞机维修,也可以阻碍航空业务。除了增加操作的复杂性,某些方面可能会产生额外费用的公司,如与诉讼成本,食品供应,运输援助,对乘客和住宿,因为失败的几率可能阻挠客户的期望(Gasparotto et al ., 2018)。

一些条件没有控制的公司,如气象学、研究de Oliveira et al。(2021)在运输途中,飞机和空中交通系统可以生成更多的诉讼。不得不取消航班的飞行安全是常见的。提供的服务提出了作为一个因素可以直接影响消费者的关系(Sezgen et al ., 2019;Lucini et al ., 2020)。客户满意度的最相关的方面之一是相关公司的守时,观察到Arora, Mathur (2020)。尽管巴西航空公司面临许多诉讼,他们的表现类似于美国,这是80%左右。非经营性位于萨玛拉州、空中交通强度和航班延误是诉讼的其他原因。简而言之,这些额外的成本与乘客大约3%的公司的总成本1

航空公司的低效率,解决冲突,保证赔偿,或诉讼在中国根深蒂固的文化有助于在巴西的问题。一些公司鼓励法律行动通过购买旅客获得补偿的权利。这些公司有助于抑制巴西航空的发展,法律可能会增加不确定性,减少外国企业经营的机会,减少竞争和影响票价。

根据Yadav和Goriet (2022),航空公司的性能受到外部因素的影响,如政治、经济和法律指令。遵守法律的成本是影响收入和性能的一个例子。讨论这个问题的难度也出现在中国的航空运输。王(2015)州有相关的一些法律问题。差异和争议了承运人的责任范围,责任固定原则,补偿相关法律规定的数量产生这些困难。

航空公司的责任是一个问题,超出了延迟和取消航班。它存在于事故和疾病。桃花心木(2021)法官解释说,有些情况下,建立了事故和航空公司的责任。然而,它需要事故之间的因果关系的存在和航空公司的过失。欧盟的法院2表明,航空公司可能会释放他们的赔偿义务如果他们证明取消或推迟是由于特殊情况超出了他们的实际控制,无法避免,即使已采取一切合理的措施。此外,固定费率的监管提供补偿。

在巴西,航空公司必须遵守规则的400号决议,2016年12月13日推荐的ANAC(国家民航机构)关于协助乘客。协助消费者的假设中列出解决类似于所表现出的不满的原因徐和李(2016)。如果不提供客户支持,它仍有可能求助于特殊民事法庭在一些巴西的机场。根据Sabo et al。(2021),这些法院使公民获得正义。解决冲突的另一种方法是直接通过联系该公司Consumidor.gov公共服务平台,解决消费公司纠纷考虑诉讼的最后措施。

航空运输的消费关系是受消费者保护代码(Sabo et al ., 2021)。本法建立消费者保护规则,比如获得司法和行政机关,以防止或修复属性和道德的破坏3。巴西的司法判决是基于这种法律,不影响国际条约中,巴西是一个政党,如蒙特利尔和华沙公约与国际航空运输有关。Non-etheless,法官仍困惑于一个或另一个规则的应用。

讨论法律行动在航空运输是复杂的,因为不同的国家法律、区域文化、条约,和司法。一些法官不承认这些法律,大多数乘客不知道他们的权利和义务。此外,很难找到数据很难获取信息、全国或国际。一般来说,客户和航空公司支付的补偿数据进行分类,使访问相关信息困难。

这项研究考虑了随机森林,支持向量机,朴素贝叶斯、和多项逻辑回归(高)模型来解决以下研究问题:什么是最相关的因素定义司法赔偿价值?时,模型具有最好的性能预测最后的赔偿?

随机森林使用装袋更换取样和随机选择的属性和变化原因引起树木,这使得它竞争与其他方法相比。它是闻名的预测能力。SVM允许用一个合适的核函数解决复杂的问题,这有助于有满意的结果如果使用适当的内核。此外,它可以处理数据库与相对较高的维度和嘈杂的数据。朴素贝叶斯提出假设的属性值是条件独立的,这让简单解决算法和更少的计算成本。尽管如此,它可以执行同样的神经网络和决策树在某些领域。多项式回归是划算的。它可以建立变量之间的关系,没有不同的结果,如果参考基础是另一个类别,并提供的方向(正面或负面)的变量之间的关系。这些模型是研究选择的一部分。

这些模型在文献中被广泛使用在几个领域,如推荐系统Rrmoku et al。(2022)、语音的检测Alaoui et al。(2022),道路交通事故Bokaba et al。(2022)、空气污染预测Kumar和潘德(2022)电动汽车的充电需求黛比和高(2022)、预测风险的无人驾驶飞机Truong和崔(2020),出租飞机航空需求的预测Rajendran et al。(2021)。性能结果评估基于混淆矩阵,准确性,ROC曲线下的面积,算法的处理时间。使用这些算法的原因是他们的表现显示在文学和计算成本。

适用的假设基于文献引用显示随机森林模型,作为一个整体和健壮的一个,可能是最好的方法来分类补偿值给定的属性出现在诉讼。基于数据库的知识,道德损害,北部地区,取消航班的主要因素是高赔偿。

本研究的主要贡献是突出主要因素导致客户采取法律行动,展示最影响补偿值。此外,它指出可能的假设不同的行为在每个巴西地区和礼物帮助成本预测的模型。这些知识帮助航空公司在预测诉讼费用,在策略来缓解该问题,证据的可能性在法庭上解决问题。这些方面的缺乏知识学术文献证明这部小说研究的执行。

本文的组织结构如下:第二节介绍de当前文学作品相同的技术应用。第三节描述了方法和数据库。在第4部分,5突出显示的结果和讨论,检查变量之间的关系。最后,第六节介绍了研究结论和局限性,和未来的工作的可能性。

2背景

知道不满的情况下处理客户和航空公司之间在世界不同地区的理解是至关重要的,往往缺乏或过剩的规定,没有定义具体行动。这使得司法的主体性和空间冲突解决缺乏标准化。另一方面,使用已知的和普遍的方法在各领域的知识,如机器学习模型,有助于对理解某些情况下有信心受到不好的影响探讨变量。因此,本节提出了文学,讨论主题相关的法律行动,航空公司的责任,研究表明机器学习技术的相关性。

2.1责任的航空公司

信息法律行动在航空运输是一个很大的困难,因为他们的机密性的话题。缺乏研究关于这个问题因为没有信息被收集。的一些研究航空公司在特殊情况下的责任。王(2015)调查涉及航空公司和乘客的冲突是如何在中国定居。几个法律治理国家的一些限制承运人的责任和其他人建立最低为乘客权利。困难是由于差异和争议的承运人的责任范围、责任固定原则,补偿相关法律规定的数量。这些方面是频繁的在巴西的情况。不同的解释的不同法律阻碍标准化问题。

Mazaheri和Basiri (2018)评估了航空公司的民事责任在国际和国家的水平。研究集中在延误造成的航空公司。Non-etheless,它不存在一个特定的定义。乘客很难在延迟要求适当的服务。由于缺少信息监管法律,乘客应该争取在伊朗法律诉讼体系。这可以覆司法。

Hipp (2019)旨在分析新形式的索赔管理公司的业务模式已经成功地建立了自己的市场。这是一个有趣的话题,因为什么原因导致这个数字在巴西与这些公司的诉讼。乘客不觉得损失时需要向管理公司支付的税收。他们仍然感觉得到,因为他们不希望钱。这些企业帮助通知消费者对他们的权利。

桃花心木(2021)试图回答这个航空公司责任的损害所引起的疾病在飞机和乘客的健康运营。根据华沙公约进行分析。有情况下,航空公司被认为是对事故负责。然而,这需要一个因果关系的发生事故和航空公司的过失。例如,如果航空公司不否认运输旅客展现COVID-19症状,它有责任,以防感染。

Yadav和Goriet (2022)列出几个因素影响航空公司的性能,主要和外部因素等。政治、经济和法律规定影响性能。作者发现和分析这些因素和航空公司经营业绩之间的关系。通过描述性调查数据收集。航空业的脆弱性是由目前由于法律环境的变化,和航空公司的性能可能会受到影响,如果外部因素不稳定或不可预测的。

上述研究表明,法律行动是一个复杂的问题。有几个因素影响的标准化解决方案对任何类型的诉讼。监管法律没有定义,另一个变量被法官的解释。可以看出,这些研究课题涉及的问题进行分析,但没有人调查的因素导致起诉其中的航空公司也导致高补偿。表1显示了研究的概述。

表1
www.雷竞技rebatfrontiersin.org

表1。一览表的回顾研究。

2.2机器学习方法的重要性在不同的知识领域

使用机器学习在许多领域的知识,比如交通、卫生、司法等。最近的研究使用文本挖掘分析用户评论在航空运输。Sezgen et al。(2019)Lucini et al。(2020)探讨了在线评论来自不同国家的航空运输客户和航空公司。尽管这些作品显示属性最可能引起乘客的不满,他们没有调查这些方面的影响导致航空公司,它是重要为他们创建的方法减少问题的相关性。

监督和非监督模式在司法领域经常使用。Sabo et al。(2021)使用聚类方法在司法判决获得航空运输的重要因素的信息,如服务失败。Lei et al。(2017)使用监督模型:朴素贝叶斯、支持向量机和随机森林分类文档的中国法院的判决。支持向量机是最准确的。朴素贝叶斯分类器可能显示潜在的文本分类好,准确性和计算效率优于其他分类模型,如决策树、神经网络和支持向量机,这取决于研究域(Ting et al ., 2011)。然而,这取决于缺乏变量之间的多重共线性,可以限制在某些情况下(Tsangaratos髂骨,2016)。

Yanying et al。(2019)应用NB、支持向量机、决策树(DT)和逻辑回归(LR)预测航班取消的可能性基于飞行时间,距离和其他变量。他们的研究显示更好的性能对DT和支持向量机,大约90%的准确率。因为NB的条件独立性假设,这个模型没有表现良好。施迈茨et al。(2021)NB和SVM模型用于分类空中旅行的趋势。支持向量机取得了最好的模型。他们将数据分成七个不同类别基于航空运输的文学。本研究的一个重要方面是平衡数据集类的问题,以避免任何偏见。

最近的研究对航空运输使用逻辑回归的情况下研究变量是二分。Negri et al。(2019)讨论了概率在机场登机手续,使用生物识别技术de Oliveira et al。(2021)研究了到达航班在巴西航空运输系统的性能由于气象的影响,Freitas et al。(2021)评估消费者体验与商业机构在巴西的机场。Savolainen et al。(2011)状态,当有三个或更多类型的分类目标类,可以使用逻辑回归多项式(高)。Lieshout et al。(2016)应用高估计水平,消费者可用的航空运输市场的竞争在欧洲。

小王和赫里克(2012)研究了鸟类在机场附近。空中作战,这可能是一个问题,因为它可能会导致延误,取消,和意外事故的潜在因素建立航空公司起诉。研究通过突出贡献因素最有可能导致机场鸟击附近使用高。Arora, Mathur (2020)应用高调查服务失败在美国航空公司使用信息从起源机场飞机起飞延误。

某些方面的证据质量的机器学习模型的性能比较与统计方法,如多项式回归。一个挑战当比较统计和机器学习模型是他们没有类似的解释能力(小王和罗斯,2018年)。然而,一些研究已经解决的主题来确定最好的方法在不同的情况下使用。来解决这个问题,Christodoulou et al。(2019)开发了一个系统的研究,分析几个作品进行对比逻辑回归和ML模型在医学临床学科。在研究中,90%的技术评估通过ROC曲线下的面积。

小王和罗斯(2018)比较极端的梯度增加(XGB)和推广模型模型的交通方式选择个人基于区域旅游数据集。这项研究是基于错误的多层次比较模型的预测性能。Rajendran et al。(2021)解决城市航空运输的问题,更确切地说,城市空气出租车。这项工作使用机器学习模型,如射频、梯度推进,高钙,人工神经网络具有连续和分类变量来预测这种运输方式的需求在纽约市。用于比较的技术是基于精度。

Shiran et al。(2021)解决交通事故严重性分析相比,使用人工神经网络和决策树技术高。目标是找到最好的模型符合事故严重性数据基于定性和定量变量。在模型、决策树模型在预测表现的更好,但高钙也提出了好的结果。重要的是要强调关注结果的可靠性高。该研究使用卡方检验、AIC和BIC测试来选择最重要的变量。此外,它显示了数据模型基于皮尔森的R2偏差计算,这使得它可以验证中使用的参数的模型是否相关。

尽管许多类型的研究评估与机器学习航空运输行业,缺乏信息有关的司法后果障碍引起客户对航空公司以及他们如何行动。因此,本研究旨在强调这个问题使用上述研究提出的模型为一个主题在这一领域。

3材料和方法

本部分提出了本研究中使用的方法。的步骤是基于USELEI过程描述Truong (2021)在他的作品中对航班延误和必要的修改。图1显示之后的步骤。点链接意味着下面的框中。例如,数据的预处理步骤是探索盒子。non-dotted链接步骤的顺序。例如,在理解问题、数据采样。

图1
www.雷竞技rebatfrontiersin.org

图1。流程图的步骤的方法。

3.1理解问题

诉讼的数量对巴西航空公司以来一直关注他们带来的成本大大增加。它代表的增加费用,为企业和消费者。司法化有关的数量对航空公司的诉讼由他们提供的服务。考虑到航空公司的数据是保密的,很难找到关于这个问题的文献信息。因此,确定问题的相关变量是基本的,因为它可以得到表达和现实的结果。

的因素存在于诉讼关闭他们和公司的相关知识。航空公司属性提供了足够的理解从乘客投诉它接收到的频率,这可能影响他们的最终决定取决于他们的观点。季节和年的属性允许航空公司了解诉讼期间的比例和评估值变化的补偿行为是否由于一些外部因素,如COVID-19大流行。此外,它允许识别和淡季月峰值之间是否存在差异。三个赛季出现在类别度假几个月在巴西(Dec-Feb和7月)。它代表了旺季,旅游,和淡季。所有这些信息帮助航空公司了解他们的客户。

该地区是一个重要的变量来理解整个巴西境内诉讼的行为。巴西是一个大陆国家,高度发达和欠发达地区,知道投诉的最高浓度,帮助航空公司采取客观地在这些地方。道德和财产损失提供知识的属性对乘客的赔偿,财产损失是否有更高的优势,可以弥补物质损失,还是决定道德损害是最突出的。知道了这一点,一些司法模式可能被用来关闭诉讼,允许航空公司之间建立政策和司法。

的原因,导致非常相关在这项研究中,为他们提供信息的主要因素顾客的投诉和问题的原因报告。知道什么是有害的客户允许航空公司开发方法重新获得他们的信任和定义成本更低的安排虽然了解真正的原因有助于开发内部程序减轻新问题。决策变量显示乘客的要求是否被认为是结束后的诉讼。

补偿值对应于由航空公司顾客价值补偿由于投诉提起的诉讼。对于每一个诉讼,法官的解释和不同的价值观。这个变量包含法律行动中,法官决定最终的数量或安排双方签署。的值被分为低、中、高类别来平衡它们的频率。因此,范围值指定为:R1000美元,00(美国200);R200年1000美元,00(美国)<我nline-formula id="inf1"> < <米我>e<米我>d<米我>我<米我>u<米我>米<米o> ≤ R 5美元000,00(美国1000);>R1000年5000美元,00(美国)。

表2显示变量及其频率,图2突出了飞行操作的数量的场景在巴西和诉讼。圆sub-figure C越大,越大的诉讼数量关于飞行操作。

表2
www.雷竞技rebatfrontiersin.org

表2。定性变量的模型。

图2
www.雷竞技rebatfrontiersin.org

图2(一)每个州——飞行操作(B)诉讼/状态-(C)标准化的数量比例的诉讼和飞行操作每个州。

3.2数据采集

收集的数据是由巴西航空公司提供。它包含信息诉讼在巴西的城市,从2007年1月到2021年9月。然而,在数据预处理阶段,本研究使用观察从2016年到2021年,因为之前有很多不完整的数据。数据库包括所有相关的变量出现在巴西的诉讼。抽样是基于最重要的变量来研究。数据库中的所有变量都饶有兴致,但一些属性有很多类别和删除算法由于强加的复杂性。

所需的数据研究开发从航空公司和他们的客户包含机密信息,是不可能向他们展示在这里。然而,所示的变量表2和3.1节中解释。

3.3数据探索

在应用模型,之前的预处理步骤包括清洗和整理所有分类属性的数据。所有的失踪,不正确的值被移除。清理数据,标准化的信息进行了一些步骤。某些类别与其他不同的写作包括在相同的意义。白色空间被移除,拼写错误被纠正,utf - 8编码是应用于文字。

法律行动对象分为两个属性:原因和原因。第一个显示的原因旅客对航空公司提起诉讼,和第二个代表因素导致客户报告的问题。例如,客户声称航班延误(原因),导致延迟是空中交通问题(原因)。

之后,数据库减少到约一百一十与平衡类观测目标属性:为每个类别约33%。标签和一个炎热的编码方法被用来预处理数据库应用于算法。他们将分类属性转换为虚拟变量为每个数据集的属性,删除任何数值的变量之间的关系(米隆et al ., 2021)。在Python中所有的预处理阶段。

3.4学习算法

采样和探索数据的步骤后,机器学习模型被应用到模型诉讼基于讨论的变量的问题。图3其次是应用模型显示了一般的步骤。的解释技术是如何工作的描述如下。

图3
www.雷竞技rebatfrontiersin.org

图3。一般步骤是在学习阶段。

机器学习任务可以分为预测和描述。第一个目标是找到一个函数,可以预测一个新的基于其输入属性的示例。这些算法遵循监督学习范式,因为训练的输出示例。第二个探索数据集和不知道输出属性,所以它是无监督学习(卡瓦略et al ., 2011)。

这项工作中所使用的数据集是由分类变量。一个炎热的编码变压器应用于预测属性,Rajendran et al。(2021)类别之间,因为没有订单,标签编码器变压器应用到目标属性。第一个将每个类别的属性转换成一个新的分类列和分配一个二进制值这一列,而第二个编码每个类别的目标变量的数值。

朴素贝叶斯分类器是一个监督算法基于贝叶斯推理应用到学习任务,每个实例都是描述一组属性值,目标函数可以假设任何值从一个给定的数据集(米切尔,1997)。它允许我们分类信息的一个实例,并将最可能的值分配给目标,给出的值属性,描述它。这个分类器依赖于先天的概率,P(y类的),可以计算的后验概率,P(y/x),这个类的一组属性x。使用贝叶斯定理,一个观察的概率y给定的一组属性x是由:

P<米fenced open="(" close=")"> y / x = P<米fenced open="(" close=")"> x<米o> / y P<米fenced open="(" close=")"> y P<米fenced open="(" close=")"> x ( 1<米o stretchy="false"> )

在哪里P(y)是先天的概率,P(x/y)的条件概率组属性类y,P(x)的概率是属性集。有一个假设之间的独立属性和作为P(x)是相同的所有类,这个因素可以忽略,这并不影响相关值的概率(卡瓦略et al ., 2011)。因此,情商。1可以这样写:

P<米fenced open="(" close=")"> y / x = P<米fenced open="(" close=")"> y <米o> = 1 n P<米fenced open="(" close=")"> x j / y ( 2<米o stretchy="false"> )

在哪里xj是j实例的属性。

支持向量机(SVM)是基于统计学习理论的一种分类器,帮助选择一个特定的分类器对于一个给定的数据集(卡瓦略et al ., 2011)。支持向量机的目标是找到一个前沿之间数据集的类将尽可能多的例子,最大化边界的距离,通过一个超平面最近的点更大的利润,也就是说,更大的类之间的距离。最接近的边界点被称为支持向量。硬边排序应用如果需要排序的所有实例定义的保证金外,否则使用软优势排序,集之间的平衡保持尽可能广泛的利润率和限制他们的漏洞(Geron 2019)。

对于不是线性可分的问题,它可以改变内核中使用支持向量机分类器的类型,如高斯和多项式内核。在多级数据集,是一个内部修改算法,允许多类分类分割成多个二进制分类。有两种方法:one-vs-rest(表达),将多级集分为几个二进制问题和使用的分类器,选择最有信心的模型;one-vs-one(蛋),也将多级集分为若干二进制的问题,但与表达,有类的组合。在这部作品中,蛋方法的应用。

随机森林分类器(RF)是几个随机生成的决策树模型,结合成一个数据集。根据卡瓦略et al。(2011)由装袋,它通常是训练方法,执行随机抽样的实例和更换(刘和Ozsu, 2018年)。简而言之,该算法选择一个特定的数据集的随机样本,每个样本构建决策树,每棵树,使预测;类的票数最高的决策树中变成了预测模型的类。

除了毫升技术,多项逻辑回归模型(高)。高是一个逻辑回归的因变量的变化超过两类。例如,它试图确定是否有更大的机会补偿值将是给定一个特定的地区。这个模型适合单独为每个响应类别对二元逻辑回归(长,弗里兹,2014年)。在这个模型中类型,分类结果的解释变量是不变的,但它们的参数随结果(古吉拉特人,2011)。本研究适用于高钙比较与前面讨论的机器学习模型的预测能力。下面将描述的步骤二元逻辑回归来演示这个过程计算的概率高模型中的变量,然后组织高。下面的方程是基于古吉拉特语(2011)的例子。

通常模型与两个解释变量和因变量可以写成:

Y = β 1 + β 2 X 2<米我>我 + β 3 X 3<米我>我 + u = β<米我米athvariant="bold"> X<米o> + u ( 3<米o stretchy="false"> )

在哪里Y的预测价值的例子吗,β的估计系数的拦截和独立变量X2X3分别为,u误差项。logit模型假定误差项的概率分布遵循物流根据概率分布古吉拉特语(2011),这是写在情商。4:

P = 1 1<米o> + e Z 1<米o> − P = 1 1<米o> + e Z ( 4<米o stretchy="false"> )

在哪里P是一个类别的概率,Z=βX+u。这种关系是非线性的。自然对数的比值P和1−P应用于变换成线性关系,称为优势比,根据情商。5

l = ln<米fenced open="(" close=")"> P 1<米o> − P = ln<米fenced open="(" close=")"> 1<米o> + e Z 1<米o> + e Z = ln<米fenced open="(" close=")"> e Z = β<米我米athvariant="bold"> X<米o> + u ( 5<米o stretchy="false"> )

因此,l(优势比的对数)有一个线性关系β′s参数和变量X。如果l是正的,当解释变量的值增加,类别的可能性增加;另一方面,如果l类别的是负的,发生的几率就会减少。

在高钙,可能有多个类,因此可以由情商的概率。6:

π <米我>j = e α j + β j X j<米o> = 1 n e α j + β j X ( 6<米o stretchy="false"> )

在哪里πij代表类别发生的概率j在这个例子中。在这种情况下,是不可能独立估计这些概率,所以它变成了常见的做法建立类别作为比较的基础,如情商所示。7类别1作为参考:

ln<米fenced open="(" close=")"> π <米我>j π <米n>1 = α j + β j X ( 7<米o stretchy="false"> )

j=1,…,n。这种关系表明类别j是首选的机会/类别1。如果估计系数是积极的,那么选择类别j /类别的可能性更大。

3.5评估和讨论的模型

模型的性能评估是基于综合指标用于研究,应用机器学习和多项逻辑回归,根据2.2节了。我意味着的符号模型的性能提出了机器学习技术和讨论。出于这个原因,混淆矩阵,准确性,ROC曲线下的面积,处理时间进行评估。另一方面,模型II意味着属性之间的关系进行了讨论。

混淆矩阵显示的数量为每个类别正确和不正确的预测。行代表实际的分类和预测的列(卡瓦略et al ., 2011)。它提出了一种评估模型的预测的质量。精度定义为总命中率的算法(卡瓦略et al ., 2011)。ROC曲线下的面积显示了分类器是否工作比一个随机的选择。模型的质量是由曲线下的面积(墨菲,2012)。除了性能措施,测试证据独立变量的影响(似然比检验),模型适合(卡方),并进行了多重共线性的高钙提供可靠性结果。

的整体讨论指标和测试提出了部分4和5。scikit-learn在Python和R语言被用来运行算法。的一些描述性的分析是在Microsoft Excel和PowerBI。

4结果和讨论:理解之间的关系属性

本研究的动机是确定如何因素是相互关联和影响的问题在巴西。这提供了洞察这个问题表现在巴西航空运输和如何帮助创建措施来缓解这个问题。讨论的结果是基于每个变量的意义,实践和理论。

在高,每个预测类别作为比较的基础,这是选择数据库中根据其最高频率(长,弗里兹,2014年)。每个变量的引用基础定义如下(变量、参考基地):[公司Cia2],[季节,淡季],[地区,东南(SE)],[道德损害,中值],[物质损失,低价值),原因,取消航班,原因,公司的错,决定,成立,(2020年)。

解释变量解释如下:公司,航空公司提供的数据;季节,分为旺季(12月至2月和7月),淡季(其他月份);年时期的诉讼;地区,巴西地区;道德损害和财产损失的赔偿范围的消费者为每种类型的损失,根据法院的判决;原因,表明给出的理由消费者起诉该公司移动;原因,表明根因素引起索赔的乘客;的决定,表明最终的决定是什么;如果找到,这意味着消费者取得了胜利。独立变量,赔偿,表明补偿支付给客户后法院判决或之后达成了一项协议。

模型结果讨论了基于实际和统计学意义的变量,这是重要的解释(古吉拉特人,2011)。此外,结果来自一个合身的模型,如图所示卡方,多重共线性和似然比测试。测试模型的可靠性和独立变量的影响,似然比检验之间进行完整的模型,预测,模型和拦截。零假设,H0,测试是否完成模型的估计系数等于零,<我nline-formula id="inf2"> β x = 0 ,除了拦截(长,弗里兹,2014年)。换句话说,它测试两种模型是否适合同样。表3显示了测试结果。因此,自p(公关(> Chisq))值小于0.001,H0被拒绝,也就是说,显著的影响研究结果表明,该模型预测的1%。完整的模型提供了一个改善健康的拦截单一模型。

表3
www.雷竞技rebatfrontiersin.org

表3。完整的,只有截距模型之间的似然比检验。

除了比较完整的模型和模型只有拦截,概率比值判别法进行了比较完整的模型与模型与一个不变量。例如,中情局与结果变量之间的比较完整的模型和模型的变量,变量中情局除外。这是用来确定自变量移除对模型具有重要的影响。根据p值,所有的独立变量有显著的影响在1%的性能模型。这意味着他们有助于解释补偿值。表4显示结果。

表4
www.雷竞技rebatfrontiersin.org

表4。似然比检验来确定预测变量的显著影响。

一个卡方拟合优度检验了在R知道模型符合预测的数据和验证值多项式回归不同于预期值。零假设,H0,国家没有区别(预测)和期望频率。如果H0被拒绝,推断,预测分类模型有一些困难。因此,表5,6目前的测试结果和频率,分别。结果确认的拒绝H0。以来的观察和期望频率有差异结果是显著的。这个事实可能会导致一个精确的模型和损失的减少对ML性能模型。

表5
www.雷竞技rebatfrontiersin.org

表5。卡方适合测试模型。

表6
www.雷竞技rebatfrontiersin.org

表6。预测和期望频率由航空公司支付赔偿范围值。

最后,方差膨胀因子(VIF)是一个测量,以避免高预测属性之间的相关性的问题。这个问题会导致错误或有偏见的预测。vif多重共线性的诊断很重要。vif大于10显示多重共线性问题。因此,模型结果可能不能充分解释因变量的行为蒙哥马利et al。(2021)

为分类变量和两个以上的水平,就可以知道是否有证据表明它们之间多重共线性的计算广义方差膨胀因子(GVIF)解释福克斯和Monette (1992)和解释计算GVIF(1 / (2*df))VIF是相同的方式。表7显示了GVIF预测属性的值。所有的方差膨胀值小于10,低于阈值。这意味着缺乏相关的变量,导致结果不被偏见。

表7
www.雷竞技rebatfrontiersin.org

表7。GVIF值。

通过测试结果,给出模型统计的鲁棒性。表8显示了高的结果。每个变量的系数,以及优势比,标准错误,z测试和p值(p≤0。01***,p≤0。05**,p≤0。1*)。补偿值的变量的影响分别解释为更好的清晰度。每个属性提高的理解方式不同。该公司展示了如果有大型航空公司之间的补偿值的差异。季节和年显示问题时更多的问题和帮助航空公司预计措施,减轻风险。

表8
www.雷竞技rebatfrontiersin.org

表8。高模型的结果。

诉讼的地区可以理解更多礼物。原因和导致诉讼中出现的突出的主要因素。补偿值非常受到道德和财产损失。了解这些有助于建立一个固定费率支付。决定显示的比例在巴西成立了诉讼。

4.1公司属性和季节

有重大影响的数据显示,一个公司会赔偿超过其他机会约为14倍赔偿中值。之一的公司可能存在的另一种方式补偿产生的扰动,如提供旅游券或协议。这些可以减少最终的补偿,根据法官的解释或当事人之间的协议。

本赛季的诉讼是似乎并不影响最终的赔偿支付给客户由于估计系数接近于零,其中只有一个是显著的。在此基础上,我们可以推断,司法判决不考虑是否有经验的问题是在旺季。结果显示没有季节性。重要的是干扰引起的类型,而不是当它发生。

4.2属性年

从2016年开始,不利判决的赔偿由航空公司支付高于2020年。然而,这并不意味着2020年由公司支付的货币总额低于在其他年份。这些信息表明,尽管诉讼的数量逐年增长,最终的赔偿一个不利的决定可能会降低。换句话说,2020年最低的赔偿诉讼关闭。有更多的机会在其他补偿值低于年。

这一事实可能是直接关系到COVID-19爆发于2020年在巴西。作为一种帮助企业在一般情况下,鉴于COVID-19引发的金融脆弱性,司法的判决变得更加吝啬的公司,由道德损失的减少观察授予客户。此外,尽管法律14034/2020,处理紧急措施民航由于COVID-19,只在2020年8月生效,它似乎已经帮助法官根据摘录补贴他们的判决2020年第二季度以来的文本。巴西航空专家支持这一事实。

4.3属性区域

分析巴西地区,很明显,航空公司支付的薪酬往往保持在同一水平相对于参考地区,东南自系数接近于零。唯一的例外是在北方地区的几率增加约1.45 times-statistically重要有一个高价值的最终赔偿一个媒介。

解释为什么这发生是一个复杂的任务。关于总延误和取消诉讼的比例大约是53% - -58%在所有地区。它排除了假设,在北方,有更多问题延误和取消,这可能增加诉讼的赔偿。可能预期,随着北方一些地区的航班频率低于东南较小的航空网络,因为航班取消或延误产生更大的影响乘客在北方的生活。它可以导致法官判决更高的道德伤害值来弥补客户减少。

可能,本地区低数量的航班是因为它在经济上是不可行的维持更频繁的操作,可以讨论与司法程序的年度成本和门票收入在地区的分析。在北部的一些州,诉讼成本高于其他人。它有一个更大的影响从门票销售收入。而不是帮助航空公司,这些地方可能伤害他们的财务状况。

4.4道德属性和财产损失

通过调查道德和财产损害赔偿,补偿的可能性高值在媒介的道德损害有关媒介道德增加106倍赔偿。相同的发生财产损失,虽然不是相同的程度。当财产损失高,补偿的可能性高值中增加的47倍而低财产损失的事件。据说可以推断总欠消费者越来越与道德法官判处的损害之间的关系。它符合法官的主观的假设是重要的补偿。此外,国家之间的差异可以解释为不同的道德损害值判断,即使诉讼的问题是相同的。

高优势比可能表明目标类的不平衡。然而,它并不与道德损害发生,从类别的频率中,对应于44%的数据,和高、低类别,分别为29%和27%。关于财产损失,有一个不平衡的类别:低频率高于85%,高不到1%,可能解释为什么优势比很高。

4.5属性的原因

当探索因素诱发乘客对航空公司提起诉讼,它是指出,如果有一个航班取消,补偿值高于其他原因。补偿值低的几率增加,高价值补偿减少与媒介相比的。航班取消的原因是这些解释的基础。例如,当比较航班改变航班取消,这是1.25倍支付较低的赔偿比介质的航班改变。

另一个因素,也有类似的可能性导致薪酬中值是一个航班延误,与重要的结果为10%。一般来说,如果它是一个机票的问题,支付更低的值更高的机会。重要的是要注意,分类的原因是一个复杂的问题。的乘客有一个视图问题,法官可能将它作为另一个的一部分,该公司甚至可以分类,不同于在司法文本。

4.6属性引起

关于真正的原因的原因导致了所谓的乘客,该公司的错误似乎是最大的问题。问题造成的航空公司相比,大多数的原因往往会增加低补偿的可能性。时的情况有问题维修(2 x更多的机会),空中交通(的可能性是后者的1.97倍),空气网络(1.72倍赔率)和不可抗力(的可能性是后者的1.61倍)。

然而,当失去行李的根源原因是所谓的乘客在诉讼中,支付的可能性中值较低的一个增加约2.27(1/0.44)时间相对于参考基础。这个结果在统计上显著的1%。因此,当因素不完全造成的问题是在航空公司的控制下,法院往往不为高值决定。虽然有赔偿公司的外部因素,他们的价值观往往是低的。

4.7属性决定

诉讼的决定时,哪个州获胜,部分成立,和不符合所有的客户投诉,赔偿是1.28倍的可能性很低。补偿的可能性较低的价值观也发生了毫无根据的诉讼。正如所料,航空公司不应该承担任何货币损失如果它在法庭上获胜。然而,如果在客户赢得诉讼,诉讼上诉后可能改革是没有根据的。在这些情况下,可能会有一些费用。此外,由于数据库是一个聚集法院判决的复杂的信息,它可能支付赔偿的证据,即使当事人的过程是没有根据的。

这个变量的结果是解释如下。关于高比值比(54.76),重要的是要注意,R的0.00美元(美国0.00)数量也在低价值范畴。,绝大多数是毫无根据的情况下零雷亚尔补偿,这是合理的,毫无根据的行为更有可能降低值。这么高的优势比的另一个原因可能是一个不平衡的属性决定。然而,每个类别的频率在18%和32%之间,不不平衡的特点。当诉讼决定其他闭包(义务,协议,凭证),中等赔偿的可能性增加。

5结果和预测模型的讨论

当没有平衡不对称类预测之间的数据集,通过精度测量模型的性能可能不是最好的选择(Geron 2019)。然而,在这项工作中使用的数据库,这些类有相同的比例平衡,使精度足够的指标来测量性能。

此外,Tsangaratos和髂骨(2016);努哥鲁和法赫米(2017);Sagala和王(2018);Van der海德et al . (2019);Yanying et al。(2019);Truong (2021)评估和其他指标的研究提出:混淆矩阵,它允许识别错误地预测类,和ROC曲线下的面积,这显示了类算法的分离。他们是重要的指标,使技术之间的比较。所有指标都与交叉验证评估,建议(卡瓦略et al ., 2011)。

所有的模型与5折交叉验证使用。这意味着数据样本峰分成5组。的GridSearchCV用于选择最佳hyperparameters每个模型。朴素贝叶斯模型,hyperparameter测试α、拉普拉斯平滑值8。LinearSVC,价值观的点球,损失、正规化(C)进行了测试,与12,铰链,和2.0,分别。在随机森林,树木的数量(n_estimators),质量指标(标准),最大树深度(max_depth)和最小数量的分歧的一个节点(min_samples_split)测试,1000年和价值观,基尼,12和图4,分别是最好的。

随着LinearSVC没有方法来计算每个类的预测概率,校准器的多级分类模型用于这个目的,CalibratedClassifierCV,从sklearn。在这个步骤之后,可以获得ROC曲线下的面积的价值。执行多项逻辑回归使用的默认参数multinom函数从nnet包r . relevel函数被用来为每个属性选择基线。多级。中华民国函数被用来计算roc曲线下的面积。

随机森林与one-vs-one SVM多类分类方法有最好的表现,83.1%和80.9%的准确性,分别,其次是朴素贝叶斯、76.6%。虽然不同于其他的研究领域,这些表现类似于发现结果(Tsangaratos髂骨,2016;Van der海德et al ., 2019;Patgiri et al ., 2020)模型。然而,他们不同的结果et al。(2011)王et al。(2019)和Yanying et al .(2019)的支持向量机。这可能是由于不同的调优hyperparameters以及使用的数据集。重要的是要注意,NB假设条件独立的属性,可能影响结果。表9显示了每个模型的性能指标的值。

表9
www.雷竞技rebatfrontiersin.org

表9。机器学习模型的性能。

概率曲线下的面积表示的模型可以区分不同的类(墨菲,2012)。其中,随机森林是最好的区分能力。朴素贝叶斯分类器有一个值为91.4%,类似的结果Tsangaratos和髂骨(2016)分类显示它的力量,尽管它没有伟大的准确性。

支持向量机模型是最严重的ROC曲线下的面积。虽然比NB更精确,它不区分一个类从另一个在做预测。关于处理时间,数据分析的一个重要因素,注意是在最短的时间内处理,因为它很简单,与其他技术相比,支持向量机和射频紧随其后,与之前的工作相一致et al。(2011),Tsangaratos和髂骨(2016),Lei et al。(2017)。使用的计算机处理器的特点是:戴尔玩家,16 gb的RAM,英特尔(R) (TM)核心i7 - 7700总部CPU 2.80 ghz,使用所有可用的内核。

用另一种方式来评估模型的质量是显示数据的分布到实际的类和预测类。在表10混淆矩阵,提出了一种方法来评估分类器的性能,允许哪些类是正确的分类(Geron 2019)。因此,信息处理这项工作表明,随机森林模型可以更准确地预测类的赔偿在中、低类,和一个更大的类高值的预测误差。反过来,支持向量机能够更好地预测类较低的值,用一个更大的错误在中值的类别。

表10
www.雷竞技rebatfrontiersin.org

表10。混淆矩阵的机器学习模型。

值得注意的是,诉讼在航空运输的问题是复杂的,因为它取决于一些主观因素,如法官的观点在句子和特定情况下的乘客,他们可能有不同的补偿值。因此,没有方法达到完美的精度问题的特殊性。

这项工作的目标之一是比较机器学习模型和多项式回归模型,有必要比较相关的度量标准。因此,他们选择了文学的基础上Christodoulou et al。(2019),冯et al。(2019)Itoo et al。(2021)。的准确性和ROC曲线下的面积使用多层次模型。表11,12显示,指标和混淆矩阵,分别。

表11
www.雷竞技rebatfrontiersin.org

表11。多项逻辑回归模型的性能。

表12
www.雷竞技rebatfrontiersin.org

表12。混淆矩阵的多项式回归。

性能通过多项逻辑回归模型值与RF, SVM和NB模型的准确性,AUC民国,混淆矩阵。高执行比SVM和NB,结果接近射频。根据先前的研究Christodoulou et al。(2019)临床领域,这项工作的结果还表明,机器学习模型的性能并没有被证明是优于多项式逻辑回归模型的性能。它是相关的,因为高模型可以应用于不同类型的数据集和一个伟大的性能和更少的计算能力。

虽然有些毫升模型更准确,如梯度推动和支持向量机,逻辑回归模型与各种毫升技术性能,有良好的预测能力,根据小王和罗斯(2018)冯et al。(2019)。相比之下,性能优越的文献指出机器学习在逻辑回归模型,如的工作Rajendran et al。(2021)指标的基础上精度,回忆,F1-score。因此,它可以推断没有最好的模型,因为它取决于数据集问题的解决。

这个模型是开发和支持的统计检验在第六节所讨论的,这个工作可靠证据的相关性分析的数据库分类变量。因此,似乎因素最能影响最终的赔偿是道德的破坏。乘客的原因和问题的原因似乎并不一样有效的道德上的损害赔偿。北方地区提供证据,表明提高法院的命令的值,和2020年公开的后果大流行在关闭的情况下,较低的补偿更温和的句子。

6结论

这项工作解决司法化在航空运输的问题。机器学习和多项逻辑回归方法用于诉讼数据从巴西的航空公司。根据所使用的方法和描述图1,可以理解问题和执行的必要步骤以获得结果。

通过分析预测模型研究问题是充分回答和讨论的变量之间的关系。以来的目标也成功实现结果考虑航空运输行业专家的意见,统计的鲁棒性,这证实了提出的假设为每个变量,保证结果的可靠性。

关于机器学习模型,随机森林的最佳性能,具有相似的价值观多项逻辑回归。尽管不是最好的技术,高钙被证明是重要的分类分类数据集。支持向量机和NB技术有一个较低的性能。虽然RF是最准确的,其处理时间是非常高的,这可能是一个缺点,如果计算能力是有限的。高成本效益最好的比例。

提供的高基本推断变量之间的关系。结论是,航空公司补偿不同。本赛季当服务出现故障不影响补偿值。尽管2020年高的司法需求,是今年提出的最低补偿价值。这个事实可能与COVID-19大流行。

道德的价值损失是大多数影响最后的补偿。主体性的解释是一个方面,可以进一步讨论自判断参数可能会有所不同从法官和地方。北方地区表现出不同的行为的巴西,朗多尼亚州的影响,最高赔偿。它主要是由于法官的判决以来服务失败的理由和原因,状态类似于他人。当客户端没有他的整个索赔,即过程的一部分是毫无根据的,补偿支付的航空公司往往是低,如预期。

澄清的限制是很重要的工作。第一个是很难与他人比较结果以来的文学主题是一点一点研究,学术信息。的原因之一是在商业航空咨询专家来锚定结果与实践。此外,由于限制包含在巴西通用数据保护法(LGPD),变量与乘客信息不能被收购,从而影响算法的性能,防止客户之间的基本解释和赔偿。

另一个限制方面的差异原因的分类和原因属性由每个航空公司,这会影响算法的性能。类似的事件可能是创建数据库时作出不同的解释。描述的预处理步骤图1试图尽可能地规范这个问题。最后,大流行时期可能已经改变了法官的批判,增加差异和创建在分析期间不一致。

在未来的工作中,拟构建模型可以估计客户提起诉讼的可能性及其可能的补偿值。它可能帮助航空公司创建更有效的策略来解决问题或减少他们的财务影响。其他机器学习技术的应用,如神经网络,可以提高预测精度。最后,分析短期和航空公司分别可以达到更一致的结果。这项工作贡献的科技文献提供讨论巴西航空市场的一个基本问题,提出相关的预测模型之间的比较,并引入学术知识有关的问题。

数据可用性声明

本文中给出的数据集是没有现成的,因为数据集来自巴西的航空公司,它是保密的。不可能分享它们。请求访问数据集应该指向GT,gabrielot4@gmail.com

作者的贡献

GT是首席研究员;他领导写的情况下,应用程序的模型和解释结果;VC了数据采集的联系人,负责分析模型的鲁棒性;MG是负责审查书面文章,提出的模型分析问题;所有的合作者了讨论和手稿编辑。所有作者回顾了结果,批准了最终版本的手稿。

确认

我们承认美国航空公司提供的数据在巴西航空市场和法律行动ABEAR调节交流。

的利益冲突

作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。

出版商的注意

本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。

脚注

1https://www.gov.br/anac/pt br/assuntos/dados交通- e - estatisticas/mercado -做- - - - aereo/painel - de - indicadores -做-内在aereo/painel - de - indicadores -做-内在aereo - 2020

2https://curia.europa.eu/jcms/upload/docs/application/pdf/2019 05/qd - 04 - 17 - 650 - en - n.pdf

3http://www.planalto.gov.br

引用

Alaoui, S。,Farhaoui, Y., and Aksasse, B. (2022). Hate speech detection using text mining and machine learning.在t。j .决策。支持系统。抛光工艺。(IJDSST)14日,1 - 20。doi: 10.4018 / IJDSST.286680

CrossRef全文|谷歌学术搜索

Arora, s D。,米athur, S. (2020). Effect of airline choice and temporality on flight delays.j。空气透明。等内容。86年,101813年。doi: 10.1016 / j.jairtraman.2020.101813

CrossRef全文|谷歌学术搜索

Bokaba, T。,Doorsamy, W., and Paul, B. S. (2022). Comparative study of machine learning classifiers for modelling road traffic accidents.达成。科学。12日,828年。doi: 10.3390 / app12020828

CrossRef全文|谷歌学术搜索

卡瓦略,。Faceli, K。罗瑞拉,。,Gama, J. (2011).在teligencia人工——乌玛abordagem de aprendizado de关系变化。里约热内卢:LTC

谷歌学术搜索

Christodoulou E。,妈,J。,Collins, G. S., Steyerberg, E. W., Verbakel, J. Y., and Van Calster, B. (2019). A systematic review shows no performance benefit of machine learning over logistic regression for clinical prediction models.j。中国。论文。。110年,12日至22日doi: 10.1016 / j.jclinepi.2019.02.004

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

de Oliveira M。,Eufrásio, A. B. R., Guterres, M. X., Murça, M. C. R., and de Arantes Gomes, R. (2021). Analysis of airport weather impact on on-time performance of arrival flights for the brazilian domestic air transportation system.j。空气透明。等内容。91年,101974年。doi: 10.1016 / j.jairtraman.2020.101974

CrossRef全文|谷歌学术搜索

Deb, S。,Gao, X.-Z. (2022). Prediction of charging demand of electric city buses of helsinki, Finland by random forest.能量15日,3679年。doi: 10.3390 / en15103679

CrossRef全文|谷歌学术搜索

Doganis, r (2019)。飞课程:航空经济学和市场营销。纽约:劳特利奇

谷歌学术搜索

冯,J.-z。王,Y。彭,J。,Sun, M.-w., Zeng, J., and Jiang, H. (2019). Comparison between logistic regression and machine learning algorithms on survival prediction of traumatic brain injuries.j。暴击。护理54岁,110 - 116。doi: 10.1016 / j.jcrc.2019.08.010

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

福克斯,J。,米onette, G. (1992). Generalized collinearity diagnostics.j。统计协会。87年,178 - 183。doi: 10.1080 / 01621459.1992.10475190

CrossRef全文|谷歌学术搜索

Freitas, p . T。席尔瓦,l . M。,Nascimento, M. V., and Borille, G. M. (2021). Passenger profile and its effects on satisfaction level in food and beverage establishments: Case study of major brazilian airports.螺柱。透明。政策9日,1219 - 1224。doi: 10.1016 / j.cstp.2021.06.009

CrossRef全文|谷歌学术搜索

Gasparotto, l·S。帕切科,n。低音部,K。,Corte, V. F. D., Rabello, G. C., and Gallon, S. (2018). The role of regulation and financial compensation on trust recovery.Australas。马克。J。26日10到16。doi: 10.1016 / j.ausmj.2018.01.002

CrossRef全文|谷歌学术搜索

杰龙(2019)。Obra为人物形象:Aprendizado de变化com Scikit-Learn & TensorFlow。1。里约热内卢:阿尔塔的书

谷歌学术搜索

古吉拉特语,d . n . (2011)。计量经济学的例子1。纽约:帕尔格雷夫麦克米伦

谷歌学术搜索

Hipp, c (2019)。“航空客运的执法权利:最近声称管理公司的分析和比较,建立调解机构,”欧亚业务视角(柏林:施普林格),341 - 353。

CrossRef全文|谷歌学术搜索

Itoo F。,米eenakshi, , , and Singh, S. (2021). Comparison and analysis of logistic regression, naïve bayes and knn machine learning algorithms for credit card fraud detection.在t。j . Inf,抛光工艺。13日,1503 - 1511。doi: 10.1007 / s41870 - 020 - 00430 - y

CrossRef全文|谷歌学术搜索

Kumar K。,P和e,B. (2022). Air pollution prediction with machine learning: A case study of indian cities.在t。j .包围。科学。抛光工艺。硕士论文。doi: 10.1007 / s13762 - 022 - 04241 - 5

CrossRef全文|谷歌学术搜索

Lei, M。,Ge, J., Li, Z., Li, C., Zhou, Y., Zhou, X., et al. (2017). “Automatically classify Chinese judgment documents utilizing machine learning algorithms,” in国际会议上先进的应用程序的数据库系统(柏林:施普林格),3 - 17。doi: 10.1007 / 978 - 3 - 319 - 55705 - 2 _1

CrossRef全文|谷歌学术搜索

Lieshout, R。,米alighetti, P., Redondi, R., and Burghouwt, G. (2016). The competitive landscape of air transport in Europe.j。透明。Geogr。50岁,68 - 82。doi: 10.1016 / j.jtrangeo.2015.06.001

CrossRef全文|谷歌学术搜索

刘,L。,Özsu, M. T. (2018).百科全书的数据库系统。2。柏林:施普林格

谷歌学术搜索

长,j·S。,Freese, J. (2014).回归模型的分类使用占据因变量。德州3:占据新闻

谷歌学术搜索

Lucini, f R。,Tonetto, L. M., Fogliatto, F. S., and Anzanello, M. J. (2020). Text mining approach to explore dimensions of airline customer satisfaction using online customer reviews.j。空气透明。等内容。83年,101760年。doi: 10.1016 / j.jairtraman.2019.101760

CrossRef全文|谷歌学术搜索

Mazaheri, S。,Basiri, Z. (2018). Civil liability of air carrier in delays.j。Hu米anit。的见解2,67- 75。doi: 10.22034 / JHI.2018.64941

CrossRef全文|谷歌学术搜索

米隆,M。,Tolan, S., Gómez, E., and Castillo, C. (2021). Evaluating causes of algorithmic bias in juvenile criminal recidivism.Artif。智能。法律29日,111 - 147。doi: 10.1007 / s10506 - 020 - 09268 - y

CrossRef全文|谷歌学术搜索

米切尔,t m (1997)。机器学习。1。纽约:麦格劳-希尔

谷歌学术搜索

蒙哥马利,d . C。派克,大肠。,Vining, G. G. (2021).介绍线性回归分析约翰威利& Sons

谷歌学术搜索

墨菲,k p (2012)。机器学习:概率的角度来看。伦敦:麻省理工学院出版社

谷歌学术搜索

Negri: a。R。,Borille, G. M. R., and Falcão, V. A. (2019). Acceptance of biometric technology in airport check-in.j。空气透明。等内容。81年,101720年。doi: 10.1016 / j.jairtraman.2019.101720

CrossRef全文|谷歌学术搜索

努哥鲁,一个。,Fahmi, R. A., and Ali Fahmi, R. (2017). On-time flight departure prediction system using naive bayes classification method (case study: Xyz airline).在t。j .第一版。抛光工艺发展趋势。54岁的4到10。doi: 10.14445 / 22312803 / IJCTT-V54P102

CrossRef全文|谷歌学术搜索

Patgiri, R。,Hussain, S., and Nongmeikapam, A. (2020). Empirical study on airline delay analysis and prediction.arXiv预印本)doi: 10.48550 / arXiv.2002.10254

CrossRef全文|谷歌学术搜索

Rajendran, S。,Srinivas, S., and Grimshaw, T. (2021). Predicting demand for air taxi urban aviation services using machine learning algorithms.j。空气透明。等内容。92年,102043年。doi: 10.1016 / j.jairtraman.2021.102043

CrossRef全文|谷歌学术搜索

Rrmoku, K。,Selimi, B., and Ahmedi, L. (2022). Application of trust in recommender systems—Utilizing naive bayes classifier.计算10日,6。doi: 10.3390 / computation10010006

CrossRef全文|谷歌学术搜索

Sabo i C。,Dal Pont, T. R., Wilton, P. E. V., Rover, A. J., and Hübner, J. F. (2021). Clustering of brazilian legal judgments about failures in air transport service: An evaluation of different approaches.Artif。智能。法律1,21-57。doi: 10.1007 / s10506 - 021 - 09287 - 3

CrossRef全文|谷歌学术搜索

Sagala: t M。,王,J。-H. (2018). “A comparative study for classification on different domain,” in学报》2018年第10届国际机器学习大会和计算,Nashik,2015年1月13日1。doi: 10.1145/3195106.3195129

CrossRef全文|谷歌学术搜索

Savolainen, p . T。,米annering, F. L., Lord, D., and Quddus, M. A. (2011). The statistical analysis of highway crash-injury severities: A review and assessment of methodological alternatives.Accid。分析:。43岁,1666 - 1676。doi: 10.1016 / j.aap.2011.03.025

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

施迈茨U。,R我ngbeck, J., and Spinler, S. (2021). Door-to-door air travel: Exploring trends in corporate reports using text classification models.抛光工艺。预测。Soc。改变170年,120865年。doi: 10.1016 / j.techfore.2021.120865

CrossRef全文|谷歌学术搜索

Sezgen E。,米ason, K. J., and Mayer, R. (2019). Voice of airline passenger: A text mining approach to understand customer satisfaction.j。空气透明。等内容。77年,65 - 74。doi: 10.1016 / j.jairtraman.2019.04.001

CrossRef全文|谷歌学术搜索

Shiran G。,Imaninasab, R., and Khayamim, R. (2021). Crash severity analysis of highways based on multinomial logistic regression model, decision tree techniques, and artificial neural network: A modeling comparison.可持续性13日,5670年。doi: 10.3390 / su13105670

CrossRef全文|谷歌学术搜索

桃花心木,a (2021)。航空公司的责任赔偿和航空客运的健康状况。:事故和疾病(Covid-19)。挂。j .腿。钉。61年,85 - 112。doi: 10.1556 / 2052.2020.00002

CrossRef全文|谷歌学术搜索

Ting, s . L。、Ip, w . H。,Tsang, A. H. C. (2011). Is naive bayes a good classifier for document classification.在t。j . Softw。Eng。它的达成。5,37-46。

谷歌学术搜索

Truong D。,Choi, W. (2020). Using machine learning algorithms to predict the risk of small unmanned aircraft system violations in the national airspace system.j。空气透明。等内容。86年,101822年。doi: 10.1016 / j.jairtraman.2020.101822

CrossRef全文|谷歌学术搜索

Truong, d . (2021)。使用机器学习因果预测在航空运输航班延误的风险。j。空气透明。等内容。91年,101993年。doi: 10.1016 / j.jairtraman.2020.101993

CrossRef全文|谷歌学术搜索

Tsangaratos, P。,Ilia, I. (2016). Comparison of a logistic regression and naïve bayes classifier in landslide susceptibility assessments: The influence of models complexity and training dataset size.系列145年,164 - 179。doi: 10.1016 / j.catena.2016.06.004

CrossRef全文|谷歌学术搜索

海德,Van der E。Veerkamp, R。Van Pelt, M。Kamphuis C。,Athanasiadis, I., and Ducro, B. (2019). Comparing regression, naive bayes, and random forest methods in the prediction of individual survival to second lactation in holstein cattle.j。乳品科学。102年,9409 - 9421。doi: 10.3168 / jds.2019 - 16295

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

王,F。,Ross, C. L. (2018). Machine learning travel mode choices: Comparing the performance of an extreme gradient boosting model with a multinomial logit model.透明。研究矩形。2672年,35 - 45。doi: 10.1177 / 0361198118773556

CrossRef全文|谷歌学术搜索

王,J。,Herricks, E. E. (2012). Risk assessment of bird–aircraft strikes at commercial airports: Submodel development.透明。研究矩形。2266年,78 - 84。doi: 10.3141 / 2266 - 09年

CrossRef全文|谷歌学术搜索

王,l . (2015)。应用有关航空运输中华人民共和国的法律诉讼:在未来我们应该做什么?北京l .牧师。6,125- 132。doi: 10.4236 / blr.2015.62013

CrossRef全文|谷歌学术搜索

王,W。,Chu, X., Jiang, Z., and Liu, L. (2019). “Classification of ship trajectories by using naive bayesian algorithm,” in2019年第五届国际交通信息与安全会议(icti),利物浦,2019年7月14日至17日(IEEE),466 - 470。doi: 10.1109 / ICTIS.2019.8883562

CrossRef全文|谷歌学术搜索

徐,X。,l我,Y。(2016)。检查旅客不满航空服务失败的关键因素:文本挖掘的方法。j。供应链操作等内容。14日,30 - 50。

谷歌学术搜索

Yadav, d K。,Goriet, M. O. (2022). An illustrative evaluation of external factors that affect performance of an airline.j。Aerosp。抛光工艺。等内容。14。doi: 10.1590 / jatm.v14.1253

CrossRef全文|谷歌学术搜索

Yanying Y。密苏里州,H。,Haifeng, L. (2019). A classification prediction analysis of flight cancellation based on spark.Procedia第一版。科学。162年,480 - 486。doi: 10.1016 / j.procs.2019.12.014

CrossRef全文|谷歌学术搜索

关键词:航空运输,航空公司诉讼,机器学习,多项逻辑回归

引用:托雷斯GdO,古特雷斯MX和Celestino VRR(2023)在巴西航空运输法律行动:机器学习和多项逻辑回归分析。前面。未来的透明。4:1070533。doi: 10.3389 / ffutr.2023.1070533

收到:2022年10月15日;接受:2023年1月17日;
发表:2023年4月17日。

编辑:

Gustavo阿隆索西班牙,马德里理工大学

审核:

费尔南多·戈麦斯Comendador西班牙,马德里理工大学
罗莎Arnaldo西班牙,马德里理工大学
安东尼奥Comi意大利罗马大学Tor Vergata

版权©2023托雷斯,古特雷斯Celestino。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

*通信:加布里埃尔de Oliveira托雷斯gabrielot4@gmail.com

下载