跳转到主要内容

原始研究的文章

前面。Artif。智能。,22May 2023
秒。人工智能在金融领域
卷6 - 2023 | https://doi.org/10.3389/frai.2023.1177702

一个案例研究在资产负债管理发挥深度学习的潜力

托马斯Krabichler 1约瑟夫摄影师2 *
  • 1银行和金融中心东瑞士大学的应用科学,瑞士圣加伦
  • 2随机金融集团,苏黎世联邦理工学院,苏黎世瑞士

深度学习的广泛应用领域的定量风险管理仍然是一个相对较新的现象。本文介绍了深资产负债管理的关键概念(“深ALM”)技术改造管理资产和负债的期限结构。有深远的影响的方法广泛的应用,如财务人员最优决策,优化采购商品或水电站的优化。基于目标的副产品,有趣的方面投资或资产负债管理在抽象(ALM)紧急一起预计我们的社会的挑战。我们在程式化的说明方法的潜力。

1。介绍

反对固定和浮动价格之间不匹配以及整个期限结构在各种业务领域无处不在,提高大量的商业风险。已经卑微的方法导致分析棘手的数学模型包括了高维约束分配问题的存在摩擦。这种障碍常常会导致过度简化建模(仍然需要复杂的技术),发现风险或监督的机会。惊人的成功的深度学习在语言处理技术,图像识别,从白板学习游戏,或风险管理,只是仅举几例,激发我们的想象力资产负债管理(ALM)可能会进入一个新时代。这部小说的方法,简要地表示“深切ALM”,提出了一个巨大的数学研究领域问题如可行性、健壮性、模型固有风险和夹杂物的所有经济方面。如果我们回答这些问题,这可能改变ALM完全实践。

ALM是一个研究课题,可以追溯到上个世纪的年代当马丁·l·莱博维茨和其他人开发的现金流匹配方案的上下文中所谓的专门的投资组合理论;看到法博齐et al。(1992)。在20世纪八九十年代,ALM是一个集中在社区的数学研究课题研究。这种一致重要分支的定量风险管理一直由技术主导随机控制理论;例如,看到Consigli和法官(1998)由乔治•Consigli和迈克尔·a·h·法官或Frauendorfer和Schurle (2003)由卡尔Frauendorfer和迈克尔Schurle文章利用动态规划。在进一步的方面的历史演进瑞安(2013)罗纳德·j·瑞恩。然而,已经过度简化建模涉及高复杂性分析和技术观点。在这方面是一个基石Kusy和Ziemba (1983)由马丁·i Kusy和威廉·t·Ziemba。他们认为一个相当先进和灵活的ALM模式通过指定一个经济目标(例如,未来利润的现值最大化),一系列的约束(例如,监管要求和流动性保障)和罚款费用约束违反。

普遍的方法应用于完全免疫等行业对收益率曲线平行转移自己一直不佳,直到这一天;例如,看到斯皮尔曼et al。(2019)马丁·斯皮尔曼卡斯滕Dohnert,罗杰Rissi最近博览会。特别是,实证方法与静态复制的4.2节中描述的组合斯皮尔曼et al。(2019)常应用于中等规模的零售银行。尽管压力情景的影响调查的监管要求,整体投资和风险管理过程,许多财政部门仍然是不够的。更复杂的方法,比如实例option-adjusted传播模型(例如,明白了Bardenhewer 2007由马丁·m·Bardenhewer),并没有成为金融行业建立了。因此,尽管有很多成就,它是公平地说,ALM并没有完全履行其很高的期望。

新鲜的方法深对冲由汉斯·布勒公司、卢卡斯Gonon约瑟夫摄影师,Ben Wood(见布勒公司et al ., 2019)可能为一种定量风险管理的新时代。很明显,古典然而分析棘手的问题可以解决ALM技术受到很深的强化学习的一个潜在的马尔可夫链的结构;看到格拉汉姆·古德费勒et al。(2016)由伊恩·格拉汉姆·古德费勒Yoshua Bengio,亚伦考维尔的深入学习和全面概述萨顿和Barto (1998)理查德·s·萨顿和安德鲁·g·Barto介绍强化学习。强化学习在游戏中发现许多应用程序(例如,看到银et al ., 2018谷歌的一个研究小组DeepMind),机器人(例如,见科比et al ., 2013Jens科比j·安德鲁Bagnell, Jan Peters)和自动车辆(如,看到Kiran et al ., 2020法雷奥的联合出版和学术合作伙伴)。最近的专著对机器学习金融应用程序洛佩斯·德·普拉多(2018)马科斯·洛佩兹·德·普拉多和迪克森et al . (2020)马修·f·迪克森,伊戈尔·霍尔柏林和保罗Bilokon。关于应用神经网络用于套期保值和价格,大约200个研究文章积累了过去30年;革命联合阵线和王(2019)由约翰Ruf和围观王提供了一个全面的文献综述。只有少数这些文章利用强化学习范式。与这种显而易见的应用深度ALM强化学习,深ALM套期保值方法更简单,但仍为业务决策提供相关的解决方案。不过,请注意,既不需要马尔可夫过程的假设,也值函数或动态规划原则:深ALM只会提供一个人工asset-liability-manager人正是解决业务问题(而不是更多)以令人信服的方式,即。提供了ALM策略以及预定义的未来情景和压力场景。的基本思想将进一步阐述了下面的部分。我们所知,我们是第一个解决ALM系统用很深的套期保值方法。

有许多基本问题数学金融学无法接受明确的解析公式。作为模范地,显式美式期权定价公式在连续时间还未知如Black-Scholes-framework即使在最简单的设置。这是难以置信的,大多数交易所交易期权的美国风格。真正的随机模型中最优停止问题涉及所谓的抛物型积分微分不等式,它可以通过经典数值近似方法三个维度;例如,请参见10.7节Hilber et al。(2013)。维度的诅咒阻碍经典有限元方法应用的可行性涉及超过三个风险驱动程序。与今天的计算能力的多核笔记本电脑,运行时在六个维度将持续几个世纪。一个受欢迎的规避是基于回归最小二乘蒙特卡罗方法提出的弗朗西斯·A·龙斯达夫和爱德华多·s·施瓦兹;看到龙斯达夫和施瓦茨(2001)。一些统计学家甚至认为机器学习(非线性)的泛化回归技术。机器学习因此就引入了另一个Longstaff-Schwartz-algorithm回归基础。作为一个例子的成功是通过塞巴斯蒂安·贝克尔,帕特里克·Cheridito和阿努尔夫Jentzen时利用深层神经网络多达500维的美式期权价格低于10分钟;看到贝克尔et al。(2019)为进一步的细节。深陷ALM我们甚至离开了通常的(和经典非常有用)值函数的方法,也应用于Longstaff-Schwartz-algorithm,但我们马上走的最优交易策略是一个先天完全未经训练的每个时间点(随着时间的推移和无关)。结果一个是被迫放弃的基本欲望直接解决一个非常复杂的数学方程式,必须批准范式转变的深度学习原则:“一个聪明的,通用的,经验丰富和non-forgetful人工金融代理一个像样的风险偏好做了什么?“这改变的心态打开房间的许多可能性不仅定量金融学。计算非常密集的技术,如嵌套蒙特卡罗变得过时了。我们的目标是利用这些进步来解决问题,制定的年代,例如,由马丁·i Kusy和威廉·t·Ziemba(见Kusy Ziemba, 1983),仍未解决的期望程度的复杂性。因此,金融行业的深度ALM技术的影响可能是相当大的。

马尔可夫假设,大致说来,未来状态只取决于当前状态而不是过去,通常会导致相对容易处理的金融模型和相应算法。现实世界金融时间序列通常特性杠杆效应(即。,一个relationship between the spot and the volatility) and a集群效应(即。,一个per年代我年代tenceof low and high volatility regimes). Unless volatility becomes a directly traded product itself (which generally is not the case) and is perceived as an integrable part of the state, an effective hedging strategy can hardly be found analytically. This can be analyzed within the concept of柏拉图式的金融市场介绍了在Cuchiero et al。(2020)Christa Cuchiero,艾琳•克莱因和约瑟夫摄影师。一般可观测事件和决策过程是适应严格的整个市场subfiltration过滤所产生的模糊的市场动态。这个概念类似的方向隐马尔可夫模型;例如,看教科书艾略特et al。(1995)由罗伯特·j·艾略特,Lakhdar Aggoun, John b .摩尔的参考。关于深ALM,这种固有的棘手的柏拉图式的金融市场并不是一个障碍。当然,复制组合在一个训练有素的深层神经网络通常只依赖于可观察状态。然而,金融市场动态并没有满足任何Markovianity限制对可观测状态和/或交易的产品。深层神经网络共同学习适应的定价和套期保值策略的存在市场的不完全性甚至模型不确定性;例如,看到El Karoui和Quenez (1995)在妮可El Karoui和玛丽Quenez阿et al . (1995)马可·阿,利维亚,和安东尼奥·帕拉斯为进一步的细节。较小的过滤或不确定性可以创造的框架部分可观测性,可嵌入马尔可夫链的框架在推动价格维度对无穷。深ALM方法绕过这一步,而是直接写策略以灵活的方式观察的可训练的功能。除了这些部分可观测性的描述方面,也摩擦,如交易成本或价格的影响,在深ALM很容易治疗。因此,深ALM结合关键要素数学金融学的基本用例和它首次允许一个容易处理的框架与完全现实的假设。

必不可少的先决条件的可行性深ALM财政部是想出一个足够丰富的宏观经济环境和市场风险等bank-specific数量因素,未来存款演进,信贷利率的演进和迁移,压力情景,所有的参数化。最后,银行的当前状态必须是可观测的。动态编程相比,机器学习解决方案易于实现现金流的基础上直接没有任何简化(例如,可分性成更简单的子问题变得冗余),和评估他们的质量可以瞬间一组任意大的验证场景。此外,让智能人工金融代理的模式(类似于人工棋手)有很多经验的选择更好的选择比人类对手可以驯服维度的诅咒,这是经典方法的关键瓶颈。进一步等方面复杂的价格动态,流动性不足,价格影响,存储成本、交易成本和不确定性可以很容易地注册立即;所有这些方面都很难在现有的框架。尽管更高程度的现实,深ALM是计算密集型比传统方法更少。规避风险或风险偏好分别可以直接通过选择适当的控制目标与积极以及消极奖励的学习算法。监管约束可以通过适当选择执行处罚。因此,深ALM提供了一个强大的和高维框架,支持平衡风险和前所未有的风险调整后的价格。 It surpasses prevalent replication strategies by far. Moreover, it allows to make the whole financial system more resilient through effective regulatory measures.

本文的结构如下。在第二节中,我们描述一个普遍的复制方法的零售银行。另外,我们从其他行业指定类似的用例。随后,我们解释了在第三节深ALM的关键概念。一个提示的巨大潜力深ALM的上下文中第四节中提供了一个原型。而会计监管流动性约束,深神经网络适应一个非平凡的径流动态复制策略投资组合优于静态最终基准策略。最后一部分阐述了深ALM和未来的影响的研究。从计算的常见误解和监管的观点要明确。

2。一个静态复制方案

2.1。财政部的零售银行

零售银行的商业模式依赖于盈利成熟的转换。为此,相当一部分不确定的责任期限结构是投资。责任方面主要包括术语和non-maturing存款。主要位置在资产方面是企业信贷和抵押贷款。剩余组件作为流动性缓冲,波动储备和一般的风险承担资本。固有的优化问题已经涉及在这个简化的业务情况。而大多数资金流源自责任方面是随机的,银行有义务确保均衡的流动性管理。关于短期和长期的流动性,法规要求他们举行流动性覆盖比率(LCR)和一个净稳定融资比率(NSFR)超过100%。相比之下,市场压力迫使他们收紧流动性缓冲,以达到一个像样的中。Asset-liability-committees(艾可)引导通过风险调整资产负债表管理定价和对冲工具。由于复杂性较高,许多银行主要定义和监控静态复制方案。值得注意的是,艾可如今往往只能满足每月一次和监督等简单措施修改后的持续时间和对冲会计方面的松散time-bucketed负债。很多机会监管,许多风险仍然存在非对冲;例如,看到介绍性章节斯皮尔曼et al。(2019)。关键业务决策不一致和反动,而不是积极的。

表1说明了一个通用的复制方案零售银行。这是灵感来自4.2节斯皮尔曼et al。(2019)。目前分配给固定的名义收入达100欧元,这是翻滚每月一些静态权重。第一行对应于一个流动性缓冲,不计息法定货币。

表1
www.雷竞技rebatfrontiersin.org

表1。静态投资计划的固定收益投资组合。

作为模范地,15%或15米欧元目前分配资本投资于固定收益工具到期的1y。这部分又分成等分,这样每个月大致相同体积的成熟。为了得到一个封闭循环,这是指维持12部分体积的1.25米(= 1/12×15欧元)。这个再赎回金额按1的地平线y在最新的市场利率。相同的翻转过程进行其他期限。这让我们总共有202滚动部分。在当前的前提,6部分的总量24.125欧元每个月成熟,再持续。投资组合权重只是不时修订。他们通常经验和历史因素的结果。一方面,它是有利可图的增加部分长而言,长期收益率通常但不总是高于短期收益率。另一方面,如果每个月只有一小部分被释放,这使得银行有重大利益的风险和流动性风险。这个静态方案通常是伴随着选择对冲工具的敏感性对收益率曲线平行变化或所谓的修改时间资产和负债方面大致相同。

当然,动态策略(包括重组的部分)都优于静态同行关于企业的潜在利润和弹性。然而,直接与202年部分通常不是可行的计算。如果我们只添加一个简单的动态特性和允许任意每月再过程中权重,这已经引入了一个相当大的额外的复杂性的分析观点。即使降低了收益率曲线动力学的维度,一个面临着错综复杂的嵌套优化运动对所有再实例。利用传统方法如动态规划和占一套合理的约束远非是微不足道的。此外,由于必要的简化模型,目前不能确定额外的复杂性是有回报的。因此,毫不奇怪,许多零售银行已经实现,而静态复制计划如上所述。在不久的将来,这是这部小说可能改变一次,计算更密集的ALM深处巨大的潜力将部署。

2.2。类似的用例

复制的概念方案可以类似地适用于其他用例。在下面,我们将介绍三个。

2.2.1。保险精算的角度来看

上述情况可以一对一的转移到保险公司的情况。方面的变化是完全不同的监管环境下,对冲工具(的资产流动性不足后退)和随机生成现金流以及独立的极端风险责任。人寿保险公司和养老基金必须占确切的产品条款和投保人的死亡特征。这包括,例如,长寿和大流行性流感的风险。非寿险保险公司每年损失分布模型及其在连续年解除。

2.2.2。采购

生产行业正面临着一个漫长而复杂的过程链。几个需要购买原材料商品,交付,存储,加工,设计成一个消费产品。为了控制固有的商业风险,确保盈利,成熟度转换在采购过程中成为不可避免的。虽然所需的确切数量的材料是未知的,该公司对不利的价格波动的风险需要相应的对冲。尽管看似每日交易量大,任何顺序有价格的影响。控制库存也值得由于资金和存储成本。因此,涉及到略高于上述财政情况,我们有一个ALM优化存在的流动性不足,存储成本、交易成本和不确定性。

2.2.3。水力发电厂

关于可再生能源技术进步和放松管制对电力市场产生了巨大的影响。风能和太阳能使电价与天气相关的更不稳定。尽管如此,一些领域未来的市场仍相对缺乏流动性。电力市场的特点是其复杂的价格动态(包括负价格)和各种各样的或多或少地清脆地交易期货合约在不同交货时间内(例如,盘中,前一天,周末,周,月,季度,年)。这使得估计的每小时的远期价格曲线(高功因),占季节性模式(盘中,工作日,几个月),趋势,假日日历和聚合不同期货合约的价格信息推断(基地,高峰期和非高峰期)一个非常具有挑战性的运动。电力生产商可能招致重大损失由于不良合同闭锁关税和水库mis-timed水力发电。这个环境迫使供应商进行严格的ALM,包括,例如,一个有竞争力的价格fixed-for-floating合同和日常优化电力生产计划。提供竞争的情况但仍有利可图的利润率在存在不确定性情况下银行已经习惯了几十年(不同商品、不同速率动力学)。深ALM可以根据这个情况并提供技术解决这种微妙的业务问题。都需要建立一个合适的场景发生器对未来市场和高功因。许多特定于业务的特点很难反映在传统优化技术。举个例子来说,一个涡轮不能开启和关闭每小时。这个简单约束呈现动态规划原理是不可能的。然而,这种约束可以在深ALM立即通过加入合适的处罚。

3所示。深ALM

除了专业判断,实际问题产生在ALM常常通过线性规划或解决动态规划。后者要求问题是可分割成更简单的子问题。非线性、高维情况下,一个通常利用蒙特卡罗技术为了获得或验证策略经验以及少量的标准。事实上,复制策略的复杂性水平仍然相当有限的由于高复杂性和缺乏适当的施工方法。深ALM使所有这些障碍过时了。一个直接用例的实现了任意复杂的规则,让一个非常聪明和non-forgetful人工金融代理获得许多几千年的经验在几个小时。通过激励所需的行为和刺激迅速学习过程,一个达到超人的水平。

我们考虑资产负债表的进化零售银行在一段时间网格{0、1、2…N}在几小时,几天,几周或几个月。干预之间的前滚是一个交替的过程随着时间和随机更新;(见图1)。在每次实例t人造asset-liability-manager随后表示,“人工金融代理”(AFA),评估再成熟的产品以及当前的投资组合的重组。这涉及到不同的资产类别,而不是固定收益工具。相应地,阿发的活跃一级市场新发行的仪器二级市场以前的发行和流通工具。可能会有进一步的资格转换的初始状态与交易成本,例如,发放再贷款或构建额外的流动性缓冲。资产负债表组件一个t(资产),lt(负债)和Et(股权)的标“前”和“后”,指资产负债表重组前后分别。前干预措施,辅助一步计算税可能是必要的。随后,经济场景生成器执行随机前滚的资产负债表。所有账户都更新到最新情况和宏观经济因素,例如,某些产品偿还现金数量,如优惠券或股息,某些产品需要注销的破产所引用的实体,客户撤回他们的某些部分存款,等。需要指出的是,上述情况是保持简单的为了便于说明。未来研究工作的主要目标是达到一个可接受的水平的复杂性,使现实世界ALM技术资格。这一目标的第一步Englisch et al。(2023)

图1
www.雷竞技rebatfrontiersin.org

图1。资产负债表前滚。

动态复制方案的优越性需要训练有素的阿发能完美权衡利益重组投资组合和重组的发生的交易成本。此外,训练阿发必须无可挑剔权衡不同的目标,如遵守监管约束,获得风险调整传播,保持充足的流动性,保持足够的利润对于不良场景,等等的基本想法是参数化的决策过程每次实例t通过深层神经网络(款)和通过技术逐步改善其性能受机器学习。通过连接这些深层神经网络沿着时间轴,一个最终整体动态复制策略容易处理非平稳环境。的学习过程鼓励最大化充分选择奖励函数的增量更新前馈网络的权重反向传播;(见图2)。这个想法可以驯服维度的诅咒。这些新的可能性的深ALM允许更频繁的监督而任意占许多约束和复杂的市场摩擦,如流动性不足和抵消在对冲交易成本的影响。因此,全功率的动态策略可以部署。

图2
www.雷竞技rebatfrontiersin.org

图2。深层神经网络架构。

传统的数值方案描述一个算法为了解决一个方程或以优化功能。通常,数学算法都只能接受社区如果他们有两个补充,即证明了配方终止在一定精度所需的水平,一方面,对收敛速度和声明,另一方面。在ALM的背景下,我们硬币的概念令人信服的策略因为我们很可能无法证明随机初始化深层神经网络最终将在一些最佳的复制策略。事实上,我们打算得到非平凡的但是现实的动态复制策略在一个合理的时间内,在金融行业的表现优于目前使用这些策略。从数学的角度来看,深ALM需要一个微妙的转变。基于场景的结果将派生的经验代表许多几千年的经验。通过重复学习过程几次,我们将证实了该方法的鲁棒性。此外,我们将验证和挑战在看不见的深层神经网络的性能测试数据。如果梯度下降算法只能进一步减少损失一些过度拟合训练策略验证的成本损失,我们最终在当地的优化器。即使我们将无法证明全球最优,该策略可能仍然击败传统模型以及经验丰富的专业人员,因此,多令人信服。

4所示。实证研究在一个程式化的情况

4.1。径流情况

我们旨在优化复制策略当解除径流组合超过10年的背景下,股票指数和宇宙大固定收益。在每次实例,大约200债券是活跃的。这个原型演示了程式化的情况下深ALM的可行性。最后,每一个资产负债表滚是径流的叠加组合。此外,我们给出一个指示潜在的动态复制策略。

负债是由一个静态的遗产投资组合。大约三分之二的资产投资于固定收益市场,10%是投资于股票。其余持有现金。每个月,六在一级市场发行新债券的面值100货币单位和期限3、61、5、10y。前三个系列的优惠券只支付最后的偿还期,其他三个半年度优惠券支付。在发行,所有债券面值贸易。传统的投资组合将等于六债券系列的所有部分,并进行了一次同样基于历史数据的分布式展期策略从欧洲央行(ECB)。未来的收益率曲线模拟场景与主成分分析相一致。为简单起见,我们假设没有二级市场。因此,债券不能在市场上销售,必须持有到期。此外,我们阻止信用违约。关于股票,我们生成的场景基于一个离散几何布朗运动。1改变股市的职位需要成比例的交易成本。由于法律要求,至少10%的必须持有现金资产组合;这只是一个任意的选择为了整合监管约束。任何差异都是惩罚每月利率高。初始平衡主机资产价值100的货币单位。负债期限结构具有相同面值是分布在网格根据一些贝塔分布的时间。

4.2。实施策略

行之有效的方法来解决定量金融学问题与深度强化学习是遵循标准的常规灵感来自游戏。游戏是一种随机环境中玩家可以根据一组规则和行动可以影响事件从开始到结束的过程在某种程度上。比赛终止在指定数量的轮。规则包括模型驱动程序和它们之间的相互依赖关系,约束和约束违反的惩罚,控制变量和目标函数。值得注意的是,我们实际上不能解决所有初始状态的游戏我们也不承担任何马尔可夫链的结构。我们实现了“游戏”根据以下规则指定一个Python脚本,这样任何策略都可以模拟任意随机的结果。为此,我们定义了一个经济场景生成器,主持了对股票收益率曲线动力学和现货价格。在这种环境下,一个可以测试任何幼稚或传统的性能得到复制组合。动力学模型转换规则书的步骤是理解的关键比赛,为确保一个适定的优化问题和简化后续tensorization的逻辑。ℝ的进化N价值数量可以推断出从历史时间序列与主成分分析提出的安德烈斯埃尔南德斯埃尔南德斯(2016)。随后,游戏嵌入在深层神经网络图架构使用TensorFlow这样一个阿发可以并行运行许多游戏和自适应改进其性能。许多占位符和正式的图形构成的逻辑游戏。阿发的第一个决策过程管理通过随机初始化权重与少数隐藏层神经网络。其输入层是一个参数化的初始状态,有关资产负债表结构和市场报价,和输出层特征符合条件的资产负债表的转换。资产负债表滚是通过连接神经网络的输出与一大堆有效的张量操作反映了资产负债表重组,新输入non-anticipative场景更新和下决策过程的输入层。重复这个过程产量所需的深层神经网络。

4.3。期限结构

我们有一个离散时间网格0= {0、1、2…N在个月},N= 120是指规划周期的10年。最初的负债期限结构与100年票面金额货币单位是跨越时间网格根据贝塔分布的参数一个= 1.5,b= 2.5,也就是说。,如果Fa、b表示对应的累积分布函数,然后现金流

l ( t ) : = ( F 一个 , b ( t / N ) F 一个 , b ( ( t 1 ) / N ) ) × One hundred.

就将在月t∈:=0\ {0}。我们简要地写l:= (l(1),l(2)、…l(N))收集的所有应付款项。在某个固定的时间,任何活跃的债券的特点是通过其未来的现金流B= (B(1),B(2)、…B(N))∈ℝN。如果Y= (Y(1),Y(2)、…Y(N))∈ℝN表示当前的收益率曲线与收益Y(T)成熟的T/ 12年D= (D(1),D(2)、…D(N))∈ℝND(T)=eT/ 12·Y(T)对所有T∈theconsistent discount factors, then the value ofB仅仅是V(B)=〈D、B〉,〈··〉代表标准的内积。选择优惠券,每个发行面值债券交易,现金流一代很简单。它对应于解决线性方程。作为模范地,债券到期的5y和半年度优惠券折合成年率票面利率

c = 12 6 · 1 D ( 60 ) k = 1 10 D ( 6 · k )

因此,它是

B ( 6 · k ) = c 2 · One hundred. 对所有 k { 1 , 2 , , 9 } , B ( 60 ) = ( 1 + c 2 ) · One hundred. ,

和所有其他组件是零。当从一个时间到另一个实例,B(1)付清和一个简单的适用于该计划B线性更新算子

U = ( 0 1 0 0 1 0 1 0 0 ) N × N

一个k倍的应用更新算子用Uk。我们利用数据从欧洲央行(ECB)为了模型的历史和未来的收益率曲线。央行发布为每个工作日Svensson参数β012312它的收益率曲线。相应的收益率曲线是向量Y= (Y(1),Y(2)、…Y(N))∈ℝN

Y ( T ) = β 0 + β 1 1 e T / ( 12 τ 1 ) T / ( 12 τ 1 ) + β 2 1 e T / ( 12 τ 1 ) T / ( 12 τ 1 ) e T / ( 12 τ 1 ) + β 3 1 e T / ( 12 τ 2 ) T / ( 12 τ 2 ) e T / ( 12 τ 2 )

我们在ℝ解决一些历史时间序列N并进行主成分分析。为此,我们假设固定每日收益率曲线的增量ΔX(Δ与期望值X]≡μ∈ℝN和协方差矩阵X)≡∈ℝN×N。我们可怕地分解=ΛLΛ在归一化特征向量Λ∈ℝN×N和有序的特征值l=诊断接头{λ(1)(2)λ,…(N)和λ}(1)≥λ(2)≥…≥λ(N)。最后一个历史收益率曲线是一天当我们获得径流组合。随机收益率曲线从1个月到下一个增量不断根据采样

Δ Y = 22 · μ + k = 1 n Z k Λ · k ,

我们选择n= 3, Z k ~ N ( 0 , σ k 2 ) σ k = 22 · λ ( k ) 。22个因素占每月交易日的数量。如果表示数量的到期月,遗留债券投资组合已经投资面值15 /每月货币单位特定债券系列:= {1、3、6、12、60、120}。这是符合的复制方案表1

4.4。股票市场

我们假设随机过程年代= (年代t)tT0遵循一个离散几何布朗运动,即。,它适用于所有人t

日志 年代 t 年代 t 1 ~ N ( ( 1 2 年代 2 ) · 1 12 , 年代 2 12 )

最初的水平年代0= 100,漂移= 5%和波动性年代= 18%。改变股市的职位需要成比例的交易成本κ= 0.50%。

4.5。资产负债表

我们进行迭代。让 Y t N 表示当前的收益率曲线t0\ {N},Dt折扣因素一致。在重组之前,资产负债表的左边总现值 一个 t 精准医疗 包括三个附加组件:持有现金 C t 精准医疗 ,遗留的债券投资组合的价值 V t 精准医疗 和股权的价值 G t 精准医疗 = Δ t 精准医疗 · 年代 t 。右边的资产负债表的负债

l t 精准医疗 = D t , U t l

和残渣 E t 精准医疗 = 一个 t 精准医疗 - - - - - - l t 精准医疗

4.6。深层神经网络架构

对于任何t0\ {N},我们考虑一个前馈神经网络

F t = ( ϕ W t ( 2 ) ) ( ϕ W t ( 1 ) ) ( ϕ W t ( 0 ) )

有一些仿射函数

W t ( 0 ) : 10 15 , W t ( 1 ) : 15 15 , W t ( 2 ) : 15 7

ϕReLU激活函数(x)= max {x,0}。包括输入层杠杆比率 E t 精准医疗 / 一个 t 精准医疗 ,流动比率 C t 精准医疗 / 一个 t 精准医疗 ,风险部分 G t 精准医疗 / 一个 t 精准医疗 ,持有的股票 Δ t 精准医疗 和收益率 Y t ( ) 最新的邦德系列。输出层的结果揭示了当时的重组实例t。前六组件代表控股 h t ( ) 在最新发行的系列中,代表了最后一个组件 Δ t 帖子 在股票。注意,激活函数意味着只做长线投资。

4.7。重组

重组牵连到更新后的资产负债表项目

C t 帖子 = C t 精准医疗 One hundred. · h t ( ) ( ( Δ t 帖子 Δ t 精准医疗 ) + κ · | Δ t 帖子 Δ t 精准医疗 | ) · 年代 t , V t 帖子 = V t 精准医疗 + One hundred. · h t ( ) , G t 帖子 = Δ t 帖子 · 年代 t , 一个 t 帖子 = C t 帖子 + V t 帖子 + G t 帖子 , l t 帖子 = l t 精准医疗 , E t 帖子 = 一个 t 帖子 l t 帖子

4.8。前滚

B t 帖子 N 表示整个聚合未来现金流的固定收益投资组合重组后的时间t。此外,让π(1):ℝN→ℝ表示第一个组件上的投影。如果不遵守的监管约束在现金持有至少10%的资产,一个是处罚与流动性的成本p每年= 24%的差异。一旦收益率曲线随机状态更新Yt+ 1与一致的折扣因素Dt+ 1和股票指数已经更新随机状态年代t+ 1,这让我们滚

C t + 1 精准医疗 = C t 帖子 + π ( 1 ) ( B t 帖子 ) π ( 1 ) ( U t l ) p 12 · 马克斯 { 10 % · 一个 t 帖子 C t 帖子 , 0 } , V t + 1 精准医疗 = D t + 1 , U B t 帖子 , G t + 1 精准医疗 = Δ t 帖子 · 年代 t + 1 = Δ t + 1 精准医疗 · 年代 t + 1 , 一个 t + 1 精准医疗 = C t + 1 精准医疗 + V t + 1 精准医疗 + G t + 1 精准医疗 , l t + 1 精准医疗 = D t + 1 , U t + 1 l , E t + 1 精准医疗 = 一个 t + 1 精准医疗 l t + 1 精准医疗

4.9。客观的

对不同期限T∈,数学金融学是最大化的常见方法 E ( u ( E T 帖子 / E 0 精准医疗 ) ] ,在那里

u ( x ) = { x 1 γ 1 1 γ , 如果 γ 1 日志 x , 如果 γ = 1

表示等弹性弹簧合金效用函数和常数相对风险厌恶γ≥0。这是不能直接适用在我们的案例中,因为我们无法阻止 E T 帖子 变得消极。相反,我们的目标是最大化

E ( u ( ( ε + ϕ ( E T 帖子 ) ) / E 0 精准医疗 ) ]

小恒0 <ε≪1。提供最终股权分布是正的,此案γ= 1对应的任务增长的最优投资组合最大化预期log-return;看到滚筒和希斯(2006)。一个有趣的替代方法是二次对冲,旨在最小化

E ( ( E T 帖子 ( 1 + r ) T / 12 E 0 精准医疗 ) 2 ]

对于一些年度目标中r> 0。这两种情况下会导致令人信服的策略。

4.10。结果

非负收益率曲线的优化仅仅是不平凡的。如果中期产量持续负(就像他们已经在欧元地区在相当一些年),持有现金优于被认为是固定收益投资(上图)指定的简化的前提。欧洲央行作为起点,我们选择收益率曲线按12月31日,2007年。在这种情况下,负债的初始值 l 0 精准医疗 = 86年 0 货币单位。如前所述,行使优化解决所有负债后的资产分布极具挑战性与常规方法。每次投资宇宙由实例204活跃的资产,即宇宙固定收益,股票指数和法定货币。我们提出一个简单的基准策略分配可用的现金超过10% 一个 t 精准医疗 债券到期的1,优惠券是积极的。股票转让线性。此外,我们的火车10000年阿发解除场景深度ALM的想法。直到最近访问动态策略优于基准策略最终经过短暂的学习过程大约10分钟。使用另一个10000年以前看不见的验证场景,最后附上的图表说明了股权分布经过十年经典静态策略动态策略的蓝色和橙色。不涉及极端冒险的动态策略。它只是揭示隐藏的机会。系统中过剩的基准是每年超过2%;(见图3)。

图3
www.雷竞技rebatfrontiersin.org

图3。阵容基准和训练有素的阿。

5。前景和进一步的研究

5.1。深ALM的潜力

真正的潜力几乎可以预见。一个成就将导致另一个,引发进一步的成就。尽管乐观,技术不够成熟,需要一个适当的水平的研究。市场参与者在所有用例,我们采访了谁,就像深ALM的有趣的想法。然而,只有少数敢在这一领域的先行者的阶段。ALM是风险管理的核心企业在金融行业。的新机会,这是不能接受的简单和无效的普遍复制方案。我们都是直接影响非对冲风险的银行存款,保险和养老基金。这可以说明作为模范地与芬兰的银行业造成了毁灭性的金融危机在1990年代早期。在此之后,官方失业率上升约18%。 Deep ALM offers a powerful framework that supports well-balanced risk-taking and unprecedented risk-adjusted pricing. Thus, its rigorous application may prevent a financial crisis sooner or later. Likewise, it is becoming increasingly important to spend resources wisely. Deep ALM promotes this attitude with significant efficiency gains in the procurement of commodities and the energy production; see alsoCurin et al。(2021)对于一个真实世界的应用程序。这些都是有前途的前景深ALM确实。

5.2。进一步研究的必要性

一些人认为机器学习将促进企业风险管理,使其更有效,使一些当前的任务甚至是多余的。我们同意,新的机会将允许更一致和冒险。然而,我们相信深ALM的合法应用程序将需要很多额外的工作,因为以前无法分析不是免费的。此外,他们将使一个巨大的新的经济挑战和义务的一部分。因此,至关重要的是,这项研究为这个技术改造社区准备一个坚实的基础。

5.3。可行性

优化整体资产和负债期限结构的利用技术受到深度强化学习是一种新颖的方法,需要证明其可行性。的最新进展,我们乐观地认为,这一目标可以实现。尽管如此,这一挑战打开一个大的研究领域从数学问题,计算和经济观点。在可行性方面,这是一个重要的问题,我们不仅要养活一个非常复杂的数学系统变成一个强大的超级计算机,看看我们是否得到了的东西。相比之下,我们的目标是在制定和优化动态复制方案,满足工业应用的要求,一方面,适度提高电脑上和可操作性,另一方面。尤其是,这涉及到评估是否可翻译的训练阿发的行为,是否遵循良好的经济推理和non-anticipative动态复制策略是否满足实际可行性的基本要求。解决高维效用最大化问题,需要不切实际的利用或任意调整频率为真实世界的应用程序是徒劳的。为此,深ALM必须权衡许多目标成本和收益等流动性,减少限制,温和的杠杆比率,盈利预期,监管干预措施,风险偏好,卖空限制,交易成本等。大多数方面可以在模型中通过相应激励阿发的行为的惩罚。撤军等约束和利润预期通常输入目标函数的优化。所有不同的目标之间找到合适的平衡没有影响学习过程的可靠性需要一些工程的工作。 However, once a convincing and stable economic model choice has been established, this has a tremendous impact on the economic research field. Previously inaccessible price tags to crucial economic notions such as, for instance, cost of liquidity for a retail bank can be evaluated quantitatively. All one needs to do is to line up performance measures of trained AFAs when short sale restrictions of the cash position are enforced and dropped respectively.

5.4。以目标为导向的投资

深ALM的密切相关的主题是基于目标投资;例如,看到布朗(1999)Sid布朗的一个简洁的数学处理。一个旨在最大化投资达到一定目标的概率在一个固定的成熟。从理论角度连续调整,这相当于复制一套volume-adjusted数字选项(除非或等于目标返回小于无风险利率)。尽管是非常直观的,这个结果是实际应用的只有有限的使用。离散的平衡和payoff-discontinuity罢工,作为一个越来越接近成熟,一个固有的缺口风险投资资本以外的方式。需要调查布朗的设置是否可以修改相应的真实世界的应用程序。这包括更现实的动态经济场景生成器,外生收入(灵感来自第7节布朗,1999),最大减少约束和val历史时间序列。试图在这个方向上可以找到Krabichler和温斯迟(2021)

5.5。泛化

如果我们看一步和ALM作为一个抽象的框架,深ALM可能至关重要的是我们社会的紧迫挑战应对气候变化或处理等流行病。火车一个球员达到一定目标同时最小化成本。关于气候变化,是一个复杂的权衡实施保护措施,激励行为变化,改变能源结构,等等。关于COVID-19,严格的紧急政策执行在整个世界,为了保护个人和公共卫生。这些措施涉及极端临时崩溃等某些行业成本,关闭学校,限制流动,等等。这些都是高维问题,用经典方法不能解决。深ALM是这些更加困难的挑战的第一步。

5.6。障碍

一个挑战将是克服常见的误解,深度学习需要大量的历史数据(银行或商品公司通常没有),深度学习是一个难以理解的黑盒,监管机构不会批准的ALM深处。首先,上述方法并不需要任何历史数据。所有人需要模型动力学的普通场景和压力情景。训练数据可以完全建立在综合这些前提。不过,对选定参数的校准,历史数据的可用性可以当然是有用的。其次,深层神经网络的性能可以验证立即在一组任意大的场景。在我们看来,这是一个最引人注目的特点深ALM由传统的ALM模式(不满意)。传统的混合定价和风险管理模型继承一个密集的验证过程。这种密集的工作变得过时,可以投资到更强的风险管理平台。第三和最后,只要一个为监管部门提供了令人信服的参数的准确性和韧性的方法(例如,在一个强大的验证和模型风险管理框架),他们不会反对使用深度学习。 As a rule, regulators emphasize being model agnostic.

5.7。监管的角度

复杂的监管体系应该降低金融体系的脆弱。然而,设计和实现有效的政策对金融行业,做错没有促进激励和不(太)不利于经济增长,是非常苛刻的。这是强调作为模范地在国际货币基金组织的工作论文(Sharma et al ., 2003)。说明,某些措施不一定鼓励所期望的行为中可以找到Grossmann et al。(2016)马丁·Grossmann马库斯·朗,赫尔穆特•达艾韬。最初的破产引发了赫斯塔特银行行为使人们意识到各(1974)、巴塞尔银行监管委员会建立了一个框架,用于指定银行资本充足率约束。这是修改后的严重自1988年出版以来的两倍。当前的框架,也被称为“巴塞尔协议III”巴塞尔银行监管委员会,2011年),设计后2007/2008的信贷紧缩。在别人,LCR和NSFR提出要求。这些流动性规则是经验的影响评估迪特里希et al。(2014)安德烈亚斯迪特里希,库尔特·赫斯,加布里埃尔Wanzenried。由于有限的历史数据和过多的影响因素之间的复杂的复杂性,新政权的真正影响很难被孤立。深ALM打开一个非常吸引人的新方法评价监管措施的有效性。为此,一个调查一个非常聪明和有经验的阿发如何改变她的行为当某些监管措施分别启用或禁用。这种方法允许真正确定监管干预措施的影响和相互之间的兼容性。这些定量的研究将是一个有前途的深ALM的补充。

5.8。风险管理模型

监督信SR 11-7美国联邦储备系统(美联储)已经成为一个标准的考虑风险管理模型;看到理事会的联邦储备系统(2011)。控制模型固有风险和限制将是一个关键的挑战之前深ALM可能利用有效。而提出的性能策略可以为成千上万的场景瞬间在检查模型,评估深ALM模式之间的差异与现实世界是一个重要的研究课题。一旦一个健壮的深ALM的学习环境已经建立,这些方面可以探索通过各种实验。例如,一个可以获得复制策略的敏感性分析对模型的假设或性能的参数不确定性的存在。这些不确定性可能担忧认为州(如存款外流的期限结构)和隐藏场景生成的训练和验证(例如,股票的漂移的假设)。有些人提出利用生成对抗的网络(甘斯),以确定自然和不利情况的影响,一方面,通过额外的培训提高阿发进一步的迭代,另一方面;例如,看到Flaig和Junike (2022)

5.9。风险政策的角度

另一个有趣的问题是寻求当地稳定的战略资产配置。通常,经过训练的神经网络将重组资产负债表结构从一开始。描述“区域对应于局部最优的初始状态。关于风险管理的模型,揭示了不同的模型假设之间的联系和内部的风险政策,一方面,“无为和地区,另一方面,将是一个风险管理委员会的有力工具。

数据可用性声明

公开的数据集进行分析。这些数据可以在这里找到:https://www.ecb.europa.eu/stats/financial_markets_and_interest_rates/euro_area_yield_curves/html/index.en.html

作者的贡献

两位作者列出了一大笔,直接和知识贡献的工作,批准发布。

资金

苏黎世联邦理工学院开放获取资金。

的利益冲突

作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。

出版商的注意

本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。

脚注

1。^我们做这个受欢迎的选择原因的简单性和再现性。在金融行业的注意事项,更复杂的模型或更现实的场景将是明智的。然而,该方法的适用性将不会受到影响。

引用

,M。税,。,和Parás, A. (1995). Pricing and hedging derivative securities in markets with uncertain volatilities.达成。数学。融资。2,73 - 88。doi: 10.1080 / 13504869500000005

CrossRef全文|谷歌学术搜索

Bardenhewer, m m (2007)。“建模non-maturing产品”流动性风险测量和管理,eds l . Matz和p . Neu(约翰·威利& Sons)。ch10 doi: 10.1002/9781118390399.

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

巴塞尔银行监管委员会(2011)。《巴塞尔协议III》(Basel III):一个全球监管框架更具弹性的银行和银行系统(修订版)。网上:https://www.bis.org/publ/bcbs189.htm

贝克尔,S。,Cher我dito, P., and Jentzen, A. (2019). Deep optimal stopping.j·马赫。学习。Res。1 - 25。网上:http://jmlr.org/papers/v20/18 - 232. - html

谷歌学术搜索

理事会的联邦储备系统(2011)。SR 11-7:指导风险管理模型。网上:https://www.federalreserve.gov/supervisionreg/srletters/sr1107.htm

布朗,美国(1999年)。达到目标的最后期限:数字选项和连续时间积极组合管理。放置达成。概率。31日,551 - 577。doi: 10.1239 / aap / 1029955147

CrossRef全文|谷歌学术搜索

布勒公司,H。,Gonon, L., Teichmann, J., and Wood, B. (2019). Deep hedging.定量,鳍。19日,1271 - 1291。doi: 10.1080 / 14697688.2019.1571683

CrossRef全文|谷歌学术搜索

Consigli G。,和De米p年代ter,M. A. H. (1998). Dynamic stochastic programming for asset-liability management.安。③。Res。81年,131 - 162。doi: 10.2139 / ssrn.34780

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Cuchiero C。克莱恩,我。,和Te我ch米一个nn,J. (2020). A fundamental theorem of asset pricing for continuous time large financial markets in a two filtration setting.概率理论。达成。65年,388 - 404。doi: 10.1137 / S0040585X97T990022

CrossRef全文|谷歌学术搜索

Curin, N。,Kettler, M., Kleisinger-Yu, X., Komaric, V., Krabichler, T., Teichmann, J., et al. (2021). A deep learning model for gas storage optimization.决策。经济学。鳍。44岁,1021 - 1037。doi: 10.1007 / s10203 - 021 - 00363 - 6

CrossRef全文|谷歌学术搜索

迪特里希,一个。赫斯,K。,和W一个nzenried, G. (2014). The good and bad news about the new liquidity rules of Basel III in Western European countries.j .银行。鳍。44岁的这边是。doi: 10.1016 / j.jbankfin.2014.03.041

CrossRef全文|谷歌学术搜索

迪克逊,m F。,Halperin, I., and Bilokon, P. (2020).机器学习金融。柏林;海德堡:施普林格1 -。doi: 10.1007 / 978-3-030-41068-1

CrossRef全文|谷歌学术搜索

El Karoui N。,和问uenez, M.-C. (1995). Dynamic programming and pricing of contingent claims in an incomplete market.暹罗j .控制选择。33岁的29 - 66。doi: 10.1137 / S0363012992232579

CrossRef全文|谷歌学术搜索

艾略特,r . J。Aggoun, L。,和Moore, J. B. (1995).隐马尔可夫模型。柏林;海德堡:施普林格-

谷歌学术搜索

Englisch, H。,Krabichler, T。,Müller, K. J., and Schwarz, M. (2023). Deep treasury management for banks.前面。Artif。智能。6、1120297。doi: 10.3389 / frai.2023.1120297

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

法博齐,f·J。,le我bowitz, M. L., and Sharpe, W. F. (1992).投资:马丁·l·莱博维茨的著作集。《专业酒吧。网上:https://books.google.ch/books/about/Investing.html?id=K0AUAQAAMAAJ&redir_esc=y

谷歌学术搜索

Flaig, S。,和Junike, G. (2022). Scenario generation for market risk models using generative neural networks.arXiv预印本arXiv: 2109.10072。doi: 10.3390 / risks10110199

CrossRef全文|谷歌学术搜索

Frauendorfer, K。,和年代chürle, M. (2003). Management of non-maturing deposits by multistage stochastic programming.欧元。j .打开。Res。151年,602 - 616。doi: 10.1016 / s0377 - 2217 (02) 00626 - 4

CrossRef全文|谷歌学术搜索

格拉汉姆·古德费勒,我。Bengio, Y。,和Courville, A. (2016).深度学习。麻省理工学院出版社。网上:https://mitpress.mit.edu/9780262035613/deep-learning/

谷歌学术搜索

白,M。朗,M。,和D我etl, H. (2016). Why taxing executives' bonuses can Foster risk-taking behavior.j . Instit。系统结构。经济学。172年,645 - 664。doi: 10.1628 / 093245616 x14689190842778

CrossRef全文|谷歌学术搜索

埃尔南德斯,a (2016)。模型与神经网络标定。网上:https://ssrn.com/abstract=2812140

谷歌学术搜索

Hilber, N。,Reichmann, O., Schwab, C., and Winter, C. (2013).计算方法为定量金融学。柏林;海德堡:施普林格1 -。doi: 10.1007 / 978-3-642-35401-4

CrossRef全文|谷歌学术搜索

Kiran, b R。Sobh,我。,T一个lpaert, V., Mannion, P., Al Sallab, A. A., Yogamani, S., et al. (2020).深入强化学习的自主驾驶:一项调查。arXiv预印本arXiv: 2002.00444。网上:https://ieeexplore.ieee.org/document/9351818

谷歌学术搜索

科比,J。,B一个gnell, J. A., and Peters, J. (2013). Reinforcement learning in robotics: a survey.Int。j .机器人。Res。32岁,1238 - 1274。doi: 10.1177 / 0278364913495721

CrossRef全文|谷歌学术搜索

Krabichler, T。,和Wun年代ch,M. (2021). Hedging goals.arXiv预印本arXiv: 2105.07915

谷歌学术搜索

Kusy, m . I。,和Z我e米b一个,W。T. (1983).银行资产与负债管理模型。IIASA合作的论文。网上:http://pure.iiasa.ac.at/id/eprint/2323/

谷歌学术搜索

龙斯达夫,f。,和年代chwartz, E. S. (2001). Valuing American options by simulation: a simple least-squares approach.启鳍。螺栓。14日,113 - 147。doi: 10.1093 / / 14.1.113 rfs

CrossRef全文|谷歌学术搜索

洛佩斯·德·普拉多,m (2018)。金融机器学习的进步。约翰威利和儿子。doi: 10.2139 / ssrn.3270269

CrossRef全文|谷歌学术搜索

滚筒,E。,和Heath, D. (2006).一个基准的方法来定量金融学。柏林;海德堡:施普林格1 -。doi: 10.1007 / 978-3-540-47856-0

CrossRef全文|谷歌学术搜索

革命联合阵线,J。,和W一个ng, W. (2019). Neural networks for option pricing and hedging: a literature review.arXiv预印本arXiv: 1911.05620。doi: 10.2139 / ssrn.3486363

CrossRef全文|谷歌学术搜索

瑞安,r . j . (2013)。资产/负债管理的进化。CFA协会研究基金会文献综述。网上:https://ssrn.com/abstract=2571462

谷歌学术搜索

沙玛,S。,Ch一个米我,R., and Khan, M. (2003). Emerging issues in banking regulation.国际货币基金组织的工作论文,WP / 03/101。doi: 10.5089/9781451852530.001

CrossRef全文|谷歌学术搜索

银,D。,Hubert, T., Schrittwieser, J., Antonoglou, I., Lai, M., Guez, A., et al. (2018). A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play.科学362年,1140 - 1144。doi: 10.1126 / science.aar6404

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

斯皮尔曼,M。Dohnert, K。,和Rissi, R. (2019).资产负债管理在Banken (ALM)。施普林格加布勒。doi: 10.1007 / 978-3-658-25202-1

CrossRef全文|谷歌学术搜索

萨顿,r S。,和B一个rto, A. G. (1998).强化学习:介绍。麻省理工学院出版社。doi: 10.1109 / TNN.1998.712192

CrossRef全文|谷歌学术搜索

关键词:资产负债管理,对冲,机器学习金融、投资组合管理、强化学习

引用:Krabichler T和摄影师J(2023)的案例研究释放深度学习在资产负债管理的潜力。前面。Artif。智能。6:1177702。doi: 10.3389 / frai.2023.1177702

收到:2023年3月01;接受:2023年4月28日;
发表:2023年5月22日。

编辑:

彼得Schwendner瑞士苏黎世大学的应用科学

审核:

Jan-Alexander Posth瑞士苏黎世大学的应用科学
伯特兰Kian Hassani英国伦敦大学学院

版权©2023 Krabichler和摄影师。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

*通信:约瑟夫•摄影师josef.teichmann@math.ethz.ch

下载