重庆石油天然气交易中心欢迎您! 2022-07-06 星期三

重庆石油天然气交易中心

674
0

数据不是新石油?专家解读石油行业数字化转型之路

来源:石油圈 发布时间:2024-07-19
数字化转型为各个业务领域削减成本提供了一个至关重要的机会。曾在石油巨头埃克森美孚工作26年的Thomas C. Halsey在SPE上发表评论,探讨石油行业独特的数字化转型机会,重点介绍了可以带来显著效益、有价值的业务流程自动化。

Thomas C. Halsey教授曾在埃克森美孚(ExxonMobil)工作超过26年,在德克萨斯州和新泽西州担任各种研究、管理和员工职位,并于2021年从首席计算科学家的职位上退休。他目前是莱斯大学化学与生物分子工程系教授。
从2014-2015年的油价下跌,到2020-2022年的全球新冠肺炎大流行,是上游石油和天然气业务的艰难时期。与往常一样,该行业试图通过在不影响必要的新投资情况下减少结构性成本,这些必要新投资包括没有选择性、必须要投资的领域(安全,包括网络安全、人身财产安全、健康、和环境绩效),以及适当对冲新兴更可持续能源出现所需要的投资。数字化转型是该行业系统性降低多个业务领域成本的关键机遇之一。
尽管几十年来一直有关于“数字油田”的积极讨论,但过去十年的经济冲击重新激发了人们对在整个企业中应用数字技术以改善业务成本结构的兴趣。
当然,同时也涌现了全新的行业,如社交媒体,它们利用了包括机器学习、网络软件与连接、云存储与计算在内的新数字技术。这些技术也改变了零售业和制造业等传统行业。然而,在上游行业采取相同路径也面临一些特殊的挑战和机遇。
Thomas C. Halsey教授这篇评论的重点是数字化转型机会,这些机会或多或少是现代石油行业特殊数据和运营环境所独有的。上游公司可以并且应该抓住诸如业务流程自动化等许多有价值的机会,这些创新在本质上与其他行业的类似创新没有区别。



01. 数据不是新石油图片

一个挑战是上游数据规模庞大并且具有异构性。上游石油和天然气行业是一个历史悠久的行业,许多公司的业务和技术记录可以追溯到19世纪。这些记录可以是纸质形式,也可以是各种数字形式,反映了自20世纪50年代计算机成为标准业务和科学工具以来不同的数据存储方法。例如,将这些数据转换为适合云存储的更现代的格式并不是免费的。

因此,数字化转型的一个关键原则是必须价值驱动一句经常使用的短语,“数据就是新石油”,至少对石油和天然气行业本身来说,具有严重的误导性。任何企业持有的大多数数据,无论是在图书馆、共享数据服务器还是个人硬盘,经济上并不具备实用性。其他许多数据虽然有潜在价值,但需要在质量保证、数据管理、数据传输到计算节点、(高薪)雇用领域专家进行数据解释分析和做出商业决策等方面投入大量资金,因此无法直接基于数据实现可靠的价值。

与其从数据开始,最好的数字化转型思维方式是从业务决策开始。业务决策通常可以通过更好地获取和分析数据来改善,或者可以大幅降低某些活动的成本。这需要IT专家、数据科学家和领域专家密切合作。

维护工作流程是一个例子。对于分布广泛的设施的维护,理想情况下会优化技术工人活动,以应对设施发生故障的可能性及其对运营和经济造成的影响。维护记录通常目录混乱,甚至可能(即使在2024年)包括含有模糊或难以理解字段的纸质记录或数字记录。

基于实际设备表现及丰富的故障类型及故障概率数据,使用数字化记录对某些类型的维护活动进行优化可以实现显著的价值。这一点从工业时代开始就已经为人所知,但数字记录、云存储和访问使得进一步优化和精确定位(并且可能减少)维护人员工作成为可能。一个常见的例子是使用数据分析来支持预测性维护,通过统计预测故障或异常,从而实现“及时”维护,而不是定期维护。

这个例子的一个显著特点是,并不一定依赖于高度复杂的统计或机器学习方法。比这些方法更重要的是,能够访问质量有保证、精细整理的、完整的数据集,这些数据集涵盖尽可能长的时间序列和尽可能广的地理范围其中一些内容是IT职能部门的正常关注点,但IT投资和管理需要通过对实际数据的适当的业务所有权和强有力的治理流程来平衡,明确对数据质量的业务责任。

在考虑数据架构以支持维护或其他领域改进的业务结果时,区分两种类型的数据系统非常重要。更传统的数据系统是“记录系统”,它包含操作、地下或财务数据的特定实例的“单一真实来源”。


图片

▲图1-为了有效地跨多个领域整合数据,企业将数据从优化事务一致性的记录系统移动到优化快速读取的参考系统。后者构成了业务中使用的应用程序的数据枢纽。


希望扩展分析工作流的需求促使了“参考系统”的出现,有时也称为“参与系统”,通常是基于云托管的(见图1)。参考系统包含从一个或多个记录系统获取的数据,并以支持快速读取访问的架构呈现,从而支持复杂的大数据分析。多家科技公司提供软件和服务,支持将数据流入参考系统,允许多次机会对数据进行整理和质量保证。


02. 上游数据的特殊特征图片

上游业务的一个复杂情况是,数据尤其是原始或处理过的地震记录等地下数据,通常不归运营公司所有,而是由东道国政府所有,东道国政府可能会根据其主权利益施加访问和数据本地化的要求。因此,可能有一些记录系统,其内容不适合传输到托管的参考系统或可以在特定国家之外容易使用的参考系统。设计任何全球上游企业的数据架构,都需要仔细考虑法律和业务要求。

区别于其他行业,另一个复杂因素是,上游行业数据通常是珍贵且昂贵的。这显然适用于纯粹的观测数据,如地震勘探结果,但也可能适用于来自偏远或恶劣环境的运营数据。

当深水井中的井下压力传感器发生故障或“失灵”时,更换传感器需要进行昂贵的修井作业,仅仅更换传感器是不太经济的。分析的一个直接应用是基于资产属性和剩余可用数据,重建失灵传感器的最可能的时间序列数据。

地下数据(地震、测井、油藏模型)的复杂性以及这些数据专有和开放格式的混乱多样性,促使行业内发起了一个广泛的倡议,即OSDU论坛,该论坛将运营商、服务公司和技术公司聚集在一起,共同创建一个技术中立的开源数据平台,并在多个云平台上实施。OSDU论坛最初专注于上游石油和天然气行业,现已扩展到涵盖下游数据,并朝着能源转型和提供综合能源服务的方向发展。

在上游行业中,常用的最大数据集是地震数据集,无论是原始数据还是经过处理的数据,这些数据集都可以轻松达到数TB或PB。几十年来,地震数据管理一直是一门专业化和高度技术化的学科,在过去20年中,逆时偏移和全波场成像等先进处理技术的出现,使上游行业重新成为高性能计算的主要工业用户之一。对这些数据的解释集中在一个专门的软件行业,专注于地震解释、油藏建模,最后是油藏模拟。虽然这些都不是新学科,但云计算等新技术的出现增加了从多个数据集中以综合方式获取价值的机会。

这些数据集还为更现代的机器学习技术如卷积神经网络(CNNs)提供了应用场景。这些神经网络的一个关键应用是模式识别——它们以自动检测互联网上的照片是否为特定对象的照片而闻名(例如猫或狗),这种能力被称为分类。这些神经网络在解决分类问题上的成功,促使它们在地震解释中应用,用于检测3D地震图像中的特定特征,如断层或盐体(图2)。

图片

▲图2-卷积神经网络(CNNs)可以用于自动化地震解释任务,例如断层位置解释。在这种情况下,地震立方体(左侧)会被自动标注断层属性(右侧)

这些创新的经济影响可以简单地提升解释人员的生产力,或更有雄心地开发能够检测解释人员可能会忽略的微妙的油气聚集迹象的系统。


03. 物理学、数据和上游图片

一个多世纪以来,上游行业一直在开发强大的基于物理的方法来分析钻井、完井、油藏中流体流动以及管道和设施中的流体行为。将这些方法与勘探中使用的复杂地质和地球物理方法结合起来,使得该行业有资格成为现代工业中科学基础最为坚实的行业之一。

现代统计学习或机器学习(ML)方法根源于统计学,统计学一直是工程学一个关键工具。在过去的一二十年里,这些方法的应用激增更多地是由整合和访问大量数据的能力推动的,而不是统计方法本身基础性进步推动的,统计方法本身发展得更快。不过,上述言论有例外,包括前文讨论的卷积神经网络(CNNs)和近期取得重大突破的大语言模型(LLMs)。下文将对此进行更多介绍。

读者会注意到基于物理的方法和基于数据的方法之间的哲学差异,前者利用了我们对基本过程的科学理解,后者通过对大量数据的统计处理形成见解。理想的做法是结合这两种方法,既尊重我们来之不易的基础科学知识,又利用了从我们系统通常可以获得的丰富数据。

一个有趣的结合案例来自于历史拟合,这是一个标准工作流程,通过调整油藏模型以更好地匹配生产井的压力和流量历史。使用先进的机器学习方法来支持油藏建模,并更好地理解其结构是如何受数据约束的,这已经形成了一个独立的学术产业,但遗憾的是,这尚未对行业实践产生重大影响。

另一个例子是利用现场实时钻井数据,结合钻柱振动模式的物理模型,来优化钻井(见图3)。在这里,钻井人员不是利用机器学习,而是利用现代钻井现场可用的丰富实时数据,实现钻进速率的显著提升。

图片

▲图3—有效利用实时钻井数据,结合健全、稳健的物理模型,可以提高钻进速率并减少停机时间。所示的控制参数包括压钻重量(WOB)和每分钟转数(RPM)。该系统帮助操作员选择最佳参数。来源:SPE 187447。

这样的优化应用案例是上游数字化转型的主要早期价值机会之一。这种创新的机器学习单元不需要非常复杂——关键是将健全的物理模型与现代操作中可用的丰富数据源结合起来。


04. 超越优化图片

优化非常重要,当在企业运营和流程中按照一定标准和方法进行应用时,可以显著提升企业的竞争力。但是,最近以ChatGPT及其继任者大型语言模型为代表的人工智能的突破,引发了一个问题,即人工智能是否会在上游带来更具颠覆性的创新机会。这些模型基于对文本文档中(通常是)单词之间相关性的统计确定,通过访问互联网上大量的文本数据进行训练。

这个想法的一个自然延伸是,基于文本和非文本数据(如地震数据、测井数据、地质观测数据),训练类似于ChatGPT的程序,以回答在特定空间位置勘探相关地质特征(如石油聚集、母岩)可能性的问题。

已经有人努力创建这样的系统或简化版本。当然,实际决定是否钻探探井也受到地缘政治、经济、监管和官僚多种因素的影响,这些因素可能无法完全反映在地质信息库中,也可能根本难以捕捉。但对LLM技术力量持怀疑态度的人已经在许多案例中被证明是错误的,因此我们需要对这种技术力量持开放态度。

另一个有趣的例子是地震到模拟的工作流程,该工作流程从地下数据开始,通过油藏建模和油藏模拟,最终商业目标是设计和评估油气资源的开发方案。正如目前实施的这种工作流程,涉及多种不同类型软件应用程序的高度复杂交互,同时结合来自地球科学和工程多个学科领域的专家意见。这是一项昂贵、耗时的工作,同时也是从首次发现油气资源到最终经济开发之间的重要时间延迟来源。因此,这种工作流程非常适合被新兴的人工智能技术所打破,可能已经有位于休斯顿、阿伯丁或班加罗尔的一些公司正在努力实现这一目标。

这后两个领域的创新,可能随着上游行业在勘探和开发投资普遍放缓而减缓。我们行业现在处于一个矛盾的时期,主要是由于经济和政治因素的推拉作用,这些因素造成了受气候问题驱动的能源转型步伐的不确定性。

这篇评论中的大多数观点同样适用于可再生能源、地热能源或碳捕集与储存等新能源技术,特别是因为这些技术也需要凭借其巨大能力和特性来利用地下数据。因此,无论我们未来的能源故事是什么,数字化转型几乎肯定会是其重要组成部分之一。


674
0