美林数据
ABOUT US
美林数据技术股份有限公司(简称:美林数据,NEEQ:831546)是国内知名的数据治理和数据分析服务提供商。

数字油田AI平台建设之视野、策略及切入点(深度好文)

2020-08-06 08:54:26
以智能化技术为代表的新一轮油气革命拉开了序幕,为了提高决策质量和管理水平,石油公司纷纷启动智能油田项目。随着智能油田建设的逐步深入,人工智能技术必将发挥更重要的作用。
数字油田
按照中国石化智能油田建设规划和定义,智能油气田在生产管控、一体化决策、油气藏经营等业务应用领域,实现对勘探开发全过程的全面感知、集成协同、预警预测及分析优化的四个方面的能力。
这其中,预警预测是实现以业务管控模型及专家经验、案例库等闭环式持续优化的预警预测能力;分析优化主要是建立开发方案- 动态管控- 调整方案的闭环式油藏管理体系,智能形成油气藏(井)解决方案,实现资源最优化开发的目标。人工智能技术,特别是机器学习是实现这两项能力的基础。而构建实用、高效的“人工智能平台”将是支撑“预警预测及分析优化”实现的基础和保障。

一、人工智能平台的理解

人工智能是一种基于数据分析的技术,这种技术基于在云计算和大数据技术,来解决行业各个生产阶段中预测和分析。
随着数字油田领域智能化的推进,运用AI技术来形成快速、高效的预测分析手段,已经成为一种潮流。相对于传统经验公式的长周期、区域适应较差的问题,人工智能,尤其是其中的机器学习方法可以充分利用大量数据建设的成果,快速的提取其中的关联和规律,为油田各个业务环节带来更加快速和准确的解决方案。
智能油田

随着当前基于Python与Spark等开发环境的推广,机器学习(包括深度学习)技术获得了广泛的应用。在这种行业算法积累到一定程度,我们开始思考关于人工智能如何系统应用的问题。这些问题重点在于,如何快速的构建企业智能化方法,如何快速构建企业智能应用并部署发布的问题。也就是说,如何将人工智能技术系统的应用在行业中,实现数据获取、处理、建模到部署发布的流程化、系统化与标准化。
这是企业迈向行业智能的必然趋势,人工智能平台就是解决这个问题的。
但是,人工智能平台目前存在建设目标泛化的巨大风险。
人工智能平台的定位是多样化的,可以是底层的人工智能软件开发API,可以是构建人工智能的云计算开发部署环境,可以是一种基于大数据的架构,可以是人工智能通用分析工具(就是数据挖掘),当然,最重要的是人工智能建模工具。进一步,这种建模工具上面向不同的行业逐步深入,就是某一个行业领域的数据解决方案。
人工智能
自左到右,这种技术体系的不同重心,带来了“AI平台”建设中定位的不同,以及市场选择的不同。
所以说,人工智能平台的建设目标和关注内容不同,直接导致了我们会出现用户群完全不一样的平台产品。
然而,更大的风险还不是层次选择的问题,而是在面向行业平台建设时,出现的用户群偏差带来的功能设计的不同。
进一步说,即便做智能建模,可能面对的用户群也是完全不同。如果面向IT人员,那么软件主要功能就在软件定制化与集成,甚至是更多的功能的代码化支撑以及软件的部署发布;如果面向业务分析人员,那么功能设计重点就在于如何面向一个场景将特定的(特定业务、特定格式、特定异常)数据、处理和算法进行整合设计,以及其快速的形成一个智能模型方案。
你的选择,直接决定了智能平台建设的价值体现在那个环节。

二、石油勘探、开发与工程领域(上游)的人工智能需求特点

以下是针对石油勘探开发领域,也就是油气上游领域的人工智能应用。
1、石油行业的业务特点
石油行业的研究是一个综合石油地质、油气运聚、油藏流体及井筒工程的复杂过程,其计算和分析过程相对成熟,其数据模型和数据处理方式也具有比较成型的算法。但是,随着大数据和AI技术的发展,从数据中寻找规律和模式,以辅助行业的各个阶段做出预测、分析和判断是AI当前的主要需求。
因此,AI技术的应用,一方面是应用通用AI技术(影像语音文本)加持油田生产管理,另一方面是提升数据分析技术的应用,进而提升数据在行业中的深化应用。
相对来说,后者可能是一个更有长期发展潜力的应用模式。
2、石油行业数据特点:
石油行业的数据体系和人工智能应用的互联网领域的数据来源具有很大的不同。
石油行业的数据以结构化为主。作为一种典型的工业数据体系,各油田多年来都发展出来了统一的结构化数据模型(EDM、SeaBed、EPDM、EPBP)。在数据的共享方式上,一种模式是开放数据库访问,另一种是通过数据服务(Json/WS)提供用户的数据访问。另有一些专业格式是以文件形式存在,如地震类、测井类以及油藏模拟的体网格,但是这种大文件数据内部也是具有严格内部,在结构上具有很强的规律性。

结构化数据
结构化数据为主,专业化格式为辅,多媒体数据价值更低。这是油气上游行业中的数据特点。
3、石油行业数据分析与应用的特点
对于上述各类数据的分析多年来也形成了非常系统的地震、地质、井筒工程、油藏、开采等业务应用模式,其数据分析不仅具有严格的数学模型(演绎),在经验模型(归纳)上也早已进行了长期的实验和应用,也就是说,我们传统的数据挖掘和机器学习方法在石油行业的各个领域的应用历史已经非常悠久了,即便是一些最新的深度学习和强化学习方法,在地球物理(地震)、井筒地球物理、油藏开发与开发生产等产生大数据量的领域也逐步开展起来。
因此,如何整合传统的基础方法和经验模型方法,是智能化技术应用重点(对于数据量和数据质量有限情况下的传统机器学习方法,更是如此)。
石油勘探

三、石油勘探开发领域AI应用存在的问题及需求

1、AI技术的复杂性制约了技术研发
虽然目前基于Python这样开发语言与大量的AI-API已经大大降低的人工智能技术的应用门槛,但AI技术作为一种新技术在应用上仍旧具有一定的复杂性。
大量的算法应用,以及算法的应用比较和训练模型的评估方法,都具有一定的专业性和技术壁垒。
2、数据获取,尤其是高质量数据获取难度
数据获取:各油田本身的数据具有高度保密性,相互之间的共享困难,这是其一。
数据质量:各油田的数据建设水平参差不齐,但即便数据治理最优秀的地区,其数据质量都是存在较大问题的;
数据规范:各种数据在指标参数设定、量纲、描述与计算方法上都存在差异,这使得不同地区和设备数据具有一定差异;
数据量:油气各个生产环节还有大量人工录入的数据,这种数据不仅质量上存在问题,在数据量上也严重不足,但是当前基于物联网采集在很多领域的快速铺开,自动采集和人工采集结合的方式可以有效解决数据量和数据质量的问题。
3、数据处理和特征构建的专业性
传统的AI建模平台一般会提供基本的数据处理工具并提供大量常规处理函数,但这些函数对于油气行业的专业化处理要求依旧有很大的差距。
首先,如各种专业格式的提取和转换、多种尺度数据的融合等很多方面,都是通用处理函数不能解决的,因此,必须面向不同的业务主题,提供与该主题对应的大量数据处理方法。
其次,是基于行业计算的新特征计算。由于机器学习的效率高度依赖强相关特征的构建,因此在不同的业务场景中用专业方法构建“专业化的特征项”是解决分类和预测的核心技术,多年来大量专业领域论文显示的AI技术应用重点,也是在这个方向。
4、专业算法的设计与模型训练的门槛
大量业务领域中的专业算法设计与研发具有一定难度。尤其在AI技术处于爆发期的现今,如何找到具有适用性的算法并基于特定地区和场景形成可用的训练模型,这是当前大量行业论文研究的焦点,应该也是人工智能最为核心的问题。
当然,在数据量和算法处理量达到一定规模后,如何集中资源统一训练模型也是需要解决的问题。
5、AI应用流程的复杂性制约了技术推广
完成的算法研究,如何落实到具体的生产场景也是一个问题。这些问题包括:
如何获取生产地区大量的数据并高效的完成处理和融合?
如何针对海量数据的集中训练和快速训练?
如何针对地区数据训练结果快速实现智能服务发布和智能应用构建?

四、油气行业AI平台的一些建设方法

针对AI平台在行业中的应用,此处从三个角度提出了类似平台的功能性要求,也就是从技术角度、行业应用角度和产品用户体验角度。
1、石油勘探开发领域 的AI平台,技术性设计重点(4个)
(1)数据获取方法多样性:(优先级:★★★★★)
从不同的数据来源(数据库、数据服务、数据文件)提供数据获取的功能,是极其重要的。
(2)建模流程的高度集成:(优先级:★★★★★)
在一个统一界面中,快速实现从数据获取、处理、融合、算法调用、训练、发布,定制过程快速而清晰。
(3)处理与智能算法的可复用:(优先级:★★★)
实现数据处理方法与模型训练方法的可自主创建、可统一管理、可复用,尤其针对行业用户,可实现算法分类管理的可定制。
(4)算法的快速部署发布:(优先级:★★★)
针对训练形成的模型实现快速的服务化部署。
2、石油勘探开发领域的AI平台,行业性设计重点(3个)
(1)面向油气数据模型的直接挂接:
具有常规国内勘探开发数据库和数据模型的直接挂接,建立基础的数据生态。
(2)面向主题业务场景的一体化快速建模:
主题业务场景(如地震属性岩体识别、钻井参数优化、开采工况预测等)中,用户能够快速建立从数据提取、处理融合到训练发布的智能服务。
(3)面向专业生产与研究的方法积累:
提供针对不同专业领域的数据处理、数据融合以及特征构建的专业方法,并形成这种专业方法的管理和积累。
3、关系用户体验和性能(实现简单,扩展丰富)
(1)理论清晰,概念明确:
要有一套足够强大的理论方法。所有数据分析与数据挖掘软件都是基于某一个分析流程,这个分析流程的概念明确、理论清晰。
(2)实现流程足够简单:
基于该流程,用户可以最快的形成一个流程闭环,以实现快速上手、快速实现的目的。这种定制可以不考虑大量数据处理和分析的细节,但主干过程一定是简单而快速,使得用户可以以最清晰和简洁的路径直达目标。
(3)将业务逻辑扩展方便:
对于专业的用户的一些复杂数据处理、分析和算法设计, 支持用户必要的扩展手段。同时,扩展方法的技术壁垒较低,用户可以逐步创建和积累相关方法,通过时间来实现复杂性积累,而不是代码规范的复杂度。
数字油田智能化建设依然任重道远。为了更好地把握AI技术的红利期,推进数字油田领域的智能化建设。

作者简介:孙旭东,男,1972年生人,高工。
1994年毕业于成都理工石油地质专业,中国海洋大学“地质工程”硕士,中国地质大学(武汉)“地学信息”博士。
研究方向为石油勘探开发数据模型与数据分析、油气专业软件架构设计、盆地与含油气系统模拟与分析等,曾承担多项国家科研项目与石化集团科研项目。2015年以来出版《油气勘探数据与应用集成》(电子科技大学出版社,一著)、《数字油田在中国数据篇》(科学出版社,合著)、《数字盆地》(科学出版社,一著)、《数字油田二十年》(科学出版社,合著)等多部学术专著。


如果您想了解更多智能油田建设新思路!
更多行业应用实践新方向!
更好的数据管理及数据分析产品!
更权威的行业大咖分享!
扫描下面二维码参加8月8日的线上会议吧!一场“石油数字化油田建设”的饕餮盛宴,邀您品鉴!

美林数据数字智能线上论坛
服务热线
400-608-2558
咨询热线
15502965860
美林数据
微信扫描二维码,立即在线咨询