banner
Nachrichtenzentrum
Hervorragende Inputs, strenge Qualitätssicherung.

Anwendung von maschinellem Lernen zur Vorhersage des Ölpreisrückgangs für Bakken-Schieferölquellen

Aug 10, 2023

Wissenschaftliche Berichte Band 12, Artikelnummer: 16154 (2022) Diesen Artikel zitieren

1599 Zugriffe

3 Zitate

3 Altmetrisch

Details zu den Metriken

Zur Lösung diskretisierter Massenbilanzgleichungen sind kommerzielle Reservoirsimulatoren erforderlich. Wenn das Reservoir heterogen und komplex wird, können mehr Gitterblöcke verwendet werden, was detaillierte und genaue Informationen zum Reservoir erfordert, z. B. über Porosität, Permeabilität und andere Parameter, die vor Ort nicht immer verfügbar sind. Die Vorhersage des EUR (geschätzte endgültige Gewinnung) und des Förderratenrückgangs für ein einzelnes Bohrloch kann daher Stunden oder Tage dauern, was sie rechenintensiv und zeitaufwändig macht. Im Gegensatz dazu sind Rückgangskurvenmodelle eine einfachere und schnellere Option, da sie nur wenige Variablen in der Gleichung erfordern, die leicht aus den aktuellen Daten der Bohrlöcher ermittelt werden können. Die Bohrdaten für diese Studie wurden aus den öffentlich zugänglichen Datenbanken des Montana Board of Oil and Gas Conservation gesammelt. Die Variablen der SEDM-Abnahmekurvengleichung (Stretched Exponential Decline Model), die speziell für Variablen unkonventioneller Lagerstätten entwickelt wurden, wurden mit den Prädiktorparametern in einem zufälligen Ölfeld-Bohrlochdatensatz korreliert. Die Studie untersuchte die relativen Einflüsse mehrerer Bohrlochparameter. Die Neuheit der Studie ergibt sich aus der Entwicklung eines innovativen, auf maschinellem Lernen (ML) (Random Forest (RF)) basierenden Modells für die schnelle Rate-Rückgangs- und EUR-Vorhersage in Ölquellen im Bakken-Schiefer. Die erfolgreiche Anwendung dieser Studie hängt in hohem Maße von der Verfügbarkeit einer guten Qualität und Quantität des Datensatzes ab.

Das Hauptziel dieser Studie ist die Entwicklung eines ML-basierten Modells, das zur Vorhersage des Produktionsrückgangs für eine große Anzahl von Bakken-Schiefer-Bohrlöchern in einem sehr kurzen Zeitraum verwendet werden kann. Diese Methode wird viel schneller sein als die kommerziellen Reservoirsimulatoren, da sie nicht die Lösung einer großen Anzahl von Finite-Differenzen-Gleichungen erfordert. Die Förderung von unkonventionellem Schieferöl und -gas wurde bereits vor vielen Jahren in den USA begonnen. Seitdem haben zahlreiche Explorationsunternehmen die Daten einer beträchtlichen Anzahl von Öl- und Gasbohrungen gesammelt, die in diesen Lagerstätten gebohrt und gefördert wurden, was zu einer großen Menge an horizontalen Bohrdaten führte. Diese Informationen sind in mehreren öffentlich zugänglichen Website-Datenbanken1 verfügbar. Verschiedene Datenanalysemethoden können verwendet werden, um öffentlich verfügbare Daten auszuwerten, um zugrunde liegende Muster und Sweet Spots in diesen Reservoirs aufzudecken, die für die zukünftige horizontale Bohrlochentwicklung von Vorteil sein könnten2,3,4. Die am weitesten verbreitete Methode zur Prognose der künftigen Produktion aus Schieferölquellen ist die Projektion von Produktionsrückgangskurven5. Rückgangskurvenmodelle sind mathematische Gleichungen, die zur Modellierung bestehender Bohrlochproduktionsdaten und zur Vorhersage eines zukünftigen Bohrlochrückgangs verwendet werden1. Durch die Entwicklung eines empirischen Modells für den Rückgang der Produktionsrate ausgehend von der frühen Leistung des Bohrlochs und die Extrapolation dieses Musters in die Zukunft können zukünftige Produktionspotenziale und EUR vorhergesagt werden. Das am häufigsten verwendete Produktionsrückgangskurvenmodell ist das Arps Hyperbolic Model. Die Anpassung des Arps Hyperbolic Model an Produktionsdaten aus Schieferölquellen hat jedoch häufig zu physikalisch unrealistischen Werten des hyperbolischen Abnahmekoeffizienten geführt1. Um diese Herausforderung zu lösen, wurde SEDM eingesetzt, um die Produktion aus unkonventionellen Bohrlöchern vorherzusagen5. SEDM eignet sich besser für Schieferölquellen als das Arps-Hyperbolic-Modell, da sie sich während des größten Teils ihrer Lebensdauer in einem transienten Fließregime befinden. Für positive \({q}_{i}\), n und SEDM gibt SEDM einen endlichen EUR-Wert1 zurück. Daher wurde SEDM in der Studie verwendet, um den Rückgang der Produktionsrate und den EUR für Testbohrungen vorherzusagen.

In einer ähnlichen Studie wurde ein alternativer Ansatz für die Geschwindigkeits-/Druck-Entfaltung vorgestellt. Die physikbasierten trainierten Parameter und Algorithmen spielen eine Schlüsselrolle bei der effektiven Umsetzung der empfohlenen Strategie, indem sie die Physik der überlagerten transienten Strömungen bewahren6. Der Hauptnachteil dieser Studie besteht darin, dass diese Methode keine zufriedenstellenden Ergebnisse liefert, wenn sehr variable und begrenzte Daten verfügbar sind. Der Hauptnachteil dieser Studie besteht darin, dass sie stark von der Verfügbarkeit ausreichender Datenmengen abhängt. In einer anderen Studie wurde ein Modell zur Vorhersage der Permeabilität eines technisch anspruchsvollen (extrem heterogenen) Karbonatgesteins auf der Grundlage der Random-Forest-Regression vorgeschlagen, das die relevanten physikalischen Parameter effizient erfassen und im Vergleich zu herkömmlichen empirischen Modellen eine sichere Permeabilitätsvorhersage liefern kann7. Der Hauptnachteil dieser Studie besteht darin, dass sie in hohem Maße von der Verfügbarkeit hochwertiger rauschfreier Daten abhängt. In einer ähnlichen Studie verwendeten die Autoren datengesteuerte Modelle zur Vorhersage des Fördermengenrückgangs in den Eagle Ford Shale-Ölquellen8. In einer anderen Studie wurde ein ANN-basiertes Modell zur Vorhersage des Fördermengenrückgangs in Eagle-Ford-Shale-Ölquellen vorgeschlagen9. Der Hauptnachteil dieser Studien bestand darin, dass ihre Anwendbarkeit nur auf Eagle für Schieferölquellen beschränkt war.

In einer ähnlichen Studie wurden Fuzzy-Logik, ANN (Artificial Neural Network) und Imperialist Competitive-Algorithmen zusammengestellt, um ein Modell für die Vorhersage der Öldurchflussrate zu erstellen10. Der Hauptnachteil dieser Studie ist die Bestimmung der optimierten ANN-Architektur. In einer anderen Studie wurden mehrere Algorithmen für maschinelles Lernen zusammengestellt, um Porosität und Permeabilität durch die Einbeziehung petrophysikalischer Protokolle vorherzusagen11. Der Hauptnachteil dieser Studie ist die Verwendung komplizierter Algorithmen für maschinelles Lernen, die übermäßig viel Zeit in Anspruch nehmen. In einer anderen Studie stellten die Autoren ein Deep-Belief-Network-Modell (DBN) vor, um die Produktion unkonventioneller Bohrlöcher zuverlässig und genau vorherzusagen. Die Autoren führen 815 numerische Simulationsfälle durch, um eine Datenbank für das Modelltraining zu entwickeln und die Hyperparameter mithilfe des Bayes'schen Optimierungsalgorithmus zu optimieren. Mit dem vorgeschlagenen Modellierungsrahmen konnte die Produktion unkonventioneller Bohrlöcher zuverlässiger und genauer vorhergesagt werden als mit herkömmlichen Techniken des maschinellen Lernens. Die Haupteinschränkung dieser Studie besteht darin, dass für das Modelltraining viele Simulationsläufe erforderlich sind12.

Kommerzielle Reservoirsimulatoren können Stunden oder sogar Tage brauchen, um einen Fördermengenrückgang für eine einzelne Bohrung vorherzusagen13,14,15,16. Kommerzielle Reservoirsimulatoren lösen die diskretisierte Form von Massenbilanzgleichungen. Die Anzahl der in einem Reservoirmodell verwendeten Gitterblöcke kann in die Millionen gehen, sodass millionenfache Matrixgleichungen gelöst werden müssen. Da das Reservoir immer heterogener und komplizierter wird, sollte ein Modell mit feinerer Auflösung (mit einer höheren Anzahl von Gitterblöcken) verwendet werden. Darüber hinaus sind präzise und umfassende Reservoirparameter, einschließlich Porosität, Permeabilität, Sättigung und andere Variablen, unerlässlich, um eine oder sogar mehrere Reservoirsimulationen für die in der Studie berücksichtigten Bohrlöcher durchzuführen, die vor Ort nicht immer verfügbar sind.

In dieser Studie wurde eine alternative Methode vorgestellt, die auf maschinellem Lernen basiert und sehr schnell und genau ist, da keine Lösung von Matrixgleichungen erforderlich ist. Es erstellt Vorhersagen auf der Grundlage zuvor gesammelter Felddaten. Maschinelles Lernen kann als effizientes Werkzeug zur Vorhersage eines Ölpreisrückgangs in der Art der in dieser Studie vorgestellten Daten eingesetzt werden. Diese Studie benötigte weniger als eine Minute, um den Ratenrückgang für alle für die Vorhersagen verwendeten Bohrlöcher abzuschätzen. Bei auf maschinellem Lernen basierenden Vorhersagen wurde beobachtet, dass die Verwendung des gesamten Datensatzes zur Entwicklung eines maschinellen Lernmodells aufgrund der Datenvariabilität zu erheblichen Fehlern führen kann. Um diese Einschränkung zu überwinden, umfasste ein in dieser Arbeit verwendeter alternativer Ansatz eine Kreuzvalidierung mit k-facher Validierung und Modellmittelung unter Verwendung der Ensemble-Technik (Polyak-Ruppert-Mittelung). Diese Methode teilt Trainingsdaten in mehrere Falten (k-fach) auf Teilmengen von Datenpunkten, und ein Modell wurde in einer der Falten ausgewertet, während die anderen Falten für das Training verwendet wurden. Durch die Anwendung verschiedener Teilmengen von Trainingsdaten zur Minimierung des Überanpassungsproblems erhalten wir am Ende des Trainings mehrere Modelle für maschinelles Lernen, die aus einem einzigen Trainingsdatensatz abgeleitet werden. Die endgültige Vorhersage für Testdaten/neue Daten basiert auf einem gewichteten Durchschnitt der Vorhersagen aller dieser Modelle.

In dieser Studie wurde das Variablenranking verwendet, um zu zeigen, welche Variablen/Parameter einen signifikanten Einfluss auf die Vorhersage des Ratenrückgangs haben, und um sie in der Reihenfolge ihrer Priorität zu ordnen. Diese Datenanalyse wurde durchgeführt, um den Datensatz zu verstehen, bevor er für Vorhersagen verwendet wird. Diese Studie verwendete auch explorative Analysen, um menschliches Urteilsvermögen für genauere Schlussfolgerungen einzubeziehen.

North Dakota, South Dakota, Montana, Manitoba und Saskatchewan sind alle Teil des Williston-Beckens, zu dem auch der Bakken-Schiefer und seine drei Zweige gehören. Der Bakken-Schiefer ist in Abb. 1 mit Öl- und Gasquellen (Natural Gas Intelligence) zu sehen. Alle Ölquellen in dieser Studie wurden aus dem Bakken Shale im Richland County ausgewählt (im grünen Rechteck enthalten). Bei dieser Arbeit wurde SEDM eingesetzt, um einen Produktionsrückgang vorherzusagen.

Bakken-Schiefergebiet mit Öl- und Gasquellen (Erdgasintelligenz)17.

Die Abbildungen 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 und 18 zeigen die Verteilung verschiedener Parameter in den vier untersuchten Clustern. Sie wurden ausschließlich für explorative Analysen eingesetzt, nicht für die auf maschinellem Lernen basierende Vorhersage des Ratenrückgangs. Die Abbildungen 10, 11, 12, 13, 14 und 15 zeigen die ersten Ergebnisse des 24-Stunden-Bohrlochpotenzialtests. Die Abbildungen 16, 17 und 18 enthalten Informationen zur hydraulischen Frakturierung.

Anfängliche Durchflussrate \(({q}_{i}).\)

Menge des verwendeten Stützmittels.

Menge der verwendeten Fracturing-Flüssigkeit.

Fertigstellungsdauer.

Anzahl der Bruchstufen.

TVD-Fersen-Zehen-Unterschied.

Gemessene Tiefe.

Gesamte vertikale Tiefe.

Schlauchgröße für den anfänglichen 24-Stunden-Zeitraum.

Anfänglicher 24-Stunden-Fließdruck im Schlauch.

Zunächst wurde im 24-Stunden-Zeitraum Öl produziert.

Zunächst wurde im 24-Stunden-Zeitraum Gas produziert.

Anfänglicher 24-Stunden-Zeitraum GOR.

Anfängliche Öl-API-Schwerkraft im 24-Stunden-Zeitraum.

Durchschnittliche hydraulische PS-Leistung.

Maximaler Behandlungsdruck im Bodenloch.

Durchschnittlicher Behandlungsdruck am Bohrlochboden.

Nach der Aufteilung der Bohrlochdaten in die vier Cluster, wie in den Abb. 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 und 18 und Vergleich der Cluster Nr. Aus den Bohrungen 1 und 4 lassen sich folgende Schlussfolgerungen ziehen:

Der Medianwert und \({q}_{i}\) von Cluster Nr. 4 Brunnen sind deutlich höher als die von Cluster Nr. 1 Wells, wie in Abb. 2 dargestellt. Dies liegt daran, dass die Wells ausschließlich auf der Grundlage von \({q}_{i}\) geclustert wurden.

Die in Cluster Nr. verwendete Stützmittelmenge. 4 Brunnen ist höher als im Cluster Nr. 1 Brunnen, wie in Abb. 3 dargestellt. Es besteht ein starker positiver Zusammenhang zwischen \({q}_{i}\) und der verwendeten Stützmittelmenge.

Der Mittelwert und die in Cluster Nr. eingesetzte Menge der Spaltflüssigkeit. 4 Brunnen liegen deutlich höher als im Cluster Nr. 1 Bohrlöcher, wie in Abb. 4 dargestellt. Dies ist auf die Tatsache zurückzuführen, dass die eingesetzte Stützmittelmenge mit der Menge der Frakturierungsflüssigkeit zusammenhängt.

Der Medianwert und die Abschlusslänge, die in Cluster Nr. verwendet werden. 4 Brunnen liegen deutlich höher als im Cluster Nr. 1 Brunnen, wie in Abb. 5 dargestellt. Dies liegt daran, dass die Menge des Stützmittels mit der fertigen Länge zusammenhängt.

Der Wertebereich für die Anzahl der Bruchstufen im Cluster Nr. 4 Brunnen ist wesentlich umfangreicher als im Cluster Nr. 1 Brunnen, wie in Abb. 6 dargestellt. Aus dieser Zahl lassen sich keine abschließenden Schlussfolgerungen ableiten.

Der Medianwert und die TVD-Fersen-Zehen-Differenz im Cluster Nr. 4 Brunnen sind mit denen im Cluster Nr. vergleichbar. 1 Brunnen, wie in Abb. 7 dargestellt. Die Erklärung liegt darin, dass alle in dieser Studie verwendeten Brunnen aus demselben Landkreis stammten. In Anbetracht des leichten TVD-Fersen-Zehen-Unterschieds im Vergleich zu den langen fertiggestellten Längen liegen die Bohrlöcher ziemlich nahe an der Horizontalen.

Die Obergrenze des Bereichs der gemessenen Tiefenwerte im Cluster Nr. 4 Brunnen ist viel höher als im Cluster Nr. 1 Bohrlöcher, wie in Abb. 8 dargestellt. In Bezug auf die Fertigstellungslänge wurde eine ähnliche Schlussfolgerung gezogen.

Die gesamte vertikale Tiefe im Cluster Nr. 4 Brunnen ist deutlich größer als im Cluster Nr. 1 Wells, wie in Abb. 9 gezeigt. Dies zeigt, dass \({q}_{i}\). und TVD haben eine enge Beziehung.

Im anfänglichen 24-Stunden-Bohrlochpotenzialtest wurden für alle ausgewählten Bohrlöcher nur zwei Rohrgrößen verwendet, wie in Abb. 10 dargestellt. Daher wird die anfängliche Durchflussrate relativ unbeeinflusst von der Rohrgröße.

Der Mittelwert und der Schlauchdruck im Cluster Nr. 4 Brunnen liegen höher als die im Cluster Nr. 1 Wells, wie in Abb. 11 dargestellt. Cluster-Nr. 4 Brunnen haben größere Anfangsflussraten als Cluster Nr. 1 Brunnen, wie bereits beobachtet. Dies kann daran liegen, dass Cluster Nr. Bei 4 Bohrlöchern wurden längere Fertigstellungslängen und Stützmittelmengen verwendet, was zu einem erhöhten Lagerstättendruck während der Produktion führte.

Feigen. 12, 13 und 14 zeigen, dass der anfängliche 24-Stunden-Zeitraum des in Cluster Nr. produzierten Öls. 4 Brunnen ist höher als im Cluster Nr. 1 Brunnen. Im Gegensatz dazu sind die anfängliche 24-Stunden-Gasproduktion und die anfängliche 24-Stunden-GOR geringer. Dies zeigt an, dass Cluster-Nr. 4 Brunnen haben einen geringeren Gasgehalt.

Der Bereich der Öl-API-Schwerkraft in Clustern Nr. Die Ölqualität der Bohrlöcher 1 und 4 ist, wie in Abb. 15 dargestellt, nahezu gleich, d ihre API-Bereiche sind größer als \({31.1}^{\mathrm{o}}\).

Feigen. 16, 17 und 18 zeigen, dass durch den Vergleich mit Clustern für anfängliche Flussraten keine endgültige Schlussfolgerung gezogen werden konnte. Alle diese Variablen werden jedoch im verbleibenden Teil der aktuellen Studie berücksichtigt.

Abbildung 19 beschreibt die Korrelation zwischen tatsächlichen und vorhergesagten n- und Tau-Werten. Abbildung 20 veranschaulicht die Korrelation zwischen prognostizierten und tatsächlichen EUR-Werten. Nach der Vorhersage der Rückgangsvariablen für ein Testbohrloch konnte leicht eine Rückgangskurve für das Bohrloch erstellt und mit den tatsächlichen Produktionsratendaten abgeglichen werden. Dies ist in Abb. 21 für mehrere Testbohrungen dargestellt, die das maschinelle Lernmodell mit den geringsten quadratischen Mittelwertfehlern (RMSE) der Testdaten für EUR verwenden.

Vorhersage der Parameter des SEDM-Abnahmemodells.

SEDM-Rückgangsmodell EUR-Prognose.

Anpassung der SEDM-Rückgangsmodell-basierten Vorhersage für Testbohrungen.

In dieser Studie haben wir die Bohrlöcher mit einem sehr hohen Rauschniveau der Produktionsdaten herausgefiltert und nur die Bohrlöcher mit einem gleichmäßigen Rückgang der Produktionsdaten eingesetzt. Aus Abb. 21a–f lässt sich erkennen, dass der mit dieser Methode vorhergesagte Rückgang der Produktionsrate im späteren Teil des Produktionszeitraums stärker zusammenfällt als im früheren Produktionszeitraum, da in der frühen Phase ein höherer Lärmpegel vorhanden ist Produktionsleben.

Die Prädiktorvariablen wurden gemäß ihrer numerischen Reihenfolge mithilfe des Chi-Quadrat-Tests und des F-Test-Algorithmus angeordnet, um zu bestimmen, welche Parameter einen signifikanten Einfluss auf den Ratenrückgang haben können, wie in Tabelle 1 dargestellt. Der mittlere Rang einer Variablen sollte nahe bei Eins liegen Die Rangvarianz sollte gering sein, wenn ihr mehr Priorität eingeräumt werden soll. Es kann auch zur Eliminierung der Features verwendet werden, aber aufgrund der begrenzten Datenverfügbarkeit wird der gesamte Datensatz genutzt und keines der Features wurde entfernt.

Die Prädiktoren können anhand von Tabelle 1 in drei Gruppen eingeteilt werden.

Wichtigste Prädiktoren \({q}_{i}\), Stützstoffmenge, Menge der Frakturierungsflüssigkeit, Fertigstellungslänge, Rohrdruck, Anzahl der Frakturierungsstufen.

Mäßig wichtige Prädiktoren: Gas-Öl-Verhältnis, produzierte Gasmenge, gemessene Tiefe, gesamte vertikale Tiefe, geförderte Ölmenge, Öl-API-Dichte.

Am wenigsten wichtige Prädiktoren: Hydraulikleistung, Schlauchgröße, maximaler Behandlungsdruck im unteren Loch, durchschnittlicher Behandlungsdruck im unteren Loch, TVD-Fersen-Zehen-Unterschied.

Ähnliche Ergebnisse hinsichtlich der Rangfolge der Prädiktorvariablen1.

In dieser Studie wurde beobachtet, dass \({q}_{i}\), die Menge des Stützmittels und die Menge der Frakturierungsflüssigkeit die wichtigsten Prädiktoren sind, die die Vorhersage des Geschwindigkeitsrückgangs von Testbohrungen beeinflussen, was wiederum auch mit den allgemeinen Konzepten übereinstimmt des Flüssigkeitsflusses.

Eine explorative Analyse zeigt, dass die Menge an \({q}_{i}\) und Stützmittel im Cluster Nr. verwendet wird. 4 Brunnen sind viel höher als die in Cluster Nr. 1, was auf die Existenz einer signifikanten positiven Korrelation zwischen \({q}_{i}\) und der Menge des verwendeten Stützmittels schließen lässt.

Die Prädiktorparameter wurden mithilfe von maschinellem Lernen effektiv mit den SEDM-Abnahmekurvenparametern (n und τ) in einer zufälligen Sammlung von Bakken Shale-Ölbohrlochdaten korreliert. Die Rückgangskurven der Öldurchflussrate der Testbohrungen wurden erfolgreich vorhergesagt und mit den tatsächlichen Felddaten abgeglichen. Daher kann maschinelles Lernen als zuverlässige Alternative zur Reservoirsimulation angesehen werden.

Diese Studie nutzte explorative Analysen, maschinelle Lernmodelle und menschliches Urteilsvermögen, um bessere Schlussfolgerungen aus den Bakken-Ölschieferdaten zu ziehen.

Die Variablenrangfolge zeigt, dass \({q}_{i}\) der wichtigste Prädiktor ist, während die TVD-Fersen-Zehen-Differenz der unwichtigste Prädiktor ist.

Der Hauptgrund dafür, dass die TVD-Fersen-Zehen-Differenz der am wenigsten wichtige Prädiktor ist, ist die leichte Abweichung in den Daten, da alle in dieser Studie verwendeten Bohrlöcher aus demselben Landkreis stammen, d. h. alle Bohrlöcher lagen nahe beieinander.

In dieser Studie wurden die Rückgangskurven auf große Zeiträume, beispielsweise 30 Jahre, extrapoliert und eine numerische Integration zur Bestimmung der tatsächlichen EUR-Werte eingesetzt. Da EUR auf Basis von Qi berechnet wird, ist Qi der wichtigste Prädiktor, der sich auf EUR auswirkt. Es wird also eine starke Korrelation zwischen den beiden geben.

Das hyperbolische Modell hatte besondere Schwierigkeiten bei der Korrelation mit langfristigen Reserveprognosen. Um dieses Problem zu lösen, hat Valko das SEDM formuliert, bei dem die Produktionsrate mit der Zeit abnimmt, wie in Gleichung (1) gezeigt. (1):

Dabei ist q(t) die Rate zu einem Zeitpunkt t, STB/Monat, qi ist die Anfangsrate, STB/Monat, τ ist die charakteristische Relaxationszeit, Monate, n ist der Exponentenparameter, dimensionslos, t ist die Zeit, Monate.

„Im Vergleich zur Arps-Formalisierung bietet der neue Ansatz zahlreiche Vorteile; Die beiden wichtigsten davon sind die begrenzte Natur des EUR aus jedem einzelnen Bohrloch und das lineare Verhalten des Ausdrucks des Gewinnungspotenzials gegenüber der kumulierten Produktion. Für positives n, τ und \({q}_{o}\) liefert das Modell einen endlichen Wert des EUR, auch wenn weder zeitlich noch kursmäßig ein Cutoff verwendet wird. (Leider führt die Arps-Kurvenfamilie zu einer unbegrenzten und physikalisch unmöglichen Schätzung von EUR für b ≥ 1). Sobald die Parameter n und \({q}_{o}\) bestimmt sind, kann aus den Raten ein geradliniges Diagramm des Erholungspotenzials gegenüber der kumulierten Produktion erstellt werden und der EUR kann als x-Achsenabschnitt gelesen werden. (Für die Arps-Modellfamilie kann das Konzept des Wiederherstellungspotenzials nicht einmal für b ≥ 1 definiert werden)“5. Daher wurde in dieser Studie nur SEDM eingesetzt.

In dieser Studie wurde RF für Testbohrungen eingesetzt, um SEDM-Modellparameter, Rückgangskurven und EUR vorherzusagen, da es sich um einen der am häufigsten verwendeten Algorithmen für maschinelles Lernen handelt. Es lieferte hervorragende Vorhersageergebnisse, wie in der zuvor veröffentlichten Literatur1 dargestellt.

Nachfolgend finden Sie eine kurze Beschreibung von Random Forest (RF):

Ein Random Forest ist ein maschineller Lernansatz, der aus vielen unkorrelierten Bäumen (Klassifizierungs- oder Regressionsbäumen) besteht, die jeweils mithilfe einer Bootstrap-Unterstichprobe von Trainingsdaten und einer Unterstichprobe von Prädiktorvariablen modelliert werden. Eine gemittelte Antwort wird verwendet, um die endgültige Testdatenvorhersage zu erstellen. Ein Regressionsbaum wird durch wiederholte Partitionierung des variablen Datenraums gebildet, sodass die Residual Sum of Square (RSS) an jedem Knoten reduziert wird. Aus Trainingsdaten wird mit replacement1 ein Bootstrap-Datenbeispiel abgerufen.

Residual Sum of Squares, RSS ist gegeben durch:

c ist die Nr. der Knoten ist \({n}_{c}\) die Anzahl. der Datenpunkte in einem Knoten ist \({y}_{i}\) der beobachtete oder tatsächliche Antwortwert.

Um dies zu erreichen, wird jeder Knoten aufgeteilt, um den RSS auf das Größte zu reduzieren. Dies erfolgt durch Gegenüberstellung mehrerer Aufteilungsmöglichkeiten unter Verwendung verschiedener Variablen und Aufteilungspunkte innerhalb dieser Variablen. Wenn eine Aufteilung abgeschlossen ist, werden zwei Knoten erstellt und dann werden weitere Aufteilungen durchgeführt, bis die Anzahl der Datenpunkte in jedem Knoten einen vorgegebenen Grenzwert erreicht1.

Die für das ML-Modell verwendeten Hyperparameter sind wie folgt:

Die maximale Anzahl. Die Zahl der für dieses Modell verwendeten Entscheidungsbäume beträgt 100.

Das für dieses Modell verwendete Kriterium ist RMSE.

Die maximale Tiefe in einem Entscheidungsbaum ist zulässig, bis die Reinheit erreicht ist.

Die maximale Anzahl. Die Anzahl der an jedem Knoten festgelegten Teilungen beträgt 6.

In dieser Studie wurde das Variablenranking verwendet, um zu zeigen, welche Variablen einen signifikanten Einfluss auf die Vorhersage des Ratenrückgangs haben, und um sie in der Reihenfolge ihrer Priorität zu ordnen. Es kann auch zur Eliminierung der Features verwendet werden, aber aufgrund der begrenzten Datenverfügbarkeit wird der gesamte Datensatz genutzt und keines der Features wurde entfernt. Diese Datenanalyse wurde durchgeführt, um den Datensatz gründlich zu verstehen, bevor er für Vorhersagen verwendet wird.

Um dies zu erreichen, wurden in dieser Studie zwei Algorithmen eingesetzt:

Klassifizierung mittels Chi-Quadrat-Test (χ2).

Regression mit F-Tests (fsrftest).

Der Chi-Quadrat-Test ist eine statistische Methode, die nur dann eingesetzt werden kann, wenn die Teststatistik unter der Nullhypothese Chi-Quadrat-verteilt ist. Es wird verwendet, um das Vorhandensein eines statistisch signifikanten Unterschieds zwischen der erwarteten und der tatsächlichen Häufigkeit in einer oder mehreren Kategorien einer Kontingenztabelle zu testen. Es werden einzelne Chi-Quadrat-Tests durchgeführt, um zu bestimmen, ob jeder Parameter unabhängig von einem Antwortparameter8 ist.

Die folgende Formel wird verwendet, wenn χ2 zum Testen der gegenseitigen Abhängigkeiten zwischen Variablen verwendet wird:

wobei O die beobachteten Häufigkeiten der Einträge der Tabelle darstellt, E die erwarteten Häufigkeiten der Einträge der Tabelle darstellt.

Der F-Test ist ein statistischer Test, der an einen Datensatz angepasste statistische Modelle vergleicht, um das Modell zu ermitteln, das am besten zu der Population passt, aus der die Daten entnommen wurden. Es vergleicht statistische Modelle, die mit einem Datensatz ausgestattet sind, um das Modell zu ermitteln, das am besten zu der Population passt, aus der die Daten entnommen wurden. Sie ergibt sich aus der Auswertung einer Zerlegung der Variabilität in einem Datensatz in Form von Quadratsummen und reagiert empfindlich auf Nichtnormalität9.

In dieser Studie wurden Daten von der Website des Montana Board of Oil and Gas Conservation gesammelt. Die Ausreißerbohrungen, also Bohrungen mit höheren oder niedrigeren Produktions- oder Fertigstellungsmerkmalen, wurden entfernt. Für diese Studie wurden nur Bohrlöcher berücksichtigt, die eine Produktionsgeschichte von mehr als 96 Monaten (dh 8 Jahren) aufwiesen. Die im ML-Modell verwendeten Prädiktorvariablen sind in Tabelle 2 aufgeführt.

Die Clusteranalyse wird für die explorative Analyse verwendet, bei der Bohrlochdaten basierend auf den Quartilen der anfänglichen Flussrate (qi) in vier Cluster aufgeteilt werden (in dieser Studie wird sie als gleichwertig mit der maximalen Flussrate angesehen), die am häufigsten beobachtet wurde wichtiger Prädiktor in dieser Studie sowie in früheren Studien in einer anderen Schieferregion1,8,9. Das Hauptziel der explorativen Analyse besteht darin, Trends und die relative Bedeutung von Variablen hervorzuheben und menschliches Urteilsvermögen sowie Algorithmen für maschinelles Lernen einzubeziehen, um genauere Schlussfolgerungen zu erhalten. Wenn die Produktionsrate für eine große Anzahl von Bohrlöchern in einem bestimmten Ölfeld aufgrund begrenzter Produktionsdaten gesenkt werden muss, kann diese Methode von Vorteil sein. Im Gegensatz zu kommerziellen Reservoirsimulatoren erfordert diese Methode keine genaue Kenntnis der Reservoirmerkmale wie Kerndaten, Bohrlochprotokolldaten und andere Informationen, auf die manchmal nicht zugegriffen werden kann1,8,9.

Das Hauptziel dieser Studie ist die Entwicklung eines ML-basierten Modells, das zur Vorhersage des Produktionsrückgangs für eine große Anzahl von Bakken-Schiefer-Bohrlöchern in einem sehr kurzen Zeitraum verwendet werden kann. Diese Methode wird viel schneller sein als die kommerziellen Reservoirsimulatoren, da sie nicht die Lösung einer großen Anzahl von Finite-Differenzen-Gleichungen erfordert.

Die gesamten gesammelten Bohrdaten wurden für auf maschinellem Lernen basierende Vorhersagen verwendet. Der detaillierte Vorhersageablauf ist in Abb. 22 dargestellt. Die Daten wurden von 150 Bohrlöchern gesammelt, die über alle erforderlichen variablen Daten verfügten und auch einen gleichmäßigen Rückgang der Ölraten zeigten. Insgesamt wurden 120 Brunnen zufällig als Übungsbrunnen ausgewählt, die restlichen 30 Brunnen dienten als Testbrunnen. Mehrere der verfügbaren Parameter wurden aus dem endgültigen Datensatz entfernt, da ihre entsprechenden Werte nicht für alle ausgewählten Brunnen verfügbar waren, was darauf hinweist, dass für keinen der ausgewählten Brunnenparameter Daten verfügbar waren.

Workflow zum Erstellen mehrerer Modelle und zum Mitteln dieser Modelle (modifiziert nach Vyas et al.1).

Es wurde beobachtet, dass die Verwendung des gesamten Trainingsdatensatzes zur Entwicklung eines Modells für maschinelles Lernen aufgrund der Datenvariabilität zu erheblichen Fehlern führen kann. Um diese Einschränkung zu überwinden, umfasste ein in dieser Arbeit verwendeter alternativer Ansatz eine Kreuzvalidierung mit k-facher Validierung und Modellmittelung unter Verwendung der Ensemble-Technik (Polyak-Ruppert-Mittelung).

Schritte zum Trainieren des Modells:

Die Daten sind in zwei Kategorien unterteilt: Training und Test.

Die Trainingsdaten werden weiter in 20 Falten unterteilt.

Das Modell wurde in einer der Falten evaluiert, während die anderen Falten zum Training verwendet wurden. Daher ergeben 20 Faltungen 20 Modelle.

Am Ende des Trainings werden wir über mehrere Modelle für maschinelles Lernen verfügen, die aus einem einzigen Satz von Trainingsdaten abgeleitet werden, indem wir verschiedene Proben von Trainingsdaten verwenden, um das Problem der Überanpassung zu minimieren.

Die Abstimmungsparameter für jedes Modell in einem maschinellen Lernprozess wären unterschiedlich, was zu unterschiedlichen Vorhersagen für Testdatenquellen führen würde.

Bei jedem Modelltraining wird der RF-Algorithmus verwendet, um die optimierten Werte (dh den minimierten Fehler) von τ und n zu erhalten, wie erläutert.

Die Gewichte dieser Modelle werden mithilfe der Polyak-Ruppert-Mittelungstechnik bestimmt, die auf Testdatenfehlern basiert. Die in Schritt 1 angegebenen Beispiele von Trainingsdaten entsprechen den Testdaten hier.

Schließlich sagt der gewichtete Durchschnitt der Antworten dieser Modelle die Parameter der Abnahmekurven (n und τ) und als Ergebnis die Abnahmekurven für die Testdatenbrunnen voraus.

In dieser Studie werden nur die Bohrlöcher berücksichtigt, die einen gleichmäßigen Rückgang der Produktionsrate aufweisen. Wells mit verrauschten Daten sollten für diese Art von Studie nicht verwendet werden.

Die Daten für diese Studie stammen aus dem Ölreservoir Bakken Shale. Wenn diese Methodik auf einen neuen Datensatz angewendet wird, der zu einem anderen Bereich gehört, muss das neue ML-Modell für den neuen Datensatz trainiert werden, die Gesamtmethodik sollte jedoch gleich bleiben.

In dieser Studie wurden verschiedene wichtige Parameter wie Porosität, Permeabilität, Lagerstättendruck usw. nicht berücksichtigt, da entsprechende Daten nicht verfügbar waren.

Diese Methode erfordert die Verfügbarkeit eines guten Datensatzes für alle Parameter, um die Auswirkung aller möglichen Parameter auf die Vorhersage des Ratenrückgangs zu messen. Zukünftig könnte diese Studie ausgeweitet werden, um die entwickelte Methode auf andere Schieferöllagerstätten anzuwenden und deren Anwendbarkeit und Genauigkeit zu testen.

Alle während dieser Studie generierten oder analysierten Daten sind in diesem veröffentlichten Artikel enthalten.

Analyse der Abstiegskurve

Geschätzte endgültige Erholung

Gas-Öl-Verhältnis

Gemessene Tiefe

Zufälliger Wald

Mittlerer quadratischer Fehler

Restquadratsumme

Standardkubikfuß

Gestrecktes exponentielles Rückgangsmodell

Gesamte vertikale Tiefe

Kleinste quadratische Support-Vektor-Maschine

Künstliche neuronale Netz

Mittlere quadratische Fehler

Vyas, A., Datta-Gupta, A. und Srikanta M. (2017). Modellierung des frühen zeitlichen Rückgangs der Fördermenge in unkonventionellen Lagerstätten mithilfe von Techniken des maschinellen Lernens. in Vortrag gehalten auf der Abu Dhabi International Petroleum Exhibition & Conference, Abu Dhabi, VAE, November 2017. https://doi.org/10.2118/188231-MS.

Al-Fatlawi, O., Aswin R., Roy, V., Hossain, MM, Kabir, AH (2017). Optimierung der Infill-Bohrungen im Whicher-Range-Feld in Australien. in Vortrag gehalten auf dem SPE Kingdom of Saudi Arabia Annual Technical Symposium and Exhibition, Dammam, Saudi-Arabien, April 2017. https://doi.org/10.2118/188085-MS.

Tahmasebi, P., Javadpour, F. & Sahimi, M. Data Mining und maschinelles Lernen zur Identifizierung von Sweet Spots in Schieferlagerstätten. Expertensystem. Appl. 88, 435–447 (2017).

Artikel Google Scholar

Zou, C. et al. Geologische Bedeutung und Optimierungstechnik von Sweet Spots in unkonventionellen Schiefersystemen. J. Asiatische Erdwissenschaften. 178, 3–19 (2019).

Artikel ADS Google Scholar

Valkó, P. & W. John Lee. (2010). Eine bessere Möglichkeit, die Produktion aus unkonventionellen Gasquellen vorherzusagen. in Papierpräsentation auf der SPE Annual Technical Conference and Exhibition, Florenz, Italien, September 2010. https://doi.org/10.2118/134231-MS.

Pan, Y., Deng, L. & Lee, WJ Ein neuartiger datengesteuerter Druck-/Raten-Entfaltungsalgorithmus zur Verbesserung der Produktionsdatenanalyse in unkonventionellen Lagerstätten. J. Benzin. Wissenschaft. Ing. 192, 107332. https://doi.org/10.1016/j.petrol.2020.107332 (2020).

Artikel CAS Google Scholar

Sen, S. et al. Petrophysikalische Heterogenität des Dolomitreservoirs Alamein aus der frühen Kreidezeit des Ölfelds North Razzak, Ägypten, unter Einbeziehung von Bohrlochprotokollen, Kernmessungen und maschinellem Lernansatz. Kraftstoff 306, 121698. https://doi.org/10.1016/j.fuel.2021.121698 (2021).

Artikel CAS Google Scholar

Bhattacharyya, S. & Vyas, A. Datengesteuerte modellbasierte Vorhersage des Ratenrückgangs in unkonventionellen Eagle-Ford-Schieferölquellen. Haustier. Wissenschaft. Technol. 40(4), 401–422. https://doi.org/10.1080/10916466.2021.1998116 (2022).

Artikel CAS Google Scholar

Bhattacharyya, S. & Vyas, A. Auf maschinellem Lernen basierende Vorhersage des Ratenrückgangs in unkonventionellen Lagerstätten. Upstream-Öl-Gas-Technologie. 8, 100064. https://doi.org/10.1016/j.upstre.2022.100064 (2022).

Artikel Google Scholar

Mohammad, AA, Mohammad, E., Amin, S. & Seyed, MJM Entwicklung eines künstlichen neuronalen Netzwerks und eines imperialistischen Wettbewerbsalgorithmus zur Vorhersage der Öldurchflussrate des Reservoirs. Appl. Soft Comput. 13(2), 1085–1098. https://doi.org/10.1016/j.asoc.2012.10.009 (2012).

Artikel Google Scholar

Mohammad, AA & Zhangxing, C. Vergleich maschineller Lernmethoden zur Schätzung der Permeabilität und Porosität von Öllagerstätten anhand petrophysikalischer Protokolle. Petroleum. 5(3), 271–284. https://doi.org/10.1016/j.petlm.2018.06.002 (2019).

Artikel Google Scholar

Wang, S., Qin, C., Feng, Q., Javadpour, F. & Rui, Z. Ein Framework zur Vorhersage der Produktionsleistung unkonventioneller Ressourcen mithilfe von Deep Learning. Appl. Energie. 295, 117016. https://doi.org/10.1016/j.apenergy.2021.117016 (2021).

Artikel Google Scholar

Bhark, EW, Jafarpour, B. & Datta-Gupta, A. Eine verallgemeinerte, auf Netzkonnektivität basierende Parametrisierung für die Kalibrierung von Strömungsmodellen unter der Oberfläche. Wasserressource. Res. 47, W06517. https://doi.org/10.1029/2010WR009982 (2011).

Artikel ADS Google Scholar

Datta-Gupta, A., Xie, J., Neha, G., Michael, K. & Lee, W. Untersuchungsradius und seine Verallgemeinerung auf unkonventionelle Reservoirs. J. Benzin. Technol. 63, 52–55. https://doi.org/10.2118/0711-0052-JPT (2011).

Artikel Google Scholar

Yin, J., Xie, J., Datta-Gupta, A. & Hill, AD Verbesserte Charakterisierung und Leistungsvorhersage von Schiefergasbohrungen durch Integration stimulierter Lagerstättenvolumina und dynamischer Produktionsdaten. J. Benzin. Wissenschaft. Ing. 127, 124–136. https://doi.org/10.1016/j.petrol.2015.01.030 (2015).

Artikel CAS Google Scholar

Zhuoyi, Li., Yin, J., Zhu, D. & Datta-Gupta, A. Verwendung von Bohrlochtemperaturmessungen zur Unterstützung der Lagerstättencharakterisierung und -optimierung. J. Benzin. Wissenschaft. Ing. https://doi.org/10.1016/j.petrol.2011.06.012 (2011).

Artikel Google Scholar

Erdgasintelligenz. (nd). Aktualisiert am 9. Dezember 2021. https://www.naturalgasintel.com/information-about-the-bakken-shale. Zugriff am 8. März 2021

Referenzen herunterladen

Die Autoren sind dankbar für die Laboreinrichtungen, die vom Deysarkar Centre of Excellence in Petroleum Engineering des IIT Kharagpur bereitgestellt werden. Die Autoren möchten auch dem Montana Board of Oil and Gas Conservation für die Gewährung des Zugriffs auf ihre Datenbank danken.

Deysarkar Centre of Excellence in Petroleum Engineering, Indian Institute of Technology Kharagpur, Kharagpur, Westbengalen, Indien

Subhrajyoti Bhattacharyya und Aditya Vyas

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Beide Autoren waren gleichermaßen an Design, Methodik, Konzeptualisierung, Validierung, Manuskripterstellung und Überprüfung beteiligt.

Korrespondenz mit Subhrajyoti Bhattacharyya.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Bhattacharyya, S., Vyas, A. Anwendung von maschinellem Lernen zur Vorhersage des Ölpreisrückgangs für Bakken-Schieferölquellen. Sci Rep 12, 16154 (2022). https://doi.org/10.1038/s41598-022-20401-6

Zitat herunterladen

Eingegangen: 25. Juni 2022

Angenommen: 13. September 2022

Veröffentlicht: 28. September 2022

DOI: https://doi.org/10.1038/s41598-022-20401-6

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.