Preview

Proceedings in Cybernetics

Advanced search

METHODS OF SELECTING SIGNIFICANT FEATURES IN A MODEL FOR ASSESSING THE EFFICIENCY OF WELL OPERATIONS

https://doi.org/10.34822/1999-7604-2020-1-22-34

Abstract

The article presents the results of geological, material and technological features selection of oil well’s efficiency for a regression model that evaluatestheir productivity. The methods of the forward, backward selection of variables and the method based on a random forest are considered. The advantages and disadvantages of the application of these methods in the subject field are revealed, and a comparative analysis is carried out based on an assessment of the model’s accuracy according to the number of the selected features. The adequacy of the obtained regression models is confirmed.

About the Authors

A. Yu. Virstyuk
Surgut State University, Surgut, Russia
Russian Federation
E-mail: eaafit@gmail.com


A. A. Egorov
Surgut State University, Surgut, Russia
Russian Federation


References

1. Вирстюк А. Ю. Основные этапы создания модели эффективности работы нефтяных скважин // Наука и инновации XXI века : сб. ст. по материалам V Всерос. конф. молодых ученых : в 3 т. Сургут : ИЦ СурГУ, 2018. Т. 1. С. 19–21.

2. Афанаскин И. В., Крыганов П. В., Вольпин С. Г., Егоров А. А. Анализ добычи. Комплексирование исследований скважин и численного моделирования разработки нефтяных месторождений в рамках учебного проекта «Цифровое месторождение» / Сургут. гос. ун-т; Научно-исслед. ин-т системных исслед. Рос. Акад. Наук; Рос. Фед. Ядерный центр // Северный регион: наука, образование, культура. 2015. № 2. С. 8–18.

3. Азиз Х., Сеттари Э. Математическое моделирование пластовых систем. М. : Ин-т компьютер. Исслед., 2004. 416 с.

4. Минина И. Д. Статистика. Ч. 1. Теория статистики. Пенза: РИО ПГСХА, 2013. 225 с.

5. Feature Engineering. URL: https://nagornyy.me/courses/data-science/feature_engineering/ (дата обращения: 03.01.2020).

6. Чистяков С. П. Случайные леса: обзор // Тр. Карел. науч. центра РАН. 2013. № 1. С. 117–136.

7. Breiman L. Out-of-bag estimation // Technical report, Statistics Department University of California, Berkeley. 1996. P. 1–13. URL: https://www.stat.berkeley.edu/~breiman/ OOBestimation.pdf (дата обращения: 20.03.2020).

8. Элбон К. Машинное обучение с использованием Python. Сб. рецептов. СПб. : БХВ-Петербург, 2019. 384 с.

9. Дудченко П. В. Метрики оценки классификаторов в задачах медицинской диагностики // Молодежь и современ. информ. технологии : сб. тр. XVI Междунар. науч.-практ. Конф. студентов, аспирантов и молодых ученых, 3–7 декабря 2018 г. Томск : Изд-во ТПУ, 2018. С. 164–165. 10. Ohsaki M., Wang P., Matsuda K. et al. Confusion-Matrix-Based Kernel Logistic Regression

10. for Imbalanced Data Classification // IEEE Transactions on Knowledge and Data Engineering. 2017. No. 9. P. 1806–1819.

11. Шитиков В. К., Мастицкий С. Э. Классификация, регрессия и другие алгоритмы Data Mining с использованием R. 2017. URL: http://www.ievbras.ru/ecostat/Kiril/R/DM/DM_R.pdf (дата обращения: 09.02.2020).

12. Вирстюк А. Ю., Микшина В. С. Применение регрессионного анализа для оценки эффективности работы нефтяных скважин // Изв. Томск. политехнич. ун-та. Инжиниринг георесурсов. 2020. № 1. С.117–124.

13. Hastie T., Tibshirani R., Friedman J. The elements of statistical learning. Data mining, inference, and prediction. 2an ed. Switzerland: Springer, 2017. 764 p.

14. Lolon E., Hamidieh K., Weijers L. Evaluating the Relationship Between Well Parameters and Production using Multivariate Statistical Models: Middle Bakken and Three Forks Case History // SPE Hydraulic Fracturing Technology Conference. The Woodlands, Texas, 2016. P. 303–331. DOI 10.2118/179171-MS.

15. Калинин А. Г. Обработка данных методами математической статистики : моногр. Чита : ЗИП СибУПК, 2015. 106 с.

16. Дронов С. В. Методы и задачи многомерной статистики : моногр. Барнаул : Изд-во АлтГУ, 2015. 275 с.

17. Халафян А. А. STATISTICA 6. Статистический анализ данных. М. : ООО «Бином –Пресс», 2007. 512 с.


Review

For citations:


Virstyuk A.Yu., Egorov A.A. METHODS OF SELECTING SIGNIFICANT FEATURES IN A MODEL FOR ASSESSING THE EFFICIENCY OF WELL OPERATIONS. Proceedings in Cybernetics. 2020;(1 (37)):22-34. (In Russ.) https://doi.org/10.34822/1999-7604-2020-1-22-34

Views: 297


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 License.


ISSN 1999-7604 (Online)