APPLICATION OF METHOD OF ANTIROBUST ESTIMATION OF PARAMETERS FOR DATA SAMPLING CLUSTERING
https://doi.org/10.34822/1999-7604-2021-3-46-50
Abstract
The article presents an algorithm of data clustering based on the construction of linear regression model with application of method of antirobust estimation of parameters. The algorithm has a property of equity of the number of maximum module approximation errors to the number of parameters plus one. Three clusters of data selecting, with modeling of loading volumes at the Russian Federation railways, are formulated based on the statistical data for the period of 2005–2018.
About the Author
S. I. NoskovRussian Federation
Е-mail: sergey.noskov.57@mail.ru
References
1. Ellefsen K. J., Smith D. B. Manual Hierarchical Clustering of Regional Geochemical Data Using a Bayesian Finite Mixture Model // Applied Geochemistry. 2016. Vol. 75. P. 200–210.
2. Yun U., Ryang H., Kwon O. C. Monitoring Vehicle Outliers Based on Clustering Technique // Applied Soft Computing Journal. 2016. Vol. 49. P. 845–860.
3. Sumiyana S., Atmini S., Sugiri S. Predictive Power of Aggregate Corporate Earnings and their Components for Future GDP Growths: An International Comparison // Economics and Sociology. 2019. Vol. 12, Is. 1. P. 125–142.
4. Hirano K., Wright J. H. Forecasting With Model Uncertainty: Representations and Risk Reduction // Econometrica. 2017. Vol. 85. P. 617–643.
5. Han L., Tan K. M., Yang T., Zhang T. Local Uncertainty Sampling for Large-Scale Multiclass Logistic Regression // Annals of Statistics. 2020. Vol. 48, Is. 3. P. 1770–1788.
6. Бодянский Е. В., Винокурова Е. А., Пелешко Д. Д. Информационная технология кластеризации данных в условиях короткой обучающей выборки на основе ассоциативной вероятностной нейро-фаззи системы // Управляющие системы и машины. 2014. № 4. С. 73–76.
7. Кирилюк И. Л., Сенько О. В. Оценка качества кластеризации панельных данных с использованием методов Монте-Карло (на примере данных российской региональной экономики) // Компьютерные исследования и моделирование. 2020. Т. 12, № 6. С. 1501–1513.
8. Уткин Л. В., Жук Ю. А. Робастная модификация метода k-средних для кластеризации интервальных данных // Известия Санкт-Петербург. лесотехнич. акад. 2016. № 216. С. 255–266.
9. Анищенко В. В., Вятченин Д. А., Доморацкий А. В., Тати Р., Фисенко В. К. Метод быстрого прототипирования систем нечеткого вывода при неизвестном числе классов // Искусственный интеллект. 2013. № 3. С. 307–315.
10. Кирпичников А. П., Ризаев И. С., Тахавова Э. Г., Сафаров Н. И. Разработка эффективного алгоритма иерархической кластеризации // Вестник Технолог. ун-та. 2019. Т. 22, № 10. С. 117–122.
11. Островский А. А. Реализация параллельного выполнения алгоритма FCM-кластеризации // Прикладная информатика. 2009. № 2. С. 101–106.
12. Аверченков В. И., Казаков П. В. Эволюционный метод поиска оптимальных решений для задач со множеством экстремумов // Вестник компьютерных и информационных технологий. 2010. № 5. С. 3–11.
13. Емельянов В. В., Курейчик В. В., Курейчик В. М. Теория и практика эволюционного моделирования. М. : Физматлит, 2003. 431 с.
14. Курейчик В. М. Генетические алгоритмы и их применение. 2-е изд., перераб. и доп. Таганрог : Изд-во ТРТУ, 2002. 242 с.
15. Гладков Л. А., Зинченко Л. А., Курейчик В. В. и др. Методы генетического поиска. Таганрог : Изд-во ТРТУ, 2002. 122 с.
16. Пупков К. А., Феоктистов В. А. Алгоритм дифференциальной эволюции для задач технического проектирования // Информационные технологии. 2004. № 8. С. 25–31.
17. Носков С. И., Ильюшонок Д. М. Подход к кластеризации выборки данных на основе метода наименьших модулей // Южно-Сибир. науч. вестн. 2020. № 6. С. 255–259.
18. Лакеев А. В., Носков С. И. Метод наименьших модулей для линейной регрессии: число нулевых ошибок аппроксимации // Современные технологии. Системный анализ. Моделирование. 2012. № 2 (34). С. 48–50.
19. Носков С. И. Компромиссные паретовские оценки параметров линейной регрессии // Математическое моделирование. 2020. Т. 32, № 11. С. 70–78.
20. Носков С. И. Метод антиробастного оценивания параметров линейной регрессии: число максимальных по модулю ошибок аппроксимации // Южно-Сибир. науч. вестн. 2020. № 1. С. 51–54.
21. Базилевский М. П. Отбор информативных операций при построении линейно-неэлементарных регрессионных моделей // International Journal of Open Information Technologies. 2021. Т. 9, № 5. С. 30–35.
22. Базилевский М. П. Многокритериальный подход к построению моделей парно-множественной линейной регрессии // Известия Саратов. ун-та. Сер.: Математика. Механика. Информатика. 2021. Т. 21, № 1. С. 88–99.
23. Базилевский М. П. Построение степенно-показательных регрессионных моделей и их интерпретация // Вестник Воронеж. гос. ун-та. Сер. Системный анализ и информ. технологии. 2020. № 4. С. 19–28.
24. Носков С. И. Точечная характеризация множества Парето в линейной многокритериальной задаче // Современные технологии. Системный анализ. Моделирование. 2008. № 1. С. 99–101.
25. Носков С. И., Перфильева К. С. Моделирование объема погрузки на железнодорожном транспорте методом смешанного оценивания // Известия Тульск. гос. ун-та. Технич. науки. 2021. № 2. С. 148–153.
Review
For citations:
Noskov S.I. APPLICATION OF METHOD OF ANTIROBUST ESTIMATION OF PARAMETERS FOR DATA SAMPLING CLUSTERING. Proceedings in Cybernetics. 2021;(3 (43)):46-50. (In Russ.) https://doi.org/10.34822/1999-7604-2021-3-46-50