ON CERTAIN APPROACHES TO SOLVING THE PROBLEM OF SENTIMENT CLASSIFICATION OF A TEXT: AN ANALYSIS OF ENGLISH REVIEWS
https://doi.org/10.34822/1999-7604-2022-2-14-19
Abstract
The article discusses methods for automatic text sentiment analysis. The study analyzes the results obtained via the analysis and software implementation of the methods for determining text emotionality. A method based on weight coefficients was proposed for solving the problems in question, and its efficiency was analyzed. Separately, basic algorithms for a text model were discussed and text preprocessing was carried out. The practice section of the article includes an application of the methods on real data, namely, a sentiment analysis of English-language reviews of various films published at www.imdb.com. All methods applied showed 80 % of accuracy in review classification.
About the Authors
E. R. BoltachevaRussian Federation
Master’s Degree Student
E-mail: katya473@mail.ru
S. A. Nikitina
Russian Federation
Candidate of Sciences (Physics and Mathematics), Associate Professor
E-mail: nikitina@csu.ru
References
1. Рубцова Ю. В. Построение корпуса текстов для настройки тонового классификатора // Программные продукты и системы. 2015. № 1 (109). С. 72–78.
2. Гаршина В. В., Калабухов К. С., Степанцов В. А., Смотров С. В. Разработка системы анализа тональности текстовой информации // Вестн. ВГУ. Сер.: Систем. анализ и информ. технологии. 2017. № 3. С. 185–194.
3. Пархоменко П. А., Григорьев А. А, Астраханцев Н. А. Обзор и экспериментальное сравнение методов кластеризации текстов // Тр. ИСП РАН. 2017. Т. 29, Вып. 2. С. 161–200.
4. Глазкова А. В. Оценка результативности применения расстояний Евклида и Махаланобиса для решения одной из задач классификации текстов // Вестн. Дагестан. гос. технич. ун-та. Технич. науки. 2017. № 44 (1). С. 86–93.
5. Валиев А. И., Лысенкова С. А. Применение методов машинного обучения для автоматизации процесса анализа содержания текста // Вестник кибернетики. 2021. № 4 (44). С. 12–15.
6. Клековкина М. В., Котельников Е. В. Метод автоматической классификации текстов по тональности, основанный на словаре эмоциональной лексики // Электрон. библиотеки: перспектив. методы и технологии, электрон. коллекции : труды 14-й Всерос. науч. конф. (RCDL-2012). Переславль-Залесский, 2012. С. 81–86.
7. Потапенко А. А. Семантические векторные представления текста на основе вероятностного тематического моделирования : дис. … д-ра ф.-м. наук. М., 2018. 147 с.
8. Гомзин А. Г., Коршунов А. В. Тематическое моделирование текстов на естественном языке // Тр. ИСП РАН. 2012. № 23. С. 215–244.
9. Воронцов К. В. Аддитивная регуляризация тематических моделей коллекций текстовых документов // Докл. РАН. 2014. Т. 455, № 3. С. 268–271.
10. Никитина С. А., Болтачева Е. Р. Preprocessing Text Information. Свидетельство о регистрации программы для ЭВМ RU 2022614365 от 21.03.2022. Заявка № 2022611703 от 09.02.2022.
Review
For citations:
Boltacheva E.R., Nikitina S.A. ON CERTAIN APPROACHES TO SOLVING THE PROBLEM OF SENTIMENT CLASSIFICATION OF A TEXT: AN ANALYSIS OF ENGLISH REVIEWS. Proceedings in Cybernetics. 2022;(2 (46)):14-19. (In Russ.) https://doi.org/10.34822/1999-7604-2022-2-14-19