Preview

Вестник кибернетики

Расширенный поиск

О НЕКОТОРЫХ ПОДХОДАХ К РЕШЕНИЮ ЗАДАЧИ КЛАССИФИКАЦИИ ТЕКСТОВ ПО ТОНАЛЬНОСТИ НА ПРИМЕРЕ АНАЛИЗА АНГЛОЯЗЫЧНЫХ ОТЗЫВОВ

https://doi.org/10.34822/1999-7604-2022-2-14-19

Полный текст:

Аннотация

Рассмотрены способы автоматического определения тональности текста. Проведены разбор и программная реализация методов определения эмоциональной окраски текстовой информации с последующим анализом полученных результатов. Для решения поставленных задач предложен метод, основанный на весовых коэффициентах, проанализирована его эффективность. Отдельно рассмотрены базовые алгоритмы для составления текстовой модели и проведена предобработка текстовой информации. В практической части работы методы протестированы на реальных данных: проведен тоновый анализ англоязычных отзывов о различных фильмах, взятых с сайта www.imdb.com. Точность классификации отзывов для всех реализованных методов составила более 80 %.

Об авторах

Е. Р. Болтачева
Челябинский государственные университет, Челябинск
Россия

магистрант

E-mail: katya473@mail.ru



С. А. Никитина
Челябинский государственные университет, Челябинск
Россия

кандидат физико-математических наук, доцент

E-mail: nikitina@csu.ru



Список литературы

1. Рубцова Ю. В. Построение корпуса текстов для настройки тонового классификатора // Программные продукты и системы. 2015. № 1 (109). С. 72–78.

2. Гаршина В. В., Калабухов К. С., Степанцов В. А., Смотров С. В. Разработка системы анализа тональности текстовой информации // Вестн. ВГУ. Сер.: Систем. анализ и информ. технологии. 2017. № 3. С. 185–194.

3. Пархоменко П. А., Григорьев А. А, Астраханцев Н. А. Обзор и экспериментальное сравнение методов кластеризации текстов // Тр. ИСП РАН. 2017. Т. 29, Вып. 2. С. 161–200.

4. Глазкова А. В. Оценка результативности применения расстояний Евклида и Махаланобиса для решения одной из задач классификации текстов // Вестн. Дагестан. гос. технич. ун-та. Технич. науки. 2017. № 44 (1). С. 86–93.

5. Валиев А. И., Лысенкова С. А. Применение методов машинного обучения для автоматизации процесса анализа содержания текста // Вестник кибернетики. 2021. № 4 (44). С. 12–15.

6. Клековкина М. В., Котельников Е. В. Метод автоматической классификации текстов по тональности, основанный на словаре эмоциональной лексики // Электрон. библиотеки: перспектив. методы и технологии, электрон. коллекции : труды 14-й Всерос. науч. конф. (RCDL-2012). Переславль-Залесский, 2012. С. 81–86.

7. Потапенко А. А. Семантические векторные представления текста на основе вероятностного тематического моделирования : дис. … д-ра ф.-м. наук. М., 2018. 147 с.

8. Гомзин А. Г., Коршунов А. В. Тематическое моделирование текстов на естественном языке // Тр. ИСП РАН. 2012. № 23. С. 215–244.

9. Воронцов К. В. Аддитивная регуляризация тематических моделей коллекций текстовых документов // Докл. РАН. 2014. Т. 455, № 3. С. 268–271.

10. Никитина С. А., Болтачева Е. Р. Preprocessing Text Information. Свидетельство о регистрации программы для ЭВМ RU 2022614365 от 21.03.2022. Заявка № 2022611703 от 09.02.2022.


Рецензия

Для цитирования:


Болтачева Е.Р., Никитина С.А. О НЕКОТОРЫХ ПОДХОДАХ К РЕШЕНИЮ ЗАДАЧИ КЛАССИФИКАЦИИ ТЕКСТОВ ПО ТОНАЛЬНОСТИ НА ПРИМЕРЕ АНАЛИЗА АНГЛОЯЗЫЧНЫХ ОТЗЫВОВ. Вестник кибернетики. 2022;(2 (46)):14-19. https://doi.org/10.34822/1999-7604-2022-2-14-19

For citation:


Boltacheva E.R., Nikitina S.A. ON CERTAIN APPROACHES TO SOLVING THE PROBLEM OF SENTIMENT CLASSIFICATION OF A TEXT: AN ANALYSIS OF ENGLISH REVIEWS. Proceedings in Cybernetics. 2022;(2 (46)):14-19. (In Russ.) https://doi.org/10.34822/1999-7604-2022-2-14-19

Просмотров: 98


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1999-7604 (Online)