INFORMATION SYSTEM MODULE BASED ON NAIVE BAYES CLASSIFIER FOR PHARMACY OPERATION AUTOMATION
https://doi.org/10.35266/1999-7604-2024-2-8
Abstract
The introduction of the automation and management principles for pharmacists’ activities using information systems is an effective way to increase profi ts and strengthen pharmacy profi tability. Companies use machine learning algorithms to adjust their strategy, study customer reviews about their organization through feedback analysis, and improve the company’s image. However, a signifi cant amount of pharmacists’ time and effort goes into the manual processing of incoming reviews. The article proposes automating the processing using the naive Bayes classifi er algorithm, which is implemented in Python. To train the classifi er, the authors created their own corpus of labeled review texts with two categories, with the total number of reviews being about 500. A parser written in Python was used to search for reviews. The following steps were taken during the preliminary processing of the reviews’ text: lemmatization, elimination of punctuation, the text’s letter conversion to lower case, tokenization, stop words removal, and text vectorization using the bag-of-words model. According to the numerical experiments carried out, the classifier’s highest accuracy was achieved with an 80/20 ratio of training and test samples that did not include stop words. When using a classifi er, analyzing 100 reviews takes 8 times less time than manual reading. The classifi er itself can be presented as a separate application or as a module within an information system. Thus, the increasing number of positive reviews is an indicator of the company’s effi cient performance as well as the number of satisfi ed customers. The growth of its image will strengthen customers’ loyalty to the company, resulting in greater sales.
About the Authors
Kirill V. SvyatovRussian Federation
Candidate of Sciences (Engineering), Docent
Vadim S. Moshkin
Russian Federation
Candidate of Sciences (Engineering), Docent
Igor A. Shchukarev
Russian Federation
Candidate of Sciences (Physics and Mathematics)
References
1. Белоконев С. Ю., Крохина В. О., Дронов А. И. Технологии имиджевого позиционирования компаний табачного и фармацевтического рынков в условиях рыночной конкуренции // Известия Тульского государственного университета. Гуманитарные науки. 2020. № 2. С. 93–101.
2. Гуськова О. В. Репутационный маркетинг как инструмент генерирования, мотивации, популяризации компании в интернет-среде // Инновационное развитие экономики. 2022. № 1–2. С. 138–143.
3. Скрипко А. А., Фёдорова Н. В., Клименкова А. А. Информационные технологии в фармации. В 4 ч. Ч. 4. Комплексная автоматизация деятельности аптечных организаций. Иркутск : ИГМУ, 2020. 84 с.
4. Сидикова Г. Р. Методы и инструменты сентимент-анализа // Современные проблемы лингвистики и методики преподавания русского языка в ВУЗе и школе. 2022. № 34. С. 974–985.
5. Большаков Н. И., Сидорова Е. В. Сравнительный анализ методов машинного обучения для задач классификации данных // Математические методы в технологиях и технике. 2023. № 8. С. 66–71. DOI 10.52348/2712-8873_MMTT_2023_8_66.
6. Богданова Д. Р. Оценка степени удовлетворенности клиентов сферы услуг на основе учета их эмоционально окрашенной информации // Системная инженерия и информационные технологии. 2021. Т. 3, № 3. С. 72–81.
7. Любченко М. А. Об одном опыте анализа данных и извлечения информации о программном продукте // Системная инженерия и информационные технологии. 2021. Т. 3, № 2. С. 75–80.
8. Farisi A. A., Sibaroni Y., Faraby S. A. Sentiment analysis on hotel reviews using Multinomial Naïve Bayes classifi er // Journal of Physics: Conference Series. 2019. Vol. 1192. P. 012024.
9. Кугач В. В., Рылко Я. Н. Информационное наполнение и оформление интернет-сайтов аптечных организаций // Вестник фармации. 2022. № 1. С. 28–41.
10. Федяева И. А. Разработка метода отслеживания зависимостей для кэша вывода типов статического анализатора кода среды разработки Pycharm // XXIV Всерос. студенч. науч.-практич. конф., 05–06 апреля 2022 г., г. Нижневартовск. Ч. 3. Нижневартовск : Нижневартовский государственный университет, 2022. С. 209–214.
11. Хисамутдинов Д. С., Рыженко И. А., Павлова К. А. Автоматическая классификация документов // Научный альманах Центрального Черноземья. 2022. № 1–7. С. 143–157.
12. Томашевская В. С., Старичкова Ю. В., Яковлев Д. А. Использование машинного обучения для распознавания текстовых шаблонов литературных источников // Известия высших учебных заведений. Поволжский регион. Технические науки. 2022. № 3. С. 15–26. DOI 10.21685/2072-3059-2022-3-2.
13. Дрянкова Д. А. Искусственный интеллект в языке программирования Python // Modern Science. 2023. № 6–2. С. 15–19.
14. Болтовский Г. А. Создание парсера на языке Python с использованием библиотеки BeautifulSoup // Постулат. 2022. № 6. С. 1–6.
15. Максимова В. П., Черемных Е. О. Зависимость скорости чтения текста от формата носителя // Инновационное развитие регионов: потенциал науки и современного образования : материалы II Национал. науч.-практич. конф., 07 февраля 2019 г., г. Астрахань. Астрахань : Информационно-издательский центр, 2019. С. 176–178.
16. Щукарев И. А., Маркова Е. В. Разработка генератора паролей с использованием GUI MATLAB // Программные продукты и системы. 2022. № 3. С. 413–419.
Review
For citations:
Svyatov K.V., Moshkin V.S., Shchukarev I.A. INFORMATION SYSTEM MODULE BASED ON NAIVE BAYES CLASSIFIER FOR PHARMACY OPERATION AUTOMATION. Proceedings in Cybernetics. 2024;23(2):62-70. (In Russ.) https://doi.org/10.35266/1999-7604-2024-2-8