Preview

Вестник кибернетики

Расширенный поиск

РАЗРАБОТКА АРХИТЕКТУРЫ НЕЙРОННОЙ СЕТИ ДЛЯ ПРОВЕДЕНИЯ СЕГМЕНТАЦИИ ПОЛЬЗОВАТЕЛЕЙ ПРИ ТАРГЕТИРОВАННОЙ РЕКЛАМЕ

https://doi.org/10.35266/1999-7604-2024-2-6

Содержание

Перейти к:

Аннотация

В данной работе предложен способ построения архитектуры нейронной сети для решения задачи классификации пользователей на основании сделанных ими комментариев, размещенных в открытых источниках. Для обучения нейронной сети применяется метод обратного распространения ошибки. Данные для обучения были предварительно размечены, а затем выборку разбили на три части, а именно тренировочную, валидационную и тестовую. Потребовалось провести предобработку отзывов покупателей до того, как они подавались на вход сети. Для реализации построенной модели было необходимо создать специальные словари слов, показывающих принадлежность к определенному классу. На основании полученного выходного значения построенной сети можно сделать вывод о том, к какой категории следует отнести определенных покупателей. Это позволит предприятию эффективно применять таргетированную рекламу к выявленной целевой группе потребителей.

Для цитирования:


Никитина С.А., Болтачева Е.Р. РАЗРАБОТКА АРХИТЕКТУРЫ НЕЙРОННОЙ СЕТИ ДЛЯ ПРОВЕДЕНИЯ СЕГМЕНТАЦИИ ПОЛЬЗОВАТЕЛЕЙ ПРИ ТАРГЕТИРОВАННОЙ РЕКЛАМЕ. Вестник кибернетики. 2024;23(2):49-56. https://doi.org/10.35266/1999-7604-2024-2-6

For citation:


Nikitina S.A., Boltacheva E.R. DEVELOPING A NEURAL NETWORK ARCHITECTURE TO PERFORM USER SEGMENTATION WITH TARGETED ADVERTISING. Proceedings in Cybernetics. 2024;23(2):49-56. (In Russ.) https://doi.org/10.35266/1999-7604-2024-2-6

ВВЕДЕНИЕ

В настоящее время появляются новые методы и приемы для продвижения товаров и услуг, для расширения рынка продаж; создаются и совершенствуются инструменты для их реализации. Вместе с тем можно отметить намечающиеся изменения в модели потребительского поведения. Клиенты устанавливают новые требования, а именно: быстрое удовлетворение появляющихся потребностей, персонализированный подход, кастомизация товара или услуги. Для компаний одной из приоритетных задач становится разработка технологии привлечение и удержание внимания потенциальных клиентов. Для того чтобы получить и сохранить доверие потребителя в условиях возрастающей конкуренции, специалисты по маркетингу разрабатывают и осваивают инновационные методы, в том числе на основе применения информационных технологий. Среди этих методов можно выделить таргетированную рекламу как один из действенных способов рекламы в интернете.

Таргетированная реклама (от англ. target – цель) в литературе определяется так: вид интернет-рекламы, для демонстрации которого осуществляется подбор потребительской аудитории; рекламное объявление, направленное на отображение исключительно у целевой аудитории клиентов; выборочное представление некоторого товара или услуги потребителю путем ориентации на полученную о нем информацию [1, с. 233].

Для определения целевой аудитории, для которой будет интересен определенный продукт, проводится специальный анализ на основе предварительно проведенного сбора данных.

Следует отметить, что на сегодня объем накопленного информационного контента социальных сетей огромен. Поэтому возникает необходимость автоматизации процесса указанного мониторинга. Для этого можно использовать методы анализа и классификации данных, основанные на нейросетевом подходе.

Под искусственной нейронной сетью понимается структура из связанных друг с другом нейронов. Нейроны могут быть связаны совершенно по-разному, это определяется выбранной архитектурой конкретной сети. Принцип работы нейронной сети следующий: по значениям поступающих на вход сети сигналов формируется выходной сигнал. Проще говоря, нейронную сеть можно представить в виде черного ящика, у которого есть входы и выходы, а внутри этого ящика расположено большое количество нейронов [2, с. 6].

Целью исследования является изучение вопроса применения нейронных сетей при проведении таргетированной рекламы.

В качестве задач исследования выступают:

  1. Изучение основных механизмов таргетированной рекламы.
  2. Рассмотрение базовых архитектур нейронных сетей.
  3. Разработка подходящей модели нейронной сети для проведения сегментации данных.

Актуальность выбранной для исследования темы определяется необходимостью проработки вопроса эффективности существующих рекламных стратегий на основе таргетинга вследствие непрерывного развития цифровых технологий.

МАТЕРИАЛЫ И МЕТОДЫ

Анализ цифровых инструментов рекламных кампаний в последнее десятилетие проводился многими авторами. Сделаем обзор некоторых научных работ, посвященных исследованию вопросов в рассматриваемой области.

Так, в [3, с. 212] авторы представили обзор подходов к построению нейронных сетей для анализа данных, размещенных в социальных сетях в свободном доступе. Описаны практические результаты, полученные для байесовского классификатора.

В статье [4, с. 112] изучались основные технологии таргет-рекламы. Была показана выгода от применения данного инструмента продвижения. При этом доказательной практической базой исследования являются данные в области интернет-маркетинга за несколько лет.

В работе [5, с. 3] проведено сравнение возможностей таргетированной рекламы для популярных социальных сетей «ВКонтакте» и «Одноклассники». В основу для сравнения положены два показателя: наличие возможности настроек подбора аудитории для демонстрации рекламных сообщений и наличие возможности рекламных форматов. Сделаны выводы, сформулированы рекомендации.

В статье [6, с. 31] рассматривается, каким образом трансформируются традиционные маркетинговые технологии в связи с возможностями, которые предлагает искусственный интеллект и машинное обучение. В исследовании [7, с. 18] проведена систематизация инструментов нескольких платформ с точки зрения использования извлеченных данных о клиентах в таргетированной рекламе. В статье [8, с. 102] доказывается важность таргетированной рекламы как части маркетинговой системы компании.

Отметим также несколько работ, в которых описаны основные методы анализа данных и нейросетевые технологии.

В статье [9, с. 8–15] сделан обзор современных архитектур нейронных сетей. Описаны важные тренды в области искусственного интеллекта. В работе [10, с. 28–31] приведена базовая терминология, приемы разработки и обучения нейросети. В материалах [11] представлена подборка сервисов аналитики, которые могут помочь упростить работу по анализу данных в социальных сетях.

На основании проведенного выше обзора научной литературы были установлены базовые механизмы осуществления таргетированной рекламы. Это позволило выявить и очертить круг решаемых задач. Установлено [12, с. 37], что главной из них является разделение пользователей социальных сетей на группы, что дает возможность в дальнейшем получить целевую аудиторию. Кроме этого, были рассмотрены некоторые современные архитектуры искусственных нейронных сетей, что помогло разработать подходящую модель нейронной сети для проведения сегментации данных.

В практической части работы решена задача классификации пользователей на основании оставленных ими отзывов. Для этого была спроектирована нейронная сеть прямого распространения [13, с. 145]. Для обучения нейронной сети выбран метод обратного распространения ошибки [14, с. 77].

Отметим, что авторами статьи ранее была рассмотрена подобная задача при классификации текстов, поэтому часть полученных в статье [15, с. 15] результатов удалось применить и при решении данной проблемы.

РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ

Особенность таргетированной рекламы состоит в том, что ее имеет смысл запускать только на основе проведенного предварительного анализа пользовательской аудитории. Определение нужного сегмента целевой аудитории для таргетинга – одна из важнейших составляющих эффективности такой рекламы. Необходимо четко понимать цели рекламной кампании и то, какие результаты планируется достичь с ее помощью. Если правильно сегментировать имеющиеся данные, то можно существенно увеличить объем и рынок продаж.

Главным преимуществом таргет-рекламы является то, что она настраивается исключительно на отдельную целевую аудиторию, которая заинтересована в предлагаемых продуктах. Другим преимуществом такого вида рекламы является ее невысокая стоимость, что позволяет снизить затраты компании.

Таргетирование состоит из нескольких этапов, каждый из них имеет свои особенности, которые необходимо обязательно учитывать для достижения цели рекламной кампании. Перечислим эти этапы.

  1. Создание портрета потребителя и поиск целевой аудитории. На этом этапе проводится сбор и анализ данных пользователей.
  2. Наполнение контента. Речь идет о наполнении страницы или сайта, на которых происходит продажа, удобной и полной информацией.
  3. Генерация рекламных сообщений. Важный этап, так как на нем выполняется создание материала, способного заинтересовать представителей целевой аудитории.

Для реализации первого пункта в части сбора сведений необходимо провести так называемое извлечение данных из информационной среды. Это возможно выполнить, например, с помощью специальной программы, называемой парсером. Данные, собранные парсером, записываются по определенным правилам в заданном формате. Парсинг позволяет собрать базу людей, которым возможно будет интересно предложение компании. Для эффективной настройки таргетированной рекламы подобный сбор информации является необходимым. Для выполнения несложного анализа можно собрать первичную информацию: пол, возраст, образование, место проживания, наличие семьи, указанные интересы и контакты. Однако для более тщательного анализа аудитории может потребоваться информация о сообществах, в которых состоят потребители, о количестве друзей, об активности за определенный период, о размещенных постах и комментариях. Отдельно можно отобрать фотографии для их дальнейшего анализа (какую одежду и каких брендов предпочитает, носит ли очки и аксессуары, увлечения, досуг, вредные привычки и т. д.).

Непосредственно анализ уже отобранных данных может быть проведен с использованием нейросетевых технологий, которые позволяют автоматически устанавливать закономерности в больших объемах данных.

При проведении второго и третьего этапов таргетирования также возможно использовать искусственные нейронные сети. Они позволяют создавать креатив как визуальный, так и текстовый. Для упрощения создания наполнения страницы или сайта можно использовать специальные нейронные сети, генерирующие нужные элементы. Процесс создания рекламных сообщений также можно «поручить» нейронным сетям. На сегодня нейросети умеют подстраивать сообщения (текст, изображение, звук) под предпочтения конкретного человека.

На текущий момент разработано большое количество видов нейронных сетей, различающихся по связям между нейронами, количеству слоев, сложности в реализации, методу обучения. Следует отметить, что архитектура нейронной сети подбирается разработчиком для каждой конкретной задачи. Существует базовые архитектуры, которые рекомендуется применять к определенным классам задач.

Следуя работе [13, с. 137], приведем базовые архитектуры искусственных нейронных сетей.

Сначала опишем полносвязную нейронную сеть. В этой сети каждый нейрон из одного слоя связан со всеми нейронами, расположенными в соседних слоях, при этом связи сети всегда направлены от входных нейронов к выходным.

Эта сеть решает задачу классификации, если нам нужно разбить данные на категории, либо задачу регрессии, если необходимо получить прогноз (предсказание) значения по входным данным. Обучение полносвязной сети обычно выполняется методом обратного распространения ошибки, построенного на базе градиентного спуска.

Для таргетированной рекламы нейросеть с такой архитектурой может применяться, например, для классификации пользователей по заданным характеристикам. Выполненная классификация позволит очертить круг потенциальных пользователей товара или услуги.

Сверточные нейронные сети – это сети, архитектура которых позволяет работать с небольшими участками входа. Основной задачей, решаемой такими нейросетями, является обработка изображений (классификация и детекция). В состав архитектуры обязательно входят сверточные слои, слои для уменьшения размера изображения и полносвязные слои (расположены перед выходным слоем и используются для классификации).

Для таргет-рекламы сверточная нейросеть может применяться, например, в случае «детального таргетирования», когда по фотографии отбираются пользователи, которые носят бороду, очки, определенные бренды и т. д.

Рекуррентные нейронные сети работают с данными, в которых присутствует временная зависимость. Связи между нейронами в этих сетях могут идти не только от текущего слоя к последующему, но и к предыдущему. Эта особенность позволяет отразить зависимость переменных задачи от значений в разные моменты времени.

Для таргетированной рекламы рекуррентная нейросеть может применяться, например, для моделирования контента. Такие сети лучше всего работают с генерацией текстов и обработкой последовательностей значений, то есть с данными, имеющими закономерности при изменении во времени.

Разработка модели нейронной сети для проведения сегментации

Рассмотрим решение задачи классификации пользователей на основании оставленных ими комментариев в социальных сетях. Как было сказано выше, для решения такой задачи лучше всего подходит нейронная сеть прямого распространения. Для обучения нейронной сети возьмем метод обратного распространения ошибки.

Данные представляют собой отзывы о некотором продукте, размещенные в открытых источниках. Требуется выполнить сегментацию пользователей, то есть разбить на группы в зависимости от оставленного комментария. Зададим три класса отзывов: позитивные, негативные и нейтральные. При проведении исследования заранее был составлен специальный словарь наиболее часто встречающихся слов в каждом из трех видов отзывов.

Поскольку обучение сети в рассматриваемой задаче предполагает процесс обучения с учителем, то необходимо, чтобы полученные данные были заранее размечены. Разметка должна соответствовать заявленным трем классам. В работе была подготовлена размеченная выборка, то есть множество объектов с известными ответами. Размеченную выборку разделили на три части: тренировочную, валидационную и тестовую выборки в пропорции 70, 10 и 20 %. Это стандартная процедура для таких задач. Тренировочная выборка непосредственно участвует в процессе обучения, валидационная понадобится для оценки качества работы спроектированной нейросети. Тестовая выборка используется для окончательной проверки работы сети после указанных двух процессов.

До того как подать на вход сети текст, надо его подготовить, то есть провести предобработку. Предобработка включает в себя следующие этапы:

Удаление «служебных» единиц текста, то есть предлогов, союзов, знаков препинания, а также лишних пробелов и т. п.

Приведение всех слов к малому регистру.

Обработка отрицаний – слияние отрицательных частиц с парными словами.

Отметим, что для выполнения предобработки нужен отдельный скрипт, созданный на основе специальных алгоритмов.

Нейроны входного слоя фактически представляют собой ранее составленный словарь часто употребляемых слов в положительных, нейтральных и негативных отзывах (отрицания включены в словарь). Перед тем как мы подаем отзыв на вход сети, мы вычленяем из него все слова согласно этому словарю. На вход в нейроны подается количество Yi вхождений определенного слова в отзыв. В дальнейшем данная величина умножается на весовой коэффициент Xij, вычисленный в процессе обучения для каждой связи. Изначально любой вес Xij полагаем равным некоторому небольшому значению. На вход в следующий слой подается величина, вычисленная по формуле Yi * Xij, i = 1, …, n, j = 1, …, n. Здесь n – размерность первого слоя (рис. 1).

Рис. 1. Схематичное описание входного слоя нейронной сети

Примечание: составлено авторами на основании данных, полученных в исследовании.

На вход в нейроны скрытого слоя подаются числа Yi * Xij, вычисленные на предыдущем слое. В дальнейшем данные величины суммируются и умножаются на весовые коэффициенты Mik, вычисляемые в процессе обучения для каждой связи сети. Размерность данного слоя соответствует размерности входного слоя. Изначально любой вес Mik равен произвольному небольшому значению. На вход в следующий слой (рис. 2) подается величина.

,

k = 1, 2, 3. Здесь n – размерность первых двух слоев сети.

Рис. 2. Схематичное описание скрытого слоя нейронной сети

Примечание: составлено авторами на основании данных, полученных в исследовании.

Следующий слой – это softmax-слой, то есть слой «сглаживания», является необходимым при классификации данных (рис. 3). Каждый нейрон данного слоя отвечает за определенный класс тональности (первый – за положительный, второй – за нейтральный, третий – за негативный).

Рис. 3. Схематичное описание softmax-слоя нейронной сети

Примечание: составлено авторами на основании данных, полученных в исследовании.

Поясним применение этого слоя. Пусть a, b, c – это положительные значения, которые выдал предыдущий слой нейронной сети.

Тогда числа

положительны и их сумма равна единице. То есть их можно интерпретировать как вероятности. Аналогичные значения определяются на данном слое нейронной сети.

Введем обозначения:

,

,

k = 1, 2, 3, l = 1, 2, 3.

На выходе слоя softmax в данной модели будет величина Vk ∈ [ 0; 1], обозначающая вероятность принадлежности отзыва к определенному классу. В результирующем слое выбирается наибольшая вероятность и выдается за результат. Если любые из двух вероятностей равны, то в результате отзыв будет определяться как нейтральный.

Обучение нейронной сети по методу обратного распространения ошибки происходит так.

  1. Выполняем инициализацию весовых коэффициентов случайным образом.
  2. Из тренировочной выборки отделяем очередную обучающую пару; подаем на вход сети входной параметр этой пары.
  3. Выполняем вычисление выходных параметров нейронной сети.
  4. Определяем разность между полученным выходом нейросети и требуемым выходом (речь идет о целевом векторе обучающей пары).
  5. Пересчитываем веса нейронной сети в целях минимизации ошибки. Точка минимума будет определять оптимальные веса.
  6. Повторяем для каждого набора из тренировочной выборки шаги 2–5, пока ошибка обучения нейронной сети на всем множестве не достигнет приемлемого уровня.

Таким образом, полностью описана математическая модель и архитектура нейронной сети, а также пошагово представлен метод ее обучения.

Предполагается, что применение такой сети позволит решать задачу сегментации пользователей, которая, в свою очередь, даст возможность персонифицировать подачу рекламы товаров и услуг.

ЗАКЛЮЧЕНИЕ

Одна из основных целей анализа данных в маркетинге состоит в том, чтобы точно сегментировать клиентов для достижения эффективного взаимодействия с ними. В условиях глобализации рынка и усиливающейся конкуренции в центре внимания производителей находятся клиенты, а именно их интересы и предпочтения. Четкое знание того, что необходимо клиентам, и поддержание их удовлетворенности позволяет компаниям обеспечивать рынок сбыта.

Использование нейросетевых технологий дает возможность автоматизировать многие трудоемкие процессы. Внедрение подобных технологий направлено на улучшение качества принимаемых решений, касающихся привлечения новых выгодных клиентов, совершенствования и сохранения взаимоотношений с уже имеющимися потребителями.

В представленной работе были рассмотрены основных этапы проведения таргетированной рекламы. Кроме этого, были разобраны базовые архитектуры искусственных нейронных сетей. Было отмечено, что для проведения каждого из этапов таргет-рекламы возможно разработать и применить подходящую нейронную сеть, которая справится с выполнением задачи наилучшим образом.

В работе отдельно рассмотрен вопрос сегментации пользователей. Было предложено использовать нейронные сети для выявления целевой группы потребителей продукции. Обосновано применение указанного подхода для данной задачи. В практической части построена архитектура полносвязной сети прямого распространения для решения задачи классификации пользователей на основе оставленных ими комментариев. Изложено выполнение работы по исследуемой теме в части получения и разметки тренировочных данных, а также составления специальных словарей. Описанная в работе сеть может быть рекомендована к использованию на практике. Это позволит предприятию эффективно применять таргетированную рекламу к выявленной целевой группе потребителей.

Список литературы

1. Жильцова О. Н., Артемьева О. А., Жильцов Д. А. Интернет-маркетинг. 2-е изд., пер. и доп. М. : Юрайт, 2023. 335 с.

2. Гафаров Ф. М., Галимянов А. Ф. Искусственные нейронные сети и приложения. Казань : Изд-во Казан. ун-та, 2018. 121 с.

3. Ищукова Е. А., Салманов В. Д., Калябин А. А. и др. Исследование алгоритмов анализа информации в социальных сетях // Современные наукоемкие технологии. 2020. № 4. С. 210–215.

4. Медведева О. С., Билюнас Д. В. Возможности таргетированной рекламы в социальных сетях // Вестник Алтайской академии экономики и права. 2019. № 3–2. С. 112–117.

5. Лучинкин В. Ю. Сравнение возможностей таргетинговой рекламы в социальных сетях «ВКонтакте» и «Одноклассники» // Наука. Общество. Государство. 2016. Т. 4, № 4. С. 1–7.

6. Старостин В. С. Трансформация маркетинговых технологий в эпоху машинного обучения // Вестник университета. 2018. № 1. С. 28–34. DOI 10.26425/1816-4277-2018-1-28-34.

7. Загорная Т. О., Баева Д. А., Коломыцева А. О. Оценка возможностей использования цифровых данных о потребителях в таргетированной рекламе // Новое в экономической кибернетике. 2020. № 2. С. 11–20.

8. Корева О. В. Таргетированная реклама как инструмент маркетинговой политики коммерческих компаний // Тенденции и технологии управления процессами и системами в современной экономике : материалы Всерос. конф., 30 марта 2022 г., г. Орел. Орел : Орловский государственный университет имени И. С. Тургенева, 2022. С. 100–106.

9. Макаренко А. В. Глубокие нейронные сети: зарождение, становление, современное состояние // Проблемы управления. 2020. № 2. С. 3–19.

10. Созыкин А. В. Обзор методов обучения глубоких нейронных сетей // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2017. Т. 6, № 3. С. 28–59.

11. 35 инструментов для аналитики социальных сетей. URL: https://popsters.ru/blog/post/35-instrumentovdlya-analitiki-socsetey (дата обращения: 17.04.2024).

12. Жильцова О. Н., Синяева И. М., Жильцов Д. А. Рекламная деятельность. М. : Юрайт, 2023. 233 с.

13. Николенко С., Кадурин А., Архангельская Е. Глубокое обучение. СПб. : Питер, 2018. 480 с.

14. Головко В. А., Краснопрошин В. В. Нейросетевые технологии обработки данных. Минск : БГУ, 2017. 263 с.

15. Болтачева Е. Р., Никитина С. А. О некоторых подходах к решению задачи классификации текстов по тональности на примере анализа англоязычных отзывов // Вестник кибернетики. 2022. № 2. С. 14–19. DOI 10.34822/1999-7604-2022-2-14-19.


Об авторах

Светлана Анатольевна Никитина
Челябинский государственный университет, Челябинск
Россия

кандидат физико-математических наук, доцент



Екатерина Рафаэлевна Болтачева
Челябинский государственный университет, Челябинск
Россия

магистрант



Рецензия

Для цитирования:


Никитина С.А., Болтачева Е.Р. РАЗРАБОТКА АРХИТЕКТУРЫ НЕЙРОННОЙ СЕТИ ДЛЯ ПРОВЕДЕНИЯ СЕГМЕНТАЦИИ ПОЛЬЗОВАТЕЛЕЙ ПРИ ТАРГЕТИРОВАННОЙ РЕКЛАМЕ. Вестник кибернетики. 2024;23(2):49-56. https://doi.org/10.35266/1999-7604-2024-2-6

For citation:


Nikitina S.A., Boltacheva E.R. DEVELOPING A NEURAL NETWORK ARCHITECTURE TO PERFORM USER SEGMENTATION WITH TARGETED ADVERTISING. Proceedings in Cybernetics. 2024;23(2):49-56. (In Russ.) https://doi.org/10.35266/1999-7604-2024-2-6

Просмотров: 153


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1999-7604 (Online)