ВОЗМОЖНОСТИ АВТОМАТИЗАЦИИ ИНТЕРНЕТ-МАРКЕТИНГА КОМПАНИИ С ПОМОЩЬЮ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ

Исаева Юлия Олеговна
Новосибирский государственный университет
бакалавр, кафедра применения математических методов в экономике

Аннотация
Статья посвящена анализу возможностей автоматизации задач маркетолога с помощью технологий машинного обучения. В работе подробно рассматриваются основные виды машинного обучения, а также подчеркивается актуальность использования данных технологий именно в интернет-маркетинге с опорой на современные исследования. В результате влияние машинного обучения на интернет-маркетинг компании было разделено на две группы: внешнее - изменения, происходящие в ИТ-среде в целом, и внутренние - оптимизация части задач маркетолога.

Ключевые слова: автоматизация, алгоритм, Интернет-маркетинг, машинное обучение, оптимизация

Рубрика: 08.00.00 ЭКОНОМИЧЕСКИЕ НАУКИ

Библиографическая ссылка на статью:
Исаева Ю.О. Возможности автоматизации интернет-маркетинга компании с помощью технологий машинного обучения // Современные научные исследования и инновации. 2021. № 5 [Электронный ресурс]. URL: https://web.snauka.ru/issues/2021/05/95625 (дата обращения: 30.07.2026).

В настоящее время уже трудно себе представить бизнес без какой-либо маркетинговой стратегии. Более того, в эпоху обилия всевозможных товаров на полках магазина и в каталогах интернет-магазинов и сокращения потребителем времени на принятие решений, компаниям приходится идти в ногу, а иногда даже и опережать быстрорастущие запросы клиента, и использовать все более изощренные способы борьбы за него, чтобы оставаться конкурентоспособными. Поэтому сегодня использование стандартных каналов продвижения в интернете уже не самое выигрышное решение, необходимо постоянно держать руку на пульсе изменений, происходящих в сфере digital-маркетинга. Так, по результатам исследования Microsoft, 94% руководителей считают, что технологии искусственного интеллекта и машинного обучения важны для решения стратегических задач их организаций, причем 37% характеризуют их как «очень важные» [1, с. 4].

Машинное обучение (Machine Learning, ML) — один из наиболее известных и широких подразделов искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться [2, с. 210]. Для построения таких методов используются инструменты математической статистики, численных методов, методов оптимизации, теории вероятностей, теории графов, различные техники работы с данными в цифровой форме и Computer Science.

В общем виде процесс обучения выглядит следующим образом: алгоритм получает на вход массив эмпирических данных, находит особенными методами (которые более подробно будут описаны ниже) закономерности, и на основе этого может делать определенные прогнозы. Затем все верно и ошибочно проанализированные данные попадают в общую базы данных, соответственно, чем больше алгоритм получит входных данных, тем больше у него возможностей выявить «правильные» закономерности. Именно поэтому машинное обучение тесно связано с другим «IT-феноменом» современности – Большими данными.

Различают 4 основных типа обучения: классическое обучение, обучение с подкреплением, ансамбли и нейронные сети [4, с. 20].

1. Классическое обучение

Классические алгоритмы – базовые алгоритмы, с которых начиналось машинное обучение. Однако, они до сих пор в большинстве своем самые широко используемые, а также наиболее простые для понимания и применения в бизнесе.

Классическое обучение делится на два больших блока: обучение с учителем и обучение без учителя или в английском варианте – Supervised и Unsupervised Learning.

1.1. Обучение с учителем.

Такой способ машинного обучения подразумевает наличие входных данных Х и обязательно выходных данных Y. Под учителем подразумеваются данные, которые уже разделены человеком по определённому принципу, которому и должна обучиться машина, то есть Y = f(X). Поскольку данные уже разделены и правильные ответы известны, то алгоритм итеративно делает прогнозы по данным обучения и корректируется преподавателем. Обучение прекращается, когда алгоритм достигает приемлемого уровня производительности. Основными методами обучения с учителем являются:

1.1.1. Классификация

Классификация – самый распространенный метод во всем классе классического машинного обучения. Известны следующие реализации этого метода:

Алгоритм Наивного Байеса

Нашел применение для довольно широкого спектра задач ввиду своей простоты. Одним из примеров из digital сферы является простейший spam-фильтр, который работал на основе данного алгоритма до 2010 года. Программа считала количество повторений определенного «запрещенного» слова в спам-письмах и в обычных письмах, и далее по формуле условной вероятности Байеса получала вероятность того, является ли письмо спамом [3, с. 20].

Деревья решений

Это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение. Под правилом понимается логическая конструкция, представленная в виде “если …, то …”. Проще говоря, машина автоматически разделяет все данные по вопросам, ответы на которые «да» или «нет». Естественно, вопросы строятся таким образом, чтобы такие ответы имели место быть, а целевая переменная должна иметь дискретное значение. Так, например, можно упрощенно описать работу скоринговых систем, которые вычисляют, можно ли давать кредит определенному лицу.

Метод опорных векторов (SVM)

Основной задачей алгоритма является найти наиболее правильную линию, или гиперплоскость, разделяющую массив данных на два класса. SVM получает на входе данные и возвращает такую разделяющую линию. Метод устроен таким образом, что он ищет точки на графике, которые расположены непосредственно к линии разделения ближе всего. Эти точки называются опорными векторами. Затем, алгоритм вычисляет расстояние между опорными векторами и разделяющей плоскостью. Это расстояние, которое называется зазором. Основная цель — максимизировать расстояние зазора. Лучшей гиперплоскостью считается такая гиперплоскость, для которой этот зазор является максимально большим.

Логистическая регрессия

Несмотря на то, что Регрессии – это отдельный метод машинного обучения, логистическая регрессия относится к бинарной классификации, поскольку на выходе мы получаем результат принадлежности объекта к классу. Логистическая регрессия похожа на линейную тем, что в ней тоже требуется найти значения коэффициентов для входных переменных. Разница заключается в том, что выходное значение преобразуется с помощью логистической функции. Логистическая функция выглядит как большая буква S и преобразовывает любое значение в число в пределах от 0 до 1. Это весьма полезно, так как мы можем применить правило к выходу логистической функции для привязки к 0 и 1 (например, если результат функции меньше 0.5, то на выходе получаем 1) и предсказания класса.

1.1.2. Регрессия

Регрессионный метод обучения с учителем похож на метод классификации, однако на выходе мы получаем результат не в виде класса, к которому относится целевая переменная, а числовом виде. Регрессию можно представить в виде уравнения, которое описывает прямую, наиболее точно показывающую взаимосвязь между входными переменными X и выходными переменными Y. Для составления этого уравнения нужно найти определённые коэффициенты B для входных переменных. Здесь используются стандартные регрессионные модели: линейная – в самом простом случае, когда алгоритм пытается нарисовать прямую линию по точкам, и, соответственно, продолжив эту линию, получить прогноз; и полиномиальная – построение кривой.

1.2. Обучение без учителя

Не всегда так получается, что мы имеем заранее размеченные данные, т. е. «обучающую выборку». А это означает, что все вышеперечисленные алгоритмы мы не можем использовать. Однако, такая ситуация встречается намного реже, но все же кратко осветить ее стоит. Основными методами обучения без учителя являются:

1.2.1. Кластеризация

Используется, когда требуется разбить данные на непересекающиеся подмножества – кластеры, так, чтобы объекты в каждом кластере обладали схожими характеристиками. Кластеризация похожа по своей идее на классификацию, но заранее нам не известны классы. Машина сама ищет объекты с похожими характеристиками и объединяет их в кластеры.

Алгоритм k-mean – самый популярный в данном классе. Его основные шаги:

1. Выбор количества кластеров k

2. Рандомное помещение в пространство данных k точек (центроидов)

3. Подсчет близости каждой точки данных к центроиду

4. Перемещение центроидов в центр выборки, отнесенную к этому центроиду.

5. Повтор 3-4 шагов n раз, либо до тех пор, пока центроиды не “сойдутся”.

Примеры использования кластеризации: группировки маркеров на карте (когда мы масштабируем карту, браузер не может нарисовать миллионы маркеров, поэтому группирует их); Google Photos находит лица людей на фотографиях и группирует их в альбомы, ничего не зная об этих людях; сжатие изображений при сохранении (кластеризация пикселей по цветам).

1.2.2. Уменьшение размерности (обобщение)

Еще более сложный метод, заключающийся в следующем: алгоритм собирает определённые признаки в абстракции более высокого уровня. Например, человек, имеющий заработок в 35-40 тыс.руб, имеющий машину за 300 тыс.руб. и платящий ипотеку, будет отнесен в абстракцию «средний класс». Самые известные реализации этого метода: латентно-семантический анализ (LSA) и Сингулярное разложение (SVD). Алгоритмы используются в Topic Modelling (автоматическое определение тематик текстов). Суть в следующем: абстрагирование от конкретных слов до уровня смыслов даже без привлечения учителя со списком категорий. Работает заcчёт гипотезы о том, что частота появления слова в тексте зависит от его тематики. Еще одно популярное применение метода обобщения – рекомендательные системы. Исследователи обнаружили, что оценки и фильмы часто коррелируют с определенным возрастом, жанром и др. признаками.

1.2.3. Ассоциация

Метод поиска ассоциативных правил имеет довольно интересные применения с экономической точки зрения. Например, в анализе продуктовой корзины: какие товары чаще всего покупаются вместе. Какой из товаров является триггером к покупке второго? Такая информация крайне важна для гипермаркетов, ведь это может помочь в правильной тактической расстановке товаров, и возможно, увеличить тем самым прибыль.

2. Обучение с подкреплением

Это следующий большой подраздел машинного обучения, который в отличие от классического обучения, используется там, где целью является не анализ данных, и построение выводов на их основе, а выживание объекта в среде. Такой средой может служить как видеоигра, так и реальная жизнь. Машина ищет оптимальную стратегию, опираясь на реакцию внешней среды.

3. Ансамбли и нейросети

На текущий момент эти методы дают нам более широкие возможности, чем все вышеперечисленные, а главное при этом и более точные результаты. Идея ансамблей довольно проста: если взять пару не самых эффективных методов обучения и обучить исправлять ошибки друг друга, качество такого ансамбля будет значительно выше, чем каждого из методов по отдельности. Чаще всего берут самые нестабильные методы, например, такие как Регрессия и Дерево решений. Самый, пожалуй, известный пример использования ансамблей – работа Яндекс поисковика с помощью бустинга.

Таким образом, сегодня существует достаточно большое количество различных методов ML, которые находятся в постоянном усовершенствовании. Действительно, актуальность использования машинного обучения возрастает с каждым годом ввиду все большего накопления big data у компаний в различных отраслях: наука, здравоохранение, транспорт, производство, бизнес и т.д. Важность применения машинного обучения в бизнесе, и, в частности, в одной из важнейших частей стратегии электронной коммерции – интернет-маркетинге, подтверждается многочисленными результатами опросов и прогнозами мировых компаний:

61% маркетологов считают технологии машинного обучения наиболее важным аспектом стратегии данных [5].
По данным исследования Data Dilemma, основывающимся на опросе 151 британских топ-менеджеров, 80% из них полагают, что им необходимо значительно расширить аналитику данных и инструменты в течение следующих двух лет, поскольку они тратят в среднем 5 часов и 36 минут на то, чтобы разобрать с данными [6]
К 2021 году 30% мировых компаний будут использовать машинное обучение как минимум в одном из их процессов продажи [7].

Ниже рассмотрены реальные примеры маркетинговых задач, решенных компаниями различных отраслей, с применением ML [8, с. 351]:

Прогноз вероятности покупки того или иного продукта для таргетированного маркетинга: PREMIER bankcard уменьшила издержки на direct-рассылку на $12 млн;
Прогноз оттока клиентов (churn rate): FedEx выявляет не просто коэффициент оттока, а конкретных клиентов, готовых уйти, с точностью 65-90%;
Персонализированный поход и рекомендательные системы: Amazon.com: 35% продаж приходится на персонально рекомендованные товары.

Данные примеры иллюстрируют только небольшую часть тех возможностей, которые открываются перед компанией, которая решает внедрить технологии машинного обучения в свою стратегию маркетинга и анализа данных. Правильно выбранное направление применения машинного обучения позволяет в разы превысить инвестиции в технологию.

Вообще, говоря о машинном обучении в digital-маркетинге нельзя обходить стороной тот факт, что влияние ML-технологий может быть внутренним и внешним. Это объясняется тем, эти же технологии могут использовать другие компании, которые являются внешними по отношению к рассматриваемой и влиять на результаты ее деятельности. В основном, под этими компаниями понимаются мировые IT-компании, такие как Google и Yandex, которые и создают различные инструменты маркетинга и чьими поисковиками пользуются подавляющее большинство. В основном внедрение алгоритмов МL такими компаниями влияет на SEO-оптимизацию и подход к контент-маркетингу в компаниях.

Внешнее влияние ML-технологий на SEO-оптимизацию и контент-маркетинг.

В 2015 году компания Google выпустила новый алгоритм обработки и ранжирования поисковых запросов на базе алгоритмов машинного обучения – RankBrain, который значительно повлиял на результаты поисковой выдачи и заставил большое количество компаний начинать пересматривать способы SEO-оптимизации. Разумеется, информация о схеме работы алгоритма не раскрывается, однако можно выделить основные моменты, которые поменялись и имеют значение для SEO-специалистов и контент-маркетологов:

1. Одной из основных целей создания такого алгоритма – улучшение понимания естественного языка. Это означает, что алгоритм может еще лучше понимать запросы пользователя и выдавать действительно релевантный контент. Более того, компания тестирует технологию, которая позволяет ИИ обучаться так же, как это происходит в человеческом мозгу (нейронные сети). Технология DeepMind позволяет машинам «читать», и таким образом алгоритмы могут понимать смысловую нагрузку контента так, как это понимает человек. Для маркетологов это означает еще более тщательный подход к созданию контента. Копирайтинг и рерайтинг – главенствующие на данный момент способы создания контента по мере развития и обучения машины, будут отходить на второй план. Авторский контент будет очень высоко цениться, но и требования к нему станут жестче. Уже можно проследить некоторую закономерность, подтверждающую этот факт: опрос людей, занимающихся блоггингом, показал, что среднее время на создание 1 поста в блог растет с каждым годом [9].

2. С развитием алгоритмов машинного обучения снижается значимость стандартных способов внутренней оптимизации. Такой традиционный метод как работа с title, мета тегами и URL все еще будет применим, но перестанет быть решающим критерием, который определяют эффективность продвижения. Так, некоторое время назад основным способом наращивания ссылочной базы являлась закупка ссылок на специальных биржах. Теперь такие черные методы оптимизации под угрозой вымирания, поскольку у алгоритма Google на базе искусственного интеллекта нет проблем с тем, чтобы определить купленные ссылки и «наказать» за них веб-ресурс. На ряду с этим в перспективе может снизиться важность органических ссылок, которые сейчас являются одними из наиболее значимых факторов ранжирования. Когда технологии машинного обучения будут доведены до желаемого компаний результата, поисковик будет легко извлекать настоящую ценность страницы. При условии, что DeepMind понимает контент страницы, технологии ML смогут проанализировать, корректно ли размещена конкретная ссылка в тексте. Помимо этого, будет видно поведение пользователей после клика по ссылке: если они будут тут же возвращаться, Google посчитает ценность ссылки равной нулю и не засчитает ее вес при ранжировании. Неорганическое и линейное наращивание ссылочной массы будет легко идентифицировано и определенно не будет приветствоваться.

3. А вот значение факторов пользовательского опыта будет только расти в отличии от внутренней оптимизации, ссылок и технических аспектов SEO. User Experience — это однозначно ключевой фактор, который Google будет использовать для ранжирования сайтов в поисковых результатах. На сегодняшний день кликабельность и вовлеченность для Google — основные показатели того, что определенная страница оправдала ожидания пользователей. Поэтому вполне вероятно, что Google будет шлифовать свои поисковые алгоритмы машинного обучения до тех пор, пока опыт их взаимодействия с сайтом не станет идентичным опыту человека. Искусственный интеллект сможет мгновенно оценить UX и соответственно ранжировать страницы. Таким образом, SEO-специалисты наряду с дизайнерами, разработчиками, диджитал-маркетологами и бизнес-аналитиками должны будут тщательно изучить вебсайты и убедиться, что все недочеты UI/UX исправлены и скорость загрузки сайта находится на должном уровне.

Внутреннее влияние ML-технологий (применение технологий непосредственно в компании).

1. Оптимизация частоты и времени отправки email

Одним из базовых инструментов интернет-продвижения является email-маркетинг. Конечно, можно осуществлять email-рассылку в одинаковое время для всех пользователей, однако, если же персонализировать время получения письма, это может значительно повысить конверсию. Однако осуществить вручную данный процесс представляется довольно трудоемкой задачей, а машинное обучение позволяет автоматизировать данный процесс. Так, алгоритм обрабатывает информацию о времени открытия, прочтения и закрытия письма, систематизирует полученную информацию и проведёт серию A/B тестов (отправка в скорректированное рекомендованное время), чтобы выяснить точное время с некоторым доверительным интервалом для отправки писем. При этом любые изменения автоматически учитываются в режиме реального времени.

2. Интеллектуальная сегментация

Если раньше основными характеристиками целевой аудитории для ее сегментации были социально-демографические, географические характеристики, а также интересы потребителя, то на сегодняшний день поведенческий фактор также играет большую роль: какие сайты посещает пользователь, как долго от находится на сайте, как много товаров он кладет в корзину, как часто осуществляет покупку, переходил ли он по рекламе и пр. Появляется понятие цифровой след – совокупность информации о действиях пользователя во время пребывания в цифровом пространстве, которую также можно включать в анализ целевой аудитории и последующую сегментацию.

И снова здесь алгоритмы машинного обучения позволяют автоматизировать сложный процесс выявления сходного поведения пользователей, распознают паттерны, присутствующие в различных группах клиентов, и объединяют их в кластеры. На основе данного разделения каждому конкретному пользователю кластера будет показан свой блок рекомендуемых товаров, контент, который ему с большей вероятностью понравится, и предложения от компании, которые будут интересны лично ему.

3. Автоматизация сбора и обработки данных

Сейчас можно собирать и анализировать совершенно разные типы данных, однако мы рассмотрим пример социального прослушивания с целью репутационного аудита компании. Social listening можно осуществлять на поверхностном уровне: маркетолог может вручную искать упоминания названии своей компании в Интернете. Однако только алгоритмы машинного обучения на базе нейронных сетей могут оптимизировать данный процесс, в режиме реального времени отслеживать информацию по миллионам различных источников (форумы, агрегаторы отзывов, социальные сети, блоги и пр.), агрегировать и осуществлять семантический анализ на предмет тональности упоминания, автоматически сегментируя упоминания по различных группам влияния на репутацию бренда [10].

И, наконец, существует несколько подходов к внедрению алгоритмов машинного обучения:

Подход 1. Покупка готового решения. На данный момент на рынке существует не так много мультифункциональных готовых решений, поскольку довольно сложно написать алгоритм машинного обучения, который будет подходить всем компаниям. У каждой компании есть своя специфика и свои конкретные нужды. Одним из развивающихся направлений в готовых продуктах по автоматизации digital-маркетинга являются Программатики. Программатика — это совокупность методов закупки рекламы в интернете с использованием автоматизированных систем (роботов) на базе машинного обучения и алгоритмов для принятия решений о сделке без участия человека (байера) в режиме реального времени (RTB), предоставляющая возможность показывать объявление конкретному клиенту в определенном контексте. На рынке представлены следующие программатики маркетинга: Soloway, Kavanga, hybrid.ai и др.

Подход 2. Заказ готового решения под ключ. Этот способ на данный момент более популярен, поскольку позволяет удовлетворить конкретные бизнес-цели: прогнозирование, рекомендательные системы, сегментация, анализ соц. сетей, обработка естественного языка и пр. Конечно, очевидным недостатком такого подхода является его высокая стоимость, однако, если вспомнить кейсы применения ML (см. п. 1.3.) и те суммы, на которые машинное обучение снижает издержки ведения клиентов или же наоборот выручку, которую они приносят – можно сказать, что в долгосрочной перспективе эта инвестиция мало того, что окупится, так еще и приумножит в разы отдачу. Лидером на рынке разработке таких решений – компания Statanly Technologies [11].

Подход 3. Разработка собственных решений. Популярность этого подхода обусловлена тем, что нет необходимости обмениваться данными с третьими сторонами. Ведь алгоритмы машинного обучения хорошо работают только на больших выборках данных, а не все компании готовы их передавать. Конечно, этот способ имеет ряд ограничений: наличие высококвалифицированных IT-специалистов, которые смогут предложить качественное решение, сравнимое по уровню с рыночными. Обычно такой метод используют компании, находящиеся в крайностях: мировые крупные компании, которые являются флагманами в использовании машинного обучения, либо, наоборот, небольшие компании, которым проще под их конкретные узкие нужны написать своими силами алгоритм, не затрачивая деньги на покупку каких-либо готовых решений.

Библиографический список

INTELLIGENT ECONOMIES: AI’s transformation of industries and society // A report from The Economist Intelligence Unit. – 2018. – URL: https://eiuperspectives.economist.com/sites/default/files/EIU_Microsoft%20-%20Intelligent%20Economies_AI's%20transformation%20of%20industries%20and%20society.pdf (дата обращения: 23.05.2021)
Samuel A. Some studies in machine learning using the game of checkers // IBM J. Res. Dev. – 1959. – Т. 3. – № 3. – С. 210–229.
Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. // М. : ДМК Пресс. – 2015. – С. 20-24.
Campesato O. Python 3 for Machine Learning. // Stylus Publishing, LLC. – 2020. – 20 p.
Survey Finds Machine Learning and Artificial Intelligence are Top Business Priorities // Survey by O’Reilly Media [Electronic resource] – URL https://www.memsql.com/releases/oreilly-survey/ (дата обращения: 23.05.2021)
The Data Dilemma research // Study by Callcredit Information Group [Electronic resource] – URL https://www.transunion.co.uk/press-office/news/2017/01/marketers-spend-almost-one-day-a-week-grappling-with-data-analysis (дата обращения: 23.05.2021)
Future of SEO and Content Marketing Survey // Research by BrightEdge [Electronic resource] – URL https://www.brightedge.com/resources/research-reports/seo-and-content-marketing-survey-2017 (дата обращения: 23.05.2021)
Сигель Э. Просчитать будущее. Кто кликнет, купит, соврет или умрет. – М.: Альпина Паблишер. – 2017. – С. 351-353.
Crestodina A. Blogging still works, especially for the 10% of bloggers who do things very differently. [Electronic resource] – URL: https://www.orbitmedia.com/blog/blogging-statistics/ (дата обращения: 23.05.2021)
Forthmann J. Social listening: a potential game changer in reputation management. How big data analysis can contribute to understanding stakeholders' views on organizations // Communications: An International Journal. – Vol. 26 No. 1. – 2020. – pp. 2-22.
Сайт компании Statanly Technologies. [Электронный ресурс] – URL: https://statanly.com/ (дата обращения: 23.05.2021)

Все статьи автора «Исаева Юлия Олеговна»