Сегодня Brand Analytics добавляет функционал тематических спам-фильтров, позволяющий автоматически выявлять и удалять пользовательский контент, который зашумляет медиаполе и в большинстве случаев не используется в анализе. Применяемые для этого алгоритмы натренированны с помощью машинного обучения на специально подобранных тематических текстах (корпусах) и способны с высокой точностью и скоростью классифицировать поток сообщений социальных медиа.
До недавнего времени пользователи Brand Analytics использовали автоматическую фильтрацию спам-сообщений от автоматизированных аккаунтов, дублей сообщений и фильтрацию публикаций с нецензурной лексикой. Однако вместе с ростом популярности соцсетей значительно вырос и объем пользовательского контента, связанного с массовыми коммерческими предложениями, сбором финансовой помощи, сообщениями о ДТП и так далее. Мы проанализировали пользовательские сценарии использования системы Brand Analytics и выявили те тематики, которые клиенты наиболее часто исключают из анализа и отправляют в корзину.
Теперь пользователи могут сэкономить свое время и ресурсы, задав в настройках «Корзины» автоматическую фильтрацию ненужных для анализа тематик публикаций. Все отфильтрованные сообщения автоматически переносятся в «Корзину» в «свою» категорию контента и дополнительно выделяются соответствующим обозначением перед основным текстом публикации. Непосредственно в “Корзине” пользователи имеют возможность еще раз проанализировать удаленные сообщения и при необходимости “вернуть” полезные из них для анализа в основную ленту сообщений.
Новый функционал тематической классификации реализован для тем типов «Соцмедиа+СМИ» и «Избранные источники».
В настройках «Корзины» уже сейчас доступны тематические и базовые спам-фильтры:
- [Продажи] – Объявления о продажах (тематический фильтр)
- [Помощь] – Сбор средств для помощи (тематический фильтр)
- [Заработок] – Реклама заработка в интернете (тематический фильтр)
- [ДТП] – Автомобильные аварии (тематический фильтр)
- [Дубль] – Дубли сообщений (базовый фильтр)
- [Мат] – Сообщения с нецензурной лексикой (базовый фильтр)
Для включения тематических спам-фильтров необходимо воспользоваться настройками «Корзины» – позиции 1 и 2 на скриншоте ниже. Результаты работы фильтров, статистику и категоризацию удаленных сообщений также можно видеть на скриншоте – позиция 3.
Основное назначение нового функционала – значительная экономия времени и ресурсов сотрудников при решении широкого ряда аналитических задач. Для некоторых отраслей доля автоматически отфильтрованных сообщений может достигать 30% и более. Наибольший эффект от представленных тематических фильтров на текущий момент смогут получить пользователи из банковской и автомобильной сферы.