Теперь мы с помощью ML-технологий определяем категории сообщений на узбекском языке в темах типа соцмедиа и онлайн-СМИ. Это ускорит обработку пользовательских сообщений и поможет выделять значимые публикации в инфополе.
Категория — это определенный признак, которым может обладать то или иное сообщение. Он присваивается в системе автоматически и позволяет фильтровать нужные для анализа сообщения, например, быстро находить клиентские жалобы или автоматически очищать тему от нерелевантных сообщений.
Теперь с помощью ML-алгоритмов в системе Brand Analytics сообщениям на узбекском языке присваиваются промо категории:
- Коммерческие объявления;
- Заработок в интернете;
- Благотворительность;
- Розыгрыши;
- Бьюти-услуги;
- Вакансии;
- Промокоды;
- Поисковый спам.

А также WOM (пользовательские сообщения от первого лица) и его подкатегории:
- Вопросы
- Сравнения
- Жалобы.

Как пользоваться категориями
Узбекский язык занимает значимую часть инфополя в Узбекистане и других странах. Например, в ноябре 2024 года пользователи Telegram опубликовали более 47 млн сообщений (постов и комментариев) на узбекском языке.
Теперь обрабатывать эти сообщения стало еще проще:
- Система автоматически на основе содержания присваивает категории сообщениям;
- Можно отфильтровать нужные сообщения по новым категориям в основном или боковом фильтре для самостоятельного анализа;
- Можно выбрать фильтр с категорией при создании правила (например, отмечать определенным тегом сообщения категории WOM или удалять сообщения категории Поисковый спам).
Новые категории полезны продуктовым менеджерам, специалистам по работе с клиентами, SMM-менеджерам. Они позволят более оперативно находить и автоматически или вручную обрабатывать сообщения, чтобы освободить время на аналитические задачи.