Усовершенствованный NER позволяет выявлять персоны и компании в потоке данных соцмедиа с точностью 99%

Разработчики Brand Analytics усовершенствовали технологию распознавания именованных сущностей (NER) и добились рекордных показателей точности и полноты при обработке потоков данных социальных медиа. Теперь NER обрабатывает сообщения с точностью 99% и полнотой 97%.

NER (named entity recognition) — технология, которая распознаёт в тексте именованные сущности: имена людей, названия организаций и продуктов,
городов и географических объектов.

Что новый NER улучшил в системе Brand Analytics?

В системе Brand Analytics NER используется в аналитических отчётах «Персоны» и «Юрлица» и помогает клиентам анализировать, какие персоналии и компании участвуют в формировании инфополя бренда или любого другого объекта мониторинга.

Технология NER упрощает отраслевой анализ: вы сразу видите конкурентов, присутствующих в вашем инфополе, находите лидеров мнений, которые влияют на репутацию вашего бренда, а также экспертов, сильных в конкретных темах.

Напомним, что NER работает не по словарям, а умеет выявлять именованные сущности даже тогда, когда впервые их видит в тексте. NER стал точнее, благодаря чему вы не будете тратить время на чистку облаков слов в отчётах «Персоны» и «Юрлица» от случайно попавшего в отчёт нерелеванта. Усовершенствованная технология стала значительно быстрее: у вас не возникнет задержек с отчётами даже при работе с большими потоками данных в режиме реального времени.

Новый NER уже доступен в темах и корректно работает с данными, собранными после 4 апреля 2023 года. Если вы хотите работать с обновленным NER, выбирайте для анализа период после 4 апреля.

Как работает NER? Объясняем на примере

Вот случайное сообщение пользователя Сети: он поделился в районной группе новостью об акциях в продуктовом магазине.

Старый NER мог определить только то, что «Лента», которую упоминают в тексте, — это какая-то организация. А вот новый NER понимает ещё и то, что «сергей» — это имя человека, а «москва» и «путилково» — названия неких геолокаций. Новый NER «не обращает внимания» на то, что часть имён собственных написаны с ошибками или с маленькой буквы – корректно отрабатывает такие кейсы. И это только часть отличий.

В скором времени NER научится понимать прозвища и жаргонизмы. Например, если в Сети напишут «ездили на выходные в нерезиновую», система сможет определить, что речь идёт о Москве.

В чём уникальность технологии?

Соцмедийные данные, которые обрабатывает система Brand Analytics, — это скоростные потоки неструктурированной информации. Пользователи Сети часто пишут с ошибками, по настроению меняют правила русского языка, используют много разных словоформ в названиях объектов и именах собственных. Всё это — так называемые, «грязные тексты». И чтобы научить систему вычленять из них правильные именованные сущности, мы проделали большую работу по замене в NER лингвистических технологий на современные ML-решения.

Попробуйте новый NER в отчётах «Персоны» и «Юрлица» и поделитесь своим мнением в наших соцсетях — группе ВКонтакте и Telegram-канале.

 

Бесплатный демонстрационный доступ

Персональный консультант проведет демонстрацию и поможет протестировать систему с учетом ваших бизнес-задач

Запросить демо

Похожие статьи

Добавили в Экспорты в формате Excel информацию по типам источников

Конкурс кейсов по аналитике соцмедиа «Хрустальный шар 2022»

Теперь выгрузки xls-формата аналитических отчётов во всех типах тем и отчётов в разделе «Сравнение тем» совместимы с офисным пакетом LibreOffice и онлайн-инструментом Google Sheets (Google Таблицы).

Сделали xls-файлы экспортов совместимыми с LibreOffice и Google Таблицами

«Продукты» — новый отчёт в системе Brand Analytics

Последние статьи

Как использовать ИИ-ассистента BrandGPT

BrandGPT: как аналитику соцмедиа использовать ИИ-ассистента

Клиентский опыт с аналитикой соцмедиа

Клиентский опыт: как его исследовать и улучшать с аналитикой соцмедиа

Программа Brand Analytics Forum 2024: представляем спикеров форума по аналитике соцмедиа для решения задач государства

Вебинар 25 апреля: Как определить целевую аудиторию

Вебинар 25 апреля: «Как определить целевую аудиторию»