Единое информационное поле уже давно формируется не только классическими средствами массовой информации, но и социальными сетями, популярными блогерами и популярными тематическими площадками. В этой ситуации использование для мониторинга отдельно инструментария по СМИ и отдельно по соцмедиа становится не только экономически неоправданым, но и просто не решает базовых задач анализа распространения информации.
Свежее обновление от Brand Analytics предлагает выход из сложившейся ситуации. Теперь система обеспечивает не только лучшие возможности в мониторинге и анализе соцмедиа, но и полный функционал для работы со СМИ.
Поясним подробнее. Во-первых, база СМИ в Brand Analytics к настоящему моменту превысила 15 тыс российских источников и не уступает возможностям лучших систем и агентств, занимающихся мониторингом информационного поля. Во-вторых, в системе внедрен прозрачный, понятный рынку и автоматически рассчитываемый Индекс цитируемости СМИ в соцмедиа, больше известный как Индекс виральности, так как он точно отражает востребованность публикаций среди читателей. И в третьих, сегодня мы объявляем о внедрении такой метрики, как роль объекта в публикации СМИ – главная, второстепенная и эпизодическая.
Для удобства клиентов функционал Brand Analytics обеспечивает преемственность по отношению к традиционному мониторингу СМИ, предлагая пользователям все рекомендованные международной ассоциацией медиаизмерений (АМЕС) метрики и позволяя без каких-либо сложностей перейти на использование современной универсальной аналитической системы для работы с единым инфополем. Теперь система Brand Analytics дает возможность работать либо с мониторингом СМИ, в котором реализованы все преемственные метрики, либо с мониторингом соцмедиа, либо с универсальной темой мониторинга и по СМИ и по соцмедиа. Есть и актуальный для многих вариант мониторинга избранных источников и аккаунтов.
В классических системах мониторинга анализируются только заранее известные системе объекты, что в нашем быстроменяющемся мире может дать неточный результат. В случае Brand Analytics, современная лингвистика сначала выявляет в тексте все именнованные сущности, о которых заранее система и не знала, а далее ранжирует найденные объекты по весу «значимости» в тексте. Для привычного анализа объекту присваивается главная, второстепенная или эпизодическая роль в зависимости от его положения в отранжированном списке. Но это не все. В интерактивных отчетах «Персоны», «Компании» и «Геообъкты» предлагается более детальная аналитика по объектам, отражающая тренды информационного поля.
По научному это называется «Сервис поиска и ранжирования важных сущностей в тексте (VIO: very important objects)». Алексей Соловьев, руководитель лингвистической команды Brand Analytics, поясняет:
«Сервис производит анализ каждого документа и выделяет все именованные сущности, ранжируя их по весу «значимости» в тексте.
При расчете учитываются следующие параметры: тип именованной сущности (юр.лицо, физ.лицо, гео, продукт, сбытие), место в тексте (заголовок, подзаголовок, первый или последний абзацы), а также синтаксическая роль слова в предложении. Таким образом, текст проходит полный цикл лингвистической обработки, после чего с помощью машинного обучения определяются типы именованных сущностей и происходит расчет веса для каждой из них с последующим ранжированием.
В зависимости от количества упоминаний объекта в тексте и общего частотного распределения всех найденных именованных сущностей результат разделяется на небольшой, как правило, класс наиболее важных объектов (о чем или о ком текст) и остальных (второстепенные объекты), упомянутых в тексте.
На данный момент в алгоритме не учитывается кореференция сущностей (например, «отделение Сбера» = «Сбербанк»), которая будет реализована в ближайшем будущем».
Рассмотрим пример, в котором выделены объекты: зеленый – юридические лица, фиолетовый – географические названия.
Полученный результат:
В самое ближайшее время мы представим дальнейшее развитие функционала для аналитики единого информационного поля – СМИ и соцмедиа. Оставайтесь с нами.