Brand Analytics с февраля 2017 года исследует предпочтения авторов социальных медиа по отношению к участникам президентской гонки во Франции 2017 года. Исследование строится на основе анализа мнений о кандидатах на пост в соцмедиа Франции. Рейтинг кандидатов мы публикуем в нашем блоге:
Данные рейтинга публикуются также в информационных проектах Спутника и РИА Новости, посвященных выборам. Поэтому совершенно естественно было желание коллег из Спутника осмыслить и сопоставить в своей публикации наши прогнозные данные с использованием Big Data, данные опросов таких исследовательских компаний, как Ipsos, OPINIONWAY, IFOP и реальные результаты I тура. С итоговым материалом Спутника можно ознакомиться здесь: https://fr.sputniknews.com/international/201704261031108892-reseaux-sociaux/
В ходе же подготовки указанного материала директор аналитического центра Brand Analytics Светлана Крылова дала комментарии Спутнику, которые, к сожалению, использованы в итоговой публикации лишь частично. Мы считаем заданные вопросы и важными и интересными и поэтому ответы на них приводим ниже.
Ответы Brand Analytics редакции портала Спутник
Судя по результатам вашего анализа соц. сетей, Франсуа Фийон выступал в качестве фаворита президентской кампании. Как так случилось, что вы ошиблись?
Франсуа Фийон не выступал фаворитом согласно нашим данным. Он лидировал в некоторые периоды времени – по результатам успешных дебатов, митингов и др. Но на протяжении всего периода исследования борьба между кандидатами была весьма напряженной. К 21 апреля Макрон и Фийон имели равный уровень поддержки, а по данным на утро 23 апреля преимущество было уже у Эммануэля Макрона.
На графике ниже прекрасно видна динамичность информационного поля: резкие взлеты и падения кандидатов, тренд роста поддержки Марин Ле Пен и, собственно, постоянная смена лидера.
Big Analytics в прогностике — очень новое направление, которому всего-то 3-5 лет (первые наши «опыты» приходятся на выборы во Франции и США в 2012 году). Первые компьютерные опыты (ИИ) в шахматах, покере или Go случились 50+ лет назад, и только недавно искусственный интеллект стал «сильнее» человека.
Предыдущие годы мы предлагали свои технологии для прогностики в «дуэльных» ситуациях, когда выбор делался из 2-х кандидатов (типа Мадуро-Каприлес, Саркози-Олланд, Трамп-Клинтон), в этом году апробировали технологии в мультивыборном событии.
Сам факт пристального внимания к Big Analytics уже показывает готовность общества к пониманию необходимости новых подходов в прогностике.
Может ли анализ соц. сетей и бигдата помочь отразить тенденции в режиме реального времени или определить намерения избирателей?
Спасибо за очень хороший вопрос, Вы идеально уловили одну из самых важных черт новых технологий: оперативность, доступность и низкую цену входа. Под доступностью мы понимаем возможность применения в тех странах или индустриях, где проведение опросов невозможно или затруднено. Например, Украина в период конфликта, или последний референдум в Турции, где люди с некоторой опаской высказывались при опросах.
Идея опроса миллионов людей об их намерениях как избирателей не нова, о ней говорили еще в начале века, еще до изобретения математиками понятия выборочного значения, позволившего минимизировать погрешности.
Этот способ превалирует и сегодня. Зачем тогда прибегать к массовому опросу, а не к более репрезентативному?
Мы ни в коем случае не рекомендуем прибегать к «массовым опросам», потому что никаких опросов мы не проводим. Мы анализируем публично высказанные мнения людей, и принципиальный момент — отсутствие каких-либо «наводящих» вопросов, которые могли бы повлиять на ответ.
Вопрос не в противопоставлении массовости и репрезентативности. Репрезентативность безусловно важна. Мы, к слову, аудируем наши данные, взвешивая показатели по поло-возрастным характеристикам и географии. В принципе это тоже можно назвать «выборкой» — из миллиардов сообщений, генерируемых человечеством, в исследовании учитываются только мнения французского электората. Главное – это «выборка» тех людей, которые реально заинтересованы в проблематике и высказываются о ней открыто.
События 2015-2016 года (Греция, Brexit, Италия, Трамп и др.) показали, что нужно расширять данные, аудиторию, методологию – ведь появились новые вызовы, которые не всегда (дешево) решаются старыми подходами.
Brand Analytics, Filteris и другие технологические компании показывали данные по ситуации (в том числе и во Франции) в режиме реал-тайм — что позволяло оперативно оценивать успешность акций (дебатов, митингов) и влияние внешних событий (взрывы, скандалы), задействуя ежедневно всего 30 минут времени одного аналитика. Сопоставьте с расходами исследовательских компаний на опросы и логистике выдачи обработанных данных.
На наш взгляд, идеальная новая схема в прогностике — содружество устоявшихся апробированных методологий и новых реал-тайм технологий, что собственно сейчас и происходит во всем мире: Pew Research и др. крупные исследовательские структуры создают свои подразделения Big Data Analytics, или используют возможности сторонних структур. Наши технологии используют российские и зарубежные исследовательские и социологические структуры и компании.
Более того, нам хотелось бы заниматься именно технологиями, позволяя специализированным исследовательским компаниям использовать наши решения. Но мы понимаем, что на «переходной период» пока что нам самим приходится реализовывать подобные проекты. По многочисленным сигналам (мы анализируем и мировое инфо-поле) мы видим, что ждать осталось недолго.
В предыдущем интервью Спутнику вы говорили, что «работаете только с высказанными искренними мнениями». Каким образом можно определить степень искренности в виртуальном пространстве?
Это и есть принципиальное отличие исследований соцмедиа от опросных технологий – мы не заставляем отвечать на вопросы. Не секрет, что формулировка вопроса, пол интервьюера, время проведения опроса, место, и даже погода могут влиять на ответ. Мы не заставляем людей отвечать, мы не формулируем вопросы, мы изучаем мнения, которые уже высказаны людьми добровольно.
Мы используем термин Big Analytics вместо Big Data, поскольку для анализа неструктурированных данных (тексты и мнения людей) требуется очень важная компонента — высокоскоростная лингвистика. Это крайне важная и очень дорогая область индустрии искусственного интеллекта. Для понимания цены вопроса — покупки технологий в этой области составляют сотни миллионов долларов.
Как можно улучшить эффективность аналитической системы бигдата?
Знаниями людей. Их успешным опытом, творческой составляющей, пониманием социума, постоянными экспериментами и совместным развитием методологии социологическими и технологическими компаниями.
Поэтому для нас так важны партнерские взаимоотношения с участниками рынка и индустрии.