26 нояб. 2011 г.

Платформа SemanticForce - кластеризация упоминаний в социальных медиа

Взято с портала semanticforce

В развитии методов анализа в конкурентной разведке и в частности такого направления как структурирование информации.

При сборе и накоплении большого объема данных мы получаем, с одной стороны, важную базу для анализа и исследования, но с другой – огромный массив, который требует систематизации и обработки.

Как мудро заметил в одной из своих статей на Slon.ru Андрей Мирошниченко, «Навигация – единственный информационный продукт, чья ценность будет расти, с увеличением объемов информации».

Если переходить к инструментам навигации, представленных в различных мониторинговых платформах, то среди самых «базовых» и распространенных можно выделить распределение по тематическим рубрикам (категориям) и тональности упоминаний.

Причем тональности обычно уделяют больше всего внимания, хотя часто тональность сообщений не показывает качественного состава упоминаний и контекста обсуждений.

Рубрикация упоминаний (то есть распределение всех сообщений по определенным темам) дает более репрезентативню структуру разговоров. Однако рубрики-маяки не всегда ясны и понятны, а в случае с известными брендами часто могут работать некорректно – трудно предугадать и точно определить направления «гласа народа» и то, что будет обсуждаться аудиторией на этой неделе или тем более в следующем месяце. Кроме того, нередки случаи, когда зная, что искать, и работая только в данном направлении, все иные тренды становятся «слепым пятном» и остаются незамеченными.

Так как же научиться слушать и системно понять, о чем говорят люди в сети?

Для решения такой нетривиальной задачи применяется технология кластеризации, то есть объединение нескольких однородных элементов по определенным признакам.

Кластеризация позволяет быстро сориентироваться в большом медиа-поле и сделать качественный анализ даннных.

Простейший вариант кластеризации – это популярные «облака тегов» (часто встречающихся слов), которые отображают, какие слова чаще всего употребляются в рамках данной темы. Однако с учетом простоты данной технологии, облака тегов являются малоэффективными с точки зрения навигации и понимания контекста обсуждений.

Мы пошли дальше в решении задачи навигации и по уже сложившейся традиции первыми на рынке СНГ предлагаем иерархическую кластеризацию. Это позволяет не только увидеть, какие темы обсуждают вместе с вашим брендом (первый уровень), но и также узнать, какие подтемы обсуждались в рамках тем первого упровня....

Подробности тут semanticforce

Комментариев нет: