26 нояб. 2011 г.

Платформа SemanticForce - кластеризация упоминаний в социальных медиа

Взято с портала semanticforce

В развитии методов анализа в конкурентной разведке и в частности такого направления как структурирование информации.

При сборе и накоплении большого объема данных мы получаем, с одной стороны, важную базу для анализа и исследования, но с другой – огромный массив, который требует систематизации и обработки.

Как мудро заметил в одной из своих статей на Slon.ru Андрей Мирошниченко, «Навигация – единственный информационный продукт, чья ценность будет расти, с увеличением объемов информации».

Если переходить к инструментам навигации, представленных в различных мониторинговых платформах, то среди самых «базовых» и распространенных можно выделить распределение по тематическим рубрикам (категориям) и тональности упоминаний.

Причем тональности обычно уделяют больше всего внимания, хотя часто тональность сообщений не показывает качественного состава упоминаний и контекста обсуждений.

Рубрикация упоминаний (то есть распределение всех сообщений по определенным темам) дает более репрезентативню структуру разговоров. Однако рубрики-маяки не всегда ясны и понятны, а в случае с известными брендами часто могут работать некорректно – трудно предугадать и точно определить направления «гласа народа» и то, что будет обсуждаться аудиторией на этой неделе или тем более в следующем месяце. Кроме того, нередки случаи, когда зная, что искать, и работая только в данном направлении, все иные тренды становятся «слепым пятном» и остаются незамеченными.

Так как же научиться слушать и системно понять, о чем говорят люди в сети?

Для решения такой нетривиальной задачи применяется технология кластеризации, то есть объединение нескольких однородных элементов по определенным признакам.

Кластеризация позволяет быстро сориентироваться в большом медиа-поле и сделать качественный анализ даннных.

Простейший вариант кластеризации – это популярные «облака тегов» (часто встречающихся слов), которые отображают, какие слова чаще всего употребляются в рамках данной темы. Однако с учетом простоты данной технологии, облака тегов являются малоэффективными с точки зрения навигации и понимания контекста обсуждений.

Мы пошли дальше в решении задачи навигации и по уже сложившейся традиции первыми на рынке СНГ предлагаем иерархическую кластеризацию. Это позволяет не только увидеть, какие темы обсуждают вместе с вашим брендом (первый уровень), но и также узнать, какие подтемы обсуждались в рамках тем первого упровня....

Подробности тут semanticforce

Продолжается взаимная интеграция социальных сервисов.

Продолжается взаимная интеграция самых разных социальных сервисов. Теперь вот "Мой Мир" и "Одноклассники" задумали сделать свои сервисы взаимно открытыми. Такая тенденция вполне логична - ведь неудобно управлять сразу несколькими аккаунтами в разных сетях. Нужен удобный интерфейс синхронного управления. А в данном конкретном случае еще и обе сети принадлежат одному собственнику :) Такое объединение удобно не только рядовому пользователю , но и "Большому Брату"...

Как это можно будет использовать в целях конкурентной разведки посмотрим и решим чуть позже. Вероятно помогут решения аналогичные работе с Твиттером.

«Одноклассники» рассказали, как будут срастаться с «Моим миром»

«Одноклассники» продолжат взаимное проникновение с социальной сетью «Мой мир», принадлежащей ее материнской компании Mail.ru Group, рассказал руководитель проекта «Одноклассники» и вице-президент Mail.ru Group Илья Широков.

По его словам, в скором времени будет реализована трансляция пользовательских статусов и фотографий из «Одноклассников» в «Мой мир» и обратно. Поскольку, по словам самого Широкова, «во всех соцсетях пользователи обмениваются статусами и фотографиями», этот шаг можно считать самым ярким примером интеграции между ними....

Подробнее: http://internet.cnews.ru/news/top/index.shtml?2011/11/24/465761

Несколько инструментов semantic web

Взято с сайта Лаборатория интеллектуальных систем ИТМО
Советую заглянуть в первоисточник - там есть много интересностей...

Marbles

Данное приложение является браузером семантического наполнения Интернет. Надо признать, что он является скорее инструментом специалиста а не простого пользователя. Для своей работы он требует указания ручного ввода идентификатора исследуемого ресурса и выбора способа представления.
Для результата Marbles предлагает три варианта отображения:

Подробное. Полный список отношений в которых участвует данный ресурс. Приводятся ссылки для просмотра в Marbles типа отношения и связанного объекта.
Сводка. Несколько наиболее важных характеристик, например имя, текстовое описание, домашняя страница.
Фотографии. Автоматически найденные изображения предмета.

Интересной особенностью является то, что после результатов приводится список источников с их значками-метками. Этими значками помечаются результаты, полученные из данного источника.
Особенно важен в этом проекте подход к способу представления результатов. В нём используется так называемый словарь представления RDF-документов Fresnel. Этот словарь образует язык, позволяющий описать способ отображения пользователю данных, распределённых в Сети. Он создан рабочей группой консорциума W3C для унификации способов представления метаданных и возможности отделения описания этого представления от сервиса, выполняющего сбор и, возможно, обработку данных.
В целом подводя итог обзору этого приложения можно отметить, что несмотря на общую недружественность пользователю, он несёт в себе следующие практически интересные идеи:
Использование переносимого формата описания представления ресурсов.
Дифференциация способа представления данных, предоставление пользователю выбора.
Визуальная ассоциация результатов запроса с источником из которого они получены.


Operator

Operator – плагин для браузера Firefox, предназначенный для обработки различных микроформатов. Функции предельно просты: обнаружение микроформатов на странице, просматриваемой пользователем, и возможность перенаправить данные из них в один из популярных сервисов.
Сценарий работы прост: если плагину удаётся обнаружить на странице данные в знакомом микроформате, он информирует об этом пользователя(предусмотренно несколько путей для этого) и тот может выбрать куда извлечённую информацию перенаправить.


Rich snippets

Rich snippets – способ дополнения результатов поиска, используемый Google. Это небольшая вставка рядом с результатом, содержащая некоторую дополнительную информацию о найденном ресурсе. Например отзывы о статье или персональную информацию человека.
Однако основной интерес представляет на snippet сам по себе, а способ его формирования. Дело в том, что данные для него могут браться непосредственно с самого ресурса. Для этого веб-мастеру достаточно внедрить в тело ресурса дополнительную разметку, содержащую необходимую информацию. Поддерживается два варианта разметки: на основе распространённых микроформатов и на основе открытого RDF-словаря, также разработанного Google. Таким образом устанавливается семантическая связь между ресурсом и его внешним представлением (результатом поиска).


True Knowledge

True Knowledge – являет системой поиска ответов на конкретные вопросы. Сервис основывается на решении двух вопросов: получение наборов формальных фактов из Интернет и преобразование запросов на естественном языке в запросы к имеющемуся набору фактов.
В качестве источников фактов выступают различные семантически аннотированные ресурсы (например Википедия или Freebase). Факты из них регулярно переносятся во внутреннее хранилище и становятся доступны для поиска. Для каждого ответа приводится факт на основании которого он был выведен и способ которым он был выведен. О факте также можно получить подробную информацию, например откуда он был получен.
Важной частью концепции этого ресурса является привлечение пользователей к наполнению базы знаний. Это достигается несколькими путями. Во-первых на главной странице портала есть несколько ссылок, позволяющих пользователям добавлять факты о некоторых объектах(людях, компаниях и т.д.). Во-вторых вместе с каждым ответом выдаётся вопрос согласен-ли пользователь с ним. Если пользователь не согласен, то ему предлагается указать с чем именно он не согласен и привести ссылку на подтверждающий документ. Также есть возможность вручную отредактировать ошибочный факт, введённый другим пользователем. Третьим способом является ввод правильного ответа на естественном языке.
Надо отметить, что данный сервис является одним из наиболее актуальных и полезных в данном обзоре. В нём прослеживается не академическая разработка, а близкий к коммерческому использованию проект. На его примере мы видим как масса распределённой в Сети информации может быть преобразована, интерпретирована и эффективно использована. Данный ресурс также отличается тем, что он не просто берёт информацию из Интернет, но и всячески привлекает своих пользователей к её оценке и, при необходимости, корректировки.

Optimization-2011: Оценка эффективности продвижения, веб-аналитика

Взято с СЕО-ньюс

В рамках работы секции «Оценка эффективности продвижения, веб-аналитика» представители ведущих российских SEO-компаний раскрыли особенности, преимущества различных веб-инструментов и полезные приемы в применении их для анализа эффективности поискового продвижения.

Открыл работу секции директор компании «Новые Линии Продвижения» Дмитрий Кудинов с докладом «Google Analytics и Яндекс.Метрика для анализа эффективности поискового продвижения».

Google Analytics и Яндекс.Метрика – наиболее популярные инструменты веб-аналитики в России. Дмитрий провел сравнение функционала двух систем веб-аналитики.
.....
Возможности GoogleAnalytics...
Уникальные возможности Яндекс.Метрики...
Способы отслеживания источников звонков...
Анализ эффективности рекламных кампаний...
Анализ поведения посетителей на сайте...
.....


Продолжение и подробности на СЕО-ньюс

Крис ДиБона: Антивирусы для смартфонов могут предлагать только шарлатаны

Взято с портала Открытые Системы

Антивирусные программы для смартфонов на базе Android, iOS или RIM могут предлагать только мошенники и шарлатаны, пишет в блоге сотрудник Google, известный деятель движения сторонников программ с открытым кодом Крис ДиБона.

Ни один из популярных сотовых телефонов не страдает от проблем с вирусами в том же смысле, что компьютеры с системами Windows и Mac, подчеркивает ДиБона. Теоретически вирусы для смартфонов возможны, но появление их маловероятно, потому что барьеры для их распространения слишком высоки. Перенести программу с телефона на телефон не так-то просто даже для законных владельцев аппаратов, пишет автор, и широко распространиться не удалось ни одной из известных вредоносных программ для смартфонов.

Разработчики антивирусов и даже инфраструктурные компании наподобие Juniper Networks и IBM с недавних пор стали подчеркивать угрозу, которую представляют вирусы на смартфонах, в особенности на базе Android, что, по-видимому, и вызвало такую резкую реакцию сотрудника Google. В McAfee утверждают, что в третьем квартале 2011 года количество вирусов, нацеленных на Android, выросло на 37%.

Facebook оставил позади LiveJournal

Взято с сайта Деловой Петербург
Согласно исследованию компании TNS посещаемости российской аудиторией интернет-ресурсов, социальная сеть Facebook обогнала в России популярный блогхостинг LiveJournal по этому показателю.Facebook, Livejournal.

Проект TNS Web Index представил данные, в которых октябрьская аудитория Facebook в России составила около 13,4 млн человек, превысив соответствующий показатель LiveJournal.com, набравшего на 400 тысяч посетителей меньше.

Аудитория LiveJournal увеличивается, но блогхостинг все же уступает позиции другим социальным сервисам. К примеру, всего за месяц российская аудитория Facebook увеличилась почти на 1,9 млн пользователей.

В сегменте посещаемости российских Интернет-ресурсов лидируют проекты компании "Яндекс" (29,2 млн посетителей в месяц). За ней расположились портал Mail.Ru (28,89 млн) и социальная сеть "ВКонтакте"(25 млн). При этом в счет последней не учитывается альтернативный сайт "Вконтакте" – "vk.com", собравший в октябре 8,47 млн посетителей.

Статистика TNS учитывает пользователей в возрасте от 12 до 54 лет, проживающих в городах с населением более 100 тысяч человек.

Показатели Facebook во всем мире поражают – аудитория сайта превышает 850 миллионов человек. Благодаря сервису Socialbakers стало известно, что в России количество пользователей, зарегистрированных в Facebook, составляет 4,86 миллиона человек. По этому показателю наша страна занимает 28 место в рейтинге.

Facebook окончательно обошла блогхостинг LiveJournal по количеству переходов на другие сайты рунета еще в июне этого года. .....

24 нояб. 2011 г.

На поисковик «Яндекс» подали в суд из-за пиратских книг

Взято с Компьюленты

Издательство «Эксмо» обратилось в московский арбитражный суд с иском к компании «Яндекс», требуя обязать её убрать из результатов поиска ссылки на незаконно размещённые в Интернете копии книг. Третьими сторонами в процессе выступают веб-библиотека «ЛитРес» («Эксмо» владеет контрольным пакетом этой компании) и издательство «Алгоритм-книга».

«Яндекс» не удаляет ссылки из результатов поиска по запросу правообладателей, резонно считая подобную практику цензурой и нарушением конституционного права граждан на свободный поиск информации. Российский поисковик полагает, что контент такого рода должны уничтожать те, кто его разместил.

«Эксмо» рассчитывает в судебном порядке обязать «Яндекс» удалить из результатов поиска ссылки на сайт издательства «Алгоритм-книга». По словам руководителя юридического отдела «Эксмо» Максима Рябыко, некоторое время назад на этом ресурсе были обнаружены незаконные копии книг Дарьи Донцовой, Ника Перумова, Татьяны Устиновой и других гениев российской словесности. Сами пиратские материалы с сайта «Алгоритм-книги» уже убраны, но их копии сохранены в базе «Яндекса».

Кроме того, «Эксмо» намерено получить от «Яндекса» компенсацию в размере 50 тыс. рублей.

Тут нужно заметить, что Google, в отличие от российского поисковика, идёт навстречу правообладателям, нисколько не беспокоясь по поводу цензуры. Так, весной американская веб-корпорация удалила из результатов поиска ссылки на 106 пиратских ресурсов (446 страниц), на которых были размещены нелегальные копии книг.

22 нояб. 2011 г.

Пресса узнала о глобальном рынке слежки за интернетом

Газета The Wall Street Journal опубликовала в субботу более 200 документов о глобальном рынке слежки за интернетом и сотовой связью.

Как сообщает издание, речь идет о средствах для взлома пользовательских компьютеров и мобильных устройств, а также сбора информации об интернет-коммуникациях граждан. Они предназначены для ловли преступников и использовались американской полицией и спецслужбами.

Отмечается, что до 2001 года они использовали собственные средства, но за последние десять лет оборот на рынке в этой сфере вырос с "почти нулевой" отметки до пяти миллиардов долларов в год. В документах упоминаются 36 компаний, в том числе работающие и за пределами США.

Среди выявленных способов добывания информации упоминается "исследование незакрытых уязвимостей" в мобильных устройствах компаний Apple, Microsoft, Blackberry и Google.

Ранее The Wall Street Journal публиковал информацию о приложении для слежки за интернет-пользователями, использовавшемся египетскими властями для перехвата сообщений оппозиции в Skype. Тогда сообщалось, что разработчиком этого приложения была британская фирма Gamma International.

В октябре появилась информация о взломе вируса, который использовала немецкая полиция в своей работе. Тогда хакеры выяснили, что троян обладал более широким функционалом, чем того допускал закон. Результатом разразившегося скандала стало обещание немецких властей доработать программу на федеральном уровне. Впоследствии ее смогут покупать как федеральные органы безопасности, так и отдельные земли.

Взято с Лента-РУ