30 дек. 2011 г.

Вот и техническая организация процесса...

Массовое использование в 2011 году социальных сетей для влияния на поведение пользователей (в т.ч. и организация протестных выступлений) повлекло и появление соответствующих сервисов для "удобства пользования":

Основатель Abbyy придумал мобильное приложение для участников митингов

Основатель и глава компании Abbyy Давид Ян изложил на своей странице в Facebook идею мобильного приложения для обратной связи ораторов на митингах с их аудиторией.

По мнению Яна, отсутствие обратной связи с аудиторией в реальном времени - одна из серьезных проблем для выступающих на митингах. В этом было нетрудно убедиться в процессе митинга на проспекте Сахарова, где аудитория в равной освистала большинство выступающих.

Идея Яна состоит в разработке мобильного приложения под условным названием «Барометр», которое позволило бы участникам митинга выставлять выступающим бинарную оценку («за» или «против») и отправляло бы ее на сервер, который раздавал бы журнал оценок всем желающим, в том числе и ораторам на митинге.

При отсутствии сотовой связи, что часто случается в местах массового скопления, данные приложения будут отправлены на сервер, когда телефон окажется в зоне устойчивого приема, причем вместе с оценками на сервер будет поступать информация о точном времени и геокоординате выставленной оценки.

В разговоре с CNews Давид Ян пояснил, что, хотя посещал митинг на проспекте Сахарова 24 декабря, но не имеет отношения к его организации, как и к организации митинга на Болотной площади. Кроме того, ни он сам, ни его компания не планируют заниматься воплощением идеи «Митингового барометра»: «Я просто понял, что у тех, кто выступает на митингах, а также у тех, кто не ходит на митинги есть потребность в объективной обратной связи: какие тезисы митингующие поддерживают, а какие нет», - говорит Давид Ян. Идея «барометра» у него появилась, когда стало ясно, что существующими техническими средствами реализовать такую связь затруднительно.

Автор идеи полагает, что встроенных средств современного смартфона достаточно, чтобы пресечь возможности накруток при голосовании. Так, например, с помощью GPS-приемника можно точно установить, какие голоса были поданы непосредственно с территории митинге, а какие из-за ее пределов.

Давид Ян говорит, что старается занимать взвешенную позицию к политической ситуации в стране: «радикальные методы - это не то, что может изменить ситуацию к лучшему, однако, подчеркивает он, если в стране проводятся выборы, то они должны быть честными и объективными. Компромиссов тут не может быть! И я буду выходить на митинги за честные выборы, если данная проблема на будет решена».

Рассуждая о том «что делать», Ян говорит: «Каждый на своем месте должен делать свое дело честно и профессионально: и инженер, и судья, и журналист, и председатель ЦИК. Я не политик, я не знаю, как этого добиться, но уверен, что честные выборы - это первый фундаментальный шаг на этом пути».

«При том, что очень многое в нашей стране достойно критики, - продолжает Ян, - у нас есть много ярчайших проектов, появившихся в последние годы, например, информационная система Федеральной налоговой службы или проект «Сколково».

«ФНС строит без преувеличения по-видимому лучшую в мире информационную систему, а что касается Сколково, то если темпы не упадут, то до той фазы, на которой «Сколково» будет находиться через 2 года, Кремниевая долина развивалась более 15-20 лет. Это колоссальный проект!»

Давид Ян стал вторым представителем российского ИТ-рынка, который согласился публично прокомментировать свое отношение к гражданским акциям «за честные выборы» и к политической ситуации в России в целом. Первой была руководитель компании Cognitive Technologies Ольга Ускова.

http://internet.cnews.ru/news/top/index.shtml?2011/12/29/470939

29 дек. 2011 г.

Новая реальность или схема влияния на Власть

Соцсети давно уже стали значимой силой в жизни общества. Вот еще одно подверждение:

Блогеры покопались в биографии судьи Боровковой

В Тверском суде заявляют, что судья Ольга Боровкова у них не работает. На сайте Мосгорсуда закрепленный за ней Тверской участок №369 обозначен как вакантный. Напомним, мировой судья Тверского райсуда Ольга Боровкова стала известна Интернет-общественности после того, как она осудила на 10 и 15 суток ряд представителей внесистемной оппозиции за их противоправные действия. Некоторые Интернет-деятели сделали ответный ход, раскопав, как потом оказалось, не ее биографию, и опубликовав адрес места жительства судьи. Из-за этого Ольге Боровкой даже приставили круглосуточную полицейскую охрану. Биографию судьи пришлось изучить и корреспонденту "Вестей ФМ" Сергею Гололобову.
Социальные сети взорвались разоблачениями. Блогеры на основании разрозненных фактов выяснили удивительные в кавычках факты биографии судьи Боровковой. Что она уже в 19 лет получила магистерскую степень в Уральском филиале Российской школы частного права. То есть школу она должна была закончить лет этак в 12. И весть о таком вундеркинде разнеслась, конечно же, по просторам России.
Правда, потом выяснилось, что в том вузе училась полная тезка судьи, но на 10 лет ее старше. Липой оказались и другие персональные данные. Так, Боровкова не живет по указанному на блогах адресу. И ее отцом не является известный адвокат, который дочь, якобы, и двигает.
Биографию же настоящей Ольги Болровковой узнать оказалось не так уж и сложно. Сведения о ней есть в материалах Мосгордумы, ибо столичные законодатели утверждают всех московских судей. Итак, будущая судья Ольга Боровкова родилась в 83-ем году, в 2005 закончила Московский государственный социальный университет. И с тех пор работает в суде на разных должностях.
Причем ее карьера все равно оказалась стремительной. Как выяснили неугомонные блогеры, на должность помощника судьи, требующую высшего образования, ее назначили еще будучи студенткой последнего курса. Ну, это не слишком серьезное нарушение, полагает директор информационно-аналитического центра "Сова" Александр Верховский.
"Я подозреваю, что эти должности технические в суде, они, скорее всего, вечно недозаполняются, и поэтому там приходится так делать. Я не знаю, но подозреваю, что не одна судья Боровкова с такой биографией", - говорит Верховский.
По внутренним документам судебного департамента, мировым судьей можно стать, имея пятилетний юридический стаж. Спустя ровно пять лет после окончания вуза Боровкову и назначают мировым судьей. То есть, по мнению авторов Интернет-публикаций, вопрос о волосатой руке, тянущей к карьерным вершинам юную судью, все равно остается. И раз уж это дело вызвало такой общественный резонанс, то надо бы провести официальное расследование, уверен правозащитник Московской Хельсинкской группы Валерий Борщов.
"Вопросы правомерны. И нельзя уклоняться от этого ответа. Вполне возможно, что здесь могут быть нарушения. И что она занимает свое место неправомерно. Но здесь требуется расследование соответствующих органов, прежде всего, квалификационной коллегии судей", - отмечает Борщов.
Вообще то, очень многие посетители социальных сетей, судя по их комментариям, не понимают, зачем вообще нужно раскапывать биографию судьи. Те же, кто считает, что копать надо – упоминают некое юридическое понятие – принудительной честности. Ее смысл в том, что биография оппозиционеров, которых судит Боровкова, разобрана по косточкам. И они имеют право задать встречный вопрос: "А судьи - кто?". И требование такой симметричности представляется вполне оправданным, считает Александр Верховский.
"Я думаю, что все, что относится к ее служебной карьере, не может быть закрытым. Собственно, для любого чиновника это не может быть закрытым. А чего тут скрывать-то, даже непонятно. Что же касается ее личной жизни, была ли она замужем и сколько раз, то до этого дела не должно никому быть. Собственно, и все. А ее образование, ее карьерное продвижение не может быть секретом, как и для любого чиновника", - комментирует Верховский.
Или эти нападки блоггеров на судью, или что другое сыграло свою роль, но уже сегодня на сайте Мосгорсуда Тверской участок №369, а это участок как раз Ольги Боровковой, обозначен как вакантный. В Тверском суде нам подтвердили, что такой судьи у них на данный момент нет.
Гололобов Сергей

25 дек. 2011 г.

Технологии конкурентной разведки

После не долгих размышлений решил, что самый оптимальный способ распространения знаний это бесплатный электронный формат. По сему новая книга ("Технологии конкурентной разведки") выходит именно так - берите, читайте, используйте, распространяйте. Появятся вопросы, пожелания, просьбы, рекомендации - пишите. Мне очень интересно получить обратную связь.

Книга лежит здесь.

Теперь несколько слов о том что это за материал – это описание моих опыта и знаний, опыта и знаний коллег, которыми они поделились. Здесь собрано то, что было осмыслено, понято, что было опробовано на практике, что принесло нужный результат. То, что может существенно облегчить коллегам поиск правильного решения. Но не всё. Мир многогранен и изменчив. Поэтому каждый день появляется что то новое. В следующем «издании» будет еще больше практического материала.
При этом я постарался свести к минимуму теоретические выкладки. Конечно же есть моменты, которые без описания теории могут быть не поняты. В этих случаях теория присутствует в нужном объеме. А уж анализ информации без теории вообще не получиться объяснить. Поэтому не обессудьте – в разделе по анализу теории много.
Кроме того из материала убраны рассуждения о том что есть конкурентная разведка, откуда она появилась, что первичнее, а что вторичнее… Конечно же эти рассуждения важны – они являются фундаментом, на котором строится стратегия, в частности стратегия понимания «куда идти». Но проблема в том, что этот самый фундамент еще не сформировался и нет желания тратить ресурсы на исследование и описание того, что еще «не застыло». А «столбить территорию» в мои планы не входит. Лучше больше внимания уделить практическим аспектам, так необходимым в ежедневной работе, у а «сражения» за термины оставляю желающим потеоритизировать. В конце концов мне не важно как называется деятельность, которой я занимаюсь, важно ЧТО я делаю и КАК это согласуется с законом и моралью. Именно по этому целая отдельная глава посвящена технологиям, применимым в конкурентной разведке. Даже не просто применимым, а активно используемым в конкурентной разведке. Это далеко не всё, что есть, а лишь малая часть. Та часть, которую переложил на бумагу. Со временем «расширю» и «углублю». Но пока – то что есть в наличии в буквенном выражении.

24 дек. 2011 г.

Еще пара аргументов в пользу социальных сетей как источника информации для конкурентной разведки

20% онлайн-времени пользователи проводят в социальных сетях

В отчете компании ComScore отмечается, что на долю социальных сетей пришлось 20% времени проводимого интернет-пользователями по всему миру.
Аудитория социальных сетей составляет 82% всех пользователей глобальной сети в возрасте старше 15 лет. Общая интернет-аудитория в мире превысила 1,2 млрд человек.
В октябре 2011 года 55% мировой аудитории интернета пользовались Facebook, пользователи работали с Facebook 75% времени, проводимого в социальных сетях.
В октябре с Twitter работали примерно 10% интернет-пользователей. Аудитория этого сервиса за год выросла почти на 60%.
Больше всего в соцсетях присутствуют пользователи в возрасте 15-25 лет, в среднем они проводили в социальных сетях по 8 часов в месяц.

Русский Твиттер за 4 месяца вырос в 2 раза

Яндекс подсчитал, что на данный момент число русскоязычных аккаунтов в Twitter составляет 1,85 млн. При этом сервис в нашей стране быстро растёт: за последние четыре месяца эта цифра выросла почти вдвое. Ещё в августе это был миллион.
В 2010 году кириллические слова редко оказывались в мировых трендах Twitter, а в этом году это явление стало частым. Например, это были слова «Путин», «ЧП», «выборы», ряд других.

22 дек. 2011 г.

Оранжерея знаний с MediaWiki

Автор: Стас Фомин, заместитель директора по информационным технологиям, компания CUSTIS (http://belonesox.moikrug.ru)

Управление знаниями — область довольно молодая, с неясно очерченными границами, включающая как программную, так и социальную инженерию. Упоминания knowledge management в Интернете и публикациях часто склоняются к крайним взглядам.

Взгляд «Библиотекарский». Знания — это то, что хранится целостно в некоторой библиотеке, куда нужно все занести, каждый элемент детально описать и каталогизировать, «составить карточки», далее выдавать по атрибутным запросам. Управление заключается в контроле над этим процессом. Это основа разного рода систем документооборота и прочих библиотек, выдаваемых за «базы знаний».

Взгляд «Менеджерский». «Библиотека» — это утопия, основной объем знаний всегда остается в головах сотрудников, поэтому надо занимать «проактивную» позицию, шевелить людей, сбивать их в сообщества, проводить собрания‑семинары-конференции. Для этого нужны специально обученные люди, сводящие ищущих со знающими, занимающиеся «фасилитацией» общения и оргвопросами, — и все это представляет разно­видность обычного организационного менеджмента. Типичный пример популярной книги Learning to Fly.

К сожалению, русский перевод‑калька «управление знаниями» не совсем соответствует исходному понятию. «Управление» ближе к «контролю», а management тут — скорее «забота и обеспечение». А ожидаемая цель Knowledge Management — не бесконечный затратный процесс с «ручным приводом, бурлаками и аниматорами», а обеспеченное инфраструктурой состояние организации, когда с минимальными накладными расходами знания фиксируются и распространяются по всем доступным каналам, где спрашивающие эффективно получают ответы и знакомятся с экспертами по своим темам.

При этом важно нащупать работающий компромисс между крайними точками разных граней.

Грань «ПЗУ vs. ОЗУ» — все ли должно быть на 100% формально зафиксировано, разложено по полочкам, прошито семантическими связями? К этому стремятся тяжелые системы управления требованиями. Или пусть все будет в головах, просто нужно больше общаться? Это Agile- подход.

Грань «полнота или актуальность?» Надо ли стремиться к широте в ущерб актуальности, или бороться за целостность? «Обо всем, с ошибками» или «точно, но о малом»?

Субъективность «авторского взгляда» или выстраданные компромиссы?

Передача знаний — «PUSH vs. PULL»: «толкать в людей» или дать им свободу «тянуть то, что им нужно»?

Синхронные или асинхронные процессы?

А получившаяся инфраструктура должна быть достаточно удобна для массового использования без существенной мотивации, ведь премиями или угрозой штрафов и увольнения пользователя можно заставить работать со сколь угодно неудобной системой, а тут ожидается: «счастья всем, даром, и пусть никто не уйдет обиженным».

Откуда же ждать таких систем и инструментов? Ведь полно примеров неработающих дорогих систем, установленных и внедренных, но которыми сотрудники так и не стали пользоваться. И возникает желание решить проблему менеджерскими методами, мотивировать сотрудников работать с системой — «премия наиболее активным пользователям портала»(1). Это опасно, ибо подменяет истинную мотивацию, и если «перестать платить за любовь» — все будет кончено. Тут очень уместна притча о пенсионере и хулиганах.

Хулиганы каждый день беспокоили одного старика, играли в футбол в его дворе, шумели и т. п. Рычагов воздействия у пенсионера никаких не было. Тогда он сказал, что эта игра ему нравится, и стал давать каждому гопнику по доллару «за работу» — то есть за каждую игру в его дворе. После такой недели он с видимым сожалением (кризис!) урезал оплату до 50 центов. Еще через неделю — до 25. В следующий раз шпана уже не пришла — «нашел дураков вкалывать за ко­пейки».
Демократизм электронных пространств

А как сделать, чтобы все это заработало без материального подогрева и смазки?

Оказалось, надо всего лишь присмотреться к процессам, происходящим в Большом Интернете, где различные тематические сообщества уже десятилетиями решали все эти задачи, где эволюционно сложился набор систем, интерфейсов и практик, массово удобных и эффективных.

Например, там появились такие вещи.

Закладки. Самая первая парадигма, сбор находок в безбрежном Интернете. Затем они эволюционировали в сетевые закладки и даже в «закладки-цитаты» — Google Notebook, Evernote.

Блоги. Простейшая фиксация «ответов на незаданные вопросы». Минимальные «налоги» на регистрацию — не нужно классифицировать и актуализировать. Каждая запись — это только мнение автора на момент публикации.

Форумы. Место, где вопросы встречаются с ответами. Здесь уже есть попытка найти объективную истину или хотя бы собрать спектр мнений. Опять‑таки, актуализировать ничего не требуется, представлен весь спектр мнений вокруг одного вопроса, а вычленение сухого остатка — обычно работа читателя.

Вики‑системы. То место, где выжимаются актуальные и объективные знания, после чего они классифицируются и обрастают семантическими связями.

Определились и основные средства доступа.

Полнотекстовый поиск. Все научились «гуглить», и даже если есть отличная документация, пользователям быстрее найти ответы на свои конкретные вопросы через поисковики.

Концепция RSS/Atom‑каналов. Все изменения распространяются через ленты‑каналы в формате RSS или Atom, пользователи подписываются на них и просматривают агрегированные потоки в специальных программах и сервисах. Колесико мыши оказалось не менее ценным изобретением, чем обычное колесо: с ним очень удобно читать-просматривать длинные информационные полосы-ленты. Почему бы не присмотреться к этим инструментам и шаблонам их использования, а потом инсталлировать лучшие экземпляры у себя в компании и дать привычные для образованного человека третьего тысячелетия интерфейсы и практики — вместо того чтобы размещать очередную «библиотеку» или «систему документооборота», где все основано на бумажных метафорах доинтернетной эры.

Инженерный подход требует: «есть задача — разработать конструкцию для ее решения», после чего конструкция пустует, как заброшенное промздание. Новое решение будет его антиподом. Это скорее «агротехника» — высаживается правильная, жизнеспособная рассада, обеспечивается поливка и прочая инфраструктура, а дальше нужно наблюдать за внутренними тенденциями, внося коррективы лишь по необходимости. И такое садоводство, по крайней мере в ИТ-компаниях, встречается все чаще, ударяясь в одну из двух следующих крайностей.

Установить только какую‑нибудь вики‑систему и ждать, когда она сама наполнится знаниями. Получилось в мировом масштабе «Википедии», значит, и у нас все будет ОК. Но «Википедия» работает на мощности огромного числа авторов и редакторов, и упор там сделан не на полноту, а на целостность и актуальность — удаление недостаточно важного, недостаточно объективного, не имеющего твердых доказательств и т. п. В масштабе компании так делать нельзя — надо «допустить» информацию разной степени актуальности и обновляющие «дельты». Именно это и обеспечивает «поток» информации в противовес модели склада(2). Как раз такова модель блогов и форумов. Тогда нужно дать персональное пространство для хранения личного опыта.

«Дать людям все!» — как предлагается в кинофильме «Фонтан». Установить и вики‑систему, и блоги, и форумы, и закладки! Увы, в этом случае возникает конфликт использования — разные интерфейсы систем, невозможность переноса содержимого из‑за несовместимых форматов разметки, концепций ссылок и т. п.

Что же делать? Хорошие новости! На самом деле все стандартные системы блогов/форумов/закладок созданы для агрессивной внешней интернет‑среды, где нужно учитывать противодействию спаму, вандалам и идиотам. Даже вики‑системы если и справляются с этим, то только благодаря активному сообществу — заброшенная вики очень быстро превращается в ферму ссылок для SEO‑спамеров.

Но внутри компании, в интранете — доверенная среда. Если там обнаруживается спаммер/вандал/идиот — это радость для HR‑службы. Ему можно вправить мозги или уволить, пока он не наломал серьезных дров. А это явно прибавляет уверенности в том, что в компании можно создать не просто «сад знаний», а настоящую оранжерею на базе мощной вики‑системы, невозможную в Большом Интернете — ведь там мало кто согласится вести блог, который может испортить любой прохожий. В компании становятся осмысленными даже микроблоги. Ведь твит в Интернете о том, что какой‑то «sdk756f разобрался с технологией XXX», несет практически нулевую информацию. Ну разве что эта технология настолько редка и важна для вас, что вы попробуете с ним связаться. Совсем другое дело, если это заметка от «Васи из соседнего отдела», — теперь, когда вы нашли этот микропост-маркер, вы знаете, с кем эту тему можно обсудить, а сделать запись «Васе» ничего не стоило!

Так вот, можно реализовать все концепции: закладки, блоги, форумы и вики — на базе одной системы, наиболее мощной из всех. А именно — качественной вики, такой как MediaWiki! То есть получить все плюс бонусы вики‑систем: совместное редактирование, управление версиями, удобную разметку, поддержку шаблонов и разнородного мультимедиаконтента!

Внимательно присмотревшись, можно даже убрать концептуальный раздел между блогами и форумами — это на самом деле одно и то же, вопрос только в представлении и классификации. В обоих случаях это список блоков «тема, сообщение, обсуждение». Но блоги — это в первую очередь хронологическая лента сообщений от отдельного автора, а форум — «самое свежее от всех», то есть либо только что опубликованные темы, либо те, где кипит обсуждение. Технически это может быть единая система, просто между двумя представлениями «блоги» и «форумы» нет никакого ментальной разницы, куда писать сотруднику, когда у него возникает мысль или вопрос.
Да, информация в блогах и форумах может стать:

неактуальной — но поскольку она привязана к датам публикации, степень доверия и актуальности вполне можно вычислять из этого. Мешать может только устаревшая информация, которая в поиске находится раньше актуальной. Тогда ее можно удалить, обновить или быстро пометить как «архивную», понизив релевантность для поиска;
дублированной — например, если в длинном обсуждении «перемывается» одна и та же тема. Но полнота у нас уже есть, а если затраты оправданны, и мы легко можем добиваться и целостности, делая выжимки и резюме обсуждений в соответствии с обычным вики-подходом.

И все это не теоретические соображения, а реальный опыт: именно такое расширение «ВикиЛоги» MediaWiki мы реализовали в нашей компании. Широк спектр обсуждаемых в компании тем — от политических и организационных новостей в блоге генерального директора до жарких технологических споров с сотнями комментариев, в которых если и не рождается истина, то, по крайней мере, составляется резюме возможных проблем и решений, а участники определяются с позицией. Выросла и вовлеченность сотрудников в наполнение базы знаний.

Иногда еще встречается мнение, что вики‑системы — это какие‑то унылые поделки для программистов и прочих гиков, у которых нет денег на «что‑то серьезное от солидного вендора». Это не так. Добротные вики‑системы являются отличным компромиссом между эффективностью фиксации и актуализации знаний и их простотой и доступностью для всех категорий сотрудников. Важно запомнить: правильная вики‑система — это не когда «все плоским текстом», а когда «быстро-быстро»(3). Значит, можно грузить сколь угодно «богатый» контент — фото, видео, скринкасты, звук, диаграммы, майндмапы, статьи и книги в PDF/DjVu и, на худой конец, просто документы в офисных форматах.

А мощность самой концепции позволяет использовать вики практически для всего, хоть как‑то попадающего в категории «база знаний» и «публикация материалов», где единственная уязвимость — это все менее ценная постраничная верстка для бумажной печати. Более подробно все это разобрано в статье «MediaWiki — серебряная пуля или швейцарский нож?»(4).

Осталось поговорить о «закладках», или, вернее, о «вырезках», — ведь нечто схожее аналитики доинтернетной эры, пользуясь ножницами и кнопками, вытворяли с газетами. Они очень важны при Knowledge Miningе во внешнем Интернете — ведь сейчас пользователь компьютера совсем не похож на «оператора ЭВМ», сидящего перед клавиатурой с 10:00 до 18:00. Мы постоянно «серфим» в Интернете — ноутбуки и прочие девайсы сделали возможным чтение/просмотр информационных потоков в любом месте и положении, на улице и в туалете, стоя, лежа и сидя. Чисто физически приходится разделять режимы «читателя» и «аналитика-реализатора»: заметив интересное, выделить важное, чтобы позже, сидя за столом, проанализировать и применить. Или обратить на это важное внимание экспертов или ответственных товарищей. Например, можно собрать ключевые цитаты из книги или статьи, чтобы потом написать рецензию. Или добавить ссылки-заметки на плюсы и минусы технологии, а затем заняться их реальной проверкой. Или отметить активность конкурентов, чтобы отдел маркетинга сделал правильные выводы.

Проблемы стандартных сервисов закладок в том, что «личный склад» очень быстро замусоривается, в нем сложно искать. Набор закладок не может быть персональной базой знаний, его очень трудно рефакторить — быстро удалять, переносить куда‑то содержимое. К тому же большинство сервисов не хранят цитаты. Велики и накладные расходы на добавление ссылки: «заполните поля», «выберите категорию»… Нет групповой работы.

Как вы уже, наверное, догадались, мы сделали свой сервис «ВикиЗакладки» на базе MediaWiki. Там можно завести неограниченное число «каналов закладок» — статей, где будут размещаться ссылки и вырезки. Для добавления закладки и вырезки нужно всего лишь выделить интересное в броузере и нажать кнопку букмарклета. Сервис работает во всех броузерах без инсталляции. Закладки можно вести в одиночку и коллективно («Сводки аналитического отдела по рыночному сектору X»), разделять по темам («Книга YYY») или перемешивать. Закладки автоматически сортируются в хронологическом порядке по разделам статьи, но хранить их вечно не обязательно. Лучше время от времени разбирать их: на основе каких‑то писать новые или дополнять существующие статьи базы знаний, какие‑то превращать в реализованные проекты. А многое вскоре потеряет важность, и закладки можно будет стереть. Все это делается быстро, ибо интерфейс самый эффективный — редактирование теста: copy-paste, перенос и удаление блоков.

А чтобы сделать pull-интерфейс, нужно уметь превращать в RSS-поток любое изменение, будь то свежий пост в блоге, новая статья, закладка, редактирование и другие гибко задаваемые события. И сделать удобной подписку на эти каналы, с централизованной агрегацией и Web-интерфейсом, чтобы можно было их просматривать откуда угодно, быстро и удобно, — короче, сделать внутрикорпоративный «Google Reader». Мы сделали и его — это система «FeedOnFeeds»!

Реализован отличный полнотекстовый поиск с русской морфологией по всей вики‑системе, включая блоги-форумы-закладки, с настраиваемым выбором пространства поиска: например, можно искать в «блогах» или, наоборот, везде, кроме них. Впрочем, есть и push-интерфейс, реализованный через электронную почту, когда важна именно оперативность реакции: например, письмами приходят ответы к авторским постам и комментариям. Это привычный интерфейс для любого интернет-пользователя.
«Ненавязчивое» образование

Иногда знания нужно передавать не просто «обычной почтой без гарантии доставки», а «заказным письмом, с уведомлением о вручении», проверив, что авторские мысли поняты правильно. Такое полезно, например, для обучающих курсов или каких‑то важных регламентов.

Общеизвестен софизм греческого оратора Горгия: «Ничто не существует; если и существует, то оно непознаваемо; если оно и познаваемо, то непередаваемо». И трудно с ним не согласиться: просто диву даешься, насколько люди склонны пропускать или неверно трактовать элементарные регламенты!

Но выход есть! Как прочность программного обеспечения увеличивается при покрытии кода проверочными тестами, так и надежность передачи знаний увеличится, если сопроводить ее «автоматическими проверочными тестами на понимание».

Речь идет о классическом подходе формирования системы тестов с выбором вариантов. При всей критике, это очень дешево и эффективно. Ведь критикуют именно систему оценивания, с линейной зависимостью от числа баллов. А достаточно просто отсекать «тяжелые случаи», тугодумов или лентяев, и дополнять оценку по другим критериям. И очень эффективно использовать систему тестов в роли тренажера‑симулятора.

Но неужели нужна специальная система для редактирования тестов и выполнения проверок? Нет! Мы и это реализовали как расширение MediaWiki «MediaWikiQuizzer». То есть тесты — это те же вики‑статьи, все функции быстрой и эффективной публикации под рукой. Можно делать сколь угодно сложные композиции новых тестов из уже существующих, использовать вариации одной и той же тестовой базы — выдавать случайные блоки по N вопросов, перетасовывать варианты, включать режим экзамена или обучения и т. п.

Тесты могут работать как в проверочном режиме, так и в обучающем: «Вы выбрали не тот вариант, правильно так‑то и потому‑то». Если использовать MediaWiki для публикации курсов и MediaWikiQuizzer-тесты, то никакие «профессиональные системы e-learningа» скорее всего не потребуются. Ведь остальной бюрократический (учет студентов, оценок) функционал, предлагаемый этими системами, в организации разумного размера и с нормальными отношениями попросту не нужен.

И еще об обучении: Mediawiki можно использовать не только в режиме «человек-компьютер», но и для передачи знаний «человек-человек» — а именно, для семинаров и курсов со слайдами.

Широко известны проблемы правильных слайдов:

автор пытается угнаться за двумя зайцами: подготовить слайд-презентацию, которую можно одновременно использовать и во время доклада, и раздать для самостоятельного чтения. Из-за этого получаются страшные «слайдоменты» — гибриды «слайдов и документов»(5), совершенно бессмысленные для выступления;
авторы не могут работать совместно, быстро и параллельно редактировать слайды;
нет богатых возможностей семантической подготовки материала, таких как автоматическое построение графов и диаграмм, раскраски исходных кодов и прочего, все это приходится делать вручную и повторять при изменении материала;
хочется включать мультимедиаконтент на современном уровне — видеоролики, майднмапы, анимацию и т. п.;
сложно делать целостный reusable-контент — например, составлять презентации для разных аудиторий из одних и тех же блоков слайдов.

Мы решили и эту задачу, реализовав MediaWiki-расширение «S5SlideShow», позволяющее выпускать «гибридные» статьи, пригодные и чтения, и для показа в виде слайдов.

К сожалению, объем бумажной статьи ограничен, и «за бортом» осталось много наших MediaWiki-изобретений: календарь с системой регистрации, совместное редактирование изображений и много другое.

Но для читателя важны два главных момента.

MediaWiki «расцветает» в «оранжерее» корпоративного интранета, огражденная от вандалов и спаммеров, и на ней можно удобно реализовать все привычное для обмена знаниями: блоги, форумы, закладки, слайды, проверочные тесты.

Мы не просто «делимся опытом», а выложили все наши доработки в open-source и предлагаем всем заинтересовавшимся совершенно бесплатно установить все это у себя: просто зайдите по адресу http://wiki.4intra.net/Mediawiki4Intranet.

Dpznj c iemag.ru

Гугл видит ВсЕ. В прямом смысле видит

Взято у ne-onn

Доказательства
Функция Instant Preview – вот почему мы видим скриншоты-аннотации в SERP. Эти превью обладают впечатляющей возможностью: они не только отображают скриншот страницы, но также визуально выделяют и подчеркивают текст, подходящий под ваш запрос. Этого просто невозможно достигнуть простым текстовым пауком. Cкриншоты флеш-страниц – вы, возможно, уже заметили в Инструментах вебмастера Google скриншоты флеш-сайтов.

Постойте... я думал, Google не видит флеш... Подтверждение запросов AJAX POST – Мэтт Каттс подтвердил, что GoogleBot умеет обращаться с запросами AJAX POST, и, по случайному совпадению, это произошло через несколько часов после того как Рэнд запостил статью «GoogleBot – это Chrome». Согласно определению, AJAX – это контент, загружаемый JavaScript, когда происходит действие после загрузки страницы. Следовательно, его невозможно отследить с помощью текстового паука, потому что текстовый паук не выполняет JavaScript, а только получает существующий код, каким он предоставлен при первоначальной загрузке. Google отслеживает Flash – Мэтт Клэйтон также показал мне некоторые журналы сервера, в которых GoogleBot получал доступ к URL, которые доступны только через встроенные Flash-модули на Mixcloud.com: 66.249.71.130 "13/Nov/2011:11:55:41 +0000" "GET /config/?w=300&h=300&js=1&embed_type=widget_standard&feed= http%3A//www.mixcloud.com/chrisreadsubstance/bbe-mixtape-competition-2010.json&tk=TlVMTA HTTP/1.1" 200 695 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" 66.249.71.116 "13/Nov/2011:11:51:14 +0000" "GET /config/?w=300&h=300&js=1&feed=http%3A//www.mixcloud.com/ZiMoN/electro-house-mix-16.json&embed_type=widget_standard&tk=TlVMTA HTTP/1.1" 200 694 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

Допустим, это не новость, но другой пост от 2008 года объясняет, что Google «рассматривает Flash-файлы таким же образом, как это делал бы человек, вводя данные, и так далее». А, вы имеете в виду, как человек работает с браузером? Скорость сайта – Хотя Google мог бы получать время загрузки сайтов с панели инструментов и данные об использовании от Chrome, для него гораздо надежнее получать эту информацию, индексируя саму сеть. Не выполняя всего кода страницы, практически невозможно точно вычислить время загрузки этой страницы. До сих пор все это могло звучать так, как будто Google находится всего в нескольких шагах от SkyNet. А оптимизаторы и Google уже много лет уверяют нас, что поисковый робот (паук) имеет текстовую основу, поэтому это может показаться вам фантастикой. Уверяю вас, это не так, и многие из тех вещей, о которых я говорю, доступны программистам даже с намного менее сильной командой инженеров, чем у Google. Знакомьтесь – PhantomJS PhantomJS – это headless Webkit browser, которым можно управлять через JavaScript API. С помощью небольшой автоматизации скрипта браузер легко можно превратить в паука. Забавно, что его логотипом является призрак, похожий на призраки в Pacman, а концепт довольно прост: PhantomJS используется для загрузки страницы так, как пользователь видит ее в Firefox, Chrome или Safari, извлечения материалов и прослеживания ссылок. PhantomJS имеет бесчисленное количество приложений для парсинга информации и других видов анализа сайтов, и я советую SEO-общественности осознать это прежде чем мы двинемся дальше. Джош воспользовался PhantomJS, чтобы подготовить некоторые доказательства сведений, которые я выложил на SearchLove. Ранее, когда я выпустил GoFish, я уже упоминал, что столкнулся с трудностями при сборе информации о росте количества запросов с Google Insights с помощью текстового паука из-за того, что список этих вопросов предоставляется через AJAX. Ричард Бакстер предположил, что эти данные легко можно собрать с помощью строки XPath (XPath string), и это убеждает меня в том, что поисковая архитектура ImportXML в Google Docs основана тоже на headless browser. На схеме написано красным: «Обычным путем эти данные получить невозможно, потому что это AJAX». Во всяком случае, здесь Джош снимает эти данные со страницы при помощи PhantomJS. Делать скриншоты текстовым пауком невозможно, но с помощью headless webkit browser это проще простого. На этом примере Джош показывает, как делаются скриншоты при помощи PhantomJS. Chromium – это общедоступная ветвь браузера Webkit, а я сильно сомневаюсь, что Google создал браузер из чисто альтруистических побуждений. Вышеупомянутое исследование предполагает, что GoogleBot – это многопоточный headless browser на основе того же самого кода. Почему нам ничего не говорят? Ну, вообще-то, говорят, но утверждают, что «робот-индексатор для создания превью» – это совершенно отдельный объект. Представьте этого робота как «миссис Pacman». Участник главного форума вебмастеров пожаловался, что в качестве пользовательского агента у них в журналах отображается "Mozilla/5.0 (X11; U; Linux x86_64; en-US) AppleWebKit/534.14 (KHTML, like Gecko) Chrome/9.0.597 Safari/534.14", а не "Mozilla/5.0 (en-us) AppleWebKit/525.13 (KHTML, like Gecko; Google Web Preview) Version/3.1 Safari/525.13". Джон Му рассказал: «В качестве инструмента для тестирования мгновенных превью мы используем пользовательский агент по образцу Chrome, чтобы можно было сравнить то, что будет видеть браузер (при помощи этого пользовательского агента), с тем, что видим мы с помощью доступа Googlebot к кэшированному превью». В то время как headless browser и Googlebot, как мы знаем, отличаются, мне кажется, что они всегда параллельно просматривают страницы и собирают информацию для индексации и ранжирования. Другими словами, это как одновременная двухпользовательская версия Pacman с миссис Pacman в 3D и обычным Pacman, которые играют на одном уровне в одно время. В конце концов, паукам не было бы смысла просматривать всю сеть дважды по отдельности. Так почему же относительно этих возможностей не все так ясно, ведь они имеют отношение к ранжированию? В двух словах: качество поиска. Прикрываясь недостатками текстовых пауков, поисковики могут продолжать использовать их в качестве козла отпущения, объясняющего их неидеальные результаты. Они могут продолжать двигаться в направлении таких вещей как предполагаемый AuthorRank и полагаться на SEO, чтобы в буквальном смысле оптимизировать свои поисковые машины. Они могут продолжать говорить неопределенные вещи, вроде «не гонитесь на алгоритмом», «улучшайте пользовательское восприятие» и «мы учитываем то, что видно без прокрутки», что заставляет специалистов SEO облегчать работу Google. Основной продукцией Google (и единственной их продукцией, если спросить у Эрика Шмидта в суде), является поиск, и если обнародовать информацию о том, что их возможности намного превосходят заявленные, то им придется повысить качество поиска. Они не говорят нам об этом, потому что с ростом возможностей растет и ответственность.

Что это означает для нас?
Когда мы с Джошем представили свое исследование, многие люди спрашивали меня: «Как это должно поменять мои действия в плане SEO?». По моему мнению, есть три момента:

1. Javascript не поможет вам ничего скрыть. Если вам казалось, что с помощью постзагрузки JavaScript вы можете спрятать какой-либо контент – прекратите это делать. Заманивание и переключение теперь на 100% неэффективный метод. Pacman видит все.
2. Пользовательское впечатление чрезвычайно важно. Google сейчас может в буквальном смысле видеть ваш сайт! Как сказал Мэтт Катс, они смотрят на то, что выше границы прокрутки, а следовательно, могут учитывать при ранжировании то, сколько рекламы представлено на странице. Google может применять данные о поведенческих факторах вместе с дизайном сайта чтобы определить, насколько сайт полезен для людей. Это одновременно радует и пугает, но также это означает, что каждый специалист SEO должен приобрести книгу Круга «Не заставляй меня думать».

3. Инструменты SEO должны стать умнее. Большинство средств SEO основано на текстовых сборщиках (text scrapers), и хотя многие из них довольно сложны (в данный момент лидирует SEOmoz), они все еще сильно напоминают Pacman 80-х годов. Если мы хотим понять, что на самом деле принимает во внимание Google при ранжировании страниц, надо учитывать больше аспектов. - При обсуждении таких вещей как Page Authority и вероятность спама необходимо визуально проверять страницы с точки зрения программы, а не ограничиваться простыми показателями, такими как плотность распределения ключевиков и граф ссылок.

Другими словами, нам нужен показатель качества пользовательского восприятия (UX Quality Score), на который влиял бы визуальный анализ и возможные видоизменения спама. - Следует сравнивать, насколько отображаемая страница отличается от того, что можно предполагать по коду. Это можно назвать коэффициентом дельта (Delta Score). - При оценке распределения доли ссылок на странице нужно также учитывать динамическое преобразование (dinamic transformations), поскольку поисковые машины способны понять, сколько в действительности ссылок на странице. Этот фактор тоже можно включить в коэффициент дельта (Delta Score). - Также следует включить в наш анализ обработку естественного языка, так как это, по-видимому, тоже учитывается алгоритмом Google. Этот фактор не оказывает значительного влияния на общий результат, но помогает определить ключевые понятия, с которыми машина ассоциирует контент, а также полностью понять, чего стоит ссылка с учетом желаемого результата. Другими словами, необходим контекстуальный анализ графа ссылок. В двух вещах я согласен с Мэттом Катсом. Единственный постоянный параметр – это перемены. Однако мы должны также понимать, что Google будет продолжать дезинформировать нас относительно своих возможностей или подталкивать к определенным выводам, которых мы потом будем придерживаться. Поэтому нам следует понимать, что Google в ответе за свои технологии. Проще говоря, если они могут точно доказать, что они ничего такого не делают, то с этого момента им следует начать; в конце концов, там работают одни из самых талантливых инженеров на планете. Google продолжает усложнять поисковый маркетинг и отменять данные, позволяющие нам улучшать восприятие пользователем, но факт в том, что у нас симбиоз. Поисковики нуждаются в SEO-специалистах и вебмастерах, чтобы сделать сеть быстрее, проще и понятнее, а мы нуждаемся в поисковиках, чтобы качественный контент поощрялся, занимая более заметные места. Проблема в том, что у Google в руках все карты, и я рад, что приложил свои усилия к тому, чтобы вырвать одну из них. Твой ход, Мэтт.

Взято у ne-onn

20 дек. 2011 г.

Facebook может влиять на кредитный рейтинг участников

Взято с ИнФокс

Банки и иные финансовые учреждения намерены использовать социальную сеть Facebook для получения дополнительной информации о клиентах, желающих получить кредит на те или иные нужды.

Личная страничка человека в Facebook может рассказать специалистам о многом и существенно отразиться на его кредитном рейтинге. Основываясь на анализе данных, банк может принять решение о выплате кредита или отказе в кредитовании. Принцип работы этой схемы готов пока еще не полностью, но некоторые его аспекты уже озвучены. Работники банка будут смотреть, в первую очередь, на список друзей клиента и искать среди них злостных неплательщиков. Наличие таковых, само собой, не будет способствовать успеху в получении суммы. Обратная ситуация — когда в списке друзей у клиента есть весьма обеспеченные люди, — тоже имеет место быть, и тут уж шансы на получение кредита заметно возрастают.

По некоторым данным, одной только сетью Facebook банки не ограничатся. Для анализа им подойдет даже Twitter, столь популярный на западе. Здесь, как и в случае с социальной сеть, оценивается список друзей, но также и самого клиента в микроблоге.

10 дек. 2011 г.

Противоправные инструменты на защите Закона? Интересно живется в "развитых демократиях"...

Норвежская полиция безопасности (PST) намерена заражать вирусами компьютеры подозреваемых в противоправной деятельности

Датская полиция безопасности (PET) уже десять лет имеет легальную возможность заражать компьютеры потенциальных террористов и шпионов специальными программами типа троянских вирусов. Норвежские контрразведчики хотели бы воспользоваться опытом датских коллег и также получить возможность доступа к удаленным компьютерам потенциально неблагонадежных элементов.

«Решение, которое соответствует датскому законодательству, предполагает большее вторжение, но в некоторых случаях может стать абсолютно необходимым для того, чтобы получить доступ к актуальной информации. В соответствии с датской моделью имеется возможность наблюдать и регистрировать все системные данные в течение продолжительного времени», - сообщается в предложениях, которые разработала норвежская PST.

«Меры, которые содержатся в наших предложениях, еще не рассмотрены на юридическом или политическом уровне, поэтому мы не можем предоставить дополнительные комментарии», - заявила представитель PST Сив Алсен.

9 дек. 2011 г.

eBay разработала язык запросов к Web

Взято с сайта Открытые Системы

Язык запросов ql.io упрощает работу с веб-сервисами получения данных

Джоаб Джексон Служба новостей IDG, Нью-Йорк

Компания eBay предложила язык программирования ql.io, позволяющий объединять запросы к различным API в один вызов, что упрощает получение данных из Web.

«Использование ql.io сокращает число строк кода, необходимого для обращения к различным HTTP API. Кроме того, в определенных случаях снижаются задержки в сети и требуемая полоса пропускания», — пояснил Суббу Алламараджи, разработчик eBay, который руководил работой по созданию ql.io.

Язык ql.io стал еще одним предствителем большой группы программных продуктов, разработанных крупными провайдерами сервисов и предложенных ими сообществу для использования и совершенствования. В эту группу входит, например, инструмент анализа потоков данных Storm, созданный Twitter, программное обеспечение хэширования данных memecached, предложенное LiveJournal, инструмент агрегирования записей протокола Scribe, разработанный Facebook, и протокол SPDY, созданный Google.

Для разработчиков веб-сайтов и приложений для Web написание кодов для извлечения данных из других сетей может оказаться трудоемким процессом, отметил Алламараджи в посте в своем блоге. Этот пост он и озаглавил соответственно: «API — кошмар разработчика».

В качестве примера он привел клиентскую программу, для которой требуются данные о продукте, размещенные на сайте электронной коммерции и в которой нужно написать три отдельных обращения к различным API: для выполнения поиска данных, для извлечения детальной информации о продукте и для получения отзывов пользователей. Написание запросов ко всем этим API — большая работа, а исполнение каждого запроса по отдельности влечет «накладные расходы» в виде загрузки полосы пропускания и ресурсов процессора.

С помощью ql.io разработчики смогут агрегировать все эти запросы в один. На специализированном веб-сервере выполняется разбор запроса и результаты выдаются единым пакетом.

ql.io представляет собой декларативный управляемый событиями язык, основанный частично на языке запросов к СУБД, а также на формате обмена данными JSON (JavaScript Object Notation). В нем используется интерпретатор node.js из JavaScript на сервере.

Исходный код языка, который распространяется на условиях лицензии Apache License 2.0, размещен в интерактивном репозитории кодов GitHub. Алламараджи привел также несколько примеров использования языка, с которыми можно ознакомиться на недавно созданном сайте ql.io.

Google запустит специализированный сайт для маркетологов

Взято с CMONews

Google представила новую специализированную платформу Think Insights, которая содержит полезную информацию для пользователей, занимающихся и интересующихся маркетингом - Think Insights.

Данный ресурс предлагает множество полезных инструментов для маркетинговых исследований, объемную информацию о последних в данной области тенденциях, а также различные вспомогательные материалы. Так, на страницах сайта представлен инструмент Real Time Insights, с помощью которого можно получить сведения про зарождающиеся тренды в конкретном регионе. Инструмент работает в режиме онлайн и позволяет узнать про нужды и потребности потребителей. Так, воспользовавшись данным инструментом, можно с легкостью выяснить, какой видеоролик просматривается чаще всего, к примеру, итальянскими мужчинами в возрасте от 25 и до 34 лет.

Интересен и библиотечный раздел ресурса Research Library, содержащий отчеты и результаты маркетинговых исследований, не говоря уже про сформированные по темам видеоролики, а также инфографику.

На страницах своего блога Google заявляет, что стремится постоянно совершенствовать продукты, поэтому компания приглашает всех своих пользователей к диалогу, который можно вести на Think With Google. А вот следить за всеми обновлениями ресурса можно, подписавшись на новостную ленту от Google.

6 дек. 2011 г.

Веб-аналитика 2.0 на практике. Тонкости и лучшие методики

Взято с сайта Издательства Диалектика
Веб-аналитика 2.0 на практике. Тонкости и лучшие методики
автор Авинаш Кошик

Web Analytics 2.0: The Art of Online Accountability and Science of Customer Centricity
Avinash Kaushik

"Несмотря на бурное развитие веб-среды, онлайнового маркетинга и рекламы за последние несколько лет, подход к использованию данных в основном остался тем же самым, что и десятилетие назад. В этой книге лидер в области веб-аналитики, Авинаш Кошик, представляет платформу веб-аналитики следующего поколения, которая существенно расширяет интеллектуальные возможности организаций и способствует более быстрому их росту.

Авинаш компонует специфические стратегии и модели выполнения для перехода от простых инструментов анализа потока кликов к эффективной смеси качественных данных, экспериментирования, тестирования и инструментов конкурентной разведки.

Расширяя уроки, изложенные в своей предыдущей книге, автор объясняет, как измерять, анализировать и иметь дело с современными быстро развивающимися технологиями и трендами, включая социальные медиа, видео, мобильные средства и ориентированный на пользователей дизайн онлайновых ресурсов. Обновляя традиционные подходы, Авинаш развенчивает мифы, идентифицирует ловушки и демонстрирует специфичные, простые и расширенные методологии для трансформации образа вашего мышления. Все это превращает книгу в незаменимое руководство для всех веб-профессионалов.

В этой книге Вы

* Найдите решения для сложнейших проблем, включая многоканальную аналитику и анализ вклада многоконтактных кампаний
* Подсчитайте экономическую ценность своего веб-сайта и измерьте макро- и микроконверсии для веб-сайтов электронной коммерции, некоммерческих веб-сайтов и веб-сайтов B2B
* Извлеките пользу от методологий аналитики, связанных с поиском – внутреннего поиска по сайту, маркетинга платы за клик и поисковой оптимизации
* Определите наиболее подходящие основные индикаторы производительности (KPI) для организации и создания действенного пульта управления, являющегося движущей силой
* Научитесь выполнять аналитику в критически важных областях, таких как Twitter, YouTube, блоги и мультимедийный контент
* Используйте экспериментирование и тестирование для создания по-настоящему ориентированных на клиентов веб-сайтов
* Создайте босса и организацию, которые ориентированы на данные, и добивайтесь уровня знаний и опыта, необходимых для успешной карьеры аналитика
* Продолжайте обучение с использованием материалов, предоставленных на прилагаемом компакт-диске...."

Взято с сайта Издательства Диалектика

3 дек. 2011 г.

Социальные сети и конкурентная разведка (часть 2)




Продолжение - начало тут

Как искать объект
Прямой поиск
Это поиск личной странички с помощью встроенной поисковой системы по совпадению нескольких признаков (ФИО + дата рождения; или ФИО + место проживания…). Такой поиск по разному организован в разных сетях, но он есть везде, по скольку этот поиск является фундаментом развития данной сети. Ведь что делает человек впервые создав страничку в социальной сети? – правильно – ищет своих друзей, чтобы с ними наладить контакт. А как ему это сделать кроме как не через поиск?... Вот и для конкурентной разведки такой поиск является достаточно удобным инструментом исследований.
Искать можно по имени и фамилии (это есть во всех сетях), можно ограничивать выборку возрастом или датой рождения, местом жительства или другими признаками. При этом нужно знать и использовать особенности внутренних поисковых систем социальных сетей, в том числе и операторы этих систем.
Взять, к примеру, «Одноклассники». У них используется внутренняя поисковая система умеющая работать с операторами. Например с оператором «квадратные скобки» или с оператором «нижнее подчеркивание». И используя эти операторы можно в ряде случаев облегчить поиск:
1. Чередующаяся буква. Бывают случаи, когда нам не известно, какая буква стоит в имени того или иного человека. Может мы просто забыли, или не знали. Возможно пользователь мог написать свое имя по-разному. К примеру, Лейсан и Ляйсан. Что бы нам не ломать голову, и не подбирать нужный критерий часами необходимо воспользоваться квадратными скобками. Это делается следующим образом: Л[ея]йсан. Вводя в поиск подобное имя, мы сможем найти всех, кто подходит под требование. Система автоматически будет чередовать буквы, проверяя и тех и других.
2. Если же вы вообще не знаете одну из букв в имени пользователя, то здесь вам придется воспользоваться иным вариантом. Скажем Вы точно помните, что вашу подругу детства звали как схоже с Машей, но не уверенны, что именно так. Можно вписать имя следующим образом «_аша». Тогда система начнет подбирать вместо нижней черты все возможные буквы и получившиеся комбинации. То есть: Даша, Маша, Саша и тому подобное. Так что, как видите это просто необходимая функция для поиска.
У Фэйсбука выявлен один оператор работы с поиском. Это “|“ (вертикальный слэш) – логическое "ИЛИ" – помогает вывести результаты, которые содержат хотя бы одну часть поискового запроса.
Кроме поиска встроенным поисковиком социальной сети, можно воспользоваться «большими» поисковиками (Google, Яндекс…). Дело в том, что последнее время обозначилась тенденция у соцсетей открывать данные пользователей для индексация поисковиками. Но часто проблема заключается в большом количестве совпадений, находимых поисковиками. При поиске через глобальные поисковые системы можно воспользоваться их операторами для ограничения поиска нужной соцсетью.
Помимо этого есть в интернете довольно много специализированных сервисов для поиска по социальным сетям.

Приведу несколько примеров:
Poiski
http://www.poiski.ru
Русскоязычная система поиска людей. Сервис предлагает подробно описать, кого именно пользователь ищет.

123people
http://www.123people.com
В поисковой выдаче данного сервиса будут показаны социальные сети, результат поиска по блогам и фотохостингам, по ссылкам и микроблогам, видео, документам, доменам, телефонным номерам, электронным адресам и другой информации.
В результате на странице с результатами поиска будет размещено несколько блоков. Это блоки с фотографиями и картинками, электронными адресами, телефонными номерами, ссылками, публикуется даже облако тегов, связанное с человеком.

Yoname
http://www.yoname.com
Поиск по профилям и сообщениям пользователей вполне определенных социальных сетей MySpace, LinkedIn, Friendster, Windows Live Spaces, Bebo, Digg, Match, Xanga, YouTube, FaceBook, LinkedIn, Yahoo 360, Flickr, Friendster.
Ищутся точные совпадения имени и фамилии, учитывается и социально демографическая информация: пол, возраст, расположение, род деятельности.

Wink
http://wink.com
Поисковик индексирует только «социальные» сайты, где информация снабжается тематическими тегами L. Поиск осуществляется по уже отфильтрованной и классифицированной информации.
Вместо автоматических алгоритмов ранжирования и фильтрации он полагается на коллективный разум тысяч людей, которые самостоятельно классифицируют информацию и вручную помечают наиболее релевантные ссылки.
Можно детализировать запрос с помощью различных слов, которые встречаются в профилях пользователей, - интересов, музыки и т.д.

Bing-social
http://www.bing.com/social
Поисковик от Microsoft.
На первый взгляд производит хорошее впечатление - корректно ищет по Интернету.
Microsoft договорились с Facebook, потому поиск идет прежде всего здесь.
Почему-то для поиска надо сменить страну на США, наверное, у них с языковыми версиями пока проблема.

Через группы
Это поиск объекта в группах, образованных пользователями. Это могут быть самые разнообразные группы работа, учеба, места отдыха, места службы, группы по интересам и по увлечениям… Если, например, известен период работы объекта в некой организации, то можно изучить соответствующую группу пользователей и по дополнительным признакам определить искомый объект. Или для поиска по отдыху в определенном месте в определенное время также можно воспользоваться соответствующей группой.

Спросить у знающих людей
Если об объекте мало информации, но есть люди знающие объект – почему бы не поинтересоваться у них. Понятно, что задавать «вопрос в лоб» не нужно, хотя и можно – вряд ли таким способом получите искомое. А вот чрез опосредованное общение или посредством обсуждения «родственных» тем – вполне можно.
Такое поиск возможен только в социальных сервисах – в сервисах, где возможно общение между участниками. Именно общение является основой данной технологии поиска объекта.
Можно, зная, что объект признан знатоком определенной темы, спровоцировать общение по этой проблематике, подобрав заранее элемент, сложный для разрешения или спорный. Через какое то время, обращая внимание именно на спорный момент, вы добьетесь того, что либо обратятся к объекту, либо посоветуют обратиться к нему. А это отличный повод познакомиться не настораживая. В общем то старый испытанный способ переложенный на платформу социальных сетей.

Провоцированием самого объекта
Если известны интересы объекта, то можно подтолкнуть объект к ответной реакции на ваши действия (высказывания) и тем самым идентифицировать. Можно действовать по указанной выше схеме – нужно только знать, что тема его действительно заинтересует. И тогда либо обсуждая интересные для объекта вопросы, или рассуждая о них и делая «ошибочные» суждения и выводы, можно добиться того, что объект вступить в диалог.

С уважением!
Нежданов Игорь

Продолжение следует...
Оригинал материала "Социальные сети и конкурентная разведка (часть 2)

Google Maps видит сквозь стены и потолки

Взято с Компьюленты

Корпорация Google приступила к картографированию закрытых помещений: торговых центров, аэропортов, магазинов.

Пользователи «гуглофонов» уже получили в своё распоряжение карты аэропортов Атланты, Сан-Франциско, Чикаго и Токио. Теперь пассажирам не придётся возиться с информационными киосками и отдельно стоящими схемами: Google Maps подскажет направление к выходам, кафе, уборным. Путь не прокладывается, просто показывается, где вы находитесь относительно ближайшей «достопримечательности».

Компания полагается не на спутниковые рентгеновские снимки, а на сотрудничество с организациями, в ведении которых находятся объекты. К аэропортам уже присоединились магазины Mall of America, IKEA, Home Depot, Macy's, Bloomingdale's и др.

«Гугл» также разработал сайт, на который любой ответственный за здание может загрузить поэтажные планы и чертежи, связав их со спутниковыми изображениями и задав направления.

«Подробные поэтажные планы автоматически отображаются при увеличении того здания, где они доступны, — пишет пресс-служба Google. — Знакомая голубая точка указывает на ваше местоположение в пределах нескольких метров, а при перемещении вверх или вниз в здании с несколькими этажами интерфейс будет автоматически обновляться».....

2 дек. 2011 г.

Тенденции в поисковых технологиях Яндекса

Яндекс начинает поддерживать schema.org
Яндекс присоединяется к инициативе международной группы schema.org по поддержке единого стандарта семантической микроразметки.

Стандарт schema.org появился летом 2011 года усилиями поисковиков Bing, Google и Yahoo. Представители этих компаний сформировали рабочую группу, которая выработала основы единого стандарта и продолжает улучшать несколько сотен схем разметки для различных типов данных. С недавнего времени Яндекс принимает активное участие в работе этой группы.

Цель семантической разметки – дать возможность роботам узнать больше полезной информации из данных веб-страниц. С помощью специальных свойств html-тегов, описанных в коллекции разметки schema.org, можно указать, какое именно свойство объекта описывает размеченный участок текста и его контекст.

Специально обученные и подготовленные роботы (в частности, поисковых систем) распознают такую дополнительную разметку, чтобы в дальнейшем интерпретировать ее на благо пользователя. На текущий момент самый популярный вид использования семантической разметки поисковиками – создание специальных сниппетов на странице результатов поиска.

Теперь контент, размеченный вебмастерами с помощью schema.org, будет понятен сервисам Яндекса, в том числе и Поиску. Уже сейчас schema.org поддерживают такие сервисы, как Яндекс.Справочник, Яндекс.Словари, Яндекс.Картинки, Яндекс.Видео. Благодаря schema.org в рамках проекта Яндекс.Видео стало возможным размечать более одного видеоролика на странице. Данные из этих сервисов различными способами (например, в виде специальных сниппетов) используются в Поиске Яндекса. Более подробную информацию вы можете прочитать в нашей документации.

Мы считаем, что семантическая разметка страниц улучшает мировой интернет. Поэтому мы не только используем её в своих сервисах, но и сами размечаем их. Первым таким сервисом стал Мой Круг. На страницах профилей вы теперь также можете обнаружить разметку schema.org.

Еще один интересный источник инофрмации для конкурентной разведки

Вот еще один интересный источник инофрмации для конкурентной разведки и не только источник, но и средство обработки информации:

У Salesforce.com появился сервис мониторинга мнений о брендах и продуктах

Компания Salesforce.com ввела в действие Radian6 Social Marketing Cloud — новый набор сервисов, расширяющих возможностей облачной CRM-системы. Его назначение — отслеживание в Интернете мнений о различных продуктах и брендах. Платформа обрабатывает данные со 150 млн онлайн-источников и поддерживает 17 языков, включая русский.

Один из элементов «маркетингового облака» Radian6 — Social Insights, система построения аналитических информационных панелей, позволяющих компаниям извлекать наиболее важную для них информацию из всего потока социальных данных. Последние можно сегментировать по географии, демографии и тону высказываний. Система способна «вычислять» наиболее влиятельных пользователей, обсуждающих тот или иной брэнд, — по числу последователей на Twitter и другим связам.

Еще один элемент Radian6 — Social Hub, механизм на базе правил, передающий информацию с социальных сайтов в отделы продаж или поддержки. Например, заказчик, жалующийся в Twitter на плохой сервис в авиакомпании, автоматически будет переадресован на ее маркетинговый отдел, где ему могут в качестве возмещения морального ущерба предложить билет со скидкой.


Взято с сайта Открытые Системы

1 дек. 2011 г.

Спецслужба Великобритании проводит конкурс среди хакеров

Взято с СекьюритиЛаб

Центр обработки развединформации Великобритании надеется найти сотрудников среди хакеров. Сотрудники Центра обработки развединформации Великобритании (Government Communications Headquarters, GCHQ) сообщили о проведении конкурса среди хакеров. Конкурс проводится с целью принятия на работу в Центр молодых специалистов.

В рамках проведения конкурса, представители спецслужбы создали web-сайт со специальным шифром, который должны взломать участники конкурса. Организаторы конкурса заявили, что этот метод был выбран для привлечения специфической аудитории.

"Целевая аудитория этой кампании – не те люди, которых можно привлечь традиционными рекламными методами. Мы хотим, чтобы они знали, что нам требуются специалисты в области криптографии", - отметил один из представителей Центра.

Участники, которым удастся взломать шифр, должны ввести кодовое слово в специальное окно. После этого, их перенаправят на ресурс с вакансиями Центра обработки развединформации. Спецслужба не будет рассматривать кандидатуры тех хакеров, которые ранее проводили кибератаки, а также тех людей, которые не являются гражданами Великобритании.

Отметим, что Центр обработки развеинформации уже не впервые ищет сотрудников таким нестандартным образом. В 2007 году информация о деятельности Центра размещалась в шпионской игре Splinter Cell Double Agent и в Tom Clancy’s Rainbow Six: Vegas. В 2009 году спецслужба искала специалистов среди любителей видеоигр. В то время Центр размещал свою рекламу в виде видеороликов и изображений в игровой сети Xbox Live, в играх Call of Duty, Assassin’s Creed и пр.

30 нояб. 2011 г.

Самодельный поисковик YaCy будет конкурировать с Google

Еще одна попытка создать альтернативу Гуглу и как следствие новый источник для конкурентной разведки. Надо сказать с интересной задумкой...

Взято с BBC

YaCy - далеко не первая попытка конкурентов свергнуть Google с пьедестала поисковиков
У поисковых сайтов типа Google, Bing и Yahoo появился новый конкурент - поисковик YaCy, главной отличительной чертой которого является открытый доступ к программному обеспечению.
Любой желающий сможет скачать в сети программное обеспечение YaCy и форматировать его на свой вкус. Таким образом, новинка позволит не только снизить нагрузку на серверы, но также будет в гораздо меньшей степени уязвима для цензуры.
YaCy, запущенный 28 ноября при поддержке Европейского фонда свободного программного обеспечения (FSFE), в отличие от своих конкурентов, основан на независимой поисковой системе (Peer to Peer, или P2P), в которой вместо центрального сервера в поисковом процессе используются независимые узлы (peers) распределенной (децентрализованной) сети.
На каждом из узлов, которых на данный момент насчитывается около 600, будет расположен отдельный локальный поисковый индекс, являющийся частью обширной поисковой сети.
"Большую часть нашей деятельности в интернете составляет процесс поиска, - заявил руководитель проекта Майкл Кристен. - Это ключевое звено между нами и необходимой нам информацией. Столь важное для нас действие не должно проходить под надзором нескольких крупных интернет-компаний, которые могут нарушить конфиденциальность запросов".
Туманные перспективы
В фонде FSFE, который борется за будущее свободного программного обеспечения в современном цифровом обществе, утверждают, что поисковая модель YaCy позволит пользователям создавать и форматировать свои личные профили.
Эта система, в отличие от централизованных поисковиков вроде Google и Yandex, сможет гарантировать конфиденциальность запросов и защиту персональных данных пользователей.
YaCy доступен для платформ Windows, Linux и Mac OS X; создатели проекта призывают интернет-пользователей загрузить программу и испробовать ее лично.
В день запуска демоверсии поисковика, который уже сейчас используется для внутреннего поиска по сайтам FSFE и Sciencenet, демоверсия YaCy чуть не рухнула из-за наплыва поисковых запросов.
Впрочем, перспективы новичка на мировом рынке поисковых систем пока что весьма туманны. Инновационные проекты, такие как Cuil или Bing, в прошлом пытались соперничать с интернет-гигантом Google, но особых успехов не достигли.
Первый был запущен в 2008 году, но закрылся в сентябре 2010; второй стал очередной попыткой Microsoft перехватить рынок у Google, но также не сумел даже приблизиться к детищу Сергея Брина по популярности.

Взято с BBC

27 нояб. 2011 г.

Социальные сети и конкурентная разведка (часть 1)



Social network and competitive intelligence

Полностью опубликовано в моём блоге Технологии конкурентной разведки

Особенности соцсетей
Что такое соцсеть
Социальная сеть — интерактивный многопользовательский ресурс, контент которого наполняется самими участниками сети. Ресурс представляет собой автоматизированную социальную среду, позволяющую общаться группе пользователей, объединенных общим интересом. Собственно то, что содержимое создается самими пользователями и представляет интерес для конкурентной разведки. Ведь обыватель в большинстве своем далек от проблем защиты персональных данных и прибывает в уверенности, что написанное им будут читать только добрые люди. И обыватель пишет…. Пишет всё, что знает, о чем слышал, о чем догадывается. И таких создателей содержимого очень много.

Причины популярности
Человек по сути своей нуждается в общении. А социальные сети позволяют еще эффективнее это общение осуществлять. Соцсети делают общение возможным в любое удобное время, удобном месте и обстановке, не зависеть от расстояний и границ. При необходимости можно «улучшить» себя или создать идеальную личность. Поэтому популярность социальных сетей растет.

Изменение аудитории
Популярность соцсетей растет,а с популярностью растет и число пользователей. Мало того - идет выравнивание аудитории по возрасту – в соцсети идут не только молодые, но и зрелые и пожилые люди. Также в соцсети идут представители всех социальных слоев.
Активная аудитория социальных сетей в России к 2015 году составит 76 миллионов пользователей против 31 млн на начало 2010 года, прогнозирует J'son & Partners Consulting. А это большая часть населения. При таком количестве «генераторов контента» просто верх безрассудства не использовать соцсети как источник информации.
Сами понимаете, что такая популярность социальных сервисов ведет к накоплению огромного массива информации, что естественно крайне интересно конкурентной разведке, а значит ею используется

Тенденции

Кроме того социальные сети развиваются, приспосабливаются к потребностям клиентов, повышают свою привлекательность… Такое развитие заложило вполне определенные тренды в развитии соцсетей:
Интеграция с другими сервисами и сетями – с другими соцсетями например. Ведь гораздо удобнее управлять сразу несколькими аккаунтами чем в каждый вносить изменения отдельно. Такая интеграция дает дополнительные инструменты и конкурентной разведке. Ведь гораздо удобнее найдя один аккаунт объекта, сразу проследить все его накопления информации и действия, а не тратить время на поиск остальных.
Специализация - развитие тематических (узкоспециализированных) сетей – сетей предназначенных под специальные задачи. Конечно же есть например теже самые группы, но гораздо комфортнее себя чувствуешь, когда знаешь, что это не маленький кусочек огромной аудитории, а организация изначально, созданная под твои хотелки. И тут для конкурентной разведки дополнительные удобства – если нужно исследовать специфическую область, то гораздо эффективнее изучить материал собранный специалистами в этой области…
Технологическое развитие (следствие конкуренции) – тут все понятно – новые технологии тут же используются социальными сервисами для своих нужд и более эффективного удовлетворения потребностей юзеров, для привлечения еще большего количества этих же юзеров.
Коммерциализация (монетизация) и внедрение в бизнес – с коммерциализацией социальных сервисов понятно – альтруизм вещь весьма редкая в этом мире, а вот использование возможностей соцсетей в бизнесе это действительно сильный тренд. И снова для конкурентной разведки дополнительные удобства – если бизнес в своей деятельности использует социальные сервисы, то значит через эти самые сервисы можно собрать информацию об этом бизнесе и повлиять на этот самый бизнес.
Мобильность – «будь всегда на связи» это девиз современного общества и соцсети не исключение.
Создание индивидуальных «облаков» - это еще одно удобство – все свои материалы всегда иметь под рукой и не таскать с собой кучу флэшек.
Визуализация всего что только можно – наглядность всегда удобна и для себя и для окружающих, так что визуализация будет только развиваться и в социальных сетях тоже.

Соцсети как источник информации
Какая информация может быть получена
Что можно узнать в соцсетях? Ответ весьма интересен – возможности ограничены только знаниями пользователей данной сети. Т.е. (теоретически) в соцсети можно узнать всё, что знают все ее пользователи вместе взятые. Поистине безграничные возможности для конкурентной разведки. И этими возможностями нужно пользоваться. Конечно же нужно помнить о искажении информации и о дезинформации. Поэтому получаемые в социальных сетях данные, как в прочем и всегда, нужно перепроверять, а также изучать автора этих данных на предмет его возможностей и заинтересованности. Но это тема отдельного и большого разговора.
Основной вопрос в том каким образом эту информацию добыть. Путей не так много, но они достаточно эффективны. Это пассивный способ (прямой поиск) и активный (общение).
Прямой поиск
....
Полностью опубликовано в моём блоге Технологии конкурентной разведки

С уважением!
Нежданов Игорь

Интересный тренд в развитии социальных сетей

То, что с помощью социальных сетей можно получать и распространять информацию уже успело стать обыденным. Как и то, что соцсети превратились в эффективный инструмент конкурентной разведки. Но вот ставший не просто устойчивым, а ставший ярко выраженным тренд в развитии социальных сетей как средства поиска работы, делает социальные сети еще более интересным ресурсом для конкурентной разведки...

48% пользователей используют Facebook для поиска работы

В официально опубликованном отчете сказано, что количество людей, использующих самую крупную социальную сеть в мире для поиска нового места работы, увеличивается ежегодно, причем довольно быстро. Данные, предоставленные Jobvite, гласят, что еще в прошлом году всего 7,7 миллиона человек, проживающих в США, искали себе новое место работы посредством сети Facebook. В текущем году их количество практически утроилось - теперь таких людей уже 22 млн.

Собранная статистика предлагает куда более интересный вывод - из всех людей, искавших работу в 2011 году, 48% хотя бы раз делали соответствующий запрос в Facebook. Если посмотреть на это шире и учесть тех пользователей, кто в этой сети не зарегистрирован, то вместо 48% будет уже 63%. Все эти сведения являются результатом анализа опроса, в котором приняло участие 2049 человек в возрасте от 18 лет. Сбор данных проходил в течение трех дней и включал в себя вопросы о текущем состоянии занятости (чуть меньше половины респондентов на момент опроса нигде не работали).....

продолжение на Аdvertology

Скоро пявиться еще один источник персональных данных

Похоже в ближайшее время пояиться новый не маленький потенциальный источник утечек персональных данных...

Данные из ЗАГСов скоро можно будет получить по Интернету


В скором времени все необходимые данные, которыми располагает ЗАГС, можно будет получить через Интернет, пишет «Российская газета». Программа «Юстиция», разработанная Минюстом, предполагает изменения нормативной базы, техническое переоснащение ЗАГСов по всей стране и создание единого федерального информационного ресурса ЗАГС. На создание федерального информационного ресурса ЗАГСов предлагается выделить 13 млрд руб. Точная дата перехода всех ЗАГСов страны на интернет-обслуживание пока не определена, но в ряде регионов частично уже начали внедрять технологию.

По данным Минюста России, государственную регистрацию актов гражданского состояния осуществляют 9286 органов, из них органов ЗАГС — 2652, органов местного самоуправления сельских поселений — 6634.

Посредством соцсетей можно прогнозировать действия человека

Соцсети давно стали инструментом сбора и распространения информации, которым пользуются все заинтересованные стороны от самих людей до корпораций и государств. Пример с возможностями использования Твиттера достаточно показателен. Да и прогнозирование действий юзера уже новость не первой свежести. Но во тпрогнозирование действий в реальном мире пользователя соцсети - это что то новое...

Соцсеть нового поколения: предсказания как основа взаимодействия
В США разработана технология, определяющая, куда направляется пользователь, сколько он там пробудет и с кем, вероятнее всего, встречается.

Система Jyotish, названная в честь индуистской астрологии, создана исследовательским центром Boeing при Иллинойском университете в Урбане и Шампейне.

Принцип её действия основан на отслеживании траектории движения людей путём мониторинга их подключений к беспроводным сетям Bluetooth и Wi-Fi. Поскольку радиус действия этих сетей составляет соответственно 10 и 100 м, можно весьма точно определить местоположение пользователя. А зная, в каких местах был человек, можно спрогнозировать, где он будет находиться через определённый промежуток времени.

Изначально Jyotish предполагалось использовать лишь для того, чтобы контролировать перемещения персонала на заводах авиастроительного гиганта. Однако разработчики решили, что из неё может вырасти полноценная социальная сеть: её участники будут узнавать, где могли бы находиться их потенциальные друзья со схожими интересами. Руководитель проекта Лонг Ву говорит, что Jyotish способна давать рекомендации по поводу места проведения того или иного события для определённой группы людей....

Продолжение и подробности на НьюсЛэнд

26 нояб. 2011 г.

Платформа SemanticForce - кластеризация упоминаний в социальных медиа

Взято с портала semanticforce

В развитии методов анализа в конкурентной разведке и в частности такого направления как структурирование информации.

При сборе и накоплении большого объема данных мы получаем, с одной стороны, важную базу для анализа и исследования, но с другой – огромный массив, который требует систематизации и обработки.

Как мудро заметил в одной из своих статей на Slon.ru Андрей Мирошниченко, «Навигация – единственный информационный продукт, чья ценность будет расти, с увеличением объемов информации».

Если переходить к инструментам навигации, представленных в различных мониторинговых платформах, то среди самых «базовых» и распространенных можно выделить распределение по тематическим рубрикам (категориям) и тональности упоминаний.

Причем тональности обычно уделяют больше всего внимания, хотя часто тональность сообщений не показывает качественного состава упоминаний и контекста обсуждений.

Рубрикация упоминаний (то есть распределение всех сообщений по определенным темам) дает более репрезентативню структуру разговоров. Однако рубрики-маяки не всегда ясны и понятны, а в случае с известными брендами часто могут работать некорректно – трудно предугадать и точно определить направления «гласа народа» и то, что будет обсуждаться аудиторией на этой неделе или тем более в следующем месяце. Кроме того, нередки случаи, когда зная, что искать, и работая только в данном направлении, все иные тренды становятся «слепым пятном» и остаются незамеченными.

Так как же научиться слушать и системно понять, о чем говорят люди в сети?

Для решения такой нетривиальной задачи применяется технология кластеризации, то есть объединение нескольких однородных элементов по определенным признакам.

Кластеризация позволяет быстро сориентироваться в большом медиа-поле и сделать качественный анализ даннных.

Простейший вариант кластеризации – это популярные «облака тегов» (часто встречающихся слов), которые отображают, какие слова чаще всего употребляются в рамках данной темы. Однако с учетом простоты данной технологии, облака тегов являются малоэффективными с точки зрения навигации и понимания контекста обсуждений.

Мы пошли дальше в решении задачи навигации и по уже сложившейся традиции первыми на рынке СНГ предлагаем иерархическую кластеризацию. Это позволяет не только увидеть, какие темы обсуждают вместе с вашим брендом (первый уровень), но и также узнать, какие подтемы обсуждались в рамках тем первого упровня....

Подробности тут semanticforce

Продолжается взаимная интеграция социальных сервисов.

Продолжается взаимная интеграция самых разных социальных сервисов. Теперь вот "Мой Мир" и "Одноклассники" задумали сделать свои сервисы взаимно открытыми. Такая тенденция вполне логична - ведь неудобно управлять сразу несколькими аккаунтами в разных сетях. Нужен удобный интерфейс синхронного управления. А в данном конкретном случае еще и обе сети принадлежат одному собственнику :) Такое объединение удобно не только рядовому пользователю , но и "Большому Брату"...

Как это можно будет использовать в целях конкурентной разведки посмотрим и решим чуть позже. Вероятно помогут решения аналогичные работе с Твиттером.

«Одноклассники» рассказали, как будут срастаться с «Моим миром»

«Одноклассники» продолжат взаимное проникновение с социальной сетью «Мой мир», принадлежащей ее материнской компании Mail.ru Group, рассказал руководитель проекта «Одноклассники» и вице-президент Mail.ru Group Илья Широков.

По его словам, в скором времени будет реализована трансляция пользовательских статусов и фотографий из «Одноклассников» в «Мой мир» и обратно. Поскольку, по словам самого Широкова, «во всех соцсетях пользователи обмениваются статусами и фотографиями», этот шаг можно считать самым ярким примером интеграции между ними....

Подробнее: http://internet.cnews.ru/news/top/index.shtml?2011/11/24/465761

Несколько инструментов semantic web

Взято с сайта Лаборатория интеллектуальных систем ИТМО
Советую заглянуть в первоисточник - там есть много интересностей...

Marbles

Данное приложение является браузером семантического наполнения Интернет. Надо признать, что он является скорее инструментом специалиста а не простого пользователя. Для своей работы он требует указания ручного ввода идентификатора исследуемого ресурса и выбора способа представления.
Для результата Marbles предлагает три варианта отображения:

Подробное. Полный список отношений в которых участвует данный ресурс. Приводятся ссылки для просмотра в Marbles типа отношения и связанного объекта.
Сводка. Несколько наиболее важных характеристик, например имя, текстовое описание, домашняя страница.
Фотографии. Автоматически найденные изображения предмета.

Интересной особенностью является то, что после результатов приводится список источников с их значками-метками. Этими значками помечаются результаты, полученные из данного источника.
Особенно важен в этом проекте подход к способу представления результатов. В нём используется так называемый словарь представления RDF-документов Fresnel. Этот словарь образует язык, позволяющий описать способ отображения пользователю данных, распределённых в Сети. Он создан рабочей группой консорциума W3C для унификации способов представления метаданных и возможности отделения описания этого представления от сервиса, выполняющего сбор и, возможно, обработку данных.
В целом подводя итог обзору этого приложения можно отметить, что несмотря на общую недружественность пользователю, он несёт в себе следующие практически интересные идеи:
Использование переносимого формата описания представления ресурсов.
Дифференциация способа представления данных, предоставление пользователю выбора.
Визуальная ассоциация результатов запроса с источником из которого они получены.


Operator

Operator – плагин для браузера Firefox, предназначенный для обработки различных микроформатов. Функции предельно просты: обнаружение микроформатов на странице, просматриваемой пользователем, и возможность перенаправить данные из них в один из популярных сервисов.
Сценарий работы прост: если плагину удаётся обнаружить на странице данные в знакомом микроформате, он информирует об этом пользователя(предусмотренно несколько путей для этого) и тот может выбрать куда извлечённую информацию перенаправить.


Rich snippets

Rich snippets – способ дополнения результатов поиска, используемый Google. Это небольшая вставка рядом с результатом, содержащая некоторую дополнительную информацию о найденном ресурсе. Например отзывы о статье или персональную информацию человека.
Однако основной интерес представляет на snippet сам по себе, а способ его формирования. Дело в том, что данные для него могут браться непосредственно с самого ресурса. Для этого веб-мастеру достаточно внедрить в тело ресурса дополнительную разметку, содержащую необходимую информацию. Поддерживается два варианта разметки: на основе распространённых микроформатов и на основе открытого RDF-словаря, также разработанного Google. Таким образом устанавливается семантическая связь между ресурсом и его внешним представлением (результатом поиска).


True Knowledge

True Knowledge – являет системой поиска ответов на конкретные вопросы. Сервис основывается на решении двух вопросов: получение наборов формальных фактов из Интернет и преобразование запросов на естественном языке в запросы к имеющемуся набору фактов.
В качестве источников фактов выступают различные семантически аннотированные ресурсы (например Википедия или Freebase). Факты из них регулярно переносятся во внутреннее хранилище и становятся доступны для поиска. Для каждого ответа приводится факт на основании которого он был выведен и способ которым он был выведен. О факте также можно получить подробную информацию, например откуда он был получен.
Важной частью концепции этого ресурса является привлечение пользователей к наполнению базы знаний. Это достигается несколькими путями. Во-первых на главной странице портала есть несколько ссылок, позволяющих пользователям добавлять факты о некоторых объектах(людях, компаниях и т.д.). Во-вторых вместе с каждым ответом выдаётся вопрос согласен-ли пользователь с ним. Если пользователь не согласен, то ему предлагается указать с чем именно он не согласен и привести ссылку на подтверждающий документ. Также есть возможность вручную отредактировать ошибочный факт, введённый другим пользователем. Третьим способом является ввод правильного ответа на естественном языке.
Надо отметить, что данный сервис является одним из наиболее актуальных и полезных в данном обзоре. В нём прослеживается не академическая разработка, а близкий к коммерческому использованию проект. На его примере мы видим как масса распределённой в Сети информации может быть преобразована, интерпретирована и эффективно использована. Данный ресурс также отличается тем, что он не просто берёт информацию из Интернет, но и всячески привлекает своих пользователей к её оценке и, при необходимости, корректировки.

Optimization-2011: Оценка эффективности продвижения, веб-аналитика

Взято с СЕО-ньюс

В рамках работы секции «Оценка эффективности продвижения, веб-аналитика» представители ведущих российских SEO-компаний раскрыли особенности, преимущества различных веб-инструментов и полезные приемы в применении их для анализа эффективности поискового продвижения.

Открыл работу секции директор компании «Новые Линии Продвижения» Дмитрий Кудинов с докладом «Google Analytics и Яндекс.Метрика для анализа эффективности поискового продвижения».

Google Analytics и Яндекс.Метрика – наиболее популярные инструменты веб-аналитики в России. Дмитрий провел сравнение функционала двух систем веб-аналитики.
.....
Возможности GoogleAnalytics...
Уникальные возможности Яндекс.Метрики...
Способы отслеживания источников звонков...
Анализ эффективности рекламных кампаний...
Анализ поведения посетителей на сайте...
.....


Продолжение и подробности на СЕО-ньюс

Крис ДиБона: Антивирусы для смартфонов могут предлагать только шарлатаны

Взято с портала Открытые Системы

Антивирусные программы для смартфонов на базе Android, iOS или RIM могут предлагать только мошенники и шарлатаны, пишет в блоге сотрудник Google, известный деятель движения сторонников программ с открытым кодом Крис ДиБона.

Ни один из популярных сотовых телефонов не страдает от проблем с вирусами в том же смысле, что компьютеры с системами Windows и Mac, подчеркивает ДиБона. Теоретически вирусы для смартфонов возможны, но появление их маловероятно, потому что барьеры для их распространения слишком высоки. Перенести программу с телефона на телефон не так-то просто даже для законных владельцев аппаратов, пишет автор, и широко распространиться не удалось ни одной из известных вредоносных программ для смартфонов.

Разработчики антивирусов и даже инфраструктурные компании наподобие Juniper Networks и IBM с недавних пор стали подчеркивать угрозу, которую представляют вирусы на смартфонах, в особенности на базе Android, что, по-видимому, и вызвало такую резкую реакцию сотрудника Google. В McAfee утверждают, что в третьем квартале 2011 года количество вирусов, нацеленных на Android, выросло на 37%.

Facebook оставил позади LiveJournal

Взято с сайта Деловой Петербург
Согласно исследованию компании TNS посещаемости российской аудиторией интернет-ресурсов, социальная сеть Facebook обогнала в России популярный блогхостинг LiveJournal по этому показателю.Facebook, Livejournal.

Проект TNS Web Index представил данные, в которых октябрьская аудитория Facebook в России составила около 13,4 млн человек, превысив соответствующий показатель LiveJournal.com, набравшего на 400 тысяч посетителей меньше.

Аудитория LiveJournal увеличивается, но блогхостинг все же уступает позиции другим социальным сервисам. К примеру, всего за месяц российская аудитория Facebook увеличилась почти на 1,9 млн пользователей.

В сегменте посещаемости российских Интернет-ресурсов лидируют проекты компании "Яндекс" (29,2 млн посетителей в месяц). За ней расположились портал Mail.Ru (28,89 млн) и социальная сеть "ВКонтакте"(25 млн). При этом в счет последней не учитывается альтернативный сайт "Вконтакте" – "vk.com", собравший в октябре 8,47 млн посетителей.

Статистика TNS учитывает пользователей в возрасте от 12 до 54 лет, проживающих в городах с населением более 100 тысяч человек.

Показатели Facebook во всем мире поражают – аудитория сайта превышает 850 миллионов человек. Благодаря сервису Socialbakers стало известно, что в России количество пользователей, зарегистрированных в Facebook, составляет 4,86 миллиона человек. По этому показателю наша страна занимает 28 место в рейтинге.

Facebook окончательно обошла блогхостинг LiveJournal по количеству переходов на другие сайты рунета еще в июне этого года. .....

24 нояб. 2011 г.

На поисковик «Яндекс» подали в суд из-за пиратских книг

Взято с Компьюленты

Издательство «Эксмо» обратилось в московский арбитражный суд с иском к компании «Яндекс», требуя обязать её убрать из результатов поиска ссылки на незаконно размещённые в Интернете копии книг. Третьими сторонами в процессе выступают веб-библиотека «ЛитРес» («Эксмо» владеет контрольным пакетом этой компании) и издательство «Алгоритм-книга».

«Яндекс» не удаляет ссылки из результатов поиска по запросу правообладателей, резонно считая подобную практику цензурой и нарушением конституционного права граждан на свободный поиск информации. Российский поисковик полагает, что контент такого рода должны уничтожать те, кто его разместил.

«Эксмо» рассчитывает в судебном порядке обязать «Яндекс» удалить из результатов поиска ссылки на сайт издательства «Алгоритм-книга». По словам руководителя юридического отдела «Эксмо» Максима Рябыко, некоторое время назад на этом ресурсе были обнаружены незаконные копии книг Дарьи Донцовой, Ника Перумова, Татьяны Устиновой и других гениев российской словесности. Сами пиратские материалы с сайта «Алгоритм-книги» уже убраны, но их копии сохранены в базе «Яндекса».

Кроме того, «Эксмо» намерено получить от «Яндекса» компенсацию в размере 50 тыс. рублей.

Тут нужно заметить, что Google, в отличие от российского поисковика, идёт навстречу правообладателям, нисколько не беспокоясь по поводу цензуры. Так, весной американская веб-корпорация удалила из результатов поиска ссылки на 106 пиратских ресурсов (446 страниц), на которых были размещены нелегальные копии книг.

22 нояб. 2011 г.

Пресса узнала о глобальном рынке слежки за интернетом

Газета The Wall Street Journal опубликовала в субботу более 200 документов о глобальном рынке слежки за интернетом и сотовой связью.

Как сообщает издание, речь идет о средствах для взлома пользовательских компьютеров и мобильных устройств, а также сбора информации об интернет-коммуникациях граждан. Они предназначены для ловли преступников и использовались американской полицией и спецслужбами.

Отмечается, что до 2001 года они использовали собственные средства, но за последние десять лет оборот на рынке в этой сфере вырос с "почти нулевой" отметки до пяти миллиардов долларов в год. В документах упоминаются 36 компаний, в том числе работающие и за пределами США.

Среди выявленных способов добывания информации упоминается "исследование незакрытых уязвимостей" в мобильных устройствах компаний Apple, Microsoft, Blackberry и Google.

Ранее The Wall Street Journal публиковал информацию о приложении для слежки за интернет-пользователями, использовавшемся египетскими властями для перехвата сообщений оппозиции в Skype. Тогда сообщалось, что разработчиком этого приложения была британская фирма Gamma International.

В октябре появилась информация о взломе вируса, который использовала немецкая полиция в своей работе. Тогда хакеры выяснили, что троян обладал более широким функционалом, чем того допускал закон. Результатом разразившегося скандала стало обещание немецких властей доработать программу на федеральном уровне. Впоследствии ее смогут покупать как федеральные органы безопасности, так и отдельные земли.

Взято с Лента-РУ

17 нояб. 2011 г.

Neiron предоставил сервис для конкурентной разведки

Взято с Сеопро
На этот раз компания Neiron поможет с конкурентной разведкой, предоставив список переходов и показов по указанным запросам на определенные сайты в поисковых системах Google и Яндекс.

Зарегистрировавшись на сайте, пользователь составляет список запросов (от 1 до 10) и через 1-12 часов получает такую информацию с указанием доли показов и переходов:
• список сайтов, показанных в результатах поиска по анализируемым запросам с указанием доли показов каждого сайта;
• список сайтов, показанных в спецразмещении по анализируемым запросам с указанием доли показов каждого сайта;
• список сайтов, показанных в правом рекламном блоке по анализируемым запросам с указанием доли показов каждого сайта;
• список сайтов, на которые перешли пользователи из результатов поиска по анализируемым запросам с указанием доли переходов на каждый сайт;
• список сайтов, на которые перешли пользователи из спецразмещения по анализируемым запросам с указанием доли переходов на каждый сайт;
• список сайтов, на которые перешли пользователи из правого рекламного блока по анализируемым запросам с указанием доли переходов на каждый сайт.