13 янв. 2008 г.

Софт для конкурентной разведки

Конкурентная разведка это работа с информаций (поиск, получение, хранение, обработка представление информации). А для работы с информацией есть компьютер, позволяющий эту работу облегчить в тысячи раз. Значит его надо загружать по полной. Вот о том как наиболее эффективно использовать компьютер если вы занимаетесь конкурентной разведкой я и хочу рассказать. В этом материале смешаны материалы нескольких авторов (с их согласия конечно):
-Смирнов Юрий;
-
Смирнов Дмитрий;
- Ющук Евгений;
- Нежданов Игорь.


Поиск информации в Интернет

Maxthon (http://maxthon.org.ru)

Maxthon (бесплатная браузерная надстройка для Internet Explorer)

Сегодня никого не удивишь просмотром нескольких страниц в одном табулированном окне и прочими возможностями, упрощающими и улучшающими браузинг. Я люблю Maxthon не за эти бесчисленные возможности, а за беспрецедентное удобство поиска. В его поисковой панели можно выбрать «птичками» сразу несколько ресурсов – и поиск по одному запросу будет одновременно осуществляться по каждому ресурсу (с выводом результатов в отдельном окне). Заметьте, я вовсе не предлагаю вам одновременно беспокоить 20 поисковых машин – аналогов Google и Yandex: в этом не было бы никакого смысла (вы ведь не собираетесь тратить свою жизнь на то, чтобы выяснить, на сколько десятых долей процента релевантнее отдельные машины выполняют отдельные ваши запросы). Смысл в том, чтобы одновременно задействовать разнотипные поисковые системы. Например, одним щелчком выяснить, что знает о таинственной фирме «Абракадабра» ваш любимый Google, какие сообщения СМИ о ней зафиксировала новостная система YandexNews, какое толкование слову «абракадабра» дает энциклопедия Wikipedia, упоминается ли эта фирма в маркетинговых исследованиях ведущих аналитических агентств, пишут ли о ней в блогах, на каких торговых площадках предлагаются ее товары и т.д. Это экономит на сокращении однотипных действий драгоценные секунды, минуты, часы по сравнению с работой в Firefox и Opera, где запрос может одновременно выполняться только в одной поисковой системе.
К сожалению, на пути к совершенству разработчики Maxthon несколько перемудрили – и версии 2.x проходящей сейчас стадию бета-тестирования, внедрили поисковую панель, аналогичную панелям Opera и Firefox. То есть собственными руками задушили свою лучшую «фичу». Я искренне скорблю – но на все письма разработчикам отвечает почтовый робот. Вряд ли что-то изменит недавняя покупка этой браузерной надстройки гигантом Google: скорее, дело ограничится тем, что поисковая машина Google будет «железно» стоять в новой поисковой панели на первом месте. Единственное, что могу посоветовать: скачивайте, пока не поздно, Maxthon версии 1.x. Он пока считается основной версией и доступен для скачивания.
По умолчанию Maxthon версии 1.x обладает огромной базой настроенных шаблонов для работы с сотнями интернет-сервисов: от универсальных и специализированных (книжных, рефератных, товарных, софтовых и т.п.) поисковиков – до серверов погоды и сервисов перевода на многие языки мира, включая китайский. Могу выслать желающим пару десятков моих личных поисковых шаблонов, полезных для бизнес-аналитика, а также поделиться правилами их создания (они довольно просты).

Для сохранения обнаруженной ценной информации в виде текстовых фрагментов вместе графикой, а также веб-страниц целиком – программу Net Snippets (бесплатна в виде плагина к Maxthon и IE)

Получение новостей из Интернета

GetNews (стоимость – $25)
После выхода Internet Eхplorer 7.0, наверное, никому не нужно объяснять, что такое новостные RSS-потоки и агрегаторы новостей (причем многие, освоив ограниченные по возможностям и малоудобные браузерные агрегаторы, быстро переходят на RSS-ридеры, выполнены в виде отдельной программы).
Сегодня RSS-технология на каждом углу рекламируется как идеальный способ быть в курсе событий в сфере своих профессиональных интересов. Мол, если вы интересуетесь бизнес-анализом или бизнес-разведкой – просто добавляйте в свой агрегатор RSS-ленты универсальных и специализированных новостных агентств, аналитических, консалтинговых компаний, корпоративных сайтов, профессиональных блогов и т.д.
Однако очень быстро наступает насыщение. Удалив из агрегатора сотню-другую установленных по умолчанию бесполезных лент, аналитик начинает добавлять входящие в круг его интересов ленты, которые он нашел в интернете самостоятельно. Но уже на втором десятке лент у него опускаются руки: чтение отнимает все больше времени, но так и не дает полной картины событий. Чтобы вести полный мониторинг отрасли, конкурентов, технологий, персон и т.д., нужно использовать не одну сотню источников – но у кого найдется время все их штудировать? К тому же RSS-ридер позволяет знакомиться только с заголовками и краткими анонсами новостей. Чтобы изучить и добавить в свою базу знаний полный текст новости, приходится переходить по ссылке на новостной сайт – первоисточник новости и заниматься ручной каталогизацией.
Короче говоря, я не рекомендую использовать RSS-агрегаторы в качестве основного источника информации. Их идеальное предназначение – знакомство с главными событиями дня за утренней чашечкой кофе, не более того.
Если мы говорим об автоматическом скачивании и каталогизации новостей, статистики, экспертных мнений и т.п., то ее цель – вовсе не в том, чтобы под завязку загрузить аналитика занимательным профессиональным чтивом. Напротив, нам нужно найти способ на 99% избавить аналитика от необходимости читать все подряд. Тогда освободившееся время он сможет потрать на правильное формулирование и планирование поисковых задач, на углубленное знакомство с ключевыми публикациями по теме, на анализ результатов поисковых запросов, на подготовку экспертного заключения.
В качестве решения этой задачи рекомендую программу GetNews. Оставим в стороне ее многочисленные возможности работы с информацией (включая обработку упомянутых выше RSS-потоков), многие из которых – уникальны и не встречаются в других программах. С мощным функционалом программы лучше меня вас познакомит ее help. А сейчас для наших целей интересно следующее.
Во-первых, эта программа умеет автоматически скачивать не только заголовки и анонсы, но и полные тексты новостей (после не очень сложной настройки т.н. новостного канала под особенности данного сайта). Причем она скачивает «голые» тексты, полностью очищенные от веб-дизайнерских излишеств (при желании можно оставить прилагающимися к ним фотографии, графики и т.д.), что облегчает последующую работу с ними.
Во-вторых, GetNews умеет работать не только лентами новостных агентств и СМИ, но и с любой обновляемой информацией, будь то пресс-релизы, блоги, сообщения форумов и т.д.
В-третьих, программа автоматически сортирует все новости не только по источникам, но и по любым темам, заданным пользователем (достаточно ввести в программу ключевые слова: новость будет автоматически отправляться в определенный каталог при наличии в заголовке или тексте определенного ключевого слова). Уже одно это значительно сокращает объем обязательного чтения аналитика: в большинство каталогов можно заглядывать, только когда в этом возникнет, так сказать, производственная необходимость.
В-четвертых, каталоги GetNews можно легко превратить в *.htm-файлы и затем разместить в папке Net Snipets. Это позволит смешать данные ручной и автоматической каталогизации и анализировать их одновременно. В т.ч. – с помощью программ, о которых я расскажу позже.
К сожалению, сайт разработчиков программы GetNews в данный момент по каким-то причинам не поддерживается, но саму ее еще можно скачать в интернете. На всякий случай, поспешите это сделать.

Отслеживание изменений на сайтах

Avalanche (Аваланч) http://www.tora-centre.ru/avalanche.htm

Программа Аваланч (Avalanche) предназначена для мониторинга изменений, происходящих в Интернете. Она собирает информацию с вэб-страниц по заданному алгоритму и складывает эту информацию в собственную базу данных. В любой момент пользователь может провести поиск по этой базе, используя операторы Булевой Алгебры, подобные тем, которые используются в Яндексе при формировании поискового запроса в Интернет. Аваланч существует в двух модификациях по алгоритму работы и в нескольких модификациях по своим возможностям. Различия по алгоритму работы заключаются в том, что одна из них собирает с заданных адресов все подряд, а вторая - только страницы, на которых произошли изменения с прошлого посещения ее Аваланчем. Более сложные (и дорогие) модификации Аваланча позволяют проводить обучение программы с тем, чтобы она анализировала контекст и размещала в соответствующие папки материалы, даже если в тех отсутствуют ключевые слова. Некоторые модификации Аваланча позволяют создавать в Интренете сайт в единственном экземпляре, который содержит все новости по заданным пользователем проблемам. В таком виде новости очень удобны для работы с ними. Есть и такие варианты Аваланча, которые обеспечивают практически полную анонимность работы. Аваланч состоит из паука и "умных папок". Паук посещает страницы, которые ему предписано посещать, проверяет изменения на них и складывает информацию в базу данных. "Умные папки" самостоятельно сортируют эту принесенную пауком информацию, делая ее удобной для работы. Есть еще такое понятие, как рубрики. Рубрики позволяют работать с базой данных по конкретным запросам, интересующим пользователя в данный момент. В целом, работа с Аваланчем выглядит следующим образом. Сначала прописываются источники, контент которых будет контролироваться. Это могут быть не только отдельные страницы сайтов, но и страницы поисковых машин, которые появляются по определенному поисковому запросу. Указывается глубина переходов со стораницы по ссылкам. Так, например, с первой страницы Гугла или Яндекса во время испытаний паук переходил по каждой ссылке, расположенной на первой странице поисковика с результатами выдачи. А на той странице, куда он по такой ссылке перешел, он уже не ходил по ссылкам дальше. Это настраиваемая опция.

WhatzNew

После долгих колебаний поставил себе программу WhatzNew. Ходил вокруг да около чуть ли не месяц. Вру — два месяца. Сегодня нашел к ней кряк и поставил. Долгие душевные колебания были связаны с тем, что программа (судя по рассказам) просто шикарная, вот я и боялся — поставлю, она мне понравится, а через 30 дней она перестанет работать… Теперь не перестанет, но мне все равно стыдно, даже еще сильней — программу писал наш соотечественник, простой русский парень Игорь Афанасьев. И просит он за нее «just $19.95!». Не так уж и много… Но все-таки в одном он был не прав. Наверное…

Думаю, стоило сделать программу бесплатной для русских пользователей. В результате ее свои же и «сломали». Обидно…

Ладно, о самой программе. WhatzNew проверяет заданные вами адреса на предмет обновления. Но! что самое шикарное — выдает не просто сообщение, мол «Страница обновилась». Хитрые настройки позволяют сделать так, чтобы WhatzNew выдавала именно ту информацию, которая вам нужна. Например — дата последней заметки на Cooler’е, на DZ, ну и номер с названием последней заметки на Спектаторе :)

Все очень просто — на Кулере и DZ, например, данные о текущем выпуске находятся в первом килобайте html-файла. В общем, WhatzNew так хитро настроен — он скачивает первый килобайт (опционально. Можно хоть все целиком качать, но один килобайт-то быстрее :), выдирает оттудова дату текущей заметки и сообщает мне если она изменилась. Не буду долго рассказывать, отправлю вас к Кулеру, вот сюда. Тут он как раз все это красочно расписывает…

Я на самом деле потенциал у программы чуть ли не такой же, как и у ICQ. В плане популярности и распространенности. Уж очень она удобная… Не только об обновлениях скажет, но и курсы валют или прогноз погоды или номер последней версии любимой программы покажет… Да еще и почтовые ящики проверит… Надо только настроить, а настройка там — легче некуда. Даже я разобрался :)

Единственное, что мешает — это платность программы. Да, пусть и цена не большая, но все-таки… Кстати, вы не поверите — только что залез вот сюда http://www.watznew.com/channels.htm… оказалось, что там есть канал… цитирую… «Сетевой журнал „Spectator“. Last issue.»… Оказалось, автор меня читает :((( Это, разумеется, хорошо, но я ему такую пакость сделал :( Чуть было не сделал. Регнумбер я никому не скажу. Не надейтесь. Если у вас есть деньги — обязательно зарегистрируйте эту программу! Если нет денег — копите.

C4U «see for you», смотрю для вас, за вас и вместо вас.

Минусы — ужасный интерфейс, одни цвета чего стоят :) Сайты хранятся в неком древовидном списке, что в общем-то не так уж и плохо. А вот proxy не поддерживается. Все не так сильно настраиваемо, как WatzNew, но C4U может делать то, чего WatzNew не могет. Например, искать, какие на странице появились новые ссылки. И показывать их. Или что именно изменилось в тексте. Общая оценка — три с плюсом. WatzNew — четыре. Но запросто можно придумать ситуации, в которых C4U будет лучше.

Check&Get.. Два с минусом. Тупо загоняете ссылки, которые надо периодически проверять, оно тупо их периодически проверяет. Реагирует даже на изменения текстового счетчика (как, например, на Спектаторе). Тупой, как валенок. И еще вроде деньги просит за регистрацию…

URLy Warning. «УРЛистое предупреждение». Интерфейс — красивый. Proxy опять не поддерживается. Сообщает, если n-ное количество слов (или больше) изменилось и показывает, что именно нового. Либо сообщает, что появилось какое-то определенное ключевое слово. Freeware, но показывает рекламу.

Общая оценка — три с половиной. И то из-за интерфейса. :) Неплохо сделан, но при запуске прогаммы если вы находитесь в оффлайне почему-то портится… По крайней мере, у меня…

WWW&FTP Observer. Просто проверяет страницы на предмет бновления/необновления. Но! умеет проверять и ftp, и если файл был изменен, может задать его для скачивания Net Vampir’у или ReGet’у. Русско/английский интерфейс и хелп, достаточно простые и мощные настройки, proxy поддерживается.

Очень полезная штучка для тех, кому надо отслеживать и тут же скачивать всякое новье. Стоит 20 баксов, но при желании можно найти кряку. Общая оценка — четыре. Из-за интеграции с моим любимым Вампиром.

DISKo Watchman. Русско/английский интерфейс. Очень навязчивое предложение о регистрации. Вот где-то слышал: «Если в файле dwatch.exe нати строку байтов EB02B3018BC3 и заменить на EB02B30133C0 то это даст полную регистрацию.» Сам не проверял…

Что можно сказать? Очередная отечественная разработка (что-то много их стало). Настройки довольно гибкие. Показывает, что изменилось… По сравнению с предыдущими программами — практически the same… Одно и то же… Оценка — три с половиной.

AnchorNet (вы будете смеяться, но это тоже отечественная разработка) построена по тому же принципу — показывает только то, что вам надо. Вы создаете Anchor’ы — и указываете, что именно надо отображать. Также настраиваемые сообщения об обновлении того или иного anchor’а. В общем, очень достойный конкурент WatzNew. Или наоборот. В общем, я еще не разобрался, кто кому конкурент… Русский/английский/украiнський интерфейс. Интересная фича — выстраивание диаграмм. То есть, к примеру, Anchor ежедневно проверяет уровень акций Мелкософта и показывает красивый график стабильного роста. :)

Программа ad-ware, то есть показывает рекламу, но зато бесплатная. Общая оценка — четыре с плюсом. Плюс — за конкуренцию :) Всем надо попробовать. Автору WatzNew посмотреть и спереть лучшие фичи :))) Или наоборот. AnchorNet в упор не понимает koi, да и proxy там непонятно как настраивается…

Check4New. Простенькая чекалка. Ужасный интерфейс. Тупо проверяет на наличие изменений. Не понимаю, как она на listsoft.ru получила рейтинг «good»…

Webspector. Практически WebSpectator :) Гигант — 3 мегабайта. Пока что (пока еще не все обзорено) наиболее удобный из «тупых» проверяльщиков. Просто скачивает страницы и честно показывает, что изменилось, выделяя цветом. Может создавать репорты о своей работе, но для этого надо зарегистрироваться. В общем, не нравиться он мне совсем, хотя не так уж и плохо. Но за три мега хотелось бы нечто большее…

Morning Paper. Регулярно проверяет заданные сайты, а потом шлет некий суммарий вам же по email’у. Очень увлекательно, знаете ли, особенно если больше никто не пишет :) Моя оценка — три. Не понимает кодировок, и шлет письма вперемешку koi/win, да и вообще…

Поиск нужной информации

Google Desktop Search – http://desktop.google.com/ru/

За минувшие год-два тема настольного поиска стала не менее популярной, чем тема поиска онлайнового. Я перепробовал огромное множество программ, но все-таки остался верен Google Desktop.
Оставим в стороне «гаджеты» боковой панели GDS (некоторые из которых не имеют аналогов у конкурентов). Для нас важно, что поиск в этой утилите реализован по «гугловски» эргономично и эффективно. После двойного нажатия на CTRL появляется полупрозрачное окошко. Начините вводить в него свой запрос. По мере ввода каждой буквы утилита учтиво пытается угадать ваши мысли, перебирая варианты результатов поиска.
Для большинства поисковых задач поисковой панели GDS вполне достаточно: ввели ключевую фразу – мгновенно получили результат на html-странице в привычном стиле Google. Но если вам хочется большего – нажмите на ссылку «Расширенный поиск» рядом с поисковой строкой.
Во-первых, здесь можно уточнить свой запрос, определив временной интервал и файловый формат, а также исключив из поиска документы, содержащие определенные слова. Во-вторых, ссылка «Обзор хронологии» приведет вас на страницу, на которой все результаты вашего запроса будут выстроены по дням и часам. Здесь же имеется календарь, некоторые даты в котором выделены синим цветом – в эти дни вы работали над документами, имеющими отношение к данному запросу. Их список вы получите, щелкнув по дате. Этой функции можно найти множество применений: от составления информационных дайджестов – до управления личным временем.
Также обратите внимание на ссылку «Сохранено в кэше» под каждым найденным документом. Она выводит длинный список промежуточных текстовых копий данного документа, даже если сам он стерт с жесткого диска компьютера! Мне эта функция не один раз помогала спасать сюжетные ходы, павшие жертвой неудачного саморедактирования. Более того, несколько раз с помощью кэша GDS я возвращал из небытия целые статьи, по небрежности удаленные с винчестера и не поддающиеся восстановлению даже с помощью утилит, применяемых профессиональными сисадминами и спецслужбами. Электронные рукописи не горят, если об этом позаботились программисты.
«Уязвимая пята» утилиты, как всегда, обнаруживается на «толчковой ноге». Порой Google Desktop Search эффективен до абсурда и выводит в ответ на простенький запрос сотни и тысячи результатов поиска, заставляя пользователя почувствовать затылком стылое дыхание космического вакуума интернета (вы и не подозреваете, сколько файлов, содержащих тексты, размещается на вашем ПК).
Поэтому, если вас не волнует поиск тегов в mp3-композициях и содержимое системных ini-файлов, я бы посоветовал проделать следующее. В настройках программы оставьте индексацию только тех файловых форматов, которые вас действительно интересуют (например: текстовых файлов, *.doc, *.pdf и др.). Затем исключите из поиска все диски и папки с программами, оставив только папки с документами, которые собираетесь подвергать анализу (разумеется, в их числе должна быть папка с архивом Net Snippets).
Аналитик вздохнет с облегчением, но не надолго. У серьезного аналитика архив с каждым днем пухнет как на дрожжах – и через некоторое время GDS вновь начнет выдавать по каждому запросу тысячи результатов. Что порождает новую подзадачу: добавить к нашему «поисково-аналитическому комплексу» средства, помогающие структурировать поисковую «продукцию» GDS. Эту подзадачу решают следующие две программы.

Quintura Search (www.quintura.com/ru/download/)

Вообще-то эта программа (как и онлайновые сервисы www.quintura.com и www.quintura.ru) предназначена для поиска в интернете. Но в нее встроен и плагин для работы с GDS. В этом качестве мы ее и рассмотрим.
Окно Quintura Search разделено на две части: справа – обычная лента с результатами поиска Google Desktop, слева – визуальная карта поиска, на которой вокруг вашего запроса как города-спутники располагаются уточняющие слова и словосочетания. Это наиболее значимые, с точки зрения программного алгоритма, слова, употребляемые в одном контексте со словами вашего запроса. Одновременно меняется список результатов поиска: при наведении мыши на отдельные слова в левом окне – в правом могут остаться и 10, и 5, и 1–2 результата, ценность которых несложно оценить «на глазок». Таким образом, буквально за минуту вы можете исследовать всю карту и либо найдете нужные вам страницы, либо поймете, как следует уточнить запрос.
Попытаюсь описать то же самое более наглядно. Предположим, на вашем компьютере размещен архив с публикациями на тему мобильной связи. Введите в Quintura Search запрос «мобильный телефон». На визуальной карте на разном расстоянии вокруг запроса выстроится десятка два уточняющих слов (вес и значимость которых дополнительно подчеркивается игрой шрифтов). Предположим, это: «продажа», «операторы», «полифонический», «аксессуры», «ремонт», «тест», «магазин», «доставка», «цена» и т.д. Например, наведя курсор на слово «тест», получаем новые направления поиска: «обзор» и «сравнительный». Выбрав «Nokia» из представленных на карте торговых марок, мы увидим, что с ней ассоциативно связаны «Motorola», «Panasonic», «Samsung», «Siemens». Выбрав «Panasonic», на разных расстояниях от этой торговой марки увидим «Nokia», «Motorola», «Philips». Выбрав «Motorola» – увидим «Siemens», «Sony», «Nokia», «Alkatel». Вот так играючи, за несколько секунд, мы получили представление о рыночных пересечениях ведущих «мобильных» игроков. С чем связаны эти пересечения – с конкурентными стычками, совместными проектами или представлениями IT-журналистов о прекрасном – можно уточнить в правом окне программы.
Quintura Search позволяет добавлять и удалять на карте поиска уточняющие слова, а также удалять ссылки, далекие от темы запроса. Это очистит карту от смыслового мусора и добавит в нее новые страницы, более точно соответствующие вашим интересам (программа анализирует до 1000 первых результатов поиска GDS). Карту поиска можно:
• сохранить;
• переслать коллегам или подчиненным, ежедневно выполняющим типовую для вашего бизнеса поисковую задачу;
• использовать в качестве структурированной и визуализированной базы знаний по определенной теме.
В конце концов, вы можете просто остановиться «на самом интересном месте» – и с него же продолжить поиск в более удобное время.
Понятно, что любой машинный алгоритм, несмотря на все старания программистов, несовершенен. Ваш способ мышления, несомненно, отличается от программных методов кластеризации – распределения поисковых запросов по группам наиболее значимых, с точки зрения Quintura Search, слов. Чтобы программа не стала шорами на ваших глазах, используйте несколько запросов для изучения каждой темы. А также периодически возвращайтесь к обычному поиску: долгому и кропотливому – зато надежному. И сравнивайте результаты.

Inxight Search Extender for GDS (www.inxight.com/products/se_google/)

Основная сложность аналитического поиска заключается вовсе не в том, чтобы найти необходимое. Наибольшую ценность представляют сведения, которых вы даже не собирались искать.
К примеру, нет ничего проще, чем отыскать все пересечения в одном контексте ваших конкурентов. Достаточно ввести в окошко Google Desktop Search список фирм-соперников – и вы узнаете, кто с кем и против кого заключал союзы и кто кому роет яму (толщина «досье» будет зависеть только от количества накопленных вами публикаций). Но как решить другую задачу: быстро получить полный список фирм и персон (в т.ч. – совершенно незнакомых вам), с которыми пересекалась интересующая вас компания? Если вам нужен список фирм с анголязычными названиями – тогда воспользуйтесь Inxight Search Extender for GDS.
Проанализировав содержание найденных c помощью Google Desktop Search документов, программа Inxight SE автоматически, без участия пользователя, находит в них значимые фактические данные: например, имена, названия, цифры (процентные, количественные показатели, денежные суммы и др.). Затем программа за считанные секунды группирует все документы, найденные по запросу, в восьми разделах: персоны, компании, продукты, местности, телефоны, цифровые значения, даты, почтовые и интернет-адреса – с соответствующими подразделами-списками фамилий, названий, адресов и т.п.. После чего пользователю останется пометить «птичкой» самые интересные пункты («А что связывает фирму X с персоной Y? А как занесло ее представителей в город Z? А что за кругленькая сумма – $1 000 000 – упоминается в одном контексте с фирмой X? И т.д.). В итоге система сократит длинный список документов, оставив только самые значимые для вас в данный момент.
Разумеется, программа периодически ошибается: например, может принять за фамилию человека термин из области информационных технологий (к слову, такие ошибки косвенно указывают на то, что Inxight SE применяет не встроенные словари имен и названий – по крайней мере, не только их – а использует интеллектуальные алгоритмы распознавания). Но подобных ошибок не так уж много и они легко «фильтруются» визуально.
Программа охотно выполняет поисковые запросы на русском языке, но списки имен и названий выдает только на английском (разработчики сообщили мне, что выпускать полностью адаптированную к русскому языку версию Inxight SE for GDS пока не планируют). Но даже в таком виде программа весьма полезен для отечественных бизнес-пользователей. Во-первых, многие из них ведут дела в дальнем зарубежье, либо присматриваются к тамошним потенциальным партнерам, либо «мониторят» деятельность местных представительств иностранных компаний. Во-вторых, еще с конца перестройки у нас сохранилось огромное количество фирм с англоязычными названиями. В-третьих, функция структуризации цифровых данных никак не привязана к языку – а ведь часто аналитики ищут в текстах именно цифры (по крайней мере, понижают индекс достоверности текстов без цифр).

Yandex Desktop Search

Еще одно интересное решение локального поиска информации. Ищет в файлах HTML, Microsoft Office, Macromedia Flash, PDF, DjVu, Open Office, EML, MHT, RTF, CHM, SWF, OGG, MP3 и конечно в текстовых разных кодировок. Так же поддерживаются архивы ZIP и RAR. Индексацию производит в интеллектуальном режиме, т.е. когда пользователь ничего на компьютере не делает. Результаты отображает в любом браузере точно как при поиске On-Line. Все по русски. Поддерживает операторы «старшего брата» по этому искать довольно удобно и сам поиск достаточно гибок. И что важно бесплатен.

Архивариус 3000 (http://www.likasoft.com) это программа для смыслового поиска документов на персональном компьютере, в локальной сети и на съёмных дисках (CD, DVD, ZIP и других). Поиск документов производится по их содержимому, аналогично тому, как это делается в поисковых системах Интернета. При поиске автоматически учитываются все грамматические формы слов, обеспечивая смысловой поиск документов на 18 языках. Программа извлекает и хранит полную информацию о документах. Даже если документ физически недоступен, Архивариус 3000 за доли секунды найдет его по ключевым словам и укажет на каком диске находится разыскиваемый файл.
Архивариус 3000 содержит ряд решений экономящих время работы. Строитель Запросов позволяет быстро организовать сложный формальный поиск без каких-либо специальных знаний. Мастер Поиска поможет найти документ по размеру, дате и типу за несколько шагов. Функция Быстрого Просмотра документа даёт возможность просмотреть текст документа с подсветкой ключевых слов, найти и распечатать нужный фрагмент, даже если документ физически недоступен. Найденные документы также могут быть экспортированы в текстовый файл и отправлены по почте. В Архивариус 3000 встроены средства удаленного доступа через Интернет. Находясь вне дома или офиса, пользователь может производить поиск, просматривать найденные фрагменты и скачивать или отправлять найденные документы по почте используя обычный веб браузер.
Программа работает со всеми популярными типами документов от MS Office и PDF до файлов TXT и LEX. Поддерживается поиск в архивах (ZIP, RAR, ARJ и прочих), в почтовых сообщениях Outlook, Outlook Express и The Bat!, и в документах вложенных в почту.

Ищейка

Ищейка (http://www.isleuthhound.com) - персональная поисковая система позволяет за одну секунду находить нужные документы и файлы на жестком диске. Пользователи Ищейки имеют возможность получить действительно мгновенный доступ к необходимым документам, используя самый удобный способ - ключевые слова из текста.

Разработанная точно так же, как самые популярные поисковые интернет-системы, программа обладает удобным и привычным интерфейсом. Ищейка - это полноценное использование механизма интернет-систем на персональном компьютере.

При первом запуске программа осмотрит заданные каталоги (Зону Поиска) на жестком диске и запомнит информацию о содержимом всех документов входящих в Зону поиска. После этого на поиск любого документа из зоны поиска требуется не больше секунды.

Ищейка использует интеллектуальные механизмы поиска, благодаря чему обнаруживает документы, в которых содержатся слова из запроса во всех словоформах и падежных окончаниях (морфологический поиск). Скормите Ищейке фразу на естественном языке и она найдет все документы, в которых встречаются слова (во всех падежных окончаниях и словоформах!) из введенной фразы.

Добавьте Ищейку в автозапуск , установите период обновления Зоны Поиска, и тогда все изменения в Зоне поиска будут учитываться Ищейкой. Для редактирования найденных документов Ищейка сама запускает соответствующее приложение.

Вы получаете удобный интерфейс поисковых систем и возможность использовать Интернет-технологии для локального поиска.

Структурирование

Net Snippets

Адрес для скачивания, как видите, не указан. К сожалению, разработчики прекратили развитие «настольной» версии программы и (видимо, под влиянием моды Веб 2.0) открыли онлайновый сервис для хранения и обмена информацией, видео, музыкой и файлами (для работы с сервисом предлагается бесплатная программа eSnips). Хотя многие говорят, что скоро все приложения станут онлайновыми, но лично я буду последним, кто выложит в интернете свои поисковые проекты. Консерватизм, однако. Но если кому-то, как и мне, удобнее хранить информацию на своем компьютере – скачивайте Net Snippets, не откладывая. Пока что в интернете предостаточно ссылок на эту программу (похоже, разработчик не стремится ее изъять с даунлоуд-порталов), но как показывает опыт, через год-другой все они перестанут работать. Если что – обращайтесь ко мне.
Существуют и более продвинутые аналоги этой программы. Однако Net Snippets обладает тремя козырями: она проста и удобна в использовании, стабильна в работе, а также хранит файлы в формате *.htm («открытость» формата позволяет анализировать накопленную информацию с помощью других программ).
Работает программа предельно просто. Выделив на веб-странице нужный фрагмент (либо всю страницу) – перетащите его вручную в боковую панель,«пристыкованную» к браузеру (того же результата можно добиться с помощью меню панели или меню правой кнопки мыши). При сохранении фрагмента-«сниппета» программа автоматически сохраняет в базе данных адрес сайта, время и дату копирования и некоторые другие данные. Вы вольны перетаскивать «сниппеты» между папками (которые создаете по своему усмотрению), копировать в один файл всю базу или отдельную иерархию вложенных папок, отправлять этот файл по почте и т.п. Вы также можете перетаскивать текстовые фрагменты из других «настольных» программ, включая Word.
Слабое место программы – ее встроенный поиск: слишком уж он медленный и ограниченный по функциональности. Но это на самом деле – не проблема, поскольку в любом случае лучше использовать специально «заточенную» для «настольного» поиска программу – Google Desktop Search.
Ручная каталогизация, на первый взгляд, отнимает у аналитика немало сил (по крайней мере – на этапе рутинных операций сохранения и сортировки страниц). На самом деле на «длинной дистанции» она сторицей возвращает потраченные усилия. Искать в интернете одну и ту же информацию экспертного значения два и более раз – бездарная растрата времени. Тем более что сайты имеют обыкновение исчезать или менять свою структуру, зачастую не оставляя следов даже в www.archive.org (ресурс, по мере сил «архивирующий» весь интернет).
Наконец, по своей природе ручная каталогизация – это процесс самообразования, превращения специалиста в эксперта, накопления личной базы знаний, в которой легко ориентируешься в любое время дня и ночи.

CT Каталог

От компании Cognitive Technologies (http://www.cognitive.ru). Система, предназначенная для создания и просмотра тематического архива цифровых данных, хранящихся на любых типах носителей, например на CD дисках. Система CT Каталог позволяет
создавать тематические архивы цифровых данных, хранящихся на любых типах носителей. При этом используется автоматический анализ дисков с помощью настраиваемых модулей (plug-in). Программа позволяет расширять список таких модулей и управлять им. Пользователь может просматривать занесенные данные или реорганизовывать их по своему усмотрению. Например, можно группировать введенные диски по месту их хранения (шкафам, коробкам, полкам) или добавить новые реквизиты. Поисковый механизм позволяет найти нужный объект по любому поисковому признаку (реквизиту) или по ключевым словам.

Составление отчетов

KeyNote (www.keynote.prv.pl)

На любом этапе поиска, обнаружив нехватку информации или аналитического материала, можно вернуться к одному из предыдущих этапов. KeyNote – не исключение. Более того, я бы рекомендовал начинать с ним работу с момента открытия очередного поискового проекта.
Текстовый редактор KeyNote разрабатывался для создания мини-энциклопедий, товарных каталогов, адресных книг и т.п. – любых справочно-информационных баз, имеющих древовидную структуру. Но если взглянуть на него глазами аналитика, мы увидим в KeyNote почти идеальный инструмент подготовки отчетов, статей и любых других текстовых документов. На порядок более удобный, чем старый-добрый Word.
Вначале опишу общий стиль работы с программой. Предположим, вы читаете некий текстовый документ (совершенно не важно, в какой программе он загружен). KeyNote в это время в свернутом виде сидит в system tray, а его функция «Захват буфера» – включена. Встретив в открытом документе полезный факт, цитату, цифру, тезис и т.п. – выделите его и нажмите стандартную комбинацию клавиш для копирования: «CTRL + C». Этот фрагмент будет автоматически сохранен в «дереве» заметок KeyNote (при этом сам KeyNote остается в свернутом виде, и вам не придется отвлекаться от чтения документа). KeyNote автоматически присваивает новой заметке название, состоящее из ее первых слов (либо – из названия источника заметки, либо – из даты и времени копирования: текущий вариант зависит от настроек, которые пользователь заранее внес в программу).
Закончив наполнение KeyNote информацией, разверните его окно, разделенное на две части («дерево» заметок + окно просмотра/редактирования). Полученный список заметок может испугать своим размером. На самом деле он поддается систематизации буквально на лету (в программе Word вам было бы намного сложнее выстроить логическую цепочку тезисов будущего отчета).
Удерживая клавишу SHIFT, нажимайте клавиши курсора: «Стрелка вверх»/«Стрелка вниз» – и заметка перемещается вверх или вниз в общем списке. Нажимайте: «Стрелка влево»/«Стрелка вправо» – и заметка присоединяется к другой заметке в качестве «дочерней» либо выводится из этой логической «ветви» и вновь становится самостоятельной.
Когда вы перемещаетесь по списку заметок с помощью тех же клавиш курсора, но без нажатой клавиши SHIFT – в окне просмотра мгновенно отражается содержимое текущей заметки (то есть вам не нужно тратить время на открытие-закрытие файлов – вы просто «скользите» от одной заметки к другой). Не отходя от кассы, можно отредактировать любую заметку, либо выделить ее часть и превратить в самостоятельную заметку, которая тут же появится в информационном «дереве». Любые изменения программа сохраняет автоматически.
С помощью горячих клавиш также можно:
• менять названия заметок;
• присваивать заметкам иконки-символы для облегчения ориентации в информационном «дереве»;
• перетаскивать заметки и целые ветви из одних информационных проектов в другие, размещенные в отдельной вкладке (между вкладками, каждая из которых содержит собственное информационное «дерево», можно переключаться щелчком мыши).
Структуризация текста – процесс творческий. Меняя приоритет заметок, вы на лету редактируете план будущего аналитического отчета или статьи – и одновременно сужаете или расширяете поле идей, которые могут у вас родиться по мере работы с данным текстом. Механическими, на первый взгляд, действиями вы отсекаете часть потенциальных информационных источников (поскольку они будут противоречить выстроенной вами логике) – и, напротив, задаете себе новые направления поиска дополнительной информации. Передвинув определенный факт на несколько позиций, вы вольно или невольно понижаете его удельный вес в списке причин, а то и вовсе переводите в список следствий – что непременно скажется на выводах и рекомендациях вашего аналитического отчета.
А теперь «встроим» KeyNote в нашу цепочку обработки информации. Первым делом предлагаю следующим образом разделить функции KeyNote и Net Snippets.
В Net Snippets будет логично хранить веб-страницы и текстовые документы целиком (на случай, если нам понадобится уточнить детали, значимость которых заранее определить невозможно. Как и нельзя определить, сколько раз нам понадобится ими воспользоваться). Ведь Net Snippets поддерживает открытый *.htm формат данных, доступный для обработки в аналитических программах нашего «комплекса».
В KeyNote удобнее манипулировать данными, однако формат, в котором хранятся «деревья» и «ветви» заметок – закрытый. Следовательно, в него удобнее копировать данные, прошедшие первичную очистку и обдумывание: цифры, цитаты, примеры и т.д. – и предназначенные исключительно для данного отчета (причем копировать можно как из Net Snippets, так и прямо из браузера, редактора Word, «читалки» Adobe Reader и др.). И попутно записывать в KeyNote заметки с собственными идеями, наблюдениями, выводами, которые впоследствии послужат связками между частями отчета.
Таким образом, вы можете начать работу с KeyNote как на последнем, восьмом этапе поискового проекта, так и на любом предыдущем. На мой взгляд, второй вариант предпочтительнее, поскольку ваши размышления над «деревом» заметок KeyNote не раз подскажут вам дополнительные направления поиска и анализа. Кроме того, так вам будет легче распределять время между текущими проектами. Чтобы освежить в памяти проект, теперь достаточно взглянуть на его иерархическую структуру. Чтобы улучшить качество проекта – достаточно изменить порядок следования заметок в информационном дереве, выбросить заметки, достоверность или важность которых не подтвердилась, заполнить логические пробелы новыми фактами или собственными идеями.
Наполнив KeyNote и проведя сортировку заметок (своеобразных «зерен кристаллизации» будущего отчета), можно экспортировать «дерево» заметок в текстовый формат, а затем, например, открыть в привычном Word’е (к сожалению, KeyNote не умеет просматривать/редактировать «дерево» как единый текст).

Вот такое представление о софте для частных лиц в целях конкурентной разведки. Еще раз спасибо Смирову Юрию, Смирнову Дмитрию, Ющуку Евгению за предоставленную возможность использовать их материалы в данном обзоре.



По мере поступления новой информации об интересных программах для конкурентной разведки буду выкладывать здесь.