7 мар. 2013 г.

Измерена скорость реакции китайских цензоров

Измерена скорость реакции китайских цензоров

Китайский веб-сервис Weibo, запущенный в 2010 году, — аналог американского твиттера, который забанен на территории Китая. В остальном он практически ничем не отличается: максимальный размер сообщений ограничен теми же 140 символами, они публикуются в реальном времени, а ники пользователи имеют вид @username. Впрочем, в 140 символов иероглифами можно вместить небольшой рассказ, это гораздо больший объём информации, чем 140 символов обычного алфавита.

Так или иначе, но природа «мгновенных» сообщений китайского твиттера создаёт немалую головную боль для местных цензоров, которые круглосуточно отслеживают трафик на предмет вредоносной информации. За три года аудитория Weibo выросла до 300 миллионов человек, они отправляют около 100 миллионов сообщений в сутки, то есть примерно 70 тысяч в минуту. Отфильтровать такой поток совсем непросто. Никто не знает, какими методами и программными средствами пользуются «бойцы невидимого фронта», но зато есть возможность исследовать результат их работы. Специалисты из университета Райса в Хьюстоне (США) опубликовали научный доклад (pdf) с анализом цензуры в сервисе Weibo.

Технические возможности компьютерщиков из США позволили регистрировать факты удаления сообщений в течение одной минуты после события, так что они смогли осуществить довольно точный анализ скорости реакции цензоров. Исследование осуществлялось на выборке около 3500 пользователей, чьи сообщения как будто модерировались в прошлом и, следовательно, имели высокую вероятность модерирования в будущем. Так оно и вышло: за 15 дней де-факто было удалено 12,75% из 2,38 миллиона опубликованных ими сообщений. Общий объём зачистки составил около 4500 сообщений в сутки.

Для 30% оригинальных сообщений (не ретвитов/репостов) скорость удаления составила от 5 до 30 минут. Около 90% случаев зачистки осуществляется в течение 24 часов.
Анализируя полученные данные, учёные выдвинули несколько гипотез, каким образом может осуществляться цензура. Контент-анализ удалённых сообщений показывает ключевые слова, по которым, судя по всему, осуществляется автоматический мониторинг. Авторы исследования также указывают зависимость скорости удаления сообщений от количества ретвитов/репостов сообщения.
В таблице показана зависимость времени жизни сообщения от его темы.

Комментариев нет: