Роботы и синдикация: наши враги или друзья

Хотел я рассказать вам про тот самый случай из прошлого поста, и тут удачно подвернулся конкурс семи блоггеров при поддержке Stimul Cash – лучшая партнерка рунета, про который я писал чуть раньше.
А случай, по сути своей, довольно банальный. Проверяя контент совего блога на уникальность с помощью одного онлайн сервиса, я обнаружил свои посты вплоть до последней точки и смайлика на нескольких других блогах. Ну, а если быть совсем точным на других сплогах.
Вот таким образом я стал жертвой неправомерной синдикации моего контента. Если кто-то не знает значения слова «синдикация» не торопитесь вбивать его в гугл, я сейчас сам все объясню.
Синдикация - это процесс, делающий доступными материалы сайта для повторного использования, или процесс получения информации.
За примером далеко бегать не надо. Ярким представителем синдикации является RSS, который и расшифровывается, начиная с версии 2.0 как Really Simple Syndication(перевод с англ. – очень простое приобретение информации).
Отношение к сплогам у всех разное. Те, кто непосредственно делает сплоги относятся к ним скорее всего положительное. Те, чьи блоги/сайты подвергаются незаконной синдикации, относятся, естественно, отрицательно.
Робот - служба, автоматизирующая тот или иной процесс и выполняющая определенное запрограммированное действие в зависимости от входных условий.
Плагины и любое другое ПО, которые обеспечивают синдикацию для сплогов можно причислить к этим самым роботам.
Как же защититься от «консервных банок» с зачатками интеллекта?
Вообще, борьба людей и «людей-синдикаторов» уходит в далекое прошлое, когда поисковые системы не так сильно следили за уникальностью. Достаточно было сменить в сворованной статье русские буквы на латинские и гуглояндекс с радостью индексировал «уникальный» контент на сплогах. Вскоре это дело стали пресекать, изменились алгоритмы, и такой контент стал и вовсе банится. А если такой контент банится, то хорошо было бы подложить «синдикаторам» утку и сделать подобную рокировку в RSS, при этом в статье на своем сайте ничего не изменять, чтобы счастливый робот, наткнувшись на свеженький пост, неприменно закинул его на сплог и подавился неперевариваемым поисковыми машинами контентом. Все бы хорошо, да только Яндекс изначально индексирует страницы через RSS feed если такой имеется. При таком подходе «синдикаторам» плохо, а нам, защитникам авторского права, еще хуже.
Перейдем из прошлого в настоящее и посмотрим, какие же методы наиболее эффективны для защиты нашего контента на сегодняшний день.
1. Помещать ссылки в тексте на предыдущие посты.
Пользы от них практически нет никакой. Пузомерки у сплогов нулевые, поэтому ни капли PR вам не перепадет. Единственное, может какой-нибудь заблудившийся серфер тыкнет по ссылке и попадет на ваш сайт. В любом случае ваш пост всегда будет иметь свзяь с вашим сайтом.
2. Публиковать в RSS только анонс поста, вместо полной статьи.
Этот метод имеет ряд недостатков. Во-первых, многие предпочитают получать полную статью в свой ридер, а, во-вторых, существуют средства, которые все равно смогут заполучить весь пост не смотря на то, что в фиде всего лишь анонс.
3. Отсрочить появление поста в фиде.
Это может помочь в решении вопроса о первоисточнике. Таким образом увеличиваются шансы стать тем, кем вы являетесь на самом деле – автором статьи.
4. Вставлять в ваш RSS feed блоки текста, которые на вашем сайте не отображаются.
Последние два пункта можно реализовать с помощью плагина Deferred RSS.
Как видите, существуют и добрые роботы, которые готовы прийти и уберечь нас от злых «синдикаторов» и других напастей. Но не советую сильно увлекаться защитой своего контента и вешать «замки» повсюду, доходя до абсурда. Не надо заменять часть текста картинкой с этим текстом или блокировать нажатие правой кнопки мыши, в надежде предотвратить просмотр вашего кода. Лучшее – враг хорошего. Но самое главное, при всей этой роботизации – не забывать оставаться людьми.




Хорошая статья. Главное что актуальная. Я бы еще посоветовал ускорить индексацию вашей статьи за счет социальных закладок и кроспостинга. Таким образом снижается вероятность, что оригинал будет проиндексирован позже плагиата…
Жук, согласен, как раз для этого можно использовать задержку появления статьи в RSS =))
Мдя. Борьба с ворами контента становиться все сложнее. Хорошо что ПС помогают в этом, баня за неуник. Однако, могут забанить и вас, посчитав за первоисточник что то другое.
Denis, чтобы это не произошло, используйте перелинковку, ссылки на себя и т.п. Во всех сплогах, где я находил свой контент, оставались ссылки, сделанные плагином SimpleTags. В результате Гугл видел, откуда торчат уши, и банил сплоггера, а не меня.
А еще полезно добавлять в фид свои копирайты (Deferred RSS это умеет) и пользоваться сервисом MyFreeCopyright.com или аналогичным.
Встречал ещё один интересный способ рассчитанный не на ПС, а на людей. Идея в том, чтобы специально публиковать пост сообщающий о том, что ресурс представляет собой сплог, а после того как пост скушают, удалять его у себя
Ну это уже, как мне кажется, попахивает параноей =))) Постоянно отслеживать не появился ли еще сплог, который ворует контент и публиковать для него подставной пост. А как нормальные подписчики интересно будут реагировать на частые посты о том, что данный блог является сплогом =)))
[...] SAnche: Роботы и синдикация: наши враги или друзья [...]
Пригодилась статья. Столкнулся как раз с воровством контента из RSS. Чем плохо? В выдаче ворюга на первом месте, я – на задворках. Обидно, но проблема решилась ябедой в Гугл. Зато теперь обязательно поставлю плагин из поста.
Сhief, рад оказаться полезным. Надеюсь вам больше никогда не придется доказывать свое авторское право =)))
Хорошая статья, познавательная! Имхо, второй пункт не стоит делать. Так как многие читатели любят читать только в ридерах и не любят ходить на блог…
Была такая же проблема и получилось что не сплог (который забирал информацию), а я попал под пессимизацию. Печально…
>>Однако, могут забанить и вас, посчитав за первоисточник что то другое.<<
У меня так и получилось. Блог с ПР4 ТИц10 в бане из-за такой вот синдикации (сразу несколько сплогов). Яндекс не способен определить первоисточник.
Признаюсь, сам тяну чужой контент, но с уникализацией обязательной, так что никому вреда такое не приносит. Делали бы так все и интернет стал немножко бы лучше
Кстати для операций с чужим контентом попробуйте сервис yahoo pipes.
Теперь уже на чужом контенте далеко не уедешь, совсем недавно Яндекс отлично копипаст кушал, теперь же нет…
Подскажите пожалуйста а на сколько лучше задерживать «отдачу» ленты? Гоша понятно – сразу индексирует а ведь от Яндекса по 4-5 дней надо ждать?
Задерживать публикацию нового материала в RSS ленту больше чем на сутки мне кажется не имеет смысла. Вообщем-то задержка создана исключительно для того, чтобы вы имели возможность за это время опубликовать побольше ссылок на новый пост с помощью сервисов закладкок, социальных сетей и т.д., увеличивая таким образом вероятность того, что ваш материал проиндексируется раньше.
Полезный пост