Как защитить текст сайта от копирования?

Очень часто наблюдается довольно не приятная ситуация с кражей, копированием, заимствованием текста с вашего сайта и его тиражированием на сторонние ресурсы.

Очень часто не добросовестные ушлые вебмастера, контент менеджеры, владельцы аналогичного бизнеса находят у вас хорошее, понравившееся описание товара, какую то интересную вашу статью или написанную вами инструкцию и просто копируют ее себе на сайт, при этом не удосужившись хоть как то ее отрерайтить, при этом не испытывая ни какого стыда.

Вообще есть несколько способов такой кражи:

  1. Парсинг контента (текста) на автомате (разными скриптами)
  2. Ручное копирование текста с вашего сайта

Сразу оговорюсь, что от таких ситуаций полностью защитить себя не возможно, но есть несколько действенных способов, применив которые в комплексе, вы минимизируете доставленные вам неудобства от таких их действий, а в некоторых случаях даже получите определенный результат в виде дополнительного ссылочного на наш сайт.

Способы борьбы с кражей контента на сайте

  1. Абуза (жалоба) хостеру, что у него размещен такой то сайт, который нарушает авторские права другого ресурса
  2. Защита текста от копирования (где скриптом отключается возможность копировать в буфер текст)
  3. Разрешение копирования, но при условии активной ссылки на вас как на первоисточник (на примере блога на WordPress)

Стоит отметить, что внедрение способа №2 будет не совсем правильным, тк.. полностью запрещать копирование текста на сайте не вариант, ведь часто людям нужно выделить и скопировать телефон, адрес магазина, какое то название товара и т.д., а запрещая это действие на сайте, мы только разозлим и огорчим нашего посетителя.

В идеале нужно пользоваться способами №1 и №3, но не обязательно в паре.

Итак, вы заметили что ваш сайт (или его отдельные страницы товаров или услуг) заметно просели в поиске, позиции по некоторым запросам и страницам понизились, а по самим товарам/услугам стали звонить обращаться меньше. Я обычно в таком случае сразу же смотрю конкретную страницу, которая просела, ее техническое состояние, нет ли на этой странице ошибок, доступна ли она вообще в поиске, заполнены ли у нее мета теги, присутствует ли заголовок Н1, на месте ли контент основной, и уникальный ли текст этой страницы.

При проверке текста на уникальность часто обнаруживается что текст этой страницы размещен не только у вас, но и у вашего конкурента, при том его полная идентичная копия.

Первым действием, если такое видите, посмотрите, нет ли с этого конкурента ссылки на вас, если есть, беспокоиться не о чем, он явно не является причиной вашей просадки. Но если он нагло своровал ваш текст, и представляет его как свой личный (не проставив на вас ссылку как на первоисточник), а по поиску частей этого текста в Яндексе или в Google показывается не ваш сайт на первых местах а этот конкурент, то как минимум его за это нужно наказать.

Жалоба хостеру

В данной ситуации нужно узнать на каком именно хостинге размещается сайт с ворованным контентом и написать администраторам или в службу поддержки этого хостинга, что мол так и так, у вас обслуживается один ресурс, который нарушает мои авторские права, а именно размещает у себя ворованный контент, который принадлежит моему сайту, ну и показать пару примеров страниц, что за контент и когда был размещен у вас и где этот же контент размещен у нарушителя.

Хостер как минимум обязан будет уведомить нарушителя о проблеме и предоставить вам ответ.

Узнать на каком хостинге обслуживается тот или иной сайт можно по его домену, а точнее по DNS серверам этого домена, на какой хостинг они смотрят. Это можно сделать в любом Whois сервисе, например здесь http://www.whois-service.ru/ смотрим эти значения:


В нашем случае видим хостинг Бегет

Так же не лишним будет написать и администраторам сервиса, в котором был зарегистрирован домен (в нашем случае перейти по ссылке в admin-contact:), какого то кардинального решения они конечно же предпринимать не будут, но когда начнется шумиха с разных сторон, недобросовестный вебмастер лишний раз задумается, стоит ли нарушать, ну и 6-8 из 10 таких вебмастеров или уберут ворованный контент из своих сайтов, либо же поставят на вас активную ссылку с этих материалов.

Механическая защита (блокировка) функции копирования в буфер

На странице можно добавить скрипт, который не позволит пользователю вручную выделить и скопировать текст

<script type=»text/javascript»>
document.ondragstart = noselect;
// запрет на перетаскивание
document.onselectstart = noselect;
// запрет на выделение элементов страницы
document.oncontextmenu = noselect;
// запрет на выведение контекстного меню
function noselect() {return false;}
</script>

Так же можно воспользоваться для запрета прописав стили:

<style type=»text/css»>
/* Отключение возможности выделения в теге DIV */
.noselect {
-moz-user-select: none;
-webkit-user-select: none;
-ms-user-select: none;
-o-user-select: none;
user-select: none;
}
</style>

Этот скрипт и стиль запрещает выделение части текста, а также отключает контекстное меню во всем документе, если злоумышленник захочет открыть код страницы (но полностью он все равно не защитит, т.к. текст можно будет легко скопировать открыв «источник» браузера и скопировать через его через код.

Но опять же повторюсь, что этот метод содержит достаточно много неудобств для пользователей, а для тех, кто очень сильно захочет скопировать ваш текст, это не преграда.

Копирование с активной ссылкой на нас

Выглядит это так: когда вы копируете с сайта номер телефона, название товара или просто название статьи — это все копируется без проблем, но если вы решите скопировать более 100 знаков фрагмента текста без пробелов, т.е. целые абзацы, вам в буфер так же прицепится ссылка на эту страницу, с которой вы скопировали этот текст.

Для внедрения подобного на примере сайта на CMS WordPress:

  1. Скачиваем себе на ПК файл copyright.min и закидываем себе этот файл на хостинг через фтп в директорию: ВашСайт.ru/public_html/wp-includes/js
  2. В файше шаблона Header.php перед закрывающимся тегом </head> вставляем эти строки кода:

<script type=»text/javascript» src=»/wp-includes/js/copyright.min.js»></script>
<script type=»text/javascript»>
$(document).ready(function(){
$(‘article’).copyright({extratxt:’© 2019, Авторские права защищены! Ссылка при копировании материала обязательна! | Источник: %source%’, sourcetxt: ‘ВашСайт.ru’});
});
</script>

Когда проверите, например скопировав и вставив этот кусок текста в любой HTML редактор, то обнаружите, что визуально видно лишь текстовое предупреждение «© 2019, Авторские права защищены…», но если заглянете в html код, то увидите там активную ссылку на страницу, с которой был скопирован этот текст.

Да, это все легко можно подчистить и скопировав текст удалить эту приписку, но в нашей практике в 60% тексты растаскивают в основном какие то контент менеджеры или обычные рядовые пользователи (копируют с нашего сайта описание товара и добавляют его на свой интернет магазин на проме, олх, авито и т., не особо понимая, что там цепляется еще с текстом, в результате чего мы получаем на себя активные ссылки с подобных площадок).

Работоспособность этого метода в будущем можно будет наблюдать в Яндекс Вебмастере и в Google Search Console, где отчетливо будет видно рост ссылочной массы нашего сайта, и среди того количества ссылок так же будут проскакивать ссылки с таких вот описаний на других сайтах.

Если знаете еще какие то эффективные методы борьбы с воровством и копированием текстов или другого контента, не стесняйтесь, делитесь, пишите в комментариях.

Ссылка на основную публикацию