Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:
Россия +7 (495) 139-20-33
11 Августа 2016 в 14:35

Как защитить сайт от плагиата?

Россия +7 (495) 139-20-33
1 18186
Подпишитесь на нас в Telegram
Михаил Барзман
Основатель и руководитель Бюро копирайтинга TextBroker.ru

Всё в этом мире плагиат!

Это утверждение принадлежит Дюма-отцу, который без всяческих стеснений обвинил в плагиате даже Господа Бога. Ведь он создавал Адама по своему образу и подобию. Вот только юристы с этим утверждением вряд ли согласятся, поскольку чаще обращаются к законодательству. А в нём предельно чётко сказано, что плагиат – это присвоение авторства (почитайте статью 146 Уголовного кодекса РФ).

Большинство из нас считает, что плагиат расцвёл пышным цветом лишь тогда, когда появился интернет. Однако история этого явления уходит в глубокую древность. В плагиате подозревали Геродота и Софокла, Вергилия и Шекспира. Нить обвинений можно раскручивать бесконечно. Но всегда найдутся те, кто, как Мольер, ответят обвинителям: «Я беру своё добро всюду, где его нахожу!»

Сегодня, когда даже художественная литература сплошь и рядом состоит из явного плагиата и компиляций, о плагиате на сайтах становится говорить всё сложнее. Так просто забыть о нравственных принципах, если о них предпочитают не вспоминать знаменитости, которых поддерживают издатели, читатели и критики.

Но одно дело книги, совсем другое – сайты. Уникальный контент в нашей сфере – одно из требований поискового продвижения. Правда, нет-нет да и звучат утверждения о том, что всё это просто миф, привычка, предрассудок. Тогда и писать больше ничего не надо. Вполне можно обойтись тем, что уже появилось за время существования интернета.

Тем не менее смысл в создании уникального контента и борьбе с плагиатом есть. Об это поговорим дальше, но начнём с сервисов проверки уникальности текстов. Ведь именно они позволяют обнаружить плагиат.

Сервисы проверки уникальности текстов

А кто был первым?

В деле создания сервисов и программ проверки текстов на плагиат Россия всего на год отстала от Запада: монополист западного рынка Copyscape был запущен в 2004, а уже на следующий год началось тестирование российского «Антиплагиата» http://www.antiplagiat.ru/. Правда, этот сервис, в отличие от западного, предназначался исключительно для системы образования. И сейчас он используется для проверки учебных и научных работ на заимствования.

Второй по времени создания стала программа Double Content Finder (DCFinder), которую разработали программисты Бюро копирайтинга Textbroker.ru в 2007 году. В отличие от «Антиплагиата», прогоняющего тексты по собственной базе, DCFinder осуществлял проверку через поисковые системы.

Принципы работы программ проверки текстов на плагиат

На сегодняшний день существует несколько методов проверки текстов на плагиат. Однако все они базируются на поиске отдельных фраз и фрагментов текста в поисковых машинах. По сути – это первый этап работы каждой программы.

После того как в поисковике обнаружены схожие фразы, программа забирает их и начинает обработку по собственным алгоритмам: высчитывает процент уникальности, обнаруживает рерайт и определяет другие характеристики текста, заложенные разработчиками.

Необходимо отметить, что каждая программа дробит текст по-своему. Назвать эти части можно как угодно: шинглы, куски, фразы. Одни программы выбирают фразы из нескольких слов, идущих друг за другом. Другие – выдёргивают фразы из текста в случайном порядке. Третьи – берут из текста пересекающиеся фразы. Вариантов множество, но чем больше текст, тем больше этих кусков, которые требуется проверить.

Например, возьмём текст из 1500 символов и предположим, что этот объём включает примерно 250 слов. Разобьём текст на куски, состоящие из пяти слов. Если программа будет учитывать фразы без пересечений, то в итоге получится 50 фраз. Если же сделать пересечение в одно-два слова, то количество фраз увеличится в несколько раз.

Чтобы проверить текст на уникальность с максимальной точностью, нужно исследовать все эти фразы. То есть придётся сделать 50 запросов к поисковой системе. Программа, которая нацелена на обычную выдачу, уже на третьем запросе вызовет подозрения поисковика и для последующей проверки придётся вводить капчу 47 раз.

Есть программы, использующие xml-запросы к поисковым системам. Тогда капч никаких не будет, но запросы будут недешёвыми. Отдать 50 запросов для проверки одного текста да ещё и бесплатно – слишком расточительно.

Следовательно, программы не проверяют текст досконально, целиком и полностью. Очевидно, что для каждой проверки используется меньшее количество запросов.

Но, используя десять запросов и проверяя десять выбранных случайным образом фраз, мы получим один результат. При повторной проверке программа выберет другие фразы из текста (и вероятность этого очень высока), поэтому результаты проверки окажутся другими. Это не говоря о том, что результаты поисковой системы могут быть разными не только для одного и того же запроса, но и для разных регионов.

Вывод из вышесказанного один: даже самые продвинутые алгоритмы проверки не гарантируют стопроцентной точности: результаты пяти проверок, проведённых одна за другой, но в разное время, из разных регионов или разными людьми, будут различаться.

Популярные сервисы и программы проверки текстов на плагиат

Программы

  • Advego Plagiatus
  • eTXT Антиплагиат

Сервисы

  • Text.ru
  • Copyscape

Менее известные сервисы

Вроде плагиат есть, а вроде его и нет

Если на сайте размещается текстовый контент, то владелец сайта непременно столкнётся с проблемой плагиата и задаст эти три вопроса:

1. Как отслеживать размещение текстов на других веб-ресурсах?

2. А если они вдруг и обнаружатся, как доказать авторство?

3. Стоит ли идти в суд?

Ответим на каждый из них.

Как отслеживать размещение текстов на других веб-ресурсах?

Совершенно бесплатно сегодня можно использовать только поисковые системы. Но представьте, сколько времени потребуется, чтобы обработать таким образом каждую статью!

Некоторые сервисы (например, Text.ru, Content Watch) предусматривают проверку всего сайта, но без оплаты сделать это не удастся.

Как вариант – можно вовсе отказаться от использования сервисов и программ, сосредоточив свои усилия лишь на сайтах конкурентов. Ведь, по сути, сегодня важнее предотвратить плагиат с их стороны, особенно если речь идёт о сайтах компаний. Отслеживать десяток-другой конкурирующих сайтов гораздо проще, чем рыть весь интернет.

В Бюро копирайтинга Textbroker.ru проблема обнаружения плагиата решается внутри системы. Клиентам доступна опция «Плагиатфиндер», с помощью которой каждый месяц проверяются статьи определённого ценового уровня. Если обнаружится перепечатка, то клиент узнает об этом сразу.

плагиатфиндер.png

Как доказать авторство?

Некоторые уверены, что если автор не указан, то и претензии о нарушении авторских прав никто не заявит, а если заявит, то доказать не сможет. На самом деле не всегда это так.

Ситуация с авторством на текстовый контент может разворачиваться в нескольких направлениях.

Первый вариант. На сайте размещаются статьи, которые пишет штатный автор, получающий за это заработную плату. В соответствии со статьёй 1295 Гражданского кодекса РФ авторское право принадлежит автору, а исключительное право на использование – работодателю, если не был заключён договор на каких-либо других условиях.

Второй вариант. Создание текстового контента компания отдала на аутсорсинг в другую организацию: агентство, бюро, биржу копирайтинга или отдельному автору. Соответственно, в этом случае стороны заключают договор, в котором отражаются все тонкости, связанные с авторским правом.

В любой из этих ситуаций не мешает подстраховаться:

★ Поскольку уникальные тексты прежде всего нужны для поискового продвижения, лучше зафиксировать дату размещения статьи с помощью сервиса Яндекса «Оригинальные тексты».

★ Некоторые сервисы проверки уникальности текстов (например, Text.ru) предлагают зафиксировать уникальность с помощью баннера.

баннеры.png

★ Можно создавать pdf-файлы, в которых, кроме текста, будет дата и время его создания, данные авторы и правообладателя. Такой подход используется у нас в бюро: опция CopyGuard формирует pdf-файл со статьей и направляет его на адрес электронной почты клиента. Если возникнут проблемы с авторскими правами, то факт отправки файла станет подтверждением получения имущественных прав на текст в точно зафиксированное время. По сути, этот вариант заменяет собой отправку почтой бумажного письма с распечатанной статьёй. Автор или правообладатель отправляет себе такое письмо и хранит в запечатанном виде на случай, если понадобится доказывать авторство.

письмо.png

Стоит ли идти в суд?

Если мы обратимся к судебной практике, то не найдём ни одного случая, когда факт плагиата статьи рассматривался в суде.

Есть примеры судебных дел, связанных с воровством дизайна сайта или его элементов. Не поддаётся подсчёту количество судебных разбирательств с продавцами контрафакта и юрлицами, использующими программы без лицензий. То и дело вспыхивают споры об авторском праве между авторами художественных произведений и научных работ.

Ситуация вполне объяснима. Масштабы плагиата текстового контента настолько несущественны, что предпочтительнее не доводить дело до суда. Те суммы, которые может получить истец в случае решения суда в его пользу, просто не сопоставимы с временными затратами и переживаниями.

В соответствии со статьёй 7.12 КоАП РФ суммы административного штрафа составляют:

  • для граждан – от 1 500 до 2 000 рублей;
  • для должностных лиц – от 10 000 до 20 000 рублей;
  • для юрлиц – от 30 000 до 40 000 рублей.

Административное наказание сопровождается конфискацией произведений, фонограмм, материалов, оборудования и иных орудий совершения административного правонарушения.

Однако, для доказательства факта плагиата придётся провести автороведческую экспертизу, стоимость которой начинается от 40 000 рублей.

За плагиат предусмотрена и уголовная ответственность, но при условии, что автору или правообладателю причинён крупный ущерб (более 100 000 рублей). Конечно, вполне возможно подсчитать доход, который получил владелец сайта, например, с рекламы. Но стоит ли с этим возиться? Ведь сопутствующие затраты могут оказаться гораздо выше компенсаций.

Рерайтинг – это плагиат?

Это ещё одна скользкая тема, связанная с плагиатом. Закон не запрещает заимствовать в определённых пределах и перерабатывать авторский текст, но переработка должна быть творческой.

Претензий не будет к тем текстам, в которых позаимствованная идея обрела дополнительный смысл. Если же рерайтинг выполнен поверхностно да ещё указано имя другого автора, то доказать факт плагиата будет просто.

Выводы и рекомендации

Рекомендации владельцам сайтов, которые хотят защитить контент от плагиата

1. Поскольку сегодня поисковые системы при ранжировании сайтов, кроме уникальности, используют и множество других параметров, делать ставку на уникальность как основу поискового продвижения не стоит. Это не значит, что можно позаимствовать контент у других. Просто лучше сосредоточиться на качестве информации и её подачи. Тогда защита от плагиата будет более осмысленной.

2. Текст на сайте можно защитить от выделения и копирования с помощью специальных плагинов. Однако полагаться на них не стоит, так как при желании их можно легко обойти.

3. Не пытайтесь следить за всем интернетом. Определите конкурентов и мониторьте их сайты. Если конкурентов слишком много, то имеет смысл выбрать только самых крупных.

4. Разработайте политику использования материалов сайта. Иногда лучше не запрещать перепечатку, а разрешить её с обязательным указанием имени автора, названия источника и гиперссылки на сайт.

Рекомендации тем, кого всё-таки обвинили в плагиате

1. Если к вам обратились с претензией об обнаружении на вашем сайте плагиата и вы знаете, что это плагиат, лучше сразу убрать текст с сайта или выполнить требования, например, указать имя автора и поставить гиперссылку на сайт-источник.

2. Если вы даже не догадываетесь, что разместили плагиат на сайте, а претензия поступила, то разбираться придётся не только с обратившимися, но и с автором, которому были заплачены деньги. Вероятно, в этой ситуации стоит пересмотреть подходы к сотрудничеству с авторами и приобретению контента. И преимущество в данном случае за агентствами и компаниями. С ними можно заключить договор, а значит и решить любую проблему, касающуюся контента, будет гораздо проще.

3. Если вы уверены, что в вашей сфере сложно создать что-то новое и единственный выход – рерайтинг, то лучше не торопитесь. Может быть, нужно понаблюдать за целевой аудиторией, понять её потребности, интересы и привычки, выяснить, какие смежные направления могут заинтересовать пользователей. На основе этих данных появятся идеи для контента, и не факт, что это будут исключительно статьи.

1 комментарий
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
  • Сергей Ольховик
    5
    комментариев
    0
    читателей
    Сергей Ольховик
    больше года назад
    А чем Оригинальные тексты Яндекса не устраивают?
    -
    0
    +
    Ответить

Отправьте отзыв!
X | Закрыть