Существует несколько вопросов, которые смущают SEO индустрию уже на протяжении нескольких лет. Уже неважно, как и сколько раз представители Google и Yandex поясняли эти вопросы. Всё равно существуют сложно объяснимые мифы. Одним таким вопросом является широко обсуждаемая тема о дублированном контенте. Что это такое? Можно ли получить пенальти за это и как этого избежать?
Давайте разъясним несколько вопросов по теме дублированного контента. В это статье мы расскажем о том, что такое дублированный контент и как с ним бороться.
Как диагностировать пенальти за дублированный контент?
Забавно как сейчас некоторые читатели выкатили глаза, читая заголовок. Но давайте разберемся с этим мифом.
Не существует пенальти за дублированный контент. Никто из представителей поисковых систем никогда не подтверждал существования такого пенальти. Не существует алгоритмических обновлений под названием «дублированный контент», и тут вообще не может никогда быть никакого пенальти, из-за ошеломляющего количества случаев, когда дублированный контент — это естественная вещь, не несущая в себе ничего плохого. Мы это знаем и Google это знает.
До сих пор множество SEO экспертов «диагностируют» «пенальти» за дублированный контент, занимаясь анализом какого-либо сайта.
Зачастую дублированный контент упоминается в одном ряду с такими обновлениями как Панда и Фред, но они применяются для выявления более важных проблем, таких как спам или украденный(scraped) контент.
До тех пора, пока у вас нет последних двух описанных проблем, несколько примеров дублированного контента на вашем сайте не могут вызвать пенальти от поисковика.
Google продолжает оповещать владельцев сайтов делать упор на высококачественный контент, который точно поможет вам избежать проблем с отметкой вашего контента, как нежелательного.
Вы же хотите аккуратно относиться к перепубликации ваших статей, потому что вы не хотите смутить Google, когда дело дойдет до поиска настоящего источника контента. Вы же не хотите, чтобы страницы вашего сайта отфильтровывались, когда вы перепубликовываете статью на авторитетном блоге. Но если таковое и случиться, скорее всего, это не повлияет на общую работу Google с сайтом.
Вкратце, дублированный контент — это фильтр, а не пенальти, это означает то, что Google выбирает один из URL с неоригинальным контентом и фильтрует его от других.
Нужно ли мне перестать беспокоиться о внутреннем дублированном контенте?
Вкратце, нет. Вы же не игнорируете повторяющиеся головные боли? Головная боль — это не заболевание, само себе, но это может быть симптомом более серьёзного состояния, таким образом вам нужно вычистить эти страницы или вылечить их, чтобы они стали подходящими.
Дублированный контент может сигнализировать о некоторых структурных проблемах на вашем сайте, мешая поисковикам понимать, что им нужно ранжировать и что имеет наибольшее значение на вашем сайте. Как правило, пока Google совершенствуется в понимании разных случаев для одного и того же контента на вашем сайте, вам всё равно не нельзя каким-либо образом усложнять ему процесс индексации.
Внутренний дублированный контент может сигнализировать о недостатке оригинального контента на вашем сайте, что является ещё одной важной проблемой, с которой нужно бороться.
Google хочет видеть только оригинальный контент в своей поисковой выдаче по очевидным причинам: поисковик не хочет, чтобы пользователи заходили на тот же контент снова и снова. Это ужасный опыт взаимодействия, за который так борется Google. Таким образом Google сам решает какие неуникальные страницы он хочет показывать своим пользователям, а какие он хочет скрыть.
Вот где может появиться проблема. Чем больше страниц на вашем сайте имеют оригинальный контент, тем на больших позициях в Google они могут появляться по разным поисковым запросам.
Если вы хотите знать есть ли на вашем сайте какие-нибудь проблемы с дублированием контента, попробуйте такие инструменты как SE Ranking, который проиндексирует ваш сайт и проанализирует есть ли какие-нибудь ссылки с дублированным контентом, которые могут смутить Google.
Как Google определяет какие неоригинальные ссылки отфильтровывать, а какие ранжировать?
Вы можете подумать, что Google хочет выбрать как можно больше авторитетных постов, основываясь на различных сигналах, включая бэклинки и вероятно поисковик так и поступает.
Но вот, что ещё делает Google. Он выбирает самый короткий URL, когда находит две или более страницы с идентичными URL.
Что делать с зарубежными сайтами? Может ли переведённый контент рассматриваться как дублированный?
Этот вопрос был задан Мэту Каттсу ещё в 2011 году. Если вкратце, то переведённый контент не позиционируется как дублированный, даже если он переведён максимально близко к оригиналу.
Но есть одно предупреждение – не публикуйте автоматические переводы с использованием инструментов, таких как Google Translate, потому что именно тут вы и сможете попасться, потому что Google научился хорошо работать в этом направлении. Если же вы решили так сделать, то вы подвергаетесь риску того, что ваш контент может быть отмечен как спам.
Также мы советуем вам использовать hreflang атрибут, чтобы направить Google на настоящий язык, используемый на региональных версиях вашего сайта.