<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Блог Golan &#187; теория</title>
	<atom:link href="http://golanblog.info/tag/teoriya/feed/" rel="self" type="application/rss+xml" />
	<link>http://golanblog.info</link>
	<description>העם עם הגולן</description>
	<lastBuildDate>Tue, 13 Dec 2011 06:28:14 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.5</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Как же все-таки поисковики относятся к дублированному контенту?</title>
		<link>http://golanblog.info/kak-poiskoviki-otnosyatsya-k-dublirovannomu-kontentu/</link>
		<comments>http://golanblog.info/kak-poiskoviki-otnosyatsya-k-dublirovannomu-kontentu/#comments</comments>
		<pubDate>Thu, 17 Dec 2009 22:16:21 +0000</pubDate>
		<dc:creator>Golan</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[теория]]></category>

		<guid isPermaLink="false">http://golanblog.info/?p=130</guid>
		<description><![CDATA[Что такое дублированный контент? Как к нему относиться? Когда его становится слишком много? Как к нему относятся ПС? Как они с ним работают?]]></description>
			<content:encoded><![CDATA[<p><span style="color: #165604;">На тему <strong>дублированного контента</strong> немало копий сломано. То это плохо, то ужасно, то ничего страшного. Давайте послушаем настоящего авторитета, Рэнда Фишкина из <a href="http://www.seomoz.org" target="_blank">SEOmoz</a>. В последнем <strong>Whiteboard Friday</strong> (наверное, можно перевести как &#8220;Классная доска по пятницам&#8221;) он выдал <a href="http://www.seomoz.org/blog/whiteboard-friday-dealing-with-duplicate-content" target="_blank">немало ценной информации</a> по нашему сабжу. Вот краткий перевод.</span></p>
<div id="attachment_135" class="wp-caption aligncenter" style="width: 210px"><img class="size-full wp-image-135" title="Рэнд Фишкин" src="http://golanblog.info/wp-content/uploads/rand.jpg" alt="Рэнд Фишкин" width="200" height="182" /><p class="wp-caption-text">Рэнд Фишкин</p></div>
<p>Что такое <strong>дублированный контент</strong>? Как к нему относиться? Когда его становится слишком много? Как к нему относятся поисковые системы (ПС)? Как они с ним работают? Как определяют, где источник, а где плагиат? Что происходит со страницами, попавшими под фильтр за плагиат, и как они могут вам повредить?</p>
<p>Мы рассмотрим сегодня три ключевых вопроса.</p>
<ol>
<li>Как ПС определяют &#8220;победителя в схватке двух источников&#8221;?</li>
<li>Сколько дублированного контента приемлемо?</li>
<li>Что происходит, когда страница попадает &#8220;под дубль-фильтр&#8221;?</li>
</ol>
<h4>Как ПС определяют &#8220;победителя в схватке двух источников&#8221;?</h4>
<p>Допустим, у нас есть сайт, и у нашего конкурента есть сайт, и мы одновременно опубликовали некий контент. Обе страницы проиндексировались пауками ПС, и в алгоритмах ПС началась &#8220;схватка&#8221; между ними. На картинке этот момент обозначен стрелочкой.</p>
<div id="attachment_132" class="wp-caption aligncenter" style="width: 295px"><img class="size-full wp-image-132" title="Схватка двух источников" src="http://golanblog.info/wp-content/uploads/battle.jpg" alt="Схватка двух источников" width="285" height="177" /><p class="wp-caption-text">Схватка двух источников</p></div>
<p>Как же ПС определяют победителя?</p>
<p>Критерии для такого решения постоянно упрощаются. ПС смотрят на три важнейшие вещи:</p>
<p><strong>1. Параметры домена</strong> – авторитетность и т.п.</p>
<p>Здесь важны авторитет домена, ценность контента и информации на нем, наличие и количество уникального контента, диверсифицированные ссылки из разных источников, желательно трастовых, и прочие подобные параметры.<br />
Например, мы часто можем наблюдать, как какой-то мелкий блог публикует интересную статью, которую перепубликовывают монстры, авторитетные газеты и новостные сайты, и в выдаче газета оказывается выше блога, потому что хоть газета и не может &#8220;переплюнуть&#8221; блог в фильтре оригинала контента, она запросто переплевывает его в фильтре параметров домена.</p>
<p><span style="color: #165604;"><em>Это можно сравнить с тем, как социалки обгоняют ваш оригинал. Если вы запостите статью на каком-нибудь совершенно нераскрученном сайте и прогоните ее по социалкам, а потом через пару дней наберете в поиске ее заголовок или фразу, которую вы постили в социалки, то вы увидите, что записи в mixx, reddit, folkd, digg, stumbleupon, propeller и так далее намного обогнали саму статью.</em></span></p>
<p><strong>2. Параметры страницы</strong> – PR, ссылки и т.п.</p>
<p>Опять же, сколько ссылок, насколько они диверсифицированы, кто на вас ссылается.  Если ПС трудно определить победителя по параметрам домена, они начинают рассматривать конкретные страницы.</p>
<p><strong>3. Ссылка на источник</strong>.</p>
<p>Если на одной странице стоит ссылка на другую страницу с тем же контентом с другого сайта, то для ПС это явный знак того, кто же был первым.</p>
<p>Одна обратная ссылка не очень помогает установить ваше первенство. Но если на вас ссылаются много сайтов, перепечатавших ваш контент легально или нелегально, то этот третий пункт может побить первые два вместе взятые.</p>
<div id="attachment_131" class="wp-caption aligncenter" style="width: 211px"><img class="size-full wp-image-131" title="Обратные ссылки говорят о вашем первенстве" src="http://golanblog.info/wp-content/uploads/backlinks.jpg" alt="Обратные ссылки говорят о вашем первенстве" width="201" height="144" /><p class="wp-caption-text">Обратные ссылки говорят о вашем первенстве</p></div>
<p><strong>Важный момент – чтобы обратные ссылки были не на морду, а именно на страницу с оригинальным контентом</strong>. Иначе третий пункт не сработает. Вы получите пользу через первый пункт, получите плюс к &#8220;репутации&#8221; домена, но не через третий пункт. Поэтому следите, чтобы ссылки на вас были не просто &#8220;источник: сайт vasya.com&#8221;, а с полным урлом страницы.</p>
<h4>Сколько дублированного контента приемлемо?</h4>
<p>Сколько дублированного контента нормально? Сколько уже слишком много? Где начинаются санкции, и какие? В какой точке вы попадете под фильтр? Никто вам точно не скажет. Алгоритмы постоянно меняются, и как только мы сможем нащупать какую-то закономерность, назавтра все будет уже по-другому. Толпы черношапочников пытаются расколоть эти механизмы, но ПС неизменно выигрывают эту войну, простым нажатием кнопки меняя алгоритм.</p>
<p>Ясно, чего не стоит делать – это копировать дизайн и расположение элементов на странице: здесь видео, тут карта, здесь три колонки, а текст мы немного изменим. Это прямая дорога под фильтр. <strong>Никакие синонимизации и уникализации здесь не работают</strong>. Замены дат и географии также не работают.</p>
<div id="attachment_133" class="wp-caption aligncenter" style="width: 286px"><img class="size-full wp-image-133" title="Скопированная структура страницы" src="http://golanblog.info/wp-content/uploads/copy.jpg" alt="Скопированная структура страницы" width="276" height="190" /><p class="wp-caption-text">Скопированная структура страницы</p></div>
<p>Как же можно превратить скопированный контент в более-менее уникальный? Есть несколько методов.</p>
<p>1. UGC – user generated content, контент, написанный посетителями. Невероятно действенный метод. Комментарии, отзывы, рейтинги. Это уж точно будет уникальный контент.  Посмотрите на Amazon, там такого контента в десятки раз больше, чем непосредственно описаний товаров. Есть к чему стремиться.<br />
2. Редактирование своими силами и добавление своего текста.<br />
3. Редактирование силами аутсорсинга.</p>
<p>Но здесь нужно твердо уяснить<strong> очень важный пункт: уникальность сама по себе недостаточна</strong>. Если у вас есть уникальный контент, в том плане, что такого не найти нигде в Сети, это еще не значит, что вы достигли успеха. <strong>Для успеха необходимо, чтобы контент был не только уникальный, но и ценный, полезный</strong>.</p>
<p>Переработанный любым из трех вышеперечисленных методов контент вряд ли будет хоть кому-то полезен <em><span style="color: #165604;">(за исключением, наверное, отзывов на Амазоне)</span></em>. И будьте уверены, ПС определяют эту степень полезности на ура. Они быстро поймут, действительно ли у вас полезный контент, или просто уникальная, но никому не нужная абракадабра. Вы можете изобретать сколько угодно новых синонимайзеров и генераторов читабельного контента – все это без толку. Нет никакого смысла тратить на это время и деньги. Нужно тратить их на то, чтобы ваш контент был полезным.</p>
<h4>Что происходит, когда страница попадает под &#8220;дубль-фильтр&#8221;?</h4>
<p>Допустим, у нас на сайте есть страницы А, В и С. Страница В попала под фильтр за дублированный контент. Что тогда происходит?</p>
<div id="attachment_134" class="wp-caption aligncenter" style="width: 260px"><img class="size-full wp-image-134" title="Страница В попала под фильтр" src="http://golanblog.info/wp-content/uploads/filter.jpg" alt="Страница В попала под фильтр" width="250" height="155" /><p class="wp-caption-text">Страница В попала под фильтр</p></div>
<p><strong>1.</strong> Во-первых, она <strong>выпадает из выдачи</strong>. Слетает с любых позиций.</p>
<p>Иногда  можно в запрос добавить параметр &amp;filter=0 и тогда увидеть, на какой позиции находилась бы ваша страница без этого фильтра. Но это срабатывает уже не всегда. Похоже, что гугл сворачивает эту лазейку.</p>
<p><strong>2. &#8220;Черная дыра ссылочного веса&#8221;</strong>. Это недоказанный фактор, и наблюдения и эксперименты его то подтверждают, то нет, а ПС, понятно, эту информацию не раскрывают.</p>
<p>Исходящие ссылки, которые изображены зелеными стрелками, <strong>не передают никакого веса</strong> и по сути бесполезны для страниц-акцепторов.</p>
<p>Почему это происходит? Потому что подсчет распределения ссылочного веса происходит <strong>после </strong>того, как страница попала под фильтр и выпала из индекса. Лично Рэнд склонен с этим не согласиться и считает, что скорее всего сначала считается ссылочный вес, а потом уже применяется фильтр, но в любом случае он советует не сбрасывать эту опасность со счетов.</p>
<p>С другой стороны, <strong>и входящие ссылки на эту страницу оказываются бесполезными</strong>, потому что они никак не могут помочь в ее ранжировании, пока с нее не снят фильтр. То есть вес этих ссылок уходит в никуда.</p>
<div id="attachment_136" class="wp-caption aligncenter" style="width: 234px"><img class="size-full wp-image-136" title="Вес входящих ссылок уходит в никуда" src="http://golanblog.info/wp-content/uploads/backlink.jpg" alt="Вес входящих ссылок уходит в никуда" width="224" height="214" /><p class="wp-caption-text">Вес входящих ссылок уходит в никуда</p></div>
<p>А что делать, если на вашем сайте по определению должно быть <strong>много контента из других источников</strong>? Легального, с необходимыми ссылками и копирайтами. Например, ваш сайт – агрегатор какой-то информации. Нужно ли нам бояться, что мы попадем под фильтр и весь наш сайт никогда не вылезет в выдаче? Ответ однозначный: <strong>нет</strong>. Пока мы ссылаемся на источник, пока ясно, с какой целью мы перепубликовываем этот контент, пока мы не начинаем заниматься уникализацией, ПС ясно видят, что к чему, и не применяют к нам фильтр. Мы даже можем попытаться вылезти в выдаче с этим контентом, особенно если у нас хорошие параметры домена, о которых мы говорили вначале.<br />
Если же мы сильно боимся, что какая-то страница попадет под фильтр и испортит показатели всему сайту, можно закрыть ее в noindex.</p>
<p><span style="color: #165604;">На своем опыте могу подтвердить, что насчет полезности контента – это все чистая правда. В свое время я потратил кучу денег, заказывая оригинальный контент у индусов. Сайты с этими статьями продвигались ничуть не лучше, чем простые сплоги, и денег приносят не больше. Но те блоги, в которые я действительно вкладывал время и, можно сказать, душу, которые раскручивал, которые действительно предоставляют полезную информацию, находятся в топах в своих нишах, хоть дублированного контента там процентов 90%.</span></p>
<p><span style="color: #165604;">И кстати, еще почти по теме: буквально вчера Гугл <a href="http://googlewebmastercentral.blogspot.com/2009/12/handling-legitimate-cross-domain.html" target="_blank">издал инструкцию</a>, в которой впервые рекомендует для четкого указания источника использовать тег rel=&#8221;canonical&#8221; в ссылках на источник &#8211; не только в пределах вашего сайта, но и на чужой.</span></p>
]]></content:encoded>
			<wfw:commentRss>http://golanblog.info/kak-poiskoviki-otnosyatsya-k-dublirovannomu-kontentu/feed/</wfw:commentRss>
		<slash:comments>14</slash:comments>
		</item>
	</channel>
</rss>

