Эта статья переведена из следующего источника: http://www.mattcutts.com/blog/rel-canonical-html-head/ Автор Matt Cutts.

Сегодня по электронной почте я ответил на интересный вопрос касающийся rel=canonical, и подумал что нужно написать об этом в блоге. Если вы незнакомы с rel=canonical, сначала прочитайте эту страницу.

Итак, иногда мне задают вопрос о том, всегда ли Google использует url из rel=canonical в качестве предпочтительного url. Ответ заключается в том, что мы рассматриваем rel=canonical в качестве важного фактора, но в некоторых случаях игнорируем его:

  • например, если мы видим что вы собираетесь случайно выстрелить себе в ногу (направляя rel=canonical на несуществующую/404 страницу), мы оставляем за собой право не использовать ресурс, который вы указали с rel=canonical.
  • другой пример когда мы будем игнорировать ваши установки rel=canonical:если мы считаем что ваш web-сайт был взломан, и хакер добавил свой rel=canonical. Но это не самое страшное, т.к. если хакер получил к вашему сайту достаточный доступ, чтобы вставить свой rel=canonical, то обычно он может нанести гораздо больше вреда, внедрив вредоносное ПО, скрытые ссылки/текст и т.п.

Я хотел поговорить ещё об одном случае когда мы не учитываем rel=canonical.  Для начала вот вам задачка: должен ли Google доверять rel=canonical, если мы видим его в теле HTML? Ответ: нет, потому что некоторые web-сайты позволяют людям редактировать содержимое страниц. Если бы Google доверял rel=canonical в теле HTML, мы бы видели намного больше атак, в которых люди внедряли бы rel=canonical в какую-то часть web-страницы, пытаясь попользоваться ею не по назначению.

Хорошо, теперь мы подошли к другому случаю, когда мы вероятно не будем доверять rel=canonical: если мы видим странности в содержимом вашего HEAD раздела. Например, если вы начнёте вставлять текст, или другие теги, которые мы обычно видим лишь в разделе BODY, в раздел HEAD документа, мы можем с лёгкостью предположить что кто-то просто забыл закрыть раздел HEAD. Мы не допускаем rel=canonical в разделе BODY (потому что, как я упоминал, люди будут его спамить), так что мы можем не доверять rel=canonical в таких случаях, особенно если встречаем его после обычного текста, или тегов, которые мы обычно видим в разделе BODY.

Но вообще, до тех пор пока ваш раздел HEAD выглядит достаточно обычно, всё должно быть хорошо. Если же вы хотите быть по-настоящему уверены, вы можете позаботиться о том, чтобы rel=canonical было первым, что встречается в разделе HEAD. Но опять же всё должно быть хорошо и без этого, но если вам нужно простое и действенное правило: помещайте rel=canonical как можно ближе к началу раздела HEAD.

 

JavaScript - это уникальный язык программирования, код которого выполняется не просто компьютером, а именно интернет-браузером. Читать далее »

Doorway («дверной проём») - это сайт, каждая web-страница которого не содержит никакой полезной информации (чаще всего состоит из бессмысленного набор слов), но сделана так, чтобы, во-первых, поисковая система сочла её очень подходящей для показа в списке результатов поиска, и во-второх, чтобы человек, перешедший на эту страницу, был сразу переадресован на сайт какого-нибудь реального магазина. Читать далее »

Dmoz  (от первоначального названия домена этого каталога directory.mozilla.org) - это многоязыковой открытый каталог ссылок мировой паутины. Читать далее »

CTR («click-through rate» - «уровень прокликивания, или кликабельность») - это простое соотношение числа показов чего-нибудь кликабельного к числу кликов по нему. Читать далее »

CSS («Cascading Style Sheets» - «Каскадные листы стилей») - это встраиваемые в html-страничку списки, в которых перечислены элементы этой html-странички с указанием правил их отображения. Читать далее »

CAPTCHA («Completely Automated Public Turing test to tell Computers and Humans Apart» — «Полностью автоматизированный общественный тест Тьюринга чтобы отличить компьютеры от людей») - это появившийся в 2000 году термин, обозначающий такую задачу, которую человек может решить легко, а компьютер решить не может. Читать далее »

CMS (Content Management System - Система Управления Содержимым) - это комплекс хранящихся на сервере скриптов, которые отвечают за выдачу страничек в ответ на клики пользователя, и помогают web-мастеру изменять внешний вид и содержимое сайта. Читать далее »

Эта статья переведена из следующего источника: http://searchenginewatch.com/3641979 Автор Eric Enge.

Сегодняшняя статья будет посвящена изучению веб-сайта, который значительно улучшил свои показатели лишь за счёт элементарных работ по очистке кода. Самое интересное, что то, что мы сделали, далеко не первое, что приходит в голову когда думаешь о SEO, и тем не менее этот подход зачастую позволяет достичь ощутимых результатов. Читать далее »

Соплями google (Supplemental Index Google)  называют дополнительную выдачу поисковой системы, которая не попадает в основной список найденных страниц. Читать далее »

© 2011 Изучение SEO-оптимизации Suffusion theme by Sayontan Sinha
This is a free demo result from the Wayback Machine Downloader. Click here to download the full version.