Навигация
   
Самое популярное
   
Скоро у нас
 
Раздача ICQ Номеров 
(6,7,8 значных) 
Раздача Email Адресов
( Ваше слово@stilys.ru ) 
(А также другие) 
Раздача Доменов
(Ваше слово.stilys.ru) 
(А также другие) 
 
Читаем
  Как Добавить новость????
  Как скачать с DepositFiles
  Как скачать с Letitbit
 
 
Наша Ссылка
 
Если вам понравился наш сайт
 поставьте у себя на  сайте нашу ссылку
 
 
Реклама
  Приобрести детские путевки в лагеря рекомендую в ГЕО-тур  
 
.::Реклама::.
регистрация доменов
Php хостинг для Web-Мастеров. Hostia.Ru
.::Темы с форума::.
web раскрутка Adult сайта 0 neon27
web Фотохостинг 1 admin
web Помощь в раскрутке 26 sum74xp
Графические ON-LINE сервисы генератор flash-баннеров 28 klf
Графические ON-LINE сервисы флеш сайт за 5 минут(халява) 0 туретский
Халява Где зарегить домен 3 innovation
Аптека Есть ли рабочий Allsubmitter 5.3 3 30698963
web Раскрутка моего сайта 3 wgc
web Бесплатно приподняться в гугле. 0 VMN
Халява Бесплатная раскрутка 1 fahist

Работаем с файлом robots.txt
[Категория: Раскрутка | Автор: admin | Просмотров: 1345 | Дата: 4 ноября 2008]  
В этой статей я постараюсь описать как можно управлять индексацией своего сайта с помощью одного файла robots.txt и что он представляет
из себя.

Наверное иногда веб мастеру или владельцу какого-нибудь ресурса нужно закрыть от индексации часть сайта, определенный файл или каталог.
Почти все роботы позволяют это сделать:
-Разместить в корневой папке своего сайта текстовый файл robots.txt, выгладить будет так www.site.ru/robots.txt
-Также это можно сделать в html файле используя специальный META тэг
-Использовать нестандартные приемы, работающие для конкретных поисковых роботов роботов. Например запретить роботу следовать по
ссылке при помощи rel=”nofollow”(Google, MSN, Yahoo) или запретить индексацию части страницы при помощи тега (Yandex, Rambler).
Следует помнить, что все эти методы не дают стопроцентной гарантии. Некоторые поисковые роботы могут попросту не обращать на них внимание,
тогда нам на помощь придет файл robots.txt(который укротит поведение поисковых роботов на вашем сайте).

Помните, что файл robots.txt нужно класть только в корневую директорию вашего сайта, и не забывайте, что название файла robots.txt должно
быть написано в нижнем регистре, посмотрите примеры:

http://www.w3.org/admin/robots.txt Файл находится не в корне сайта, а в папке admin, там поисковый робот не будет учитывать файл robots.txt
http://www.w3.org/~timbl/robots.txt Файл находится не в корне сайта, таже ситуация, что и в первом случае
ftp://ftp.w3.com/robots.txt Поисковые роботы не индексируют ftp
http://www.w3.org/Robots.txt Название файла не в нижнем регистре, файл должен быть назван только robots.txt

Теперь давайте разберемся с содержимым файла robots.txt. Обычно в этом файле пишут, нечто похожее этому:
User-agent: *
Disallow: /cgi-bin/
Disallow: /download/
В этом примере запрещена индексация двух директорий сайта, это папки: cgi-bib и папка download. Нужно помнить, что нужно писать каждую директорию
с новой строчки, а не подряд, пример неправильного написания: «Disallow: /cgi-bin/ /download/»
Строчка User-agent: * означает, что это относится ко всем поисковым роботам, но можно и указать самому поисковых роботов, которые должны соблюдать
эти правила, например User-agent: GOOGLE BOT
Строчка Disallow: /cgi-bin/ запрещяет от индексации папку cgi-bin, которая находится у вас на сервере

Если вы хотите полностью запретить свой сайт от индексации поисковыми роботами, напишите в файле robots.txt следующий код:
User-agent: *
Disallow: /
Это полностью запретит индексировать ваш сайт, и относится это будет ко всем поисковым роботам.

Противоположный пример предыдущему, здесь мы разрешаем индексировать сайт любому роботу:
User-agent: *
Disallow:
Или вы можете просто создать пустой файл robots.txt, это тоже будет означать, что поисковые роботы могут индексировать ваш сайт без запретов и ограничений.

В этом примере показано как разрешить индексацию сайта одному роботу и запретить всем остальным роботам:
User-agent: Rambler
Disallow:

User-agent: *
Disallow: /
Здесь мы разрешили индексацию сайта, только одному поисковому роботу, это Rambler (www.rambler.ru)

Если вам нужно запретить в индексации определенные файлы, например страничку aboume.htm или passwords.html и.т.п,для этого воспользуйтесь следующим кодом:
User-agent: *
Disallow: /aboutme.htm
Disallow: /passwords.html
Disallow: /icq.txt
Здесь мы запретили к индексации три файла, это: aboutme.htm, passwords.html, icq.txt, вы можете указать больше файлов

В самом начале я говорил, что индексацией своего сайта можно управлять через специальные META тэги, пора о них поговорить. Итак, существуйте два атрибута META тэга,
которые за это отвечают, это NOFOLLOW и NOINDEX. Рассмотрите два примеры с применением META тэгов.

В этом случае документ не будет проиндексирован. Напомню эту строчку надо вставлять в свою страничку, вы можете указывать для каждой странички свои значения META тэгов.


Данная страничка будет проиндексирована поисковым роботом, но он не будет переходить по ссылкам, которые находятся на этой странички.
На этом все, думаю вы разберетесь с этим файлом! Удачи!
Download
\\\\\\\///////

--------------------------------------------------------------------------------------------------

--------------------------------------------------------



 (голосов: 1)


 
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

Комментарии (0)

Распечатать



 Другие новости по теме
  • Spider Log Analyser v2.0
  • FAQ по вопросам раскрутки сайта
  • Принципы оптимизации сайта
  • Секреты индексации динамических страниц в поисковых системах
  • Page Promouter v.7.4

  •   Информация

    Посетители, находящиеся в группе Гости, не могут оставлять комментарии в данной новости.



     
    Он-Лайн
      Сейчас на сайте:
    Пользователей: 1
    Fastt

    Роботов: 1
    Yandex

    Гостей: 3
    Всех: 5

    20ка посетивших:
    Пользователей: 20
    antoha1231 arsenal10010
    Bigest_Group eva2003
    fhbhjasdg folis
    grandmasterbit8 greencapital
    hisopolko167 kungfupanda1
    leokom58 lepilo1
    mozilla_pro robosoft4
    ruspostprost86 sidewiki130
    TheBlackAngel udpr0Manager
    volchok2 yarik4136

     
    Интересные сайты
     
     
    Опрос
     
    Как вам наш сайт?

    Отлично
    Не плохо
    Понравился
    Не очень
    Ужасный
     
    Сервисы
     
    Cервис Reggun.ru
     
    Друзья
     
    У вас есть интересный сайт?
    пусть о нем знают другие,
    Предлогаю обмнен
    ссылками,пишем заявку:
    Email: Admin{@}stilys.ru
    ________________
     
    Статистика
    Rambler's Top100
    Рейтинг@Mail.ru
     

    Администрация сайта не несет ответственности за выложенные на сайте материалы!
    При распространении новостей ссылка на данный сайт обязательна.
    WWW.STILYS.RU