¿Cómo le digo motores de búsqueda no indexar el contenido a través de los nombres de dominio secundarios?

StackOverflow https://stackoverflow.com/questions/3498491

Pregunta

Tengo un sitio web en a.com (por ejemplo). También tengo un par de nombres de dominio que no estoy utilizando para cualquier cosa: b.com y c.com. Actualmente reenvían a a.com. Me he dado cuenta de que Google indexa el contenido de un sitio web mediante b.com/stuff y c.com/stuff, no sólo a.com/stuff. Lo que es la forma correcta de decirle a Google a indexar el contenido solamente a través de a.com, no b.com y c.com?

Parece como si una redirección 301 a través de htaccess es la mejor solución, pero no estoy seguro de cómo hacer eso. No es sólo el archivo .htaccess (cada dominio no tiene su propio archivo .htaccess).

b.com y c.com no están destinados a ser alias de a.com, no son más que otros nombres de dominio que estoy reservando para posibles proyectos futuros.

¿Fue útil?

Solución

Usted simplemente puede crear una redirección con un archivo .htaccess como esto:

RewriteEngine on
RewriteCond %{HTTP_HOST} \.b\.com$ [OR]
RewriteCond %{HTTP_HOST} \.c\.com$
RewriteRule ^(.*)$ http://a.com/$1 [R=301,L]

Otros consejos

robots.txt es la manera de saber lo que las arañas a gatear y qué no rastreo. Si ponemos la siguiente en la raíz de su sitio en /robots.txt:

User-agent: *
Disallow: /

Una araña bien comportado no buscará cualquier parte de su sitio. La mayoría de los sitios de gran tamaño tienen un robots.txt, como google

User-agent: *
Disallow: /search
Disallow: /groups
Disallow: /images
Disallow: /news
#and so on ...

Es más o menos depende de lo que quiere lograr. 301 dirán que el contenido se mueve de forma permanente (y es la forma correcta de transferir PR), es esto lo que quiere lograr?

¿Quieres Google comportarse? De lo que puede utilizar robots.txt, pero tenga en cuenta hay un inconveniente: este archivo es legible desde el exterior y cada vez que se encuentra en el mismo lugar, por lo que, básicamente, regala la ubicación de los directorios y archivos que es posible que desee proteger. Por lo tanto el uso de robots.txt sólo si no hay nada digno de ser protegido.

Si hay algo digno de ser protegido de lo que debe proteger con contraseña el directorio, esto sería la forma correcta. Google no contraseña protegida índice de directorios.

http://support.google.com/webmasters/ bin / answer.py? hl = es & answer = 93708

En el último método depende de si desea utilizar el archivo httpd.conf o .htaccess. La mejor manera será utilizar httpd.conf, incluso si .htaccess parece más fácil.

http://httpd.apache.org/docs/2.0/howto/ auth.html

Haga que su código del lado del servidor genera una referencia canónica que apuntan a que la página sea considerada "fuente". Ejemplo =

Referencia: http://googlewebmastercentral.blogspot.com/2009/02/specify-your -canonical.html - Actualización:.-Tag este enlace está también apoyada por Ask.com, Microsoft Live Search y Yahoo

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top