Cómo eliminar contenido de Google de forma orgánica
Seguro que alguna vez os habéis visto en la tesitura de que una página de vuestra web deja de existir.
Lo normal es que, tras eliminarla, la página comience a responder con un código 404: Not found.
Cuando Google vuelva a crawlear la web, se encontrará con un código 404 y volverá a crawlearla cuando crea necesario.
¿Por qué vuelve a crawlearla? Pues sencillo: un código 404 puede pasar por equivocación y ser temporal.
Tras unas cuantas pasadas devolviendo un error 404, Google la eliminará de su índice.
Desindexar una URL que ha dejado de existir
Desde el punto de vista del usuario, encontrarse con un 404 no es tampoco lo más ideal. Una opción que se suele realizar es redireccionar la página eliminada a una página similar o a la home.
Por ejemplo, si la URL que ha dejado de existir es un producto, podemos redireccionar la página eliminada a un producto similar o a la categoría del producto, de forma que el usuario no estará totalmente perdido.
En caso de que no tengamos ninguna URL relacionada o no queramos relacionarla, podemos hacer una redirección a la home de nuestra web.
Nota: Es importante que la redirección sea permanente (código 301) y no temporal (código 302).
Desindexar una URL que ha sido indexada involuntariamente
A veces, Google encuentra URLs hacia nuestra web que nunca pretendimos indexar: páginas lorem ipsum, enlaces muy antiguos, etc.
En estos casos, realizar una redirección 301 terminaría también eliminando nuestra URL del índice de Google tras varios crawleos. Sin embargo, hay una forma mucho más rápida de eliminar esta URL de forma orgánica:
Utilizar el código 410 para marcar una URL como eliminada
En lugar de una redirección 301 o un código 404, Google recomienda utilizar el código 410 para marcar una URL como eliminada voluntariamente.
Aunque a medio-largo plazo, un código 404 y un código 410 tienen el mismo efecto (ambos terminan desindexando una URL), el código 410 tiene un efecto mucho más rápido que el resto.