fbpx

Qué es Contenido duplicado y 7 formas de evitarlo

El contenido duplicado es un término de SEO y significa que el mismo contenido aparece en varios lugares en un sitio web o en Internet. En este artículo discutimos ¿Qué es exactamente el contenido duplicado y que importancia tiene para el SEO?

Además debes sabe que el contenido duplicado puede presentarse en muchas formas, por lo que debes aprender a identificarlo para poder solucionarlo correctamente.

¿Qué es el contenido duplicado?

Contenido duplicado, o «contenido duplicado» en holandés, significa que 2 o más páginas web son idénticas o casi idénticas en contenido en 1 sitio web en particular o en sitios diferentes. La siguiente figura lo aclara visualmente.

¿Por qué el contenido duplicado es un problema de SEO?

El contenido duplicado puede causar problemas de SEO. Para Google, solo la página web original tiene valor; sus copias no generan ningún valor añadido. Entonces esas páginas duplicadas contaminan el índice de Google.

Si el motor de búsqueda encuentra grandes cantidades de contenido duplicado en un sitio web (por ejemplo, miles de búsquedas internas), existe una posibilidad real de que ya no rastree esas páginas para su indexación, con el resultado de que las páginas más profundas (como la mucho más páginas de productos más importantes) no se rastrearán.

Antes de la actualización de Google Panda era la opinión común de que el contenido duplicado solo podía dañar las páginas en cuestión y no era realmente un problema de SEO.

contenido duplicado

Después de la entrega de Panda, el contenido duplicado puede afectar a todo un sitio web, incluido el contenido no duplicado. Así que ya no es un problema aislado.

¿Qué sucede si los backlinks externos, destinados a una página web específica, se dividen en diferentes URL? Pues que el valor del enlace también se divide.

Si ese es el caso, por ejemplo, para la página de inicio (ver también el punto 4.1.), la página más importante de un sitio, entonces esto es negativo para todo el SEO del sitio web.

Tipos de contenido duplicado

Contenido duplicado real

Estas son páginas web que son 100% idénticas en contenido a otra página.

Contenido casi duplicado

Estas son páginas web que difieren solo ligeramente de otra página. El mismo Google habla de bloques sustanciales que son bastante similares, pero deja abierto lo que es sustancial.

Contenido duplicado externo

Estas son páginas web que son casi o 100% idénticas al contenido de otros sitios web. En la mayoría de los casos, Google verá qué sitio publicó la página web original y penalizará al otro sitio.

4. ¿Causas del contenido duplicado?

A menudo, el contenido duplicado se crea simplemente… por accidente y no pretende ser engañoso. Los siguientes ejemplos lo aclaran.

www versus no-www

Este debe ser probablemente la mayor causa de páginas duplicadas. En este caso tanto las páginas con www como las que no son www están indexadas. Por ejemplo, indexan ambas páginas de esta manera.

  • https://bimsoluciones.com
  • https://bimsoluciones.com

Canonicals – Url final /T

técnicamente, una URL con / final es diferente a una URL sin / , por ejemplo:

  • https://bimsoluciones.com/blog
  • https://bimsoluciones.com/blog/

Solía ​​​​ser un problema mayor que hoy en día, ya que la mayoría de los motores de búsqueda ahora agregan / ellos mismos y consideran que ambas URL son iguales.

Sin embargo, puedes aprender más sobre las urls canónicas haciendo clic aquí.

https pagina web segura con certificado SSL

El estándar actual es que un sitio web es https, ya que se trata de un sitio seguro con certificado SSL. aun así, existe la posibilidad de que las páginas https y http se indexen accidentalmente al mismo tiempo.

seguridad-online-certificado-SSL

Por ejemplo:

  • https://bimsoluciones.com
  • https://bimsoluciones.com

Sitio web de prueba

En este caso, el contenido duplicado surge tan pronto como se desarrolla un nuevo sitio web ‘en construcción’. Esto generalmente sucede bajo una nueva URL, como https://enconstruccion.bimsoluciones.com

Pero a menudo sucede que los desarrolladores se olvidan de bloquear el sitio en construcción de los rastreadores después de la puesta en marcha, y como resultado se indexan las páginas tanto del sitio en construcción como del sitio renovado

Por ejemplo:

  • https://bimsoluciones.com
  • http://enconstruccion.bimsoluciones.com

Resultados de la búsqueda interna

Este tipo de contenido duplicado se origina por las búsquedas internas que los visitantes ingresan en un sitio web. Estas páginas de búsqueda no tienen contenido único, solo fragmentos de otras URL

Por ejemplo:

  • https://bimsoluciones.com/blog?=que+es+marketing+digital
  • https://bimsoluciones.com/blog?categorias=SEO?page=2

Aunque el resultado varía según la URL, el problema se debe a que las metas principales de las páginas (como la etiqueta del título, el encabezado, la meta descripción) son siempre las mismas.

Parámetros y filtros

El sitio web hace que el mismo contenido esté disponible aquí a través de diferentes URL agregando una ID de sesión y otros parámetros de URL.

La identificación de la sesión se usa para brindarle a un cliente en una tienda web una experiencia más personal, como el contenido del carrito de compras o las opciones de filtro

Algunos ejemplos:

  • Duplicados de afiliados: https://bimsoluciones.com vs https://bimsoluciones.com?affiliate=12345
  • identificadores de sesión: https://bimsoluciones.com frente a https://bimsoluciones.com?session=12345
  • duplicados de productos: https://bimsoluciones.com/categoria/producto/rojo vs https://bimsoluciones.com/categoria/producto/azul
  • duplicados internacionales: https://bimsoluciones.com/ vs https://www.bimsoluciones.ec

Variantes del producto

Amenudo ocurre en tiendas web que el contenido duplicado surge de que muchos artículos de productos solo difieren entre sí en términos de color, por ejemplo

sitio web con 4 artículos: un polo blanco, rojo, azul y verde, entonces hay 4 URL toda la información en las 4 URL es casi la misma, excepto probablemente la foto, que muestra los distintos colores. Entonces para el motor de búsqueda esas 4 URL son casi idénticas entre sí.

Contenido copiado

Es contenido que se copia intencionalmente de otros sitios web, con o sin permiso del propietario del contenido. Y en caso de que tengas permiso, debes saber que el mismo contenido también está disponible en otros lugares de Internet en 1 o más versiones, que el contenido copiado a menudo no aparece en los resultados de búsqueda y que deberías vincular de nuevo a la fuente original.

En caso de que la copia sea sin permiso se recomienda que no hagas esto, no es legal. Además, corre el riesgo de que Google elimine todo tu sitio web de los resultados de búsqueda si la investigación muestra que existen prácticas engañosas de plagio de contenido.

¿Cómo saber si hay contenido duplicado en tu sitio web?

Con las herramientas a continuación, puedes descubrir contenido duplicado en un sitio.

Consola de búsqueda de Google

Vea la sección Formato de búsqueda de sus Herramientas para webmasters de Google y haz clic en Mejoras de HTML. Haz clic en Descripciones duplicadas en etiquetas meta y Etiquetas de título duplicadas para determinar dónde tiene textos duplicados.

Comando Site de Google

Otra herramienta práctica es el propio sitio de Google con el comando Site. Si deseas averiguar si, por ejemplo, una determinada página de destino contiene duplicados, puede colocar el siguiente comando en la barra de búsqueda:

Herramientas en línea

Las herramientas en línea, como 1text.com , también son útiles para detectar textos duplicado.

Herramientas en línea para evitar contenido duplicado

7 Formas de evitar el contenido duplicado

Bien, ahora que sabemos qué es el contenido duplicado y cómo descubrirlo, obviamente queremos solucionarlo. Esto es posible con las siguientes técnicas.

1. Redirigir 301

Las páginas, tanto para los visitantes como para los rastreadores, se pueden mover permanentemente a otra ubicación a través de la redirección 301. Entonces, cuando un visitante llega a la URL1 (la página vieja o mala), es redirigido a través del 301 a la nueva y mejor URL2.

2. Eliminar 404

La solución más simple es eliminar el contenido duplicado y devolver una página de error 404. Si el contenido realmente no tiene valor en términos de tráfico de búsqueda y enlaces, entonces esta es una solución correcta.

3. etiqueta canónica

Si se puede acceder al contenido único a través de varias URL, la URL preferida debe revelarse al motor de búsqueda. Esto se puede hacer usando la llamada etiqueta canónica (cuando ambas URL deben permanecer operativas), vea el ejemplo a continuación. Esto le dice a Google que asigne el valor del enlace a la mejor página original.

<head>
   <link rel="canonical" href="http://www.paginaweb.com" />
</head>

4. Robots.txt

Otra opción es dejar las páginas duplicadas accesibles para los visitantes en línea, pero bloquearlas para que no puedan rastrear arañas a través del archivo robots.txt .

5. Etiqueta de metarobots

Una mejor solución para el SEO es diciendo a los motores de búsqueda que no rastreen e indexen una página web en particular. Esto puede hacerse a través de la siguiente etiqueta:

<head>
   <meta name="robots" content="noindex, nofollow" />
</head>

A través de la etiqueta meta robots, puedes eliminar las URL que ya están en el índice de ese índice. Entonces, el código le dice a los motores de búsqueda «hola, dejen de indexar esta URL».

6. Consola de búsqueda de parámetros de URL

Puedes administrar los parámetros de URL a través de «parámetros de URL» en (la sección anterior de) Google Search Console. Allí puedes decirle a Google cómo manejar ciertos parámetros.

7. Contenido único

Los motores de búsqueda prefieren que los sitios web ofrezcan contenido único y relevante a sus visitantes en línea. La forma más sencilla de evitar el contenido duplicado es escribir contenido original por ti mismo. Si descubres textos duplicados en su sitio web, vuelve a escribir el contenido hasta que sea 100% original.

Resumiendo

En la mayoría de los casos, el contenido duplicado se crea inconscientemente y puede tener un impacto negativo en las posiciones de SEO de un sitio web. Utilice las herramientas y soluciones de diagnóstico de este artículo y prohíba el contenido duplicado de su sitio.


¿Quieres hacer crecer tu negocio con marketing digital con una página web diseñada a tu medida? En BIM Soluciones te ofrecemos planes a la medida de tus necesidades, para más información puedes consultar nuestras ofertas.

Si estás interesado en consultoría de SEO y marketing digital en QuitoEcuador o el resto de Latinoamérica, estamos para ayudarte. ¡Contacta ya uno de nuestros asesores!

Abrir chat