Cabecera

Como proteger tu blog del robo de contenidos via feed

web scrapperDesde hace algún tiempo venía observando que el contenido de mi blog estaba siendo sistemáticamente copiado punto por punto y yendo a parar a ciertos blogs que no voy a nombrar para no darles publicidad. No es algo que padezca solo yo, me consta que plagian contenido de muchos sitios y lo hacen de manera completamente automatizada, mediante el uso de web scrapers y extrayendo el contenido directamente del feed de los blogs que copian.

Esto evidentemente me molesta bastante por dos motivos.

  • Por un lado, las posibles implicaciones de cara a Google que pueda tener el plagio, como la penalización por contenido duplicado o llegar a posicionar en peor lugar tu entrada original que la copia en el blog “pirata”. ¿Cómo puede ser esto? Ay amigos, a veces Google actúa de manera incomprensible, pero mas de uno ha comprobado en sus propias carnes la certeza de esto. Mas de una y mas de dos veces Google ha llegado a indexar antes al que plagia que al autor de la entrada original, penalizando a este último como si fuera el ladrón.
  • Generalmente estos sitios construidos con blog scrapers están hechos exclusivamente para ganar dinero, no son mas que una serie de entradas robadas y un montón de banners de publicidad que van dejando dinero a sus dueños sin necesidad de esfuerzo alguno. Y sinceramente me fastidia sobremanera que alguien pueda ganar dinero, aunque solo sea un miserable céntimo, a costa de algo que ni siquiera me han pedido permiso para utilizar.

Se ha hablado en infinidad de sitios sobre qué se debe hacer cuando alguien hace copy & paste de tu contenido, consejos que en sus distintas variantes acaban convergiendo todos en dos soluciones posibles, ponerte en contacto con el personaje que copia tus contenidos para pedirle amablemente que deje de hacerlo o bien denunciar si lo primero no funciona. A mi sinceramente me parece que ambas soluciones no conducen a nada en la mayor parte de las ocasiones. En respuesta a mis mensajes me he topado con personajes y contestaciones de toda clase. Los que piden perdón y retiran la copia son los menos, mientras que la mayoría directamente se han reído de mi, me han llegado a insultar o incluso han hecho oídos sordos de mis quejas y han seguido copiando impunemente. Por supuesto denunciar en estos casos lo descarto completamente, el coste es desproporcionado en comparación con la ganancia obtenida, además de que tendrías que pasarte media vida en juzgados.

Así que he llegado a la conclusión de que impedir el plagio en Internet es poco menos que imposible hoy por hoy, el copy & paste manual está la orden del día y el automatizado cada vez se utiliza mas. Asumiendo que es una realidad que está ahí, quienes estén suscritos al feed de Xeduced habrán apreciado en las ultimas dos semanas que ahora al final de cada entrada aparecen un par de enlaces nuevos, uno que apunta directamente a Xeduced.com y el otro a la entrada original.

De esta manera, quien copie íntegramente el contenido a través del feed, no solo estará copiando cada una de las entradas, si no los dos enlaces que las acompañan. Dentro de lo malo, al menos gano dos enlaces entrantes a mi blog y aumento la probabilidad de que la copia quede relegada al pozo del olvido de Google ;)

Para hacer esto, en Wordpress puedes utilizar cualquiera de los plugins que existen para añadir un pie HTML a las entradas del feed. Algunos ejemplos de este tipo de plugins son RSS Signature, Feed Footer y RSS Footer. Aunque inicialmente opté por uno de estos plugins, al final he conseguido implementar de manera bastante sencilla la misma funcionalidad directamente en el código de Wordpress sin necesidad de usar ninguno. Otro día os cuento cómo para no extender la entrada mas..

Por cierto, desde que implementé este sistema he observado que un par de sitios que plagiaban el contenido del blog a través del feed, han dejado de hacerlo ;)

Bitacoras.com Meneame del.icio.us Apezz TwitThis Facebook StumbleUpon Technorati Google MySpace

También puedes seguir el contenido de este blog vía RSS o recibir los artículos en tu correo electrónico, rellenando el formulario que encontrarás en la barra lateral izquierda.

26 Comentarios. El siguiente tiene premio ;)

  1. Comentario por Xoxe
    Diciembre 8, 2008 @ 12:13 am
    1

    Desde luego suscribo tu opinión en este artículo así como comparto la frustración de estas tácticas fraudulentas con evidente falta de respeto a todos nosotros. Muy bien expresado!

  2. Comentario por senovilla
    Diciembre 8, 2008 @ 12:16 am
    2

    Que se basen en tus post para hacer uno propio es normal, pero que te copien todo con pelos y comas, es horroroso.

    Está muy bien lo de poner los dos enlaces en el feed.

    Saludos Cordiales.

  3. Comentario por Xoxe
    Diciembre 8, 2008 @ 12:28 am
    3

    De todas maneras, aun basándose en un post yo ya lo consideraría una falta de respeto y un robo el hecho de no mostrar la fuente original de tal manera como cualquier estudio o libro pone la fuente bibliográfica de la fuente de información, parece que cueste dinero poner la fuente original o basado en…

  4. Comentario por Dondado
    Diciembre 8, 2008 @ 1:24 am
    4

    Y si además te roban imágenes te pueden llegar incluso a costar dinero. Aquí algunas sugerencias para tratar el hotlinking

  5. Comentario por Public Enemy
    Diciembre 8, 2008 @ 2:38 am
    5

    @Xoxe: Normalmente a esa gente le da igual que sea falta de respeto o como queramos llamarlo. Después de todo lo único que buscan es sacar dinero fácil y para eso no hay escrúpulos.

    @Senovilla: Si, eso es precisamente lo que me cabrea, que no se dignen a cambiar ni una coma y sea una copia exacta.

    @Dondado: Cierto, lo del Hotlinking es muy importante especialmente si tu factura de Hosting depende del tráfico consumido.

  6. Comentario por Intruso
    Diciembre 8, 2008 @ 11:01 am
    6

    Genial tio, asi se hace, por lo menos que pidan permiso, es lo minimo, es una buena opcion para evitar contenido duplicado que te afecte a ti directamente, si señor.

  7. Comentario por Rubén
    Diciembre 8, 2008 @ 11:38 am
    7

    Para casos extremos como el tuyo, yo sugeriría otra posible solución: en el mismo panel de administración de Wordpress. En

    Opciones / Lectura / Mostrar cada entrada en el feed

    hay la posibilidad de determinar que la entrada del feed sea completa o que solo sea un sumario de la misma. Si se marca esta última opción (yo en este momento lo he configurado así) el lector habitual del feed lee el primer párrafo y si le interesa entonces accede a la entradas original para verla completa y posiblemente comentarla. Creo que con este sistema todo el mundo gana. El lector habitual muchas veces le basta el primer párrafo del feed para saber si le interesa o no seguir leyendo. El dueño del Blog gana más entradas al mismo de sus propios lectores a través del feed – incluida la posibilidad de que sean buenos y te regalen con un clic a la publicidad que tengas dentro del mismo :) – Y el ladrón vía feed lo tiene algo más difícil.

    No sé qué pensáis al respecto, es otra sugerencia para estos casos.

  8. Comentario por jose87
    Diciembre 8, 2008 @ 12:10 pm
    8

    Me da mucha rabia cuando encuentro a alguien que copia contenido y no pone referencias ni nada por el estilo, es muy fácil copiar y pegar, ya he tenido varios casos y es que no se puede hacer prácticamente nada, siguen a lo suyo.

  9. Comentario por Lucía
    Diciembre 8, 2008 @ 12:48 pm
    9

    Grandes consejos!!

    Cuando expliques como implementarlo en el código sin un plugin intentaré añadirlo a la nueva plantilla.

  10. Comentario por gruncho
    Diciembre 8, 2008 @ 3:25 pm
    10

    Que bien me va a venir esto del RSS Footer.. ! ya ves que si. Gracias !

  11. Comentario por Visitas Web
    Diciembre 8, 2008 @ 11:03 pm
    11

    Me parece una buena solución, además se pueden incluir enlaces a artículos propios del blog o al index con algunas palabras clave. Además de mejorar el posicionamiento de esos artículos, los que copien te estarán enlazando… y no solo eso, también sabremos cuando nos están copiando.
    Otra cosa importante que yo hago:
    Una vez publicado un post, lo primero que hago es enviar el sitemap a Google y pings a technorati y GoogleblogSearch.

    Un saludo.

  12. Comentario por MikeM
    Diciembre 9, 2008 @ 1:36 pm
    12

    Cago en tó!! Ya se me ha jodido el invento!!

    Ahora ya no te puedo copiar!!

    XD

    Muy buena idea lo de los enlaces, habrá que utilizarlo. Saludos!!

  13. Comentario por Public Enemy
    Diciembre 9, 2008 @ 2:36 pm
    13

    @Intruso: Sip, precisamente eso es lo que mas me interesa remediar.
    @Rubén: Es cierto que cortar los feeds eliminaría el problema, pero ya hubo un debate sobre ello hace tiempo y resulta una medida bastante impopular. La gente que se suscribe normalmente lo hace para no pasar por el blog y prefiero dejarlo así.
    @jose87: Es cierto, saben que pueden hacerlo impunemente y juegan con eso.
    @Lucia: Cuenta con ella ;)
    @Gruncho: No hay de qué ;)
    @Visitas Web: Yo lo último que comentas no suelo hacerlo, pero normalmente el bot de Google me visita rápido así que no temo en ese sentido.
    @MikeM: Ajo y agua xD Me alegro que te gustase el invento, saludos amigo ;)

  14. Comentario por komoloves
    Diciembre 11, 2008 @ 1:54 pm
    14

    Muchas gracias por la info, a mi me pasa lo mismo, tenía pendiente ponerme con el tema con algunas cosillas. Me pondré y tendré en cuenta tu post.
    Saludos.

  15. Comentario por Sharma
    Diciembre 15, 2008 @ 12:31 am
    15

    Muy buena información, si no te molesta me gustaría publicarlo en mi blog, mencionando tu autoría y dejando el link a tu web claro

  16. Comentario por tRaCk3r
    Diciembre 15, 2008 @ 10:44 am
    16

    Crea una clase CSS llamada por ejemplo “hide” y entre las palabras del post, rellena con palabras malsonantes o aleatorias, insultos o lo que quieras usando la clase.

    En tu web, define la clase hide para que el texto no se muestre.. tal vez poniendo el color de texto igual al del fondo.

    Si se hace copy/paste, seguro que no van a copiar el CSS con lo que a ellos se les verán las palabras “hide”.

    Sería algo así:

    En un lugar puta madrede la caca culo pedo pismancha…

  17. Comentario por ozutto
    Diciembre 20, 2008 @ 1:43 pm
    17

    a mi tambien me pasa con un par de sitios que estan montados asi de forma automatica, les he escrito a los dos, uno no me respondio y el otro me dijo en tono sarcastico algo asi como ¿tu es que no bajas musica de internet?, … no me cague en sus muertos porque no soy de esos asi que empece a buscar y tome la misma solucion que tu, lo lei en dondado hace ya tiempo, y casi todos mis post llevan un enlace a mi blog de nuevo o dos de forma que genere alli enlaces entrantes hacia mi, y google no me penalice el mio por duplicado, … es una putada tener que ponerse asi, pero es que copian letra por letra.

  18. 18

    [...] Como proteger tu blog del robo de contenidos via feed. [Xeduced] [...]

  19. Pingback por Gu
    Enero 3, 2009 @ 12:33 am
    19

    [...] Como proteger tu blog del robo de contenidos via feed [...]

  20. Pingback por III) Promoci
    Enero 7, 2009 @ 11:34 pm
    20

    [...] Como proteger tu blog del robo de contenidos via feed [...]

  21. Comentario por tonyescalante
    Enero 15, 2009 @ 12:09 pm
    21

    ¿Alguien sabe como proteger el blog ante ataques que lo cuelguen?

  22. Comentario por Lille Skvat
    Enero 24, 2009 @ 9:23 pm
    22

    Excelente información y muy útil. Muchas gracias.

  23. Comentario por juan sierra
    Marzo 9, 2009 @ 10:16 am
    23

    la verdad que no me haria mucha gracia encontrarme con el duplicado de mi contenido, sin permiso alguno, pero en fin , como dices “es lo que hay”, tenemos dos opciones aguantarnos y hacernos de la vista gorda, o simplemente abandonar nuestros blogs,yo sufri en mis carnes el plagio de un blog gracias al copy paste pero en fin q se le va a hacer, q ganen nidero a conta mia en fin… mientras q ami no me lo quiten no es algo q me quite el sueño

  24. Comentario por Esteban
    Junio 27, 2009 @ 5:56 pm
    24

    la verdad recien me acaba de llegar un monton de mensajes de un sitio que copio me feed de meses por completo, con punto y coma :S entre a buscar en la red y encontre este articulo muy bueno.
    saludos y espero que google se de cuenta de quienes son realmente las fuentes originales…

  25. Comentario por Nico
    Septiembre 26, 2009 @ 11:31 am
    25

    Gran Post,
    Seguro que esto del robo de contenido es un tema complejo y muy difícil de que algún día se pueda solucionar. Y creo que la opción de incluir una firma al pie del feed, es una de las mejores ideas para implementar. Por cierto, ¿Ya has publicado un post para explicar cómo agregar dicha firma a los feed “sin tener que utilizar un plugin”?
    Lo he buscado por todo tu blog (usando tu buscador) y nada. No lo encuentro. ¿Nos podrías decir cómo hacerlo? Sin duda te lo agradeceríamos un montón.

    Un saludo ;)

  26. Comentario por Reina
    Octubre 7, 2009 @ 2:21 pm
    26

    ¡¡¡A mi me lo vas a contar!!! Menuda pesadilla!! Cda vez que escribo una entrada es sistemáticamente copiada; llegó a copiarme (bueno parecido) el blog entero, utiizando mi identidad. Las peticiones de retirar las copias las ignora por completo; es más cuanto más insistes, peor porque en ese caso insulta amenaza, etc… Google “pasa”; es más yo no puedo entrar en los foros de google a denunciar el blog!!!!!!

    Acorté mis feed, he implantado un anti-copy… Da igual, sigue haciéndolo!!!

    ¿Me podrías decir si hay un código así para Blogger?

    Muchas gracias. :) Reina

Deja un comentario