Piano.cat
    • Categories
    • Recent
    • Tags
    • Popular
    • World
    • Users
    • Groups
    • Register
    • Login
    1. Principal
    2. Tags
    3. scraping
    Log in to post

    • All categories
    • spla@mastodont.catS
      Els de codeberg diuen que els robots xafarders de les IA ja està aprenent com esquivar ràpidament la protecció d'Anubis:
      Uncategorized
      •
      botsxafarders scraping
      0
      Votes
      1
      Posts
      5
      Views

      No one has replied

    • spla@mastodont.catS
      El robot DotBot era l'únic que seguia intentant "escrapejar" mastodont.cat i dic intentant perquè l'estava bloquejant.
      Uncategorized
      •

      botsxafarders scraping
      0
      Votes
      4
      Posts
      11
      Views
      caelumtangi@mastodont.catC
    • spla@mastodont.catS
      Bon dia!
      Uncategorized
      •

      botsxafarders scraping manteniment
      0
      Votes
      3
      Posts
      20
      Views
      spla@mastodont.catS
    • spla@mastodont.catS
      Amb un petit programa Python, estic desant en una base de dades tota la informació dels logs de nginx des del primer dia en aquest servidor actual.
      Uncategorized
      •

      botsxafarders scraping
      0
      Votes
      5
      Posts
      21
      Views
      spla@mastodont.catS
    • spla@mastodont.catS
      Fins a 658 diferents IP del robot d'Apple (Applebot/0.1; +http://www.apple.com/go/applebot) estan llistades en el log de nginx però no intenten xafardejar ni tuts, ni enllaços ni res, només miren robots.txt a veure si tenen permís per fer-ho.
      Uncategorized
      •
      scraping
      0
      Votes
      1
      Posts
      2
      Views

      No one has replied

    • spla@mastodont.catS
      Al bot de #Amazon no li preocupa gens que l'estigui bloquejant en cada intent que fa, ell segueix al mateix ritme.
      Uncategorized
      •

      amazon scraping botsxafarders
      0
      Votes
      14
      Posts
      35
      Views
      spla@mastodont.catS
    • spla@mastodont.catS
      Bé, per ara ho deixo aquí, tinc la informació prou gràfica de les xafarderies dels robots com ara el de Amazon que intenten obtenir tuts, enllaços, avatars, capçaleres etc de mastodont.cat.
      Uncategorized
      •
      scraping
      0
      Votes
      1
      Posts
      2
      Views

      No one has replied

    • spla@mastodont.catS
      És més fàcil mirar una gràfica que filtrar logs per veure quants robots han intentat xafardejar mastodont.cat.
      Uncategorized
      •

      scraping
      0
      Votes
      5
      Posts
      7
      Views
      spla@mastodont.catS
    • spla@mastodont.catS
      #Amazon és el bot més agressiu a l'hora xafardejar mastodont.cat:
      Uncategorized
      •

      amazon scraping
      0
      Votes
      9
      Posts
      28
      Views
      4n0n1m8@mastodont.cat4
    • spla@mastodont.catS
      Molts tuts denunciant l'scrapping de #Meta però el bot que fa l'scrapping més agressiu és el de Amazon:
      Uncategorized
      •

      meta scraping
      0
      Votes
      5
      Posts
      19
      Views
      spla@mastodont.catS
    • spla@mastodont.catS
      Per el que estic veient hi ha dos patrons:
      Uncategorized
      •
      meta scraping
      0
      Votes
      1
      Posts
      9
      Views

      No one has replied

    • spla@mastodont.catS
      El bot de Amazon ha fet peticions a mastodont.cat des de 433 IP diferents, això només avui:
      Uncategorized
      •
      scraping manteniment
      0
      Votes
      1
      Posts
      8
      Views

      No one has replied