Piano.cat
    • Categories
    • Recent
    • Tags
    • Popular
    • World
    • Users
    • Groups
    • Register
    • Login
    1. Principal
    2. Uncategorized
    3. #Amazon és el bot més agressiu a l'hora xafardejar mastodont.cat:
    This topic has been deleted. Only users with topic management privileges can see it.
    • spla@mastodont.catS spla@mastodont.cat

      #Amazon és el bot més agressiu a l'hora xafardejar mastodont.cat:

      spla@mastodont.catS spla@mastodont.cat

      #Amazon és el bot més agressiu xafardejant mastodont.cat en un dia

      cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" |wc -l
      18473

      18.473 "escrapejades" en total, principalment enllaços a mitjans externs però:

      cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" | grep "/@" | wc -l
      907
      o sigui, 907 intents d'obtenir tuts de diversos usuaris.

      cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" | grep "/tags" | wc -l
      271 -> tuts d'etiquetes

      #scraping

        0
        Offline spla@mastodont.cat •
        , last edited by spla@mastodont.cat
      • caelumtangi@mastodont.catC caelumtangi@mastodont.cat
        caelumtangi@mastodont.catC caelumtangi@mastodont.cat

        @spla fem una etiqueta exclusivament per aquest bot, i l' insultem! 😅

          0
          Offline caelumtangi@mastodont.cat •
          , last edited by
        • spla@mastodont.catS spla@mastodont.cat
          spla@mastodont.catS spla@mastodont.cat

          @Caelumtangi 😅

            0
            Offline spla@mastodont.cat •
            , last edited by
          • spla@mastodont.catS spla@mastodont.cat
            spla@mastodont.catS spla@mastodont.cat

            Des de les 7 de la tarda d'ahir, #fail2ban està bloquejant automàticament totes les IPs de bots xafarders, no només Amazonbot. Ara mateix ja ha bloquejat un total de 1.171 IP, bloqueig actiu de 327.
            Edito: cap robot obté res de mastodont.cat, només "veuen" que s'ha interromput la connexió gràcies a una configuració específica de nginx (el programari que serveix continguts).

            #scraping #BotsXafarders

            Link Preview Image
              0
              Offline spla@mastodont.cat •
              , last edited by spla@mastodont.cat
            • maquinari_cat@mastodon.socialM maquinari_cat@mastodon.social
              maquinari_cat@mastodon.socialM maquinari_cat@mastodon.social

              @spla Repassa la rotació de logs, no sigui que de tant bloquejar t'ompli el disc de porquería 😀

                0
                Offline maquinari_cat@mastodon.social •
                , last edited by
              • spla@mastodont.catS spla@mastodont.cat
                spla@mastodont.catS spla@mastodont.cat

                @maquinari_cat és automàtica des de sempre 💪

                  0
                  Offline spla@mastodont.cat •
                  , last edited by
                • worr@mastodont.catW worr@mastodont.cat
                  worr@mastodont.catW worr@mastodont.cat

                  @spla Has pensat en Anubis per bloquejar els bots? Diferents projects de FOSS l'ha trobat molt efectiu

                  (i una nota: es diu "scraping," no "scrapping." "scrapping" vol dir una cosa completament diferent)

                    0
                    Offline worr@mastodont.cat •
                    , last edited by
                  • spla@mastodont.catS spla@mastodont.cat
                    spla@mastodont.catS spla@mastodont.cat

                    @worr vaig estar mirant Anubis però no sé com s'integraria amb un servidor Mastodon, no crec que agradi massa veure la pàgina de verificació d'Anubis abans de veure el contingut que es vol.
                    Gràcies per la correcció a "scraping"!

                      0
                      Offline spla@mastodont.cat •
                      , last edited by spla@mastodont.cat
                    • 4n0n1m8@mastodont.cat4 4n0n1m8@mastodont.cat
                      4n0n1m8@mastodont.cat4 4n0n1m8@mastodont.cat

                      @spla

                        0
                        Offline 4n0n1m8@mastodont.cat •
                        , last edited by
                      Loading More Posts
                      • Oldest to Newest
                      • Newest to Oldest
                      • Most Votes
                      Reply
                      • Reply as topic
                      Log in to reply
                      • First post
                        Last post