79 Commits (e6008eb9717577b8582fa8fccacd73765f50d768)
 

Autor SHA1 Mensaje Fecha
  JustAnotherArchivist e6008eb971 Add script for automatic social media discovery hace 4 años
  JustAnotherArchivist fed66542fa Support python3 in any directory instead of just /usr/bin hace 4 años
  JustAnotherArchivist 5982e131a4 Stop gracefully when encountering a SIGPIPE hace 4 años
  JustAnotherArchivist c13a1150df Add support for WARC/1.1 hace 4 años
  JustAnotherArchivist 376cde7b8c Fix broken block digest calculation on malformed HTTP responses hace 4 años
  JustAnotherArchivist b121cbd958 Write all log messages to stderr hace 4 años
  JustAnotherArchivist ed1270d988 Add support for upper-cased chunk lengths hace 4 años
  JustAnotherArchivist d4826abde2 Add record ID to log messages hace 4 años
  JustAnotherArchivist 4925a912c0 Add youtube-filter-autogen-channels hace 4 años
  JustAnotherArchivist 9b8f223776 Add wiki-sections-sort hace 4 años
  JustAnotherArchivist 552a4147c2 Fix not returning complete body for non-chunked responses hace 4 años
  JustAnotherArchivist 0dc0de6b50 Add support for lists hace 4 años
  JustAnotherArchivist 9d344df8c6 +x hace 4 años
  JustAnotherArchivist f6a7cbfc70 Fix --with-list-urls help message hace 4 años
  JustAnotherArchivist 9743aa7c35 Add s3-bucket-list hace 4 años
  JustAnotherArchivist 91adce786f Add YouTube normalisation script hace 4 años
  JustAnotherArchivist 5ca90c3b7d Update tmux session commands hace 4 años
  JustAnotherArchivist 679923d37d Add support for Twitter hashtag extraction hace 4 años
  JustAnotherArchivist 663383830c Add support for lists hace 4 años
  JustAnotherArchivist d85d142def Handle parameters on Twitter URLs hace 5 años
  JustAnotherArchivist 5984565417 Handle Twitter URLs with trailing slash hace 5 años
  JustAnotherArchivist 8647ccaa8f Support subdomain-less Facebook URLs hace 5 años
  JustAnotherArchivist 66ec0c93c4 Handle more Facebook URLs hace 5 años
  JustAnotherArchivist baa8a566bd Add script for scraping MEP links from europarl.europa.eu hace 5 años
  JustAnotherArchivist c2413b2c4f Add ArchiveBot wiki list helper hace 5 años
  JustAnotherArchivist 72818019bc Extract external links from Twitter hace 5 años
  JustAnotherArchivist b262d893da Silence by default hace 5 años
  JustAnotherArchivist 6fb9587a2b More flexible normalisation hace 5 años
  JustAnotherArchivist 06be216f4c Print Instagram ignore immediately after upload instead of at the end hace 5 años
  JustAnotherArchivist 1be4ed829b Add helper for AB/chromebot-ing YouTube channels and users hace 5 años
  JustAnotherArchivist 2a7a4ea6dc Fix HTTPS handling hace 5 años
  JustAnotherArchivist a812cb5fc2 More snscrape helper tools hace 5 años
  JustAnotherArchivist 3ee3ffc340 Generate commands for Blogspot hace 5 años
  JustAnotherArchivist 5090a8ad02 Enumerate users on a Mastodon instance hace 5 años
  JustAnotherArchivist 0000d8ffd9 Add script to queue derive on IA hace 5 años
  JustAnotherArchivist 6dc711c54e Further helper scripts for snscrape: normalising usernames and extracting them from a list of URLs hace 5 años
  JustAnotherArchivist e3a37455ba Add uniqify hace 5 años
  JustAnotherArchivist 321067819c Proper script for tracking size of uploaded data hace 5 años
  JustAnotherArchivist 5c654cb16b Split out size formatting hace 5 años
  JustAnotherArchivist de2cdc0aae curl with ArchiveBot UA hace 5 años
  JustAnotherArchivist 89ccd68b59 Helper tools for snscrape and the wiki pages hace 5 años
  JustAnotherArchivist f2e836d2e9 Add support for differently formatted digests hace 5 años
  JustAnotherArchivist 94c4f76570 Fix crash when a digest is missing from a record hace 5 años
  JustAnotherArchivist ef78a3318c Colour only the header field names but not the values hace 5 años
  JustAnotherArchivist 9ce4653094 Document colouring and usage hace 5 años
  JustAnotherArchivist e7c5d82254 Coloured WARCs?! hace 5 años
  JustAnotherArchivist 70b413f5c1 Better events: include raw WARC header data and separate HTTP requests into headers and body hace 5 años
  JustAnotherArchivist 641bc7a207 Fix infinite loop at end of WARC hace 5 años
  JustAnotherArchivist a700e8e2fe Add tcp-closer command hace 5 años
  JustAnotherArchivist 859c75a591 Add tool for WARC verification and extraction hace 5 años