204 Commits (dde44645559484f2857d6cb1a8da101837718e31)
 

Autor SHA1 Mensaje Fecha
  JustAnotherArchivist dde4464555 Cover two more rare URLs hace 3 años
  JustAnotherArchivist bbf2d2c315 Be more lenient regarding slashes to catch things with collapsed URLs in paths etc. hace 3 años
  JustAnotherArchivist 362f66eb26 Handle youtube-nocookie.com and fix removenonyt mode not recognising CC domains hace 3 años
  JustAnotherArchivist 81e2b4b999 Refine patterns hace 3 años
  JustAnotherArchivist 9974d4613c Stop trying to rewrite patterns for percent encoding hace 3 años
  JustAnotherArchivist 0ee83bc0f2 Refactor hace 3 años
  JustAnotherArchivist b66260ca94 Add youtube-extract hace 3 años
  JustAnotherArchivist d82dff8b71 Add ETA column hace 3 años
  JustAnotherArchivist 01274e461a Prevent constantly moving bytes around for better performance on large chunked records hace 3 años
  JustAnotherArchivist 77d9f61de0 Colourise output hace 3 años
  JustAnotherArchivist 6512669cfd Refactor and compare file list as well hace 3 años
  JustAnotherArchivist 8e0cb30d0a Add atdash mode hace 3 años
  JustAnotherArchivist 5fe595d71c Record wrapper script in meta WARC as well hace 3 años
  JustAnotherArchivist c1def0e7a8 Fix S3_WITH_LIST_URLS being defined (but empty) when --with-list-urls is not used hace 3 años
  JustAnotherArchivist 398cbfdcda Add s3-bucket-list-qwarc, rewritten s3-bucket-list on top of qwarc hace 3 años
  JustAnotherArchivist 80084e0d35 Another alternative and performance/memory comparison hace 3 años
  JustAnotherArchivist 6a288a6338 Use grep instead, which is faster but uses more memory hace 3 años
  JustAnotherArchivist 4d274e64e0 Add dedupe hace 3 años
  JustAnotherArchivist a4af8e6ca6 Add IE6 UA hace 3 años
  JustAnotherArchivist ac277437a3 Add Googlebot UA hace 3 años
  JustAnotherArchivist 0181e53f01 Treat NXDOMAIN and no A/AAAA record errors as ok hace 3 años
  JustAnotherArchivist 41c2a9d2d4 Add support for alternative xmlns hace 3 años
  JustAnotherArchivist 830e9dbc43 Treat redirects as successful retrievals hace 3 años
  JustAnotherArchivist 7a999c9b0a Ignore redirects hace 3 años
  JustAnotherArchivist 579d589853 Add a script to extract errors from wpull 2.x logs hace 3 años
  JustAnotherArchivist d60948e90f Verbosity hace 3 años
  JustAnotherArchivist a9a4792854 Fix server validation hace 3 años
  JustAnotherArchivist 57e2e26d80 Support multi-file uploads hace 3 años
  JustAnotherArchivist 02c967f608 Add gofile.io download script hace 3 años
  JustAnotherArchivist a83d28d08e Add WARC/1.1 support hace 3 años
  JustAnotherArchivist ba2f7db380 Merge warc-peek repository into little-things hace 3 años
  JustAnotherArchivist 79fc113467 Merge kill-wpull-connections repository into little-things hace 3 años
  JustAnotherArchivist b4bb9babac Switch to HTTPS hace 3 años
  JustAnotherArchivist 9f3c7b3ca8 Support negative filter values for date columns as relative to the current datetime hace 3 años
  JustAnotherArchivist c7151efc3e Add script for checking whether a file on transfer.notkiska.pw was archived correctly with AB hace 3 años
  JustAnotherArchivist 4c90bacaed Shield values in colons with angled brackets hace 3 años
  JustAnotherArchivist f51adccd3f Add --meta mode for dump-responses which prefixes each line with information about the file and record hace 3 años
  JustAnotherArchivist 9cc1f41917 Pass the filename in NewFile events hace 3 años
  JustAnotherArchivist a38efc31b6 Introduce a way to provide additional arguments to processors hace 3 años
  JustAnotherArchivist ecf667884b Fix deb file URLs hace 3 años
  JustAnotherArchivist 1e5fbedcef Fix log message going to stdout hace 3 años
  JustAnotherArchivist 3a2cea1980 Add script for recursing over Debian repos hace 3 años
  JustAnotherArchivist 4f12f73b57 Refactor filtering and add --pyfilter hace 3 años
  JustAnotherArchivist 785f13ece8 Add --replace-{concurrency,delay} hace 3 años
  JustAnotherArchivist 5067c406b2 Fix errors on invalid filter or sort values hace 3 años
  JustAnotherArchivist 7e2befc827 +x hace 3 años
  JustAnotherArchivist 49376db51b Decode HTTP request bodies hace 3 años
  JustAnotherArchivist 171ca4252b Disable truncation when stdout is not a terminal hace 4 años
  JustAnotherArchivist 9763370976 Truncate URLs by default to fit the terminal width hace 4 años
  JustAnotherArchivist 1bc1487ecc Add script for extracting remaining wpull 2 queue hace 4 años