JustAnotherArchivist
93e4140295
Add support for malformed LF HTTP responses
1 рік тому
JustAnotherArchivist
9879db1195
Proper HTTP/1.0 support
HTTP/1.0 does not mandate a Content-Length header in responses since keep-alive connections aren't a thing; the connection closure then signals the end of the response.
This change requires the URL metadata line for processing HTTP/1.0 data, so it plays well with `warc-dump-responses --meta`.
1 рік тому
JustAnotherArchivist
a1e2e26a3f
Fix warning
1 рік тому
JustAnotherArchivist
2163d745fd
Fix warning
1 рік тому
JustAnotherArchivist
ccafb1eb51
Only search within headers
1 рік тому
JustAnotherArchivist
427884af5e
Fix warnings
1 рік тому
JustAnotherArchivist
38d8be57f2
Warnings are bad, mmkay?
1 рік тому
JustAnotherArchivist
b644d3f454
Rebuild when .make-and-exec changes
1 рік тому
JustAnotherArchivist
448e624b65
Fix UB in memcasemem when no match is found
1 рік тому
JustAnotherArchivist
90616b0d5f
Improve debug compilation options
1 рік тому
JustAnotherArchivist
887c063533
Add support for non-standard header capitalisation
1 рік тому
JustAnotherArchivist
af25c108ba
Add support for HTTP 1.0
1 рік тому
JustAnotherArchivist
6bc6c13427
Get rid of Makefile for more control; add proper debug build support
1 рік тому
JustAnotherArchivist
06d8155a10
Fix --no-derive and --clobber options not working for single-part uploads
1 рік тому
JustAnotherArchivist
ebfc78ef3a
More retries on item existence check
1 рік тому
JustAnotherArchivist
62cee00ebe
Upload files smaller than a single part without using the multipart API
1 рік тому
JustAnotherArchivist
3db8841ed1
Clear line before completion message of progress bar
1 рік тому
JustAnotherArchivist
edf1dd417c
Add timeouts
1 рік тому
JustAnotherArchivist
0933c2adc0
Print progress less frequently
1 рік тому
JustAnotherArchivist
69c718a2b2
Not-so-new new ArchiveBot domain
1 рік тому
JustAnotherArchivist
337896958a
Add support for IA_S3_{ACCESS,SECRET} environment variables
1 рік тому
JustAnotherArchivist
5a8bab3a01
Fix negative ints
1 рік тому
JustAnotherArchivist
232a430946
Fix single-file torrents
1 рік тому
JustAnotherArchivist
568cf9ade6
Add files mode
1 рік тому
JustAnotherArchivist
3b0201cdeb
Fix infohash
1 рік тому
JustAnotherArchivist
1977b237e5
Fix random BrokenPipeError on exiting Python processes
Just catching the BrokenPipeError is not sufficient. There might still be data in the stdout buffer, which then causes the following error when Python shuts down and flushes it:
Exception ignored in: <_io.TextIOWrapper name='<stdout>' mode='w' encoding='utf-8'>
BrokenPipeError: [Errno 32] Broken pipe
To handle this, redirect stdout to /dev/null in the exception handler before exiting: https://docs.python.org/3.11/library/signal.html#note-on-sigpipe
1 рік тому
JustAnotherArchivist
e3380e6e2a
Fix 'binary' lines
1 рік тому
JustAnotherArchivist
2d4546f274
Fix errors on sscanf
%n takes a signed int so is incompatible with size_t; further, sscanf could in theory return a negative value (EOF).
1 рік тому
JustAnotherArchivist
8d2b04c56f
Add torrent-tiny
1 рік тому
JustAnotherArchivist
5eae0c45c2
Add header mode (e.g. for tasks API)
1 рік тому
JustAnotherArchivist
0f8a22f035
Add curl-ia
1 рік тому
JustAnotherArchivist
c9bf3a93af
Filter out lines without an attribute value
1 рік тому
JustAnotherArchivist
98ebc667f2
Silence BrokenPipeError
1 рік тому
JustAnotherArchivist
511405bbca
Fix case sensitivity on img srcset processing
1 рік тому
JustAnotherArchivist
6acea5d6eb
Add html-extract-stupid
1 рік тому
JustAnotherArchivist
3440da3f9a
Fix output sometimes appearing after prompt
1 рік тому
JustAnotherArchivist
75999e969c
Make --name a normal mode
1 рік тому
JustAnotherArchivist
9c1f803e13
Get rid of shell quoting and print name/fullname on separate lines instead
1 рік тому
JustAnotherArchivist
5ba7d26621
Fix error when no arguments are provided
1 рік тому
JustAnotherArchivist
ea27e35b90
Add optional username and fullname extraction
1 рік тому
JustAnotherArchivist
65a47d5091
Fix header matches potentially occurring in the record body
1 рік тому
JustAnotherArchivist
10c7ab0889
Fix off-by-one error for non-chunked responses
1 рік тому
JustAnotherArchivist
761606a5be
Add options to pass the URL context out through warc-dump-responses and http-response-bodies
1 рік тому
JustAnotherArchivist
9228c23ae6
Fix off-by-one error on WARC-Type parsing
1 рік тому
JustAnotherArchivist
a79291e081
Fix debug output for small/empty buffer
1 рік тому
JustAnotherArchivist
1737842841
Add http-response-bodies
1 рік тому
JustAnotherArchivist
9d60d7d3d7
Add comment about spec compliance
1 рік тому
JustAnotherArchivist
2e579964f9
More debug output
1 рік тому
JustAnotherArchivist
a432631d9b
Replace memmove with pointer arithmetic
1 рік тому
JustAnotherArchivist
27950fdc52
Check state at the input end
1 рік тому