]> git.cworth.org Git - gzip/blob - gzip.c
Avoid creating an undersized buffer for the hufts table.
[gzip] / gzip.c
1 /* gzip (GNU zip) -- compress files with zip algorithm and 'compress' interface
2
3    Copyright (C) 1999, 2001, 2002, 2006, 2007 Free Software Foundation, Inc.
4    Copyright (C) 1992-1993 Jean-loup Gailly
5
6    This program is free software; you can redistribute it and/or modify
7    it under the terms of the GNU General Public License as published by
8    the Free Software Foundation; either version 2, or (at your option)
9    any later version.
10
11    This program is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14    GNU General Public License for more details.
15
16    You should have received a copy of the GNU General Public License
17    along with this program; if not, write to the Free Software Foundation,
18    Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.  */
19
20 /*
21  * The unzip code was written and put in the public domain by Mark Adler.
22  * Portions of the lzw code are derived from the public domain 'compress'
23  * written by Spencer Thomas, Joe Orost, James Woods, Jim McKie, Steve Davies,
24  * Ken Turkowski, Dave Mack and Peter Jannesen.
25  *
26  * See the license_msg below and the file COPYING for the software license.
27  * See the file algorithm.doc for the compression algorithms and file formats.
28  */
29
30 static char  *license_msg[] = {
31 "Copyright (C) 2007 Free Software Foundation, Inc.",
32 "Copyright (C) 1993 Jean-loup Gailly.",
33 "This is free software.  You may redistribute copies of it under the terms of",
34 "the GNU General Public License <http://www.gnu.org/licenses/gpl.html>.",
35 "There is NO WARRANTY, to the extent permitted by law.",
36 0};
37
38 /* Compress files with zip algorithm and 'compress' interface.
39  * See help() function below for all options.
40  * Outputs:
41  *        file.gz:   compressed file with same mode, owner, and utimes
42  *     or stdout with -c option or if stdin used as input.
43  * If the output file name had to be truncated, the original name is kept
44  * in the compressed file.
45  * On MSDOS, file.tmp -> file.tmz. On VMS, file.tmp -> file.tmp-gz.
46  *
47  * Using gz on MSDOS would create too many file name conflicts. For
48  * example, foo.txt -> foo.tgz (.tgz must be reserved as shorthand for
49  * tar.gz). Similarly, foo.dir and foo.doc would both be mapped to foo.dgz.
50  * I also considered 12345678.txt -> 12345txt.gz but this truncates the name
51  * too heavily. There is no ideal solution given the MSDOS 8+3 limitation.
52  *
53  * For the meaning of all compilation flags, see comments in Makefile.in.
54  */
55
56 #ifdef RCSID
57 static char rcsid[] = "$Id: gzip.c,v 1.16 2007/03/20 05:09:51 eggert Exp $";
58 #endif
59
60 #include <config.h>
61 #include <ctype.h>
62 #include <sys/types.h>
63 #include <signal.h>
64 #include <sys/stat.h>
65 #include <errno.h>
66
67 #include "tailor.h"
68 #include "gzip.h"
69 #include "lzw.h"
70 #include "revision.h"
71
72 #include "fcntl-safer.h"
73 #include "getopt.h"
74 #include "stat-time.h"
75
76                 /* configuration */
77
78 #ifdef HAVE_FCNTL_H
79 #  include <fcntl.h>
80 #endif
81
82 #ifdef HAVE_LIMITS_H
83 #  include <limits.h>
84 #endif
85
86 #ifdef HAVE_UNISTD_H
87 #  include <unistd.h>
88 #endif
89
90 #if defined STDC_HEADERS || defined HAVE_STDLIB_H
91 #  include <stdlib.h>
92 #else
93    extern int errno;
94 #endif
95
96 #ifndef NO_DIR
97 # define NO_DIR 0
98 #endif
99 #if !NO_DIR
100 # include <dirent.h>
101 # ifndef _D_EXACT_NAMLEN
102 #  define _D_EXACT_NAMLEN(dp) strlen ((dp)->d_name)
103 # endif
104 #endif
105
106 #ifdef CLOSEDIR_VOID
107 # define CLOSEDIR(d) (closedir(d), 0)
108 #else
109 # define CLOSEDIR(d) closedir(d)
110 #endif
111
112 #ifndef NO_UTIME
113 #  include <utimens.h>
114 #endif
115
116 #define RW_USER (S_IRUSR | S_IWUSR)  /* creation mode for open() */
117
118 #ifndef MAX_PATH_LEN
119 #  define MAX_PATH_LEN   1024 /* max pathname length */
120 #endif
121
122 #ifndef SEEK_END
123 #  define SEEK_END 2
124 #endif
125
126 #ifndef CHAR_BIT
127 #  define CHAR_BIT 8
128 #endif
129
130 #ifdef off_t
131   off_t lseek OF((int fd, off_t offset, int whence));
132 #endif
133
134 #ifndef OFF_T_MIN
135 #define OFF_T_MIN (~ (off_t) 0 << (sizeof (off_t) * CHAR_BIT - 1))
136 #endif
137
138 #ifndef OFF_T_MAX
139 #define OFF_T_MAX (~ (off_t) 0 - OFF_T_MIN)
140 #endif
141
142 /* Use SA_NOCLDSTOP as a proxy for whether the sigaction machinery is
143    present.  */
144 #ifndef SA_NOCLDSTOP
145 # define SA_NOCLDSTOP 0
146 # define sigprocmask(how, set, oset) /* empty */
147 # define sigset_t int
148 # if ! HAVE_SIGINTERRUPT
149 #  define siginterrupt(sig, flag) /* empty */
150 # endif
151 #endif
152
153 #ifndef HAVE_WORKING_O_NOFOLLOW
154 # define HAVE_WORKING_O_NOFOLLOW 0
155 #endif
156
157 #ifndef ELOOP
158 # define ELOOP EINVAL
159 #endif
160
161 /* Separator for file name parts (see shorten_name()) */
162 #ifdef NO_MULTIPLE_DOTS
163 #  define PART_SEP "-"
164 #else
165 #  define PART_SEP "."
166 #endif
167
168                 /* global buffers */
169
170 DECLARE(uch, inbuf,  INBUFSIZ +INBUF_EXTRA);
171 DECLARE(uch, outbuf, OUTBUFSIZ+OUTBUF_EXTRA);
172 DECLARE(ush, d_buf,  DIST_BUFSIZE);
173 DECLARE(uch, window, 2L*WSIZE);
174 #ifndef MAXSEG_64K
175     DECLARE(ush, tab_prefix, 1L<<BITS);
176 #else
177     DECLARE(ush, tab_prefix0, 1L<<(BITS-1));
178     DECLARE(ush, tab_prefix1, 1L<<(BITS-1));
179 #endif
180
181                 /* local variables */
182
183 int ascii = 0;        /* convert end-of-lines to local OS conventions */
184 int to_stdout = 0;    /* output to stdout (-c) */
185 int decompress = 0;   /* decompress (-d) */
186 int force = 0;        /* don't ask questions, compress links (-f) */
187 int no_name = -1;     /* don't save or restore the original file name */
188 int no_time = -1;     /* don't save or restore the original file time */
189 int recursive = 0;    /* recurse through directories (-r) */
190 int list = 0;         /* list the file contents (-l) */
191 int verbose = 0;      /* be verbose (-v) */
192 int quiet = 0;        /* be very quiet (-q) */
193 int do_lzw = 0;       /* generate output compatible with old compress (-Z) */
194 int test = 0;         /* test .gz file integrity */
195 int foreground = 0;   /* set if program run in foreground */
196 char *program_name;   /* program name */
197 int maxbits = BITS;   /* max bits per code for LZW */
198 int method = DEFLATED;/* compression method */
199 int level = 6;        /* compression level */
200 int exit_code = OK;   /* program exit code */
201 int save_orig_name;   /* set if original name must be saved */
202 int last_member;      /* set for .zip and .Z files */
203 int part_nb;          /* number of parts in .gz file */
204 struct timespec time_stamp; /* original time stamp (modification time) */
205 off_t ifile_size;      /* input file size, -1 for devices (debug only) */
206 char *env;            /* contents of GZIP env variable */
207 char **args = NULL;   /* argv pointer if GZIP env variable defined */
208 char *z_suffix;       /* default suffix (can be set with --suffix) */
209 size_t z_len;         /* strlen(z_suffix) */
210
211 /* The set of signals that are caught.  */
212 static sigset_t caught_signals;
213
214 /* If nonzero then exit with status WARNING, rather than with the usual
215    signal status, on receipt of a signal with this value.  This
216    suppresses a "Broken Pipe" message with some shells.  */
217 static int volatile exiting_signal;
218
219 /* If nonnegative, close this file descriptor and unlink ofname on error.  */
220 static int volatile remove_ofname_fd = -1;
221
222 off_t bytes_in;             /* number of input bytes */
223 off_t bytes_out;            /* number of output bytes */
224 off_t total_in;             /* input bytes for all files */
225 off_t total_out;            /* output bytes for all files */
226 char ifname[MAX_PATH_LEN]; /* input file name */
227 char ofname[MAX_PATH_LEN]; /* output file name */
228 struct stat istat;         /* status for input file */
229 int  ifd;                  /* input file descriptor */
230 int  ofd;                  /* output file descriptor */
231 unsigned insize;           /* valid bytes in inbuf */
232 unsigned inptr;            /* index of next byte to be processed in inbuf */
233 unsigned outcnt;           /* bytes in output buffer */
234 int rsync = 0;             /* make ryncable chunks */
235
236 static int handled_sig[] =
237   {
238     /* SIGINT must be first, as 'foreground' depends on it.  */
239     SIGINT
240
241 #ifdef SIGHUP
242     , SIGHUP
243 #endif
244 #ifdef SIGPIPE
245     , SIGPIPE
246 #else
247 # define SIGPIPE 0
248 #endif
249 #ifdef SIGTERM
250     , SIGTERM
251 #endif
252 #ifdef SIGXCPU
253     , SIGXCPU
254 #endif
255 #ifdef SIGXFSZ
256     , SIGXFSZ
257 #endif
258   };
259
260 struct option longopts[] =
261 {
262  /* { name  has_arg  *flag  val } */
263     {"ascii",      0, 0, 'a'}, /* ascii text mode */
264     {"to-stdout",  0, 0, 'c'}, /* write output on standard output */
265     {"stdout",     0, 0, 'c'}, /* write output on standard output */
266     {"decompress", 0, 0, 'd'}, /* decompress */
267     {"uncompress", 0, 0, 'd'}, /* decompress */
268  /* {"encrypt",    0, 0, 'e'},    encrypt */
269     {"force",      0, 0, 'f'}, /* force overwrite of output file */
270     {"help",       0, 0, 'h'}, /* give help */
271  /* {"pkzip",      0, 0, 'k'},    force output in pkzip format */
272     {"list",       0, 0, 'l'}, /* list .gz file contents */
273     {"license",    0, 0, 'L'}, /* display software license */
274     {"no-name",    0, 0, 'n'}, /* don't save or restore original name & time */
275     {"name",       0, 0, 'N'}, /* save or restore original name & time */
276     {"quiet",      0, 0, 'q'}, /* quiet mode */
277     {"silent",     0, 0, 'q'}, /* quiet mode */
278     {"recursive",  0, 0, 'r'}, /* recurse through directories */
279     {"suffix",     1, 0, 'S'}, /* use given suffix instead of .gz */
280     {"test",       0, 0, 't'}, /* test compressed file integrity */
281     {"no-time",    0, 0, 'T'}, /* don't save or restore the time stamp */
282     {"verbose",    0, 0, 'v'}, /* verbose mode */
283     {"version",    0, 0, 'V'}, /* display version number */
284     {"fast",       0, 0, '1'}, /* compress faster */
285     {"best",       0, 0, '9'}, /* compress better */
286     {"lzw",        0, 0, 'Z'}, /* make output compatible with old compress */
287     {"bits",       1, 0, 'b'}, /* max number of bits per code (implies -Z) */
288     {"rsyncable",  0, 0, 'R'}, /* make rsync-friendly archive */
289     { 0, 0, 0, 0 }
290 };
291
292 /* local functions */
293
294 local void try_help     OF((void)) ATTRIBUTE_NORETURN;
295 local void help         OF((void));
296 local void license      OF((void));
297 local void version      OF((void));
298 local int input_eof     OF((void));
299 local void treat_stdin  OF((void));
300 local void treat_file   OF((char *iname));
301 local int create_outfile OF((void));
302 local char *get_suffix  OF((char *name));
303 local int  open_input_file OF((char *iname, struct stat *sbuf));
304 local int  make_ofname  OF((void));
305 local void shorten_name  OF((char *name));
306 local int  get_method   OF((int in));
307 local void do_list      OF((int ifd, int method));
308 local int  check_ofname OF((void));
309 local void copy_stat    OF((struct stat *ifstat));
310 local void install_signal_handlers OF((void));
311 local void remove_output_file OF((void));
312 local RETSIGTYPE abort_gzip_signal OF((int));
313 local void do_exit      OF((int exitcode)) ATTRIBUTE_NORETURN;
314       int main          OF((int argc, char **argv));
315 int (*work) OF((int infile, int outfile)) = zip; /* function to call */
316
317 #if ! NO_DIR
318 local void treat_dir    OF((int fd, char *dir));
319 #endif
320
321 #define strequ(s1, s2) (strcmp((s1),(s2)) == 0)
322
323 static void
324 try_help ()
325 {
326   fprintf (stderr, "Try `%s --help' for more information.\n",
327            program_name);
328   do_exit (ERROR);
329 }
330
331 /* ======================================================================== */
332 local void help()
333 {
334     static char  *help_msg[] = {
335  "Compress or uncompress FILEs (by default, compress FILES in-place).",
336  "",
337  "Mandatory arguments to long options are mandatory for short options too.",
338  "",
339 #if O_BINARY
340  "  -a, --ascii       ascii text; convert end-of-line using local conventions",
341 #endif
342  "  -c, --stdout      write on standard output, keep original files unchanged",
343  "  -d, --decompress  decompress",
344 /*  -e, --encrypt     encrypt */
345  "  -f, --force       force overwrite of output file and compress links",
346  "  -h, --help        give this help",
347 /*  -k, --pkzip       force output in pkzip format */
348  "  -l, --list        list compressed file contents",
349  "  -L, --license     display software license",
350 #ifdef UNDOCUMENTED
351  "  -m, --no-time     do not save or restore the original modification time",
352  "  -M, --time        save or restore the original modification time",
353 #endif
354  "  -n, --no-name     do not save or restore the original name and time stamp",
355  "  -N, --name        save or restore the original name and time stamp",
356  "  -q, --quiet       suppress all warnings",
357 #if ! NO_DIR
358  "  -r, --recursive   operate recursively on directories",
359 #endif
360  "  -S, --suffix=SUF  use suffix SUF on compressed files",
361  "  -t, --test        test compressed file integrity",
362  "  -v, --verbose     verbose mode",
363  "  -V, --version     display version number",
364  "  -1, --fast        compress faster",
365  "  -9, --best        compress better",
366 #ifdef LZW
367  "  -Z, --lzw         produce output compatible with old compress",
368  "  -b, --bits=BITS   max number of bits per code (implies -Z)",
369 #endif
370  "    --rsyncable   Make rsync-friendly archive",
371  "",
372  "With no FILE, or when FILE is -, read standard input.",
373  "",
374  "Report bugs to <bug-gzip@gnu.org>.",
375   0};
376     char **p = help_msg;
377
378     printf ("Usage: %s [OPTION]... [FILE]...\n", program_name);
379     while (*p) printf ("%s\n", *p++);
380 }
381
382 /* ======================================================================== */
383 local void license()
384 {
385     char **p = license_msg;
386
387     printf ("%s %s\n", program_name, VERSION);
388     while (*p) printf ("%s\n", *p++);
389 }
390
391 /* ======================================================================== */
392 local void version()
393 {
394     license ();
395     printf ("\n");
396     printf ("Written by Jean-loup Gailly.\n");
397 }
398
399 local void progerror (string)
400     char *string;
401 {
402     int e = errno;
403     fprintf (stderr, "%s: ", program_name);
404     errno = e;
405     perror(string);
406     exit_code = ERROR;
407 }
408
409 /* ======================================================================== */
410 int main (argc, argv)
411     int argc;
412     char **argv;
413 {
414     int file_count;     /* number of files to process */
415     size_t proglen;     /* length of program_name */
416     int optc;           /* current option */
417
418     EXPAND(argc, argv); /* wild card expansion if necessary */
419
420     program_name = gzip_base_name (argv[0]);
421     proglen = strlen (program_name);
422
423     /* Suppress .exe for MSDOS, OS/2 and VMS: */
424     if (4 < proglen && strequ (program_name + proglen - 4, ".exe"))
425       program_name[proglen - 4] = '\0';
426
427     /* Add options in GZIP environment variable if there is one */
428     env = add_envopt(&argc, &argv, OPTIONS_VAR);
429     if (env != NULL) args = argv;
430
431 #ifndef GNU_STANDARD
432 # define GNU_STANDARD 1
433 #endif
434 #if !GNU_STANDARD
435     /* For compatibility with old compress, use program name as an option.
436      * Unless you compile with -DGNU_STANDARD=0, this program will behave as
437      * gzip even if it is invoked under the name gunzip or zcat.
438      *
439      * Systems which do not support links can still use -d or -dc.
440      * Ignore an .exe extension for MSDOS, OS/2 and VMS.
441      */
442     if (strncmp (program_name, "un",  2) == 0     /* ungzip, uncompress */
443         || strncmp (program_name, "gun", 3) == 0) /* gunzip */
444         decompress = 1;
445     else if (strequ (program_name + 1, "cat")     /* zcat, pcat, gcat */
446              || strequ (program_name, "gzcat"))   /* gzcat */
447         decompress = to_stdout = 1;
448 #endif
449
450     z_suffix = Z_SUFFIX;
451     z_len = strlen(z_suffix);
452
453     while ((optc = getopt_long (argc, argv, "ab:cdfhH?lLmMnNqrS:tvVZ123456789",
454                                 longopts, (int *)0)) != -1) {
455         switch (optc) {
456         case 'a':
457             ascii = 1; break;
458         case 'b':
459             maxbits = atoi(optarg);
460             for (; *optarg; optarg++)
461               if (! ('0' <= *optarg && *optarg <= '9'))
462                 {
463                   fprintf (stderr, "%s: -b operand is not an integer\n",
464                            program_name);
465                   try_help ();
466                 }
467             break;
468         case 'c':
469             to_stdout = 1; break;
470         case 'd':
471             decompress = 1; break;
472         case 'f':
473             force++; break;
474         case 'h': case 'H':
475             help(); do_exit(OK); break;
476         case 'l':
477             list = decompress = to_stdout = 1; break;
478         case 'L':
479             license(); do_exit(OK); break;
480         case 'm': /* undocumented, may change later */
481             no_time = 1; break;
482         case 'M': /* undocumented, may change later */
483             no_time = 0; break;
484         case 'n':
485             no_name = no_time = 1; break;
486         case 'N':
487             no_name = no_time = 0; break;
488         case 'q':
489             quiet = 1; verbose = 0; break;
490         case 'r':
491 #if NO_DIR
492             fprintf (stderr, "%s: -r not supported on this system\n",
493                      program_name);
494             try_help ();
495 #else
496             recursive = 1;
497 #endif
498         case 'R':
499             rsync = 1; break;
500
501         case 'S':
502 #ifdef NO_MULTIPLE_DOTS
503             if (*optarg == '.') optarg++;
504 #endif
505             z_len = strlen(optarg);
506             z_suffix = optarg;
507             break;
508         case 't':
509             test = decompress = to_stdout = 1;
510             break;
511         case 'v':
512             verbose++; quiet = 0; break;
513         case 'V':
514             version(); do_exit(OK); break;
515         case 'Z':
516 #ifdef LZW
517             do_lzw = 1; break;
518 #else
519             fprintf(stderr, "%s: -Z not supported in this version\n",
520                     program_name);
521             try_help ();
522             break;
523 #endif
524         case '1':  case '2':  case '3':  case '4':
525         case '5':  case '6':  case '7':  case '8':  case '9':
526             level = optc - '0';
527             break;
528         default:
529             /* Error message already emitted by getopt_long. */
530             try_help ();
531         }
532     } /* loop on all arguments */
533
534     /* By default, save name and timestamp on compression but do not
535      * restore them on decompression.
536      */
537     if (no_time < 0) no_time = decompress;
538     if (no_name < 0) no_name = decompress;
539
540     file_count = argc - optind;
541
542 #if O_BINARY
543 #else
544     if (ascii && !quiet) {
545         fprintf(stderr, "%s: option --ascii ignored on this system\n",
546                 program_name);
547     }
548 #endif
549     if ((z_len == 0 && !decompress) || z_len > MAX_SUFFIX) {
550         fprintf(stderr, "%s: incorrect suffix '%s'\n",
551                 program_name, z_suffix);
552         do_exit(ERROR);
553     }
554     if (do_lzw && !decompress) work = lzw;
555
556     /* Allocate all global buffers (for DYN_ALLOC option) */
557     ALLOC(uch, inbuf,  INBUFSIZ +INBUF_EXTRA);
558     ALLOC(uch, outbuf, OUTBUFSIZ+OUTBUF_EXTRA);
559     ALLOC(ush, d_buf,  DIST_BUFSIZE);
560     ALLOC(uch, window, 2L*WSIZE);
561 #ifndef MAXSEG_64K
562     ALLOC(ush, tab_prefix, 1L<<BITS);
563 #else
564     ALLOC(ush, tab_prefix0, 1L<<(BITS-1));
565     ALLOC(ush, tab_prefix1, 1L<<(BITS-1));
566 #endif
567
568     exiting_signal = quiet ? SIGPIPE : 0;
569     install_signal_handlers ();
570
571     /* And get to work */
572     if (file_count != 0) {
573         if (to_stdout && !test && !list && (!decompress || !ascii)) {
574             SET_BINARY_MODE(fileno(stdout));
575         }
576         while (optind < argc) {
577             treat_file(argv[optind++]);
578         }
579     } else {  /* Standard input */
580         treat_stdin();
581     }
582     if (list && !quiet && file_count > 1) {
583         do_list(-1, -1); /* print totals */
584     }
585     do_exit(exit_code);
586     return exit_code; /* just to avoid lint warning */
587 }
588
589 /* Return nonzero when at end of file on input.  */
590 local int
591 input_eof ()
592 {
593   if (!decompress || last_member)
594     return 1;
595
596   if (inptr == insize)
597     {
598       if (insize != INBUFSIZ || fill_inbuf (1) == EOF)
599         return 1;
600
601       /* Unget the char that fill_inbuf got.  */
602       inptr = 0;
603     }
604
605   return 0;
606 }
607
608 /* ========================================================================
609  * Compress or decompress stdin
610  */
611 local void treat_stdin()
612 {
613     if (!force && !list &&
614         isatty(fileno((FILE *)(decompress ? stdin : stdout)))) {
615         /* Do not send compressed data to the terminal or read it from
616          * the terminal. We get here when user invoked the program
617          * without parameters, so be helpful. According to the GNU standards:
618          *
619          *   If there is one behavior you think is most useful when the output
620          *   is to a terminal, and another that you think is most useful when
621          *   the output is a file or a pipe, then it is usually best to make
622          *   the default behavior the one that is useful with output to a
623          *   terminal, and have an option for the other behavior.
624          *
625          * Here we use the --force option to get the other behavior.
626          */
627         fprintf(stderr,
628     "%s: compressed data not %s a terminal. Use -f to force %scompression.\n",
629                 program_name, decompress ? "read from" : "written to",
630                 decompress ? "de" : "");
631         fprintf (stderr, "For help, type: %s -h\n", program_name);
632         do_exit(ERROR);
633     }
634
635     if (decompress || !ascii) {
636         SET_BINARY_MODE(fileno(stdin));
637     }
638     if (!test && !list && (!decompress || !ascii)) {
639         SET_BINARY_MODE(fileno(stdout));
640     }
641     strcpy(ifname, "stdin");
642     strcpy(ofname, "stdout");
643
644     /* Get the file's time stamp and size.  */
645     if (fstat (fileno (stdin), &istat) != 0)
646       {
647         progerror ("standard input");
648         do_exit (ERROR);
649       }
650     ifile_size = S_ISREG (istat.st_mode) ? istat.st_size : -1;
651     time_stamp.tv_nsec = -1;
652     if (!no_time || list)
653       time_stamp = get_stat_mtime (&istat);
654
655     clear_bufs(); /* clear input and output buffers */
656     to_stdout = 1;
657     part_nb = 0;
658
659     if (decompress) {
660         method = get_method(ifd);
661         if (method < 0) {
662             do_exit(exit_code); /* error message already emitted */
663         }
664     }
665     if (list) {
666         do_list(ifd, method);
667         return;
668     }
669
670     /* Actually do the compression/decompression. Loop over zipped members.
671      */
672     for (;;) {
673         if ((*work)(fileno(stdin), fileno(stdout)) != OK) return;
674
675         if (input_eof ())
676           break;
677
678         method = get_method(ifd);
679         if (method < 0) return; /* error message already emitted */
680         bytes_out = 0;            /* required for length check */
681     }
682
683     if (verbose) {
684         if (test) {
685             fprintf(stderr, " OK\n");
686
687         } else if (!decompress) {
688             display_ratio(bytes_in-(bytes_out-header_bytes), bytes_in, stderr);
689             fprintf(stderr, "\n");
690 #ifdef DISPLAY_STDIN_RATIO
691         } else {
692             display_ratio(bytes_out-(bytes_in-header_bytes), bytes_out,stderr);
693             fprintf(stderr, "\n");
694 #endif
695         }
696     }
697 }
698
699 /* ========================================================================
700  * Compress or decompress the given file
701  */
702 local void treat_file(iname)
703     char *iname;
704 {
705     /* Accept "-" as synonym for stdin */
706     if (strequ(iname, "-")) {
707         int cflag = to_stdout;
708         treat_stdin();
709         to_stdout = cflag;
710         return;
711     }
712
713     /* Check if the input file is present, set ifname and istat: */
714     ifd = open_input_file (iname, &istat);
715     if (ifd < 0)
716       return;
717
718     /* If the input name is that of a directory, recurse or ignore: */
719     if (S_ISDIR(istat.st_mode)) {
720 #if ! NO_DIR
721         if (recursive) {
722             treat_dir (ifd, iname);
723             /* Warning: ifname is now garbage */
724             return;
725         }
726 #endif
727         close (ifd);
728         WARN ((stderr, "%s: %s is a directory -- ignored\n",
729                program_name, ifname));
730         return;
731     }
732
733     if (! to_stdout)
734       {
735         if (! S_ISREG (istat.st_mode))
736           {
737             WARN ((stderr,
738                    "%s: %s is not a directory or a regular file - ignored\n",
739                    program_name, ifname));
740             close (ifd);
741             return;
742           }
743         if (istat.st_mode & S_ISUID)
744           {
745             WARN ((stderr, "%s: %s is set-user-ID on execution - ignored\n",
746                    program_name, ifname));
747             close (ifd);
748             return;
749           }
750         if (istat.st_mode & S_ISGID)
751           {
752             WARN ((stderr, "%s: %s is set-group-ID on execution - ignored\n",
753                    program_name, ifname));
754             close (ifd);
755             return;
756           }
757
758         if (! force)
759           {
760             if (istat.st_mode & S_ISVTX)
761               {
762                 WARN ((stderr,
763                        "%s: %s has the sticky bit set - file ignored\n",
764                        program_name, ifname));
765                 close (ifd);
766                 return;
767               }
768             if (2 <= istat.st_nlink)
769               {
770                 WARN ((stderr, "%s: %s has %lu other link%c -- unchanged\n",
771                        program_name, ifname,
772                        (unsigned long int) istat.st_nlink - 1,
773                        istat.st_nlink == 2 ? ' ' : 's'));
774                 close (ifd);
775                 return;
776               }
777           }
778       }
779
780     ifile_size = S_ISREG (istat.st_mode) ? istat.st_size : -1;
781     time_stamp.tv_nsec = -1;
782     if (!no_time || list)
783       time_stamp = get_stat_mtime (&istat);
784
785     /* Generate output file name. For -r and (-t or -l), skip files
786      * without a valid gzip suffix (check done in make_ofname).
787      */
788     if (to_stdout && !list && !test) {
789         strcpy(ofname, "stdout");
790
791     } else if (make_ofname() != OK) {
792         close (ifd);
793         return;
794     }
795
796     clear_bufs(); /* clear input and output buffers */
797     part_nb = 0;
798
799     if (decompress) {
800         method = get_method(ifd); /* updates ofname if original given */
801         if (method < 0) {
802             close(ifd);
803             return;               /* error message already emitted */
804         }
805     }
806     if (list) {
807         do_list(ifd, method);
808         if (close (ifd) != 0)
809           read_error ();
810         return;
811     }
812
813     /* If compressing to a file, check if ofname is not ambiguous
814      * because the operating system truncates names. Otherwise, generate
815      * a new ofname and save the original name in the compressed file.
816      */
817     if (to_stdout) {
818         ofd = fileno(stdout);
819         /* Keep remove_ofname_fd negative.  */
820     } else {
821         if (create_outfile() != OK) return;
822
823         if (!decompress && save_orig_name && !verbose && !quiet) {
824             fprintf(stderr, "%s: %s compressed to %s\n",
825                     program_name, ifname, ofname);
826         }
827     }
828     /* Keep the name even if not truncated except with --no-name: */
829     if (!save_orig_name) save_orig_name = !no_name;
830
831     if (verbose) {
832         fprintf(stderr, "%s:\t", ifname);
833     }
834
835     /* Actually do the compression/decompression. Loop over zipped members.
836      */
837     for (;;) {
838         if ((*work)(ifd, ofd) != OK) {
839             method = -1; /* force cleanup */
840             break;
841         }
842
843         if (input_eof ())
844           break;
845
846         method = get_method(ifd);
847         if (method < 0) break;    /* error message already emitted */
848         bytes_out = 0;            /* required for length check */
849     }
850
851     if (close (ifd) != 0)
852       read_error ();
853
854     if (!to_stdout)
855       {
856         sigset_t oldset;
857         int unlink_errno;
858
859         copy_stat (&istat);
860         if (close (ofd) != 0)
861           write_error ();
862
863         sigprocmask (SIG_BLOCK, &caught_signals, &oldset);
864         remove_ofname_fd = -1;
865         unlink_errno = xunlink (ifname) == 0 ? 0 : errno;
866         sigprocmask (SIG_SETMASK, &oldset, NULL);
867
868         if (unlink_errno)
869           {
870             WARN ((stderr, "%s: ", program_name));
871             if (!quiet)
872               {
873                 errno = unlink_errno;
874                 perror (ifname);
875               }
876           }
877       }
878
879     if (method == -1) {
880         if (!to_stdout)
881           remove_output_file ();
882         return;
883     }
884
885     /* Display statistics */
886     if(verbose) {
887         if (test) {
888             fprintf(stderr, " OK");
889         } else if (decompress) {
890             display_ratio(bytes_out-(bytes_in-header_bytes), bytes_out,stderr);
891         } else {
892             display_ratio(bytes_in-(bytes_out-header_bytes), bytes_in, stderr);
893         }
894         if (!test && !to_stdout) {
895             fprintf(stderr, " -- replaced with %s", ofname);
896         }
897         fprintf(stderr, "\n");
898     }
899 }
900
901 /* ========================================================================
902  * Create the output file. Return OK or ERROR.
903  * Try several times if necessary to avoid truncating the z_suffix. For
904  * example, do not create a compressed file of name "1234567890123."
905  * Sets save_orig_name to true if the file name has been truncated.
906  * IN assertions: the input file has already been open (ifd is set) and
907  *   ofname has already been updated if there was an original name.
908  * OUT assertions: ifd and ofd are closed in case of error.
909  */
910 local int create_outfile()
911 {
912   int name_shortened = 0;
913   int flags = (O_WRONLY | O_CREAT | O_EXCL
914                | (ascii && decompress ? 0 : O_BINARY));
915
916   for (;;)
917     {
918       int open_errno;
919       sigset_t oldset;
920
921       sigprocmask (SIG_BLOCK, &caught_signals, &oldset);
922       remove_ofname_fd = ofd = OPEN (ofname, flags, RW_USER);
923       open_errno = errno;
924       sigprocmask (SIG_SETMASK, &oldset, NULL);
925
926       if (0 <= ofd)
927         break;
928
929       switch (open_errno)
930         {
931 #ifdef ENAMETOOLONG
932         case ENAMETOOLONG:
933           shorten_name (ofname);
934           name_shortened = 1;
935           break;
936 #endif
937
938         case EEXIST:
939           if (check_ofname () != OK)
940             {
941               close (ifd);
942               return ERROR;
943             }
944           break;
945
946         default:
947           progerror (ofname);
948           close (ifd);
949           return ERROR;
950         }
951     }
952
953   if (name_shortened && decompress)
954     {
955       /* name might be too long if an original name was saved */
956       WARN ((stderr, "%s: %s: warning, name truncated\n",
957              program_name, ofname));
958     }
959
960   return OK;
961 }
962
963 /* ========================================================================
964  * Return a pointer to the 'z' suffix of a file name, or NULL. For all
965  * systems, ".gz", ".z", ".Z", ".taz", ".tgz", "-gz", "-z" and "_z" are
966  * accepted suffixes, in addition to the value of the --suffix option.
967  * ".tgz" is a useful convention for tar.z files on systems limited
968  * to 3 characters extensions. On such systems, ".?z" and ".??z" are
969  * also accepted suffixes. For Unix, we do not want to accept any
970  * .??z suffix as indicating a compressed file; some people use .xyz
971  * to denote volume data.
972  *   On systems allowing multiple versions of the same file (such as VMS),
973  * this function removes any version suffix in the given name.
974  */
975 local char *get_suffix(name)
976     char *name;
977 {
978     int nlen, slen;
979     char suffix[MAX_SUFFIX+3]; /* last chars of name, forced to lower case */
980     static char *known_suffixes[] =
981        {NULL, ".gz", ".z", ".taz", ".tgz", "-gz", "-z", "_z",
982 #ifdef MAX_EXT_CHARS
983           "z",
984 #endif
985           NULL};
986     char **suf = known_suffixes;
987
988     *suf = z_suffix;
989     if (strequ(z_suffix, "z")) suf++; /* check long suffixes first */
990
991 #ifdef SUFFIX_SEP
992     /* strip a version number from the file name */
993     {
994         char *v = strrchr(name, SUFFIX_SEP);
995         if (v != NULL) *v = '\0';
996     }
997 #endif
998     nlen = strlen(name);
999     if (nlen <= MAX_SUFFIX+2) {
1000         strcpy(suffix, name);
1001     } else {
1002         strcpy(suffix, name+nlen-MAX_SUFFIX-2);
1003     }
1004     strlwr(suffix);
1005     slen = strlen(suffix);
1006     do {
1007        int s = strlen(*suf);
1008        if (slen > s && suffix[slen-s-1] != PATH_SEP
1009            && strequ(suffix + slen - s, *suf)) {
1010            return name+nlen-s;
1011        }
1012     } while (*++suf != NULL);
1013
1014     return NULL;
1015 }
1016
1017
1018 /* Open file NAME with the given flags and mode and store its status
1019    into *ST.  Return a file descriptor to the newly opened file, or -1
1020    (setting errno) on failure.  */
1021 static int
1022 open_and_stat (char *name, int flags, mode_t mode, struct stat *st)
1023 {
1024   int fd;
1025
1026   /* Refuse to follow symbolic links unless -c or -f.  */
1027   if (!to_stdout && !force)
1028     {
1029       if (HAVE_WORKING_O_NOFOLLOW)
1030         flags |= O_NOFOLLOW;
1031       else
1032         {
1033 #if HAVE_LSTAT || defined lstat
1034           if (lstat (name, st) != 0)
1035             return -1;
1036           else if (S_ISLNK (st->st_mode))
1037             {
1038               errno = ELOOP;
1039               return -1;
1040             }
1041 #endif
1042         }
1043     }
1044
1045   fd = OPEN (name, flags, mode);
1046   if (0 <= fd && fstat (fd, st) != 0)
1047     {
1048       int e = errno;
1049       close (fd);
1050       errno = e;
1051       return -1;
1052     }
1053   return fd;
1054 }
1055
1056
1057 /* ========================================================================
1058  * Set ifname to the input file name (with a suffix appended if necessary)
1059  * and istat to its stats. For decompression, if no file exists with the
1060  * original name, try adding successively z_suffix, .gz, .z, -z and .Z.
1061  * For MSDOS, we try only z_suffix and z.
1062  * Return an open file descriptor or -1.
1063  */
1064 static int
1065 open_input_file (iname, sbuf)
1066     char *iname;
1067     struct stat *sbuf;
1068 {
1069     int ilen;  /* strlen(ifname) */
1070     int z_suffix_errno = 0;
1071     static char *suffixes[] = {NULL, ".gz", ".z", "-z", ".Z", NULL};
1072     char **suf = suffixes;
1073     char *s;
1074 #ifdef NO_MULTIPLE_DOTS
1075     char *dot; /* pointer to ifname extension, or NULL */
1076 #endif
1077     int fd;
1078     int open_flags = (O_RDONLY | O_NONBLOCK | O_NOCTTY
1079                       | (ascii && !decompress ? 0 : O_BINARY));
1080
1081     *suf = z_suffix;
1082
1083     if (sizeof ifname - 1 <= strlen (iname))
1084         goto name_too_long;
1085
1086     strcpy(ifname, iname);
1087
1088     /* If input file exists, return OK. */
1089     fd = open_and_stat (ifname, open_flags, RW_USER, sbuf);
1090     if (0 <= fd)
1091       return fd;
1092
1093     if (!decompress || errno != ENOENT) {
1094         progerror(ifname);
1095         return -1;
1096     }
1097     /* file.ext doesn't exist, try adding a suffix (after removing any
1098      * version number for VMS).
1099      */
1100     s = get_suffix(ifname);
1101     if (s != NULL) {
1102         progerror(ifname); /* ifname already has z suffix and does not exist */
1103         return -1;
1104     }
1105 #ifdef NO_MULTIPLE_DOTS
1106     dot = strrchr(ifname, '.');
1107     if (dot == NULL) {
1108         strcat(ifname, ".");
1109         dot = strrchr(ifname, '.');
1110     }
1111 #endif
1112     ilen = strlen(ifname);
1113     if (strequ(z_suffix, ".gz")) suf++;
1114
1115     /* Search for all suffixes */
1116     do {
1117         char *s0 = s = *suf;
1118         strcpy (ifname, iname);
1119 #ifdef NO_MULTIPLE_DOTS
1120         if (*s == '.') s++;
1121         if (*dot == '\0') strcpy (dot, ".");
1122 #endif
1123 #ifdef MAX_EXT_CHARS
1124         if (MAX_EXT_CHARS < strlen (s) + strlen (dot + 1))
1125           dot[MAX_EXT_CHARS + 1 - strlen (s)] = '\0';
1126 #endif
1127         if (sizeof ifname <= ilen + strlen (s))
1128           goto name_too_long;
1129         strcat(ifname, s);
1130         fd = open_and_stat (ifname, open_flags, RW_USER, sbuf);
1131         if (0 <= fd)
1132           return fd;
1133         if (errno != ENOENT)
1134           {
1135             progerror (ifname);
1136             return -1;
1137           }
1138         if (strequ (s0, z_suffix))
1139           z_suffix_errno = errno;
1140     } while (*++suf != NULL);
1141
1142     /* No suffix found, complain using z_suffix: */
1143     strcpy(ifname, iname);
1144 #ifdef NO_MULTIPLE_DOTS
1145     if (*dot == '\0') strcpy(dot, ".");
1146 #endif
1147 #ifdef MAX_EXT_CHARS
1148     if (MAX_EXT_CHARS < z_len + strlen (dot + 1))
1149       dot[MAX_EXT_CHARS + 1 - z_len] = '\0';
1150 #endif
1151     strcat(ifname, z_suffix);
1152     errno = z_suffix_errno;
1153     progerror(ifname);
1154     return -1;
1155
1156  name_too_long:
1157     fprintf (stderr, "%s: %s: file name too long\n", program_name, iname);
1158     exit_code = ERROR;
1159     return -1;
1160 }
1161
1162 /* ========================================================================
1163  * Generate ofname given ifname. Return OK, or WARNING if file must be skipped.
1164  * Sets save_orig_name to true if the file name has been truncated.
1165  */
1166 local int make_ofname()
1167 {
1168     char *suff;            /* ofname z suffix */
1169
1170     strcpy(ofname, ifname);
1171     /* strip a version number if any and get the gzip suffix if present: */
1172     suff = get_suffix(ofname);
1173
1174     if (decompress) {
1175         if (suff == NULL) {
1176             /* With -t or -l, try all files (even without .gz suffix)
1177              * except with -r (behave as with just -dr).
1178              */
1179             if (!recursive && (list || test)) return OK;
1180
1181             /* Avoid annoying messages with -r */
1182             if (verbose || (!recursive && !quiet)) {
1183                 WARN((stderr,"%s: %s: unknown suffix -- ignored\n",
1184                       program_name, ifname));
1185             }
1186             return WARNING;
1187         }
1188         /* Make a special case for .tgz and .taz: */
1189         strlwr(suff);
1190         if (strequ(suff, ".tgz") || strequ(suff, ".taz")) {
1191             strcpy(suff, ".tar");
1192         } else {
1193             *suff = '\0'; /* strip the z suffix */
1194         }
1195         /* ofname might be changed later if infile contains an original name */
1196
1197     } else if (suff != NULL) {
1198         /* Avoid annoying messages with -r (see treat_dir()) */
1199         if (verbose || (!recursive && !quiet)) {
1200             /* Don't use WARN, as it affects exit status.  */
1201             fprintf (stderr, "%s: %s already has %s suffix -- unchanged\n",
1202                      program_name, ifname, suff);
1203         }
1204         return WARNING;
1205     } else {
1206         save_orig_name = 0;
1207
1208 #ifdef NO_MULTIPLE_DOTS
1209         suff = strrchr(ofname, '.');
1210         if (suff == NULL) {
1211             if (sizeof ofname <= strlen (ofname) + 1)
1212                 goto name_too_long;
1213             strcat(ofname, ".");
1214 #  ifdef MAX_EXT_CHARS
1215             if (strequ(z_suffix, "z")) {
1216                 if (sizeof ofname <= strlen (ofname) + 2)
1217                     goto name_too_long;
1218                 strcat(ofname, "gz"); /* enough room */
1219                 return OK;
1220             }
1221         /* On the Atari and some versions of MSDOS,
1222          * ENAMETOOLONG does not work correctly.  So we
1223          * must truncate here.
1224          */
1225         } else if (strlen(suff)-1 + z_len > MAX_SUFFIX) {
1226             suff[MAX_SUFFIX+1-z_len] = '\0';
1227             save_orig_name = 1;
1228 #  endif
1229         }
1230 #endif /* NO_MULTIPLE_DOTS */
1231         if (sizeof ofname <= strlen (ofname) + z_len)
1232             goto name_too_long;
1233         strcat(ofname, z_suffix);
1234
1235     } /* decompress ? */
1236     return OK;
1237
1238  name_too_long:
1239     WARN ((stderr, "%s: %s: file name too long\n", program_name, ifname));
1240     return WARNING;
1241 }
1242
1243
1244 /* ========================================================================
1245  * Check the magic number of the input file and update ofname if an
1246  * original name was given and to_stdout is not set.
1247  * Return the compression method, -1 for error, -2 for warning.
1248  * Set inptr to the offset of the next byte to be processed.
1249  * Updates time_stamp if there is one and --no-time is not used.
1250  * This function may be called repeatedly for an input file consisting
1251  * of several contiguous gzip'ed members.
1252  * IN assertions: there is at least one remaining compressed member.
1253  *   If the member is a zip file, it must be the only one.
1254  */
1255 local int get_method(in)
1256     int in;        /* input file descriptor */
1257 {
1258     uch flags;     /* compression flags */
1259     char magic[2]; /* magic header */
1260     int imagic1;   /* like magic[1], but can represent EOF */
1261     ulg stamp;     /* time stamp */
1262
1263     /* If --force and --stdout, zcat == cat, so do not complain about
1264      * premature end of file: use try_byte instead of get_byte.
1265      */
1266     if (force && to_stdout) {
1267         magic[0] = (char)try_byte();
1268         imagic1 = try_byte ();
1269         magic[1] = (char) imagic1;
1270         /* If try_byte returned EOF, magic[1] == (char) EOF.  */
1271     } else {
1272         magic[0] = (char)get_byte();
1273         magic[1] = (char)get_byte();
1274         imagic1 = 0; /* avoid lint warning */
1275     }
1276     method = -1;                 /* unknown yet */
1277     part_nb++;                   /* number of parts in gzip file */
1278     header_bytes = 0;
1279     last_member = RECORD_IO;
1280     /* assume multiple members in gzip file except for record oriented I/O */
1281
1282     if (memcmp(magic, GZIP_MAGIC, 2) == 0
1283         || memcmp(magic, OLD_GZIP_MAGIC, 2) == 0) {
1284
1285         method = (int)get_byte();
1286         if (method != DEFLATED) {
1287             fprintf(stderr,
1288                     "%s: %s: unknown method %d -- not supported\n",
1289                     program_name, ifname, method);
1290             exit_code = ERROR;
1291             return -1;
1292         }
1293         work = unzip;
1294         flags  = (uch)get_byte();
1295
1296         if ((flags & ENCRYPTED) != 0) {
1297             fprintf(stderr,
1298                     "%s: %s is encrypted -- not supported\n",
1299                     program_name, ifname);
1300             exit_code = ERROR;
1301             return -1;
1302         }
1303         if ((flags & CONTINUATION) != 0) {
1304             fprintf(stderr,
1305                     "%s: %s is a multi-part gzip file -- not supported\n",
1306                     program_name, ifname);
1307             exit_code = ERROR;
1308             if (force <= 1) return -1;
1309         }
1310         if ((flags & RESERVED) != 0) {
1311             fprintf(stderr,
1312                     "%s: %s has flags 0x%x -- not supported\n",
1313                     program_name, ifname, flags);
1314             exit_code = ERROR;
1315             if (force <= 1) return -1;
1316         }
1317         stamp  = (ulg)get_byte();
1318         stamp |= ((ulg)get_byte()) << 8;
1319         stamp |= ((ulg)get_byte()) << 16;
1320         stamp |= ((ulg)get_byte()) << 24;
1321         if (stamp != 0 && !no_time)
1322           {
1323             time_stamp.tv_sec = stamp;
1324             time_stamp.tv_nsec = 0;
1325           }
1326
1327         (void)get_byte();  /* Ignore extra flags for the moment */
1328         (void)get_byte();  /* Ignore OS type for the moment */
1329
1330         if ((flags & CONTINUATION) != 0) {
1331             unsigned part = (unsigned)get_byte();
1332             part |= ((unsigned)get_byte())<<8;
1333             if (verbose) {
1334                 fprintf(stderr,"%s: %s: part number %u\n",
1335                         program_name, ifname, part);
1336             }
1337         }
1338         if ((flags & EXTRA_FIELD) != 0) {
1339             unsigned len = (unsigned)get_byte();
1340             len |= ((unsigned)get_byte())<<8;
1341             if (verbose) {
1342                 fprintf(stderr,"%s: %s: extra field of %u bytes ignored\n",
1343                         program_name, ifname, len);
1344             }
1345             while (len--) (void)get_byte();
1346         }
1347
1348         /* Get original file name if it was truncated */
1349         if ((flags & ORIG_NAME) != 0) {
1350             if (no_name || (to_stdout && !list) || part_nb > 1) {
1351                 /* Discard the old name */
1352                 char c; /* dummy used for NeXTstep 3.0 cc optimizer bug */
1353                 do {c=get_byte();} while (c != 0);
1354             } else {
1355                 /* Copy the base name. Keep a directory prefix intact. */
1356                 char *p = gzip_base_name (ofname);
1357                 char *base = p;
1358                 for (;;) {
1359                     *p = (char)get_char();
1360                     if (*p++ == '\0') break;
1361                     if (p >= ofname+sizeof(ofname)) {
1362                         gzip_error ("corrupted input -- file name too large");
1363                     }
1364                 }
1365                 p = gzip_base_name (base);
1366                 memmove (base, p, strlen (p) + 1);
1367                 /* If necessary, adapt the name to local OS conventions: */
1368                 if (!list) {
1369                    MAKE_LEGAL_NAME(base);
1370                    if (base) list=0; /* avoid warning about unused variable */
1371                 }
1372             } /* no_name || to_stdout */
1373         } /* ORIG_NAME */
1374
1375         /* Discard file comment if any */
1376         if ((flags & COMMENT) != 0) {
1377             while (get_char() != 0) /* null */ ;
1378         }
1379         if (part_nb == 1) {
1380             header_bytes = inptr + 2*sizeof(long); /* include crc and size */
1381         }
1382
1383     } else if (memcmp(magic, PKZIP_MAGIC, 2) == 0 && inptr == 2
1384             && memcmp((char*)inbuf, PKZIP_MAGIC, 4) == 0) {
1385         /* To simplify the code, we support a zip file when alone only.
1386          * We are thus guaranteed that the entire local header fits in inbuf.
1387          */
1388         inptr = 0;
1389         work = unzip;
1390         if (check_zipfile(in) != OK) return -1;
1391         /* check_zipfile may get ofname from the local header */
1392         last_member = 1;
1393
1394     } else if (memcmp(magic, PACK_MAGIC, 2) == 0) {
1395         work = unpack;
1396         method = PACKED;
1397
1398     } else if (memcmp(magic, LZW_MAGIC, 2) == 0) {
1399         work = unlzw;
1400         method = COMPRESSED;
1401         last_member = 1;
1402
1403     } else if (memcmp(magic, LZH_MAGIC, 2) == 0) {
1404         work = unlzh;
1405         method = LZHED;
1406         last_member = 1;
1407
1408     } else if (force && to_stdout && !list) { /* pass input unchanged */
1409         method = STORED;
1410         work = copy;
1411         inptr = 0;
1412         last_member = 1;
1413     }
1414     if (method >= 0) return method;
1415
1416     if (part_nb == 1) {
1417         fprintf (stderr, "\n%s: %s: not in gzip format\n",
1418                  program_name, ifname);
1419         exit_code = ERROR;
1420         return -1;
1421     } else {
1422         if (magic[0] == 0)
1423           {
1424             int inbyte;
1425             for (inbyte = imagic1;  inbyte == 0;  inbyte = try_byte ())
1426               continue;
1427             if (inbyte == EOF)
1428               {
1429                 if (verbose)
1430                   WARN ((stderr, "\n%s: %s: decompression OK, trailing zero bytes ignored\n",
1431                          program_name, ifname));
1432                 return -3;
1433               }
1434           }
1435
1436         WARN((stderr, "\n%s: %s: decompression OK, trailing garbage ignored\n",
1437               program_name, ifname));
1438         return -2;
1439     }
1440 }
1441
1442 /* ========================================================================
1443  * Display the characteristics of the compressed file.
1444  * If the given method is < 0, display the accumulated totals.
1445  * IN assertions: time_stamp, header_bytes and ifile_size are initialized.
1446  */
1447 local void do_list(ifd, method)
1448     int ifd;     /* input file descriptor */
1449     int method;  /* compression method */
1450 {
1451     ulg crc;  /* original crc */
1452     static int first_time = 1;
1453     static char* methods[MAX_METHODS] = {
1454         "store",  /* 0 */
1455         "compr",  /* 1 */
1456         "pack ",  /* 2 */
1457         "lzh  ",  /* 3 */
1458         "", "", "", "", /* 4 to 7 reserved */
1459         "defla"}; /* 8 */
1460     int positive_off_t_width = 1;
1461     off_t o;
1462
1463     for (o = OFF_T_MAX;  9 < o;  o /= 10) {
1464         positive_off_t_width++;
1465     }
1466
1467     if (first_time && method >= 0) {
1468         first_time = 0;
1469         if (verbose)  {
1470             printf("method  crc     date  time  ");
1471         }
1472         if (!quiet) {
1473             printf("%*.*s %*.*s  ratio uncompressed_name\n",
1474                    positive_off_t_width, positive_off_t_width, "compressed",
1475                    positive_off_t_width, positive_off_t_width, "uncompressed");
1476         }
1477     } else if (method < 0) {
1478         if (total_in <= 0 || total_out <= 0) return;
1479         if (verbose) {
1480             printf("                            ");
1481         }
1482         if (verbose || !quiet) {
1483             fprint_off(stdout, total_in, positive_off_t_width);
1484             printf(" ");
1485             fprint_off(stdout, total_out, positive_off_t_width);
1486             printf(" ");
1487         }
1488         display_ratio(total_out-(total_in-header_bytes), total_out, stdout);
1489         /* header_bytes is not meaningful but used to ensure the same
1490          * ratio if there is a single file.
1491          */
1492         printf(" (totals)\n");
1493         return;
1494     }
1495     crc = (ulg)~0; /* unknown */
1496     bytes_out = -1L;
1497     bytes_in = ifile_size;
1498
1499 #if RECORD_IO == 0
1500     if (method == DEFLATED && !last_member) {
1501         /* Get the crc and uncompressed size for gzip'ed (not zip'ed) files.
1502          * If the lseek fails, we could use read() to get to the end, but
1503          * --list is used to get quick results.
1504          * Use "gunzip < foo.gz | wc -c" to get the uncompressed size if
1505          * you are not concerned about speed.
1506          */
1507         bytes_in = lseek(ifd, (off_t)(-8), SEEK_END);
1508         if (bytes_in != -1L) {
1509             uch buf[8];
1510             bytes_in += 8L;
1511             if (read(ifd, (char*)buf, sizeof(buf)) != sizeof(buf)) {
1512                 read_error();
1513             }
1514             crc       = LG(buf);
1515             bytes_out = LG(buf+4);
1516         }
1517     }
1518 #endif /* RECORD_IO */
1519     if (verbose)
1520       {
1521         struct tm *tm = localtime (&time_stamp.tv_sec);
1522         printf ("%5s %08lx ", methods[method], crc);
1523         if (tm)
1524           printf ("%s%3d %02d:%02d ",
1525                   ("Jan\0Feb\0Mar\0Apr\0May\0Jun\0Jul\0Aug\0Sep\0Oct\0Nov\0Dec"
1526                    + 4 * tm->tm_mon),
1527                   tm->tm_mday, tm->tm_hour, tm->tm_min);
1528         else
1529           printf ("??? ?? ??:?? ");
1530       }
1531     fprint_off(stdout, bytes_in, positive_off_t_width);
1532     printf(" ");
1533     fprint_off(stdout, bytes_out, positive_off_t_width);
1534     printf(" ");
1535     if (bytes_in  == -1L) {
1536         total_in = -1L;
1537         bytes_in = bytes_out = header_bytes = 0;
1538     } else if (total_in >= 0) {
1539         total_in  += bytes_in;
1540     }
1541     if (bytes_out == -1L) {
1542         total_out = -1L;
1543         bytes_in = bytes_out = header_bytes = 0;
1544     } else if (total_out >= 0) {
1545         total_out += bytes_out;
1546     }
1547     display_ratio(bytes_out-(bytes_in-header_bytes), bytes_out, stdout);
1548     printf(" %s\n", ofname);
1549 }
1550
1551 /* ========================================================================
1552  * Shorten the given name by one character, or replace a .tar extension
1553  * with .tgz. Truncate the last part of the name which is longer than
1554  * MIN_PART characters: 1234.678.012.gz -> 123.678.012.gz. If the name
1555  * has only parts shorter than MIN_PART truncate the longest part.
1556  * For decompression, just remove the last character of the name.
1557  *
1558  * IN assertion: for compression, the suffix of the given name is z_suffix.
1559  */
1560 local void shorten_name(name)
1561     char *name;
1562 {
1563     int len;                 /* length of name without z_suffix */
1564     char *trunc = NULL;      /* character to be truncated */
1565     int plen;                /* current part length */
1566     int min_part = MIN_PART; /* current minimum part length */
1567     char *p;
1568
1569     len = strlen(name);
1570     if (decompress) {
1571         if (len <= 1)
1572           gzip_error ("name too short");
1573         name[len-1] = '\0';
1574         return;
1575     }
1576     p = get_suffix(name);
1577     if (! p)
1578       gzip_error ("can't recover suffix\n");
1579     *p = '\0';
1580     save_orig_name = 1;
1581
1582     /* compress 1234567890.tar to 1234567890.tgz */
1583     if (len > 4 && strequ(p-4, ".tar")) {
1584         strcpy(p-4, ".tgz");
1585         return;
1586     }
1587     /* Try keeping short extensions intact:
1588      * 1234.678.012.gz -> 123.678.012.gz
1589      */
1590     do {
1591         p = strrchr(name, PATH_SEP);
1592         p = p ? p+1 : name;
1593         while (*p) {
1594             plen = strcspn(p, PART_SEP);
1595             p += plen;
1596             if (plen > min_part) trunc = p-1;
1597             if (*p) p++;
1598         }
1599     } while (trunc == NULL && --min_part != 0);
1600
1601     if (trunc != NULL) {
1602         do {
1603             trunc[0] = trunc[1];
1604         } while (*trunc++);
1605         trunc--;
1606     } else {
1607         trunc = strrchr(name, PART_SEP[0]);
1608         if (!trunc)
1609           gzip_error ("internal error in shorten_name");
1610         if (trunc[1] == '\0') trunc--; /* force truncation */
1611     }
1612     strcpy(trunc, z_suffix);
1613 }
1614
1615 /* ========================================================================
1616  * The compressed file already exists, so ask for confirmation.
1617  * Return ERROR if the file must be skipped.
1618  */
1619 local int check_ofname()
1620 {
1621     /* Ask permission to overwrite the existing file */
1622     if (!force) {
1623         int ok = 0;
1624         fprintf (stderr, "%s: %s already exists;", program_name, ofname);
1625         if (foreground && isatty(fileno(stdin))) {
1626             fprintf(stderr, " do you wish to overwrite (y or n)? ");
1627             fflush(stderr);
1628             ok = yesno();
1629         }
1630         if (!ok) {
1631             fprintf(stderr, "\tnot overwritten\n");
1632             if (exit_code == OK) exit_code = WARNING;
1633             return ERROR;
1634         }
1635     }
1636     if (xunlink (ofname)) {
1637         progerror(ofname);
1638         return ERROR;
1639     }
1640     return OK;
1641 }
1642
1643
1644 /* ========================================================================
1645  * Copy modes, times, ownership from input file to output file.
1646  * IN assertion: to_stdout is false.
1647  */
1648 local void copy_stat(ifstat)
1649     struct stat *ifstat;
1650 {
1651     mode_t mode = ifstat->st_mode & S_IRWXUGO;
1652     int r;
1653
1654 #ifndef NO_UTIME
1655     struct timespec timespec[2];
1656     timespec[0] = get_stat_atime (ifstat);
1657     timespec[1] = get_stat_mtime (ifstat);
1658
1659     if (decompress && 0 <= time_stamp.tv_nsec
1660         && ! (timespec[1].tv_sec == time_stamp.tv_sec
1661               && timespec[1].tv_nsec == time_stamp.tv_nsec))
1662       {
1663         timespec[1] = time_stamp;
1664         if (verbose > 1) {
1665             fprintf(stderr, "%s: time stamp restored\n", ofname);
1666         }
1667       }
1668
1669     if (gz_futimens (ofd, ofname, timespec) != 0)
1670       {
1671         int e = errno;
1672         WARN ((stderr, "%s: ", program_name));
1673         if (!quiet)
1674           {
1675             errno = e;
1676             perror (ofname);
1677           }
1678       }
1679 #endif
1680
1681 #ifndef NO_CHOWN
1682 # if HAVE_FCHOWN
1683     fchown (ofd, ifstat->st_uid, ifstat->st_gid);  /* Copy ownership */
1684 # elif HAVE_CHOWN
1685     chown(ofname, ifstat->st_uid, ifstat->st_gid);  /* Copy ownership */
1686 # endif
1687 #endif
1688
1689     /* Copy the protection modes */
1690 #if HAVE_FCHMOD
1691     r = fchmod (ofd, mode);
1692 #else
1693     r = chmod (ofname, mode);
1694 #endif
1695     if (r != 0) {
1696         int e = errno;
1697         WARN ((stderr, "%s: ", program_name));
1698         if (!quiet) {
1699             errno = e;
1700             perror(ofname);
1701         }
1702     }
1703 }
1704
1705 #if ! NO_DIR
1706
1707 /* ========================================================================
1708  * Recurse through the given directory. This code is taken from ncompress.
1709  */
1710 local void treat_dir (fd, dir)
1711     int fd;
1712     char *dir;
1713 {
1714     struct dirent *dp;
1715     DIR      *dirp;
1716     char     nbuf[MAX_PATH_LEN];
1717     int      len;
1718
1719 #if HAVE_FDOPENDIR
1720     dirp = fdopendir (fd);
1721 #else
1722     close (fd);
1723     dirp = opendir(dir);
1724 #endif
1725
1726     if (dirp == NULL) {
1727         progerror(dir);
1728 #if HAVE_FDOPENDIR
1729         close (fd);
1730 #endif
1731         return ;
1732     }
1733     /*
1734      ** WARNING: the following algorithm could occasionally cause
1735      ** compress to produce error warnings of the form "<filename>.gz
1736      ** already has .gz suffix - ignored". This occurs when the
1737      ** .gz output file is inserted into the directory below
1738      ** readdir's current pointer.
1739      ** These warnings are harmless but annoying, so they are suppressed
1740      ** with option -r (except when -v is on). An alternative
1741      ** to allowing this would be to store the entire directory
1742      ** list in memory, then compress the entries in the stored
1743      ** list. Given the depth-first recursive algorithm used here,
1744      ** this could use up a tremendous amount of memory. I don't
1745      ** think it's worth it. -- Dave Mack
1746      ** (An other alternative might be two passes to avoid depth-first.)
1747      */
1748
1749     while ((errno = 0, dp = readdir(dirp)) != NULL) {
1750
1751         if (strequ(dp->d_name,".") || strequ(dp->d_name,"..")) {
1752             continue;
1753         }
1754         len = strlen(dir);
1755         if (len + _D_EXACT_NAMLEN (dp) + 1 < MAX_PATH_LEN - 1) {
1756             strcpy(nbuf,dir);
1757             if (len != 0 /* dir = "" means current dir on Amiga */
1758 #ifdef PATH_SEP2
1759                 && dir[len-1] != PATH_SEP2
1760 #endif
1761 #ifdef PATH_SEP3
1762                 && dir[len-1] != PATH_SEP3
1763 #endif
1764             ) {
1765                 nbuf[len++] = PATH_SEP;
1766             }
1767             strcpy(nbuf+len, dp->d_name);
1768             treat_file(nbuf);
1769         } else {
1770             fprintf(stderr,"%s: %s/%s: pathname too long\n",
1771                     program_name, dir, dp->d_name);
1772             exit_code = ERROR;
1773         }
1774     }
1775     if (errno != 0)
1776         progerror(dir);
1777     if (CLOSEDIR(dirp) != 0)
1778         progerror(dir);
1779 }
1780 #endif /* ! NO_DIR */
1781
1782 /* Make sure signals get handled properly.  */
1783
1784 static void
1785 install_signal_handlers ()
1786 {
1787   int nsigs = sizeof handled_sig / sizeof handled_sig[0];
1788   int i;
1789
1790 #if SA_NOCLDSTOP
1791   struct sigaction act;
1792
1793   sigemptyset (&caught_signals);
1794   for (i = 0; i < nsigs; i++)
1795     {
1796       sigaction (handled_sig[i], NULL, &act);
1797       if (act.sa_handler != SIG_IGN)
1798         sigaddset (&caught_signals, handled_sig[i]);
1799     }
1800
1801   act.sa_handler = abort_gzip_signal;
1802   act.sa_mask = caught_signals;
1803   act.sa_flags = 0;
1804
1805   for (i = 0; i < nsigs; i++)
1806     if (sigismember (&caught_signals, handled_sig[i]))
1807       {
1808         if (i == 0)
1809           foreground = 1;
1810         sigaction (handled_sig[i], &act, NULL);
1811       }
1812 #else
1813   for (i = 0; i < nsigs; i++)
1814     if (signal (handled_sig[i], SIG_IGN) != SIG_IGN)
1815       {
1816         if (i == 0)
1817           foreground = 1;
1818         signal (handled_sig[i], abort_gzip_signal);
1819         siginterrupt (handled_sig[i], 1);
1820       }
1821 #endif
1822 }
1823
1824 /* ========================================================================
1825  * Free all dynamically allocated variables and exit with the given code.
1826  */
1827 local void do_exit(exitcode)
1828     int exitcode;
1829 {
1830     static int in_exit = 0;
1831
1832     if (in_exit) exit(exitcode);
1833     in_exit = 1;
1834     if (env != NULL)  free(env),  env  = NULL;
1835     if (args != NULL) free((char*)args), args = NULL;
1836     FREE(inbuf);
1837     FREE(outbuf);
1838     FREE(d_buf);
1839     FREE(window);
1840 #ifndef MAXSEG_64K
1841     FREE(tab_prefix);
1842 #else
1843     FREE(tab_prefix0);
1844     FREE(tab_prefix1);
1845 #endif
1846     exit(exitcode);
1847 }
1848
1849 /* ========================================================================
1850  * Close and unlink the output file.
1851  */
1852 static void
1853 remove_output_file ()
1854 {
1855   int fd;
1856   sigset_t oldset;
1857
1858   sigprocmask (SIG_BLOCK, &caught_signals, &oldset);
1859   fd = remove_ofname_fd;
1860   if (0 <= fd)
1861     {
1862       remove_ofname_fd = -1;
1863       close (fd);
1864       xunlink (ofname);
1865     }
1866   sigprocmask (SIG_SETMASK, &oldset, NULL);
1867 }
1868
1869 /* ========================================================================
1870  * Error handler.
1871  */
1872 void
1873 abort_gzip ()
1874 {
1875    remove_output_file ();
1876    do_exit(ERROR);
1877 }
1878
1879 /* ========================================================================
1880  * Signal handler.
1881  */
1882 static RETSIGTYPE
1883 abort_gzip_signal (sig)
1884      int sig;
1885 {
1886   if (! SA_NOCLDSTOP)
1887     signal (sig, SIG_IGN);
1888    remove_output_file ();
1889    if (sig == exiting_signal)
1890      _exit (WARNING);
1891    signal (sig, SIG_DFL);
1892    raise (sig);
1893 }