]> granicus.if.org Git - strace/blob - strace.1
2008-07-03 Jan Kratochvil <jan.kratochvil@redhat.com>
[strace] / strace.1
1 .\" Copyright (c) 1991, 1992 Paul Kranenburg <pk@cs.few.eur.nl>
2 .\" Copyright (c) 1993 Branko Lankester <branko@hacktic.nl>
3 .\" Copyright (c) 1993, 1994, 1995, 1996 Rick Sladkey <jrs@world.std.com>
4 .\" All rights reserved.
5 .\"
6 .\" Redistribution and use in source and binary forms, with or without
7 .\" modification, are permitted provided that the following conditions
8 .\" are met:
9 .\" 1. Redistributions of source code must retain the above copyright
10 .\"    notice, this list of conditions and the following disclaimer.
11 .\" 2. Redistributions in binary form must reproduce the above copyright
12 .\"    notice, this list of conditions and the following disclaimer in the
13 .\"    documentation and/or other materials provided with the distribution.
14 .\" 3. The name of the author may not be used to endorse or promote products
15 .\"    derived from this software without specific prior written permission.
16 .\"
17 .\" THIS SOFTWARE IS PROVIDED BY THE AUTHOR ``AS IS'' AND ANY EXPRESS OR
18 .\" IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
19 .\" OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
20 .\" IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR ANY DIRECT, INDIRECT,
21 .\" INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT
22 .\" NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
23 .\" DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
24 .\" THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
25 .\" (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
26 .\" THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
27 .\"
28 .\"     $Id$
29 .\"
30 .de CW
31 .sp
32 .nf
33 .ft CW
34 ..
35 .de CE
36 .ft R
37 .fi
38 .sp
39 ..
40 .TH STRACE 1 "2003-01-21"
41 .SH NAME
42 strace \- trace system calls and signals
43 .SH SYNOPSIS
44 .B strace
45 [
46 .B \-dffhiqrtttTvxx
47 ]
48 [
49 .BI \-a column
50 ]
51 [
52 .BI \-e expr
53 ]
54 \&...
55 [
56 .BI \-o file
57 ]
58 [
59 .BI \-p pid
60 ]
61 \&...
62 [
63 .BI \-s strsize
64 ]
65 [
66 .BI \-u username
67 ]
68 [
69 .BI \-E var=val
70 ]
71 \&...
72 [
73 .BI \-E var
74 ]
75 \&...
76 [
77 .I command
78 [
79 .I arg
80 \&...
81 ]
82 ]
83 .sp
84 .B strace
85 .B \-c
86 [
87 .BI \-e expr
88 ]
89 \&...
90 [
91 .BI \-O overhead
92 ]
93 [
94 .BI \-S sortby
95 ]
96 [
97 .I command
98 [
99 .I arg
100 \&...
101 ]
102 ]
103 .SH DESCRIPTION
104 .IX "strace command" "" "\fLstrace\fR command"
105 .LP
106 In the simplest case
107 .B strace
108 runs the specified
109 .I command
110 until it exits.
111 It intercepts and records the system calls which are called
112 by a process and the signals which are received by a process.
113 The name of each system call, its arguments and its return value
114 are printed on standard error or to the file specified with the
115 .B \-o
116 option.
117 .LP
118 .B strace
119 is a useful diagnostic, instructional, and debugging tool.
120 System administrators, diagnosticians and trouble-shooters will find
121 it invaluable for solving problems with
122 programs for which the source is not readily available since
123 they do not need to be recompiled in order to trace them.
124 Students, hackers and the overly-curious will find that
125 a great deal can be learned about a system and its system calls by
126 tracing even ordinary programs.  And programmers will find that
127 since system calls and signals are events that happen at the user/kernel
128 interface, a close examination of this boundary is very
129 useful for bug isolation, sanity checking and
130 attempting to capture race conditions.
131 .LP
132 Each line in the trace contains the system call name, followed
133 by its arguments in parentheses and its return value.
134 An example from stracing the command ``cat /dev/null'' is:
135 .CW
136 open("/dev/null", O_RDONLY) = 3
137 .CE
138 Errors (typically a return value of \-1) have the errno symbol
139 and error string appended.
140 .CW
141 open("/foo/bar", O_RDONLY) = -1 ENOENT (No such file or directory)
142 .CE
143 Signals are printed as a signal symbol and a signal string.
144 An excerpt from stracing and interrupting the command ``sleep 666'' is:
145 .CW
146 sigsuspend([] <unfinished ...>
147 --- SIGINT (Interrupt) ---
148 +++ killed by SIGINT +++
149 .CE
150 Arguments are printed in symbolic form with a passion.
151 This example shows the shell performing ``>>xyzzy'' output redirection:
152 .CW
153 open("xyzzy", O_WRONLY|O_APPEND|O_CREAT, 0666) = 3
154 .CE
155 Here the three argument form of open is decoded by breaking down the
156 flag argument into its three bitwise-OR constituents and printing the
157 mode value in octal by tradition.  Where traditional or native
158 usage differs from ANSI or POSIX, the latter forms are preferred.
159 In some cases,
160 .B strace
161 output has proven to be more readable than the source.
162 .LP
163 Structure pointers are dereferenced and the members are displayed
164 as appropriate.  In all cases arguments are formatted in the most C-like
165 fashion possible.
166 For example, the essence of the command ``ls \-l /dev/null'' is captured as:
167 .CW
168 lstat("/dev/null", {st_mode=S_IFCHR|0666, st_rdev=makedev(1, 3), ...}) = 0
169 .CE
170 Notice how the `struct stat' argument is dereferenced and how each member is
171 displayed symbolically.  In particular, observe how the st_mode member
172 is carefully decoded into a bitwise-OR of symbolic and numeric values.
173 Also notice in this example that the first argument to lstat is an input
174 to the system call and the second argument is an output.  Since output
175 arguments are not modified if the system call fails, arguments may not
176 always be dereferenced.  For example, retrying the ``ls \-l'' example
177 with a non-existent file produces the following line:
178 .CW
179 lstat("/foo/bar", 0xb004) = -1 ENOENT (No such file or directory)
180 .CE
181 In this case the porch light is on but nobody is home.
182 .LP
183 Character pointers are dereferenced and printed as C strings.
184 Non-printing characters in strings are normally represented by
185 ordinary C escape codes.
186 Only the first
187 .I strsize
188 (32 by default) bytes of strings are printed;
189 longer strings have an ellipsis appended following the closing quote.
190 Here is a line from ``ls \-l'' where the
191 .B getpwuid
192 library routine is reading the password file:
193 .CW
194 read(3, "root::0:0:System Administrator:/"..., 1024) = 422
195 .CE
196 While structures are annotated using curly braces, simple pointers
197 and arrays are printed using square brackets with commas separating
198 elements.  Here is an example from the command ``id'' on a system with
199 supplementary group ids:
200 .CW
201 getgroups(32, [100, 0]) = 2
202 .CE
203 On the other hand, bit-sets are also shown using square brackets
204 but set elements are separated only by a space.  Here is the shell
205 preparing to execute an external command:
206 .CW
207 sigprocmask(SIG_BLOCK, [CHLD TTOU], []) = 0
208 .CE
209 Here the second argument is a bit-set of two signals, SIGCHLD and SIGTTOU.
210 In some cases the bit-set is so full that printing out the unset
211 elements is more valuable.  In that case, the bit-set is prefixed by
212 a tilde like this:
213 .CW
214 sigprocmask(SIG_UNBLOCK, ~[], NULL) = 0
215 .CE
216 Here the second argument represents the full set of all signals.
217 .SH OPTIONS
218 .TP 12
219 .TP
220 .B \-c
221 Count time, calls, and errors for each system call and report a summary on
222 program exit.  On Linux, this attempts to show system time (CPU time spent
223 running in the kernel) independent of wall clock time.  If -c is used with
224 -f or -F (below), only aggregate totals for all traced processes are kept.
225 .TP
226 .B \-d
227 Show some debugging output of
228 .B strace
229 itself on the standard error.
230 .TP
231 .B \-f
232 Trace child processes as they are created by currently traced
233 processes as a result of the
234 .BR fork (2)
235 system call.
236 .IP
237 On non-Linux platforms the new process is
238 attached to as soon as its pid is known (through the return value of
239 .BR fork (2)
240 in the parent process). This means that such children may run
241 uncontrolled for a while (especially in the case of a
242 .BR vfork (2)),
243 until the parent is scheduled again to complete its
244 .RB ( v ) fork (2)
245 call.  On Linux the child is traced from its first instruction with no delay.
246 If the parent process decides to
247 .BR wait (2)
248 for a child that is currently
249 being traced, it is suspended until an appropriate child process either
250 terminates or incurs a signal that would cause it to terminate (as
251 determined from the child's current signal disposition).
252 .IP
253 On SunOS 4.x the tracing of
254 .BR vfork s
255 is accomplished with some dynamic linking trickery.
256 .TP
257 .B \-ff
258 If the
259 .B \-o
260 .I filename
261 option is in effect, each processes trace is written to
262 .I filename.pid
263 where pid is the numeric process id of each process.
264 This is incompatible with -c, since no per-process counts are kept.
265 .TP
266 .B \-F
267 This option is now obsolete and it has the same functionality as
268 .BR -f .
269 .TP
270 .B \-h
271 Print the help summary.
272 .TP
273 .B \-i
274 Print the instruction pointer at the time of the system call.
275 .TP
276 .B \-q
277 Suppress messages about attaching, detaching etc.  This happens
278 automatically when output is redirected to a file and the command
279 is run directly instead of attaching.
280 .TP
281 .B \-r
282 Print a relative timestamp upon entry to each system call.  This
283 records the time difference between the beginning of successive
284 system calls.
285 .TP
286 .B \-t
287 Prefix each line of the trace with the time of day.
288 .TP
289 .B \-tt
290 If given twice, the time printed will include the microseconds.
291 .TP
292 .B \-ttt
293 If given thrice, the time printed will include the microseconds
294 and the leading portion will be printed as the number
295 of seconds since the epoch.
296 .TP
297 .B \-T
298 Show the time spent in system calls. This records the time
299 difference between the beginning and the end of each system call.
300 .TP
301 .B \-v
302 Print unabbreviated versions of environment, stat, termios, etc.
303 calls.  These structures are very common in calls and so the default
304 behavior displays a reasonable subset of structure members.  Use
305 this option to get all of the gory details.
306 .TP
307 .B \-V
308 Print the version number of
309 .BR strace .
310 .TP
311 .B \-x
312 Print all non-ASCII strings in hexadecimal string format.
313 .TP
314 .B \-xx
315 Print all strings in hexadecimal string format.
316 .TP
317 .BI "\-a " column
318 Align return values in a specific column (default column 40).
319 .TP
320 .BI "\-e " expr
321 A qualifying expression which modifies which events to trace
322 or how to trace them.  The format of the expression is:
323 .RS 15
324 .IP
325 [\fIqualifier\fB=\fR][\fB!\fR]\fIvalue1\fR[\fB,\fIvalue2\fR]...
326 .RE
327 .IP
328 where
329 .I qualifier
330 is one of
331 .BR trace ,
332 .BR abbrev ,
333 .BR verbose ,
334 .BR raw ,
335 .BR signal ,
336 .BR read ,
337 or
338 .B write
339 and
340 .I value
341 is a qualifier-dependent symbol or number.  The default
342 qualifier is
343 .BR trace .
344 Using an exclamation mark negates the set of values.  For example,
345 .B \-eopen
346 means literally
347 .B "\-e trace=open"
348 which in turn means trace only the
349 .B open
350 system call.  By contrast,
351 .B "\-etrace=!open"
352 means to trace every system call except
353 .BR open .
354 In addition, the special values
355 .B all
356 and
357 .B none
358 have the obvious meanings.
359 .IP
360 Note that some shells use the exclamation point for history
361 expansion even inside quoted arguments.  If so, you must escape
362 the exclamation point with a backslash.
363 .TP
364 .BI "\-e trace=" set
365 Trace only the specified set of system calls.  The
366 .B \-c
367 option is useful for determining which system calls might be useful
368 to trace.  For example,
369 .B trace=open,close,read,write
370 means to only
371 trace those four system calls.  Be careful when making inferences
372 about the user/kernel boundary if only a subset of system calls
373 are being monitored.  The default is
374 .BR trace=all .
375 .TP
376 .B "\-e trace=file"
377 Trace all system calls which take a file name as an argument.  You
378 can think of this as an abbreviation for
379 .BR "\-e\ trace=open,stat,chmod,unlink," ...
380 which is useful to seeing what files the process is referencing.
381 Furthermore, using the abbreviation will ensure that you don't
382 accidentally forget to include a call like
383 .B lstat
384 in the list.  Betchya woulda forgot that one.
385 .TP
386 .B "\-e trace=process"
387 Trace all system calls which involve process management.  This
388 is useful for watching the fork, wait, and exec steps of a process.
389 .TP
390 .B "\-e trace=network"
391 Trace all the network related system calls.
392 .TP
393 .B "\-e trace=signal"
394 Trace all signal related system calls.
395 .TP
396 .B "\-e trace=ipc"
397 Trace all IPC related system calls.
398 .TP
399 .B "\-e trace=desc"
400 Trace all file descriptor related system calls.
401 .TP
402 .BI "\-e abbrev=" set
403 Abbreviate the output from printing each member of large structures.
404 The default is
405 .BR abbrev=all .
406 The
407 .B \-v
408 option has the effect of
409 .BR abbrev=none .
410 .TP
411 .BI "\-e verbose=" set
412 Dereference structures for the specified set of system calls.  The
413 default is
414 .BR verbose=all .
415 .TP
416 .BI "\-e raw=" set
417 Print raw, undecoded arguments for the specified set of system calls.
418 This option has the effect of causing all arguments to be printed
419 in hexadecimal.  This is mostly useful if you don't trust the
420 decoding or you need to know the actual numeric value of an
421 argument.
422 .TP
423 .BI "\-e signal=" set
424 Trace only the specified subset of signals.  The default is
425 .BR signal=all .
426 For example,
427 .B signal=!SIGIO
428 (or
429 .BR signal=!io )
430 causes SIGIO signals not to be traced.
431 .TP
432 .BI "\-e read=" set
433 Perform a full hexadecimal and ASCII dump of all the data read from
434 file descriptors listed in the specified set.  For example, to see
435 all input activity on file descriptors 3 and 5 use
436 .BR "\-e read=3,5" .
437 Note that this is independent from the normal tracing of the
438 .BR read (2)
439 system call which is controlled by the option
440 .BR "\-e trace=read" .
441 .TP
442 .BI "\-e write=" set
443 Perform a full hexadecimal and ASCII dump of all the data written to
444 file descriptors listed in the specified set.  For example, to see
445 all output activity on file descriptors 3 and 5 use
446 .BR "\-e write=3,5" .
447 Note that this is independent from the normal tracing of the
448 .BR write (2)
449 system call which is controlled by the option
450 .BR "\-e trace=write" .
451 .TP
452 .BI "\-o " filename
453 Write the trace output to the file
454 .I filename
455 rather than to stderr.
456 Use
457 .I filename.pid
458 if
459 .B \-ff
460 is used.
461 If the argument begins with `|' or with `!' then the rest of the
462 argument is treated as a command and all output is piped to it.
463 This is convenient for piping the debugging output to a program
464 without affecting the redirections of executed programs.
465 .TP
466 .BI "\-O " overhead
467 Set the overhead for tracing system calls to
468 .I overhead
469 microseconds.
470 This is useful for overriding the default heuristic for guessing
471 how much time is spent in mere measuring when timing system calls using
472 the
473 .B \-c
474 option.  The accuracy of the heuristic can be gauged by timing a given
475 program run without tracing (using
476 .BR time (1))
477 and comparing the accumulated
478 system call time to the total produced using
479 .BR \-c .
480 .TP
481 .BI "\-p " pid
482 Attach to the process with the process
483 .SM ID
484 .I pid
485 and begin tracing.
486 The trace may be terminated
487 at any time by a keyboard interrupt signal (\c
488 .SM CTRL\s0-C).
489 .B strace
490 will respond by detaching itself from the traced process(es)
491 leaving it (them) to continue running.
492 Multiple
493 .B \-p
494 options can be used to attach to up to 32 processes in addition to
495 .I command
496 (which is optional if at least one
497 .B \-p
498 option is given).
499 .TP
500 .BI "\-s " strsize
501 Specify the maximum string size to print (the default is 32).  Note
502 that filenames are not considered strings and are always printed in
503 full.
504 .TP
505 .BI "\-S " sortby
506 Sort the output of the histogram printed by the
507 .B \-c
508 option by the specified criterion.  Legal values are
509 .BR time ,
510 .BR calls ,
511 .BR name ,
512 and
513 .B nothing
514 (default
515 .BR time ).
516 .TP
517 .BI "\-u " username
518 Run command with the user \s-1ID\s0, group \s-2ID\s0, and
519 supplementary groups of
520 .IR username .
521 This option is only useful when running as root and enables the
522 correct execution of setuid and/or setgid binaries.
523 Unless this option is used setuid and setgid programs are executed
524 without effective privileges.
525 .TP
526 .BI "\-E " var=val
527 Run command with
528 .IR var=val
529 in its list of environment variables.
530 .TP
531 .BI "\-E " var
532 Remove
533 .IR var
534 from the inherited list of environment variables before passing it on to
535 the command.
536 .SH "SETUID INSTALLATION"
537 If
538 .B strace
539 is installed setuid to root then the invoking user will be able to
540 attach to and trace processes owned by any user.
541 In addition setuid and setgid programs will be executed and traced
542 with the correct effective privileges.
543 Since only users trusted with full root privileges should be allowed
544 to do these things,
545 it only makes sense to install
546 .B strace
547 as setuid to root when the users who can execute it are restricted
548 to those users who have this trust.
549 For example, it makes sense to install a special version of
550 .B strace
551 with mode `rwsr-xr--', user
552 .B root
553 and group
554 .BR trace ,
555 where members of the
556 .B trace
557 group are trusted users.
558 If you do use this feature, please remember to install
559 a non-setuid version of
560 .B strace
561 for ordinary lusers to use.
562 .SH "SEE ALSO"
563 .BR ltrace (1),
564 .BR time (1),
565 .BR ptrace (2),
566 .BR proc (5)
567 .SH NOTES
568 It is a pity that so much tracing clutter is produced by systems
569 employing shared libraries.
570 .LP
571 It is instructive to think about system call inputs and outputs
572 as data-flow across the user/kernel boundary.  Because user-space
573 and kernel-space are separate and address-protected, it is
574 sometimes possible to make deductive inferences about process
575 behavior using inputs and outputs as propositions.
576 .LP
577 In some cases, a system call will differ from the documented behavior
578 or have a different name.  For example, on System V-derived systems
579 the true
580 .BR time (2)
581 system call does not take an argument and the
582 .B stat
583 function is called
584 .B xstat
585 and takes an extra leading argument.  These
586 discrepancies are normal but idiosyncratic characteristics of the
587 system call interface and are accounted for by C library wrapper
588 functions.
589 .LP
590 On some platforms a process that has a system call trace applied
591 to it with the
592 .B \-p
593 option will receive a
594 .BR \s-1SIGSTOP\s0 .
595 This signal may interrupt a system call that is not restartable.
596 This may have an unpredictable effect on the process
597 if the process takes no action to restart the system call.
598 .SH BUGS
599 Programs that use the
600 .I setuid
601 bit do not have
602 effective user
603 .SM ID
604 privileges while being traced.
605 .LP
606 A traced process ignores
607 .SM SIGSTOP
608 except on SVR4 platforms.
609 .LP
610 A traced process which tries to block SIGTRAP will be sent a SIGSTOP
611 in an attempt to force continuation of tracing.
612 .LP
613 A traced process runs slowly.
614 .LP
615 Traced processes which are descended from
616 .I command
617 may be left running after an interrupt signal (\c
618 .SM CTRL\s0-C).
619 .LP
620 On Linux, exciting as it would be, tracing the init process is forbidden.
621 .LP
622 The
623 .B \-i
624 option is weakly supported.
625 .SH HISTORY
626 .B strace
627 The original
628 .B strace
629 was written by Paul Kranenburg
630 for SunOS and was inspired by its trace utility.
631 The SunOS version of
632 .B strace
633 was ported to Linux and enhanced
634 by Branko Lankester, who also wrote the Linux kernel support.
635 Even though Paul released
636 .B strace
637 2.5 in 1992,
638 Branko's work was based on Paul's
639 .B strace
640 1.5 release from 1991.
641 In 1993, Rick Sladkey merged
642 .B strace
643 2.5 for SunOS and the second release of
644 .B strace
645 for Linux, added many of the features of
646 .BR truss (1)
647 from SVR4, and produced an
648 .B strace
649 that worked on both platforms.  In 1994 Rick ported
650 .B strace
651 to SVR4 and Solaris and wrote the
652 automatic configuration support.  In 1995 he ported
653 .B strace
654 to Irix
655 and tired of writing about himself in the third person.
656 .SH PROBLEMS
657 Problems with
658 .B strace
659 should be reported via the Debian Bug Tracking System,
660 or to the
661 .B strace
662 mailing list at <strace-devel@lists.sourceforge.net>.