Debugginng un démon qui arrête de façon inattendue
Question
Je suis en train d'écrire un démon en c sur linux. Il emprisonne les signaux SIGHUP, SIGTERM, SIGINT et SIGQUIT, les journaux à l'aide syslog et se ferme. Si elle reçoit SIGSEGV il des coredumps. Lorsque ceux-ci se produisent tout se passe comme prévu, mais de temps en temps il se ferme ... ne quitte pas proprement, ne note pas le signal, et ne laisse pas une décharge de base. Je suis perplexe et ne sais pas comment déboguer le problème. Quels moyens peut-il quitter autre que ces signaux? Y at-il une réponse évidente, quelque chose que je suis absent? Quelles autres pratiques de débogage recommandez-vous pour déboguer un problème apparemment sporadique dans un processus démon?
La solution
Si votre démon travaille avec les sockets réseau, il est tout à fait susceptible d'être SIGPIPE
- vous obtenez si vous essayez d'écrire à une prise (ou pipe) qui a été fermé par l'autre côté. Notez que même si vous vérifiez si la prise est accessible en écriture avant l'écriture (par exemple. Avec select()
), il peut toujours être fermé entre le chèque et l'écriture elle-même.
Autres conseils
Vous pouvez avoir le parent du démon rester et attendre, puis ont le parent journal la raison du démon de quitter (à savoir s'il a été signalé ou sa sortie).
Joindre gdb avec
gdb -p <pid>
Assurez-vous que vous avez compilé avec le drapeau -g et prendre un backtrace dès sa sortie.
Bonne chance!
Eh bien, il y a beaucoup d'autres signaux qui causeront à cesser de fumer, y compris des SIGKILL
bien sûr, que vous n'allez pouvoir rien faire. Fondamentalement, rien dans le contenu suivant de man 7 signal
où Action
est Term
ou Core
(bien que celui-ci serait au moins laisser une décharge de base):
First the signals described in the original POSIX.1-1990 standard.
Signal Value Action Comment
-------------------------------------------------------------------------
SIGHUP 1 Term Hangup detected on controlling terminal
or death of controlling process
SIGINT 2 Term Interrupt from keyboard
SIGQUIT 3 Core Quit from keyboard
SIGILL 4 Core Illegal Instruction
SIGABRT 6 Core Abort signal from abort(3)
SIGFPE 8 Core Floating point exception
SIGKILL 9 Term Kill signal
SIGSEGV 11 Core Invalid memory reference
SIGPIPE 13 Term Broken pipe: write to pipe with no readers
SIGALRM 14 Term Timer signal from alarm(2)
SIGTERM 15 Term Termination signal
SIGUSR1 30,10,16 Term User-defined signal 1
SIGUSR2 31,12,17 Term User-defined signal 2
SIGCHLD 20,17,18 Ign Child stopped or terminated
SIGCONT 19,18,25 Cont Continue if stopped
SIGSTOP 17,19,23 Stop Stop process
SIGTSTP 18,20,24 Stop Stop typed at tty
SIGTTIN 21,21,26 Stop tty input for background process
SIGTTOU 22,22,27 Stop tty output for background process
The signals SIGKILL and SIGSTOP cannot be caught, blocked, or ignored.
Next the signals not in the POSIX.1-1990 standard but described in SUSv2 and POSIX.1-2001.
Signal Value Action Comment
-------------------------------------------------------------------------
SIGBUS 10,7,10 Core Bus error (bad memory access)
SIGPOLL Term Pollable event (Sys V). Synonym of SIGIO
SIGPROF 27,27,29 Term Profiling timer expired
SIGSYS 12,-,12 Core Bad argument to routine (SVr4)
SIGTRAP 5 Core Trace/breakpoint trap
SIGURG 16,23,21 Ign Urgent condition on socket (4.2BSD)
SIGVTALRM 26,26,28 Term Virtual alarm clock (4.2BSD)
SIGXCPU 24,24,30 Core CPU time limit exceeded (4.2BSD)
SIGXFSZ 25,25,31 Core File size limit exceeded (4.2BSD)
Up to and including Linux 2.2, the default behaviour for SIGSYS, SIGXCPU, SIGXFSZ, and (on architectures other than SPARC
and MIPS) SIGBUS was to terminate the process (without a core dump). (On some other Unices the default action for SIGX-
CPU and SIGXFSZ is to terminate the process without a core dump.) Linux 2.4 conforms to the POSIX.1-2001 requirements
for these signals, terminating the process with a core dump.
Next various other signals.
Signal Value Action Comment
--------------------------------------------------------------------
SIGIOT 6 Core IOT trap. A synonym for SIGABRT
SIGEMT 7,-,7 Term
SIGSTKFLT -,16,- Term Stack fault on coprocessor (unused)
SIGIO 23,29,22 Term I/O now possible (4.2BSD)
SIGCLD -,-,18 Ign A synonym for SIGCHLD
SIGPWR 29,30,19 Term Power failure (System V)
SIGINFO 29,-,- A synonym for SIGPWR
SIGLOST -,-,- Term File lock lost
SIGWINCH 28,28,20 Ign Window resize signal (4.3BSD, Sun)
SIGUNUSED -,31,- Term Unused signal (will be SIGSYS)
Une enveloppe de coquille peut attraper l'état de la sortie de votre démon. Voici comment cela fonctionne:
$ ./waitstatus true
pid 1512: exit status 0 (success)
$ ./waitstatus false
pid 1514: exit status 1 (abnormal)
$ ./waitstatus perl -e 'exit 21'
pid 1518: exit status 21 (abnormal)
$ ./waitstatus perl -e 'kill TERM => $$'
pid 1520: terminated on signal 15
$ ./waitstatus no-such-command
pid 1522: command not found: no-such-command
$ ./waitstatus /sbin/EACCES.contrived
pid 1524: command not executable: /sbin/EACCES.contrived
... et voici comment il est mis en œuvre:
$ cat ./waitstatus
#! /bin/bash
"$@" &
PID=$!
wait $PID
STATUS=$?
if [ $STATUS -gt 128 ]; then
MSG="terminated on signal $(( $STATUS - 128 ))";
else
case $STATUS in
0)
MSG="exit status 0 (success)"
;;
127)
MSG="command not found: $1"
;;
126)
MSG="command not executable: $1"
;;
*)
MSG="exit status $STATUS (abnormal)"
;;
esac
fi
echo "pid $PID: $MSG"
exit $STATUS
Vous pouvez modifier cette dernière ligne de echo
à l'invocation de votre commande logger
de système, par exemple, diriger le message d'état syslog .