Merge branch 'timers/urgent' of ssh://master.kernel.org/pub/scm/linux/kernel/git...
[linux-2.6] / kernel / signal.c
1 /*
2  *  linux/kernel/signal.c
3  *
4  *  Copyright (C) 1991, 1992  Linus Torvalds
5  *
6  *  1997-11-02  Modified for POSIX.1b signals by Richard Henderson
7  *
8  *  2003-06-02  Jim Houston - Concurrent Computer Corp.
9  *              Changes to use preallocated sigqueue structures
10  *              to allow signals to be sent reliably.
11  */
12
13 #include <linux/slab.h>
14 #include <linux/module.h>
15 #include <linux/init.h>
16 #include <linux/sched.h>
17 #include <linux/fs.h>
18 #include <linux/tty.h>
19 #include <linux/binfmts.h>
20 #include <linux/security.h>
21 #include <linux/syscalls.h>
22 #include <linux/ptrace.h>
23 #include <linux/signal.h>
24 #include <linux/signalfd.h>
25 #include <linux/capability.h>
26 #include <linux/freezer.h>
27 #include <linux/pid_namespace.h>
28 #include <linux/nsproxy.h>
29
30 #include <asm/param.h>
31 #include <asm/uaccess.h>
32 #include <asm/unistd.h>
33 #include <asm/siginfo.h>
34 #include "audit.h"      /* audit_signal_info() */
35
36 /*
37  * SLAB caches for signal bits.
38  */
39
40 static struct kmem_cache *sigqueue_cachep;
41
42 static int __sig_ignored(struct task_struct *t, int sig)
43 {
44         void __user *handler;
45
46         /* Is it explicitly or implicitly ignored? */
47
48         handler = t->sighand->action[sig - 1].sa.sa_handler;
49         return handler == SIG_IGN ||
50                 (handler == SIG_DFL && sig_kernel_ignore(sig));
51 }
52
53 static int sig_ignored(struct task_struct *t, int sig)
54 {
55         /*
56          * Tracers always want to know about signals..
57          */
58         if (t->ptrace & PT_PTRACED)
59                 return 0;
60
61         /*
62          * Blocked signals are never ignored, since the
63          * signal handler may change by the time it is
64          * unblocked.
65          */
66         if (sigismember(&t->blocked, sig) || sigismember(&t->real_blocked, sig))
67                 return 0;
68
69         return __sig_ignored(t, sig);
70 }
71
72 /*
73  * Re-calculate pending state from the set of locally pending
74  * signals, globally pending signals, and blocked signals.
75  */
76 static inline int has_pending_signals(sigset_t *signal, sigset_t *blocked)
77 {
78         unsigned long ready;
79         long i;
80
81         switch (_NSIG_WORDS) {
82         default:
83                 for (i = _NSIG_WORDS, ready = 0; --i >= 0 ;)
84                         ready |= signal->sig[i] &~ blocked->sig[i];
85                 break;
86
87         case 4: ready  = signal->sig[3] &~ blocked->sig[3];
88                 ready |= signal->sig[2] &~ blocked->sig[2];
89                 ready |= signal->sig[1] &~ blocked->sig[1];
90                 ready |= signal->sig[0] &~ blocked->sig[0];
91                 break;
92
93         case 2: ready  = signal->sig[1] &~ blocked->sig[1];
94                 ready |= signal->sig[0] &~ blocked->sig[0];
95                 break;
96
97         case 1: ready  = signal->sig[0] &~ blocked->sig[0];
98         }
99         return ready != 0;
100 }
101
102 #define PENDING(p,b) has_pending_signals(&(p)->signal, (b))
103
104 static int recalc_sigpending_tsk(struct task_struct *t)
105 {
106         if (t->signal->group_stop_count > 0 ||
107             PENDING(&t->pending, &t->blocked) ||
108             PENDING(&t->signal->shared_pending, &t->blocked)) {
109                 set_tsk_thread_flag(t, TIF_SIGPENDING);
110                 return 1;
111         }
112         /*
113          * We must never clear the flag in another thread, or in current
114          * when it's possible the current syscall is returning -ERESTART*.
115          * So we don't clear it here, and only callers who know they should do.
116          */
117         return 0;
118 }
119
120 /*
121  * After recalculating TIF_SIGPENDING, we need to make sure the task wakes up.
122  * This is superfluous when called on current, the wakeup is a harmless no-op.
123  */
124 void recalc_sigpending_and_wake(struct task_struct *t)
125 {
126         if (recalc_sigpending_tsk(t))
127                 signal_wake_up(t, 0);
128 }
129
130 void recalc_sigpending(void)
131 {
132         if (!recalc_sigpending_tsk(current) && !freezing(current))
133                 clear_thread_flag(TIF_SIGPENDING);
134
135 }
136
137 /* Given the mask, find the first available signal that should be serviced. */
138
139 int next_signal(struct sigpending *pending, sigset_t *mask)
140 {
141         unsigned long i, *s, *m, x;
142         int sig = 0;
143         
144         s = pending->signal.sig;
145         m = mask->sig;
146         switch (_NSIG_WORDS) {
147         default:
148                 for (i = 0; i < _NSIG_WORDS; ++i, ++s, ++m)
149                         if ((x = *s &~ *m) != 0) {
150                                 sig = ffz(~x) + i*_NSIG_BPW + 1;
151                                 break;
152                         }
153                 break;
154
155         case 2: if ((x = s[0] &~ m[0]) != 0)
156                         sig = 1;
157                 else if ((x = s[1] &~ m[1]) != 0)
158                         sig = _NSIG_BPW + 1;
159                 else
160                         break;
161                 sig += ffz(~x);
162                 break;
163
164         case 1: if ((x = *s &~ *m) != 0)
165                         sig = ffz(~x) + 1;
166                 break;
167         }
168         
169         return sig;
170 }
171
172 static struct sigqueue *__sigqueue_alloc(struct task_struct *t, gfp_t flags,
173                                          int override_rlimit)
174 {
175         struct sigqueue *q = NULL;
176         struct user_struct *user;
177
178         /*
179          * In order to avoid problems with "switch_user()", we want to make
180          * sure that the compiler doesn't re-load "t->user"
181          */
182         user = t->user;
183         barrier();
184         atomic_inc(&user->sigpending);
185         if (override_rlimit ||
186             atomic_read(&user->sigpending) <=
187                         t->signal->rlim[RLIMIT_SIGPENDING].rlim_cur)
188                 q = kmem_cache_alloc(sigqueue_cachep, flags);
189         if (unlikely(q == NULL)) {
190                 atomic_dec(&user->sigpending);
191         } else {
192                 INIT_LIST_HEAD(&q->list);
193                 q->flags = 0;
194                 q->user = get_uid(user);
195         }
196         return(q);
197 }
198
199 static void __sigqueue_free(struct sigqueue *q)
200 {
201         if (q->flags & SIGQUEUE_PREALLOC)
202                 return;
203         atomic_dec(&q->user->sigpending);
204         free_uid(q->user);
205         kmem_cache_free(sigqueue_cachep, q);
206 }
207
208 void flush_sigqueue(struct sigpending *queue)
209 {
210         struct sigqueue *q;
211
212         sigemptyset(&queue->signal);
213         while (!list_empty(&queue->list)) {
214                 q = list_entry(queue->list.next, struct sigqueue , list);
215                 list_del_init(&q->list);
216                 __sigqueue_free(q);
217         }
218 }
219
220 /*
221  * Flush all pending signals for a task.
222  */
223 void flush_signals(struct task_struct *t)
224 {
225         unsigned long flags;
226
227         spin_lock_irqsave(&t->sighand->siglock, flags);
228         clear_tsk_thread_flag(t, TIF_SIGPENDING);
229         flush_sigqueue(&t->pending);
230         flush_sigqueue(&t->signal->shared_pending);
231         spin_unlock_irqrestore(&t->sighand->siglock, flags);
232 }
233
234 static void __flush_itimer_signals(struct sigpending *pending)
235 {
236         sigset_t signal, retain;
237         struct sigqueue *q, *n;
238
239         signal = pending->signal;
240         sigemptyset(&retain);
241
242         list_for_each_entry_safe(q, n, &pending->list, list) {
243                 int sig = q->info.si_signo;
244
245                 if (likely(q->info.si_code != SI_TIMER)) {
246                         sigaddset(&retain, sig);
247                 } else {
248                         sigdelset(&signal, sig);
249                         list_del_init(&q->list);
250                         __sigqueue_free(q);
251                 }
252         }
253
254         sigorsets(&pending->signal, &signal, &retain);
255 }
256
257 void flush_itimer_signals(void)
258 {
259         struct task_struct *tsk = current;
260         unsigned long flags;
261
262         spin_lock_irqsave(&tsk->sighand->siglock, flags);
263         __flush_itimer_signals(&tsk->pending);
264         __flush_itimer_signals(&tsk->signal->shared_pending);
265         spin_unlock_irqrestore(&tsk->sighand->siglock, flags);
266 }
267
268 void ignore_signals(struct task_struct *t)
269 {
270         int i;
271
272         for (i = 0; i < _NSIG; ++i)
273                 t->sighand->action[i].sa.sa_handler = SIG_IGN;
274
275         flush_signals(t);
276 }
277
278 /*
279  * Flush all handlers for a task.
280  */
281
282 void
283 flush_signal_handlers(struct task_struct *t, int force_default)
284 {
285         int i;
286         struct k_sigaction *ka = &t->sighand->action[0];
287         for (i = _NSIG ; i != 0 ; i--) {
288                 if (force_default || ka->sa.sa_handler != SIG_IGN)
289                         ka->sa.sa_handler = SIG_DFL;
290                 ka->sa.sa_flags = 0;
291                 sigemptyset(&ka->sa.sa_mask);
292                 ka++;
293         }
294 }
295
296 int unhandled_signal(struct task_struct *tsk, int sig)
297 {
298         if (is_global_init(tsk))
299                 return 1;
300         if (tsk->ptrace & PT_PTRACED)
301                 return 0;
302         return (tsk->sighand->action[sig-1].sa.sa_handler == SIG_IGN) ||
303                 (tsk->sighand->action[sig-1].sa.sa_handler == SIG_DFL);
304 }
305
306
307 /* Notify the system that a driver wants to block all signals for this
308  * process, and wants to be notified if any signals at all were to be
309  * sent/acted upon.  If the notifier routine returns non-zero, then the
310  * signal will be acted upon after all.  If the notifier routine returns 0,
311  * then then signal will be blocked.  Only one block per process is
312  * allowed.  priv is a pointer to private data that the notifier routine
313  * can use to determine if the signal should be blocked or not.  */
314
315 void
316 block_all_signals(int (*notifier)(void *priv), void *priv, sigset_t *mask)
317 {
318         unsigned long flags;
319
320         spin_lock_irqsave(&current->sighand->siglock, flags);
321         current->notifier_mask = mask;
322         current->notifier_data = priv;
323         current->notifier = notifier;
324         spin_unlock_irqrestore(&current->sighand->siglock, flags);
325 }
326
327 /* Notify the system that blocking has ended. */
328
329 void
330 unblock_all_signals(void)
331 {
332         unsigned long flags;
333
334         spin_lock_irqsave(&current->sighand->siglock, flags);
335         current->notifier = NULL;
336         current->notifier_data = NULL;
337         recalc_sigpending();
338         spin_unlock_irqrestore(&current->sighand->siglock, flags);
339 }
340
341 static int collect_signal(int sig, struct sigpending *list, siginfo_t *info)
342 {
343         struct sigqueue *q, *first = NULL;
344         int still_pending = 0;
345
346         if (unlikely(!sigismember(&list->signal, sig)))
347                 return 0;
348
349         /*
350          * Collect the siginfo appropriate to this signal.  Check if
351          * there is another siginfo for the same signal.
352         */
353         list_for_each_entry(q, &list->list, list) {
354                 if (q->info.si_signo == sig) {
355                         if (first) {
356                                 still_pending = 1;
357                                 break;
358                         }
359                         first = q;
360                 }
361         }
362         if (first) {
363                 list_del_init(&first->list);
364                 copy_siginfo(info, &first->info);
365                 __sigqueue_free(first);
366                 if (!still_pending)
367                         sigdelset(&list->signal, sig);
368         } else {
369
370                 /* Ok, it wasn't in the queue.  This must be
371                    a fast-pathed signal or we must have been
372                    out of queue space.  So zero out the info.
373                  */
374                 sigdelset(&list->signal, sig);
375                 info->si_signo = sig;
376                 info->si_errno = 0;
377                 info->si_code = 0;
378                 info->si_pid = 0;
379                 info->si_uid = 0;
380         }
381         return 1;
382 }
383
384 static int __dequeue_signal(struct sigpending *pending, sigset_t *mask,
385                         siginfo_t *info)
386 {
387         int sig = next_signal(pending, mask);
388
389         if (sig) {
390                 if (current->notifier) {
391                         if (sigismember(current->notifier_mask, sig)) {
392                                 if (!(current->notifier)(current->notifier_data)) {
393                                         clear_thread_flag(TIF_SIGPENDING);
394                                         return 0;
395                                 }
396                         }
397                 }
398
399                 if (!collect_signal(sig, pending, info))
400                         sig = 0;
401         }
402
403         return sig;
404 }
405
406 /*
407  * Dequeue a signal and return the element to the caller, which is 
408  * expected to free it.
409  *
410  * All callers have to hold the siglock.
411  */
412 int dequeue_signal(struct task_struct *tsk, sigset_t *mask, siginfo_t *info)
413 {
414         int signr;
415
416         /* We only dequeue private signals from ourselves, we don't let
417          * signalfd steal them
418          */
419         signr = __dequeue_signal(&tsk->pending, mask, info);
420         if (!signr) {
421                 signr = __dequeue_signal(&tsk->signal->shared_pending,
422                                          mask, info);
423                 /*
424                  * itimer signal ?
425                  *
426                  * itimers are process shared and we restart periodic
427                  * itimers in the signal delivery path to prevent DoS
428                  * attacks in the high resolution timer case. This is
429                  * compliant with the old way of self restarting
430                  * itimers, as the SIGALRM is a legacy signal and only
431                  * queued once. Changing the restart behaviour to
432                  * restart the timer in the signal dequeue path is
433                  * reducing the timer noise on heavy loaded !highres
434                  * systems too.
435                  */
436                 if (unlikely(signr == SIGALRM)) {
437                         struct hrtimer *tmr = &tsk->signal->real_timer;
438
439                         if (!hrtimer_is_queued(tmr) &&
440                             tsk->signal->it_real_incr.tv64 != 0) {
441                                 hrtimer_forward(tmr, tmr->base->get_time(),
442                                                 tsk->signal->it_real_incr);
443                                 hrtimer_restart(tmr);
444                         }
445                 }
446         }
447
448         recalc_sigpending();
449         if (!signr)
450                 return 0;
451
452         if (unlikely(sig_kernel_stop(signr))) {
453                 /*
454                  * Set a marker that we have dequeued a stop signal.  Our
455                  * caller might release the siglock and then the pending
456                  * stop signal it is about to process is no longer in the
457                  * pending bitmasks, but must still be cleared by a SIGCONT
458                  * (and overruled by a SIGKILL).  So those cases clear this
459                  * shared flag after we've set it.  Note that this flag may
460                  * remain set after the signal we return is ignored or
461                  * handled.  That doesn't matter because its only purpose
462                  * is to alert stop-signal processing code when another
463                  * processor has come along and cleared the flag.
464                  */
465                 if (!(tsk->signal->flags & SIGNAL_GROUP_EXIT))
466                         tsk->signal->flags |= SIGNAL_STOP_DEQUEUED;
467         }
468         if ((info->si_code & __SI_MASK) == __SI_TIMER && info->si_sys_private) {
469                 /*
470                  * Release the siglock to ensure proper locking order
471                  * of timer locks outside of siglocks.  Note, we leave
472                  * irqs disabled here, since the posix-timers code is
473                  * about to disable them again anyway.
474                  */
475                 spin_unlock(&tsk->sighand->siglock);
476                 do_schedule_next_timer(info);
477                 spin_lock(&tsk->sighand->siglock);
478         }
479         return signr;
480 }
481
482 /*
483  * Tell a process that it has a new active signal..
484  *
485  * NOTE! we rely on the previous spin_lock to
486  * lock interrupts for us! We can only be called with
487  * "siglock" held, and the local interrupt must
488  * have been disabled when that got acquired!
489  *
490  * No need to set need_resched since signal event passing
491  * goes through ->blocked
492  */
493 void signal_wake_up(struct task_struct *t, int resume)
494 {
495         unsigned int mask;
496
497         set_tsk_thread_flag(t, TIF_SIGPENDING);
498
499         /*
500          * For SIGKILL, we want to wake it up in the stopped/traced/killable
501          * case. We don't check t->state here because there is a race with it
502          * executing another processor and just now entering stopped state.
503          * By using wake_up_state, we ensure the process will wake up and
504          * handle its death signal.
505          */
506         mask = TASK_INTERRUPTIBLE;
507         if (resume)
508                 mask |= TASK_WAKEKILL;
509         if (!wake_up_state(t, mask))
510                 kick_process(t);
511 }
512
513 /*
514  * Remove signals in mask from the pending set and queue.
515  * Returns 1 if any signals were found.
516  *
517  * All callers must be holding the siglock.
518  *
519  * This version takes a sigset mask and looks at all signals,
520  * not just those in the first mask word.
521  */
522 static int rm_from_queue_full(sigset_t *mask, struct sigpending *s)
523 {
524         struct sigqueue *q, *n;
525         sigset_t m;
526
527         sigandsets(&m, mask, &s->signal);
528         if (sigisemptyset(&m))
529                 return 0;
530
531         signandsets(&s->signal, &s->signal, mask);
532         list_for_each_entry_safe(q, n, &s->list, list) {
533                 if (sigismember(mask, q->info.si_signo)) {
534                         list_del_init(&q->list);
535                         __sigqueue_free(q);
536                 }
537         }
538         return 1;
539 }
540 /*
541  * Remove signals in mask from the pending set and queue.
542  * Returns 1 if any signals were found.
543  *
544  * All callers must be holding the siglock.
545  */
546 static int rm_from_queue(unsigned long mask, struct sigpending *s)
547 {
548         struct sigqueue *q, *n;
549
550         if (!sigtestsetmask(&s->signal, mask))
551                 return 0;
552
553         sigdelsetmask(&s->signal, mask);
554         list_for_each_entry_safe(q, n, &s->list, list) {
555                 if (q->info.si_signo < SIGRTMIN &&
556                     (mask & sigmask(q->info.si_signo))) {
557                         list_del_init(&q->list);
558                         __sigqueue_free(q);
559                 }
560         }
561         return 1;
562 }
563
564 /*
565  * Bad permissions for sending the signal
566  */
567 static int check_kill_permission(int sig, struct siginfo *info,
568                                  struct task_struct *t)
569 {
570         struct pid *sid;
571         int error;
572
573         if (!valid_signal(sig))
574                 return -EINVAL;
575
576         if (info != SEND_SIG_NOINFO && (is_si_special(info) || SI_FROMKERNEL(info)))
577                 return 0;
578
579         error = audit_signal_info(sig, t); /* Let audit system see the signal */
580         if (error)
581                 return error;
582
583         if ((current->euid ^ t->suid) && (current->euid ^ t->uid) &&
584             (current->uid  ^ t->suid) && (current->uid  ^ t->uid) &&
585             !capable(CAP_KILL)) {
586                 switch (sig) {
587                 case SIGCONT:
588                         sid = task_session(t);
589                         /*
590                          * We don't return the error if sid == NULL. The
591                          * task was unhashed, the caller must notice this.
592                          */
593                         if (!sid || sid == task_session(current))
594                                 break;
595                 default:
596                         return -EPERM;
597                 }
598         }
599
600         return security_task_kill(t, info, sig, 0);
601 }
602
603 /* forward decl */
604 static void do_notify_parent_cldstop(struct task_struct *tsk, int why);
605
606 /*
607  * Handle magic process-wide effects of stop/continue signals. Unlike
608  * the signal actions, these happen immediately at signal-generation
609  * time regardless of blocking, ignoring, or handling.  This does the
610  * actual continuing for SIGCONT, but not the actual stopping for stop
611  * signals. The process stop is done as a signal action for SIG_DFL.
612  *
613  * Returns true if the signal should be actually delivered, otherwise
614  * it should be dropped.
615  */
616 static int prepare_signal(int sig, struct task_struct *p)
617 {
618         struct signal_struct *signal = p->signal;
619         struct task_struct *t;
620
621         if (unlikely(signal->flags & SIGNAL_GROUP_EXIT)) {
622                 /*
623                  * The process is in the middle of dying, nothing to do.
624                  */
625         } else if (sig_kernel_stop(sig)) {
626                 /*
627                  * This is a stop signal.  Remove SIGCONT from all queues.
628                  */
629                 rm_from_queue(sigmask(SIGCONT), &signal->shared_pending);
630                 t = p;
631                 do {
632                         rm_from_queue(sigmask(SIGCONT), &t->pending);
633                 } while_each_thread(p, t);
634         } else if (sig == SIGCONT) {
635                 unsigned int why;
636                 /*
637                  * Remove all stop signals from all queues,
638                  * and wake all threads.
639                  */
640                 rm_from_queue(SIG_KERNEL_STOP_MASK, &signal->shared_pending);
641                 t = p;
642                 do {
643                         unsigned int state;
644                         rm_from_queue(SIG_KERNEL_STOP_MASK, &t->pending);
645                         /*
646                          * If there is a handler for SIGCONT, we must make
647                          * sure that no thread returns to user mode before
648                          * we post the signal, in case it was the only
649                          * thread eligible to run the signal handler--then
650                          * it must not do anything between resuming and
651                          * running the handler.  With the TIF_SIGPENDING
652                          * flag set, the thread will pause and acquire the
653                          * siglock that we hold now and until we've queued
654                          * the pending signal.
655                          *
656                          * Wake up the stopped thread _after_ setting
657                          * TIF_SIGPENDING
658                          */
659                         state = __TASK_STOPPED;
660                         if (sig_user_defined(t, SIGCONT) && !sigismember(&t->blocked, SIGCONT)) {
661                                 set_tsk_thread_flag(t, TIF_SIGPENDING);
662                                 state |= TASK_INTERRUPTIBLE;
663                         }
664                         wake_up_state(t, state);
665                 } while_each_thread(p, t);
666
667                 /*
668                  * Notify the parent with CLD_CONTINUED if we were stopped.
669                  *
670                  * If we were in the middle of a group stop, we pretend it
671                  * was already finished, and then continued. Since SIGCHLD
672                  * doesn't queue we report only CLD_STOPPED, as if the next
673                  * CLD_CONTINUED was dropped.
674                  */
675                 why = 0;
676                 if (signal->flags & SIGNAL_STOP_STOPPED)
677                         why |= SIGNAL_CLD_CONTINUED;
678                 else if (signal->group_stop_count)
679                         why |= SIGNAL_CLD_STOPPED;
680
681                 if (why) {
682                         /*
683                          * The first thread which returns from finish_stop()
684                          * will take ->siglock, notice SIGNAL_CLD_MASK, and
685                          * notify its parent. See get_signal_to_deliver().
686                          */
687                         signal->flags = why | SIGNAL_STOP_CONTINUED;
688                         signal->group_stop_count = 0;
689                         signal->group_exit_code = 0;
690                 } else {
691                         /*
692                          * We are not stopped, but there could be a stop
693                          * signal in the middle of being processed after
694                          * being removed from the queue.  Clear that too.
695                          */
696                         signal->flags &= ~SIGNAL_STOP_DEQUEUED;
697                 }
698         }
699
700         return !sig_ignored(p, sig);
701 }
702
703 /*
704  * Test if P wants to take SIG.  After we've checked all threads with this,
705  * it's equivalent to finding no threads not blocking SIG.  Any threads not
706  * blocking SIG were ruled out because they are not running and already
707  * have pending signals.  Such threads will dequeue from the shared queue
708  * as soon as they're available, so putting the signal on the shared queue
709  * will be equivalent to sending it to one such thread.
710  */
711 static inline int wants_signal(int sig, struct task_struct *p)
712 {
713         if (sigismember(&p->blocked, sig))
714                 return 0;
715         if (p->flags & PF_EXITING)
716                 return 0;
717         if (sig == SIGKILL)
718                 return 1;
719         if (task_is_stopped_or_traced(p))
720                 return 0;
721         return task_curr(p) || !signal_pending(p);
722 }
723
724 static void complete_signal(int sig, struct task_struct *p, int group)
725 {
726         struct signal_struct *signal = p->signal;
727         struct task_struct *t;
728
729         /*
730          * Now find a thread we can wake up to take the signal off the queue.
731          *
732          * If the main thread wants the signal, it gets first crack.
733          * Probably the least surprising to the average bear.
734          */
735         if (wants_signal(sig, p))
736                 t = p;
737         else if (!group || thread_group_empty(p))
738                 /*
739                  * There is just one thread and it does not need to be woken.
740                  * It will dequeue unblocked signals before it runs again.
741                  */
742                 return;
743         else {
744                 /*
745                  * Otherwise try to find a suitable thread.
746                  */
747                 t = signal->curr_target;
748                 while (!wants_signal(sig, t)) {
749                         t = next_thread(t);
750                         if (t == signal->curr_target)
751                                 /*
752                                  * No thread needs to be woken.
753                                  * Any eligible threads will see
754                                  * the signal in the queue soon.
755                                  */
756                                 return;
757                 }
758                 signal->curr_target = t;
759         }
760
761         /*
762          * Found a killable thread.  If the signal will be fatal,
763          * then start taking the whole group down immediately.
764          */
765         if (sig_fatal(p, sig) &&
766             !(signal->flags & (SIGNAL_UNKILLABLE | SIGNAL_GROUP_EXIT)) &&
767             !sigismember(&t->real_blocked, sig) &&
768             (sig == SIGKILL || !(t->ptrace & PT_PTRACED))) {
769                 /*
770                  * This signal will be fatal to the whole group.
771                  */
772                 if (!sig_kernel_coredump(sig)) {
773                         /*
774                          * Start a group exit and wake everybody up.
775                          * This way we don't have other threads
776                          * running and doing things after a slower
777                          * thread has the fatal signal pending.
778                          */
779                         signal->flags = SIGNAL_GROUP_EXIT;
780                         signal->group_exit_code = sig;
781                         signal->group_stop_count = 0;
782                         t = p;
783                         do {
784                                 sigaddset(&t->pending.signal, SIGKILL);
785                                 signal_wake_up(t, 1);
786                         } while_each_thread(p, t);
787                         return;
788                 }
789         }
790
791         /*
792          * The signal is already in the shared-pending queue.
793          * Tell the chosen thread to wake up and dequeue it.
794          */
795         signal_wake_up(t, sig == SIGKILL);
796         return;
797 }
798
799 static inline int legacy_queue(struct sigpending *signals, int sig)
800 {
801         return (sig < SIGRTMIN) && sigismember(&signals->signal, sig);
802 }
803
804 static int send_signal(int sig, struct siginfo *info, struct task_struct *t,
805                         int group)
806 {
807         struct sigpending *pending;
808         struct sigqueue *q;
809
810         assert_spin_locked(&t->sighand->siglock);
811         if (!prepare_signal(sig, t))
812                 return 0;
813
814         pending = group ? &t->signal->shared_pending : &t->pending;
815         /*
816          * Short-circuit ignored signals and support queuing
817          * exactly one non-rt signal, so that we can get more
818          * detailed information about the cause of the signal.
819          */
820         if (legacy_queue(pending, sig))
821                 return 0;
822         /*
823          * fast-pathed signals for kernel-internal things like SIGSTOP
824          * or SIGKILL.
825          */
826         if (info == SEND_SIG_FORCED)
827                 goto out_set;
828
829         /* Real-time signals must be queued if sent by sigqueue, or
830            some other real-time mechanism.  It is implementation
831            defined whether kill() does so.  We attempt to do so, on
832            the principle of least surprise, but since kill is not
833            allowed to fail with EAGAIN when low on memory we just
834            make sure at least one signal gets delivered and don't
835            pass on the info struct.  */
836
837         q = __sigqueue_alloc(t, GFP_ATOMIC, (sig < SIGRTMIN &&
838                                              (is_si_special(info) ||
839                                               info->si_code >= 0)));
840         if (q) {
841                 list_add_tail(&q->list, &pending->list);
842                 switch ((unsigned long) info) {
843                 case (unsigned long) SEND_SIG_NOINFO:
844                         q->info.si_signo = sig;
845                         q->info.si_errno = 0;
846                         q->info.si_code = SI_USER;
847                         q->info.si_pid = task_pid_vnr(current);
848                         q->info.si_uid = current->uid;
849                         break;
850                 case (unsigned long) SEND_SIG_PRIV:
851                         q->info.si_signo = sig;
852                         q->info.si_errno = 0;
853                         q->info.si_code = SI_KERNEL;
854                         q->info.si_pid = 0;
855                         q->info.si_uid = 0;
856                         break;
857                 default:
858                         copy_siginfo(&q->info, info);
859                         break;
860                 }
861         } else if (!is_si_special(info)) {
862                 if (sig >= SIGRTMIN && info->si_code != SI_USER)
863                 /*
864                  * Queue overflow, abort.  We may abort if the signal was rt
865                  * and sent by user using something other than kill().
866                  */
867                         return -EAGAIN;
868         }
869
870 out_set:
871         signalfd_notify(t, sig);
872         sigaddset(&pending->signal, sig);
873         complete_signal(sig, t, group);
874         return 0;
875 }
876
877 int print_fatal_signals;
878
879 static void print_fatal_signal(struct pt_regs *regs, int signr)
880 {
881         printk("%s/%d: potentially unexpected fatal signal %d.\n",
882                 current->comm, task_pid_nr(current), signr);
883
884 #if defined(__i386__) && !defined(__arch_um__)
885         printk("code at %08lx: ", regs->ip);
886         {
887                 int i;
888                 for (i = 0; i < 16; i++) {
889                         unsigned char insn;
890
891                         __get_user(insn, (unsigned char *)(regs->ip + i));
892                         printk("%02x ", insn);
893                 }
894         }
895 #endif
896         printk("\n");
897         show_regs(regs);
898 }
899
900 static int __init setup_print_fatal_signals(char *str)
901 {
902         get_option (&str, &print_fatal_signals);
903
904         return 1;
905 }
906
907 __setup("print-fatal-signals=", setup_print_fatal_signals);
908
909 int
910 __group_send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
911 {
912         return send_signal(sig, info, p, 1);
913 }
914
915 static int
916 specific_send_sig_info(int sig, struct siginfo *info, struct task_struct *t)
917 {
918         return send_signal(sig, info, t, 0);
919 }
920
921 /*
922  * Force a signal that the process can't ignore: if necessary
923  * we unblock the signal and change any SIG_IGN to SIG_DFL.
924  *
925  * Note: If we unblock the signal, we always reset it to SIG_DFL,
926  * since we do not want to have a signal handler that was blocked
927  * be invoked when user space had explicitly blocked it.
928  *
929  * We don't want to have recursive SIGSEGV's etc, for example,
930  * that is why we also clear SIGNAL_UNKILLABLE.
931  */
932 int
933 force_sig_info(int sig, struct siginfo *info, struct task_struct *t)
934 {
935         unsigned long int flags;
936         int ret, blocked, ignored;
937         struct k_sigaction *action;
938
939         spin_lock_irqsave(&t->sighand->siglock, flags);
940         action = &t->sighand->action[sig-1];
941         ignored = action->sa.sa_handler == SIG_IGN;
942         blocked = sigismember(&t->blocked, sig);
943         if (blocked || ignored) {
944                 action->sa.sa_handler = SIG_DFL;
945                 if (blocked) {
946                         sigdelset(&t->blocked, sig);
947                         recalc_sigpending_and_wake(t);
948                 }
949         }
950         if (action->sa.sa_handler == SIG_DFL)
951                 t->signal->flags &= ~SIGNAL_UNKILLABLE;
952         ret = specific_send_sig_info(sig, info, t);
953         spin_unlock_irqrestore(&t->sighand->siglock, flags);
954
955         return ret;
956 }
957
958 void
959 force_sig_specific(int sig, struct task_struct *t)
960 {
961         force_sig_info(sig, SEND_SIG_FORCED, t);
962 }
963
964 /*
965  * Nuke all other threads in the group.
966  */
967 void zap_other_threads(struct task_struct *p)
968 {
969         struct task_struct *t;
970
971         p->signal->group_stop_count = 0;
972
973         for (t = next_thread(p); t != p; t = next_thread(t)) {
974                 /*
975                  * Don't bother with already dead threads
976                  */
977                 if (t->exit_state)
978                         continue;
979
980                 /* SIGKILL will be handled before any pending SIGSTOP */
981                 sigaddset(&t->pending.signal, SIGKILL);
982                 signal_wake_up(t, 1);
983         }
984 }
985
986 int __fatal_signal_pending(struct task_struct *tsk)
987 {
988         return sigismember(&tsk->pending.signal, SIGKILL);
989 }
990 EXPORT_SYMBOL(__fatal_signal_pending);
991
992 struct sighand_struct *lock_task_sighand(struct task_struct *tsk, unsigned long *flags)
993 {
994         struct sighand_struct *sighand;
995
996         rcu_read_lock();
997         for (;;) {
998                 sighand = rcu_dereference(tsk->sighand);
999                 if (unlikely(sighand == NULL))
1000                         break;
1001
1002                 spin_lock_irqsave(&sighand->siglock, *flags);
1003                 if (likely(sighand == tsk->sighand))
1004                         break;
1005                 spin_unlock_irqrestore(&sighand->siglock, *flags);
1006         }
1007         rcu_read_unlock();
1008
1009         return sighand;
1010 }
1011
1012 int group_send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
1013 {
1014         unsigned long flags;
1015         int ret;
1016
1017         ret = check_kill_permission(sig, info, p);
1018
1019         if (!ret && sig) {
1020                 ret = -ESRCH;
1021                 if (lock_task_sighand(p, &flags)) {
1022                         ret = __group_send_sig_info(sig, info, p);
1023                         unlock_task_sighand(p, &flags);
1024                 }
1025         }
1026
1027         return ret;
1028 }
1029
1030 /*
1031  * __kill_pgrp_info() sends a signal to a process group: this is what the tty
1032  * control characters do (^C, ^Z etc)
1033  */
1034
1035 int __kill_pgrp_info(int sig, struct siginfo *info, struct pid *pgrp)
1036 {
1037         struct task_struct *p = NULL;
1038         int retval, success;
1039
1040         success = 0;
1041         retval = -ESRCH;
1042         do_each_pid_task(pgrp, PIDTYPE_PGID, p) {
1043                 int err = group_send_sig_info(sig, info, p);
1044                 success |= !err;
1045                 retval = err;
1046         } while_each_pid_task(pgrp, PIDTYPE_PGID, p);
1047         return success ? 0 : retval;
1048 }
1049
1050 int kill_pid_info(int sig, struct siginfo *info, struct pid *pid)
1051 {
1052         int error = -ESRCH;
1053         struct task_struct *p;
1054
1055         rcu_read_lock();
1056 retry:
1057         p = pid_task(pid, PIDTYPE_PID);
1058         if (p) {
1059                 error = group_send_sig_info(sig, info, p);
1060                 if (unlikely(error == -ESRCH))
1061                         /*
1062                          * The task was unhashed in between, try again.
1063                          * If it is dead, pid_task() will return NULL,
1064                          * if we race with de_thread() it will find the
1065                          * new leader.
1066                          */
1067                         goto retry;
1068         }
1069         rcu_read_unlock();
1070
1071         return error;
1072 }
1073
1074 int
1075 kill_proc_info(int sig, struct siginfo *info, pid_t pid)
1076 {
1077         int error;
1078         rcu_read_lock();
1079         error = kill_pid_info(sig, info, find_vpid(pid));
1080         rcu_read_unlock();
1081         return error;
1082 }
1083
1084 /* like kill_pid_info(), but doesn't use uid/euid of "current" */
1085 int kill_pid_info_as_uid(int sig, struct siginfo *info, struct pid *pid,
1086                       uid_t uid, uid_t euid, u32 secid)
1087 {
1088         int ret = -EINVAL;
1089         struct task_struct *p;
1090
1091         if (!valid_signal(sig))
1092                 return ret;
1093
1094         read_lock(&tasklist_lock);
1095         p = pid_task(pid, PIDTYPE_PID);
1096         if (!p) {
1097                 ret = -ESRCH;
1098                 goto out_unlock;
1099         }
1100         if ((info == SEND_SIG_NOINFO || (!is_si_special(info) && SI_FROMUSER(info)))
1101             && (euid != p->suid) && (euid != p->uid)
1102             && (uid != p->suid) && (uid != p->uid)) {
1103                 ret = -EPERM;
1104                 goto out_unlock;
1105         }
1106         ret = security_task_kill(p, info, sig, secid);
1107         if (ret)
1108                 goto out_unlock;
1109         if (sig && p->sighand) {
1110                 unsigned long flags;
1111                 spin_lock_irqsave(&p->sighand->siglock, flags);
1112                 ret = __group_send_sig_info(sig, info, p);
1113                 spin_unlock_irqrestore(&p->sighand->siglock, flags);
1114         }
1115 out_unlock:
1116         read_unlock(&tasklist_lock);
1117         return ret;
1118 }
1119 EXPORT_SYMBOL_GPL(kill_pid_info_as_uid);
1120
1121 /*
1122  * kill_something_info() interprets pid in interesting ways just like kill(2).
1123  *
1124  * POSIX specifies that kill(-1,sig) is unspecified, but what we have
1125  * is probably wrong.  Should make it like BSD or SYSV.
1126  */
1127
1128 static int kill_something_info(int sig, struct siginfo *info, int pid)
1129 {
1130         int ret;
1131
1132         if (pid > 0) {
1133                 rcu_read_lock();
1134                 ret = kill_pid_info(sig, info, find_vpid(pid));
1135                 rcu_read_unlock();
1136                 return ret;
1137         }
1138
1139         read_lock(&tasklist_lock);
1140         if (pid != -1) {
1141                 ret = __kill_pgrp_info(sig, info,
1142                                 pid ? find_vpid(-pid) : task_pgrp(current));
1143         } else {
1144                 int retval = 0, count = 0;
1145                 struct task_struct * p;
1146
1147                 for_each_process(p) {
1148                         if (p->pid > 1 && !same_thread_group(p, current)) {
1149                                 int err = group_send_sig_info(sig, info, p);
1150                                 ++count;
1151                                 if (err != -EPERM)
1152                                         retval = err;
1153                         }
1154                 }
1155                 ret = count ? retval : -ESRCH;
1156         }
1157         read_unlock(&tasklist_lock);
1158
1159         return ret;
1160 }
1161
1162 /*
1163  * These are for backward compatibility with the rest of the kernel source.
1164  */
1165
1166 /*
1167  * The caller must ensure the task can't exit.
1168  */
1169 int
1170 send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
1171 {
1172         int ret;
1173         unsigned long flags;
1174
1175         /*
1176          * Make sure legacy kernel users don't send in bad values
1177          * (normal paths check this in check_kill_permission).
1178          */
1179         if (!valid_signal(sig))
1180                 return -EINVAL;
1181
1182         spin_lock_irqsave(&p->sighand->siglock, flags);
1183         ret = specific_send_sig_info(sig, info, p);
1184         spin_unlock_irqrestore(&p->sighand->siglock, flags);
1185         return ret;
1186 }
1187
1188 #define __si_special(priv) \
1189         ((priv) ? SEND_SIG_PRIV : SEND_SIG_NOINFO)
1190
1191 int
1192 send_sig(int sig, struct task_struct *p, int priv)
1193 {
1194         return send_sig_info(sig, __si_special(priv), p);
1195 }
1196
1197 void
1198 force_sig(int sig, struct task_struct *p)
1199 {
1200         force_sig_info(sig, SEND_SIG_PRIV, p);
1201 }
1202
1203 /*
1204  * When things go south during signal handling, we
1205  * will force a SIGSEGV. And if the signal that caused
1206  * the problem was already a SIGSEGV, we'll want to
1207  * make sure we don't even try to deliver the signal..
1208  */
1209 int
1210 force_sigsegv(int sig, struct task_struct *p)
1211 {
1212         if (sig == SIGSEGV) {
1213                 unsigned long flags;
1214                 spin_lock_irqsave(&p->sighand->siglock, flags);
1215                 p->sighand->action[sig - 1].sa.sa_handler = SIG_DFL;
1216                 spin_unlock_irqrestore(&p->sighand->siglock, flags);
1217         }
1218         force_sig(SIGSEGV, p);
1219         return 0;
1220 }
1221
1222 int kill_pgrp(struct pid *pid, int sig, int priv)
1223 {
1224         int ret;
1225
1226         read_lock(&tasklist_lock);
1227         ret = __kill_pgrp_info(sig, __si_special(priv), pid);
1228         read_unlock(&tasklist_lock);
1229
1230         return ret;
1231 }
1232 EXPORT_SYMBOL(kill_pgrp);
1233
1234 int kill_pid(struct pid *pid, int sig, int priv)
1235 {
1236         return kill_pid_info(sig, __si_special(priv), pid);
1237 }
1238 EXPORT_SYMBOL(kill_pid);
1239
1240 int
1241 kill_proc(pid_t pid, int sig, int priv)
1242 {
1243         int ret;
1244
1245         rcu_read_lock();
1246         ret = kill_pid_info(sig, __si_special(priv), find_pid(pid));
1247         rcu_read_unlock();
1248         return ret;
1249 }
1250
1251 /*
1252  * These functions support sending signals using preallocated sigqueue
1253  * structures.  This is needed "because realtime applications cannot
1254  * afford to lose notifications of asynchronous events, like timer
1255  * expirations or I/O completions".  In the case of Posix Timers 
1256  * we allocate the sigqueue structure from the timer_create.  If this
1257  * allocation fails we are able to report the failure to the application
1258  * with an EAGAIN error.
1259  */
1260  
1261 struct sigqueue *sigqueue_alloc(void)
1262 {
1263         struct sigqueue *q;
1264
1265         if ((q = __sigqueue_alloc(current, GFP_KERNEL, 0)))
1266                 q->flags |= SIGQUEUE_PREALLOC;
1267         return(q);
1268 }
1269
1270 void sigqueue_free(struct sigqueue *q)
1271 {
1272         unsigned long flags;
1273         spinlock_t *lock = &current->sighand->siglock;
1274
1275         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1276         /*
1277          * We must hold ->siglock while testing q->list
1278          * to serialize with collect_signal() or with
1279          * __exit_signal()->flush_sigqueue().
1280          */
1281         spin_lock_irqsave(lock, flags);
1282         q->flags &= ~SIGQUEUE_PREALLOC;
1283         /*
1284          * If it is queued it will be freed when dequeued,
1285          * like the "regular" sigqueue.
1286          */
1287         if (!list_empty(&q->list))
1288                 q = NULL;
1289         spin_unlock_irqrestore(lock, flags);
1290
1291         if (q)
1292                 __sigqueue_free(q);
1293 }
1294
1295 int send_sigqueue(struct sigqueue *q, struct task_struct *t, int group)
1296 {
1297         int sig = q->info.si_signo;
1298         struct sigpending *pending;
1299         unsigned long flags;
1300         int ret;
1301
1302         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1303
1304         ret = -1;
1305         if (!likely(lock_task_sighand(t, &flags)))
1306                 goto ret;
1307
1308         ret = 1; /* the signal is ignored */
1309         if (!prepare_signal(sig, t))
1310                 goto out;
1311
1312         ret = 0;
1313         if (unlikely(!list_empty(&q->list))) {
1314                 /*
1315                  * If an SI_TIMER entry is already queue just increment
1316                  * the overrun count.
1317                  */
1318                 BUG_ON(q->info.si_code != SI_TIMER);
1319                 q->info.si_overrun++;
1320                 goto out;
1321         }
1322         q->info.si_overrun = 0;
1323
1324         signalfd_notify(t, sig);
1325         pending = group ? &t->signal->shared_pending : &t->pending;
1326         list_add_tail(&q->list, &pending->list);
1327         sigaddset(&pending->signal, sig);
1328         complete_signal(sig, t, group);
1329 out:
1330         unlock_task_sighand(t, &flags);
1331 ret:
1332         return ret;
1333 }
1334
1335 /*
1336  * Wake up any threads in the parent blocked in wait* syscalls.
1337  */
1338 static inline void __wake_up_parent(struct task_struct *p,
1339                                     struct task_struct *parent)
1340 {
1341         wake_up_interruptible_sync(&parent->signal->wait_chldexit);
1342 }
1343
1344 /*
1345  * Let a parent know about the death of a child.
1346  * For a stopped/continued status change, use do_notify_parent_cldstop instead.
1347  */
1348
1349 void do_notify_parent(struct task_struct *tsk, int sig)
1350 {
1351         struct siginfo info;
1352         unsigned long flags;
1353         struct sighand_struct *psig;
1354
1355         BUG_ON(sig == -1);
1356
1357         /* do_notify_parent_cldstop should have been called instead.  */
1358         BUG_ON(task_is_stopped_or_traced(tsk));
1359
1360         BUG_ON(!tsk->ptrace &&
1361                (tsk->group_leader != tsk || !thread_group_empty(tsk)));
1362
1363         info.si_signo = sig;
1364         info.si_errno = 0;
1365         /*
1366          * we are under tasklist_lock here so our parent is tied to
1367          * us and cannot exit and release its namespace.
1368          *
1369          * the only it can is to switch its nsproxy with sys_unshare,
1370          * bu uncharing pid namespaces is not allowed, so we'll always
1371          * see relevant namespace
1372          *
1373          * write_lock() currently calls preempt_disable() which is the
1374          * same as rcu_read_lock(), but according to Oleg, this is not
1375          * correct to rely on this
1376          */
1377         rcu_read_lock();
1378         info.si_pid = task_pid_nr_ns(tsk, tsk->parent->nsproxy->pid_ns);
1379         rcu_read_unlock();
1380
1381         info.si_uid = tsk->uid;
1382
1383         /* FIXME: find out whether or not this is supposed to be c*time. */
1384         info.si_utime = cputime_to_jiffies(cputime_add(tsk->utime,
1385                                                        tsk->signal->utime));
1386         info.si_stime = cputime_to_jiffies(cputime_add(tsk->stime,
1387                                                        tsk->signal->stime));
1388
1389         info.si_status = tsk->exit_code & 0x7f;
1390         if (tsk->exit_code & 0x80)
1391                 info.si_code = CLD_DUMPED;
1392         else if (tsk->exit_code & 0x7f)
1393                 info.si_code = CLD_KILLED;
1394         else {
1395                 info.si_code = CLD_EXITED;
1396                 info.si_status = tsk->exit_code >> 8;
1397         }
1398
1399         psig = tsk->parent->sighand;
1400         spin_lock_irqsave(&psig->siglock, flags);
1401         if (!tsk->ptrace && sig == SIGCHLD &&
1402             (psig->action[SIGCHLD-1].sa.sa_handler == SIG_IGN ||
1403              (psig->action[SIGCHLD-1].sa.sa_flags & SA_NOCLDWAIT))) {
1404                 /*
1405                  * We are exiting and our parent doesn't care.  POSIX.1
1406                  * defines special semantics for setting SIGCHLD to SIG_IGN
1407                  * or setting the SA_NOCLDWAIT flag: we should be reaped
1408                  * automatically and not left for our parent's wait4 call.
1409                  * Rather than having the parent do it as a magic kind of
1410                  * signal handler, we just set this to tell do_exit that we
1411                  * can be cleaned up without becoming a zombie.  Note that
1412                  * we still call __wake_up_parent in this case, because a
1413                  * blocked sys_wait4 might now return -ECHILD.
1414                  *
1415                  * Whether we send SIGCHLD or not for SA_NOCLDWAIT
1416                  * is implementation-defined: we do (if you don't want
1417                  * it, just use SIG_IGN instead).
1418                  */
1419                 tsk->exit_signal = -1;
1420                 if (psig->action[SIGCHLD-1].sa.sa_handler == SIG_IGN)
1421                         sig = 0;
1422         }
1423         if (valid_signal(sig) && sig > 0)
1424                 __group_send_sig_info(sig, &info, tsk->parent);
1425         __wake_up_parent(tsk, tsk->parent);
1426         spin_unlock_irqrestore(&psig->siglock, flags);
1427 }
1428
1429 static void do_notify_parent_cldstop(struct task_struct *tsk, int why)
1430 {
1431         struct siginfo info;
1432         unsigned long flags;
1433         struct task_struct *parent;
1434         struct sighand_struct *sighand;
1435
1436         if (tsk->ptrace & PT_PTRACED)
1437                 parent = tsk->parent;
1438         else {
1439                 tsk = tsk->group_leader;
1440                 parent = tsk->real_parent;
1441         }
1442
1443         info.si_signo = SIGCHLD;
1444         info.si_errno = 0;
1445         /*
1446          * see comment in do_notify_parent() abot the following 3 lines
1447          */
1448         rcu_read_lock();
1449         info.si_pid = task_pid_nr_ns(tsk, tsk->parent->nsproxy->pid_ns);
1450         rcu_read_unlock();
1451
1452         info.si_uid = tsk->uid;
1453
1454         /* FIXME: find out whether or not this is supposed to be c*time. */
1455         info.si_utime = cputime_to_jiffies(tsk->utime);
1456         info.si_stime = cputime_to_jiffies(tsk->stime);
1457
1458         info.si_code = why;
1459         switch (why) {
1460         case CLD_CONTINUED:
1461                 info.si_status = SIGCONT;
1462                 break;
1463         case CLD_STOPPED:
1464                 info.si_status = tsk->signal->group_exit_code & 0x7f;
1465                 break;
1466         case CLD_TRAPPED:
1467                 info.si_status = tsk->exit_code & 0x7f;
1468                 break;
1469         default:
1470                 BUG();
1471         }
1472
1473         sighand = parent->sighand;
1474         spin_lock_irqsave(&sighand->siglock, flags);
1475         if (sighand->action[SIGCHLD-1].sa.sa_handler != SIG_IGN &&
1476             !(sighand->action[SIGCHLD-1].sa.sa_flags & SA_NOCLDSTOP))
1477                 __group_send_sig_info(SIGCHLD, &info, parent);
1478         /*
1479          * Even if SIGCHLD is not generated, we must wake up wait4 calls.
1480          */
1481         __wake_up_parent(tsk, parent);
1482         spin_unlock_irqrestore(&sighand->siglock, flags);
1483 }
1484
1485 static inline int may_ptrace_stop(void)
1486 {
1487         if (!likely(current->ptrace & PT_PTRACED))
1488                 return 0;
1489         /*
1490          * Are we in the middle of do_coredump?
1491          * If so and our tracer is also part of the coredump stopping
1492          * is a deadlock situation, and pointless because our tracer
1493          * is dead so don't allow us to stop.
1494          * If SIGKILL was already sent before the caller unlocked
1495          * ->siglock we must see ->core_waiters != 0. Otherwise it
1496          * is safe to enter schedule().
1497          */
1498         if (unlikely(current->mm->core_waiters) &&
1499             unlikely(current->mm == current->parent->mm))
1500                 return 0;
1501
1502         return 1;
1503 }
1504
1505 /*
1506  * Return nonzero if there is a SIGKILL that should be waking us up.
1507  * Called with the siglock held.
1508  */
1509 static int sigkill_pending(struct task_struct *tsk)
1510 {
1511         return ((sigismember(&tsk->pending.signal, SIGKILL) ||
1512                  sigismember(&tsk->signal->shared_pending.signal, SIGKILL)) &&
1513                 !unlikely(sigismember(&tsk->blocked, SIGKILL)));
1514 }
1515
1516 /*
1517  * This must be called with current->sighand->siglock held.
1518  *
1519  * This should be the path for all ptrace stops.
1520  * We always set current->last_siginfo while stopped here.
1521  * That makes it a way to test a stopped process for
1522  * being ptrace-stopped vs being job-control-stopped.
1523  *
1524  * If we actually decide not to stop at all because the tracer
1525  * is gone, we keep current->exit_code unless clear_code.
1526  */
1527 static void ptrace_stop(int exit_code, int clear_code, siginfo_t *info)
1528 {
1529         int killed = 0;
1530
1531         if (arch_ptrace_stop_needed(exit_code, info)) {
1532                 /*
1533                  * The arch code has something special to do before a
1534                  * ptrace stop.  This is allowed to block, e.g. for faults
1535                  * on user stack pages.  We can't keep the siglock while
1536                  * calling arch_ptrace_stop, so we must release it now.
1537                  * To preserve proper semantics, we must do this before
1538                  * any signal bookkeeping like checking group_stop_count.
1539                  * Meanwhile, a SIGKILL could come in before we retake the
1540                  * siglock.  That must prevent us from sleeping in TASK_TRACED.
1541                  * So after regaining the lock, we must check for SIGKILL.
1542                  */
1543                 spin_unlock_irq(&current->sighand->siglock);
1544                 arch_ptrace_stop(exit_code, info);
1545                 spin_lock_irq(&current->sighand->siglock);
1546                 killed = sigkill_pending(current);
1547         }
1548
1549         /*
1550          * If there is a group stop in progress,
1551          * we must participate in the bookkeeping.
1552          */
1553         if (current->signal->group_stop_count > 0)
1554                 --current->signal->group_stop_count;
1555
1556         current->last_siginfo = info;
1557         current->exit_code = exit_code;
1558
1559         /* Let the debugger run.  */
1560         __set_current_state(TASK_TRACED);
1561         spin_unlock_irq(&current->sighand->siglock);
1562         read_lock(&tasklist_lock);
1563         if (!unlikely(killed) && may_ptrace_stop()) {
1564                 do_notify_parent_cldstop(current, CLD_TRAPPED);
1565                 read_unlock(&tasklist_lock);
1566                 schedule();
1567         } else {
1568                 /*
1569                  * By the time we got the lock, our tracer went away.
1570                  * Don't drop the lock yet, another tracer may come.
1571                  */
1572                 __set_current_state(TASK_RUNNING);
1573                 if (clear_code)
1574                         current->exit_code = 0;
1575                 read_unlock(&tasklist_lock);
1576         }
1577
1578         /*
1579          * While in TASK_TRACED, we were considered "frozen enough".
1580          * Now that we woke up, it's crucial if we're supposed to be
1581          * frozen that we freeze now before running anything substantial.
1582          */
1583         try_to_freeze();
1584
1585         /*
1586          * We are back.  Now reacquire the siglock before touching
1587          * last_siginfo, so that we are sure to have synchronized with
1588          * any signal-sending on another CPU that wants to examine it.
1589          */
1590         spin_lock_irq(&current->sighand->siglock);
1591         current->last_siginfo = NULL;
1592
1593         /*
1594          * Queued signals ignored us while we were stopped for tracing.
1595          * So check for any that we should take before resuming user mode.
1596          * This sets TIF_SIGPENDING, but never clears it.
1597          */
1598         recalc_sigpending_tsk(current);
1599 }
1600
1601 void ptrace_notify(int exit_code)
1602 {
1603         siginfo_t info;
1604
1605         BUG_ON((exit_code & (0x7f | ~0xffff)) != SIGTRAP);
1606
1607         memset(&info, 0, sizeof info);
1608         info.si_signo = SIGTRAP;
1609         info.si_code = exit_code;
1610         info.si_pid = task_pid_vnr(current);
1611         info.si_uid = current->uid;
1612
1613         /* Let the debugger run.  */
1614         spin_lock_irq(&current->sighand->siglock);
1615         ptrace_stop(exit_code, 1, &info);
1616         spin_unlock_irq(&current->sighand->siglock);
1617 }
1618
1619 static void
1620 finish_stop(int stop_count)
1621 {
1622         /*
1623          * If there are no other threads in the group, or if there is
1624          * a group stop in progress and we are the last to stop,
1625          * report to the parent.  When ptraced, every thread reports itself.
1626          */
1627         if (stop_count == 0 || (current->ptrace & PT_PTRACED)) {
1628                 read_lock(&tasklist_lock);
1629                 do_notify_parent_cldstop(current, CLD_STOPPED);
1630                 read_unlock(&tasklist_lock);
1631         }
1632
1633         do {
1634                 schedule();
1635         } while (try_to_freeze());
1636         /*
1637          * Now we don't run again until continued.
1638          */
1639         current->exit_code = 0;
1640 }
1641
1642 /*
1643  * This performs the stopping for SIGSTOP and other stop signals.
1644  * We have to stop all threads in the thread group.
1645  * Returns nonzero if we've actually stopped and released the siglock.
1646  * Returns zero if we didn't stop and still hold the siglock.
1647  */
1648 static int do_signal_stop(int signr)
1649 {
1650         struct signal_struct *sig = current->signal;
1651         int stop_count;
1652
1653         if (sig->group_stop_count > 0) {
1654                 /*
1655                  * There is a group stop in progress.  We don't need to
1656                  * start another one.
1657                  */
1658                 stop_count = --sig->group_stop_count;
1659         } else {
1660                 struct task_struct *t;
1661
1662                 if (unlikely((sig->flags & (SIGNAL_STOP_DEQUEUED | SIGNAL_UNKILLABLE))
1663                                          != SIGNAL_STOP_DEQUEUED) ||
1664                     unlikely(signal_group_exit(sig)))
1665                         return 0;
1666                 /*
1667                  * There is no group stop already in progress.
1668                  * We must initiate one now.
1669                  */
1670                 sig->group_exit_code = signr;
1671
1672                 stop_count = 0;
1673                 for (t = next_thread(current); t != current; t = next_thread(t))
1674                         /*
1675                          * Setting state to TASK_STOPPED for a group
1676                          * stop is always done with the siglock held,
1677                          * so this check has no races.
1678                          */
1679                         if (!(t->flags & PF_EXITING) &&
1680                             !task_is_stopped_or_traced(t)) {
1681                                 stop_count++;
1682                                 signal_wake_up(t, 0);
1683                         }
1684                 sig->group_stop_count = stop_count;
1685         }
1686
1687         if (stop_count == 0)
1688                 sig->flags = SIGNAL_STOP_STOPPED;
1689         current->exit_code = sig->group_exit_code;
1690         __set_current_state(TASK_STOPPED);
1691
1692         spin_unlock_irq(&current->sighand->siglock);
1693         finish_stop(stop_count);
1694         return 1;
1695 }
1696
1697 static int ptrace_signal(int signr, siginfo_t *info,
1698                          struct pt_regs *regs, void *cookie)
1699 {
1700         if (!(current->ptrace & PT_PTRACED))
1701                 return signr;
1702
1703         ptrace_signal_deliver(regs, cookie);
1704
1705         /* Let the debugger run.  */
1706         ptrace_stop(signr, 0, info);
1707
1708         /* We're back.  Did the debugger cancel the sig?  */
1709         signr = current->exit_code;
1710         if (signr == 0)
1711                 return signr;
1712
1713         current->exit_code = 0;
1714
1715         /* Update the siginfo structure if the signal has
1716            changed.  If the debugger wanted something
1717            specific in the siginfo structure then it should
1718            have updated *info via PTRACE_SETSIGINFO.  */
1719         if (signr != info->si_signo) {
1720                 info->si_signo = signr;
1721                 info->si_errno = 0;
1722                 info->si_code = SI_USER;
1723                 info->si_pid = task_pid_vnr(current->parent);
1724                 info->si_uid = current->parent->uid;
1725         }
1726
1727         /* If the (new) signal is now blocked, requeue it.  */
1728         if (sigismember(&current->blocked, signr)) {
1729                 specific_send_sig_info(signr, info, current);
1730                 signr = 0;
1731         }
1732
1733         return signr;
1734 }
1735
1736 int get_signal_to_deliver(siginfo_t *info, struct k_sigaction *return_ka,
1737                           struct pt_regs *regs, void *cookie)
1738 {
1739         struct sighand_struct *sighand = current->sighand;
1740         struct signal_struct *signal = current->signal;
1741         int signr;
1742
1743 relock:
1744         /*
1745          * We'll jump back here after any time we were stopped in TASK_STOPPED.
1746          * While in TASK_STOPPED, we were considered "frozen enough".
1747          * Now that we woke up, it's crucial if we're supposed to be
1748          * frozen that we freeze now before running anything substantial.
1749          */
1750         try_to_freeze();
1751
1752         spin_lock_irq(&sighand->siglock);
1753         /*
1754          * Every stopped thread goes here after wakeup. Check to see if
1755          * we should notify the parent, prepare_signal(SIGCONT) encodes
1756          * the CLD_ si_code into SIGNAL_CLD_MASK bits.
1757          */
1758         if (unlikely(signal->flags & SIGNAL_CLD_MASK)) {
1759                 int why = (signal->flags & SIGNAL_STOP_CONTINUED)
1760                                 ? CLD_CONTINUED : CLD_STOPPED;
1761                 signal->flags &= ~SIGNAL_CLD_MASK;
1762                 spin_unlock_irq(&sighand->siglock);
1763
1764                 read_lock(&tasklist_lock);
1765                 do_notify_parent_cldstop(current->group_leader, why);
1766                 read_unlock(&tasklist_lock);
1767                 goto relock;
1768         }
1769
1770         for (;;) {
1771                 struct k_sigaction *ka;
1772
1773                 if (unlikely(signal->group_stop_count > 0) &&
1774                     do_signal_stop(0))
1775                         goto relock;
1776
1777                 signr = dequeue_signal(current, &current->blocked, info);
1778                 if (!signr)
1779                         break; /* will return 0 */
1780
1781                 if (signr != SIGKILL) {
1782                         signr = ptrace_signal(signr, info, regs, cookie);
1783                         if (!signr)
1784                                 continue;
1785                 }
1786
1787                 ka = &sighand->action[signr-1];
1788                 if (ka->sa.sa_handler == SIG_IGN) /* Do nothing.  */
1789                         continue;
1790                 if (ka->sa.sa_handler != SIG_DFL) {
1791                         /* Run the handler.  */
1792                         *return_ka = *ka;
1793
1794                         if (ka->sa.sa_flags & SA_ONESHOT)
1795                                 ka->sa.sa_handler = SIG_DFL;
1796
1797                         break; /* will return non-zero "signr" value */
1798                 }
1799
1800                 /*
1801                  * Now we are doing the default action for this signal.
1802                  */
1803                 if (sig_kernel_ignore(signr)) /* Default is nothing. */
1804                         continue;
1805
1806                 /*
1807                  * Global init gets no signals it doesn't want.
1808                  */
1809                 if (unlikely(signal->flags & SIGNAL_UNKILLABLE) &&
1810                     !signal_group_exit(signal))
1811                         continue;
1812
1813                 if (sig_kernel_stop(signr)) {
1814                         /*
1815                          * The default action is to stop all threads in
1816                          * the thread group.  The job control signals
1817                          * do nothing in an orphaned pgrp, but SIGSTOP
1818                          * always works.  Note that siglock needs to be
1819                          * dropped during the call to is_orphaned_pgrp()
1820                          * because of lock ordering with tasklist_lock.
1821                          * This allows an intervening SIGCONT to be posted.
1822                          * We need to check for that and bail out if necessary.
1823                          */
1824                         if (signr != SIGSTOP) {
1825                                 spin_unlock_irq(&sighand->siglock);
1826
1827                                 /* signals can be posted during this window */
1828
1829                                 if (is_current_pgrp_orphaned())
1830                                         goto relock;
1831
1832                                 spin_lock_irq(&sighand->siglock);
1833                         }
1834
1835                         if (likely(do_signal_stop(signr))) {
1836                                 /* It released the siglock.  */
1837                                 goto relock;
1838                         }
1839
1840                         /*
1841                          * We didn't actually stop, due to a race
1842                          * with SIGCONT or something like that.
1843                          */
1844                         continue;
1845                 }
1846
1847                 spin_unlock_irq(&sighand->siglock);
1848
1849                 /*
1850                  * Anything else is fatal, maybe with a core dump.
1851                  */
1852                 current->flags |= PF_SIGNALED;
1853
1854                 if (sig_kernel_coredump(signr)) {
1855                         if (print_fatal_signals)
1856                                 print_fatal_signal(regs, signr);
1857                         /*
1858                          * If it was able to dump core, this kills all
1859                          * other threads in the group and synchronizes with
1860                          * their demise.  If we lost the race with another
1861                          * thread getting here, it set group_exit_code
1862                          * first and our do_group_exit call below will use
1863                          * that value and ignore the one we pass it.
1864                          */
1865                         do_coredump((long)signr, signr, regs);
1866                 }
1867
1868                 /*
1869                  * Death signals, no core dump.
1870                  */
1871                 do_group_exit(signr);
1872                 /* NOTREACHED */
1873         }
1874         spin_unlock_irq(&sighand->siglock);
1875         return signr;
1876 }
1877
1878 void exit_signals(struct task_struct *tsk)
1879 {
1880         int group_stop = 0;
1881         struct task_struct *t;
1882
1883         if (thread_group_empty(tsk) || signal_group_exit(tsk->signal)) {
1884                 tsk->flags |= PF_EXITING;
1885                 return;
1886         }
1887
1888         spin_lock_irq(&tsk->sighand->siglock);
1889         /*
1890          * From now this task is not visible for group-wide signals,
1891          * see wants_signal(), do_signal_stop().
1892          */
1893         tsk->flags |= PF_EXITING;
1894         if (!signal_pending(tsk))
1895                 goto out;
1896
1897         /* It could be that __group_complete_signal() choose us to
1898          * notify about group-wide signal. Another thread should be
1899          * woken now to take the signal since we will not.
1900          */
1901         for (t = tsk; (t = next_thread(t)) != tsk; )
1902                 if (!signal_pending(t) && !(t->flags & PF_EXITING))
1903                         recalc_sigpending_and_wake(t);
1904
1905         if (unlikely(tsk->signal->group_stop_count) &&
1906                         !--tsk->signal->group_stop_count) {
1907                 tsk->signal->flags = SIGNAL_STOP_STOPPED;
1908                 group_stop = 1;
1909         }
1910 out:
1911         spin_unlock_irq(&tsk->sighand->siglock);
1912
1913         if (unlikely(group_stop)) {
1914                 read_lock(&tasklist_lock);
1915                 do_notify_parent_cldstop(tsk, CLD_STOPPED);
1916                 read_unlock(&tasklist_lock);
1917         }
1918 }
1919
1920 EXPORT_SYMBOL(recalc_sigpending);
1921 EXPORT_SYMBOL_GPL(dequeue_signal);
1922 EXPORT_SYMBOL(flush_signals);
1923 EXPORT_SYMBOL(force_sig);
1924 EXPORT_SYMBOL(kill_proc);
1925 EXPORT_SYMBOL(ptrace_notify);
1926 EXPORT_SYMBOL(send_sig);
1927 EXPORT_SYMBOL(send_sig_info);
1928 EXPORT_SYMBOL(sigprocmask);
1929 EXPORT_SYMBOL(block_all_signals);
1930 EXPORT_SYMBOL(unblock_all_signals);
1931
1932
1933 /*
1934  * System call entry points.
1935  */
1936
1937 asmlinkage long sys_restart_syscall(void)
1938 {
1939         struct restart_block *restart = &current_thread_info()->restart_block;
1940         return restart->fn(restart);
1941 }
1942
1943 long do_no_restart_syscall(struct restart_block *param)
1944 {
1945         return -EINTR;
1946 }
1947
1948 /*
1949  * We don't need to get the kernel lock - this is all local to this
1950  * particular thread.. (and that's good, because this is _heavily_
1951  * used by various programs)
1952  */
1953
1954 /*
1955  * This is also useful for kernel threads that want to temporarily
1956  * (or permanently) block certain signals.
1957  *
1958  * NOTE! Unlike the user-mode sys_sigprocmask(), the kernel
1959  * interface happily blocks "unblockable" signals like SIGKILL
1960  * and friends.
1961  */
1962 int sigprocmask(int how, sigset_t *set, sigset_t *oldset)
1963 {
1964         int error;
1965
1966         spin_lock_irq(&current->sighand->siglock);
1967         if (oldset)
1968                 *oldset = current->blocked;
1969
1970         error = 0;
1971         switch (how) {
1972         case SIG_BLOCK:
1973                 sigorsets(&current->blocked, &current->blocked, set);
1974                 break;
1975         case SIG_UNBLOCK:
1976                 signandsets(&current->blocked, &current->blocked, set);
1977                 break;
1978         case SIG_SETMASK:
1979                 current->blocked = *set;
1980                 break;
1981         default:
1982                 error = -EINVAL;
1983         }
1984         recalc_sigpending();
1985         spin_unlock_irq(&current->sighand->siglock);
1986
1987         return error;
1988 }
1989
1990 asmlinkage long
1991 sys_rt_sigprocmask(int how, sigset_t __user *set, sigset_t __user *oset, size_t sigsetsize)
1992 {
1993         int error = -EINVAL;
1994         sigset_t old_set, new_set;
1995
1996         /* XXX: Don't preclude handling different sized sigset_t's.  */
1997         if (sigsetsize != sizeof(sigset_t))
1998                 goto out;
1999
2000         if (set) {
2001                 error = -EFAULT;
2002                 if (copy_from_user(&new_set, set, sizeof(*set)))
2003                         goto out;
2004                 sigdelsetmask(&new_set, sigmask(SIGKILL)|sigmask(SIGSTOP));
2005
2006                 error = sigprocmask(how, &new_set, &old_set);
2007                 if (error)
2008                         goto out;
2009                 if (oset)
2010                         goto set_old;
2011         } else if (oset) {
2012                 spin_lock_irq(&current->sighand->siglock);
2013                 old_set = current->blocked;
2014                 spin_unlock_irq(&current->sighand->siglock);
2015
2016         set_old:
2017                 error = -EFAULT;
2018                 if (copy_to_user(oset, &old_set, sizeof(*oset)))
2019                         goto out;
2020         }
2021         error = 0;
2022 out:
2023         return error;
2024 }
2025
2026 long do_sigpending(void __user *set, unsigned long sigsetsize)
2027 {
2028         long error = -EINVAL;
2029         sigset_t pending;
2030
2031         if (sigsetsize > sizeof(sigset_t))
2032                 goto out;
2033
2034         spin_lock_irq(&current->sighand->siglock);
2035         sigorsets(&pending, &current->pending.signal,
2036                   &current->signal->shared_pending.signal);
2037         spin_unlock_irq(&current->sighand->siglock);
2038
2039         /* Outside the lock because only this thread touches it.  */
2040         sigandsets(&pending, &current->blocked, &pending);
2041
2042         error = -EFAULT;
2043         if (!copy_to_user(set, &pending, sigsetsize))
2044                 error = 0;
2045
2046 out:
2047         return error;
2048 }       
2049
2050 asmlinkage long
2051 sys_rt_sigpending(sigset_t __user *set, size_t sigsetsize)
2052 {
2053         return do_sigpending(set, sigsetsize);
2054 }
2055
2056 #ifndef HAVE_ARCH_COPY_SIGINFO_TO_USER
2057
2058 int copy_siginfo_to_user(siginfo_t __user *to, siginfo_t *from)
2059 {
2060         int err;
2061
2062         if (!access_ok (VERIFY_WRITE, to, sizeof(siginfo_t)))
2063                 return -EFAULT;
2064         if (from->si_code < 0)
2065                 return __copy_to_user(to, from, sizeof(siginfo_t))
2066                         ? -EFAULT : 0;
2067         /*
2068          * If you change siginfo_t structure, please be sure
2069          * this code is fixed accordingly.
2070          * Please remember to update the signalfd_copyinfo() function
2071          * inside fs/signalfd.c too, in case siginfo_t changes.
2072          * It should never copy any pad contained in the structure
2073          * to avoid security leaks, but must copy the generic
2074          * 3 ints plus the relevant union member.
2075          */
2076         err = __put_user(from->si_signo, &to->si_signo);
2077         err |= __put_user(from->si_errno, &to->si_errno);
2078         err |= __put_user((short)from->si_code, &to->si_code);
2079         switch (from->si_code & __SI_MASK) {
2080         case __SI_KILL:
2081                 err |= __put_user(from->si_pid, &to->si_pid);
2082                 err |= __put_user(from->si_uid, &to->si_uid);
2083                 break;
2084         case __SI_TIMER:
2085                  err |= __put_user(from->si_tid, &to->si_tid);
2086                  err |= __put_user(from->si_overrun, &to->si_overrun);
2087                  err |= __put_user(from->si_ptr, &to->si_ptr);
2088                 break;
2089         case __SI_POLL:
2090                 err |= __put_user(from->si_band, &to->si_band);
2091                 err |= __put_user(from->si_fd, &to->si_fd);
2092                 break;
2093         case __SI_FAULT:
2094                 err |= __put_user(from->si_addr, &to->si_addr);
2095 #ifdef __ARCH_SI_TRAPNO
2096                 err |= __put_user(from->si_trapno, &to->si_trapno);
2097 #endif
2098                 break;
2099         case __SI_CHLD:
2100                 err |= __put_user(from->si_pid, &to->si_pid);
2101                 err |= __put_user(from->si_uid, &to->si_uid);
2102                 err |= __put_user(from->si_status, &to->si_status);
2103                 err |= __put_user(from->si_utime, &to->si_utime);
2104                 err |= __put_user(from->si_stime, &to->si_stime);
2105                 break;
2106         case __SI_RT: /* This is not generated by the kernel as of now. */
2107         case __SI_MESGQ: /* But this is */
2108                 err |= __put_user(from->si_pid, &to->si_pid);
2109                 err |= __put_user(from->si_uid, &to->si_uid);
2110                 err |= __put_user(from->si_ptr, &to->si_ptr);
2111                 break;
2112         default: /* this is just in case for now ... */
2113                 err |= __put_user(from->si_pid, &to->si_pid);
2114                 err |= __put_user(from->si_uid, &to->si_uid);
2115                 break;
2116         }
2117         return err;
2118 }
2119
2120 #endif
2121
2122 asmlinkage long
2123 sys_rt_sigtimedwait(const sigset_t __user *uthese,
2124                     siginfo_t __user *uinfo,
2125                     const struct timespec __user *uts,
2126                     size_t sigsetsize)
2127 {
2128         int ret, sig;
2129         sigset_t these;
2130         struct timespec ts;
2131         siginfo_t info;
2132         long timeout = 0;
2133
2134         /* XXX: Don't preclude handling different sized sigset_t's.  */
2135         if (sigsetsize != sizeof(sigset_t))
2136                 return -EINVAL;
2137
2138         if (copy_from_user(&these, uthese, sizeof(these)))
2139                 return -EFAULT;
2140                 
2141         /*
2142          * Invert the set of allowed signals to get those we
2143          * want to block.
2144          */
2145         sigdelsetmask(&these, sigmask(SIGKILL)|sigmask(SIGSTOP));
2146         signotset(&these);
2147
2148         if (uts) {
2149                 if (copy_from_user(&ts, uts, sizeof(ts)))
2150                         return -EFAULT;
2151                 if (ts.tv_nsec >= 1000000000L || ts.tv_nsec < 0
2152                     || ts.tv_sec < 0)
2153                         return -EINVAL;
2154         }
2155
2156         spin_lock_irq(&current->sighand->siglock);
2157         sig = dequeue_signal(current, &these, &info);
2158         if (!sig) {
2159                 timeout = MAX_SCHEDULE_TIMEOUT;
2160                 if (uts)
2161                         timeout = (timespec_to_jiffies(&ts)
2162                                    + (ts.tv_sec || ts.tv_nsec));
2163
2164                 if (timeout) {
2165                         /* None ready -- temporarily unblock those we're
2166                          * interested while we are sleeping in so that we'll
2167                          * be awakened when they arrive.  */
2168                         current->real_blocked = current->blocked;
2169                         sigandsets(&current->blocked, &current->blocked, &these);
2170                         recalc_sigpending();
2171                         spin_unlock_irq(&current->sighand->siglock);
2172
2173                         timeout = schedule_timeout_interruptible(timeout);
2174
2175                         spin_lock_irq(&current->sighand->siglock);
2176                         sig = dequeue_signal(current, &these, &info);
2177                         current->blocked = current->real_blocked;
2178                         siginitset(&current->real_blocked, 0);
2179                         recalc_sigpending();
2180                 }
2181         }
2182         spin_unlock_irq(&current->sighand->siglock);
2183
2184         if (sig) {
2185                 ret = sig;
2186                 if (uinfo) {
2187                         if (copy_siginfo_to_user(uinfo, &info))
2188                                 ret = -EFAULT;
2189                 }
2190         } else {
2191                 ret = -EAGAIN;
2192                 if (timeout)
2193                         ret = -EINTR;
2194         }
2195
2196         return ret;
2197 }
2198
2199 asmlinkage long
2200 sys_kill(int pid, int sig)
2201 {
2202         struct siginfo info;
2203
2204         info.si_signo = sig;
2205         info.si_errno = 0;
2206         info.si_code = SI_USER;
2207         info.si_pid = task_tgid_vnr(current);
2208         info.si_uid = current->uid;
2209
2210         return kill_something_info(sig, &info, pid);
2211 }
2212
2213 static int do_tkill(int tgid, int pid, int sig)
2214 {
2215         int error;
2216         struct siginfo info;
2217         struct task_struct *p;
2218         unsigned long flags;
2219
2220         error = -ESRCH;
2221         info.si_signo = sig;
2222         info.si_errno = 0;
2223         info.si_code = SI_TKILL;
2224         info.si_pid = task_tgid_vnr(current);
2225         info.si_uid = current->uid;
2226
2227         rcu_read_lock();
2228         p = find_task_by_vpid(pid);
2229         if (p && (tgid <= 0 || task_tgid_vnr(p) == tgid)) {
2230                 error = check_kill_permission(sig, &info, p);
2231                 /*
2232                  * The null signal is a permissions and process existence
2233                  * probe.  No signal is actually delivered.
2234                  *
2235                  * If lock_task_sighand() fails we pretend the task dies
2236                  * after receiving the signal. The window is tiny, and the
2237                  * signal is private anyway.
2238                  */
2239                 if (!error && sig && lock_task_sighand(p, &flags)) {
2240                         error = specific_send_sig_info(sig, &info, p);
2241                         unlock_task_sighand(p, &flags);
2242                 }
2243         }
2244         rcu_read_unlock();
2245
2246         return error;
2247 }
2248
2249 /**
2250  *  sys_tgkill - send signal to one specific thread
2251  *  @tgid: the thread group ID of the thread
2252  *  @pid: the PID of the thread
2253  *  @sig: signal to be sent
2254  *
2255  *  This syscall also checks the @tgid and returns -ESRCH even if the PID
2256  *  exists but it's not belonging to the target process anymore. This
2257  *  method solves the problem of threads exiting and PIDs getting reused.
2258  */
2259 asmlinkage long sys_tgkill(int tgid, int pid, int sig)
2260 {
2261         /* This is only valid for single tasks */
2262         if (pid <= 0 || tgid <= 0)
2263                 return -EINVAL;
2264
2265         return do_tkill(tgid, pid, sig);
2266 }
2267
2268 /*
2269  *  Send a signal to only one task, even if it's a CLONE_THREAD task.
2270  */
2271 asmlinkage long
2272 sys_tkill(int pid, int sig)
2273 {
2274         /* This is only valid for single tasks */
2275         if (pid <= 0)
2276                 return -EINVAL;
2277
2278         return do_tkill(0, pid, sig);
2279 }
2280
2281 asmlinkage long
2282 sys_rt_sigqueueinfo(int pid, int sig, siginfo_t __user *uinfo)
2283 {
2284         siginfo_t info;
2285
2286         if (copy_from_user(&info, uinfo, sizeof(siginfo_t)))
2287                 return -EFAULT;
2288
2289         /* Not even root can pretend to send signals from the kernel.
2290            Nor can they impersonate a kill(), which adds source info.  */
2291         if (info.si_code >= 0)
2292                 return -EPERM;
2293         info.si_signo = sig;
2294
2295         /* POSIX.1b doesn't mention process groups.  */
2296         return kill_proc_info(sig, &info, pid);
2297 }
2298
2299 int do_sigaction(int sig, struct k_sigaction *act, struct k_sigaction *oact)
2300 {
2301         struct task_struct *t = current;
2302         struct k_sigaction *k;
2303         sigset_t mask;
2304
2305         if (!valid_signal(sig) || sig < 1 || (act && sig_kernel_only(sig)))
2306                 return -EINVAL;
2307
2308         k = &t->sighand->action[sig-1];
2309
2310         spin_lock_irq(&current->sighand->siglock);
2311         if (oact)
2312                 *oact = *k;
2313
2314         if (act) {
2315                 sigdelsetmask(&act->sa.sa_mask,
2316                               sigmask(SIGKILL) | sigmask(SIGSTOP));
2317                 *k = *act;
2318                 /*
2319                  * POSIX 3.3.1.3:
2320                  *  "Setting a signal action to SIG_IGN for a signal that is
2321                  *   pending shall cause the pending signal to be discarded,
2322                  *   whether or not it is blocked."
2323                  *
2324                  *  "Setting a signal action to SIG_DFL for a signal that is
2325                  *   pending and whose default action is to ignore the signal
2326                  *   (for example, SIGCHLD), shall cause the pending signal to
2327                  *   be discarded, whether or not it is blocked"
2328                  */
2329                 if (__sig_ignored(t, sig)) {
2330                         sigemptyset(&mask);
2331                         sigaddset(&mask, sig);
2332                         rm_from_queue_full(&mask, &t->signal->shared_pending);
2333                         do {
2334                                 rm_from_queue_full(&mask, &t->pending);
2335                                 t = next_thread(t);
2336                         } while (t != current);
2337                 }
2338         }
2339
2340         spin_unlock_irq(&current->sighand->siglock);
2341         return 0;
2342 }
2343
2344 int 
2345 do_sigaltstack (const stack_t __user *uss, stack_t __user *uoss, unsigned long sp)
2346 {
2347         stack_t oss;
2348         int error;
2349
2350         if (uoss) {
2351                 oss.ss_sp = (void __user *) current->sas_ss_sp;
2352                 oss.ss_size = current->sas_ss_size;
2353                 oss.ss_flags = sas_ss_flags(sp);
2354         }
2355
2356         if (uss) {
2357                 void __user *ss_sp;
2358                 size_t ss_size;
2359                 int ss_flags;
2360
2361                 error = -EFAULT;
2362                 if (!access_ok(VERIFY_READ, uss, sizeof(*uss))
2363                     || __get_user(ss_sp, &uss->ss_sp)
2364                     || __get_user(ss_flags, &uss->ss_flags)
2365                     || __get_user(ss_size, &uss->ss_size))
2366                         goto out;
2367
2368                 error = -EPERM;
2369                 if (on_sig_stack(sp))
2370                         goto out;
2371
2372                 error = -EINVAL;
2373                 /*
2374                  *
2375                  * Note - this code used to test ss_flags incorrectly
2376                  *        old code may have been written using ss_flags==0
2377                  *        to mean ss_flags==SS_ONSTACK (as this was the only
2378                  *        way that worked) - this fix preserves that older
2379                  *        mechanism
2380                  */
2381                 if (ss_flags != SS_DISABLE && ss_flags != SS_ONSTACK && ss_flags != 0)
2382                         goto out;
2383
2384                 if (ss_flags == SS_DISABLE) {
2385                         ss_size = 0;
2386                         ss_sp = NULL;
2387                 } else {
2388                         error = -ENOMEM;
2389                         if (ss_size < MINSIGSTKSZ)
2390                                 goto out;
2391                 }
2392
2393                 current->sas_ss_sp = (unsigned long) ss_sp;
2394                 current->sas_ss_size = ss_size;
2395         }
2396
2397         if (uoss) {
2398                 error = -EFAULT;
2399                 if (copy_to_user(uoss, &oss, sizeof(oss)))
2400                         goto out;
2401         }
2402
2403         error = 0;
2404 out:
2405         return error;
2406 }
2407
2408 #ifdef __ARCH_WANT_SYS_SIGPENDING
2409
2410 asmlinkage long
2411 sys_sigpending(old_sigset_t __user *set)
2412 {
2413         return do_sigpending(set, sizeof(*set));
2414 }
2415
2416 #endif
2417
2418 #ifdef __ARCH_WANT_SYS_SIGPROCMASK
2419 /* Some platforms have their own version with special arguments others
2420    support only sys_rt_sigprocmask.  */
2421
2422 asmlinkage long
2423 sys_sigprocmask(int how, old_sigset_t __user *set, old_sigset_t __user *oset)
2424 {
2425         int error;
2426         old_sigset_t old_set, new_set;
2427
2428         if (set) {
2429                 error = -EFAULT;
2430                 if (copy_from_user(&new_set, set, sizeof(*set)))
2431                         goto out;
2432                 new_set &= ~(sigmask(SIGKILL) | sigmask(SIGSTOP));
2433
2434                 spin_lock_irq(&current->sighand->siglock);
2435                 old_set = current->blocked.sig[0];
2436
2437                 error = 0;
2438                 switch (how) {
2439                 default:
2440                         error = -EINVAL;
2441                         break;
2442                 case SIG_BLOCK:
2443                         sigaddsetmask(&current->blocked, new_set);
2444                         break;
2445                 case SIG_UNBLOCK:
2446                         sigdelsetmask(&current->blocked, new_set);
2447                         break;
2448                 case SIG_SETMASK:
2449                         current->blocked.sig[0] = new_set;
2450                         break;
2451                 }
2452
2453                 recalc_sigpending();
2454                 spin_unlock_irq(&current->sighand->siglock);
2455                 if (error)
2456                         goto out;
2457                 if (oset)
2458                         goto set_old;
2459         } else if (oset) {
2460                 old_set = current->blocked.sig[0];
2461         set_old:
2462                 error = -EFAULT;
2463                 if (copy_to_user(oset, &old_set, sizeof(*oset)))
2464                         goto out;
2465         }
2466         error = 0;
2467 out:
2468         return error;
2469 }
2470 #endif /* __ARCH_WANT_SYS_SIGPROCMASK */
2471
2472 #ifdef __ARCH_WANT_SYS_RT_SIGACTION
2473 asmlinkage long
2474 sys_rt_sigaction(int sig,
2475                  const struct sigaction __user *act,
2476                  struct sigaction __user *oact,
2477                  size_t sigsetsize)
2478 {
2479         struct k_sigaction new_sa, old_sa;
2480         int ret = -EINVAL;
2481
2482         /* XXX: Don't preclude handling different sized sigset_t's.  */
2483         if (sigsetsize != sizeof(sigset_t))
2484                 goto out;
2485
2486         if (act) {
2487                 if (copy_from_user(&new_sa.sa, act, sizeof(new_sa.sa)))
2488                         return -EFAULT;
2489         }
2490
2491         ret = do_sigaction(sig, act ? &new_sa : NULL, oact ? &old_sa : NULL);
2492
2493         if (!ret && oact) {
2494                 if (copy_to_user(oact, &old_sa.sa, sizeof(old_sa.sa)))
2495                         return -EFAULT;
2496         }
2497 out:
2498         return ret;
2499 }
2500 #endif /* __ARCH_WANT_SYS_RT_SIGACTION */
2501
2502 #ifdef __ARCH_WANT_SYS_SGETMASK
2503
2504 /*
2505  * For backwards compatibility.  Functionality superseded by sigprocmask.
2506  */
2507 asmlinkage long
2508 sys_sgetmask(void)
2509 {
2510         /* SMP safe */
2511         return current->blocked.sig[0];
2512 }
2513
2514 asmlinkage long
2515 sys_ssetmask(int newmask)
2516 {
2517         int old;
2518
2519         spin_lock_irq(&current->sighand->siglock);
2520         old = current->blocked.sig[0];
2521
2522         siginitset(&current->blocked, newmask & ~(sigmask(SIGKILL)|
2523                                                   sigmask(SIGSTOP)));
2524         recalc_sigpending();
2525         spin_unlock_irq(&current->sighand->siglock);
2526
2527         return old;
2528 }
2529 #endif /* __ARCH_WANT_SGETMASK */
2530
2531 #ifdef __ARCH_WANT_SYS_SIGNAL
2532 /*
2533  * For backwards compatibility.  Functionality superseded by sigaction.
2534  */
2535 asmlinkage unsigned long
2536 sys_signal(int sig, __sighandler_t handler)
2537 {
2538         struct k_sigaction new_sa, old_sa;
2539         int ret;
2540
2541         new_sa.sa.sa_handler = handler;
2542         new_sa.sa.sa_flags = SA_ONESHOT | SA_NOMASK;
2543         sigemptyset(&new_sa.sa.sa_mask);
2544
2545         ret = do_sigaction(sig, &new_sa, &old_sa);
2546
2547         return ret ? ret : (unsigned long)old_sa.sa.sa_handler;
2548 }
2549 #endif /* __ARCH_WANT_SYS_SIGNAL */
2550
2551 #ifdef __ARCH_WANT_SYS_PAUSE
2552
2553 asmlinkage long
2554 sys_pause(void)
2555 {
2556         current->state = TASK_INTERRUPTIBLE;
2557         schedule();
2558         return -ERESTARTNOHAND;
2559 }
2560
2561 #endif
2562
2563 #ifdef __ARCH_WANT_SYS_RT_SIGSUSPEND
2564 asmlinkage long sys_rt_sigsuspend(sigset_t __user *unewset, size_t sigsetsize)
2565 {
2566         sigset_t newset;
2567
2568         /* XXX: Don't preclude handling different sized sigset_t's.  */
2569         if (sigsetsize != sizeof(sigset_t))
2570                 return -EINVAL;
2571
2572         if (copy_from_user(&newset, unewset, sizeof(newset)))
2573                 return -EFAULT;
2574         sigdelsetmask(&newset, sigmask(SIGKILL)|sigmask(SIGSTOP));
2575
2576         spin_lock_irq(&current->sighand->siglock);
2577         current->saved_sigmask = current->blocked;
2578         current->blocked = newset;
2579         recalc_sigpending();
2580         spin_unlock_irq(&current->sighand->siglock);
2581
2582         current->state = TASK_INTERRUPTIBLE;
2583         schedule();
2584         set_restore_sigmask();
2585         return -ERESTARTNOHAND;
2586 }
2587 #endif /* __ARCH_WANT_SYS_RT_SIGSUSPEND */
2588
2589 __attribute__((weak)) const char *arch_vma_name(struct vm_area_struct *vma)
2590 {
2591         return NULL;
2592 }
2593
2594 void __init signals_init(void)
2595 {
2596         sigqueue_cachep = KMEM_CACHE(sigqueue, SLAB_PANIC);
2597 }