Merge branch 'linus' into x86/cleanups
[linux-2.6] / arch / x86 / kernel / signal_64.c
1 /*
2  *  Copyright (C) 1991, 1992  Linus Torvalds
3  *  Copyright (C) 2000, 2001, 2002 Andi Kleen SuSE Labs
4  *
5  *  1997-11-28  Modified for POSIX.1b signals by Richard Henderson
6  *  2000-06-20  Pentium III FXSR, SSE support by Gareth Hughes
7  *  2000-2002   x86-64 support by Andi Kleen
8  */
9
10 #include <linux/sched.h>
11 #include <linux/mm.h>
12 #include <linux/smp.h>
13 #include <linux/kernel.h>
14 #include <linux/signal.h>
15 #include <linux/errno.h>
16 #include <linux/wait.h>
17 #include <linux/ptrace.h>
18 #include <linux/unistd.h>
19 #include <linux/stddef.h>
20 #include <linux/personality.h>
21 #include <linux/compiler.h>
22 #include <linux/uaccess.h>
23
24 #include <asm/processor.h>
25 #include <asm/ucontext.h>
26 #include <asm/i387.h>
27 #include <asm/proto.h>
28 #include <asm/ia32_unistd.h>
29 #include <asm/mce.h>
30 #include "sigframe.h"
31
32 #define _BLOCKABLE (~(sigmask(SIGKILL) | sigmask(SIGSTOP)))
33
34 #define __FIX_EFLAGS    (X86_EFLAGS_AC | X86_EFLAGS_OF | \
35                          X86_EFLAGS_DF | X86_EFLAGS_TF | X86_EFLAGS_SF | \
36                          X86_EFLAGS_ZF | X86_EFLAGS_AF | X86_EFLAGS_PF | \
37                          X86_EFLAGS_CF)
38
39 #ifdef CONFIG_X86_32
40 # define FIX_EFLAGS     (__FIX_EFLAGS | X86_EFLAGS_RF)
41 #else
42 # define FIX_EFLAGS     __FIX_EFLAGS
43 #endif
44
45 asmlinkage long
46 sys_sigaltstack(const stack_t __user *uss, stack_t __user *uoss,
47                 struct pt_regs *regs)
48 {
49         return do_sigaltstack(uss, uoss, regs->sp);
50 }
51
52 /*
53  * Signal frame handlers.
54  */
55
56 static inline int save_i387(struct _fpstate __user *buf)
57 {
58         struct task_struct *tsk = current;
59         int err = 0;
60
61         BUILD_BUG_ON(sizeof(struct user_i387_struct) !=
62                         sizeof(tsk->thread.xstate->fxsave));
63
64         if ((unsigned long)buf % 16)
65                 printk("save_i387: bad fpstate %p\n", buf);
66
67         if (!used_math())
68                 return 0;
69         clear_used_math(); /* trigger finit */
70         if (task_thread_info(tsk)->status & TS_USEDFPU) {
71                 err = save_i387_checking((struct i387_fxsave_struct __user *)
72                                          buf);
73                 if (err)
74                         return err;
75                 task_thread_info(tsk)->status &= ~TS_USEDFPU;
76                 stts();
77         } else {
78                 if (__copy_to_user(buf, &tsk->thread.xstate->fxsave,
79                                    sizeof(struct i387_fxsave_struct)))
80                         return -1;
81         }
82         return 1;
83 }
84
85 /*
86  * This restores directly out of user space. Exceptions are handled.
87  */
88 static inline int restore_i387(struct _fpstate __user *buf)
89 {
90         struct task_struct *tsk = current;
91         int err;
92
93         if (!used_math()) {
94                 err = init_fpu(tsk);
95                 if (err)
96                         return err;
97         }
98
99         if (!(task_thread_info(current)->status & TS_USEDFPU)) {
100                 clts();
101                 task_thread_info(current)->status |= TS_USEDFPU;
102         }
103         return restore_fpu_checking((__force struct i387_fxsave_struct *)buf);
104 }
105
106 /*
107  * Do a signal return; undo the signal stack.
108  */
109 static int
110 restore_sigcontext(struct pt_regs *regs, struct sigcontext __user *sc,
111                    unsigned long *pax)
112 {
113         unsigned int err = 0;
114
115         /* Always make any pending restarted system calls return -EINTR */
116         current_thread_info()->restart_block.fn = do_no_restart_syscall;
117
118 #define COPY(x)         (err |= __get_user(regs->x, &sc->x))
119
120         COPY(di); COPY(si); COPY(bp); COPY(sp); COPY(bx);
121         COPY(dx); COPY(cx); COPY(ip);
122         COPY(r8);
123         COPY(r9);
124         COPY(r10);
125         COPY(r11);
126         COPY(r12);
127         COPY(r13);
128         COPY(r14);
129         COPY(r15);
130
131         /* Kernel saves and restores only the CS segment register on signals,
132          * which is the bare minimum needed to allow mixed 32/64-bit code.
133          * App's signal handler can save/restore other segments if needed. */
134         {
135                 unsigned cs;
136                 err |= __get_user(cs, &sc->cs);
137                 regs->cs = cs | 3;      /* Force into user mode */
138         }
139
140         {
141                 unsigned int tmpflags;
142                 err |= __get_user(tmpflags, &sc->flags);
143                 regs->flags = (regs->flags & ~FIX_EFLAGS) | (tmpflags & FIX_EFLAGS);
144                 regs->orig_ax = -1;             /* disable syscall checks */
145         }
146
147         {
148                 struct _fpstate __user *buf;
149                 err |= __get_user(buf, &sc->fpstate);
150
151                 if (buf) {
152                         if (!access_ok(VERIFY_READ, buf, sizeof(*buf)))
153                                 goto badframe;
154                         err |= restore_i387(buf);
155                 } else {
156                         struct task_struct *me = current;
157                         if (used_math()) {
158                                 clear_fpu(me);
159                                 clear_used_math();
160                         }
161                 }
162         }
163
164         err |= __get_user(*pax, &sc->ax);
165         return err;
166
167 badframe:
168         return 1;
169 }
170
171 asmlinkage long sys_rt_sigreturn(struct pt_regs *regs)
172 {
173         struct rt_sigframe __user *frame;
174         sigset_t set;
175         unsigned long ax;
176
177         frame = (struct rt_sigframe __user *)(regs->sp - sizeof(long));
178         if (!access_ok(VERIFY_READ, frame, sizeof(*frame)))
179                 goto badframe;
180         if (__copy_from_user(&set, &frame->uc.uc_sigmask, sizeof(set)))
181                 goto badframe;
182
183         sigdelsetmask(&set, ~_BLOCKABLE);
184         spin_lock_irq(&current->sighand->siglock);
185         current->blocked = set;
186         recalc_sigpending();
187         spin_unlock_irq(&current->sighand->siglock);
188
189         if (restore_sigcontext(regs, &frame->uc.uc_mcontext, &ax))
190                 goto badframe;
191
192         if (do_sigaltstack(&frame->uc.uc_stack, NULL, regs->sp) == -EFAULT)
193                 goto badframe;
194
195         return ax;
196
197 badframe:
198         signal_fault(regs, frame, "sigreturn");
199         return 0;
200 }
201
202 /*
203  * Set up a signal frame.
204  */
205
206 static inline int
207 setup_sigcontext(struct sigcontext __user *sc, struct pt_regs *regs,
208                 unsigned long mask, struct task_struct *me)
209 {
210         int err = 0;
211
212         err |= __put_user(regs->cs, &sc->cs);
213         err |= __put_user(0, &sc->gs);
214         err |= __put_user(0, &sc->fs);
215
216         err |= __put_user(regs->di, &sc->di);
217         err |= __put_user(regs->si, &sc->si);
218         err |= __put_user(regs->bp, &sc->bp);
219         err |= __put_user(regs->sp, &sc->sp);
220         err |= __put_user(regs->bx, &sc->bx);
221         err |= __put_user(regs->dx, &sc->dx);
222         err |= __put_user(regs->cx, &sc->cx);
223         err |= __put_user(regs->ax, &sc->ax);
224         err |= __put_user(regs->r8, &sc->r8);
225         err |= __put_user(regs->r9, &sc->r9);
226         err |= __put_user(regs->r10, &sc->r10);
227         err |= __put_user(regs->r11, &sc->r11);
228         err |= __put_user(regs->r12, &sc->r12);
229         err |= __put_user(regs->r13, &sc->r13);
230         err |= __put_user(regs->r14, &sc->r14);
231         err |= __put_user(regs->r15, &sc->r15);
232         err |= __put_user(me->thread.trap_no, &sc->trapno);
233         err |= __put_user(me->thread.error_code, &sc->err);
234         err |= __put_user(regs->ip, &sc->ip);
235         err |= __put_user(regs->flags, &sc->flags);
236         err |= __put_user(mask, &sc->oldmask);
237         err |= __put_user(me->thread.cr2, &sc->cr2);
238
239         return err;
240 }
241
242 /*
243  * Determine which stack to use..
244  */
245
246 static void __user *
247 get_stack(struct k_sigaction *ka, struct pt_regs *regs, unsigned long size)
248 {
249         unsigned long sp;
250
251         /* Default to using normal stack - redzone*/
252         sp = regs->sp - 128;
253
254         /* This is the X/Open sanctioned signal stack switching.  */
255         if (ka->sa.sa_flags & SA_ONSTACK) {
256                 if (sas_ss_flags(sp) == 0)
257                         sp = current->sas_ss_sp + current->sas_ss_size;
258         }
259
260         return (void __user *)round_down(sp - size, 16);
261 }
262
263 static int setup_rt_frame(int sig, struct k_sigaction *ka, siginfo_t *info,
264                            sigset_t *set, struct pt_regs *regs)
265 {
266         struct rt_sigframe __user *frame;
267         struct _fpstate __user *fp = NULL;
268         int err = 0;
269         struct task_struct *me = current;
270
271         if (used_math()) {
272                 fp = get_stack(ka, regs, sizeof(struct _fpstate));
273                 frame = (void __user *)round_down(
274                         (unsigned long)fp - sizeof(struct rt_sigframe), 16) - 8;
275
276                 if (!access_ok(VERIFY_WRITE, fp, sizeof(struct _fpstate)))
277                         goto give_sigsegv;
278
279                 if (save_i387(fp) < 0)
280                         err |= -1;
281         } else
282                 frame = get_stack(ka, regs, sizeof(struct rt_sigframe)) - 8;
283
284         if (!access_ok(VERIFY_WRITE, frame, sizeof(*frame)))
285                 goto give_sigsegv;
286
287         if (ka->sa.sa_flags & SA_SIGINFO) {
288                 err |= copy_siginfo_to_user(&frame->info, info);
289                 if (err)
290                         goto give_sigsegv;
291         }
292
293         /* Create the ucontext.  */
294         err |= __put_user(0, &frame->uc.uc_flags);
295         err |= __put_user(0, &frame->uc.uc_link);
296         err |= __put_user(me->sas_ss_sp, &frame->uc.uc_stack.ss_sp);
297         err |= __put_user(sas_ss_flags(regs->sp),
298                           &frame->uc.uc_stack.ss_flags);
299         err |= __put_user(me->sas_ss_size, &frame->uc.uc_stack.ss_size);
300         err |= setup_sigcontext(&frame->uc.uc_mcontext, regs, set->sig[0], me);
301         err |= __put_user(fp, &frame->uc.uc_mcontext.fpstate);
302         if (sizeof(*set) == 16) {
303                 __put_user(set->sig[0], &frame->uc.uc_sigmask.sig[0]);
304                 __put_user(set->sig[1], &frame->uc.uc_sigmask.sig[1]);
305         } else
306                 err |= __copy_to_user(&frame->uc.uc_sigmask, set, sizeof(*set));
307
308         /* Set up to return from userspace.  If provided, use a stub
309            already in userspace.  */
310         /* x86-64 should always use SA_RESTORER. */
311         if (ka->sa.sa_flags & SA_RESTORER) {
312                 err |= __put_user(ka->sa.sa_restorer, &frame->pretcode);
313         } else {
314                 /* could use a vstub here */
315                 goto give_sigsegv;
316         }
317
318         if (err)
319                 goto give_sigsegv;
320
321         /* Set up registers for signal handler */
322         regs->di = sig;
323         /* In case the signal handler was declared without prototypes */
324         regs->ax = 0;
325
326         /* This also works for non SA_SIGINFO handlers because they expect the
327            next argument after the signal number on the stack. */
328         regs->si = (unsigned long)&frame->info;
329         regs->dx = (unsigned long)&frame->uc;
330         regs->ip = (unsigned long) ka->sa.sa_handler;
331
332         regs->sp = (unsigned long)frame;
333
334         /* Set up the CS register to run signal handlers in 64-bit mode,
335            even if the handler happens to be interrupting 32-bit code. */
336         regs->cs = __USER_CS;
337
338         return 0;
339
340 give_sigsegv:
341         force_sigsegv(sig, current);
342         return -EFAULT;
343 }
344
345 /*
346  * Return -1L or the syscall number that @regs is executing.
347  */
348 static long current_syscall(struct pt_regs *regs)
349 {
350         /*
351          * We always sign-extend a -1 value being set here,
352          * so this is always either -1L or a syscall number.
353          */
354         return regs->orig_ax;
355 }
356
357 /*
358  * Return a value that is -EFOO if the system call in @regs->orig_ax
359  * returned an error.  This only works for @regs from @current.
360  */
361 static long current_syscall_ret(struct pt_regs *regs)
362 {
363 #ifdef CONFIG_IA32_EMULATION
364         if (test_thread_flag(TIF_IA32))
365                 /*
366                  * Sign-extend the value so (int)-EFOO becomes (long)-EFOO
367                  * and will match correctly in comparisons.
368                  */
369                 return (int) regs->ax;
370 #endif
371         return regs->ax;
372 }
373
374 /*
375  * OK, we're invoking a handler
376  */
377
378 static int
379 handle_signal(unsigned long sig, siginfo_t *info, struct k_sigaction *ka,
380               sigset_t *oldset, struct pt_regs *regs)
381 {
382         int ret;
383
384         /* Are we from a system call? */
385         if (current_syscall(regs) >= 0) {
386                 /* If so, check system call restarting.. */
387                 switch (current_syscall_ret(regs)) {
388                 case -ERESTART_RESTARTBLOCK:
389                 case -ERESTARTNOHAND:
390                         regs->ax = -EINTR;
391                         break;
392
393                 case -ERESTARTSYS:
394                         if (!(ka->sa.sa_flags & SA_RESTART)) {
395                                 regs->ax = -EINTR;
396                                 break;
397                         }
398                 /* fallthrough */
399                 case -ERESTARTNOINTR:
400                         regs->ax = regs->orig_ax;
401                         regs->ip -= 2;
402                         break;
403                 }
404         }
405
406         /*
407          * If TF is set due to a debugger (TIF_FORCED_TF), clear the TF
408          * flag so that register information in the sigcontext is correct.
409          */
410         if (unlikely(regs->flags & X86_EFLAGS_TF) &&
411             likely(test_and_clear_thread_flag(TIF_FORCED_TF)))
412                 regs->flags &= ~X86_EFLAGS_TF;
413
414 #ifdef CONFIG_IA32_EMULATION
415         if (test_thread_flag(TIF_IA32)) {
416                 if (ka->sa.sa_flags & SA_SIGINFO)
417                         ret = ia32_setup_rt_frame(sig, ka, info, oldset, regs);
418                 else
419                         ret = ia32_setup_frame(sig, ka, oldset, regs);
420         } else
421 #endif
422         ret = setup_rt_frame(sig, ka, info, oldset, regs);
423
424         if (ret == 0) {
425                 /*
426                  * This has nothing to do with segment registers,
427                  * despite the name.  This magic affects uaccess.h
428                  * macros' behavior.  Reset it to the normal setting.
429                  */
430                 set_fs(USER_DS);
431
432                 /*
433                  * Clear the direction flag as per the ABI for function entry.
434                  */
435                 regs->flags &= ~X86_EFLAGS_DF;
436
437                 /*
438                  * Clear TF when entering the signal handler, but
439                  * notify any tracer that was single-stepping it.
440                  * The tracer may want to single-step inside the
441                  * handler too.
442                  */
443                 regs->flags &= ~X86_EFLAGS_TF;
444                 if (test_thread_flag(TIF_SINGLESTEP))
445                         ptrace_notify(SIGTRAP);
446
447                 spin_lock_irq(&current->sighand->siglock);
448                 sigorsets(&current->blocked, &current->blocked, &ka->sa.sa_mask);
449                 if (!(ka->sa.sa_flags & SA_NODEFER))
450                         sigaddset(&current->blocked, sig);
451                 recalc_sigpending();
452                 spin_unlock_irq(&current->sighand->siglock);
453         }
454
455         return ret;
456 }
457
458 /*
459  * Note that 'init' is a special process: it doesn't get signals it doesn't
460  * want to handle. Thus you cannot kill init even with a SIGKILL even by
461  * mistake.
462  */
463 static void do_signal(struct pt_regs *regs)
464 {
465         struct k_sigaction ka;
466         siginfo_t info;
467         int signr;
468         sigset_t *oldset;
469
470         /*
471          * We want the common case to go fast, which is why we may in certain
472          * cases get here from kernel mode. Just return without doing anything
473          * if so.
474          * X86_32: vm86 regs switched out by assembly code before reaching
475          * here, so testing against kernel CS suffices.
476          */
477         if (!user_mode(regs))
478                 return;
479
480         if (current_thread_info()->status & TS_RESTORE_SIGMASK)
481                 oldset = &current->saved_sigmask;
482         else
483                 oldset = &current->blocked;
484
485         signr = get_signal_to_deliver(&info, &ka, regs, NULL);
486         if (signr > 0) {
487                 /* Re-enable any watchpoints before delivering the
488                  * signal to user space. The processor register will
489                  * have been cleared if the watchpoint triggered
490                  * inside the kernel.
491                  */
492                 if (current->thread.debugreg7)
493                         set_debugreg(current->thread.debugreg7, 7);
494
495                 /* Whee!  Actually deliver the signal.  */
496                 if (handle_signal(signr, &info, &ka, oldset, regs) == 0) {
497                         /*
498                          * A signal was successfully delivered; the saved
499                          * sigmask will have been stored in the signal frame,
500                          * and will be restored by sigreturn, so we can simply
501                          * clear the TS_RESTORE_SIGMASK flag.
502                          */
503                         current_thread_info()->status &= ~TS_RESTORE_SIGMASK;
504                 }
505                 return;
506         }
507
508         /* Did we come from a system call? */
509         if (current_syscall(regs) >= 0) {
510                 /* Restart the system call - no handlers present */
511                 switch (current_syscall_ret(regs)) {
512                 case -ERESTARTNOHAND:
513                 case -ERESTARTSYS:
514                 case -ERESTARTNOINTR:
515                         regs->ax = regs->orig_ax;
516                         regs->ip -= 2;
517                         break;
518                 case -ERESTART_RESTARTBLOCK:
519                         regs->ax = test_thread_flag(TIF_IA32) ?
520                                         __NR_ia32_restart_syscall :
521                                         __NR_restart_syscall;
522                         regs->ip -= 2;
523                         break;
524                 }
525         }
526
527         /*
528          * If there's no signal to deliver, we just put the saved sigmask
529          * back.
530          */
531         if (current_thread_info()->status & TS_RESTORE_SIGMASK) {
532                 current_thread_info()->status &= ~TS_RESTORE_SIGMASK;
533                 sigprocmask(SIG_SETMASK, &current->saved_sigmask, NULL);
534         }
535 }
536
537 void do_notify_resume(struct pt_regs *regs, void *unused,
538                       __u32 thread_info_flags)
539 {
540 #ifdef CONFIG_X86_MCE
541         /* notify userspace of pending MCEs */
542         if (thread_info_flags & _TIF_MCE_NOTIFY)
543                 mce_notify_user();
544 #endif /* CONFIG_X86_MCE */
545
546         /* deal with pending signal delivery */
547         if (thread_info_flags & _TIF_SIGPENDING)
548                 do_signal(regs);
549 }
550
551 void signal_fault(struct pt_regs *regs, void __user *frame, char *where)
552 {
553         struct task_struct *me = current;
554         if (show_unhandled_signals && printk_ratelimit()) {
555                 printk("%s[%d] bad frame in %s frame:%p ip:%lx sp:%lx orax:%lx",
556                me->comm, me->pid, where, frame, regs->ip,
557                    regs->sp, regs->orig_ax);
558                 print_vma_addr(" in ", regs->ip);
559                 printk("\n");
560         }
561
562         force_sig(SIGSEGV, me);
563 }