Merge branches 'core/iommu', 'x86/amd-iommu' and 'x86/iommu' into x86-v28-for-linus...
[linux-2.6] / arch / x86 / kernel / signal_64.c
1 /*
2  *  Copyright (C) 1991, 1992  Linus Torvalds
3  *  Copyright (C) 2000, 2001, 2002 Andi Kleen SuSE Labs
4  *
5  *  1997-11-28  Modified for POSIX.1b signals by Richard Henderson
6  *  2000-06-20  Pentium III FXSR, SSE support by Gareth Hughes
7  *  2000-2002   x86-64 support by Andi Kleen
8  */
9
10 #include <linux/sched.h>
11 #include <linux/mm.h>
12 #include <linux/smp.h>
13 #include <linux/kernel.h>
14 #include <linux/signal.h>
15 #include <linux/errno.h>
16 #include <linux/wait.h>
17 #include <linux/ptrace.h>
18 #include <linux/tracehook.h>
19 #include <linux/unistd.h>
20 #include <linux/stddef.h>
21 #include <linux/personality.h>
22 #include <linux/compiler.h>
23 #include <linux/uaccess.h>
24
25 #include <asm/processor.h>
26 #include <asm/ucontext.h>
27 #include <asm/i387.h>
28 #include <asm/proto.h>
29 #include <asm/ia32_unistd.h>
30 #include <asm/mce.h>
31 #include <asm/syscall.h>
32 #include <asm/syscalls.h>
33 #include "sigframe.h"
34
35 #define _BLOCKABLE (~(sigmask(SIGKILL) | sigmask(SIGSTOP)))
36
37 #define __FIX_EFLAGS    (X86_EFLAGS_AC | X86_EFLAGS_OF | \
38                          X86_EFLAGS_DF | X86_EFLAGS_TF | X86_EFLAGS_SF | \
39                          X86_EFLAGS_ZF | X86_EFLAGS_AF | X86_EFLAGS_PF | \
40                          X86_EFLAGS_CF)
41
42 #ifdef CONFIG_X86_32
43 # define FIX_EFLAGS     (__FIX_EFLAGS | X86_EFLAGS_RF)
44 #else
45 # define FIX_EFLAGS     __FIX_EFLAGS
46 #endif
47
48 asmlinkage long
49 sys_sigaltstack(const stack_t __user *uss, stack_t __user *uoss,
50                 struct pt_regs *regs)
51 {
52         return do_sigaltstack(uss, uoss, regs->sp);
53 }
54
55 /*
56  * Signal frame handlers.
57  */
58
59 static inline int save_i387(struct _fpstate __user *buf)
60 {
61         struct task_struct *tsk = current;
62         int err = 0;
63
64         BUILD_BUG_ON(sizeof(struct user_i387_struct) !=
65                         sizeof(tsk->thread.xstate->fxsave));
66
67         if ((unsigned long)buf % 16)
68                 printk("save_i387: bad fpstate %p\n", buf);
69
70         if (!used_math())
71                 return 0;
72         clear_used_math(); /* trigger finit */
73         if (task_thread_info(tsk)->status & TS_USEDFPU) {
74                 err = save_i387_checking((struct i387_fxsave_struct __user *)
75                                          buf);
76                 if (err)
77                         return err;
78                 task_thread_info(tsk)->status &= ~TS_USEDFPU;
79                 stts();
80         } else {
81                 if (__copy_to_user(buf, &tsk->thread.xstate->fxsave,
82                                    sizeof(struct i387_fxsave_struct)))
83                         return -1;
84         }
85         return 1;
86 }
87
88 /*
89  * This restores directly out of user space. Exceptions are handled.
90  */
91 static inline int restore_i387(struct _fpstate __user *buf)
92 {
93         struct task_struct *tsk = current;
94         int err;
95
96         if (!used_math()) {
97                 err = init_fpu(tsk);
98                 if (err)
99                         return err;
100         }
101
102         if (!(task_thread_info(current)->status & TS_USEDFPU)) {
103                 clts();
104                 task_thread_info(current)->status |= TS_USEDFPU;
105         }
106         err = restore_fpu_checking((__force struct i387_fxsave_struct *)buf);
107         if (unlikely(err)) {
108                 /*
109                  * Encountered an error while doing the restore from the
110                  * user buffer, clear the fpu state.
111                  */
112                 clear_fpu(tsk);
113                 clear_used_math();
114         }
115         return err;
116 }
117
118 /*
119  * Do a signal return; undo the signal stack.
120  */
121 static int
122 restore_sigcontext(struct pt_regs *regs, struct sigcontext __user *sc,
123                    unsigned long *pax)
124 {
125         unsigned int err = 0;
126
127         /* Always make any pending restarted system calls return -EINTR */
128         current_thread_info()->restart_block.fn = do_no_restart_syscall;
129
130 #define COPY(x)         (err |= __get_user(regs->x, &sc->x))
131
132         COPY(di); COPY(si); COPY(bp); COPY(sp); COPY(bx);
133         COPY(dx); COPY(cx); COPY(ip);
134         COPY(r8);
135         COPY(r9);
136         COPY(r10);
137         COPY(r11);
138         COPY(r12);
139         COPY(r13);
140         COPY(r14);
141         COPY(r15);
142
143         /* Kernel saves and restores only the CS segment register on signals,
144          * which is the bare minimum needed to allow mixed 32/64-bit code.
145          * App's signal handler can save/restore other segments if needed. */
146         {
147                 unsigned cs;
148                 err |= __get_user(cs, &sc->cs);
149                 regs->cs = cs | 3;      /* Force into user mode */
150         }
151
152         {
153                 unsigned int tmpflags;
154                 err |= __get_user(tmpflags, &sc->flags);
155                 regs->flags = (regs->flags & ~FIX_EFLAGS) | (tmpflags & FIX_EFLAGS);
156                 regs->orig_ax = -1;             /* disable syscall checks */
157         }
158
159         {
160                 struct _fpstate __user *buf;
161                 err |= __get_user(buf, &sc->fpstate);
162
163                 if (buf) {
164                         if (!access_ok(VERIFY_READ, buf, sizeof(*buf)))
165                                 goto badframe;
166                         err |= restore_i387(buf);
167                 } else {
168                         struct task_struct *me = current;
169                         if (used_math()) {
170                                 clear_fpu(me);
171                                 clear_used_math();
172                         }
173                 }
174         }
175
176         err |= __get_user(*pax, &sc->ax);
177         return err;
178
179 badframe:
180         return 1;
181 }
182
183 asmlinkage long sys_rt_sigreturn(struct pt_regs *regs)
184 {
185         struct rt_sigframe __user *frame;
186         sigset_t set;
187         unsigned long ax;
188
189         frame = (struct rt_sigframe __user *)(regs->sp - sizeof(long));
190         if (!access_ok(VERIFY_READ, frame, sizeof(*frame)))
191                 goto badframe;
192         if (__copy_from_user(&set, &frame->uc.uc_sigmask, sizeof(set)))
193                 goto badframe;
194
195         sigdelsetmask(&set, ~_BLOCKABLE);
196         spin_lock_irq(&current->sighand->siglock);
197         current->blocked = set;
198         recalc_sigpending();
199         spin_unlock_irq(&current->sighand->siglock);
200
201         if (restore_sigcontext(regs, &frame->uc.uc_mcontext, &ax))
202                 goto badframe;
203
204         if (do_sigaltstack(&frame->uc.uc_stack, NULL, regs->sp) == -EFAULT)
205                 goto badframe;
206
207         return ax;
208
209 badframe:
210         signal_fault(regs, frame, "sigreturn");
211         return 0;
212 }
213
214 /*
215  * Set up a signal frame.
216  */
217
218 static inline int
219 setup_sigcontext(struct sigcontext __user *sc, struct pt_regs *regs,
220                 unsigned long mask, struct task_struct *me)
221 {
222         int err = 0;
223
224         err |= __put_user(regs->cs, &sc->cs);
225         err |= __put_user(0, &sc->gs);
226         err |= __put_user(0, &sc->fs);
227
228         err |= __put_user(regs->di, &sc->di);
229         err |= __put_user(regs->si, &sc->si);
230         err |= __put_user(regs->bp, &sc->bp);
231         err |= __put_user(regs->sp, &sc->sp);
232         err |= __put_user(regs->bx, &sc->bx);
233         err |= __put_user(regs->dx, &sc->dx);
234         err |= __put_user(regs->cx, &sc->cx);
235         err |= __put_user(regs->ax, &sc->ax);
236         err |= __put_user(regs->r8, &sc->r8);
237         err |= __put_user(regs->r9, &sc->r9);
238         err |= __put_user(regs->r10, &sc->r10);
239         err |= __put_user(regs->r11, &sc->r11);
240         err |= __put_user(regs->r12, &sc->r12);
241         err |= __put_user(regs->r13, &sc->r13);
242         err |= __put_user(regs->r14, &sc->r14);
243         err |= __put_user(regs->r15, &sc->r15);
244         err |= __put_user(me->thread.trap_no, &sc->trapno);
245         err |= __put_user(me->thread.error_code, &sc->err);
246         err |= __put_user(regs->ip, &sc->ip);
247         err |= __put_user(regs->flags, &sc->flags);
248         err |= __put_user(mask, &sc->oldmask);
249         err |= __put_user(me->thread.cr2, &sc->cr2);
250
251         return err;
252 }
253
254 /*
255  * Determine which stack to use..
256  */
257
258 static void __user *
259 get_stack(struct k_sigaction *ka, struct pt_regs *regs, unsigned long size)
260 {
261         unsigned long sp;
262
263         /* Default to using normal stack - redzone*/
264         sp = regs->sp - 128;
265
266         /* This is the X/Open sanctioned signal stack switching.  */
267         if (ka->sa.sa_flags & SA_ONSTACK) {
268                 if (sas_ss_flags(sp) == 0)
269                         sp = current->sas_ss_sp + current->sas_ss_size;
270         }
271
272         return (void __user *)round_down(sp - size, 16);
273 }
274
275 static int setup_rt_frame(int sig, struct k_sigaction *ka, siginfo_t *info,
276                            sigset_t *set, struct pt_regs *regs)
277 {
278         struct rt_sigframe __user *frame;
279         struct _fpstate __user *fp = NULL;
280         int err = 0;
281         struct task_struct *me = current;
282
283         if (used_math()) {
284                 fp = get_stack(ka, regs, sizeof(struct _fpstate));
285                 frame = (void __user *)round_down(
286                         (unsigned long)fp - sizeof(struct rt_sigframe), 16) - 8;
287
288                 if (!access_ok(VERIFY_WRITE, fp, sizeof(struct _fpstate)))
289                         goto give_sigsegv;
290
291                 if (save_i387(fp) < 0)
292                         err |= -1;
293         } else
294                 frame = get_stack(ka, regs, sizeof(struct rt_sigframe)) - 8;
295
296         if (!access_ok(VERIFY_WRITE, frame, sizeof(*frame)))
297                 goto give_sigsegv;
298
299         if (ka->sa.sa_flags & SA_SIGINFO) {
300                 err |= copy_siginfo_to_user(&frame->info, info);
301                 if (err)
302                         goto give_sigsegv;
303         }
304
305         /* Create the ucontext.  */
306         err |= __put_user(0, &frame->uc.uc_flags);
307         err |= __put_user(0, &frame->uc.uc_link);
308         err |= __put_user(me->sas_ss_sp, &frame->uc.uc_stack.ss_sp);
309         err |= __put_user(sas_ss_flags(regs->sp),
310                           &frame->uc.uc_stack.ss_flags);
311         err |= __put_user(me->sas_ss_size, &frame->uc.uc_stack.ss_size);
312         err |= setup_sigcontext(&frame->uc.uc_mcontext, regs, set->sig[0], me);
313         err |= __put_user(fp, &frame->uc.uc_mcontext.fpstate);
314         if (sizeof(*set) == 16) {
315                 __put_user(set->sig[0], &frame->uc.uc_sigmask.sig[0]);
316                 __put_user(set->sig[1], &frame->uc.uc_sigmask.sig[1]);
317         } else
318                 err |= __copy_to_user(&frame->uc.uc_sigmask, set, sizeof(*set));
319
320         /* Set up to return from userspace.  If provided, use a stub
321            already in userspace.  */
322         /* x86-64 should always use SA_RESTORER. */
323         if (ka->sa.sa_flags & SA_RESTORER) {
324                 err |= __put_user(ka->sa.sa_restorer, &frame->pretcode);
325         } else {
326                 /* could use a vstub here */
327                 goto give_sigsegv;
328         }
329
330         if (err)
331                 goto give_sigsegv;
332
333         /* Set up registers for signal handler */
334         regs->di = sig;
335         /* In case the signal handler was declared without prototypes */
336         regs->ax = 0;
337
338         /* This also works for non SA_SIGINFO handlers because they expect the
339            next argument after the signal number on the stack. */
340         regs->si = (unsigned long)&frame->info;
341         regs->dx = (unsigned long)&frame->uc;
342         regs->ip = (unsigned long) ka->sa.sa_handler;
343
344         regs->sp = (unsigned long)frame;
345
346         /* Set up the CS register to run signal handlers in 64-bit mode,
347            even if the handler happens to be interrupting 32-bit code. */
348         regs->cs = __USER_CS;
349
350         return 0;
351
352 give_sigsegv:
353         force_sigsegv(sig, current);
354         return -EFAULT;
355 }
356
357 /*
358  * OK, we're invoking a handler
359  */
360
361 static int
362 handle_signal(unsigned long sig, siginfo_t *info, struct k_sigaction *ka,
363               sigset_t *oldset, struct pt_regs *regs)
364 {
365         int ret;
366
367         /* Are we from a system call? */
368         if (syscall_get_nr(current, regs) >= 0) {
369                 /* If so, check system call restarting.. */
370                 switch (syscall_get_error(current, regs)) {
371                 case -ERESTART_RESTARTBLOCK:
372                 case -ERESTARTNOHAND:
373                         regs->ax = -EINTR;
374                         break;
375
376                 case -ERESTARTSYS:
377                         if (!(ka->sa.sa_flags & SA_RESTART)) {
378                                 regs->ax = -EINTR;
379                                 break;
380                         }
381                 /* fallthrough */
382                 case -ERESTARTNOINTR:
383                         regs->ax = regs->orig_ax;
384                         regs->ip -= 2;
385                         break;
386                 }
387         }
388
389         /*
390          * If TF is set due to a debugger (TIF_FORCED_TF), clear the TF
391          * flag so that register information in the sigcontext is correct.
392          */
393         if (unlikely(regs->flags & X86_EFLAGS_TF) &&
394             likely(test_and_clear_thread_flag(TIF_FORCED_TF)))
395                 regs->flags &= ~X86_EFLAGS_TF;
396
397 #ifdef CONFIG_IA32_EMULATION
398         if (test_thread_flag(TIF_IA32)) {
399                 if (ka->sa.sa_flags & SA_SIGINFO)
400                         ret = ia32_setup_rt_frame(sig, ka, info, oldset, regs);
401                 else
402                         ret = ia32_setup_frame(sig, ka, oldset, regs);
403         } else
404 #endif
405         ret = setup_rt_frame(sig, ka, info, oldset, regs);
406
407         if (ret == 0) {
408                 /*
409                  * This has nothing to do with segment registers,
410                  * despite the name.  This magic affects uaccess.h
411                  * macros' behavior.  Reset it to the normal setting.
412                  */
413                 set_fs(USER_DS);
414
415                 /*
416                  * Clear the direction flag as per the ABI for function entry.
417                  */
418                 regs->flags &= ~X86_EFLAGS_DF;
419
420                 /*
421                  * Clear TF when entering the signal handler, but
422                  * notify any tracer that was single-stepping it.
423                  * The tracer may want to single-step inside the
424                  * handler too.
425                  */
426                 regs->flags &= ~X86_EFLAGS_TF;
427
428                 spin_lock_irq(&current->sighand->siglock);
429                 sigorsets(&current->blocked, &current->blocked, &ka->sa.sa_mask);
430                 if (!(ka->sa.sa_flags & SA_NODEFER))
431                         sigaddset(&current->blocked, sig);
432                 recalc_sigpending();
433                 spin_unlock_irq(&current->sighand->siglock);
434
435                 tracehook_signal_handler(sig, info, ka, regs,
436                                          test_thread_flag(TIF_SINGLESTEP));
437         }
438
439         return ret;
440 }
441
442 /*
443  * Note that 'init' is a special process: it doesn't get signals it doesn't
444  * want to handle. Thus you cannot kill init even with a SIGKILL even by
445  * mistake.
446  */
447 static void do_signal(struct pt_regs *regs)
448 {
449         struct k_sigaction ka;
450         siginfo_t info;
451         int signr;
452         sigset_t *oldset;
453
454         /*
455          * We want the common case to go fast, which is why we may in certain
456          * cases get here from kernel mode. Just return without doing anything
457          * if so.
458          * X86_32: vm86 regs switched out by assembly code before reaching
459          * here, so testing against kernel CS suffices.
460          */
461         if (!user_mode(regs))
462                 return;
463
464         if (current_thread_info()->status & TS_RESTORE_SIGMASK)
465                 oldset = &current->saved_sigmask;
466         else
467                 oldset = &current->blocked;
468
469         signr = get_signal_to_deliver(&info, &ka, regs, NULL);
470         if (signr > 0) {
471                 /* Re-enable any watchpoints before delivering the
472                  * signal to user space. The processor register will
473                  * have been cleared if the watchpoint triggered
474                  * inside the kernel.
475                  */
476                 if (current->thread.debugreg7)
477                         set_debugreg(current->thread.debugreg7, 7);
478
479                 /* Whee!  Actually deliver the signal.  */
480                 if (handle_signal(signr, &info, &ka, oldset, regs) == 0) {
481                         /*
482                          * A signal was successfully delivered; the saved
483                          * sigmask will have been stored in the signal frame,
484                          * and will be restored by sigreturn, so we can simply
485                          * clear the TS_RESTORE_SIGMASK flag.
486                          */
487                         current_thread_info()->status &= ~TS_RESTORE_SIGMASK;
488                 }
489                 return;
490         }
491
492         /* Did we come from a system call? */
493         if (syscall_get_nr(current, regs) >= 0) {
494                 /* Restart the system call - no handlers present */
495                 switch (syscall_get_error(current, regs)) {
496                 case -ERESTARTNOHAND:
497                 case -ERESTARTSYS:
498                 case -ERESTARTNOINTR:
499                         regs->ax = regs->orig_ax;
500                         regs->ip -= 2;
501                         break;
502                 case -ERESTART_RESTARTBLOCK:
503                         regs->ax = test_thread_flag(TIF_IA32) ?
504                                         __NR_ia32_restart_syscall :
505                                         __NR_restart_syscall;
506                         regs->ip -= 2;
507                         break;
508                 }
509         }
510
511         /*
512          * If there's no signal to deliver, we just put the saved sigmask
513          * back.
514          */
515         if (current_thread_info()->status & TS_RESTORE_SIGMASK) {
516                 current_thread_info()->status &= ~TS_RESTORE_SIGMASK;
517                 sigprocmask(SIG_SETMASK, &current->saved_sigmask, NULL);
518         }
519 }
520
521 void do_notify_resume(struct pt_regs *regs, void *unused,
522                       __u32 thread_info_flags)
523 {
524 #ifdef CONFIG_X86_MCE
525         /* notify userspace of pending MCEs */
526         if (thread_info_flags & _TIF_MCE_NOTIFY)
527                 mce_notify_user();
528 #endif /* CONFIG_X86_MCE */
529
530         /* deal with pending signal delivery */
531         if (thread_info_flags & _TIF_SIGPENDING)
532                 do_signal(regs);
533
534         if (thread_info_flags & _TIF_NOTIFY_RESUME) {
535                 clear_thread_flag(TIF_NOTIFY_RESUME);
536                 tracehook_notify_resume(regs);
537         }
538 }
539
540 void signal_fault(struct pt_regs *regs, void __user *frame, char *where)
541 {
542         struct task_struct *me = current;
543         if (show_unhandled_signals && printk_ratelimit()) {
544                 printk("%s[%d] bad frame in %s frame:%p ip:%lx sp:%lx orax:%lx",
545                me->comm, me->pid, where, frame, regs->ip,
546                    regs->sp, regs->orig_ax);
547                 print_vma_addr(" in ", regs->ip);
548                 printk("\n");
549         }
550
551         force_sig(SIGSEGV, me);
552 }