x86: unify smp_prepare_cpus
[linux-2.6] / arch / x86 / kernel / signal_64.c
1 /*
2  *  Copyright (C) 1991, 1992  Linus Torvalds
3  *  Copyright (C) 2000, 2001, 2002 Andi Kleen SuSE Labs
4  *
5  *  1997-11-28  Modified for POSIX.1b signals by Richard Henderson
6  *  2000-06-20  Pentium III FXSR, SSE support by Gareth Hughes
7  *  2000-2002   x86-64 support by Andi Kleen
8  */
9
10 #include <linux/sched.h>
11 #include <linux/mm.h>
12 #include <linux/smp.h>
13 #include <linux/kernel.h>
14 #include <linux/signal.h>
15 #include <linux/errno.h>
16 #include <linux/wait.h>
17 #include <linux/ptrace.h>
18 #include <linux/unistd.h>
19 #include <linux/stddef.h>
20 #include <linux/personality.h>
21 #include <linux/compiler.h>
22 #include <asm/processor.h>
23 #include <asm/ucontext.h>
24 #include <asm/uaccess.h>
25 #include <asm/i387.h>
26 #include <asm/proto.h>
27 #include <asm/ia32_unistd.h>
28 #include <asm/mce.h>
29 #include "sigframe.h"
30
31 #define DEBUG_SIG 0
32
33 #define _BLOCKABLE (~(sigmask(SIGKILL) | sigmask(SIGSTOP)))
34
35 #define __FIX_EFLAGS    (X86_EFLAGS_AC | X86_EFLAGS_OF | \
36                          X86_EFLAGS_DF | X86_EFLAGS_TF | X86_EFLAGS_SF | \
37                          X86_EFLAGS_ZF | X86_EFLAGS_AF | X86_EFLAGS_PF | \
38                          X86_EFLAGS_CF)
39
40 #ifdef CONFIG_X86_32
41 # define FIX_EFLAGS     (__FIX_EFLAGS | X86_EFLAGS_RF)
42 #else
43 # define FIX_EFLAGS     __FIX_EFLAGS
44 #endif
45
46 int ia32_setup_rt_frame(int sig, struct k_sigaction *ka, siginfo_t *info,
47                sigset_t *set, struct pt_regs * regs); 
48 int ia32_setup_frame(int sig, struct k_sigaction *ka,
49             sigset_t *set, struct pt_regs * regs); 
50
51 asmlinkage long
52 sys_sigaltstack(const stack_t __user *uss, stack_t __user *uoss,
53                 struct pt_regs *regs)
54 {
55         return do_sigaltstack(uss, uoss, regs->sp);
56 }
57
58
59 /*
60  * Do a signal return; undo the signal stack.
61  */
62 static int
63 restore_sigcontext(struct pt_regs *regs, struct sigcontext __user *sc,
64                    unsigned long *pax)
65 {
66         unsigned int err = 0;
67
68         /* Always make any pending restarted system calls return -EINTR */
69         current_thread_info()->restart_block.fn = do_no_restart_syscall;
70
71 #define COPY(x)         err |= __get_user(regs->x, &sc->x)
72
73         COPY(di); COPY(si); COPY(bp); COPY(sp); COPY(bx);
74         COPY(dx); COPY(cx); COPY(ip);
75         COPY(r8);
76         COPY(r9);
77         COPY(r10);
78         COPY(r11);
79         COPY(r12);
80         COPY(r13);
81         COPY(r14);
82         COPY(r15);
83
84         /* Kernel saves and restores only the CS segment register on signals,
85          * which is the bare minimum needed to allow mixed 32/64-bit code.
86          * App's signal handler can save/restore other segments if needed. */
87         {
88                 unsigned cs;
89                 err |= __get_user(cs, &sc->cs);
90                 regs->cs = cs | 3;      /* Force into user mode */
91         }
92
93         {
94                 unsigned int tmpflags;
95                 err |= __get_user(tmpflags, &sc->flags);
96                 regs->flags = (regs->flags & ~FIX_EFLAGS) | (tmpflags & FIX_EFLAGS);
97                 regs->orig_ax = -1;             /* disable syscall checks */
98         }
99
100         {
101                 struct _fpstate __user * buf;
102                 err |= __get_user(buf, &sc->fpstate);
103
104                 if (buf) {
105                         if (!access_ok(VERIFY_READ, buf, sizeof(*buf)))
106                                 goto badframe;
107                         err |= restore_i387(buf);
108                 } else {
109                         struct task_struct *me = current;
110                         if (used_math()) {
111                                 clear_fpu(me);
112                                 clear_used_math();
113                         }
114                 }
115         }
116
117         err |= __get_user(*pax, &sc->ax);
118         return err;
119
120 badframe:
121         return 1;
122 }
123
124 asmlinkage long sys_rt_sigreturn(struct pt_regs *regs)
125 {
126         struct rt_sigframe __user *frame;
127         sigset_t set;
128         unsigned long ax;
129
130         frame = (struct rt_sigframe __user *)(regs->sp - sizeof(long));
131         if (!access_ok(VERIFY_READ, frame, sizeof(*frame)))
132                 goto badframe;
133         if (__copy_from_user(&set, &frame->uc.uc_sigmask, sizeof(set)))
134                 goto badframe;
135
136         sigdelsetmask(&set, ~_BLOCKABLE);
137         spin_lock_irq(&current->sighand->siglock);
138         current->blocked = set;
139         recalc_sigpending();
140         spin_unlock_irq(&current->sighand->siglock);
141         
142         if (restore_sigcontext(regs, &frame->uc.uc_mcontext, &ax))
143                 goto badframe;
144
145 #if DEBUG_SIG
146         printk("%d sigreturn ip:%lx sp:%lx frame:%p ax:%lx\n",current->pid,regs->ip,regs->sp,frame,ax);
147 #endif
148
149         if (do_sigaltstack(&frame->uc.uc_stack, NULL, regs->sp) == -EFAULT)
150                 goto badframe;
151
152         return ax;
153
154 badframe:
155         signal_fault(regs,frame,"sigreturn");
156         return 0;
157 }       
158
159 /*
160  * Set up a signal frame.
161  */
162
163 static inline int
164 setup_sigcontext(struct sigcontext __user *sc, struct pt_regs *regs, unsigned long mask, struct task_struct *me)
165 {
166         int err = 0;
167
168         err |= __put_user(regs->cs, &sc->cs);
169         err |= __put_user(0, &sc->gs);
170         err |= __put_user(0, &sc->fs);
171
172         err |= __put_user(regs->di, &sc->di);
173         err |= __put_user(regs->si, &sc->si);
174         err |= __put_user(regs->bp, &sc->bp);
175         err |= __put_user(regs->sp, &sc->sp);
176         err |= __put_user(regs->bx, &sc->bx);
177         err |= __put_user(regs->dx, &sc->dx);
178         err |= __put_user(regs->cx, &sc->cx);
179         err |= __put_user(regs->ax, &sc->ax);
180         err |= __put_user(regs->r8, &sc->r8);
181         err |= __put_user(regs->r9, &sc->r9);
182         err |= __put_user(regs->r10, &sc->r10);
183         err |= __put_user(regs->r11, &sc->r11);
184         err |= __put_user(regs->r12, &sc->r12);
185         err |= __put_user(regs->r13, &sc->r13);
186         err |= __put_user(regs->r14, &sc->r14);
187         err |= __put_user(regs->r15, &sc->r15);
188         err |= __put_user(me->thread.trap_no, &sc->trapno);
189         err |= __put_user(me->thread.error_code, &sc->err);
190         err |= __put_user(regs->ip, &sc->ip);
191         err |= __put_user(regs->flags, &sc->flags);
192         err |= __put_user(mask, &sc->oldmask);
193         err |= __put_user(me->thread.cr2, &sc->cr2);
194
195         return err;
196 }
197
198 /*
199  * Determine which stack to use..
200  */
201
202 static void __user *
203 get_stack(struct k_sigaction *ka, struct pt_regs *regs, unsigned long size)
204 {
205         unsigned long sp;
206
207         /* Default to using normal stack - redzone*/
208         sp = regs->sp - 128;
209
210         /* This is the X/Open sanctioned signal stack switching.  */
211         if (ka->sa.sa_flags & SA_ONSTACK) {
212                 if (sas_ss_flags(sp) == 0)
213                         sp = current->sas_ss_sp + current->sas_ss_size;
214         }
215
216         return (void __user *)round_down(sp - size, 16);
217 }
218
219 static int setup_rt_frame(int sig, struct k_sigaction *ka, siginfo_t *info,
220                            sigset_t *set, struct pt_regs * regs)
221 {
222         struct rt_sigframe __user *frame;
223         struct _fpstate __user *fp = NULL; 
224         int err = 0;
225         struct task_struct *me = current;
226
227         if (used_math()) {
228                 fp = get_stack(ka, regs, sizeof(struct _fpstate)); 
229                 frame = (void __user *)round_down(
230                         (unsigned long)fp - sizeof(struct rt_sigframe), 16) - 8;
231
232                 if (!access_ok(VERIFY_WRITE, fp, sizeof(struct _fpstate)))
233                         goto give_sigsegv;
234
235                 if (save_i387(fp) < 0) 
236                         err |= -1; 
237         } else
238                 frame = get_stack(ka, regs, sizeof(struct rt_sigframe)) - 8;
239
240         if (!access_ok(VERIFY_WRITE, frame, sizeof(*frame)))
241                 goto give_sigsegv;
242
243         if (ka->sa.sa_flags & SA_SIGINFO) { 
244                 err |= copy_siginfo_to_user(&frame->info, info);
245                 if (err)
246                         goto give_sigsegv;
247         }
248                 
249         /* Create the ucontext.  */
250         err |= __put_user(0, &frame->uc.uc_flags);
251         err |= __put_user(0, &frame->uc.uc_link);
252         err |= __put_user(me->sas_ss_sp, &frame->uc.uc_stack.ss_sp);
253         err |= __put_user(sas_ss_flags(regs->sp),
254                           &frame->uc.uc_stack.ss_flags);
255         err |= __put_user(me->sas_ss_size, &frame->uc.uc_stack.ss_size);
256         err |= setup_sigcontext(&frame->uc.uc_mcontext, regs, set->sig[0], me);
257         err |= __put_user(fp, &frame->uc.uc_mcontext.fpstate);
258         if (sizeof(*set) == 16) { 
259                 __put_user(set->sig[0], &frame->uc.uc_sigmask.sig[0]);
260                 __put_user(set->sig[1], &frame->uc.uc_sigmask.sig[1]); 
261         } else
262                 err |= __copy_to_user(&frame->uc.uc_sigmask, set, sizeof(*set));
263
264         /* Set up to return from userspace.  If provided, use a stub
265            already in userspace.  */
266         /* x86-64 should always use SA_RESTORER. */
267         if (ka->sa.sa_flags & SA_RESTORER) {
268                 err |= __put_user(ka->sa.sa_restorer, &frame->pretcode);
269         } else {
270                 /* could use a vstub here */
271                 goto give_sigsegv; 
272         }
273
274         if (err)
275                 goto give_sigsegv;
276
277 #if DEBUG_SIG
278         printk("%d old ip %lx old sp %lx old ax %lx\n", current->pid,regs->ip,regs->sp,regs->ax);
279 #endif
280
281         /* Set up registers for signal handler */
282         regs->di = sig;
283         /* In case the signal handler was declared without prototypes */ 
284         regs->ax = 0;
285
286         /* This also works for non SA_SIGINFO handlers because they expect the
287            next argument after the signal number on the stack. */
288         regs->si = (unsigned long)&frame->info;
289         regs->dx = (unsigned long)&frame->uc;
290         regs->ip = (unsigned long) ka->sa.sa_handler;
291
292         regs->sp = (unsigned long)frame;
293
294         /* Set up the CS register to run signal handlers in 64-bit mode,
295            even if the handler happens to be interrupting 32-bit code. */
296         regs->cs = __USER_CS;
297
298         /* This, by contrast, has nothing to do with segment registers -
299            see include/asm-x86_64/uaccess.h for details. */
300         set_fs(USER_DS);
301
302         regs->flags &= ~(X86_EFLAGS_TF | X86_EFLAGS_DF);
303         if (test_thread_flag(TIF_SINGLESTEP))
304                 ptrace_notify(SIGTRAP);
305 #if DEBUG_SIG
306         printk("SIG deliver (%s:%d): sp=%p pc=%lx ra=%p\n",
307                 current->comm, current->pid, frame, regs->ip, frame->pretcode);
308 #endif
309
310         return 0;
311
312 give_sigsegv:
313         force_sigsegv(sig, current);
314         return -EFAULT;
315 }
316
317 /*
318  * Return -1L or the syscall number that @regs is executing.
319  */
320 static long current_syscall(struct pt_regs *regs)
321 {
322         /*
323          * We always sign-extend a -1 value being set here,
324          * so this is always either -1L or a syscall number.
325          */
326         return regs->orig_ax;
327 }
328
329 /*
330  * Return a value that is -EFOO if the system call in @regs->orig_ax
331  * returned an error.  This only works for @regs from @current.
332  */
333 static long current_syscall_ret(struct pt_regs *regs)
334 {
335 #ifdef CONFIG_IA32_EMULATION
336         if (test_thread_flag(TIF_IA32))
337                 /*
338                  * Sign-extend the value so (int)-EFOO becomes (long)-EFOO
339                  * and will match correctly in comparisons.
340                  */
341                 return (int) regs->ax;
342 #endif
343         return regs->ax;
344 }
345
346 /*
347  * OK, we're invoking a handler
348  */     
349
350 static int
351 handle_signal(unsigned long sig, siginfo_t *info, struct k_sigaction *ka,
352               sigset_t *oldset, struct pt_regs *regs)
353 {
354         int ret;
355
356 #if DEBUG_SIG
357         printk("handle_signal pid:%d sig:%lu ip:%lx sp:%lx regs=%p\n",
358                 current->pid, sig,
359                 regs->ip, regs->sp, regs);
360 #endif
361
362         /* Are we from a system call? */
363         if (current_syscall(regs) >= 0) {
364                 /* If so, check system call restarting.. */
365                 switch (current_syscall_ret(regs)) {
366                 case -ERESTART_RESTARTBLOCK:
367                 case -ERESTARTNOHAND:
368                         regs->ax = -EINTR;
369                         break;
370
371                 case -ERESTARTSYS:
372                         if (!(ka->sa.sa_flags & SA_RESTART)) {
373                                 regs->ax = -EINTR;
374                                 break;
375                         }
376                 /* fallthrough */
377                 case -ERESTARTNOINTR:
378                         regs->ax = regs->orig_ax;
379                         regs->ip -= 2;
380                         break;
381                 }
382         }
383
384         /*
385          * If TF is set due to a debugger (TIF_FORCED_TF), clear the TF
386          * flag so that register information in the sigcontext is correct.
387          */
388         if (unlikely(regs->flags & X86_EFLAGS_TF) &&
389             likely(test_and_clear_thread_flag(TIF_FORCED_TF)))
390                 regs->flags &= ~X86_EFLAGS_TF;
391
392 #ifdef CONFIG_IA32_EMULATION
393         if (test_thread_flag(TIF_IA32)) {
394                 if (ka->sa.sa_flags & SA_SIGINFO)
395                         ret = ia32_setup_rt_frame(sig, ka, info, oldset, regs);
396                 else
397                         ret = ia32_setup_frame(sig, ka, oldset, regs);
398         } else 
399 #endif
400         ret = setup_rt_frame(sig, ka, info, oldset, regs);
401
402         if (ret == 0) {
403                 spin_lock_irq(&current->sighand->siglock);
404                 sigorsets(&current->blocked,&current->blocked,&ka->sa.sa_mask);
405                 if (!(ka->sa.sa_flags & SA_NODEFER))
406                         sigaddset(&current->blocked,sig);
407                 recalc_sigpending();
408                 spin_unlock_irq(&current->sighand->siglock);
409         }
410
411         return ret;
412 }
413
414 /*
415  * Note that 'init' is a special process: it doesn't get signals it doesn't
416  * want to handle. Thus you cannot kill init even with a SIGKILL even by
417  * mistake.
418  */
419 static void do_signal(struct pt_regs *regs)
420 {
421         struct k_sigaction ka;
422         siginfo_t info;
423         int signr;
424         sigset_t *oldset;
425
426         /*
427          * We want the common case to go fast, which is why we may in certain
428          * cases get here from kernel mode. Just return without doing anything
429          * if so.
430          * X86_32: vm86 regs switched out by assembly code before reaching
431          * here, so testing against kernel CS suffices.
432          */
433         if (!user_mode(regs))
434                 return;
435
436         if (test_thread_flag(TIF_RESTORE_SIGMASK))
437                 oldset = &current->saved_sigmask;
438         else
439                 oldset = &current->blocked;
440
441         signr = get_signal_to_deliver(&info, &ka, regs, NULL);
442         if (signr > 0) {
443                 /* Re-enable any watchpoints before delivering the
444                  * signal to user space. The processor register will
445                  * have been cleared if the watchpoint triggered
446                  * inside the kernel.
447                  */
448                 if (current->thread.debugreg7)
449                         set_debugreg(current->thread.debugreg7, 7);
450
451                 /* Whee!  Actually deliver the signal.  */
452                 if (handle_signal(signr, &info, &ka, oldset, regs) == 0) {
453                         /* a signal was successfully delivered; the saved
454                          * sigmask will have been stored in the signal frame,
455                          * and will be restored by sigreturn, so we can simply
456                          * clear the TIF_RESTORE_SIGMASK flag */
457                         clear_thread_flag(TIF_RESTORE_SIGMASK);
458                 }
459                 return;
460         }
461
462         /* Did we come from a system call? */
463         if (current_syscall(regs) >= 0) {
464                 /* Restart the system call - no handlers present */
465                 switch (current_syscall_ret(regs)) {
466                 case -ERESTARTNOHAND:
467                 case -ERESTARTSYS:
468                 case -ERESTARTNOINTR:
469                         regs->ax = regs->orig_ax;
470                         regs->ip -= 2;
471                         break;
472                 case -ERESTART_RESTARTBLOCK:
473                         regs->ax = test_thread_flag(TIF_IA32) ?
474                                         __NR_ia32_restart_syscall :
475                                         __NR_restart_syscall;
476                         regs->ip -= 2;
477                         break;
478                 }
479         }
480
481         /*
482          * If there's no signal to deliver, we just put the saved sigmask
483          * back.
484          */
485         if (test_thread_flag(TIF_RESTORE_SIGMASK)) {
486                 clear_thread_flag(TIF_RESTORE_SIGMASK);
487                 sigprocmask(SIG_SETMASK, &current->saved_sigmask, NULL);
488         }
489 }
490
491 void do_notify_resume(struct pt_regs *regs, void *unused,
492                       __u32 thread_info_flags)
493 {
494 #if DEBUG_SIG
495         printk("do_notify_resume flags:%x ip:%lx sp:%lx caller:%p pending:%x\n",
496                thread_info_flags, regs->ip, regs->sp, __builtin_return_address(0),signal_pending(current));
497 #endif
498                
499         /* Pending single-step? */
500         if (thread_info_flags & _TIF_SINGLESTEP) {
501                 regs->flags |= X86_EFLAGS_TF;
502                 clear_thread_flag(TIF_SINGLESTEP);
503         }
504
505 #ifdef CONFIG_X86_MCE
506         /* notify userspace of pending MCEs */
507         if (thread_info_flags & _TIF_MCE_NOTIFY)
508                 mce_notify_user();
509 #endif /* CONFIG_X86_MCE */
510
511         /* deal with pending signal delivery */
512         if (thread_info_flags & (_TIF_SIGPENDING | _TIF_RESTORE_SIGMASK))
513                 do_signal(regs);
514
515         if (thread_info_flags & _TIF_HRTICK_RESCHED)
516                 hrtick_resched();
517 }
518
519 void signal_fault(struct pt_regs *regs, void __user *frame, char *where)
520
521         struct task_struct *me = current; 
522         if (show_unhandled_signals && printk_ratelimit()) {
523                 printk("%s[%d] bad frame in %s frame:%p ip:%lx sp:%lx orax:%lx",
524                me->comm,me->pid,where,frame,regs->ip,regs->sp,regs->orig_ax);
525                 print_vma_addr(" in ", regs->ip);
526                 printk("\n");
527         }
528
529         force_sig(SIGSEGV, me); 
530