2  *  linux/arch/i386/entry.S
 
   4  *  Copyright (C) 1991, 1992  Linus Torvalds
 
   8  * entry.S contains the system-call and fault low-level handling routines.
 
   9  * This also contains the timer-interrupt handler, as well as all interrupts
 
  10  * and faults that can result in a task-switch.
 
  12  * NOTE: This code handles signal-recognition, which happens every time
 
  13  * after a timer-interrupt and after each system call.
 
  15  * I changed all the .align's to 4 (16 byte alignment), as that's faster
 
  18  * Stack layout in 'syscall_exit':
 
  19  *      ptrace needs to have all regs on the stack.
 
  20  *      if the order here is changed, it needs to be
 
  21  *      updated in fork.c:copy_process, signal.c:do_signal,
 
  22  *      ptrace.c and ptrace.h
 
  41  * "current" is in register %ebx during any slow entries.
 
  44 #include <linux/linkage.h>
 
  45 #include <asm/thread_info.h>
 
  46 #include <asm/irqflags.h>
 
  47 #include <asm/errno.h>
 
  48 #include <asm/segment.h>
 
  52 #include <asm/percpu.h>
 
  53 #include <asm/dwarf2.h>
 
  54 #include "irq_vectors.h"
 
  57  * We use macros for low-level operations which need to be overridden
 
  58  * for paravirtualization.  The following will never clobber any registers:
 
  59  *   INTERRUPT_RETURN (aka. "iret")
 
  60  *   GET_CR0_INTO_EAX (aka. "movl %cr0, %eax")
 
  61  *   ENABLE_INTERRUPTS_SYSCALL_RET (aka "sti; sysexit").
 
  63  * For DISABLE_INTERRUPTS/ENABLE_INTERRUPTS (aka "cli"/"sti"), you must
 
  64  * specify what registers can be overwritten (CLBR_NONE, CLBR_EAX/EDX/ECX/ANY).
 
  65  * Allowing a register to be clobbered can shrink the paravirt replacement
 
  66  * enough to patch inline, increasing performance.
 
  69 #define nr_syscalls ((syscall_table_size)/4)
 
  79 #define preempt_stop(clobbers)  DISABLE_INTERRUPTS(clobbers); TRACE_IRQS_OFF
 
  81 #define preempt_stop(clobbers)
 
  82 #define resume_kernel           restore_nocheck
 
  85 .macro TRACE_IRQS_IRET
 
  86 #ifdef CONFIG_TRACE_IRQFLAGS
 
  87         testl $IF_MASK,PT_EFLAGS(%esp)     # interrupts off?
 
  95 #define resume_userspace_sig    check_userspace
 
  97 #define resume_userspace_sig    resume_userspace
 
 103         CFI_ADJUST_CFA_OFFSET 4;\
 
 104         /*CFI_REL_OFFSET fs, 0;*/\
 
 106         CFI_ADJUST_CFA_OFFSET 4;\
 
 107         /*CFI_REL_OFFSET es, 0;*/\
 
 109         CFI_ADJUST_CFA_OFFSET 4;\
 
 110         /*CFI_REL_OFFSET ds, 0;*/\
 
 112         CFI_ADJUST_CFA_OFFSET 4;\
 
 113         CFI_REL_OFFSET eax, 0;\
 
 115         CFI_ADJUST_CFA_OFFSET 4;\
 
 116         CFI_REL_OFFSET ebp, 0;\
 
 118         CFI_ADJUST_CFA_OFFSET 4;\
 
 119         CFI_REL_OFFSET edi, 0;\
 
 121         CFI_ADJUST_CFA_OFFSET 4;\
 
 122         CFI_REL_OFFSET esi, 0;\
 
 124         CFI_ADJUST_CFA_OFFSET 4;\
 
 125         CFI_REL_OFFSET edx, 0;\
 
 127         CFI_ADJUST_CFA_OFFSET 4;\
 
 128         CFI_REL_OFFSET ecx, 0;\
 
 130         CFI_ADJUST_CFA_OFFSET 4;\
 
 131         CFI_REL_OFFSET ebx, 0;\
 
 132         movl $(__USER_DS), %edx; \
 
 135         movl $(__KERNEL_PERCPU), %edx; \
 
 138 #define RESTORE_INT_REGS \
 
 140         CFI_ADJUST_CFA_OFFSET -4;\
 
 143         CFI_ADJUST_CFA_OFFSET -4;\
 
 146         CFI_ADJUST_CFA_OFFSET -4;\
 
 149         CFI_ADJUST_CFA_OFFSET -4;\
 
 152         CFI_ADJUST_CFA_OFFSET -4;\
 
 155         CFI_ADJUST_CFA_OFFSET -4;\
 
 158         CFI_ADJUST_CFA_OFFSET -4;\
 
 161 #define RESTORE_REGS    \
 
 164         CFI_ADJUST_CFA_OFFSET -4;\
 
 167         CFI_ADJUST_CFA_OFFSET -4;\
 
 170         CFI_ADJUST_CFA_OFFSET -4;\
 
 172 .pushsection .fixup,"ax";       \
 
 179 .section __ex_table,"a";\
 
 186 #define RING0_INT_FRAME \
 
 187         CFI_STARTPROC simple;\
 
 189         CFI_DEF_CFA esp, 3*4;\
 
 190         /*CFI_OFFSET cs, -2*4;*/\
 
 193 #define RING0_EC_FRAME \
 
 194         CFI_STARTPROC simple;\
 
 196         CFI_DEF_CFA esp, 4*4;\
 
 197         /*CFI_OFFSET cs, -2*4;*/\
 
 200 #define RING0_PTREGS_FRAME \
 
 201         CFI_STARTPROC simple;\
 
 203         CFI_DEF_CFA esp, PT_OLDESP-PT_EBX;\
 
 204         /*CFI_OFFSET cs, PT_CS-PT_OLDESP;*/\
 
 205         CFI_OFFSET eip, PT_EIP-PT_OLDESP;\
 
 206         /*CFI_OFFSET es, PT_ES-PT_OLDESP;*/\
 
 207         /*CFI_OFFSET ds, PT_DS-PT_OLDESP;*/\
 
 208         CFI_OFFSET eax, PT_EAX-PT_OLDESP;\
 
 209         CFI_OFFSET ebp, PT_EBP-PT_OLDESP;\
 
 210         CFI_OFFSET edi, PT_EDI-PT_OLDESP;\
 
 211         CFI_OFFSET esi, PT_ESI-PT_OLDESP;\
 
 212         CFI_OFFSET edx, PT_EDX-PT_OLDESP;\
 
 213         CFI_OFFSET ecx, PT_ECX-PT_OLDESP;\
 
 214         CFI_OFFSET ebx, PT_EBX-PT_OLDESP
 
 219         CFI_ADJUST_CFA_OFFSET 4
 
 221         GET_THREAD_INFO(%ebp)
 
 223         CFI_ADJUST_CFA_OFFSET -4
 
 224         pushl $0x0202                   # Reset kernel eflags
 
 225         CFI_ADJUST_CFA_OFFSET 4
 
 227         CFI_ADJUST_CFA_OFFSET -4
 
 233  * Return to user mode is not as complex as all this looks,
 
 234  * but we want the default path for a system call return to
 
 235  * go as quickly as possible which is why some of this is
 
 236  * less clear than it otherwise should be.
 
 239         # userspace resumption stub bypassing syscall exit tracing
 
 243         preempt_stop(CLBR_ANY)
 
 245         GET_THREAD_INFO(%ebp)
 
 247         movl PT_EFLAGS(%esp), %eax      # mix EFLAGS and CS
 
 248         movb PT_CS(%esp), %al
 
 249         andl $(VM_MASK | SEGMENT_RPL_MASK), %eax
 
 251         jb resume_kernel                # not returning to v8086 or userspace
 
 253 ENTRY(resume_userspace)
 
 255         DISABLE_INTERRUPTS(CLBR_ANY)    # make sure we don't miss an interrupt
 
 256                                         # setting need_resched or sigpending
 
 257                                         # between sampling and the iret
 
 258         movl TI_flags(%ebp), %ecx
 
 259         andl $_TIF_WORK_MASK, %ecx      # is there any work to be done on
 
 260                                         # int/exception return?
 
 263 END(ret_from_exception)
 
 265 #ifdef CONFIG_PREEMPT
 
 267         DISABLE_INTERRUPTS(CLBR_ANY)
 
 268         cmpl $0,TI_preempt_count(%ebp)  # non-zero preempt_count ?
 
 271         movl TI_flags(%ebp), %ecx       # need_resched set ?
 
 272         testb $_TIF_NEED_RESCHED, %cl
 
 274         testl $IF_MASK,PT_EFLAGS(%esp)  # interrupts off (exception path) ?
 
 276         call preempt_schedule_irq
 
 282 /* SYSENTER_RETURN points to after the "sysenter" instruction in
 
 283    the vsyscall page.  See vsyscall-sysentry.S, which defines the symbol.  */
 
 285         # sysenter call handler stub
 
 286 ENTRY(ia32_sysenter_target)
 
 290         CFI_REGISTER esp, ebp
 
 291         movl TSS_sysenter_sp0(%esp),%esp
 
 294          * No need to follow this irqs on/off section: the syscall
 
 295          * disabled irqs and here we enable it straight after entry:
 
 297         ENABLE_INTERRUPTS(CLBR_NONE)
 
 299         CFI_ADJUST_CFA_OFFSET 4
 
 300         /*CFI_REL_OFFSET ss, 0*/
 
 302         CFI_ADJUST_CFA_OFFSET 4
 
 303         CFI_REL_OFFSET esp, 0
 
 305         CFI_ADJUST_CFA_OFFSET 4
 
 307         CFI_ADJUST_CFA_OFFSET 4
 
 308         /*CFI_REL_OFFSET cs, 0*/
 
 310          * Push current_thread_info()->sysenter_return to the stack.
 
 311          * A tiny bit of offset fixup is necessary - 4*4 means the 4 words
 
 312          * pushed above; +8 corresponds to copy_thread's esp0 setting.
 
 314         pushl (TI_sysenter_return-THREAD_SIZE+8+4*4)(%esp)
 
 315         CFI_ADJUST_CFA_OFFSET 4
 
 316         CFI_REL_OFFSET eip, 0
 
 319  * Load the potential sixth argument from user stack.
 
 320  * Careful about security.
 
 322         cmpl $__PAGE_OFFSET-3,%ebp
 
 325 .section __ex_table,"a"
 
 327         .long 1b,syscall_fault
 
 331         CFI_ADJUST_CFA_OFFSET 4
 
 333         GET_THREAD_INFO(%ebp)
 
 335         /* Note, _TIF_SECCOMP is bit number 8, and so it needs testw and not testb */
 
 336         testw $(_TIF_SYSCALL_EMU|_TIF_SYSCALL_TRACE|_TIF_SECCOMP|_TIF_SYSCALL_AUDIT),TI_flags(%ebp)
 
 337         jnz syscall_trace_entry
 
 338         cmpl $(nr_syscalls), %eax
 
 340         call *sys_call_table(,%eax,4)
 
 341         movl %eax,PT_EAX(%esp)
 
 343         DISABLE_INTERRUPTS(CLBR_ANY)
 
 345         movl TI_flags(%ebp), %ecx
 
 346         testw $_TIF_ALLWORK_MASK, %cx
 
 347         jne syscall_exit_work
 
 348 /* if something modifies registers it must also disable sysexit */
 
 349         movl PT_EIP(%esp), %edx
 
 350         movl PT_OLDESP(%esp), %ecx
 
 353 1:      mov  PT_FS(%esp), %fs
 
 354         ENABLE_INTERRUPTS_SYSCALL_RET
 
 356 .pushsection .fixup,"ax"
 
 357 2:      movl $0,PT_FS(%esp)
 
 359 .section __ex_table,"a"
 
 363 ENDPROC(ia32_sysenter_target)
 
 365         # system call handler stub
 
 367         RING0_INT_FRAME                 # can't unwind into user space anyway
 
 368         pushl %eax                      # save orig_eax
 
 369         CFI_ADJUST_CFA_OFFSET 4
 
 371         GET_THREAD_INFO(%ebp)
 
 372                                         # system call tracing in operation / emulation
 
 373         /* Note, _TIF_SECCOMP is bit number 8, and so it needs testw and not testb */
 
 374         testw $(_TIF_SYSCALL_EMU|_TIF_SYSCALL_TRACE|_TIF_SECCOMP|_TIF_SYSCALL_AUDIT),TI_flags(%ebp)
 
 375         jnz syscall_trace_entry
 
 376         cmpl $(nr_syscalls), %eax
 
 379         call *sys_call_table(,%eax,4)
 
 380         movl %eax,PT_EAX(%esp)          # store the return value
 
 383         DISABLE_INTERRUPTS(CLBR_ANY)    # make sure we don't miss an interrupt
 
 384                                         # setting need_resched or sigpending
 
 385                                         # between sampling and the iret
 
 387         testl $TF_MASK,PT_EFLAGS(%esp)  # If tracing set singlestep flag on exit
 
 389         orl $_TIF_SINGLESTEP,TI_flags(%ebp)
 
 391         movl TI_flags(%ebp), %ecx
 
 392         testw $_TIF_ALLWORK_MASK, %cx   # current->work
 
 393         jne syscall_exit_work
 
 396         movl PT_EFLAGS(%esp), %eax      # mix EFLAGS, SS and CS
 
 397         # Warning: PT_OLDSS(%esp) contains the wrong/random values if we
 
 398         # are returning to the kernel.
 
 399         # See comments in process.c:copy_thread() for details.
 
 400         movb PT_OLDSS(%esp), %ah
 
 401         movb PT_CS(%esp), %al
 
 402         andl $(VM_MASK | (SEGMENT_TI_MASK << 8) | SEGMENT_RPL_MASK), %eax
 
 403         cmpl $((SEGMENT_LDT << 8) | USER_RPL), %eax
 
 405         je ldt_ss                       # returning to user-space with LDT SS
 
 408 restore_nocheck_notrace:
 
 410         addl $4, %esp                   # skip orig_eax/error_code
 
 411         CFI_ADJUST_CFA_OFFSET -4
 
 416         pushl $0                        # no error code
 
 420 .section __ex_table,"a"
 
 422         .long irq_return,iret_exc
 
 427         larl PT_OLDSS(%esp), %eax
 
 429         testl $0x00400000, %eax         # returning to 32bit stack?
 
 430         jnz restore_nocheck             # allright, normal return
 
 432 #ifdef CONFIG_PARAVIRT
 
 434          * The kernel can't run on a non-flat stack if paravirt mode
 
 435          * is active.  Rather than try to fixup the high bits of
 
 436          * ESP, bypass this code entirely.  This may break DOSemu
 
 437          * and/or Wine support in a paravirt VM, although the option
 
 438          * is still available to implement the setting of the high
 
 439          * 16-bits in the INTERRUPT_RETURN paravirt-op.
 
 441         cmpl $0, pv_info+PARAVIRT_enabled
 
 445         /* If returning to userspace with 16bit stack,
 
 446          * try to fix the higher word of ESP, as the CPU
 
 448          * This is an "official" bug of all the x86-compatible
 
 449          * CPUs, which we can try to work around to make
 
 450          * dosemu and wine happy. */
 
 451         movl PT_OLDESP(%esp), %eax
 
 453         call patch_espfix_desc
 
 455         CFI_ADJUST_CFA_OFFSET 4
 
 457         CFI_ADJUST_CFA_OFFSET 4
 
 458         DISABLE_INTERRUPTS(CLBR_EAX)
 
 461         CFI_ADJUST_CFA_OFFSET -8
 
 466         # perform work that needs to be done immediately before resumption
 
 468         RING0_PTREGS_FRAME              # can't unwind into user space anyway
 
 470         testb $_TIF_NEED_RESCHED, %cl
 
 475         DISABLE_INTERRUPTS(CLBR_ANY)    # make sure we don't miss an interrupt
 
 476                                         # setting need_resched or sigpending
 
 477                                         # between sampling and the iret
 
 479         movl TI_flags(%ebp), %ecx
 
 480         andl $_TIF_WORK_MASK, %ecx      # is there any work to be done other
 
 481                                         # than syscall tracing?
 
 483         testb $_TIF_NEED_RESCHED, %cl
 
 486 work_notifysig:                         # deal with pending signals and
 
 487                                         # notify-resume requests
 
 489         testl $VM_MASK, PT_EFLAGS(%esp)
 
 491         jne work_notifysig_v86          # returning to kernel-space or
 
 494         call do_notify_resume
 
 495         jmp resume_userspace_sig
 
 499         pushl %ecx                      # save ti_flags for do_notify_resume
 
 500         CFI_ADJUST_CFA_OFFSET 4
 
 501         call save_v86_state             # %eax contains pt_regs pointer
 
 503         CFI_ADJUST_CFA_OFFSET -4
 
 509         call do_notify_resume
 
 510         jmp resume_userspace_sig
 
 513         # perform syscall exit tracing
 
 516         movl $-ENOSYS,PT_EAX(%esp)
 
 519         call do_syscall_trace
 
 521         jne resume_userspace            # ret != 0 -> running under PTRACE_SYSEMU,
 
 522                                         # so must skip actual syscall
 
 523         movl PT_ORIG_EAX(%esp), %eax
 
 524         cmpl $(nr_syscalls), %eax
 
 527 END(syscall_trace_entry)
 
 529         # perform syscall exit tracing
 
 532         testb $(_TIF_SYSCALL_TRACE|_TIF_SYSCALL_AUDIT|_TIF_SINGLESTEP), %cl
 
 535         ENABLE_INTERRUPTS(CLBR_ANY)     # could let do_syscall_trace() call
 
 539         call do_syscall_trace
 
 541 END(syscall_exit_work)
 
 544         RING0_INT_FRAME                 # can't unwind into user space anyway
 
 546         pushl %eax                      # save orig_eax
 
 547         CFI_ADJUST_CFA_OFFSET 4
 
 549         GET_THREAD_INFO(%ebp)
 
 550         movl $-EFAULT,PT_EAX(%esp)
 
 555         movl $-ENOSYS,PT_EAX(%esp)
 
 560 #define FIXUP_ESPFIX_STACK \
 
 561         /* since we are on a wrong stack, we cant make it a C code :( */ \
 
 562         PER_CPU(gdt_page, %ebx); \
 
 563         GET_DESC_BASE(GDT_ENTRY_ESPFIX_SS, %ebx, %eax, %ax, %al, %ah); \
 
 565         pushl $__KERNEL_DS; \
 
 566         CFI_ADJUST_CFA_OFFSET 4; \
 
 568         CFI_ADJUST_CFA_OFFSET 4; \
 
 570         CFI_ADJUST_CFA_OFFSET -8;
 
 571 #define UNWIND_ESPFIX_STACK \
 
 573         /* see if on espfix stack */ \
 
 574         cmpw $__ESPFIX_SS, %ax; \
 
 576         movl $__KERNEL_DS, %eax; \
 
 579         /* switch to normal stack */ \
 
 580         FIXUP_ESPFIX_STACK; \
 
 584  * Build the entry stubs and pointer table with
 
 585  * some assembler magic.
 
 591 ENTRY(irq_entries_start)
 
 597         CFI_ADJUST_CFA_OFFSET -4
 
 600         CFI_ADJUST_CFA_OFFSET 4
 
 607 END(irq_entries_start)
 
 614  * the CPU automatically disables interrupts when executing an IRQ vector,
 
 615  * so IRQ-flags tracing has to follow that:
 
 624 ENDPROC(common_interrupt)
 
 627 #define BUILD_INTERRUPT(name, nr)       \
 
 631         CFI_ADJUST_CFA_OFFSET 4;        \
 
 640 /* The include is where all of the SMP etc. interrupts come from */
 
 641 #include "entry_arch.h"
 
 643 KPROBE_ENTRY(page_fault)
 
 646         CFI_ADJUST_CFA_OFFSET 4
 
 649         /* the function address is in %fs's slot on the stack */
 
 651         CFI_ADJUST_CFA_OFFSET 4
 
 652         /*CFI_REL_OFFSET es, 0*/
 
 654         CFI_ADJUST_CFA_OFFSET 4
 
 655         /*CFI_REL_OFFSET ds, 0*/
 
 657         CFI_ADJUST_CFA_OFFSET 4
 
 658         CFI_REL_OFFSET eax, 0
 
 660         CFI_ADJUST_CFA_OFFSET 4
 
 661         CFI_REL_OFFSET ebp, 0
 
 663         CFI_ADJUST_CFA_OFFSET 4
 
 664         CFI_REL_OFFSET edi, 0
 
 666         CFI_ADJUST_CFA_OFFSET 4
 
 667         CFI_REL_OFFSET esi, 0
 
 669         CFI_ADJUST_CFA_OFFSET 4
 
 670         CFI_REL_OFFSET edx, 0
 
 672         CFI_ADJUST_CFA_OFFSET 4
 
 673         CFI_REL_OFFSET ecx, 0
 
 675         CFI_ADJUST_CFA_OFFSET 4
 
 676         CFI_REL_OFFSET ebx, 0
 
 679         CFI_ADJUST_CFA_OFFSET 4
 
 680         /*CFI_REL_OFFSET fs, 0*/
 
 681         movl $(__KERNEL_PERCPU), %ecx
 
 685         CFI_ADJUST_CFA_OFFSET -4
 
 686         /*CFI_REGISTER es, ecx*/
 
 687         movl PT_FS(%esp), %edi          # get the function address
 
 688         movl PT_ORIG_EAX(%esp), %edx    # get the error code
 
 689         movl $-1, PT_ORIG_EAX(%esp)     # no syscall to restart
 
 690         mov  %ecx, PT_FS(%esp)
 
 691         /*CFI_REL_OFFSET fs, ES*/
 
 692         movl $(__USER_DS), %ecx
 
 695         movl %esp,%eax                  # pt_regs pointer
 
 697         jmp ret_from_exception
 
 699 KPROBE_END(page_fault)
 
 701 ENTRY(coprocessor_error)
 
 704         CFI_ADJUST_CFA_OFFSET 4
 
 705         pushl $do_coprocessor_error
 
 706         CFI_ADJUST_CFA_OFFSET 4
 
 709 END(coprocessor_error)
 
 711 ENTRY(simd_coprocessor_error)
 
 714         CFI_ADJUST_CFA_OFFSET 4
 
 715         pushl $do_simd_coprocessor_error
 
 716         CFI_ADJUST_CFA_OFFSET 4
 
 719 END(simd_coprocessor_error)
 
 721 ENTRY(device_not_available)
 
 723         pushl $-1                       # mark this as an int
 
 724         CFI_ADJUST_CFA_OFFSET 4
 
 727         testl $0x4, %eax                # EM (math emulation bit)
 
 728         jne device_not_available_emulate
 
 729         preempt_stop(CLBR_ANY)
 
 730         call math_state_restore
 
 731         jmp ret_from_exception
 
 732 device_not_available_emulate:
 
 733         pushl $0                        # temporary storage for ORIG_EIP
 
 734         CFI_ADJUST_CFA_OFFSET 4
 
 737         CFI_ADJUST_CFA_OFFSET -4
 
 738         jmp ret_from_exception
 
 740 END(device_not_available)
 
 743  * Debug traps and NMI can happen at the one SYSENTER instruction
 
 744  * that sets up the real kernel stack. Check here, since we can't
 
 745  * allow the wrong stack to be used.
 
 747  * "TSS_sysenter_sp0+12" is because the NMI/debug handler will have
 
 748  * already pushed 3 words if it hits on the sysenter instruction:
 
 749  * eflags, cs and eip.
 
 751  * We just load the right stack, and push the three (known) values
 
 752  * by hand onto the new stack - while updating the return eip past
 
 753  * the instruction that would have done it for sysenter.
 
 755 #define FIX_STACK(offset, ok, label)            \
 
 756         cmpw $__KERNEL_CS,4(%esp);              \
 
 759         movl TSS_sysenter_sp0+offset(%esp),%esp;        \
 
 760         CFI_DEF_CFA esp, 0;                     \
 
 763         CFI_ADJUST_CFA_OFFSET 4;                \
 
 764         pushl $__KERNEL_CS;                     \
 
 765         CFI_ADJUST_CFA_OFFSET 4;                \
 
 766         pushl $sysenter_past_esp;               \
 
 767         CFI_ADJUST_CFA_OFFSET 4;                \
 
 768         CFI_REL_OFFSET eip, 0
 
 772         cmpl $ia32_sysenter_target,(%esp)
 
 773         jne debug_stack_correct
 
 774         FIX_STACK(12, debug_stack_correct, debug_esp_fix_insn)
 
 776         pushl $-1                       # mark this as an int
 
 777         CFI_ADJUST_CFA_OFFSET 4
 
 779         xorl %edx,%edx                  # error code 0
 
 780         movl %esp,%eax                  # pt_regs pointer
 
 782         jmp ret_from_exception
 
 787  * NMI is doubly nasty. It can happen _while_ we're handling
 
 788  * a debug fault, and the debug fault hasn't yet been able to
 
 789  * clear up the stack. So we first check whether we got  an
 
 790  * NMI on the sysenter entry path, but after that we need to
 
 791  * check whether we got an NMI on the debug path where the debug
 
 792  * fault happened on the sysenter path.
 
 797         CFI_ADJUST_CFA_OFFSET 4
 
 799         cmpw $__ESPFIX_SS, %ax
 
 801         CFI_ADJUST_CFA_OFFSET -4
 
 803         cmpl $ia32_sysenter_target,(%esp)
 
 806         CFI_ADJUST_CFA_OFFSET 4
 
 808         /* Do not access memory above the end of our stack page,
 
 809          * it might not exist.
 
 811         andl $(THREAD_SIZE-1),%eax
 
 812         cmpl $(THREAD_SIZE-20),%eax
 
 814         CFI_ADJUST_CFA_OFFSET -4
 
 815         jae nmi_stack_correct
 
 816         cmpl $ia32_sysenter_target,12(%esp)
 
 817         je nmi_debug_stack_check
 
 819         /* We have a RING0_INT_FRAME here */
 
 821         CFI_ADJUST_CFA_OFFSET 4
 
 823         xorl %edx,%edx          # zero error code
 
 824         movl %esp,%eax          # pt_regs pointer
 
 826         jmp restore_nocheck_notrace
 
 831         FIX_STACK(12,nmi_stack_correct, 1)
 
 832         jmp nmi_stack_correct
 
 834 nmi_debug_stack_check:
 
 835         /* We have a RING0_INT_FRAME here */
 
 836         cmpw $__KERNEL_CS,16(%esp)
 
 837         jne nmi_stack_correct
 
 840         cmpl $debug_esp_fix_insn,(%esp)
 
 842         FIX_STACK(24,nmi_stack_correct, 1)
 
 843         jmp nmi_stack_correct
 
 846         /* We have a RING0_INT_FRAME here.
 
 848          * create the pointer to lss back
 
 851         CFI_ADJUST_CFA_OFFSET 4
 
 853         CFI_ADJUST_CFA_OFFSET 4
 
 855         /* copy the iret frame of 12 bytes */
 
 858         CFI_ADJUST_CFA_OFFSET 4
 
 861         CFI_ADJUST_CFA_OFFSET 4
 
 863         FIXUP_ESPFIX_STACK              # %eax == %esp
 
 864         xorl %edx,%edx                  # zero error code
 
 867         lss 12+4(%esp), %esp            # back to espfix stack
 
 868         CFI_ADJUST_CFA_OFFSET -24
 
 873 #ifdef CONFIG_PARAVIRT
 
 876 .section __ex_table,"a"
 
 878         .long native_iret, iret_exc
 
 882 ENTRY(native_irq_enable_syscall_ret)
 
 885 END(native_irq_enable_syscall_ret)
 
 890         pushl $-1                       # mark this as an int
 
 891         CFI_ADJUST_CFA_OFFSET 4
 
 893         xorl %edx,%edx          # zero error code
 
 894         movl %esp,%eax          # pt_regs pointer
 
 896         jmp ret_from_exception
 
 903         CFI_ADJUST_CFA_OFFSET 4
 
 905         CFI_ADJUST_CFA_OFFSET 4
 
 913         CFI_ADJUST_CFA_OFFSET 4
 
 915         CFI_ADJUST_CFA_OFFSET 4
 
 923         CFI_ADJUST_CFA_OFFSET 4
 
 925         CFI_ADJUST_CFA_OFFSET 4
 
 930 ENTRY(coprocessor_segment_overrun)
 
 933         CFI_ADJUST_CFA_OFFSET 4
 
 934         pushl $do_coprocessor_segment_overrun
 
 935         CFI_ADJUST_CFA_OFFSET 4
 
 938 END(coprocessor_segment_overrun)
 
 942         pushl $do_invalid_TSS
 
 943         CFI_ADJUST_CFA_OFFSET 4
 
 948 ENTRY(segment_not_present)
 
 950         pushl $do_segment_not_present
 
 951         CFI_ADJUST_CFA_OFFSET 4
 
 954 END(segment_not_present)
 
 958         pushl $do_stack_segment
 
 959         CFI_ADJUST_CFA_OFFSET 4
 
 964 KPROBE_ENTRY(general_protection)
 
 966         pushl $do_general_protection
 
 967         CFI_ADJUST_CFA_OFFSET 4
 
 970 KPROBE_END(general_protection)
 
 972 ENTRY(alignment_check)
 
 974         pushl $do_alignment_check
 
 975         CFI_ADJUST_CFA_OFFSET 4
 
 982         pushl $0                        # no error code
 
 983         CFI_ADJUST_CFA_OFFSET 4
 
 984         pushl $do_divide_error
 
 985         CFI_ADJUST_CFA_OFFSET 4
 
 990 #ifdef CONFIG_X86_MCE
 
 994         CFI_ADJUST_CFA_OFFSET 4
 
 995         pushl machine_check_vector
 
 996         CFI_ADJUST_CFA_OFFSET 4
 
1002 ENTRY(spurious_interrupt_bug)
 
1005         CFI_ADJUST_CFA_OFFSET 4
 
1006         pushl $do_spurious_interrupt_bug
 
1007         CFI_ADJUST_CFA_OFFSET 4
 
1010 END(spurious_interrupt_bug)
 
1012 ENTRY(kernel_thread_helper)
 
1013         pushl $0                # fake return address for unwinder
 
1017         CFI_ADJUST_CFA_OFFSET 4
 
1020         CFI_ADJUST_CFA_OFFSET 4
 
1023 ENDPROC(kernel_thread_helper)
 
1026 ENTRY(xen_hypervisor_callback)
 
1029         CFI_ADJUST_CFA_OFFSET 4
 
1033         /* Check to see if we got the event in the critical
 
1034            region in xen_iret_direct, after we've reenabled
 
1035            events and checked for pending events.  This simulates
 
1036            iret instruction's behaviour where it delivers a
 
1037            pending interrupt when enabling interrupts. */
 
1038         movl PT_EIP(%esp),%eax
 
1039         cmpl $xen_iret_start_crit,%eax
 
1041         cmpl $xen_iret_end_crit,%eax
 
1044         call xen_iret_crit_fixup
 
1047         call xen_evtchn_do_upcall
 
1050 ENDPROC(xen_hypervisor_callback)
 
1052 # Hypervisor uses this for application faults while it executes.
 
1053 # We get here for two reasons:
 
1054 #  1. Fault while reloading DS, ES, FS or GS
 
1055 #  2. Fault while executing IRET
 
1056 # Category 1 we fix up by reattempting the load, and zeroing the segment
 
1057 # register if the load fails.
 
1058 # Category 2 we fix up by jumping to do_iret_error. We cannot use the
 
1059 # normal Linux return path in this case because if we use the IRET hypercall
 
1060 # to pop the stack frame we end up in an infinite loop of failsafe callbacks.
 
1061 # We distinguish between categories by maintaining a status value in EAX.
 
1062 ENTRY(xen_failsafe_callback)
 
1065         CFI_ADJUST_CFA_OFFSET 4
 
1073         CFI_ADJUST_CFA_OFFSET -4
 
1075         CFI_ADJUST_CFA_OFFSET -16
 
1078         jmp iret_exc            # EAX != 0 => Category 2 (Bad IRET)
 
1079 5:      pushl $0                # EAX == 0 => Category 1 (Bad segment)
 
1080         CFI_ADJUST_CFA_OFFSET 4
 
1082         jmp ret_from_exception
 
1085 .section .fixup,"ax"
 
1099 .section __ex_table,"a"
 
1106 ENDPROC(xen_failsafe_callback)
 
1108 #endif  /* CONFIG_XEN */
 
1110 .section .rodata,"a"
 
1111 #include "syscall_table_32.S"
 
1113 syscall_table_size=(.-sys_call_table)