2  *  linux/arch/i386/entry.S
 
   4  *  Copyright (C) 1991, 1992  Linus Torvalds
 
   8  * entry.S contains the system-call and fault low-level handling routines.
 
   9  * This also contains the timer-interrupt handler, as well as all interrupts
 
  10  * and faults that can result in a task-switch.
 
  12  * NOTE: This code handles signal-recognition, which happens every time
 
  13  * after a timer-interrupt and after each system call.
 
  15  * I changed all the .align's to 4 (16 byte alignment), as that's faster
 
  18  * Stack layout in 'syscall_exit':
 
  19  *      ptrace needs to have all regs on the stack.
 
  20  *      if the order here is changed, it needs to be
 
  21  *      updated in fork.c:copy_process, signal.c:do_signal,
 
  22  *      ptrace.c and ptrace.h
 
  41  * "current" is in register %ebx during any slow entries.
 
  44 #include <linux/linkage.h>
 
  45 #include <asm/thread_info.h>
 
  46 #include <asm/irqflags.h>
 
  47 #include <asm/errno.h>
 
  48 #include <asm/segment.h>
 
  52 #include <asm/percpu.h>
 
  53 #include <asm/dwarf2.h>
 
  54 #include "irq_vectors.h"
 
  57  * We use macros for low-level operations which need to be overridden
 
  58  * for paravirtualization.  The following will never clobber any registers:
 
  59  *   INTERRUPT_RETURN (aka. "iret")
 
  60  *   GET_CR0_INTO_EAX (aka. "movl %cr0, %eax")
 
  61  *   ENABLE_INTERRUPTS_SYSEXIT (aka "sti; sysexit").
 
  63  * For DISABLE_INTERRUPTS/ENABLE_INTERRUPTS (aka "cli"/"sti"), you must
 
  64  * specify what registers can be overwritten (CLBR_NONE, CLBR_EAX/EDX/ECX/ANY).
 
  65  * Allowing a register to be clobbered can shrink the paravirt replacement
 
  66  * enough to patch inline, increasing performance.
 
  69 #define nr_syscalls ((syscall_table_size)/4)
 
  79 #define preempt_stop(clobbers)  DISABLE_INTERRUPTS(clobbers); TRACE_IRQS_OFF
 
  81 #define preempt_stop(clobbers)
 
  82 #define resume_kernel           restore_nocheck
 
  85 .macro TRACE_IRQS_IRET
 
  86 #ifdef CONFIG_TRACE_IRQFLAGS
 
  87         testl $IF_MASK,PT_EFLAGS(%esp)     # interrupts off?
 
  95 #define resume_userspace_sig    check_userspace
 
  97 #define resume_userspace_sig    resume_userspace
 
 103         CFI_ADJUST_CFA_OFFSET 4;\
 
 104         /*CFI_REL_OFFSET fs, 0;*/\
 
 106         CFI_ADJUST_CFA_OFFSET 4;\
 
 107         /*CFI_REL_OFFSET es, 0;*/\
 
 109         CFI_ADJUST_CFA_OFFSET 4;\
 
 110         /*CFI_REL_OFFSET ds, 0;*/\
 
 112         CFI_ADJUST_CFA_OFFSET 4;\
 
 113         CFI_REL_OFFSET eax, 0;\
 
 115         CFI_ADJUST_CFA_OFFSET 4;\
 
 116         CFI_REL_OFFSET ebp, 0;\
 
 118         CFI_ADJUST_CFA_OFFSET 4;\
 
 119         CFI_REL_OFFSET edi, 0;\
 
 121         CFI_ADJUST_CFA_OFFSET 4;\
 
 122         CFI_REL_OFFSET esi, 0;\
 
 124         CFI_ADJUST_CFA_OFFSET 4;\
 
 125         CFI_REL_OFFSET edx, 0;\
 
 127         CFI_ADJUST_CFA_OFFSET 4;\
 
 128         CFI_REL_OFFSET ecx, 0;\
 
 130         CFI_ADJUST_CFA_OFFSET 4;\
 
 131         CFI_REL_OFFSET ebx, 0;\
 
 132         movl $(__USER_DS), %edx; \
 
 135         movl $(__KERNEL_PERCPU), %edx; \
 
 138 #define RESTORE_INT_REGS \
 
 140         CFI_ADJUST_CFA_OFFSET -4;\
 
 143         CFI_ADJUST_CFA_OFFSET -4;\
 
 146         CFI_ADJUST_CFA_OFFSET -4;\
 
 149         CFI_ADJUST_CFA_OFFSET -4;\
 
 152         CFI_ADJUST_CFA_OFFSET -4;\
 
 155         CFI_ADJUST_CFA_OFFSET -4;\
 
 158         CFI_ADJUST_CFA_OFFSET -4;\
 
 161 #define RESTORE_REGS    \
 
 164         CFI_ADJUST_CFA_OFFSET -4;\
 
 167         CFI_ADJUST_CFA_OFFSET -4;\
 
 170         CFI_ADJUST_CFA_OFFSET -4;\
 
 172 .pushsection .fixup,"ax";       \
 
 179 .section __ex_table,"a";\
 
 186 #define RING0_INT_FRAME \
 
 187         CFI_STARTPROC simple;\
 
 189         CFI_DEF_CFA esp, 3*4;\
 
 190         /*CFI_OFFSET cs, -2*4;*/\
 
 193 #define RING0_EC_FRAME \
 
 194         CFI_STARTPROC simple;\
 
 196         CFI_DEF_CFA esp, 4*4;\
 
 197         /*CFI_OFFSET cs, -2*4;*/\
 
 200 #define RING0_PTREGS_FRAME \
 
 201         CFI_STARTPROC simple;\
 
 203         CFI_DEF_CFA esp, PT_OLDESP-PT_EBX;\
 
 204         /*CFI_OFFSET cs, PT_CS-PT_OLDESP;*/\
 
 205         CFI_OFFSET eip, PT_EIP-PT_OLDESP;\
 
 206         /*CFI_OFFSET es, PT_ES-PT_OLDESP;*/\
 
 207         /*CFI_OFFSET ds, PT_DS-PT_OLDESP;*/\
 
 208         CFI_OFFSET eax, PT_EAX-PT_OLDESP;\
 
 209         CFI_OFFSET ebp, PT_EBP-PT_OLDESP;\
 
 210         CFI_OFFSET edi, PT_EDI-PT_OLDESP;\
 
 211         CFI_OFFSET esi, PT_ESI-PT_OLDESP;\
 
 212         CFI_OFFSET edx, PT_EDX-PT_OLDESP;\
 
 213         CFI_OFFSET ecx, PT_ECX-PT_OLDESP;\
 
 214         CFI_OFFSET ebx, PT_EBX-PT_OLDESP
 
 219         CFI_ADJUST_CFA_OFFSET 4
 
 221         GET_THREAD_INFO(%ebp)
 
 223         CFI_ADJUST_CFA_OFFSET -4
 
 224         pushl $0x0202                   # Reset kernel eflags
 
 225         CFI_ADJUST_CFA_OFFSET 4
 
 227         CFI_ADJUST_CFA_OFFSET -4
 
 233  * Return to user mode is not as complex as all this looks,
 
 234  * but we want the default path for a system call return to
 
 235  * go as quickly as possible which is why some of this is
 
 236  * less clear than it otherwise should be.
 
 239         # userspace resumption stub bypassing syscall exit tracing
 
 243         preempt_stop(CLBR_ANY)
 
 245         GET_THREAD_INFO(%ebp)
 
 247         movl PT_EFLAGS(%esp), %eax      # mix EFLAGS and CS
 
 248         movb PT_CS(%esp), %al
 
 249         andl $(VM_MASK | SEGMENT_RPL_MASK), %eax
 
 251         jb resume_kernel                # not returning to v8086 or userspace
 
 253 ENTRY(resume_userspace)
 
 254         DISABLE_INTERRUPTS(CLBR_ANY)    # make sure we don't miss an interrupt
 
 255                                         # setting need_resched or sigpending
 
 256                                         # between sampling and the iret
 
 257         movl TI_flags(%ebp), %ecx
 
 258         andl $_TIF_WORK_MASK, %ecx      # is there any work to be done on
 
 259                                         # int/exception return?
 
 262 END(ret_from_exception)
 
 264 #ifdef CONFIG_PREEMPT
 
 266         DISABLE_INTERRUPTS(CLBR_ANY)
 
 267         cmpl $0,TI_preempt_count(%ebp)  # non-zero preempt_count ?
 
 270         movl TI_flags(%ebp), %ecx       # need_resched set ?
 
 271         testb $_TIF_NEED_RESCHED, %cl
 
 273         testl $IF_MASK,PT_EFLAGS(%esp)  # interrupts off (exception path) ?
 
 275         call preempt_schedule_irq
 
 281 /* SYSENTER_RETURN points to after the "sysenter" instruction in
 
 282    the vsyscall page.  See vsyscall-sysentry.S, which defines the symbol.  */
 
 284         # sysenter call handler stub
 
 285 ENTRY(sysenter_entry)
 
 289         CFI_REGISTER esp, ebp
 
 290         movl TSS_sysenter_esp0(%esp),%esp
 
 293          * No need to follow this irqs on/off section: the syscall
 
 294          * disabled irqs and here we enable it straight after entry:
 
 296         ENABLE_INTERRUPTS(CLBR_NONE)
 
 298         CFI_ADJUST_CFA_OFFSET 4
 
 299         /*CFI_REL_OFFSET ss, 0*/
 
 301         CFI_ADJUST_CFA_OFFSET 4
 
 302         CFI_REL_OFFSET esp, 0
 
 304         CFI_ADJUST_CFA_OFFSET 4
 
 306         CFI_ADJUST_CFA_OFFSET 4
 
 307         /*CFI_REL_OFFSET cs, 0*/
 
 309          * Push current_thread_info()->sysenter_return to the stack.
 
 310          * A tiny bit of offset fixup is necessary - 4*4 means the 4 words
 
 311          * pushed above; +8 corresponds to copy_thread's esp0 setting.
 
 313         pushl (TI_sysenter_return-THREAD_SIZE+8+4*4)(%esp)
 
 314         CFI_ADJUST_CFA_OFFSET 4
 
 315         CFI_REL_OFFSET eip, 0
 
 318  * Load the potential sixth argument from user stack.
 
 319  * Careful about security.
 
 321         cmpl $__PAGE_OFFSET-3,%ebp
 
 324 .section __ex_table,"a"
 
 326         .long 1b,syscall_fault
 
 330         CFI_ADJUST_CFA_OFFSET 4
 
 332         GET_THREAD_INFO(%ebp)
 
 334         /* Note, _TIF_SECCOMP is bit number 8, and so it needs testw and not testb */
 
 335         testw $(_TIF_SYSCALL_EMU|_TIF_SYSCALL_TRACE|_TIF_SECCOMP|_TIF_SYSCALL_AUDIT),TI_flags(%ebp)
 
 336         jnz syscall_trace_entry
 
 337         cmpl $(nr_syscalls), %eax
 
 339         call *sys_call_table(,%eax,4)
 
 340         movl %eax,PT_EAX(%esp)
 
 341         DISABLE_INTERRUPTS(CLBR_ANY)
 
 343         movl TI_flags(%ebp), %ecx
 
 344         testw $_TIF_ALLWORK_MASK, %cx
 
 345         jne syscall_exit_work
 
 346 /* if something modifies registers it must also disable sysexit */
 
 347         movl PT_EIP(%esp), %edx
 
 348         movl PT_OLDESP(%esp), %ecx
 
 351 1:      mov  PT_FS(%esp), %fs
 
 352         ENABLE_INTERRUPTS_SYSEXIT
 
 354 .pushsection .fixup,"ax"
 
 355 2:      movl $0,PT_FS(%esp)
 
 357 .section __ex_table,"a"
 
 361 ENDPROC(sysenter_entry)
 
 363         # system call handler stub
 
 365         RING0_INT_FRAME                 # can't unwind into user space anyway
 
 366         pushl %eax                      # save orig_eax
 
 367         CFI_ADJUST_CFA_OFFSET 4
 
 369         GET_THREAD_INFO(%ebp)
 
 370                                         # system call tracing in operation / emulation
 
 371         /* Note, _TIF_SECCOMP is bit number 8, and so it needs testw and not testb */
 
 372         testw $(_TIF_SYSCALL_EMU|_TIF_SYSCALL_TRACE|_TIF_SECCOMP|_TIF_SYSCALL_AUDIT),TI_flags(%ebp)
 
 373         jnz syscall_trace_entry
 
 374         cmpl $(nr_syscalls), %eax
 
 377         call *sys_call_table(,%eax,4)
 
 378         movl %eax,PT_EAX(%esp)          # store the return value
 
 380         DISABLE_INTERRUPTS(CLBR_ANY)    # make sure we don't miss an interrupt
 
 381                                         # setting need_resched or sigpending
 
 382                                         # between sampling and the iret
 
 384         testl $TF_MASK,PT_EFLAGS(%esp)  # If tracing set singlestep flag on exit
 
 386         orl $_TIF_SINGLESTEP,TI_flags(%ebp)
 
 388         movl TI_flags(%ebp), %ecx
 
 389         testw $_TIF_ALLWORK_MASK, %cx   # current->work
 
 390         jne syscall_exit_work
 
 393         movl PT_EFLAGS(%esp), %eax      # mix EFLAGS, SS and CS
 
 394         # Warning: PT_OLDSS(%esp) contains the wrong/random values if we
 
 395         # are returning to the kernel.
 
 396         # See comments in process.c:copy_thread() for details.
 
 397         movb PT_OLDSS(%esp), %ah
 
 398         movb PT_CS(%esp), %al
 
 399         andl $(VM_MASK | (SEGMENT_TI_MASK << 8) | SEGMENT_RPL_MASK), %eax
 
 400         cmpl $((SEGMENT_LDT << 8) | USER_RPL), %eax
 
 402         je ldt_ss                       # returning to user-space with LDT SS
 
 405 restore_nocheck_notrace:
 
 407         addl $4, %esp                   # skip orig_eax/error_code
 
 408         CFI_ADJUST_CFA_OFFSET -4
 
 412         pushl $0                        # no error code
 
 416 .section __ex_table,"a"
 
 423         larl PT_OLDSS(%esp), %eax
 
 425         testl $0x00400000, %eax         # returning to 32bit stack?
 
 426         jnz restore_nocheck             # allright, normal return
 
 428 #ifdef CONFIG_PARAVIRT
 
 430          * The kernel can't run on a non-flat stack if paravirt mode
 
 431          * is active.  Rather than try to fixup the high bits of
 
 432          * ESP, bypass this code entirely.  This may break DOSemu
 
 433          * and/or Wine support in a paravirt VM, although the option
 
 434          * is still available to implement the setting of the high
 
 435          * 16-bits in the INTERRUPT_RETURN paravirt-op.
 
 437         cmpl $0, paravirt_ops+PARAVIRT_enabled
 
 441         /* If returning to userspace with 16bit stack,
 
 442          * try to fix the higher word of ESP, as the CPU
 
 444          * This is an "official" bug of all the x86-compatible
 
 445          * CPUs, which we can try to work around to make
 
 446          * dosemu and wine happy. */
 
 447         movl PT_OLDESP(%esp), %eax
 
 449         call patch_espfix_desc
 
 451         CFI_ADJUST_CFA_OFFSET 4
 
 453         CFI_ADJUST_CFA_OFFSET 4
 
 454         DISABLE_INTERRUPTS(CLBR_EAX)
 
 457         CFI_ADJUST_CFA_OFFSET -8
 
 462         # perform work that needs to be done immediately before resumption
 
 464         RING0_PTREGS_FRAME              # can't unwind into user space anyway
 
 466         testb $_TIF_NEED_RESCHED, %cl
 
 470         DISABLE_INTERRUPTS(CLBR_ANY)    # make sure we don't miss an interrupt
 
 471                                         # setting need_resched or sigpending
 
 472                                         # between sampling and the iret
 
 474         movl TI_flags(%ebp), %ecx
 
 475         andl $_TIF_WORK_MASK, %ecx      # is there any work to be done other
 
 476                                         # than syscall tracing?
 
 478         testb $_TIF_NEED_RESCHED, %cl
 
 481 work_notifysig:                         # deal with pending signals and
 
 482                                         # notify-resume requests
 
 484         testl $VM_MASK, PT_EFLAGS(%esp)
 
 486         jne work_notifysig_v86          # returning to kernel-space or
 
 489         call do_notify_resume
 
 490         jmp resume_userspace_sig
 
 494         pushl %ecx                      # save ti_flags for do_notify_resume
 
 495         CFI_ADJUST_CFA_OFFSET 4
 
 496         call save_v86_state             # %eax contains pt_regs pointer
 
 498         CFI_ADJUST_CFA_OFFSET -4
 
 504         call do_notify_resume
 
 505         jmp resume_userspace_sig
 
 508         # perform syscall exit tracing
 
 511         movl $-ENOSYS,PT_EAX(%esp)
 
 514         call do_syscall_trace
 
 516         jne resume_userspace            # ret != 0 -> running under PTRACE_SYSEMU,
 
 517                                         # so must skip actual syscall
 
 518         movl PT_ORIG_EAX(%esp), %eax
 
 519         cmpl $(nr_syscalls), %eax
 
 522 END(syscall_trace_entry)
 
 524         # perform syscall exit tracing
 
 527         testb $(_TIF_SYSCALL_TRACE|_TIF_SYSCALL_AUDIT|_TIF_SINGLESTEP), %cl
 
 530         ENABLE_INTERRUPTS(CLBR_ANY)     # could let do_syscall_trace() call
 
 534         call do_syscall_trace
 
 536 END(syscall_exit_work)
 
 539         RING0_INT_FRAME                 # can't unwind into user space anyway
 
 541         pushl %eax                      # save orig_eax
 
 542         CFI_ADJUST_CFA_OFFSET 4
 
 544         GET_THREAD_INFO(%ebp)
 
 545         movl $-EFAULT,PT_EAX(%esp)
 
 550         movl $-ENOSYS,PT_EAX(%esp)
 
 555 #define FIXUP_ESPFIX_STACK \
 
 556         /* since we are on a wrong stack, we cant make it a C code :( */ \
 
 557         PER_CPU(gdt_page, %ebx); \
 
 558         GET_DESC_BASE(GDT_ENTRY_ESPFIX_SS, %ebx, %eax, %ax, %al, %ah); \
 
 560         pushl $__KERNEL_DS; \
 
 561         CFI_ADJUST_CFA_OFFSET 4; \
 
 563         CFI_ADJUST_CFA_OFFSET 4; \
 
 565         CFI_ADJUST_CFA_OFFSET -8;
 
 566 #define UNWIND_ESPFIX_STACK \
 
 568         /* see if on espfix stack */ \
 
 569         cmpw $__ESPFIX_SS, %ax; \
 
 571         movl $__KERNEL_DS, %eax; \
 
 574         /* switch to normal stack */ \
 
 575         FIXUP_ESPFIX_STACK; \
 
 579  * Build the entry stubs and pointer table with
 
 580  * some assembler magic.
 
 586 ENTRY(irq_entries_start)
 
 592         CFI_ADJUST_CFA_OFFSET -4
 
 595         CFI_ADJUST_CFA_OFFSET 4
 
 602 END(irq_entries_start)
 
 609  * the CPU automatically disables interrupts when executing an IRQ vector,
 
 610  * so IRQ-flags tracing has to follow that:
 
 619 ENDPROC(common_interrupt)
 
 622 #define BUILD_INTERRUPT(name, nr)       \
 
 626         CFI_ADJUST_CFA_OFFSET 4;        \
 
 635 /* The include is where all of the SMP etc. interrupts come from */
 
 636 #include "entry_arch.h"
 
 638 KPROBE_ENTRY(page_fault)
 
 641         CFI_ADJUST_CFA_OFFSET 4
 
 644         /* the function address is in %fs's slot on the stack */
 
 646         CFI_ADJUST_CFA_OFFSET 4
 
 647         /*CFI_REL_OFFSET es, 0*/
 
 649         CFI_ADJUST_CFA_OFFSET 4
 
 650         /*CFI_REL_OFFSET ds, 0*/
 
 652         CFI_ADJUST_CFA_OFFSET 4
 
 653         CFI_REL_OFFSET eax, 0
 
 655         CFI_ADJUST_CFA_OFFSET 4
 
 656         CFI_REL_OFFSET ebp, 0
 
 658         CFI_ADJUST_CFA_OFFSET 4
 
 659         CFI_REL_OFFSET edi, 0
 
 661         CFI_ADJUST_CFA_OFFSET 4
 
 662         CFI_REL_OFFSET esi, 0
 
 664         CFI_ADJUST_CFA_OFFSET 4
 
 665         CFI_REL_OFFSET edx, 0
 
 667         CFI_ADJUST_CFA_OFFSET 4
 
 668         CFI_REL_OFFSET ecx, 0
 
 670         CFI_ADJUST_CFA_OFFSET 4
 
 671         CFI_REL_OFFSET ebx, 0
 
 674         CFI_ADJUST_CFA_OFFSET 4
 
 675         /*CFI_REL_OFFSET fs, 0*/
 
 676         movl $(__KERNEL_PERCPU), %ecx
 
 680         CFI_ADJUST_CFA_OFFSET -4
 
 681         /*CFI_REGISTER es, ecx*/
 
 682         movl PT_FS(%esp), %edi          # get the function address
 
 683         movl PT_ORIG_EAX(%esp), %edx    # get the error code
 
 684         movl $-1, PT_ORIG_EAX(%esp)     # no syscall to restart
 
 685         mov  %ecx, PT_FS(%esp)
 
 686         /*CFI_REL_OFFSET fs, ES*/
 
 687         movl $(__USER_DS), %ecx
 
 690         movl %esp,%eax                  # pt_regs pointer
 
 692         jmp ret_from_exception
 
 694 KPROBE_END(page_fault)
 
 696 ENTRY(coprocessor_error)
 
 699         CFI_ADJUST_CFA_OFFSET 4
 
 700         pushl $do_coprocessor_error
 
 701         CFI_ADJUST_CFA_OFFSET 4
 
 704 END(coprocessor_error)
 
 706 ENTRY(simd_coprocessor_error)
 
 709         CFI_ADJUST_CFA_OFFSET 4
 
 710         pushl $do_simd_coprocessor_error
 
 711         CFI_ADJUST_CFA_OFFSET 4
 
 714 END(simd_coprocessor_error)
 
 716 ENTRY(device_not_available)
 
 718         pushl $-1                       # mark this as an int
 
 719         CFI_ADJUST_CFA_OFFSET 4
 
 722         testl $0x4, %eax                # EM (math emulation bit)
 
 723         jne device_not_available_emulate
 
 724         preempt_stop(CLBR_ANY)
 
 725         call math_state_restore
 
 726         jmp ret_from_exception
 
 727 device_not_available_emulate:
 
 728         pushl $0                        # temporary storage for ORIG_EIP
 
 729         CFI_ADJUST_CFA_OFFSET 4
 
 732         CFI_ADJUST_CFA_OFFSET -4
 
 733         jmp ret_from_exception
 
 735 END(device_not_available)
 
 738  * Debug traps and NMI can happen at the one SYSENTER instruction
 
 739  * that sets up the real kernel stack. Check here, since we can't
 
 740  * allow the wrong stack to be used.
 
 742  * "TSS_sysenter_esp0+12" is because the NMI/debug handler will have
 
 743  * already pushed 3 words if it hits on the sysenter instruction:
 
 744  * eflags, cs and eip.
 
 746  * We just load the right stack, and push the three (known) values
 
 747  * by hand onto the new stack - while updating the return eip past
 
 748  * the instruction that would have done it for sysenter.
 
 750 #define FIX_STACK(offset, ok, label)            \
 
 751         cmpw $__KERNEL_CS,4(%esp);              \
 
 754         movl TSS_sysenter_esp0+offset(%esp),%esp;       \
 
 755         CFI_DEF_CFA esp, 0;                     \
 
 758         CFI_ADJUST_CFA_OFFSET 4;                \
 
 759         pushl $__KERNEL_CS;                     \
 
 760         CFI_ADJUST_CFA_OFFSET 4;                \
 
 761         pushl $sysenter_past_esp;               \
 
 762         CFI_ADJUST_CFA_OFFSET 4;                \
 
 763         CFI_REL_OFFSET eip, 0
 
 767         cmpl $sysenter_entry,(%esp)
 
 768         jne debug_stack_correct
 
 769         FIX_STACK(12, debug_stack_correct, debug_esp_fix_insn)
 
 771         pushl $-1                       # mark this as an int
 
 772         CFI_ADJUST_CFA_OFFSET 4
 
 774         xorl %edx,%edx                  # error code 0
 
 775         movl %esp,%eax                  # pt_regs pointer
 
 777         jmp ret_from_exception
 
 782  * NMI is doubly nasty. It can happen _while_ we're handling
 
 783  * a debug fault, and the debug fault hasn't yet been able to
 
 784  * clear up the stack. So we first check whether we got  an
 
 785  * NMI on the sysenter entry path, but after that we need to
 
 786  * check whether we got an NMI on the debug path where the debug
 
 787  * fault happened on the sysenter path.
 
 792         CFI_ADJUST_CFA_OFFSET 4
 
 794         cmpw $__ESPFIX_SS, %ax
 
 796         CFI_ADJUST_CFA_OFFSET -4
 
 798         cmpl $sysenter_entry,(%esp)
 
 801         CFI_ADJUST_CFA_OFFSET 4
 
 803         /* Do not access memory above the end of our stack page,
 
 804          * it might not exist.
 
 806         andl $(THREAD_SIZE-1),%eax
 
 807         cmpl $(THREAD_SIZE-20),%eax
 
 809         CFI_ADJUST_CFA_OFFSET -4
 
 810         jae nmi_stack_correct
 
 811         cmpl $sysenter_entry,12(%esp)
 
 812         je nmi_debug_stack_check
 
 814         /* We have a RING0_INT_FRAME here */
 
 816         CFI_ADJUST_CFA_OFFSET 4
 
 818         xorl %edx,%edx          # zero error code
 
 819         movl %esp,%eax          # pt_regs pointer
 
 821         jmp restore_nocheck_notrace
 
 826         FIX_STACK(12,nmi_stack_correct, 1)
 
 827         jmp nmi_stack_correct
 
 829 nmi_debug_stack_check:
 
 830         /* We have a RING0_INT_FRAME here */
 
 831         cmpw $__KERNEL_CS,16(%esp)
 
 832         jne nmi_stack_correct
 
 835         cmpl $debug_esp_fix_insn,(%esp)
 
 837         FIX_STACK(24,nmi_stack_correct, 1)
 
 838         jmp nmi_stack_correct
 
 841         /* We have a RING0_INT_FRAME here.
 
 843          * create the pointer to lss back
 
 846         CFI_ADJUST_CFA_OFFSET 4
 
 848         CFI_ADJUST_CFA_OFFSET 4
 
 850         /* copy the iret frame of 12 bytes */
 
 853         CFI_ADJUST_CFA_OFFSET 4
 
 856         CFI_ADJUST_CFA_OFFSET 4
 
 858         FIXUP_ESPFIX_STACK              # %eax == %esp
 
 859         xorl %edx,%edx                  # zero error code
 
 862         lss 12+4(%esp), %esp            # back to espfix stack
 
 863         CFI_ADJUST_CFA_OFFSET -24
 
 866 .section __ex_table,"a"
 
 872 #ifdef CONFIG_PARAVIRT
 
 875 .section __ex_table,"a"
 
 881 ENTRY(native_irq_enable_sysexit)
 
 884 END(native_irq_enable_sysexit)
 
 889         pushl $-1                       # mark this as an int
 
 890         CFI_ADJUST_CFA_OFFSET 4
 
 892         xorl %edx,%edx          # zero error code
 
 893         movl %esp,%eax          # pt_regs pointer
 
 895         jmp ret_from_exception
 
 902         CFI_ADJUST_CFA_OFFSET 4
 
 904         CFI_ADJUST_CFA_OFFSET 4
 
 912         CFI_ADJUST_CFA_OFFSET 4
 
 914         CFI_ADJUST_CFA_OFFSET 4
 
 922         CFI_ADJUST_CFA_OFFSET 4
 
 924         CFI_ADJUST_CFA_OFFSET 4
 
 929 ENTRY(coprocessor_segment_overrun)
 
 932         CFI_ADJUST_CFA_OFFSET 4
 
 933         pushl $do_coprocessor_segment_overrun
 
 934         CFI_ADJUST_CFA_OFFSET 4
 
 937 END(coprocessor_segment_overrun)
 
 941         pushl $do_invalid_TSS
 
 942         CFI_ADJUST_CFA_OFFSET 4
 
 947 ENTRY(segment_not_present)
 
 949         pushl $do_segment_not_present
 
 950         CFI_ADJUST_CFA_OFFSET 4
 
 953 END(segment_not_present)
 
 957         pushl $do_stack_segment
 
 958         CFI_ADJUST_CFA_OFFSET 4
 
 963 KPROBE_ENTRY(general_protection)
 
 965         pushl $do_general_protection
 
 966         CFI_ADJUST_CFA_OFFSET 4
 
 969 KPROBE_END(general_protection)
 
 971 ENTRY(alignment_check)
 
 973         pushl $do_alignment_check
 
 974         CFI_ADJUST_CFA_OFFSET 4
 
 981         pushl $0                        # no error code
 
 982         CFI_ADJUST_CFA_OFFSET 4
 
 983         pushl $do_divide_error
 
 984         CFI_ADJUST_CFA_OFFSET 4
 
 989 #ifdef CONFIG_X86_MCE
 
 993         CFI_ADJUST_CFA_OFFSET 4
 
 994         pushl machine_check_vector
 
 995         CFI_ADJUST_CFA_OFFSET 4
 
1001 ENTRY(spurious_interrupt_bug)
 
1004         CFI_ADJUST_CFA_OFFSET 4
 
1005         pushl $do_spurious_interrupt_bug
 
1006         CFI_ADJUST_CFA_OFFSET 4
 
1009 END(spurious_interrupt_bug)
 
1011 ENTRY(kernel_thread_helper)
 
1012         pushl $0                # fake return address for unwinder
 
1016         CFI_ADJUST_CFA_OFFSET 4
 
1019         CFI_ADJUST_CFA_OFFSET 4
 
1022 ENDPROC(kernel_thread_helper)
 
1025 ENTRY(xen_hypervisor_callback)
 
1028         CFI_ADJUST_CFA_OFFSET 4
 
1032         /* Check to see if we got the event in the critical
 
1033            region in xen_iret_direct, after we've reenabled
 
1034            events and checked for pending events.  This simulates
 
1035            iret instruction's behaviour where it delivers a
 
1036            pending interrupt when enabling interrupts. */
 
1037         movl PT_EIP(%esp),%eax
 
1038         cmpl $xen_iret_start_crit,%eax
 
1040         cmpl $xen_iret_end_crit,%eax
 
1043         call xen_iret_crit_fixup
 
1046         call xen_evtchn_do_upcall
 
1049 ENDPROC(xen_hypervisor_callback)
 
1051 # Hypervisor uses this for application faults while it executes.
 
1052 # We get here for two reasons:
 
1053 #  1. Fault while reloading DS, ES, FS or GS
 
1054 #  2. Fault while executing IRET
 
1055 # Category 1 we fix up by reattempting the load, and zeroing the segment
 
1056 # register if the load fails.
 
1057 # Category 2 we fix up by jumping to do_iret_error. We cannot use the
 
1058 # normal Linux return path in this case because if we use the IRET hypercall
 
1059 # to pop the stack frame we end up in an infinite loop of failsafe callbacks.
 
1060 # We distinguish between categories by maintaining a status value in EAX.
 
1061 ENTRY(xen_failsafe_callback)
 
1064         CFI_ADJUST_CFA_OFFSET 4
 
1072         CFI_ADJUST_CFA_OFFSET -4
 
1074         CFI_ADJUST_CFA_OFFSET -16
 
1077         jmp iret_exc            # EAX != 0 => Category 2 (Bad IRET)
 
1078 5:      pushl $0                # EAX == 0 => Category 1 (Bad segment)
 
1079         CFI_ADJUST_CFA_OFFSET 4
 
1081         jmp ret_from_exception
 
1084 .section .fixup,"ax"
 
1098 .section __ex_table,"a"
 
1105 ENDPROC(xen_failsafe_callback)
 
1107 #endif  /* CONFIG_XEN */
 
1109 .section .rodata,"a"
 
1110 #include "syscall_table.S"
 
1112 syscall_table_size=(.-sys_call_table)