KVM: MMU: Make flooding detection work when guest page faults are bypassed
[linux-2.6] / drivers / kvm / kvm.h
1 #ifndef __KVM_H
2 #define __KVM_H
3
4 /*
5  * This work is licensed under the terms of the GNU GPL, version 2.  See
6  * the COPYING file in the top-level directory.
7  */
8
9 #include <linux/types.h>
10 #include <linux/list.h>
11 #include <linux/mutex.h>
12 #include <linux/spinlock.h>
13 #include <linux/signal.h>
14 #include <linux/sched.h>
15 #include <linux/mm.h>
16 #include <linux/preempt.h>
17 #include <asm/signal.h>
18
19 #include <linux/kvm.h>
20 #include <linux/kvm_para.h>
21
22 #define CR3_PAE_RESERVED_BITS ((X86_CR3_PWT | X86_CR3_PCD) - 1)
23 #define CR3_NONPAE_RESERVED_BITS ((PAGE_SIZE-1) & ~(X86_CR3_PWT | X86_CR3_PCD))
24 #define CR3_L_MODE_RESERVED_BITS (CR3_NONPAE_RESERVED_BITS|0xFFFFFF0000000000ULL)
25
26 #define KVM_GUEST_CR0_MASK \
27         (X86_CR0_PG | X86_CR0_PE | X86_CR0_WP | X86_CR0_NE \
28          | X86_CR0_NW | X86_CR0_CD)
29 #define KVM_VM_CR0_ALWAYS_ON \
30         (X86_CR0_PG | X86_CR0_PE | X86_CR0_WP | X86_CR0_NE | X86_CR0_TS \
31          | X86_CR0_MP)
32 #define KVM_GUEST_CR4_MASK \
33         (X86_CR4_VME | X86_CR4_PSE | X86_CR4_PAE | X86_CR4_PGE | X86_CR4_VMXE)
34 #define KVM_PMODE_VM_CR4_ALWAYS_ON (X86_CR4_PAE | X86_CR4_VMXE)
35 #define KVM_RMODE_VM_CR4_ALWAYS_ON (X86_CR4_VME | X86_CR4_PAE | X86_CR4_VMXE)
36
37 #define INVALID_PAGE (~(hpa_t)0)
38 #define UNMAPPED_GVA (~(gpa_t)0)
39
40 #define KVM_MAX_VCPUS 4
41 #define KVM_ALIAS_SLOTS 4
42 #define KVM_MEMORY_SLOTS 8
43 #define KVM_NUM_MMU_PAGES 1024
44 #define KVM_MIN_FREE_MMU_PAGES 5
45 #define KVM_REFILL_PAGES 25
46 #define KVM_MAX_CPUID_ENTRIES 40
47
48 #define DE_VECTOR 0
49 #define UD_VECTOR 6
50 #define NM_VECTOR 7
51 #define DF_VECTOR 8
52 #define TS_VECTOR 10
53 #define NP_VECTOR 11
54 #define SS_VECTOR 12
55 #define GP_VECTOR 13
56 #define PF_VECTOR 14
57
58 #define SELECTOR_TI_MASK (1 << 2)
59 #define SELECTOR_RPL_MASK 0x03
60
61 #define IOPL_SHIFT 12
62
63 #define KVM_PIO_PAGE_OFFSET 1
64
65 /*
66  * vcpu->requests bit members
67  */
68 #define KVM_TLB_FLUSH 0
69
70 /*
71  * Address types:
72  *
73  *  gva - guest virtual address
74  *  gpa - guest physical address
75  *  gfn - guest frame number
76  *  hva - host virtual address
77  *  hpa - host physical address
78  *  hfn - host frame number
79  */
80
81 typedef unsigned long  gva_t;
82 typedef u64            gpa_t;
83 typedef unsigned long  gfn_t;
84
85 typedef unsigned long  hva_t;
86 typedef u64            hpa_t;
87 typedef unsigned long  hfn_t;
88
89 #define NR_PTE_CHAIN_ENTRIES 5
90
91 struct kvm_pte_chain {
92         u64 *parent_ptes[NR_PTE_CHAIN_ENTRIES];
93         struct hlist_node link;
94 };
95
96 /*
97  * kvm_mmu_page_role, below, is defined as:
98  *
99  *   bits 0:3 - total guest paging levels (2-4, or zero for real mode)
100  *   bits 4:7 - page table level for this shadow (1-4)
101  *   bits 8:9 - page table quadrant for 2-level guests
102  *   bit   16 - "metaphysical" - gfn is not a real page (huge page/real mode)
103  *   bits 17:19 - "access" - the user, writable, and nx bits of a huge page pde
104  */
105 union kvm_mmu_page_role {
106         unsigned word;
107         struct {
108                 unsigned glevels : 4;
109                 unsigned level : 4;
110                 unsigned quadrant : 2;
111                 unsigned pad_for_nice_hex_output : 6;
112                 unsigned metaphysical : 1;
113                 unsigned hugepage_access : 3;
114         };
115 };
116
117 struct kvm_mmu_page {
118         struct list_head link;
119         struct hlist_node hash_link;
120
121         /*
122          * The following two entries are used to key the shadow page in the
123          * hash table.
124          */
125         gfn_t gfn;
126         union kvm_mmu_page_role role;
127
128         u64 *spt;
129         unsigned long slot_bitmap; /* One bit set per slot which has memory
130                                     * in this shadow page.
131                                     */
132         int multimapped;         /* More than one parent_pte? */
133         int root_count;          /* Currently serving as active root */
134         union {
135                 u64 *parent_pte;               /* !multimapped */
136                 struct hlist_head parent_ptes; /* multimapped, kvm_pte_chain */
137         };
138 };
139
140 struct kvm_vcpu;
141 extern struct kmem_cache *kvm_vcpu_cache;
142
143 /*
144  * x86 supports 3 paging modes (4-level 64-bit, 3-level 64-bit, and 2-level
145  * 32-bit).  The kvm_mmu structure abstracts the details of the current mmu
146  * mode.
147  */
148 struct kvm_mmu {
149         void (*new_cr3)(struct kvm_vcpu *vcpu);
150         int (*page_fault)(struct kvm_vcpu *vcpu, gva_t gva, u32 err);
151         void (*free)(struct kvm_vcpu *vcpu);
152         gpa_t (*gva_to_gpa)(struct kvm_vcpu *vcpu, gva_t gva);
153         void (*prefetch_page)(struct kvm_vcpu *vcpu,
154                               struct kvm_mmu_page *page);
155         hpa_t root_hpa;
156         int root_level;
157         int shadow_root_level;
158
159         u64 *pae_root;
160 };
161
162 #define KVM_NR_MEM_OBJS 20
163
164 struct kvm_mmu_memory_cache {
165         int nobjs;
166         void *objects[KVM_NR_MEM_OBJS];
167 };
168
169 /*
170  * We don't want allocation failures within the mmu code, so we preallocate
171  * enough memory for a single page fault in a cache.
172  */
173 struct kvm_guest_debug {
174         int enabled;
175         unsigned long bp[4];
176         int singlestep;
177 };
178
179 enum {
180         VCPU_REGS_RAX = 0,
181         VCPU_REGS_RCX = 1,
182         VCPU_REGS_RDX = 2,
183         VCPU_REGS_RBX = 3,
184         VCPU_REGS_RSP = 4,
185         VCPU_REGS_RBP = 5,
186         VCPU_REGS_RSI = 6,
187         VCPU_REGS_RDI = 7,
188 #ifdef CONFIG_X86_64
189         VCPU_REGS_R8 = 8,
190         VCPU_REGS_R9 = 9,
191         VCPU_REGS_R10 = 10,
192         VCPU_REGS_R11 = 11,
193         VCPU_REGS_R12 = 12,
194         VCPU_REGS_R13 = 13,
195         VCPU_REGS_R14 = 14,
196         VCPU_REGS_R15 = 15,
197 #endif
198         NR_VCPU_REGS
199 };
200
201 enum {
202         VCPU_SREG_CS,
203         VCPU_SREG_DS,
204         VCPU_SREG_ES,
205         VCPU_SREG_FS,
206         VCPU_SREG_GS,
207         VCPU_SREG_SS,
208         VCPU_SREG_TR,
209         VCPU_SREG_LDTR,
210 };
211
212 #include "x86_emulate.h"
213
214 struct kvm_pio_request {
215         unsigned long count;
216         int cur_count;
217         struct page *guest_pages[2];
218         unsigned guest_page_offset;
219         int in;
220         int port;
221         int size;
222         int string;
223         int down;
224         int rep;
225 };
226
227 struct kvm_stat {
228         u32 pf_fixed;
229         u32 pf_guest;
230         u32 tlb_flush;
231         u32 invlpg;
232
233         u32 exits;
234         u32 io_exits;
235         u32 mmio_exits;
236         u32 signal_exits;
237         u32 irq_window_exits;
238         u32 halt_exits;
239         u32 halt_wakeup;
240         u32 request_irq_exits;
241         u32 irq_exits;
242         u32 light_exits;
243         u32 efer_reload;
244 };
245
246 struct kvm_io_device {
247         void (*read)(struct kvm_io_device *this,
248                      gpa_t addr,
249                      int len,
250                      void *val);
251         void (*write)(struct kvm_io_device *this,
252                       gpa_t addr,
253                       int len,
254                       const void *val);
255         int (*in_range)(struct kvm_io_device *this, gpa_t addr);
256         void (*destructor)(struct kvm_io_device *this);
257
258         void             *private;
259 };
260
261 static inline void kvm_iodevice_read(struct kvm_io_device *dev,
262                                      gpa_t addr,
263                                      int len,
264                                      void *val)
265 {
266         dev->read(dev, addr, len, val);
267 }
268
269 static inline void kvm_iodevice_write(struct kvm_io_device *dev,
270                                       gpa_t addr,
271                                       int len,
272                                       const void *val)
273 {
274         dev->write(dev, addr, len, val);
275 }
276
277 static inline int kvm_iodevice_inrange(struct kvm_io_device *dev, gpa_t addr)
278 {
279         return dev->in_range(dev, addr);
280 }
281
282 static inline void kvm_iodevice_destructor(struct kvm_io_device *dev)
283 {
284         if (dev->destructor)
285                 dev->destructor(dev);
286 }
287
288 /*
289  * It would be nice to use something smarter than a linear search, TBD...
290  * Thankfully we dont expect many devices to register (famous last words :),
291  * so until then it will suffice.  At least its abstracted so we can change
292  * in one place.
293  */
294 struct kvm_io_bus {
295         int                   dev_count;
296 #define NR_IOBUS_DEVS 6
297         struct kvm_io_device *devs[NR_IOBUS_DEVS];
298 };
299
300 void kvm_io_bus_init(struct kvm_io_bus *bus);
301 void kvm_io_bus_destroy(struct kvm_io_bus *bus);
302 struct kvm_io_device *kvm_io_bus_find_dev(struct kvm_io_bus *bus, gpa_t addr);
303 void kvm_io_bus_register_dev(struct kvm_io_bus *bus,
304                              struct kvm_io_device *dev);
305
306 struct kvm_vcpu {
307         struct kvm *kvm;
308         struct preempt_notifier preempt_notifier;
309         int vcpu_id;
310         struct mutex mutex;
311         int   cpu;
312         u64 host_tsc;
313         struct kvm_run *run;
314         int interrupt_window_open;
315         int guest_mode;
316         unsigned long requests;
317         unsigned long irq_summary; /* bit vector: 1 per word in irq_pending */
318         DECLARE_BITMAP(irq_pending, KVM_NR_INTERRUPTS);
319         unsigned long regs[NR_VCPU_REGS]; /* for rsp: vcpu_load_rsp_rip() */
320         unsigned long rip;      /* needs vcpu_load_rsp_rip() */
321
322         unsigned long cr0;
323         unsigned long cr2;
324         unsigned long cr3;
325         unsigned long cr4;
326         unsigned long cr8;
327         u64 pdptrs[4]; /* pae */
328         u64 shadow_efer;
329         u64 apic_base;
330         struct kvm_lapic *apic;    /* kernel irqchip context */
331 #define VCPU_MP_STATE_RUNNABLE          0
332 #define VCPU_MP_STATE_UNINITIALIZED     1
333 #define VCPU_MP_STATE_INIT_RECEIVED     2
334 #define VCPU_MP_STATE_SIPI_RECEIVED     3
335 #define VCPU_MP_STATE_HALTED            4
336         int mp_state;
337         int sipi_vector;
338         u64 ia32_misc_enable_msr;
339
340         struct kvm_mmu mmu;
341
342         struct kvm_mmu_memory_cache mmu_pte_chain_cache;
343         struct kvm_mmu_memory_cache mmu_rmap_desc_cache;
344         struct kvm_mmu_memory_cache mmu_page_cache;
345         struct kvm_mmu_memory_cache mmu_page_header_cache;
346
347         gfn_t last_pt_write_gfn;
348         int   last_pt_write_count;
349         u64  *last_pte_updated;
350
351         struct kvm_guest_debug guest_debug;
352
353         struct i387_fxsave_struct host_fx_image;
354         struct i387_fxsave_struct guest_fx_image;
355         int fpu_active;
356         int guest_fpu_loaded;
357
358         int mmio_needed;
359         int mmio_read_completed;
360         int mmio_is_write;
361         int mmio_size;
362         unsigned char mmio_data[8];
363         gpa_t mmio_phys_addr;
364         gva_t mmio_fault_cr2;
365         struct kvm_pio_request pio;
366         void *pio_data;
367         wait_queue_head_t wq;
368
369         int sigset_active;
370         sigset_t sigset;
371
372         struct kvm_stat stat;
373
374         struct {
375                 int active;
376                 u8 save_iopl;
377                 struct kvm_save_segment {
378                         u16 selector;
379                         unsigned long base;
380                         u32 limit;
381                         u32 ar;
382                 } tr, es, ds, fs, gs;
383         } rmode;
384         int halt_request; /* real mode on Intel only */
385
386         int cpuid_nent;
387         struct kvm_cpuid_entry cpuid_entries[KVM_MAX_CPUID_ENTRIES];
388
389         /* emulate context */
390
391         struct x86_emulate_ctxt emulate_ctxt;
392 };
393
394 struct kvm_mem_alias {
395         gfn_t base_gfn;
396         unsigned long npages;
397         gfn_t target_gfn;
398 };
399
400 struct kvm_memory_slot {
401         gfn_t base_gfn;
402         unsigned long npages;
403         unsigned long flags;
404         struct page **phys_mem;
405         unsigned long *dirty_bitmap;
406 };
407
408 struct kvm {
409         struct mutex lock; /* protects everything except vcpus */
410         int naliases;
411         struct kvm_mem_alias aliases[KVM_ALIAS_SLOTS];
412         int nmemslots;
413         struct kvm_memory_slot memslots[KVM_MEMORY_SLOTS];
414         /*
415          * Hash table of struct kvm_mmu_page.
416          */
417         struct list_head active_mmu_pages;
418         int n_free_mmu_pages;
419         struct hlist_head mmu_page_hash[KVM_NUM_MMU_PAGES];
420         struct kvm_vcpu *vcpus[KVM_MAX_VCPUS];
421         unsigned long rmap_overflow;
422         struct list_head vm_list;
423         struct file *filp;
424         struct kvm_io_bus mmio_bus;
425         struct kvm_io_bus pio_bus;
426         struct kvm_pic *vpic;
427         struct kvm_ioapic *vioapic;
428         int round_robin_prev_vcpu;
429 };
430
431 static inline struct kvm_pic *pic_irqchip(struct kvm *kvm)
432 {
433         return kvm->vpic;
434 }
435
436 static inline struct kvm_ioapic *ioapic_irqchip(struct kvm *kvm)
437 {
438         return kvm->vioapic;
439 }
440
441 static inline int irqchip_in_kernel(struct kvm *kvm)
442 {
443         return pic_irqchip(kvm) != 0;
444 }
445
446 struct descriptor_table {
447         u16 limit;
448         unsigned long base;
449 } __attribute__((packed));
450
451 struct kvm_x86_ops {
452         int (*cpu_has_kvm_support)(void);          /* __init */
453         int (*disabled_by_bios)(void);             /* __init */
454         void (*hardware_enable)(void *dummy);      /* __init */
455         void (*hardware_disable)(void *dummy);
456         void (*check_processor_compatibility)(void *rtn);
457         int (*hardware_setup)(void);               /* __init */
458         void (*hardware_unsetup)(void);            /* __exit */
459
460         /* Create, but do not attach this VCPU */
461         struct kvm_vcpu *(*vcpu_create)(struct kvm *kvm, unsigned id);
462         void (*vcpu_free)(struct kvm_vcpu *vcpu);
463         void (*vcpu_reset)(struct kvm_vcpu *vcpu);
464
465         void (*prepare_guest_switch)(struct kvm_vcpu *vcpu);
466         void (*vcpu_load)(struct kvm_vcpu *vcpu, int cpu);
467         void (*vcpu_put)(struct kvm_vcpu *vcpu);
468         void (*vcpu_decache)(struct kvm_vcpu *vcpu);
469
470         int (*set_guest_debug)(struct kvm_vcpu *vcpu,
471                                struct kvm_debug_guest *dbg);
472         void (*guest_debug_pre)(struct kvm_vcpu *vcpu);
473         int (*get_msr)(struct kvm_vcpu *vcpu, u32 msr_index, u64 *pdata);
474         int (*set_msr)(struct kvm_vcpu *vcpu, u32 msr_index, u64 data);
475         u64 (*get_segment_base)(struct kvm_vcpu *vcpu, int seg);
476         void (*get_segment)(struct kvm_vcpu *vcpu,
477                             struct kvm_segment *var, int seg);
478         void (*set_segment)(struct kvm_vcpu *vcpu,
479                             struct kvm_segment *var, int seg);
480         void (*get_cs_db_l_bits)(struct kvm_vcpu *vcpu, int *db, int *l);
481         void (*decache_cr4_guest_bits)(struct kvm_vcpu *vcpu);
482         void (*set_cr0)(struct kvm_vcpu *vcpu, unsigned long cr0);
483         void (*set_cr3)(struct kvm_vcpu *vcpu, unsigned long cr3);
484         void (*set_cr4)(struct kvm_vcpu *vcpu, unsigned long cr4);
485         void (*set_efer)(struct kvm_vcpu *vcpu, u64 efer);
486         void (*get_idt)(struct kvm_vcpu *vcpu, struct descriptor_table *dt);
487         void (*set_idt)(struct kvm_vcpu *vcpu, struct descriptor_table *dt);
488         void (*get_gdt)(struct kvm_vcpu *vcpu, struct descriptor_table *dt);
489         void (*set_gdt)(struct kvm_vcpu *vcpu, struct descriptor_table *dt);
490         unsigned long (*get_dr)(struct kvm_vcpu *vcpu, int dr);
491         void (*set_dr)(struct kvm_vcpu *vcpu, int dr, unsigned long value,
492                        int *exception);
493         void (*cache_regs)(struct kvm_vcpu *vcpu);
494         void (*decache_regs)(struct kvm_vcpu *vcpu);
495         unsigned long (*get_rflags)(struct kvm_vcpu *vcpu);
496         void (*set_rflags)(struct kvm_vcpu *vcpu, unsigned long rflags);
497
498         void (*tlb_flush)(struct kvm_vcpu *vcpu);
499         void (*inject_page_fault)(struct kvm_vcpu *vcpu,
500                                   unsigned long addr, u32 err_code);
501
502         void (*inject_gp)(struct kvm_vcpu *vcpu, unsigned err_code);
503
504         void (*run)(struct kvm_vcpu *vcpu, struct kvm_run *run);
505         int (*handle_exit)(struct kvm_run *run, struct kvm_vcpu *vcpu);
506         void (*skip_emulated_instruction)(struct kvm_vcpu *vcpu);
507         void (*patch_hypercall)(struct kvm_vcpu *vcpu,
508                                 unsigned char *hypercall_addr);
509         int (*get_irq)(struct kvm_vcpu *vcpu);
510         void (*set_irq)(struct kvm_vcpu *vcpu, int vec);
511         void (*inject_pending_irq)(struct kvm_vcpu *vcpu);
512         void (*inject_pending_vectors)(struct kvm_vcpu *vcpu,
513                                        struct kvm_run *run);
514 };
515
516 extern struct kvm_x86_ops *kvm_x86_ops;
517
518 /* The guest did something we don't support. */
519 #define pr_unimpl(vcpu, fmt, ...)                                       \
520  do {                                                                   \
521         if (printk_ratelimit())                                         \
522                 printk(KERN_ERR "kvm: %i: cpu%i " fmt,                  \
523                        current->tgid, (vcpu)->vcpu_id , ## __VA_ARGS__); \
524  } while(0)
525
526 #define kvm_printf(kvm, fmt ...) printk(KERN_DEBUG fmt)
527 #define vcpu_printf(vcpu, fmt...) kvm_printf(vcpu->kvm, fmt)
528
529 int kvm_vcpu_init(struct kvm_vcpu *vcpu, struct kvm *kvm, unsigned id);
530 void kvm_vcpu_uninit(struct kvm_vcpu *vcpu);
531
532 int kvm_init_x86(struct kvm_x86_ops *ops, unsigned int vcpu_size,
533                   struct module *module);
534 void kvm_exit_x86(void);
535
536 int kvm_mmu_module_init(void);
537 void kvm_mmu_module_exit(void);
538
539 void kvm_mmu_destroy(struct kvm_vcpu *vcpu);
540 int kvm_mmu_create(struct kvm_vcpu *vcpu);
541 int kvm_mmu_setup(struct kvm_vcpu *vcpu);
542 void kvm_mmu_set_nonpresent_ptes(u64 trap_pte, u64 notrap_pte);
543
544 int kvm_mmu_reset_context(struct kvm_vcpu *vcpu);
545 void kvm_mmu_slot_remove_write_access(struct kvm *kvm, int slot);
546 void kvm_mmu_zap_all(struct kvm *kvm);
547
548 hpa_t gpa_to_hpa(struct kvm_vcpu *vcpu, gpa_t gpa);
549 #define HPA_MSB ((sizeof(hpa_t) * 8) - 1)
550 #define HPA_ERR_MASK ((hpa_t)1 << HPA_MSB)
551 static inline int is_error_hpa(hpa_t hpa) { return hpa >> HPA_MSB; }
552 hpa_t gva_to_hpa(struct kvm_vcpu *vcpu, gva_t gva);
553 struct page *gva_to_page(struct kvm_vcpu *vcpu, gva_t gva);
554
555 extern hpa_t bad_page_address;
556
557 struct page *gfn_to_page(struct kvm *kvm, gfn_t gfn);
558 struct kvm_memory_slot *gfn_to_memslot(struct kvm *kvm, gfn_t gfn);
559 void mark_page_dirty(struct kvm *kvm, gfn_t gfn);
560
561 enum emulation_result {
562         EMULATE_DONE,       /* no further processing */
563         EMULATE_DO_MMIO,      /* kvm_run filled with mmio request */
564         EMULATE_FAIL,         /* can't emulate this instruction */
565 };
566
567 int emulate_instruction(struct kvm_vcpu *vcpu, struct kvm_run *run,
568                         unsigned long cr2, u16 error_code, int no_decode);
569 void kvm_report_emulation_failure(struct kvm_vcpu *cvpu, const char *context);
570 void realmode_lgdt(struct kvm_vcpu *vcpu, u16 size, unsigned long address);
571 void realmode_lidt(struct kvm_vcpu *vcpu, u16 size, unsigned long address);
572 void realmode_lmsw(struct kvm_vcpu *vcpu, unsigned long msw,
573                    unsigned long *rflags);
574
575 unsigned long realmode_get_cr(struct kvm_vcpu *vcpu, int cr);
576 void realmode_set_cr(struct kvm_vcpu *vcpu, int cr, unsigned long value,
577                      unsigned long *rflags);
578 int kvm_get_msr(struct kvm_vcpu *vcpu, u32 msr_index, u64 *data);
579 int kvm_set_msr(struct kvm_vcpu *vcpu, u32 msr_index, u64 data);
580
581 struct x86_emulate_ctxt;
582
583 int kvm_emulate_pio (struct kvm_vcpu *vcpu, struct kvm_run *run, int in,
584                      int size, unsigned port);
585 int kvm_emulate_pio_string(struct kvm_vcpu *vcpu, struct kvm_run *run, int in,
586                            int size, unsigned long count, int down,
587                             gva_t address, int rep, unsigned port);
588 void kvm_emulate_cpuid(struct kvm_vcpu *vcpu);
589 int kvm_emulate_halt(struct kvm_vcpu *vcpu);
590 int emulate_invlpg(struct kvm_vcpu *vcpu, gva_t address);
591 int emulate_clts(struct kvm_vcpu *vcpu);
592 int emulator_get_dr(struct x86_emulate_ctxt* ctxt, int dr,
593                     unsigned long *dest);
594 int emulator_set_dr(struct x86_emulate_ctxt *ctxt, int dr,
595                     unsigned long value);
596
597 void set_cr0(struct kvm_vcpu *vcpu, unsigned long cr0);
598 void set_cr3(struct kvm_vcpu *vcpu, unsigned long cr0);
599 void set_cr4(struct kvm_vcpu *vcpu, unsigned long cr0);
600 void set_cr8(struct kvm_vcpu *vcpu, unsigned long cr0);
601 unsigned long get_cr8(struct kvm_vcpu *vcpu);
602 void lmsw(struct kvm_vcpu *vcpu, unsigned long msw);
603 void kvm_get_cs_db_l_bits(struct kvm_vcpu *vcpu, int *db, int *l);
604
605 int kvm_get_msr_common(struct kvm_vcpu *vcpu, u32 msr, u64 *pdata);
606 int kvm_set_msr_common(struct kvm_vcpu *vcpu, u32 msr, u64 data);
607
608 void fx_init(struct kvm_vcpu *vcpu);
609
610 void kvm_resched(struct kvm_vcpu *vcpu);
611 void kvm_load_guest_fpu(struct kvm_vcpu *vcpu);
612 void kvm_put_guest_fpu(struct kvm_vcpu *vcpu);
613 void kvm_flush_remote_tlbs(struct kvm *kvm);
614
615 int emulator_read_std(unsigned long addr,
616                       void *val,
617                       unsigned int bytes,
618                       struct kvm_vcpu *vcpu);
619 int emulator_write_emulated(unsigned long addr,
620                             const void *val,
621                             unsigned int bytes,
622                             struct kvm_vcpu *vcpu);
623
624 unsigned long segment_base(u16 selector);
625
626 void kvm_mmu_pte_write(struct kvm_vcpu *vcpu, gpa_t gpa,
627                        const u8 *new, int bytes);
628 int kvm_mmu_unprotect_page_virt(struct kvm_vcpu *vcpu, gva_t gva);
629 void __kvm_mmu_free_some_pages(struct kvm_vcpu *vcpu);
630 int kvm_mmu_load(struct kvm_vcpu *vcpu);
631 void kvm_mmu_unload(struct kvm_vcpu *vcpu);
632
633 int kvm_emulate_hypercall(struct kvm_vcpu *vcpu);
634
635 int kvm_fix_hypercall(struct kvm_vcpu *vcpu);
636
637 static inline void kvm_guest_enter(void)
638 {
639         current->flags |= PF_VCPU;
640 }
641
642 static inline void kvm_guest_exit(void)
643 {
644         current->flags &= ~PF_VCPU;
645 }
646
647 static inline int kvm_mmu_page_fault(struct kvm_vcpu *vcpu, gva_t gva,
648                                      u32 error_code)
649 {
650         return vcpu->mmu.page_fault(vcpu, gva, error_code);
651 }
652
653 static inline void kvm_mmu_free_some_pages(struct kvm_vcpu *vcpu)
654 {
655         if (unlikely(vcpu->kvm->n_free_mmu_pages < KVM_MIN_FREE_MMU_PAGES))
656                 __kvm_mmu_free_some_pages(vcpu);
657 }
658
659 static inline int kvm_mmu_reload(struct kvm_vcpu *vcpu)
660 {
661         if (likely(vcpu->mmu.root_hpa != INVALID_PAGE))
662                 return 0;
663
664         return kvm_mmu_load(vcpu);
665 }
666
667 static inline int is_long_mode(struct kvm_vcpu *vcpu)
668 {
669 #ifdef CONFIG_X86_64
670         return vcpu->shadow_efer & EFER_LME;
671 #else
672         return 0;
673 #endif
674 }
675
676 static inline int is_pae(struct kvm_vcpu *vcpu)
677 {
678         return vcpu->cr4 & X86_CR4_PAE;
679 }
680
681 static inline int is_pse(struct kvm_vcpu *vcpu)
682 {
683         return vcpu->cr4 & X86_CR4_PSE;
684 }
685
686 static inline int is_paging(struct kvm_vcpu *vcpu)
687 {
688         return vcpu->cr0 & X86_CR0_PG;
689 }
690
691 static inline int memslot_id(struct kvm *kvm, struct kvm_memory_slot *slot)
692 {
693         return slot - kvm->memslots;
694 }
695
696 static inline struct kvm_mmu_page *page_header(hpa_t shadow_page)
697 {
698         struct page *page = pfn_to_page(shadow_page >> PAGE_SHIFT);
699
700         return (struct kvm_mmu_page *)page_private(page);
701 }
702
703 static inline u16 read_fs(void)
704 {
705         u16 seg;
706         asm ("mov %%fs, %0" : "=g"(seg));
707         return seg;
708 }
709
710 static inline u16 read_gs(void)
711 {
712         u16 seg;
713         asm ("mov %%gs, %0" : "=g"(seg));
714         return seg;
715 }
716
717 static inline u16 read_ldt(void)
718 {
719         u16 ldt;
720         asm ("sldt %0" : "=g"(ldt));
721         return ldt;
722 }
723
724 static inline void load_fs(u16 sel)
725 {
726         asm ("mov %0, %%fs" : : "rm"(sel));
727 }
728
729 static inline void load_gs(u16 sel)
730 {
731         asm ("mov %0, %%gs" : : "rm"(sel));
732 }
733
734 #ifndef load_ldt
735 static inline void load_ldt(u16 sel)
736 {
737         asm ("lldt %0" : : "rm"(sel));
738 }
739 #endif
740
741 static inline void get_idt(struct descriptor_table *table)
742 {
743         asm ("sidt %0" : "=m"(*table));
744 }
745
746 static inline void get_gdt(struct descriptor_table *table)
747 {
748         asm ("sgdt %0" : "=m"(*table));
749 }
750
751 static inline unsigned long read_tr_base(void)
752 {
753         u16 tr;
754         asm ("str %0" : "=g"(tr));
755         return segment_base(tr);
756 }
757
758 #ifdef CONFIG_X86_64
759 static inline unsigned long read_msr(unsigned long msr)
760 {
761         u64 value;
762
763         rdmsrl(msr, value);
764         return value;
765 }
766 #endif
767
768 static inline void fx_save(struct i387_fxsave_struct *image)
769 {
770         asm ("fxsave (%0)":: "r" (image));
771 }
772
773 static inline void fx_restore(struct i387_fxsave_struct *image)
774 {
775         asm ("fxrstor (%0)":: "r" (image));
776 }
777
778 static inline void fpu_init(void)
779 {
780         asm ("finit");
781 }
782
783 static inline u32 get_rdx_init_val(void)
784 {
785         return 0x600; /* P6 family */
786 }
787
788 #define ASM_VMX_VMCLEAR_RAX       ".byte 0x66, 0x0f, 0xc7, 0x30"
789 #define ASM_VMX_VMLAUNCH          ".byte 0x0f, 0x01, 0xc2"
790 #define ASM_VMX_VMRESUME          ".byte 0x0f, 0x01, 0xc3"
791 #define ASM_VMX_VMPTRLD_RAX       ".byte 0x0f, 0xc7, 0x30"
792 #define ASM_VMX_VMREAD_RDX_RAX    ".byte 0x0f, 0x78, 0xd0"
793 #define ASM_VMX_VMWRITE_RAX_RDX   ".byte 0x0f, 0x79, 0xd0"
794 #define ASM_VMX_VMWRITE_RSP_RDX   ".byte 0x0f, 0x79, 0xd4"
795 #define ASM_VMX_VMXOFF            ".byte 0x0f, 0x01, 0xc4"
796 #define ASM_VMX_VMXON_RAX         ".byte 0xf3, 0x0f, 0xc7, 0x30"
797
798 #define MSR_IA32_TIME_STAMP_COUNTER             0x010
799
800 #define TSS_IOPB_BASE_OFFSET 0x66
801 #define TSS_BASE_SIZE 0x68
802 #define TSS_IOPB_SIZE (65536 / 8)
803 #define TSS_REDIRECTION_SIZE (256 / 8)
804 #define RMODE_TSS_SIZE (TSS_BASE_SIZE + TSS_REDIRECTION_SIZE + TSS_IOPB_SIZE + 1)
805
806 #endif