sched: improve affine wakeups
[linux-2.6] / include / linux / hrtimer.h
1 /*
2  *  include/linux/hrtimer.h
3  *
4  *  hrtimers - High-resolution kernel timers
5  *
6  *   Copyright(C) 2005, Thomas Gleixner <tglx@linutronix.de>
7  *   Copyright(C) 2005, Red Hat, Inc., Ingo Molnar
8  *
9  *  data type definitions, declarations, prototypes
10  *
11  *  Started by: Thomas Gleixner and Ingo Molnar
12  *
13  *  For licencing details see kernel-base/COPYING
14  */
15 #ifndef _LINUX_HRTIMER_H
16 #define _LINUX_HRTIMER_H
17
18 #include <linux/rbtree.h>
19 #include <linux/ktime.h>
20 #include <linux/init.h>
21 #include <linux/list.h>
22 #include <linux/wait.h>
23
24 struct hrtimer_clock_base;
25 struct hrtimer_cpu_base;
26
27 /*
28  * Mode arguments of xxx_hrtimer functions:
29  */
30 enum hrtimer_mode {
31         HRTIMER_MODE_ABS,       /* Time value is absolute */
32         HRTIMER_MODE_REL,       /* Time value is relative to now */
33 };
34
35 /*
36  * Return values for the callback function
37  */
38 enum hrtimer_restart {
39         HRTIMER_NORESTART,      /* Timer is not restarted */
40         HRTIMER_RESTART,        /* Timer must be restarted */
41 };
42
43 /*
44  * hrtimer callback modes:
45  *
46  *      HRTIMER_CB_SOFTIRQ:             Callback must run in softirq context
47  *      HRTIMER_CB_IRQSAFE:             Callback may run in hardirq context
48  *      HRTIMER_CB_IRQSAFE_NO_RESTART:  Callback may run in hardirq context and
49  *                                      does not restart the timer
50  *      HRTIMER_CB_IRQSAFE_NO_SOFTIRQ:  Callback must run in hardirq context
51  *                                      Special mode for tick emultation
52  */
53 enum hrtimer_cb_mode {
54         HRTIMER_CB_SOFTIRQ,
55         HRTIMER_CB_IRQSAFE,
56         HRTIMER_CB_IRQSAFE_NO_RESTART,
57         HRTIMER_CB_IRQSAFE_NO_SOFTIRQ,
58 };
59
60 /*
61  * Values to track state of the timer
62  *
63  * Possible states:
64  *
65  * 0x00         inactive
66  * 0x01         enqueued into rbtree
67  * 0x02         callback function running
68  * 0x04         callback pending (high resolution mode)
69  *
70  * Special case:
71  * 0x03         callback function running and enqueued
72  *              (was requeued on another CPU)
73  * The "callback function running and enqueued" status is only possible on
74  * SMP. It happens for example when a posix timer expired and the callback
75  * queued a signal. Between dropping the lock which protects the posix timer
76  * and reacquiring the base lock of the hrtimer, another CPU can deliver the
77  * signal and rearm the timer. We have to preserve the callback running state,
78  * as otherwise the timer could be removed before the softirq code finishes the
79  * the handling of the timer.
80  *
81  * The HRTIMER_STATE_ENQUEUED bit is always or'ed to the current state to
82  * preserve the HRTIMER_STATE_CALLBACK bit in the above scenario.
83  *
84  * All state transitions are protected by cpu_base->lock.
85  */
86 #define HRTIMER_STATE_INACTIVE  0x00
87 #define HRTIMER_STATE_ENQUEUED  0x01
88 #define HRTIMER_STATE_CALLBACK  0x02
89 #define HRTIMER_STATE_PENDING   0x04
90
91 /**
92  * struct hrtimer - the basic hrtimer structure
93  * @node:       red black tree node for time ordered insertion
94  * @expires:    the absolute expiry time in the hrtimers internal
95  *              representation. The time is related to the clock on
96  *              which the timer is based.
97  * @function:   timer expiry callback function
98  * @base:       pointer to the timer base (per cpu and per clock)
99  * @state:      state information (See bit values above)
100  * @cb_mode:    high resolution timer feature to select the callback execution
101  *               mode
102  * @cb_entry:   list head to enqueue an expired timer into the callback list
103  * @start_site: timer statistics field to store the site where the timer
104  *              was started
105  * @start_comm: timer statistics field to store the name of the process which
106  *              started the timer
107  * @start_pid: timer statistics field to store the pid of the task which
108  *              started the timer
109  *
110  * The hrtimer structure must be initialized by hrtimer_init()
111  */
112 struct hrtimer {
113         struct rb_node                  node;
114         ktime_t                         expires;
115         enum hrtimer_restart            (*function)(struct hrtimer *);
116         struct hrtimer_clock_base       *base;
117         unsigned long                   state;
118         enum hrtimer_cb_mode            cb_mode;
119         struct list_head                cb_entry;
120 #ifdef CONFIG_TIMER_STATS
121         void                            *start_site;
122         char                            start_comm[16];
123         int                             start_pid;
124 #endif
125 };
126
127 /**
128  * struct hrtimer_sleeper - simple sleeper structure
129  * @timer:      embedded timer structure
130  * @task:       task to wake up
131  *
132  * task is set to NULL, when the timer expires.
133  */
134 struct hrtimer_sleeper {
135         struct hrtimer timer;
136         struct task_struct *task;
137 };
138
139 /**
140  * struct hrtimer_clock_base - the timer base for a specific clock
141  * @cpu_base:           per cpu clock base
142  * @index:              clock type index for per_cpu support when moving a
143  *                      timer to a base on another cpu.
144  * @active:             red black tree root node for the active timers
145  * @first:              pointer to the timer node which expires first
146  * @resolution:         the resolution of the clock, in nanoseconds
147  * @get_time:           function to retrieve the current time of the clock
148  * @get_softirq_time:   function to retrieve the current time from the softirq
149  * @softirq_time:       the time when running the hrtimer queue in the softirq
150  * @offset:             offset of this clock to the monotonic base
151  * @reprogram:          function to reprogram the timer event
152  */
153 struct hrtimer_clock_base {
154         struct hrtimer_cpu_base *cpu_base;
155         clockid_t               index;
156         struct rb_root          active;
157         struct rb_node          *first;
158         ktime_t                 resolution;
159         ktime_t                 (*get_time)(void);
160         ktime_t                 (*get_softirq_time)(void);
161         ktime_t                 softirq_time;
162 #ifdef CONFIG_HIGH_RES_TIMERS
163         ktime_t                 offset;
164         int                     (*reprogram)(struct hrtimer *t,
165                                              struct hrtimer_clock_base *b,
166                                              ktime_t n);
167 #endif
168 };
169
170 #define HRTIMER_MAX_CLOCK_BASES 2
171
172 /*
173  * struct hrtimer_cpu_base - the per cpu clock bases
174  * @lock:               lock protecting the base and associated clock bases
175  *                      and timers
176  * @lock_key:           the lock_class_key for use with lockdep
177  * @clock_base:         array of clock bases for this cpu
178  * @curr_timer:         the timer which is executing a callback right now
179  * @expires_next:       absolute time of the next event which was scheduled
180  *                      via clock_set_next_event()
181  * @hres_active:        State of high resolution mode
182  * @check_clocks:       Indictator, when set evaluate time source and clock
183  *                      event devices whether high resolution mode can be
184  *                      activated.
185  * @cb_pending:         Expired timers are moved from the rbtree to this
186  *                      list in the timer interrupt. The list is processed
187  *                      in the softirq.
188  * @nr_events:          Total number of timer interrupt events
189  */
190 struct hrtimer_cpu_base {
191         spinlock_t                      lock;
192         struct lock_class_key           lock_key;
193         struct hrtimer_clock_base       clock_base[HRTIMER_MAX_CLOCK_BASES];
194         struct list_head                cb_pending;
195 #ifdef CONFIG_HIGH_RES_TIMERS
196         ktime_t                         expires_next;
197         int                             hres_active;
198         unsigned long                   nr_events;
199 #endif
200 };
201
202 #ifdef CONFIG_HIGH_RES_TIMERS
203 struct clock_event_device;
204
205 extern void clock_was_set(void);
206 extern void hres_timers_resume(void);
207 extern void hrtimer_interrupt(struct clock_event_device *dev);
208
209 /*
210  * In high resolution mode the time reference must be read accurate
211  */
212 static inline ktime_t hrtimer_cb_get_time(struct hrtimer *timer)
213 {
214         return timer->base->get_time();
215 }
216
217 static inline int hrtimer_is_hres_active(struct hrtimer *timer)
218 {
219         return timer->base->cpu_base->hres_active;
220 }
221
222 /*
223  * The resolution of the clocks. The resolution value is returned in
224  * the clock_getres() system call to give application programmers an
225  * idea of the (in)accuracy of timers. Timer values are rounded up to
226  * this resolution values.
227  */
228 # define HIGH_RES_NSEC          1
229 # define KTIME_HIGH_RES         (ktime_t) { .tv64 = HIGH_RES_NSEC }
230 # define MONOTONIC_RES_NSEC     HIGH_RES_NSEC
231 # define KTIME_MONOTONIC_RES    KTIME_HIGH_RES
232
233 #else
234
235 # define MONOTONIC_RES_NSEC     LOW_RES_NSEC
236 # define KTIME_MONOTONIC_RES    KTIME_LOW_RES
237
238 /*
239  * clock_was_set() is a NOP for non- high-resolution systems. The
240  * time-sorted order guarantees that a timer does not expire early and
241  * is expired in the next softirq when the clock was advanced.
242  */
243 static inline void clock_was_set(void) { }
244
245 static inline void hres_timers_resume(void) { }
246
247 /*
248  * In non high resolution mode the time reference is taken from
249  * the base softirq time variable.
250  */
251 static inline ktime_t hrtimer_cb_get_time(struct hrtimer *timer)
252 {
253         return timer->base->softirq_time;
254 }
255
256 static inline int hrtimer_is_hres_active(struct hrtimer *timer)
257 {
258         return 0;
259 }
260 #endif
261
262 extern ktime_t ktime_get(void);
263 extern ktime_t ktime_get_real(void);
264
265 /* Exported timer functions: */
266
267 /* Initialize timers: */
268 extern void hrtimer_init(struct hrtimer *timer, clockid_t which_clock,
269                          enum hrtimer_mode mode);
270
271 /* Basic timer operations: */
272 extern int hrtimer_start(struct hrtimer *timer, ktime_t tim,
273                          const enum hrtimer_mode mode);
274 extern int hrtimer_cancel(struct hrtimer *timer);
275 extern int hrtimer_try_to_cancel(struct hrtimer *timer);
276
277 static inline int hrtimer_restart(struct hrtimer *timer)
278 {
279         return hrtimer_start(timer, timer->expires, HRTIMER_MODE_ABS);
280 }
281
282 /* Query timers: */
283 extern ktime_t hrtimer_get_remaining(const struct hrtimer *timer);
284 extern int hrtimer_get_res(const clockid_t which_clock, struct timespec *tp);
285
286 extern ktime_t hrtimer_get_next_event(void);
287
288 /*
289  * A timer is active, when it is enqueued into the rbtree or the callback
290  * function is running.
291  */
292 static inline int hrtimer_active(const struct hrtimer *timer)
293 {
294         return timer->state != HRTIMER_STATE_INACTIVE;
295 }
296
297 /*
298  * Helper function to check, whether the timer is on one of the queues
299  */
300 static inline int hrtimer_is_queued(struct hrtimer *timer)
301 {
302         return timer->state &
303                 (HRTIMER_STATE_ENQUEUED | HRTIMER_STATE_PENDING);
304 }
305
306 /* Forward a hrtimer so it expires after now: */
307 extern u64
308 hrtimer_forward(struct hrtimer *timer, ktime_t now, ktime_t interval);
309
310 /* Forward a hrtimer so it expires after the hrtimer's current now */
311 static inline u64 hrtimer_forward_now(struct hrtimer *timer,
312                                       ktime_t interval)
313 {
314         return hrtimer_forward(timer, timer->base->get_time(), interval);
315 }
316
317 /* Precise sleep: */
318 extern long hrtimer_nanosleep(struct timespec *rqtp,
319                               struct timespec __user *rmtp,
320                               const enum hrtimer_mode mode,
321                               const clockid_t clockid);
322 extern long hrtimer_nanosleep_restart(struct restart_block *restart_block);
323
324 extern void hrtimer_init_sleeper(struct hrtimer_sleeper *sl,
325                                  struct task_struct *tsk);
326
327 /* Soft interrupt function to run the hrtimer queues: */
328 extern void hrtimer_run_queues(void);
329 extern void hrtimer_run_pending(void);
330
331 /* Bootup initialization: */
332 extern void __init hrtimers_init(void);
333
334 #if BITS_PER_LONG < 64
335 extern u64 ktime_divns(const ktime_t kt, s64 div);
336 #else /* BITS_PER_LONG < 64 */
337 # define ktime_divns(kt, div)           (u64)((kt).tv64 / (div))
338 #endif
339
340 /* Show pending timers: */
341 extern void sysrq_timer_list_show(void);
342
343 /*
344  * Timer-statistics info:
345  */
346 #ifdef CONFIG_TIMER_STATS
347
348 extern void timer_stats_update_stats(void *timer, pid_t pid, void *startf,
349                                      void *timerf, char *comm,
350                                      unsigned int timer_flag);
351
352 static inline void timer_stats_account_hrtimer(struct hrtimer *timer)
353 {
354         timer_stats_update_stats(timer, timer->start_pid, timer->start_site,
355                                  timer->function, timer->start_comm, 0);
356 }
357
358 extern void __timer_stats_hrtimer_set_start_info(struct hrtimer *timer,
359                                                  void *addr);
360
361 static inline void timer_stats_hrtimer_set_start_info(struct hrtimer *timer)
362 {
363         __timer_stats_hrtimer_set_start_info(timer, __builtin_return_address(0));
364 }
365
366 static inline void timer_stats_hrtimer_clear_start_info(struct hrtimer *timer)
367 {
368         timer->start_site = NULL;
369 }
370 #else
371 static inline void timer_stats_account_hrtimer(struct hrtimer *timer)
372 {
373 }
374
375 static inline void timer_stats_hrtimer_set_start_info(struct hrtimer *timer)
376 {
377 }
378
379 static inline void timer_stats_hrtimer_clear_start_info(struct hrtimer *timer)
380 {
381 }
382 #endif
383
384 #endif