Merge branch 'block-dir' of git://brick.kernel.dk/data/git/linux-2.6-block
[linux-2.6] / include / asm-xtensa / bitops.h
1 /*
2  * include/asm-xtensa/bitops.h
3  *
4  * Atomic operations that C can't guarantee us.Useful for resource counting etc.
5  *
6  * This file is subject to the terms and conditions of the GNU General Public
7  * License.  See the file "COPYING" in the main directory of this archive
8  * for more details.
9  *
10  * Copyright (C) 2001 - 2005 Tensilica Inc.
11  */
12
13 #ifndef _XTENSA_BITOPS_H
14 #define _XTENSA_BITOPS_H
15
16 #ifdef __KERNEL__
17
18 #include <asm/processor.h>
19 #include <asm/byteorder.h>
20 #include <asm/system.h>
21
22 #ifdef CONFIG_SMP
23 # error SMP not supported on this architecture
24 #endif
25
26 static __inline__ void set_bit(int nr, volatile void * addr)
27 {
28         unsigned long mask = 1 << (nr & 0x1f);
29         unsigned long *a = ((unsigned long *)addr) + (nr >> 5);
30         unsigned long flags;
31
32         local_irq_save(flags);
33         *a |= mask;
34         local_irq_restore(flags);
35 }
36
37 static __inline__ void __set_bit(int nr, volatile unsigned long * addr)
38 {
39         unsigned long mask = 1 << (nr & 0x1f);
40         unsigned long *a = ((unsigned long *)addr) + (nr >> 5);
41
42         *a |= mask;
43 }
44
45 static __inline__ void clear_bit(int nr, volatile void * addr)
46 {
47         unsigned long mask = 1 << (nr & 0x1f);
48         unsigned long *a = ((unsigned long *)addr) + (nr >> 5);
49         unsigned long flags;
50
51         local_irq_save(flags);
52         *a &= ~mask;
53         local_irq_restore(flags);
54 }
55
56 static __inline__ void __clear_bit(int nr, volatile unsigned long *addr)
57 {
58         unsigned long mask = 1 << (nr & 0x1f);
59         unsigned long *a = ((unsigned long *)addr) + (nr >> 5);
60
61         *a &= ~mask;
62 }
63
64 /*
65  * clear_bit() doesn't provide any barrier for the compiler.
66  */
67
68 #define smp_mb__before_clear_bit()      barrier()
69 #define smp_mb__after_clear_bit()       barrier()
70
71 static __inline__ void change_bit(int nr, volatile void * addr)
72 {
73         unsigned long mask = 1 << (nr & 0x1f);
74         unsigned long *a = ((unsigned long *)addr) + (nr >> 5);
75         unsigned long flags;
76
77         local_irq_save(flags);
78         *a ^= mask;
79         local_irq_restore(flags);
80 }
81
82 static __inline__ void __change_bit(int nr, volatile void * addr)
83 {
84         unsigned long mask = 1 << (nr & 0x1f);
85         unsigned long *a = ((unsigned long *)addr) + (nr >> 5);
86
87         *a ^= mask;
88 }
89
90 static __inline__ int test_and_set_bit(int nr, volatile void * addr)
91 {
92         unsigned long retval;
93         unsigned long mask = 1 << (nr & 0x1f);
94         unsigned long *a = ((unsigned long *)addr) + (nr >> 5);
95         unsigned long flags;
96
97         local_irq_save(flags);
98         retval = (mask & *a) != 0;
99         *a |= mask;
100         local_irq_restore(flags);
101
102         return retval;
103 }
104
105 static __inline__ int __test_and_set_bit(int nr, volatile void * addr)
106 {
107         unsigned long retval;
108         unsigned long mask = 1 << (nr & 0x1f);
109         unsigned long *a = ((unsigned long *)addr) + (nr >> 5);
110
111         retval = (mask & *a) != 0;
112         *a |= mask;
113
114         return retval;
115 }
116
117 static __inline__ int test_and_clear_bit(int nr, volatile void * addr)
118 {
119         unsigned long retval;
120         unsigned long mask = 1 << (nr & 0x1f);
121         unsigned long *a = ((unsigned long *)addr) + (nr >> 5);
122         unsigned long flags;
123
124         local_irq_save(flags);
125         retval = (mask & *a) != 0;
126         *a &= ~mask;
127         local_irq_restore(flags);
128
129         return retval;
130 }
131
132 static __inline__ int __test_and_clear_bit(int nr, volatile void * addr)
133 {
134         unsigned long mask = 1 << (nr & 0x1f);
135         unsigned long *a = ((unsigned long *)addr) + (nr >> 5);
136         unsigned long old = *a;
137
138         *a = old & ~mask;
139         return (old & mask) != 0;
140 }
141
142 static __inline__ int test_and_change_bit(int nr, volatile void * addr)
143 {
144         unsigned long retval;
145         unsigned long mask = 1 << (nr & 0x1f);
146         unsigned long *a = ((unsigned long *)addr) + (nr >> 5);
147         unsigned long flags;
148
149         local_irq_save(flags);
150
151         retval = (mask & *a) != 0;
152         *a ^= mask;
153         local_irq_restore(flags);
154
155         return retval;
156 }
157
158 /*
159  * non-atomic version; can be reordered
160  */
161
162 static __inline__ int __test_and_change_bit(int nr, volatile void *addr)
163 {
164         unsigned long mask = 1 << (nr & 0x1f);
165         unsigned long *a = ((unsigned long *)addr) + (nr >> 5);
166         unsigned long old = *a;
167
168         *a = old ^ mask;
169         return (old & mask) != 0;
170 }
171
172 static __inline__ int test_bit(int nr, const volatile void *addr)
173 {
174         return 1UL & (((const volatile unsigned int *)addr)[nr>>5] >> (nr&31));
175 }
176
177 #if XCHAL_HAVE_NSA
178
179 static __inline__ int __cntlz (unsigned long x)
180 {
181         int lz;
182         asm ("nsau %0, %1" : "=r" (lz) : "r" (x));
183         return 31 - lz;
184 }
185
186 #else
187
188 static __inline__ int __cntlz (unsigned long x)
189 {
190         unsigned long sum, x1, x2, x4, x8, x16;
191         x1  = x & 0xAAAAAAAA;
192         x2  = x & 0xCCCCCCCC;
193         x4  = x & 0xF0F0F0F0;
194         x8  = x & 0xFF00FF00;
195         x16 = x & 0xFFFF0000;
196         sum = x2 ? 2 : 0;
197         sum += (x16 != 0) * 16;
198         sum += (x8 != 0) * 8;
199         sum += (x4 != 0) * 4;
200         sum += (x1 != 0);
201
202         return sum;
203 }
204
205 #endif
206
207 /*
208  * ffz: Find first zero in word. Undefined if no zero exists.
209  * bit 0 is the LSB of addr; bit 32 is the LSB of (addr+1).
210  */
211
212 static __inline__ int ffz(unsigned long x)
213 {
214         if ((x = ~x) == 0)
215                 return 32;
216         return __cntlz(x & -x);
217 }
218
219 /*
220  * __ffs: Find first bit set in word. Return 0 for bit 0
221  */
222
223 static __inline__ int __ffs(unsigned long x)
224 {
225         return __cntlz(x & -x);
226 }
227
228 /*
229  * ffs: Find first bit set in word. This is defined the same way as
230  * the libc and compiler builtin ffs routines, therefore
231  * differs in spirit from the above ffz (man ffs).
232  */
233
234 static __inline__ int ffs(unsigned long x)
235 {
236         return __cntlz(x & -x) + 1;
237 }
238
239 /*
240  * fls: Find last (most-significant) bit set in word.
241  * Note fls(0) = 0, fls(1) = 1, fls(0x80000000) = 32.
242  */
243
244 static __inline__ int fls (unsigned int x)
245 {
246         return __cntlz(x);
247 }
248
249 static __inline__ int
250 find_next_bit(const unsigned long *addr, int size, int offset)
251 {
252         const unsigned long *p = addr + (offset >> 5);
253         unsigned long result = offset & ~31UL;
254         unsigned long tmp;
255
256         if (offset >= size)
257                 return size;
258         size -= result;
259         offset &= 31UL;
260         if (offset) {
261                 tmp = *p++;
262                 tmp &= ~0UL << offset;
263                 if (size < 32)
264                         goto found_first;
265                 if (tmp)
266                         goto found_middle;
267                 size -= 32;
268                 result += 32;
269         }
270         while (size >= 32) {
271                 if ((tmp = *p++) != 0)
272                         goto found_middle;
273                 result += 32;
274                 size -= 32;
275         }
276         if (!size)
277                 return result;
278         tmp = *p;
279
280 found_first:
281         tmp &= ~0UL >> (32 - size);
282         if (tmp == 0UL) /* Are any bits set? */
283                 return result + size;   /* Nope. */
284 found_middle:
285         return result + __ffs(tmp);
286 }
287
288 /**
289  * find_first_bit - find the first set bit in a memory region
290  * @addr: The address to start the search at
291  * @size: The maximum size to search
292  *
293  * Returns the bit-number of the first set bit, not the number of the byte
294  * containing a bit.
295  */
296
297 #define find_first_bit(addr, size) \
298         find_next_bit((addr), (size), 0)
299
300 static __inline__ int
301 find_next_zero_bit(const unsigned long *addr, int size, int offset)
302 {
303         const unsigned long *p = addr + (offset >> 5);
304         unsigned long result = offset & ~31UL;
305         unsigned long tmp;
306
307         if (offset >= size)
308                 return size;
309         size -= result;
310         offset &= 31UL;
311         if (offset) {
312                 tmp = *p++;
313                 tmp |= ~0UL >> (32-offset);
314                 if (size < 32)
315                         goto found_first;
316                 if (~tmp)
317                         goto found_middle;
318                 size -= 32;
319                 result += 32;
320         }
321         while (size & ~31UL) {
322                 if (~(tmp = *p++))
323                         goto found_middle;
324                 result += 32;
325                 size -= 32;
326         }
327         if (!size)
328                 return result;
329         tmp = *p;
330
331 found_first:
332         tmp |= ~0UL << size;
333 found_middle:
334         return result + ffz(tmp);
335 }
336
337 #define find_first_zero_bit(addr, size) \
338         find_next_zero_bit((addr), (size), 0)
339
340 #ifdef __XTENSA_EL__
341 # define ext2_set_bit(nr,addr) __test_and_set_bit((nr), (addr))
342 # define ext2_set_bit_atomic(lock,nr,addr) test_and_set_bit((nr),(addr))
343 # define ext2_clear_bit(nr,addr) __test_and_clear_bit((nr), (addr))
344 # define ext2_clear_bit_atomic(lock,nr,addr) test_and_clear_bit((nr),(addr))
345 # define ext2_test_bit(nr,addr) test_bit((nr), (addr))
346 # define ext2_find_first_zero_bit(addr, size) find_first_zero_bit((addr),(size))
347 # define ext2_find_next_zero_bit(addr, size, offset) \
348                 find_next_zero_bit((addr), (size), (offset))
349 #elif defined(__XTENSA_EB__)
350 # define ext2_set_bit(nr,addr) __test_and_set_bit((nr) ^ 0x18, (addr))
351 # define ext2_set_bit_atomic(lock,nr,addr) test_and_set_bit((nr) ^ 0x18, (addr))
352 # define ext2_clear_bit(nr,addr) __test_and_clear_bit((nr) ^ 18, (addr))
353 # define ext2_clear_bit_atomic(lock,nr,addr) test_and_clear_bit((nr)^0x18,(addr))
354 # define ext2_test_bit(nr,addr) test_bit((nr) ^ 0x18, (addr))
355 # define ext2_find_first_zero_bit(addr, size) \
356         ext2_find_next_zero_bit((addr), (size), 0)
357
358 static __inline__ unsigned long ext2_find_next_zero_bit(void *addr, unsigned long size, unsigned long offset)
359 {
360         unsigned long *p = ((unsigned long *) addr) + (offset >> 5);
361         unsigned long result = offset & ~31UL;
362         unsigned long tmp;
363
364         if (offset >= size)
365                 return size;
366         size -= result;
367         offset &= 31UL;
368         if(offset) {
369                 /* We hold the little endian value in tmp, but then the
370                  * shift is illegal. So we could keep a big endian value
371                  * in tmp, like this:
372                  *
373                  * tmp = __swab32(*(p++));
374                  * tmp |= ~0UL >> (32-offset);
375                  *
376                  * but this would decrease preformance, so we change the
377                  * shift:
378                  */
379                 tmp = *(p++);
380                 tmp |= __swab32(~0UL >> (32-offset));
381                 if(size < 32)
382                         goto found_first;
383                 if(~tmp)
384                         goto found_middle;
385                 size -= 32;
386                 result += 32;
387         }
388         while(size & ~31UL) {
389                 if(~(tmp = *(p++)))
390                         goto found_middle;
391                 result += 32;
392                 size -= 32;
393         }
394         if(!size)
395                 return result;
396         tmp = *p;
397
398 found_first:
399         /* tmp is little endian, so we would have to swab the shift,
400          * see above. But then we have to swab tmp below for ffz, so
401          * we might as well do this here.
402          */
403         return result + ffz(__swab32(tmp) | (~0UL << size));
404 found_middle:
405         return result + ffz(__swab32(tmp));
406 }
407
408 #else
409 # error processor byte order undefined!
410 #endif
411
412
413 #define hweight32(x)    generic_hweight32(x)
414 #define hweight16(x)    generic_hweight16(x)
415 #define hweight8(x)     generic_hweight8(x)
416
417 /*
418  * Find the first bit set in a 140-bit bitmap.
419  * The first 100 bits are unlikely to be set.
420  */
421
422 static inline int sched_find_first_bit(const unsigned long *b)
423 {
424         if (unlikely(b[0]))
425                 return __ffs(b[0]);
426         if (unlikely(b[1]))
427                 return __ffs(b[1]) + 32;
428         if (unlikely(b[2]))
429                 return __ffs(b[2]) + 64;
430         if (b[3])
431                 return __ffs(b[3]) + 96;
432         return __ffs(b[4]) + 128;
433 }
434
435
436 /* Bitmap functions for the minix filesystem.  */
437
438 #define minix_test_and_set_bit(nr,addr) test_and_set_bit(nr,addr)
439 #define minix_set_bit(nr,addr) set_bit(nr,addr)
440 #define minix_test_and_clear_bit(nr,addr) test_and_clear_bit(nr,addr)
441 #define minix_test_bit(nr,addr) test_bit(nr,addr)
442 #define minix_find_first_zero_bit(addr,size) find_first_zero_bit(addr,size)
443
444 #endif  /* __KERNEL__ */
445
446 #endif  /* _XTENSA_BITOPS_H */