Merge branch 'for-linus' of master.kernel.org:/pub/scm/linux/kernel/git/roland/infiniband
[linux-2.6] / arch / powerpc / lib / rheap.c
1 /*
2  * A Remote Heap.  Remote means that we don't touch the memory that the
3  * heap points to. Normal heap implementations use the memory they manage
4  * to place their list. We cannot do that because the memory we manage may
5  * have special properties, for example it is uncachable or of different
6  * endianess.
7  *
8  * Author: Pantelis Antoniou <panto@intracom.gr>
9  *
10  * 2004 (c) INTRACOM S.A. Greece. This file is licensed under
11  * the terms of the GNU General Public License version 2. This program
12  * is licensed "as is" without any warranty of any kind, whether express
13  * or implied.
14  */
15 #include <linux/types.h>
16 #include <linux/errno.h>
17 #include <linux/kernel.h>
18 #include <linux/mm.h>
19 #include <linux/slab.h>
20
21 #include <asm/rheap.h>
22
23 /*
24  * Fixup a list_head, needed when copying lists.  If the pointers fall
25  * between s and e, apply the delta.  This assumes that
26  * sizeof(struct list_head *) == sizeof(unsigned long *).
27  */
28 static inline void fixup(unsigned long s, unsigned long e, int d,
29                          struct list_head *l)
30 {
31         unsigned long *pp;
32
33         pp = (unsigned long *)&l->next;
34         if (*pp >= s && *pp < e)
35                 *pp += d;
36
37         pp = (unsigned long *)&l->prev;
38         if (*pp >= s && *pp < e)
39                 *pp += d;
40 }
41
42 /* Grow the allocated blocks */
43 static int grow(rh_info_t * info, int max_blocks)
44 {
45         rh_block_t *block, *blk;
46         int i, new_blocks;
47         int delta;
48         unsigned long blks, blke;
49
50         if (max_blocks <= info->max_blocks)
51                 return -EINVAL;
52
53         new_blocks = max_blocks - info->max_blocks;
54
55         block = kmalloc(sizeof(rh_block_t) * max_blocks, GFP_KERNEL);
56         if (block == NULL)
57                 return -ENOMEM;
58
59         if (info->max_blocks > 0) {
60
61                 /* copy old block area */
62                 memcpy(block, info->block,
63                        sizeof(rh_block_t) * info->max_blocks);
64
65                 delta = (char *)block - (char *)info->block;
66
67                 /* and fixup list pointers */
68                 blks = (unsigned long)info->block;
69                 blke = (unsigned long)(info->block + info->max_blocks);
70
71                 for (i = 0, blk = block; i < info->max_blocks; i++, blk++)
72                         fixup(blks, blke, delta, &blk->list);
73
74                 fixup(blks, blke, delta, &info->empty_list);
75                 fixup(blks, blke, delta, &info->free_list);
76                 fixup(blks, blke, delta, &info->taken_list);
77
78                 /* free the old allocated memory */
79                 if ((info->flags & RHIF_STATIC_BLOCK) == 0)
80                         kfree(info->block);
81         }
82
83         info->block = block;
84         info->empty_slots += new_blocks;
85         info->max_blocks = max_blocks;
86         info->flags &= ~RHIF_STATIC_BLOCK;
87
88         /* add all new blocks to the free list */
89         blk = block + info->max_blocks - new_blocks;
90         for (i = 0; i < new_blocks; i++, blk++)
91                 list_add(&blk->list, &info->empty_list);
92
93         return 0;
94 }
95
96 /*
97  * Assure at least the required amount of empty slots.  If this function
98  * causes a grow in the block area then all pointers kept to the block
99  * area are invalid!
100  */
101 static int assure_empty(rh_info_t * info, int slots)
102 {
103         int max_blocks;
104
105         /* This function is not meant to be used to grow uncontrollably */
106         if (slots >= 4)
107                 return -EINVAL;
108
109         /* Enough space */
110         if (info->empty_slots >= slots)
111                 return 0;
112
113         /* Next 16 sized block */
114         max_blocks = ((info->max_blocks + slots) + 15) & ~15;
115
116         return grow(info, max_blocks);
117 }
118
119 static rh_block_t *get_slot(rh_info_t * info)
120 {
121         rh_block_t *blk;
122
123         /* If no more free slots, and failure to extend. */
124         /* XXX: You should have called assure_empty before */
125         if (info->empty_slots == 0) {
126                 printk(KERN_ERR "rh: out of slots; crash is imminent.\n");
127                 return NULL;
128         }
129
130         /* Get empty slot to use */
131         blk = list_entry(info->empty_list.next, rh_block_t, list);
132         list_del_init(&blk->list);
133         info->empty_slots--;
134
135         /* Initialize */
136         blk->start = 0;
137         blk->size = 0;
138         blk->owner = NULL;
139
140         return blk;
141 }
142
143 static inline void release_slot(rh_info_t * info, rh_block_t * blk)
144 {
145         list_add(&blk->list, &info->empty_list);
146         info->empty_slots++;
147 }
148
149 static void attach_free_block(rh_info_t * info, rh_block_t * blkn)
150 {
151         rh_block_t *blk;
152         rh_block_t *before;
153         rh_block_t *after;
154         rh_block_t *next;
155         int size;
156         unsigned long s, e, bs, be;
157         struct list_head *l;
158
159         /* We assume that they are aligned properly */
160         size = blkn->size;
161         s = blkn->start;
162         e = s + size;
163
164         /* Find the blocks immediately before and after the given one
165          * (if any) */
166         before = NULL;
167         after = NULL;
168         next = NULL;
169
170         list_for_each(l, &info->free_list) {
171                 blk = list_entry(l, rh_block_t, list);
172
173                 bs = blk->start;
174                 be = bs + blk->size;
175
176                 if (next == NULL && s >= bs)
177                         next = blk;
178
179                 if (be == s)
180                         before = blk;
181
182                 if (e == bs)
183                         after = blk;
184
185                 /* If both are not null, break now */
186                 if (before != NULL && after != NULL)
187                         break;
188         }
189
190         /* Now check if they are really adjacent */
191         if (before && s != (before->start + before->size))
192                 before = NULL;
193
194         if (after && e != after->start)
195                 after = NULL;
196
197         /* No coalescing; list insert and return */
198         if (before == NULL && after == NULL) {
199
200                 if (next != NULL)
201                         list_add(&blkn->list, &next->list);
202                 else
203                         list_add(&blkn->list, &info->free_list);
204
205                 return;
206         }
207
208         /* We don't need it anymore */
209         release_slot(info, blkn);
210
211         /* Grow the before block */
212         if (before != NULL && after == NULL) {
213                 before->size += size;
214                 return;
215         }
216
217         /* Grow the after block backwards */
218         if (before == NULL && after != NULL) {
219                 after->start -= size;
220                 after->size += size;
221                 return;
222         }
223
224         /* Grow the before block, and release the after block */
225         before->size += size + after->size;
226         list_del(&after->list);
227         release_slot(info, after);
228 }
229
230 static void attach_taken_block(rh_info_t * info, rh_block_t * blkn)
231 {
232         rh_block_t *blk;
233         struct list_head *l;
234
235         /* Find the block immediately before the given one (if any) */
236         list_for_each(l, &info->taken_list) {
237                 blk = list_entry(l, rh_block_t, list);
238                 if (blk->start > blkn->start) {
239                         list_add_tail(&blkn->list, &blk->list);
240                         return;
241                 }
242         }
243
244         list_add_tail(&blkn->list, &info->taken_list);
245 }
246
247 /*
248  * Create a remote heap dynamically.  Note that no memory for the blocks
249  * are allocated.  It will upon the first allocation
250  */
251 rh_info_t *rh_create(unsigned int alignment)
252 {
253         rh_info_t *info;
254
255         /* Alignment must be a power of two */
256         if ((alignment & (alignment - 1)) != 0)
257                 return ERR_PTR(-EINVAL);
258
259         info = kmalloc(sizeof(*info), GFP_KERNEL);
260         if (info == NULL)
261                 return ERR_PTR(-ENOMEM);
262
263         info->alignment = alignment;
264
265         /* Initially everything as empty */
266         info->block = NULL;
267         info->max_blocks = 0;
268         info->empty_slots = 0;
269         info->flags = 0;
270
271         INIT_LIST_HEAD(&info->empty_list);
272         INIT_LIST_HEAD(&info->free_list);
273         INIT_LIST_HEAD(&info->taken_list);
274
275         return info;
276 }
277
278 /*
279  * Destroy a dynamically created remote heap.  Deallocate only if the areas
280  * are not static
281  */
282 void rh_destroy(rh_info_t * info)
283 {
284         if ((info->flags & RHIF_STATIC_BLOCK) == 0 && info->block != NULL)
285                 kfree(info->block);
286
287         if ((info->flags & RHIF_STATIC_INFO) == 0)
288                 kfree(info);
289 }
290
291 /*
292  * Initialize in place a remote heap info block.  This is needed to support
293  * operation very early in the startup of the kernel, when it is not yet safe
294  * to call kmalloc.
295  */
296 void rh_init(rh_info_t * info, unsigned int alignment, int max_blocks,
297              rh_block_t * block)
298 {
299         int i;
300         rh_block_t *blk;
301
302         /* Alignment must be a power of two */
303         if ((alignment & (alignment - 1)) != 0)
304                 return;
305
306         info->alignment = alignment;
307
308         /* Initially everything as empty */
309         info->block = block;
310         info->max_blocks = max_blocks;
311         info->empty_slots = max_blocks;
312         info->flags = RHIF_STATIC_INFO | RHIF_STATIC_BLOCK;
313
314         INIT_LIST_HEAD(&info->empty_list);
315         INIT_LIST_HEAD(&info->free_list);
316         INIT_LIST_HEAD(&info->taken_list);
317
318         /* Add all new blocks to the free list */
319         for (i = 0, blk = block; i < max_blocks; i++, blk++)
320                 list_add(&blk->list, &info->empty_list);
321 }
322
323 /* Attach a free memory region, coalesces regions if adjuscent */
324 int rh_attach_region(rh_info_t * info, unsigned long start, int size)
325 {
326         rh_block_t *blk;
327         unsigned long s, e, m;
328         int r;
329
330         /* The region must be aligned */
331         s = start;
332         e = s + size;
333         m = info->alignment - 1;
334
335         /* Round start up */
336         s = (s + m) & ~m;
337
338         /* Round end down */
339         e = e & ~m;
340
341         if (IS_ERR_VALUE(e) || (e < s))
342                 return -ERANGE;
343
344         /* Take final values */
345         start = s;
346         size = e - s;
347
348         /* Grow the blocks, if needed */
349         r = assure_empty(info, 1);
350         if (r < 0)
351                 return r;
352
353         blk = get_slot(info);
354         blk->start = start;
355         blk->size = size;
356         blk->owner = NULL;
357
358         attach_free_block(info, blk);
359
360         return 0;
361 }
362
363 /* Detatch given address range, splits free block if needed. */
364 unsigned long rh_detach_region(rh_info_t * info, unsigned long start, int size)
365 {
366         struct list_head *l;
367         rh_block_t *blk, *newblk;
368         unsigned long s, e, m, bs, be;
369
370         /* Validate size */
371         if (size <= 0)
372                 return (unsigned long) -EINVAL;
373
374         /* The region must be aligned */
375         s = start;
376         e = s + size;
377         m = info->alignment - 1;
378
379         /* Round start up */
380         s = (s + m) & ~m;
381
382         /* Round end down */
383         e = e & ~m;
384
385         if (assure_empty(info, 1) < 0)
386                 return (unsigned long) -ENOMEM;
387
388         blk = NULL;
389         list_for_each(l, &info->free_list) {
390                 blk = list_entry(l, rh_block_t, list);
391                 /* The range must lie entirely inside one free block */
392                 bs = blk->start;
393                 be = blk->start + blk->size;
394                 if (s >= bs && e <= be)
395                         break;
396                 blk = NULL;
397         }
398
399         if (blk == NULL)
400                 return (unsigned long) -ENOMEM;
401
402         /* Perfect fit */
403         if (bs == s && be == e) {
404                 /* Delete from free list, release slot */
405                 list_del(&blk->list);
406                 release_slot(info, blk);
407                 return s;
408         }
409
410         /* blk still in free list, with updated start and/or size */
411         if (bs == s || be == e) {
412                 if (bs == s)
413                         blk->start += size;
414                 blk->size -= size;
415
416         } else {
417                 /* The front free fragment */
418                 blk->size = s - bs;
419
420                 /* the back free fragment */
421                 newblk = get_slot(info);
422                 newblk->start = e;
423                 newblk->size = be - e;
424
425                 list_add(&newblk->list, &blk->list);
426         }
427
428         return s;
429 }
430
431 /* Allocate a block of memory at the specified alignment.  The value returned
432  * is an offset into the buffer initialized by rh_init(), or a negative number
433  * if there is an error.
434  */
435 unsigned long rh_alloc_align(rh_info_t * info, int size, int alignment, const char *owner)
436 {
437         struct list_head *l;
438         rh_block_t *blk;
439         rh_block_t *newblk;
440         unsigned long start;
441
442         /* Validate size, and alignment must be power of two */
443         if (size <= 0 || (alignment & (alignment - 1)) != 0)
444                 return (unsigned long) -EINVAL;
445
446         /* given alignment larger that default rheap alignment */
447         if (alignment > info->alignment)
448                 size += alignment - 1;
449
450         /* Align to configured alignment */
451         size = (size + (info->alignment - 1)) & ~(info->alignment - 1);
452
453         if (assure_empty(info, 1) < 0)
454                 return (unsigned long) -ENOMEM;
455
456         blk = NULL;
457         list_for_each(l, &info->free_list) {
458                 blk = list_entry(l, rh_block_t, list);
459                 if (size <= blk->size)
460                         break;
461                 blk = NULL;
462         }
463
464         if (blk == NULL)
465                 return (unsigned long) -ENOMEM;
466
467         /* Just fits */
468         if (blk->size == size) {
469                 /* Move from free list to taken list */
470                 list_del(&blk->list);
471                 blk->owner = owner;
472                 start = blk->start;
473
474                 attach_taken_block(info, blk);
475
476                 return start;
477         }
478
479         newblk = get_slot(info);
480         newblk->start = blk->start;
481         newblk->size = size;
482         newblk->owner = owner;
483
484         /* blk still in free list, with updated start, size */
485         blk->start += size;
486         blk->size -= size;
487
488         start = newblk->start;
489
490         attach_taken_block(info, newblk);
491
492         /* for larger alignment return fixed up pointer  */
493         /* this is no problem with the deallocator since */
494         /* we scan for pointers that lie in the blocks   */
495         if (alignment > info->alignment)
496                 start = (start + alignment - 1) & ~(alignment - 1);
497
498         return start;
499 }
500
501 /* Allocate a block of memory at the default alignment.  The value returned is
502  * an offset into the buffer initialized by rh_init(), or a negative number if
503  * there is an error.
504  */
505 unsigned long rh_alloc(rh_info_t * info, int size, const char *owner)
506 {
507         return rh_alloc_align(info, size, info->alignment, owner);
508 }
509
510 /* Allocate a block of memory at the given offset, rounded up to the default
511  * alignment.  The value returned is an offset into the buffer initialized by
512  * rh_init(), or a negative number if there is an error.
513  */
514 unsigned long rh_alloc_fixed(rh_info_t * info, unsigned long start, int size, const char *owner)
515 {
516         struct list_head *l;
517         rh_block_t *blk, *newblk1, *newblk2;
518         unsigned long s, e, m, bs = 0, be = 0;
519
520         /* Validate size */
521         if (size <= 0)
522                 return (unsigned long) -EINVAL;
523
524         /* The region must be aligned */
525         s = start;
526         e = s + size;
527         m = info->alignment - 1;
528
529         /* Round start up */
530         s = (s + m) & ~m;
531
532         /* Round end down */
533         e = e & ~m;
534
535         if (assure_empty(info, 2) < 0)
536                 return (unsigned long) -ENOMEM;
537
538         blk = NULL;
539         list_for_each(l, &info->free_list) {
540                 blk = list_entry(l, rh_block_t, list);
541                 /* The range must lie entirely inside one free block */
542                 bs = blk->start;
543                 be = blk->start + blk->size;
544                 if (s >= bs && e <= be)
545                         break;
546         }
547
548         if (blk == NULL)
549                 return (unsigned long) -ENOMEM;
550
551         /* Perfect fit */
552         if (bs == s && be == e) {
553                 /* Move from free list to taken list */
554                 list_del(&blk->list);
555                 blk->owner = owner;
556
557                 start = blk->start;
558                 attach_taken_block(info, blk);
559
560                 return start;
561
562         }
563
564         /* blk still in free list, with updated start and/or size */
565         if (bs == s || be == e) {
566                 if (bs == s)
567                         blk->start += size;
568                 blk->size -= size;
569
570         } else {
571                 /* The front free fragment */
572                 blk->size = s - bs;
573
574                 /* The back free fragment */
575                 newblk2 = get_slot(info);
576                 newblk2->start = e;
577                 newblk2->size = be - e;
578
579                 list_add(&newblk2->list, &blk->list);
580         }
581
582         newblk1 = get_slot(info);
583         newblk1->start = s;
584         newblk1->size = e - s;
585         newblk1->owner = owner;
586
587         start = newblk1->start;
588         attach_taken_block(info, newblk1);
589
590         return start;
591 }
592
593 /* Deallocate the memory previously allocated by one of the rh_alloc functions.
594  * The return value is the size of the deallocated block, or a negative number
595  * if there is an error.
596  */
597 int rh_free(rh_info_t * info, unsigned long start)
598 {
599         rh_block_t *blk, *blk2;
600         struct list_head *l;
601         int size;
602
603         /* Linear search for block */
604         blk = NULL;
605         list_for_each(l, &info->taken_list) {
606                 blk2 = list_entry(l, rh_block_t, list);
607                 if (start < blk2->start)
608                         break;
609                 blk = blk2;
610         }
611
612         if (blk == NULL || start > (blk->start + blk->size))
613                 return -EINVAL;
614
615         /* Remove from taken list */
616         list_del(&blk->list);
617
618         /* Get size of freed block */
619         size = blk->size;
620         attach_free_block(info, blk);
621
622         return size;
623 }
624
625 int rh_get_stats(rh_info_t * info, int what, int max_stats, rh_stats_t * stats)
626 {
627         rh_block_t *blk;
628         struct list_head *l;
629         struct list_head *h;
630         int nr;
631
632         switch (what) {
633
634         case RHGS_FREE:
635                 h = &info->free_list;
636                 break;
637
638         case RHGS_TAKEN:
639                 h = &info->taken_list;
640                 break;
641
642         default:
643                 return -EINVAL;
644         }
645
646         /* Linear search for block */
647         nr = 0;
648         list_for_each(l, h) {
649                 blk = list_entry(l, rh_block_t, list);
650                 if (stats != NULL && nr < max_stats) {
651                         stats->start = blk->start;
652                         stats->size = blk->size;
653                         stats->owner = blk->owner;
654                         stats++;
655                 }
656                 nr++;
657         }
658
659         return nr;
660 }
661
662 int rh_set_owner(rh_info_t * info, unsigned long start, const char *owner)
663 {
664         rh_block_t *blk, *blk2;
665         struct list_head *l;
666         int size;
667
668         /* Linear search for block */
669         blk = NULL;
670         list_for_each(l, &info->taken_list) {
671                 blk2 = list_entry(l, rh_block_t, list);
672                 if (start < blk2->start)
673                         break;
674                 blk = blk2;
675         }
676
677         if (blk == NULL || start > (blk->start + blk->size))
678                 return -EINVAL;
679
680         blk->owner = owner;
681         size = blk->size;
682
683         return size;
684 }
685
686 void rh_dump(rh_info_t * info)
687 {
688         static rh_stats_t st[32];       /* XXX maximum 32 blocks */
689         int maxnr;
690         int i, nr;
691
692         maxnr = ARRAY_SIZE(st);
693
694         printk(KERN_INFO
695                "info @0x%p (%d slots empty / %d max)\n",
696                info, info->empty_slots, info->max_blocks);
697
698         printk(KERN_INFO "  Free:\n");
699         nr = rh_get_stats(info, RHGS_FREE, maxnr, st);
700         if (nr > maxnr)
701                 nr = maxnr;
702         for (i = 0; i < nr; i++)
703                 printk(KERN_INFO
704                        "    0x%lx-0x%lx (%u)\n",
705                        st[i].start, st[i].start + st[i].size,
706                        st[i].size);
707         printk(KERN_INFO "\n");
708
709         printk(KERN_INFO "  Taken:\n");
710         nr = rh_get_stats(info, RHGS_TAKEN, maxnr, st);
711         if (nr > maxnr)
712                 nr = maxnr;
713         for (i = 0; i < nr; i++)
714                 printk(KERN_INFO
715                        "    0x%lx-0x%lx (%u) %s\n",
716                        st[i].start, st[i].start + st[i].size,
717                        st[i].size, st[i].owner != NULL ? st[i].owner : "");
718         printk(KERN_INFO "\n");
719 }
720
721 void rh_dump_blk(rh_info_t * info, rh_block_t * blk)
722 {
723         printk(KERN_INFO
724                "blk @0x%p: 0x%lx-0x%lx (%u)\n",
725                blk, blk->start, blk->start + blk->size, blk->size);
726 }