Merge branch 'master' of git://git.kernel.org/pub/scm/linux/kernel/git/paulus/powerpc
[linux-2.6] / fs / gfs2 / rgrp.c
1 /*
2  * Copyright (C) Sistina Software, Inc.  1997-2003 All rights reserved.
3  * Copyright (C) 2004-2007 Red Hat, Inc.  All rights reserved.
4  *
5  * This copyrighted material is made available to anyone wishing to use,
6  * modify, copy, or redistribute it subject to the terms and conditions
7  * of the GNU General Public License version 2.
8  */
9
10 #include <linux/slab.h>
11 #include <linux/spinlock.h>
12 #include <linux/completion.h>
13 #include <linux/buffer_head.h>
14 #include <linux/fs.h>
15 #include <linux/gfs2_ondisk.h>
16 #include <linux/lm_interface.h>
17
18 #include "gfs2.h"
19 #include "incore.h"
20 #include "glock.h"
21 #include "glops.h"
22 #include "lops.h"
23 #include "meta_io.h"
24 #include "quota.h"
25 #include "rgrp.h"
26 #include "super.h"
27 #include "trans.h"
28 #include "ops_file.h"
29 #include "util.h"
30 #include "log.h"
31 #include "inode.h"
32
33 #define BFITNOENT ((u32)~0)
34
35 /*
36  * These routines are used by the resource group routines (rgrp.c)
37  * to keep track of block allocation.  Each block is represented by two
38  * bits.  So, each byte represents GFS2_NBBY (i.e. 4) blocks.
39  *
40  * 0 = Free
41  * 1 = Used (not metadata)
42  * 2 = Unlinked (still in use) inode
43  * 3 = Used (metadata)
44  */
45
46 static const char valid_change[16] = {
47                 /* current */
48         /* n */ 0, 1, 1, 1,
49         /* e */ 1, 0, 0, 0,
50         /* w */ 0, 0, 0, 1,
51                 1, 0, 0, 0
52 };
53
54 static u32 rgblk_search(struct gfs2_rgrpd *rgd, u32 goal,
55                         unsigned char old_state, unsigned char new_state);
56
57 /**
58  * gfs2_setbit - Set a bit in the bitmaps
59  * @buffer: the buffer that holds the bitmaps
60  * @buflen: the length (in bytes) of the buffer
61  * @block: the block to set
62  * @new_state: the new state of the block
63  *
64  */
65
66 static void gfs2_setbit(struct gfs2_rgrpd *rgd, unsigned char *buffer,
67                         unsigned int buflen, u32 block,
68                         unsigned char new_state)
69 {
70         unsigned char *byte, *end, cur_state;
71         unsigned int bit;
72
73         byte = buffer + (block / GFS2_NBBY);
74         bit = (block % GFS2_NBBY) * GFS2_BIT_SIZE;
75         end = buffer + buflen;
76
77         gfs2_assert(rgd->rd_sbd, byte < end);
78
79         cur_state = (*byte >> bit) & GFS2_BIT_MASK;
80
81         if (valid_change[new_state * 4 + cur_state]) {
82                 *byte ^= cur_state << bit;
83                 *byte |= new_state << bit;
84         } else
85                 gfs2_consist_rgrpd(rgd);
86 }
87
88 /**
89  * gfs2_testbit - test a bit in the bitmaps
90  * @buffer: the buffer that holds the bitmaps
91  * @buflen: the length (in bytes) of the buffer
92  * @block: the block to read
93  *
94  */
95
96 static unsigned char gfs2_testbit(struct gfs2_rgrpd *rgd, unsigned char *buffer,
97                                   unsigned int buflen, u32 block)
98 {
99         unsigned char *byte, *end, cur_state;
100         unsigned int bit;
101
102         byte = buffer + (block / GFS2_NBBY);
103         bit = (block % GFS2_NBBY) * GFS2_BIT_SIZE;
104         end = buffer + buflen;
105
106         gfs2_assert(rgd->rd_sbd, byte < end);
107
108         cur_state = (*byte >> bit) & GFS2_BIT_MASK;
109
110         return cur_state;
111 }
112
113 /**
114  * gfs2_bitfit - Search an rgrp's bitmap buffer to find a bit-pair representing
115  *       a block in a given allocation state.
116  * @buffer: the buffer that holds the bitmaps
117  * @buflen: the length (in bytes) of the buffer
118  * @goal: start search at this block's bit-pair (within @buffer)
119  * @old_state: GFS2_BLKST_XXX the state of the block we're looking for;
120  *       bit 0 = alloc(1)/free(0), bit 1 = meta(1)/data(0)
121  *
122  * Scope of @goal and returned block number is only within this bitmap buffer,
123  * not entire rgrp or filesystem.  @buffer will be offset from the actual
124  * beginning of a bitmap block buffer, skipping any header structures.
125  *
126  * Return: the block number (bitmap buffer scope) that was found
127  */
128
129 static u32 gfs2_bitfit(struct gfs2_rgrpd *rgd, unsigned char *buffer,
130                             unsigned int buflen, u32 goal,
131                             unsigned char old_state)
132 {
133         unsigned char *byte, *end, alloc;
134         u32 blk = goal;
135         unsigned int bit;
136
137         byte = buffer + (goal / GFS2_NBBY);
138         bit = (goal % GFS2_NBBY) * GFS2_BIT_SIZE;
139         end = buffer + buflen;
140         alloc = (old_state & 1) ? 0 : 0x55;
141
142         while (byte < end) {
143                 if ((*byte & 0x55) == alloc) {
144                         blk += (8 - bit) >> 1;
145
146                         bit = 0;
147                         byte++;
148
149                         continue;
150                 }
151
152                 if (((*byte >> bit) & GFS2_BIT_MASK) == old_state)
153                         return blk;
154
155                 bit += GFS2_BIT_SIZE;
156                 if (bit >= 8) {
157                         bit = 0;
158                         byte++;
159                 }
160
161                 blk++;
162         }
163
164         return BFITNOENT;
165 }
166
167 /**
168  * gfs2_bitcount - count the number of bits in a certain state
169  * @buffer: the buffer that holds the bitmaps
170  * @buflen: the length (in bytes) of the buffer
171  * @state: the state of the block we're looking for
172  *
173  * Returns: The number of bits
174  */
175
176 static u32 gfs2_bitcount(struct gfs2_rgrpd *rgd, unsigned char *buffer,
177                               unsigned int buflen, unsigned char state)
178 {
179         unsigned char *byte = buffer;
180         unsigned char *end = buffer + buflen;
181         unsigned char state1 = state << 2;
182         unsigned char state2 = state << 4;
183         unsigned char state3 = state << 6;
184         u32 count = 0;
185
186         for (; byte < end; byte++) {
187                 if (((*byte) & 0x03) == state)
188                         count++;
189                 if (((*byte) & 0x0C) == state1)
190                         count++;
191                 if (((*byte) & 0x30) == state2)
192                         count++;
193                 if (((*byte) & 0xC0) == state3)
194                         count++;
195         }
196
197         return count;
198 }
199
200 /**
201  * gfs2_rgrp_verify - Verify that a resource group is consistent
202  * @sdp: the filesystem
203  * @rgd: the rgrp
204  *
205  */
206
207 void gfs2_rgrp_verify(struct gfs2_rgrpd *rgd)
208 {
209         struct gfs2_sbd *sdp = rgd->rd_sbd;
210         struct gfs2_bitmap *bi = NULL;
211         u32 length = rgd->rd_length;
212         u32 count[4], tmp;
213         int buf, x;
214
215         memset(count, 0, 4 * sizeof(u32));
216
217         /* Count # blocks in each of 4 possible allocation states */
218         for (buf = 0; buf < length; buf++) {
219                 bi = rgd->rd_bits + buf;
220                 for (x = 0; x < 4; x++)
221                         count[x] += gfs2_bitcount(rgd,
222                                                   bi->bi_bh->b_data +
223                                                   bi->bi_offset,
224                                                   bi->bi_len, x);
225         }
226
227         if (count[0] != rgd->rd_rg.rg_free) {
228                 if (gfs2_consist_rgrpd(rgd))
229                         fs_err(sdp, "free data mismatch:  %u != %u\n",
230                                count[0], rgd->rd_rg.rg_free);
231                 return;
232         }
233
234         tmp = rgd->rd_data -
235                 rgd->rd_rg.rg_free -
236                 rgd->rd_rg.rg_dinodes;
237         if (count[1] + count[2] != tmp) {
238                 if (gfs2_consist_rgrpd(rgd))
239                         fs_err(sdp, "used data mismatch:  %u != %u\n",
240                                count[1], tmp);
241                 return;
242         }
243
244         if (count[3] != rgd->rd_rg.rg_dinodes) {
245                 if (gfs2_consist_rgrpd(rgd))
246                         fs_err(sdp, "used metadata mismatch:  %u != %u\n",
247                                count[3], rgd->rd_rg.rg_dinodes);
248                 return;
249         }
250
251         if (count[2] > count[3]) {
252                 if (gfs2_consist_rgrpd(rgd))
253                         fs_err(sdp, "unlinked inodes > inodes:  %u\n",
254                                count[2]);
255                 return;
256         }
257
258 }
259
260 static inline int rgrp_contains_block(struct gfs2_rgrpd *rgd, u64 block)
261 {
262         u64 first = rgd->rd_data0;
263         u64 last = first + rgd->rd_data;
264         return first <= block && block < last;
265 }
266
267 /**
268  * gfs2_blk2rgrpd - Find resource group for a given data/meta block number
269  * @sdp: The GFS2 superblock
270  * @n: The data block number
271  *
272  * Returns: The resource group, or NULL if not found
273  */
274
275 struct gfs2_rgrpd *gfs2_blk2rgrpd(struct gfs2_sbd *sdp, u64 blk)
276 {
277         struct gfs2_rgrpd *rgd;
278
279         spin_lock(&sdp->sd_rindex_spin);
280
281         list_for_each_entry(rgd, &sdp->sd_rindex_mru_list, rd_list_mru) {
282                 if (rgrp_contains_block(rgd, blk)) {
283                         list_move(&rgd->rd_list_mru, &sdp->sd_rindex_mru_list);
284                         spin_unlock(&sdp->sd_rindex_spin);
285                         return rgd;
286                 }
287         }
288
289         spin_unlock(&sdp->sd_rindex_spin);
290
291         return NULL;
292 }
293
294 /**
295  * gfs2_rgrpd_get_first - get the first Resource Group in the filesystem
296  * @sdp: The GFS2 superblock
297  *
298  * Returns: The first rgrp in the filesystem
299  */
300
301 struct gfs2_rgrpd *gfs2_rgrpd_get_first(struct gfs2_sbd *sdp)
302 {
303         gfs2_assert(sdp, !list_empty(&sdp->sd_rindex_list));
304         return list_entry(sdp->sd_rindex_list.next, struct gfs2_rgrpd, rd_list);
305 }
306
307 /**
308  * gfs2_rgrpd_get_next - get the next RG
309  * @rgd: A RG
310  *
311  * Returns: The next rgrp
312  */
313
314 struct gfs2_rgrpd *gfs2_rgrpd_get_next(struct gfs2_rgrpd *rgd)
315 {
316         if (rgd->rd_list.next == &rgd->rd_sbd->sd_rindex_list)
317                 return NULL;
318         return list_entry(rgd->rd_list.next, struct gfs2_rgrpd, rd_list);
319 }
320
321 static void clear_rgrpdi(struct gfs2_sbd *sdp)
322 {
323         struct list_head *head;
324         struct gfs2_rgrpd *rgd;
325         struct gfs2_glock *gl;
326
327         spin_lock(&sdp->sd_rindex_spin);
328         sdp->sd_rindex_forward = NULL;
329         head = &sdp->sd_rindex_recent_list;
330         while (!list_empty(head)) {
331                 rgd = list_entry(head->next, struct gfs2_rgrpd, rd_recent);
332                 list_del(&rgd->rd_recent);
333         }
334         spin_unlock(&sdp->sd_rindex_spin);
335
336         head = &sdp->sd_rindex_list;
337         while (!list_empty(head)) {
338                 rgd = list_entry(head->next, struct gfs2_rgrpd, rd_list);
339                 gl = rgd->rd_gl;
340
341                 list_del(&rgd->rd_list);
342                 list_del(&rgd->rd_list_mru);
343
344                 if (gl) {
345                         gl->gl_object = NULL;
346                         gfs2_glock_put(gl);
347                 }
348
349                 kfree(rgd->rd_bits);
350                 kfree(rgd);
351         }
352 }
353
354 void gfs2_clear_rgrpd(struct gfs2_sbd *sdp)
355 {
356         mutex_lock(&sdp->sd_rindex_mutex);
357         clear_rgrpdi(sdp);
358         mutex_unlock(&sdp->sd_rindex_mutex);
359 }
360
361 static void gfs2_rindex_print(const struct gfs2_rgrpd *rgd)
362 {
363         printk(KERN_INFO "  ri_addr = %llu\n", (unsigned long long)rgd->rd_addr);
364         printk(KERN_INFO "  ri_length = %u\n", rgd->rd_length);
365         printk(KERN_INFO "  ri_data0 = %llu\n", (unsigned long long)rgd->rd_data0);
366         printk(KERN_INFO "  ri_data = %u\n", rgd->rd_data);
367         printk(KERN_INFO "  ri_bitbytes = %u\n", rgd->rd_bitbytes);
368 }
369
370 /**
371  * gfs2_compute_bitstructs - Compute the bitmap sizes
372  * @rgd: The resource group descriptor
373  *
374  * Calculates bitmap descriptors, one for each block that contains bitmap data
375  *
376  * Returns: errno
377  */
378
379 static int compute_bitstructs(struct gfs2_rgrpd *rgd)
380 {
381         struct gfs2_sbd *sdp = rgd->rd_sbd;
382         struct gfs2_bitmap *bi;
383         u32 length = rgd->rd_length; /* # blocks in hdr & bitmap */
384         u32 bytes_left, bytes;
385         int x;
386
387         if (!length)
388                 return -EINVAL;
389
390         rgd->rd_bits = kcalloc(length, sizeof(struct gfs2_bitmap), GFP_NOFS);
391         if (!rgd->rd_bits)
392                 return -ENOMEM;
393
394         bytes_left = rgd->rd_bitbytes;
395
396         for (x = 0; x < length; x++) {
397                 bi = rgd->rd_bits + x;
398
399                 /* small rgrp; bitmap stored completely in header block */
400                 if (length == 1) {
401                         bytes = bytes_left;
402                         bi->bi_offset = sizeof(struct gfs2_rgrp);
403                         bi->bi_start = 0;
404                         bi->bi_len = bytes;
405                 /* header block */
406                 } else if (x == 0) {
407                         bytes = sdp->sd_sb.sb_bsize - sizeof(struct gfs2_rgrp);
408                         bi->bi_offset = sizeof(struct gfs2_rgrp);
409                         bi->bi_start = 0;
410                         bi->bi_len = bytes;
411                 /* last block */
412                 } else if (x + 1 == length) {
413                         bytes = bytes_left;
414                         bi->bi_offset = sizeof(struct gfs2_meta_header);
415                         bi->bi_start = rgd->rd_bitbytes - bytes_left;
416                         bi->bi_len = bytes;
417                 /* other blocks */
418                 } else {
419                         bytes = sdp->sd_sb.sb_bsize -
420                                 sizeof(struct gfs2_meta_header);
421                         bi->bi_offset = sizeof(struct gfs2_meta_header);
422                         bi->bi_start = rgd->rd_bitbytes - bytes_left;
423                         bi->bi_len = bytes;
424                 }
425
426                 bytes_left -= bytes;
427         }
428
429         if (bytes_left) {
430                 gfs2_consist_rgrpd(rgd);
431                 return -EIO;
432         }
433         bi = rgd->rd_bits + (length - 1);
434         if ((bi->bi_start + bi->bi_len) * GFS2_NBBY != rgd->rd_data) {
435                 if (gfs2_consist_rgrpd(rgd)) {
436                         gfs2_rindex_print(rgd);
437                         fs_err(sdp, "start=%u len=%u offset=%u\n",
438                                bi->bi_start, bi->bi_len, bi->bi_offset);
439                 }
440                 return -EIO;
441         }
442
443         return 0;
444 }
445
446 /**
447  * gfs2_ri_total - Total up the file system space, according to the rindex.
448  *
449  */
450 u64 gfs2_ri_total(struct gfs2_sbd *sdp)
451 {
452         u64 total_data = 0;     
453         struct inode *inode = sdp->sd_rindex;
454         struct gfs2_inode *ip = GFS2_I(inode);
455         char buf[sizeof(struct gfs2_rindex)];
456         struct file_ra_state ra_state;
457         int error, rgrps;
458
459         mutex_lock(&sdp->sd_rindex_mutex);
460         file_ra_state_init(&ra_state, inode->i_mapping);
461         for (rgrps = 0;; rgrps++) {
462                 loff_t pos = rgrps * sizeof(struct gfs2_rindex);
463
464                 if (pos + sizeof(struct gfs2_rindex) >= ip->i_di.di_size)
465                         break;
466                 error = gfs2_internal_read(ip, &ra_state, buf, &pos,
467                                            sizeof(struct gfs2_rindex));
468                 if (error != sizeof(struct gfs2_rindex))
469                         break;
470                 total_data += be32_to_cpu(((struct gfs2_rindex *)buf)->ri_data);
471         }
472         mutex_unlock(&sdp->sd_rindex_mutex);
473         return total_data;
474 }
475
476 static void gfs2_rindex_in(struct gfs2_rgrpd *rgd, const void *buf)
477 {
478         const struct gfs2_rindex *str = buf;
479
480         rgd->rd_addr = be64_to_cpu(str->ri_addr);
481         rgd->rd_length = be32_to_cpu(str->ri_length);
482         rgd->rd_data0 = be64_to_cpu(str->ri_data0);
483         rgd->rd_data = be32_to_cpu(str->ri_data);
484         rgd->rd_bitbytes = be32_to_cpu(str->ri_bitbytes);
485 }
486
487 /**
488  * read_rindex_entry - Pull in a new resource index entry from the disk
489  * @gl: The glock covering the rindex inode
490  *
491  * Returns: 0 on success, error code otherwise
492  */
493
494 static int read_rindex_entry(struct gfs2_inode *ip,
495                              struct file_ra_state *ra_state)
496 {
497         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
498         loff_t pos = sdp->sd_rgrps * sizeof(struct gfs2_rindex);
499         char buf[sizeof(struct gfs2_rindex)];
500         int error;
501         struct gfs2_rgrpd *rgd;
502
503         error = gfs2_internal_read(ip, ra_state, buf, &pos,
504                                    sizeof(struct gfs2_rindex));
505         if (!error)
506                 return 0;
507         if (error != sizeof(struct gfs2_rindex)) {
508                 if (error > 0)
509                         error = -EIO;
510                 return error;
511         }
512
513         rgd = kzalloc(sizeof(struct gfs2_rgrpd), GFP_NOFS);
514         error = -ENOMEM;
515         if (!rgd)
516                 return error;
517
518         mutex_init(&rgd->rd_mutex);
519         lops_init_le(&rgd->rd_le, &gfs2_rg_lops);
520         rgd->rd_sbd = sdp;
521
522         list_add_tail(&rgd->rd_list, &sdp->sd_rindex_list);
523         list_add_tail(&rgd->rd_list_mru, &sdp->sd_rindex_mru_list);
524
525         gfs2_rindex_in(rgd, buf);
526         error = compute_bitstructs(rgd);
527         if (error)
528                 return error;
529
530         error = gfs2_glock_get(sdp, rgd->rd_addr,
531                                &gfs2_rgrp_glops, CREATE, &rgd->rd_gl);
532         if (error)
533                 return error;
534
535         rgd->rd_gl->gl_object = rgd;
536         rgd->rd_rg_vn = rgd->rd_gl->gl_vn - 1;
537         rgd->rd_flags |= GFS2_RDF_CHECK;
538         return error;
539 }
540
541 /**
542  * gfs2_ri_update - Pull in a new resource index from the disk
543  * @ip: pointer to the rindex inode
544  *
545  * Returns: 0 on successful update, error code otherwise
546  */
547
548 static int gfs2_ri_update(struct gfs2_inode *ip)
549 {
550         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
551         struct inode *inode = &ip->i_inode;
552         struct file_ra_state ra_state;
553         u64 rgrp_count = ip->i_di.di_size;
554         int error;
555
556         if (do_div(rgrp_count, sizeof(struct gfs2_rindex))) {
557                 gfs2_consist_inode(ip);
558                 return -EIO;
559         }
560
561         clear_rgrpdi(sdp);
562
563         file_ra_state_init(&ra_state, inode->i_mapping);
564         for (sdp->sd_rgrps = 0; sdp->sd_rgrps < rgrp_count; sdp->sd_rgrps++) {
565                 error = read_rindex_entry(ip, &ra_state);
566                 if (error) {
567                         clear_rgrpdi(sdp);
568                         return error;
569                 }
570         }
571
572         sdp->sd_rindex_vn = ip->i_gl->gl_vn;
573         return 0;
574 }
575
576 /**
577  * gfs2_ri_update_special - Pull in a new resource index from the disk
578  *
579  * This is a special version that's safe to call from gfs2_inplace_reserve_i.
580  * In this case we know that we don't have any resource groups in memory yet.
581  *
582  * @ip: pointer to the rindex inode
583  *
584  * Returns: 0 on successful update, error code otherwise
585  */
586 static int gfs2_ri_update_special(struct gfs2_inode *ip)
587 {
588         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
589         struct inode *inode = &ip->i_inode;
590         struct file_ra_state ra_state;
591         int error;
592
593         file_ra_state_init(&ra_state, inode->i_mapping);
594         for (sdp->sd_rgrps = 0;; sdp->sd_rgrps++) {
595                 /* Ignore partials */
596                 if ((sdp->sd_rgrps + 1) * sizeof(struct gfs2_rindex) >
597                     ip->i_di.di_size)
598                         break;
599                 error = read_rindex_entry(ip, &ra_state);
600                 if (error) {
601                         clear_rgrpdi(sdp);
602                         return error;
603                 }
604         }
605
606         sdp->sd_rindex_vn = ip->i_gl->gl_vn;
607         return 0;
608 }
609
610 /**
611  * gfs2_rindex_hold - Grab a lock on the rindex
612  * @sdp: The GFS2 superblock
613  * @ri_gh: the glock holder
614  *
615  * We grab a lock on the rindex inode to make sure that it doesn't
616  * change whilst we are performing an operation. We keep this lock
617  * for quite long periods of time compared to other locks. This
618  * doesn't matter, since it is shared and it is very, very rarely
619  * accessed in the exclusive mode (i.e. only when expanding the filesystem).
620  *
621  * This makes sure that we're using the latest copy of the resource index
622  * special file, which might have been updated if someone expanded the
623  * filesystem (via gfs2_grow utility), which adds new resource groups.
624  *
625  * Returns: 0 on success, error code otherwise
626  */
627
628 int gfs2_rindex_hold(struct gfs2_sbd *sdp, struct gfs2_holder *ri_gh)
629 {
630         struct gfs2_inode *ip = GFS2_I(sdp->sd_rindex);
631         struct gfs2_glock *gl = ip->i_gl;
632         int error;
633
634         error = gfs2_glock_nq_init(gl, LM_ST_SHARED, 0, ri_gh);
635         if (error)
636                 return error;
637
638         /* Read new copy from disk if we don't have the latest */
639         if (sdp->sd_rindex_vn != gl->gl_vn) {
640                 mutex_lock(&sdp->sd_rindex_mutex);
641                 if (sdp->sd_rindex_vn != gl->gl_vn) {
642                         error = gfs2_ri_update(ip);
643                         if (error)
644                                 gfs2_glock_dq_uninit(ri_gh);
645                 }
646                 mutex_unlock(&sdp->sd_rindex_mutex);
647         }
648
649         return error;
650 }
651
652 static void gfs2_rgrp_in(struct gfs2_rgrp_host *rg, const void *buf)
653 {
654         const struct gfs2_rgrp *str = buf;
655
656         rg->rg_flags = be32_to_cpu(str->rg_flags);
657         rg->rg_free = be32_to_cpu(str->rg_free);
658         rg->rg_dinodes = be32_to_cpu(str->rg_dinodes);
659         rg->rg_igeneration = be64_to_cpu(str->rg_igeneration);
660 }
661
662 static void gfs2_rgrp_out(const struct gfs2_rgrp_host *rg, void *buf)
663 {
664         struct gfs2_rgrp *str = buf;
665
666         str->rg_flags = cpu_to_be32(rg->rg_flags);
667         str->rg_free = cpu_to_be32(rg->rg_free);
668         str->rg_dinodes = cpu_to_be32(rg->rg_dinodes);
669         str->__pad = cpu_to_be32(0);
670         str->rg_igeneration = cpu_to_be64(rg->rg_igeneration);
671         memset(&str->rg_reserved, 0, sizeof(str->rg_reserved));
672 }
673
674 /**
675  * gfs2_rgrp_bh_get - Read in a RG's header and bitmaps
676  * @rgd: the struct gfs2_rgrpd describing the RG to read in
677  *
678  * Read in all of a Resource Group's header and bitmap blocks.
679  * Caller must eventually call gfs2_rgrp_relse() to free the bitmaps.
680  *
681  * Returns: errno
682  */
683
684 int gfs2_rgrp_bh_get(struct gfs2_rgrpd *rgd)
685 {
686         struct gfs2_sbd *sdp = rgd->rd_sbd;
687         struct gfs2_glock *gl = rgd->rd_gl;
688         unsigned int length = rgd->rd_length;
689         struct gfs2_bitmap *bi;
690         unsigned int x, y;
691         int error;
692
693         mutex_lock(&rgd->rd_mutex);
694
695         spin_lock(&sdp->sd_rindex_spin);
696         if (rgd->rd_bh_count) {
697                 rgd->rd_bh_count++;
698                 spin_unlock(&sdp->sd_rindex_spin);
699                 mutex_unlock(&rgd->rd_mutex);
700                 return 0;
701         }
702         spin_unlock(&sdp->sd_rindex_spin);
703
704         for (x = 0; x < length; x++) {
705                 bi = rgd->rd_bits + x;
706                 error = gfs2_meta_read(gl, rgd->rd_addr + x, 0, &bi->bi_bh);
707                 if (error)
708                         goto fail;
709         }
710
711         for (y = length; y--;) {
712                 bi = rgd->rd_bits + y;
713                 error = gfs2_meta_wait(sdp, bi->bi_bh);
714                 if (error)
715                         goto fail;
716                 if (gfs2_metatype_check(sdp, bi->bi_bh, y ? GFS2_METATYPE_RB :
717                                               GFS2_METATYPE_RG)) {
718                         error = -EIO;
719                         goto fail;
720                 }
721         }
722
723         if (rgd->rd_rg_vn != gl->gl_vn) {
724                 gfs2_rgrp_in(&rgd->rd_rg, (rgd->rd_bits[0].bi_bh)->b_data);
725                 rgd->rd_rg_vn = gl->gl_vn;
726         }
727
728         spin_lock(&sdp->sd_rindex_spin);
729         rgd->rd_free_clone = rgd->rd_rg.rg_free;
730         rgd->rd_bh_count++;
731         spin_unlock(&sdp->sd_rindex_spin);
732
733         mutex_unlock(&rgd->rd_mutex);
734
735         return 0;
736
737 fail:
738         while (x--) {
739                 bi = rgd->rd_bits + x;
740                 brelse(bi->bi_bh);
741                 bi->bi_bh = NULL;
742                 gfs2_assert_warn(sdp, !bi->bi_clone);
743         }
744         mutex_unlock(&rgd->rd_mutex);
745
746         return error;
747 }
748
749 void gfs2_rgrp_bh_hold(struct gfs2_rgrpd *rgd)
750 {
751         struct gfs2_sbd *sdp = rgd->rd_sbd;
752
753         spin_lock(&sdp->sd_rindex_spin);
754         gfs2_assert_warn(rgd->rd_sbd, rgd->rd_bh_count);
755         rgd->rd_bh_count++;
756         spin_unlock(&sdp->sd_rindex_spin);
757 }
758
759 /**
760  * gfs2_rgrp_bh_put - Release RG bitmaps read in with gfs2_rgrp_bh_get()
761  * @rgd: the struct gfs2_rgrpd describing the RG to read in
762  *
763  */
764
765 void gfs2_rgrp_bh_put(struct gfs2_rgrpd *rgd)
766 {
767         struct gfs2_sbd *sdp = rgd->rd_sbd;
768         int x, length = rgd->rd_length;
769
770         spin_lock(&sdp->sd_rindex_spin);
771         gfs2_assert_warn(rgd->rd_sbd, rgd->rd_bh_count);
772         if (--rgd->rd_bh_count) {
773                 spin_unlock(&sdp->sd_rindex_spin);
774                 return;
775         }
776
777         for (x = 0; x < length; x++) {
778                 struct gfs2_bitmap *bi = rgd->rd_bits + x;
779                 kfree(bi->bi_clone);
780                 bi->bi_clone = NULL;
781                 brelse(bi->bi_bh);
782                 bi->bi_bh = NULL;
783         }
784
785         spin_unlock(&sdp->sd_rindex_spin);
786 }
787
788 void gfs2_rgrp_repolish_clones(struct gfs2_rgrpd *rgd)
789 {
790         struct gfs2_sbd *sdp = rgd->rd_sbd;
791         unsigned int length = rgd->rd_length;
792         unsigned int x;
793
794         for (x = 0; x < length; x++) {
795                 struct gfs2_bitmap *bi = rgd->rd_bits + x;
796                 if (!bi->bi_clone)
797                         continue;
798                 memcpy(bi->bi_clone + bi->bi_offset,
799                        bi->bi_bh->b_data + bi->bi_offset, bi->bi_len);
800         }
801
802         spin_lock(&sdp->sd_rindex_spin);
803         rgd->rd_free_clone = rgd->rd_rg.rg_free;
804         spin_unlock(&sdp->sd_rindex_spin);
805 }
806
807 /**
808  * gfs2_alloc_get - get the struct gfs2_alloc structure for an inode
809  * @ip: the incore GFS2 inode structure
810  *
811  * Returns: the struct gfs2_alloc
812  */
813
814 struct gfs2_alloc *gfs2_alloc_get(struct gfs2_inode *ip)
815 {
816         struct gfs2_alloc *al = &ip->i_alloc;
817
818         /* FIXME: Should assert that the correct locks are held here... */
819         memset(al, 0, sizeof(*al));
820         return al;
821 }
822
823 /**
824  * try_rgrp_fit - See if a given reservation will fit in a given RG
825  * @rgd: the RG data
826  * @al: the struct gfs2_alloc structure describing the reservation
827  *
828  * If there's room for the requested blocks to be allocated from the RG:
829  *   Sets the $al_rgd field in @al.
830  *
831  * Returns: 1 on success (it fits), 0 on failure (it doesn't fit)
832  */
833
834 static int try_rgrp_fit(struct gfs2_rgrpd *rgd, struct gfs2_alloc *al)
835 {
836         struct gfs2_sbd *sdp = rgd->rd_sbd;
837         int ret = 0;
838
839         if (rgd->rd_rg.rg_flags & GFS2_RGF_NOALLOC)
840                 return 0;
841
842         spin_lock(&sdp->sd_rindex_spin);
843         if (rgd->rd_free_clone >= al->al_requested) {
844                 al->al_rgd = rgd;
845                 ret = 1;
846         }
847         spin_unlock(&sdp->sd_rindex_spin);
848
849         return ret;
850 }
851
852 /**
853  * try_rgrp_unlink - Look for any unlinked, allocated, but unused inodes
854  * @rgd: The rgrp
855  *
856  * Returns: The inode, if one has been found
857  */
858
859 static struct inode *try_rgrp_unlink(struct gfs2_rgrpd *rgd, u64 *last_unlinked)
860 {
861         struct inode *inode;
862         u32 goal = 0;
863         u64 no_addr;
864
865         for(;;) {
866                 if (goal >= rgd->rd_data)
867                         break;
868                 goal = rgblk_search(rgd, goal, GFS2_BLKST_UNLINKED,
869                                     GFS2_BLKST_UNLINKED);
870                 if (goal == BFITNOENT)
871                         break;
872                 no_addr = goal + rgd->rd_data0;
873                 goal++;
874                 if (no_addr < *last_unlinked)
875                         continue;
876                 *last_unlinked = no_addr;
877                 inode = gfs2_inode_lookup(rgd->rd_sbd->sd_vfs, DT_UNKNOWN,
878                                           no_addr, -1);
879                 if (!IS_ERR(inode))
880                         return inode;
881         }
882
883         rgd->rd_flags &= ~GFS2_RDF_CHECK;
884         return NULL;
885 }
886
887 /**
888  * recent_rgrp_first - get first RG from "recent" list
889  * @sdp: The GFS2 superblock
890  * @rglast: address of the rgrp used last
891  *
892  * Returns: The first rgrp in the recent list
893  */
894
895 static struct gfs2_rgrpd *recent_rgrp_first(struct gfs2_sbd *sdp,
896                                             u64 rglast)
897 {
898         struct gfs2_rgrpd *rgd = NULL;
899
900         spin_lock(&sdp->sd_rindex_spin);
901
902         if (list_empty(&sdp->sd_rindex_recent_list))
903                 goto out;
904
905         if (!rglast)
906                 goto first;
907
908         list_for_each_entry(rgd, &sdp->sd_rindex_recent_list, rd_recent) {
909                 if (rgd->rd_addr == rglast)
910                         goto out;
911         }
912
913 first:
914         rgd = list_entry(sdp->sd_rindex_recent_list.next, struct gfs2_rgrpd,
915                          rd_recent);
916 out:
917         spin_unlock(&sdp->sd_rindex_spin);
918         return rgd;
919 }
920
921 /**
922  * recent_rgrp_next - get next RG from "recent" list
923  * @cur_rgd: current rgrp
924  * @remove:
925  *
926  * Returns: The next rgrp in the recent list
927  */
928
929 static struct gfs2_rgrpd *recent_rgrp_next(struct gfs2_rgrpd *cur_rgd,
930                                            int remove)
931 {
932         struct gfs2_sbd *sdp = cur_rgd->rd_sbd;
933         struct list_head *head;
934         struct gfs2_rgrpd *rgd;
935
936         spin_lock(&sdp->sd_rindex_spin);
937
938         head = &sdp->sd_rindex_recent_list;
939
940         list_for_each_entry(rgd, head, rd_recent) {
941                 if (rgd == cur_rgd) {
942                         if (cur_rgd->rd_recent.next != head)
943                                 rgd = list_entry(cur_rgd->rd_recent.next,
944                                                  struct gfs2_rgrpd, rd_recent);
945                         else
946                                 rgd = NULL;
947
948                         if (remove)
949                                 list_del(&cur_rgd->rd_recent);
950
951                         goto out;
952                 }
953         }
954
955         rgd = NULL;
956         if (!list_empty(head))
957                 rgd = list_entry(head->next, struct gfs2_rgrpd, rd_recent);
958
959 out:
960         spin_unlock(&sdp->sd_rindex_spin);
961         return rgd;
962 }
963
964 /**
965  * recent_rgrp_add - add an RG to tail of "recent" list
966  * @new_rgd: The rgrp to add
967  *
968  */
969
970 static void recent_rgrp_add(struct gfs2_rgrpd *new_rgd)
971 {
972         struct gfs2_sbd *sdp = new_rgd->rd_sbd;
973         struct gfs2_rgrpd *rgd;
974         unsigned int count = 0;
975         unsigned int max = sdp->sd_rgrps / gfs2_jindex_size(sdp);
976
977         spin_lock(&sdp->sd_rindex_spin);
978
979         list_for_each_entry(rgd, &sdp->sd_rindex_recent_list, rd_recent) {
980                 if (rgd == new_rgd)
981                         goto out;
982
983                 if (++count >= max)
984                         goto out;
985         }
986         list_add_tail(&new_rgd->rd_recent, &sdp->sd_rindex_recent_list);
987
988 out:
989         spin_unlock(&sdp->sd_rindex_spin);
990 }
991
992 /**
993  * forward_rgrp_get - get an rgrp to try next from full list
994  * @sdp: The GFS2 superblock
995  *
996  * Returns: The rgrp to try next
997  */
998
999 static struct gfs2_rgrpd *forward_rgrp_get(struct gfs2_sbd *sdp)
1000 {
1001         struct gfs2_rgrpd *rgd;
1002         unsigned int journals = gfs2_jindex_size(sdp);
1003         unsigned int rg = 0, x;
1004
1005         spin_lock(&sdp->sd_rindex_spin);
1006
1007         rgd = sdp->sd_rindex_forward;
1008         if (!rgd) {
1009                 if (sdp->sd_rgrps >= journals)
1010                         rg = sdp->sd_rgrps * sdp->sd_jdesc->jd_jid / journals;
1011
1012                 for (x = 0, rgd = gfs2_rgrpd_get_first(sdp); x < rg;
1013                      x++, rgd = gfs2_rgrpd_get_next(rgd))
1014                         /* Do Nothing */;
1015
1016                 sdp->sd_rindex_forward = rgd;
1017         }
1018
1019         spin_unlock(&sdp->sd_rindex_spin);
1020
1021         return rgd;
1022 }
1023
1024 /**
1025  * forward_rgrp_set - set the forward rgrp pointer
1026  * @sdp: the filesystem
1027  * @rgd: The new forward rgrp
1028  *
1029  */
1030
1031 static void forward_rgrp_set(struct gfs2_sbd *sdp, struct gfs2_rgrpd *rgd)
1032 {
1033         spin_lock(&sdp->sd_rindex_spin);
1034         sdp->sd_rindex_forward = rgd;
1035         spin_unlock(&sdp->sd_rindex_spin);
1036 }
1037
1038 /**
1039  * get_local_rgrp - Choose and lock a rgrp for allocation
1040  * @ip: the inode to reserve space for
1041  * @rgp: the chosen and locked rgrp
1042  *
1043  * Try to acquire rgrp in way which avoids contending with others.
1044  *
1045  * Returns: errno
1046  */
1047
1048 static struct inode *get_local_rgrp(struct gfs2_inode *ip, u64 *last_unlinked)
1049 {
1050         struct inode *inode = NULL;
1051         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
1052         struct gfs2_rgrpd *rgd, *begin = NULL;
1053         struct gfs2_alloc *al = &ip->i_alloc;
1054         int flags = LM_FLAG_TRY;
1055         int skipped = 0;
1056         int loops = 0;
1057         int error;
1058
1059         /* Try recently successful rgrps */
1060
1061         rgd = recent_rgrp_first(sdp, ip->i_last_rg_alloc);
1062
1063         while (rgd) {
1064                 error = gfs2_glock_nq_init(rgd->rd_gl, LM_ST_EXCLUSIVE,
1065                                            LM_FLAG_TRY, &al->al_rgd_gh);
1066                 switch (error) {
1067                 case 0:
1068                         if (try_rgrp_fit(rgd, al))
1069                                 goto out;
1070                         if (rgd->rd_flags & GFS2_RDF_CHECK)
1071                                 inode = try_rgrp_unlink(rgd, last_unlinked);
1072                         gfs2_glock_dq_uninit(&al->al_rgd_gh);
1073                         if (inode)
1074                                 return inode;
1075                         rgd = recent_rgrp_next(rgd, 1);
1076                         break;
1077
1078                 case GLR_TRYFAILED:
1079                         rgd = recent_rgrp_next(rgd, 0);
1080                         break;
1081
1082                 default:
1083                         return ERR_PTR(error);
1084                 }
1085         }
1086
1087         /* Go through full list of rgrps */
1088
1089         begin = rgd = forward_rgrp_get(sdp);
1090
1091         for (;;) {
1092                 error = gfs2_glock_nq_init(rgd->rd_gl, LM_ST_EXCLUSIVE, flags,
1093                                           &al->al_rgd_gh);
1094                 switch (error) {
1095                 case 0:
1096                         if (try_rgrp_fit(rgd, al))
1097                                 goto out;
1098                         if (rgd->rd_flags & GFS2_RDF_CHECK)
1099                                 inode = try_rgrp_unlink(rgd, last_unlinked);
1100                         gfs2_glock_dq_uninit(&al->al_rgd_gh);
1101                         if (inode)
1102                                 return inode;
1103                         break;
1104
1105                 case GLR_TRYFAILED:
1106                         skipped++;
1107                         break;
1108
1109                 default:
1110                         return ERR_PTR(error);
1111                 }
1112
1113                 rgd = gfs2_rgrpd_get_next(rgd);
1114                 if (!rgd)
1115                         rgd = gfs2_rgrpd_get_first(sdp);
1116
1117                 if (rgd == begin) {
1118                         if (++loops >= 3)
1119                                 return ERR_PTR(-ENOSPC);
1120                         if (!skipped)
1121                                 loops++;
1122                         flags = 0;
1123                         if (loops == 2)
1124                                 gfs2_log_flush(sdp, NULL);
1125                 }
1126         }
1127
1128 out:
1129         ip->i_last_rg_alloc = rgd->rd_addr;
1130
1131         if (begin) {
1132                 recent_rgrp_add(rgd);
1133                 rgd = gfs2_rgrpd_get_next(rgd);
1134                 if (!rgd)
1135                         rgd = gfs2_rgrpd_get_first(sdp);
1136                 forward_rgrp_set(sdp, rgd);
1137         }
1138
1139         return NULL;
1140 }
1141
1142 /**
1143  * gfs2_inplace_reserve_i - Reserve space in the filesystem
1144  * @ip: the inode to reserve space for
1145  *
1146  * Returns: errno
1147  */
1148
1149 int gfs2_inplace_reserve_i(struct gfs2_inode *ip, char *file, unsigned int line)
1150 {
1151         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
1152         struct gfs2_alloc *al = &ip->i_alloc;
1153         struct inode *inode;
1154         int error = 0;
1155         u64 last_unlinked = 0;
1156
1157         if (gfs2_assert_warn(sdp, al->al_requested))
1158                 return -EINVAL;
1159
1160 try_again:
1161         /* We need to hold the rindex unless the inode we're using is
1162            the rindex itself, in which case it's already held. */
1163         if (ip != GFS2_I(sdp->sd_rindex))
1164                 error = gfs2_rindex_hold(sdp, &al->al_ri_gh);
1165         else if (!sdp->sd_rgrps) /* We may not have the rindex read in, so: */
1166                 error = gfs2_ri_update_special(ip);
1167
1168         if (error)
1169                 return error;
1170
1171         inode = get_local_rgrp(ip, &last_unlinked);
1172         if (inode) {
1173                 if (ip != GFS2_I(sdp->sd_rindex))
1174                         gfs2_glock_dq_uninit(&al->al_ri_gh);
1175                 if (IS_ERR(inode))
1176                         return PTR_ERR(inode);
1177                 iput(inode);
1178                 gfs2_log_flush(sdp, NULL);
1179                 goto try_again;
1180         }
1181
1182         al->al_file = file;
1183         al->al_line = line;
1184
1185         return 0;
1186 }
1187
1188 /**
1189  * gfs2_inplace_release - release an inplace reservation
1190  * @ip: the inode the reservation was taken out on
1191  *
1192  * Release a reservation made by gfs2_inplace_reserve().
1193  */
1194
1195 void gfs2_inplace_release(struct gfs2_inode *ip)
1196 {
1197         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
1198         struct gfs2_alloc *al = &ip->i_alloc;
1199
1200         if (gfs2_assert_warn(sdp, al->al_alloced <= al->al_requested) == -1)
1201                 fs_warn(sdp, "al_alloced = %u, al_requested = %u "
1202                              "al_file = %s, al_line = %u\n",
1203                              al->al_alloced, al->al_requested, al->al_file,
1204                              al->al_line);
1205
1206         al->al_rgd = NULL;
1207         gfs2_glock_dq_uninit(&al->al_rgd_gh);
1208         if (ip != GFS2_I(sdp->sd_rindex))
1209                 gfs2_glock_dq_uninit(&al->al_ri_gh);
1210 }
1211
1212 /**
1213  * gfs2_get_block_type - Check a block in a RG is of given type
1214  * @rgd: the resource group holding the block
1215  * @block: the block number
1216  *
1217  * Returns: The block type (GFS2_BLKST_*)
1218  */
1219
1220 unsigned char gfs2_get_block_type(struct gfs2_rgrpd *rgd, u64 block)
1221 {
1222         struct gfs2_bitmap *bi = NULL;
1223         u32 length, rgrp_block, buf_block;
1224         unsigned int buf;
1225         unsigned char type;
1226
1227         length = rgd->rd_length;
1228         rgrp_block = block - rgd->rd_data0;
1229
1230         for (buf = 0; buf < length; buf++) {
1231                 bi = rgd->rd_bits + buf;
1232                 if (rgrp_block < (bi->bi_start + bi->bi_len) * GFS2_NBBY)
1233                         break;
1234         }
1235
1236         gfs2_assert(rgd->rd_sbd, buf < length);
1237         buf_block = rgrp_block - bi->bi_start * GFS2_NBBY;
1238
1239         type = gfs2_testbit(rgd, bi->bi_bh->b_data + bi->bi_offset,
1240                            bi->bi_len, buf_block);
1241
1242         return type;
1243 }
1244
1245 /**
1246  * rgblk_search - find a block in @old_state, change allocation
1247  *           state to @new_state
1248  * @rgd: the resource group descriptor
1249  * @goal: the goal block within the RG (start here to search for avail block)
1250  * @old_state: GFS2_BLKST_XXX the before-allocation state to find
1251  * @new_state: GFS2_BLKST_XXX the after-allocation block state
1252  *
1253  * Walk rgrp's bitmap to find bits that represent a block in @old_state.
1254  * Add the found bitmap buffer to the transaction.
1255  * Set the found bits to @new_state to change block's allocation state.
1256  *
1257  * This function never fails, because we wouldn't call it unless we
1258  * know (from reservation results, etc.) that a block is available.
1259  *
1260  * Scope of @goal and returned block is just within rgrp, not the whole
1261  * filesystem.
1262  *
1263  * Returns:  the block number allocated
1264  */
1265
1266 static u32 rgblk_search(struct gfs2_rgrpd *rgd, u32 goal,
1267                         unsigned char old_state, unsigned char new_state)
1268 {
1269         struct gfs2_bitmap *bi = NULL;
1270         u32 length = rgd->rd_length;
1271         u32 blk = 0;
1272         unsigned int buf, x;
1273
1274         /* Find bitmap block that contains bits for goal block */
1275         for (buf = 0; buf < length; buf++) {
1276                 bi = rgd->rd_bits + buf;
1277                 if (goal < (bi->bi_start + bi->bi_len) * GFS2_NBBY)
1278                         break;
1279         }
1280
1281         gfs2_assert(rgd->rd_sbd, buf < length);
1282
1283         /* Convert scope of "goal" from rgrp-wide to within found bit block */
1284         goal -= bi->bi_start * GFS2_NBBY;
1285
1286         /* Search (up to entire) bitmap in this rgrp for allocatable block.
1287            "x <= length", instead of "x < length", because we typically start
1288            the search in the middle of a bit block, but if we can't find an
1289            allocatable block anywhere else, we want to be able wrap around and
1290            search in the first part of our first-searched bit block.  */
1291         for (x = 0; x <= length; x++) {
1292                 if (bi->bi_clone)
1293                         blk = gfs2_bitfit(rgd, bi->bi_clone + bi->bi_offset,
1294                                           bi->bi_len, goal, old_state);
1295                 else
1296                         blk = gfs2_bitfit(rgd,
1297                                           bi->bi_bh->b_data + bi->bi_offset,
1298                                           bi->bi_len, goal, old_state);
1299                 if (blk != BFITNOENT)
1300                         break;
1301
1302                 /* Try next bitmap block (wrap back to rgrp header if at end) */
1303                 buf = (buf + 1) % length;
1304                 bi = rgd->rd_bits + buf;
1305                 goal = 0;
1306         }
1307
1308         if (old_state != new_state) {
1309                 gfs2_assert_withdraw(rgd->rd_sbd, blk != BFITNOENT);
1310
1311                 gfs2_trans_add_bh(rgd->rd_gl, bi->bi_bh, 1);
1312                 gfs2_setbit(rgd, bi->bi_bh->b_data + bi->bi_offset,
1313                             bi->bi_len, blk, new_state);
1314                 if (bi->bi_clone)
1315                         gfs2_setbit(rgd, bi->bi_clone + bi->bi_offset,
1316                                     bi->bi_len, blk, new_state);
1317         }
1318
1319         return (blk == BFITNOENT) ? blk : (bi->bi_start * GFS2_NBBY) + blk;
1320 }
1321
1322 /**
1323  * rgblk_free - Change alloc state of given block(s)
1324  * @sdp: the filesystem
1325  * @bstart: the start of a run of blocks to free
1326  * @blen: the length of the block run (all must lie within ONE RG!)
1327  * @new_state: GFS2_BLKST_XXX the after-allocation block state
1328  *
1329  * Returns:  Resource group containing the block(s)
1330  */
1331
1332 static struct gfs2_rgrpd *rgblk_free(struct gfs2_sbd *sdp, u64 bstart,
1333                                      u32 blen, unsigned char new_state)
1334 {
1335         struct gfs2_rgrpd *rgd;
1336         struct gfs2_bitmap *bi = NULL;
1337         u32 length, rgrp_blk, buf_blk;
1338         unsigned int buf;
1339
1340         rgd = gfs2_blk2rgrpd(sdp, bstart);
1341         if (!rgd) {
1342                 if (gfs2_consist(sdp))
1343                         fs_err(sdp, "block = %llu\n", (unsigned long long)bstart);
1344                 return NULL;
1345         }
1346
1347         length = rgd->rd_length;
1348
1349         rgrp_blk = bstart - rgd->rd_data0;
1350
1351         while (blen--) {
1352                 for (buf = 0; buf < length; buf++) {
1353                         bi = rgd->rd_bits + buf;
1354                         if (rgrp_blk < (bi->bi_start + bi->bi_len) * GFS2_NBBY)
1355                                 break;
1356                 }
1357
1358                 gfs2_assert(rgd->rd_sbd, buf < length);
1359
1360                 buf_blk = rgrp_blk - bi->bi_start * GFS2_NBBY;
1361                 rgrp_blk++;
1362
1363                 if (!bi->bi_clone) {
1364                         bi->bi_clone = kmalloc(bi->bi_bh->b_size,
1365                                                GFP_NOFS | __GFP_NOFAIL);
1366                         memcpy(bi->bi_clone + bi->bi_offset,
1367                                bi->bi_bh->b_data + bi->bi_offset,
1368                                bi->bi_len);
1369                 }
1370                 gfs2_trans_add_bh(rgd->rd_gl, bi->bi_bh, 1);
1371                 gfs2_setbit(rgd, bi->bi_bh->b_data + bi->bi_offset,
1372                             bi->bi_len, buf_blk, new_state);
1373         }
1374
1375         return rgd;
1376 }
1377
1378 /**
1379  * gfs2_alloc_data - Allocate a data block
1380  * @ip: the inode to allocate the data block for
1381  *
1382  * Returns: the allocated block
1383  */
1384
1385 u64 gfs2_alloc_data(struct gfs2_inode *ip)
1386 {
1387         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
1388         struct gfs2_alloc *al = &ip->i_alloc;
1389         struct gfs2_rgrpd *rgd = al->al_rgd;
1390         u32 goal, blk;
1391         u64 block;
1392
1393         if (rgrp_contains_block(rgd, ip->i_di.di_goal_data))
1394                 goal = ip->i_di.di_goal_data - rgd->rd_data0;
1395         else
1396                 goal = rgd->rd_last_alloc_data;
1397
1398         blk = rgblk_search(rgd, goal, GFS2_BLKST_FREE, GFS2_BLKST_USED);
1399         BUG_ON(blk == BFITNOENT);
1400         rgd->rd_last_alloc_data = blk;
1401
1402         block = rgd->rd_data0 + blk;
1403         ip->i_di.di_goal_data = block;
1404
1405         gfs2_assert_withdraw(sdp, rgd->rd_rg.rg_free);
1406         rgd->rd_rg.rg_free--;
1407
1408         gfs2_trans_add_bh(rgd->rd_gl, rgd->rd_bits[0].bi_bh, 1);
1409         gfs2_rgrp_out(&rgd->rd_rg, rgd->rd_bits[0].bi_bh->b_data);
1410
1411         al->al_alloced++;
1412
1413         gfs2_statfs_change(sdp, 0, -1, 0);
1414         gfs2_quota_change(ip, +1, ip->i_inode.i_uid, ip->i_inode.i_gid);
1415
1416         spin_lock(&sdp->sd_rindex_spin);
1417         rgd->rd_free_clone--;
1418         spin_unlock(&sdp->sd_rindex_spin);
1419
1420         return block;
1421 }
1422
1423 /**
1424  * gfs2_alloc_meta - Allocate a metadata block
1425  * @ip: the inode to allocate the metadata block for
1426  *
1427  * Returns: the allocated block
1428  */
1429
1430 u64 gfs2_alloc_meta(struct gfs2_inode *ip)
1431 {
1432         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
1433         struct gfs2_alloc *al = &ip->i_alloc;
1434         struct gfs2_rgrpd *rgd = al->al_rgd;
1435         u32 goal, blk;
1436         u64 block;
1437
1438         if (rgrp_contains_block(rgd, ip->i_di.di_goal_meta))
1439                 goal = ip->i_di.di_goal_meta - rgd->rd_data0;
1440         else
1441                 goal = rgd->rd_last_alloc_meta;
1442
1443         blk = rgblk_search(rgd, goal, GFS2_BLKST_FREE, GFS2_BLKST_USED);
1444         BUG_ON(blk == BFITNOENT);
1445         rgd->rd_last_alloc_meta = blk;
1446
1447         block = rgd->rd_data0 + blk;
1448         ip->i_di.di_goal_meta = block;
1449
1450         gfs2_assert_withdraw(sdp, rgd->rd_rg.rg_free);
1451         rgd->rd_rg.rg_free--;
1452
1453         gfs2_trans_add_bh(rgd->rd_gl, rgd->rd_bits[0].bi_bh, 1);
1454         gfs2_rgrp_out(&rgd->rd_rg, rgd->rd_bits[0].bi_bh->b_data);
1455
1456         al->al_alloced++;
1457
1458         gfs2_statfs_change(sdp, 0, -1, 0);
1459         gfs2_quota_change(ip, +1, ip->i_inode.i_uid, ip->i_inode.i_gid);
1460         gfs2_trans_add_unrevoke(sdp, block);
1461
1462         spin_lock(&sdp->sd_rindex_spin);
1463         rgd->rd_free_clone--;
1464         spin_unlock(&sdp->sd_rindex_spin);
1465
1466         return block;
1467 }
1468
1469 /**
1470  * gfs2_alloc_di - Allocate a dinode
1471  * @dip: the directory that the inode is going in
1472  *
1473  * Returns: the block allocated
1474  */
1475
1476 u64 gfs2_alloc_di(struct gfs2_inode *dip, u64 *generation)
1477 {
1478         struct gfs2_sbd *sdp = GFS2_SB(&dip->i_inode);
1479         struct gfs2_alloc *al = &dip->i_alloc;
1480         struct gfs2_rgrpd *rgd = al->al_rgd;
1481         u32 blk;
1482         u64 block;
1483
1484         blk = rgblk_search(rgd, rgd->rd_last_alloc_meta,
1485                            GFS2_BLKST_FREE, GFS2_BLKST_DINODE);
1486         BUG_ON(blk == BFITNOENT);
1487
1488         rgd->rd_last_alloc_meta = blk;
1489
1490         block = rgd->rd_data0 + blk;
1491
1492         gfs2_assert_withdraw(sdp, rgd->rd_rg.rg_free);
1493         rgd->rd_rg.rg_free--;
1494         rgd->rd_rg.rg_dinodes++;
1495         *generation = rgd->rd_rg.rg_igeneration++;
1496         gfs2_trans_add_bh(rgd->rd_gl, rgd->rd_bits[0].bi_bh, 1);
1497         gfs2_rgrp_out(&rgd->rd_rg, rgd->rd_bits[0].bi_bh->b_data);
1498
1499         al->al_alloced++;
1500
1501         gfs2_statfs_change(sdp, 0, -1, +1);
1502         gfs2_trans_add_unrevoke(sdp, block);
1503
1504         spin_lock(&sdp->sd_rindex_spin);
1505         rgd->rd_free_clone--;
1506         spin_unlock(&sdp->sd_rindex_spin);
1507
1508         return block;
1509 }
1510
1511 /**
1512  * gfs2_free_data - free a contiguous run of data block(s)
1513  * @ip: the inode these blocks are being freed from
1514  * @bstart: first block of a run of contiguous blocks
1515  * @blen: the length of the block run
1516  *
1517  */
1518
1519 void gfs2_free_data(struct gfs2_inode *ip, u64 bstart, u32 blen)
1520 {
1521         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
1522         struct gfs2_rgrpd *rgd;
1523
1524         rgd = rgblk_free(sdp, bstart, blen, GFS2_BLKST_FREE);
1525         if (!rgd)
1526                 return;
1527
1528         rgd->rd_rg.rg_free += blen;
1529
1530         gfs2_trans_add_bh(rgd->rd_gl, rgd->rd_bits[0].bi_bh, 1);
1531         gfs2_rgrp_out(&rgd->rd_rg, rgd->rd_bits[0].bi_bh->b_data);
1532
1533         gfs2_trans_add_rg(rgd);
1534
1535         gfs2_statfs_change(sdp, 0, +blen, 0);
1536         gfs2_quota_change(ip, -(s64)blen, ip->i_inode.i_uid, ip->i_inode.i_gid);
1537 }
1538
1539 /**
1540  * gfs2_free_meta - free a contiguous run of data block(s)
1541  * @ip: the inode these blocks are being freed from
1542  * @bstart: first block of a run of contiguous blocks
1543  * @blen: the length of the block run
1544  *
1545  */
1546
1547 void gfs2_free_meta(struct gfs2_inode *ip, u64 bstart, u32 blen)
1548 {
1549         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
1550         struct gfs2_rgrpd *rgd;
1551
1552         rgd = rgblk_free(sdp, bstart, blen, GFS2_BLKST_FREE);
1553         if (!rgd)
1554                 return;
1555
1556         rgd->rd_rg.rg_free += blen;
1557
1558         gfs2_trans_add_bh(rgd->rd_gl, rgd->rd_bits[0].bi_bh, 1);
1559         gfs2_rgrp_out(&rgd->rd_rg, rgd->rd_bits[0].bi_bh->b_data);
1560
1561         gfs2_trans_add_rg(rgd);
1562
1563         gfs2_statfs_change(sdp, 0, +blen, 0);
1564         gfs2_quota_change(ip, -(s64)blen, ip->i_inode.i_uid, ip->i_inode.i_gid);
1565         gfs2_meta_wipe(ip, bstart, blen);
1566 }
1567
1568 void gfs2_unlink_di(struct inode *inode)
1569 {
1570         struct gfs2_inode *ip = GFS2_I(inode);
1571         struct gfs2_sbd *sdp = GFS2_SB(inode);
1572         struct gfs2_rgrpd *rgd;
1573         u64 blkno = ip->i_no_addr;
1574
1575         rgd = rgblk_free(sdp, blkno, 1, GFS2_BLKST_UNLINKED);
1576         if (!rgd)
1577                 return;
1578         gfs2_trans_add_bh(rgd->rd_gl, rgd->rd_bits[0].bi_bh, 1);
1579         gfs2_rgrp_out(&rgd->rd_rg, rgd->rd_bits[0].bi_bh->b_data);
1580         gfs2_trans_add_rg(rgd);
1581 }
1582
1583 static void gfs2_free_uninit_di(struct gfs2_rgrpd *rgd, u64 blkno)
1584 {
1585         struct gfs2_sbd *sdp = rgd->rd_sbd;
1586         struct gfs2_rgrpd *tmp_rgd;
1587
1588         tmp_rgd = rgblk_free(sdp, blkno, 1, GFS2_BLKST_FREE);
1589         if (!tmp_rgd)
1590                 return;
1591         gfs2_assert_withdraw(sdp, rgd == tmp_rgd);
1592
1593         if (!rgd->rd_rg.rg_dinodes)
1594                 gfs2_consist_rgrpd(rgd);
1595         rgd->rd_rg.rg_dinodes--;
1596         rgd->rd_rg.rg_free++;
1597
1598         gfs2_trans_add_bh(rgd->rd_gl, rgd->rd_bits[0].bi_bh, 1);
1599         gfs2_rgrp_out(&rgd->rd_rg, rgd->rd_bits[0].bi_bh->b_data);
1600
1601         gfs2_statfs_change(sdp, 0, +1, -1);
1602         gfs2_trans_add_rg(rgd);
1603 }
1604
1605
1606 void gfs2_free_di(struct gfs2_rgrpd *rgd, struct gfs2_inode *ip)
1607 {
1608         gfs2_free_uninit_di(rgd, ip->i_no_addr);
1609         gfs2_quota_change(ip, -1, ip->i_inode.i_uid, ip->i_inode.i_gid);
1610         gfs2_meta_wipe(ip, ip->i_no_addr, 1);
1611 }
1612
1613 /**
1614  * gfs2_rlist_add - add a RG to a list of RGs
1615  * @sdp: the filesystem
1616  * @rlist: the list of resource groups
1617  * @block: the block
1618  *
1619  * Figure out what RG a block belongs to and add that RG to the list
1620  *
1621  * FIXME: Don't use NOFAIL
1622  *
1623  */
1624
1625 void gfs2_rlist_add(struct gfs2_sbd *sdp, struct gfs2_rgrp_list *rlist,
1626                     u64 block)
1627 {
1628         struct gfs2_rgrpd *rgd;
1629         struct gfs2_rgrpd **tmp;
1630         unsigned int new_space;
1631         unsigned int x;
1632
1633         if (gfs2_assert_warn(sdp, !rlist->rl_ghs))
1634                 return;
1635
1636         rgd = gfs2_blk2rgrpd(sdp, block);
1637         if (!rgd) {
1638                 if (gfs2_consist(sdp))
1639                         fs_err(sdp, "block = %llu\n", (unsigned long long)block);
1640                 return;
1641         }
1642
1643         for (x = 0; x < rlist->rl_rgrps; x++)
1644                 if (rlist->rl_rgd[x] == rgd)
1645                         return;
1646
1647         if (rlist->rl_rgrps == rlist->rl_space) {
1648                 new_space = rlist->rl_space + 10;
1649
1650                 tmp = kcalloc(new_space, sizeof(struct gfs2_rgrpd *),
1651                               GFP_NOFS | __GFP_NOFAIL);
1652
1653                 if (rlist->rl_rgd) {
1654                         memcpy(tmp, rlist->rl_rgd,
1655                                rlist->rl_space * sizeof(struct gfs2_rgrpd *));
1656                         kfree(rlist->rl_rgd);
1657                 }
1658
1659                 rlist->rl_space = new_space;
1660                 rlist->rl_rgd = tmp;
1661         }
1662
1663         rlist->rl_rgd[rlist->rl_rgrps++] = rgd;
1664 }
1665
1666 /**
1667  * gfs2_rlist_alloc - all RGs have been added to the rlist, now allocate
1668  *      and initialize an array of glock holders for them
1669  * @rlist: the list of resource groups
1670  * @state: the lock state to acquire the RG lock in
1671  * @flags: the modifier flags for the holder structures
1672  *
1673  * FIXME: Don't use NOFAIL
1674  *
1675  */
1676
1677 void gfs2_rlist_alloc(struct gfs2_rgrp_list *rlist, unsigned int state,
1678                       int flags)
1679 {
1680         unsigned int x;
1681
1682         rlist->rl_ghs = kcalloc(rlist->rl_rgrps, sizeof(struct gfs2_holder),
1683                                 GFP_NOFS | __GFP_NOFAIL);
1684         for (x = 0; x < rlist->rl_rgrps; x++)
1685                 gfs2_holder_init(rlist->rl_rgd[x]->rd_gl,
1686                                 state, flags,
1687                                 &rlist->rl_ghs[x]);
1688 }
1689
1690 /**
1691  * gfs2_rlist_free - free a resource group list
1692  * @list: the list of resource groups
1693  *
1694  */
1695
1696 void gfs2_rlist_free(struct gfs2_rgrp_list *rlist)
1697 {
1698         unsigned int x;
1699
1700         kfree(rlist->rl_rgd);
1701
1702         if (rlist->rl_ghs) {
1703                 for (x = 0; x < rlist->rl_rgrps; x++)
1704                         gfs2_holder_uninit(&rlist->rl_ghs[x]);
1705                 kfree(rlist->rl_ghs);
1706         }
1707 }
1708