Merge branch 'next' into for-linus
[linux-2.6] / fs / gfs2 / ops_super.c
1 /*
2  * Copyright (C) Sistina Software, Inc.  1997-2003 All rights reserved.
3  * Copyright (C) 2004-2008 Red Hat, Inc.  All rights reserved.
4  *
5  * This copyrighted material is made available to anyone wishing to use,
6  * modify, copy, or redistribute it subject to the terms and conditions
7  * of the GNU General Public License version 2.
8  */
9
10 #include <linux/sched.h>
11 #include <linux/slab.h>
12 #include <linux/spinlock.h>
13 #include <linux/completion.h>
14 #include <linux/buffer_head.h>
15 #include <linux/statfs.h>
16 #include <linux/seq_file.h>
17 #include <linux/mount.h>
18 #include <linux/kthread.h>
19 #include <linux/delay.h>
20 #include <linux/gfs2_ondisk.h>
21 #include <linux/crc32.h>
22 #include <linux/lm_interface.h>
23 #include <linux/time.h>
24
25 #include "gfs2.h"
26 #include "incore.h"
27 #include "glock.h"
28 #include "inode.h"
29 #include "log.h"
30 #include "mount.h"
31 #include "quota.h"
32 #include "recovery.h"
33 #include "rgrp.h"
34 #include "super.h"
35 #include "sys.h"
36 #include "util.h"
37 #include "trans.h"
38 #include "dir.h"
39 #include "eattr.h"
40 #include "bmap.h"
41 #include "meta_io.h"
42
43 /**
44  * gfs2_write_inode - Make sure the inode is stable on the disk
45  * @inode: The inode
46  * @sync: synchronous write flag
47  *
48  * Returns: errno
49  */
50
51 static int gfs2_write_inode(struct inode *inode, int sync)
52 {
53         struct gfs2_inode *ip = GFS2_I(inode);
54         struct gfs2_sbd *sdp = GFS2_SB(inode);
55         struct gfs2_holder gh;
56         struct buffer_head *bh;
57         struct timespec atime;
58         struct gfs2_dinode *di;
59         int ret = 0;
60
61         /* Check this is a "normal" inode, etc */
62         if (!test_bit(GIF_USER, &ip->i_flags) ||
63             (current->flags & PF_MEMALLOC))
64                 return 0;
65         ret = gfs2_glock_nq_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, &gh);
66         if (ret)
67                 goto do_flush;
68         ret = gfs2_trans_begin(sdp, RES_DINODE, 0);
69         if (ret)
70                 goto do_unlock;
71         ret = gfs2_meta_inode_buffer(ip, &bh);
72         if (ret == 0) {
73                 di = (struct gfs2_dinode *)bh->b_data;
74                 atime.tv_sec = be64_to_cpu(di->di_atime);
75                 atime.tv_nsec = be32_to_cpu(di->di_atime_nsec);
76                 if (timespec_compare(&inode->i_atime, &atime) > 0) {
77                         gfs2_trans_add_bh(ip->i_gl, bh, 1);
78                         gfs2_dinode_out(ip, bh->b_data);
79                 }
80                 brelse(bh);
81         }
82         gfs2_trans_end(sdp);
83 do_unlock:
84         gfs2_glock_dq_uninit(&gh);
85 do_flush:
86         if (sync != 0)
87                 gfs2_log_flush(GFS2_SB(inode), ip->i_gl);
88         return ret;
89 }
90
91 /**
92  * gfs2_make_fs_ro - Turn a Read-Write FS into a Read-Only one
93  * @sdp: the filesystem
94  *
95  * Returns: errno
96  */
97
98 static int gfs2_make_fs_ro(struct gfs2_sbd *sdp)
99 {
100         struct gfs2_holder t_gh;
101         int error;
102
103         gfs2_quota_sync(sdp);
104         gfs2_statfs_sync(sdp);
105
106         error = gfs2_glock_nq_init(sdp->sd_trans_gl, LM_ST_SHARED, GL_NOCACHE,
107                                    &t_gh);
108         if (error && !test_bit(SDF_SHUTDOWN, &sdp->sd_flags))
109                 return error;
110
111         gfs2_meta_syncfs(sdp);
112         gfs2_log_shutdown(sdp);
113
114         clear_bit(SDF_JOURNAL_LIVE, &sdp->sd_flags);
115
116         if (t_gh.gh_gl)
117                 gfs2_glock_dq_uninit(&t_gh);
118
119         gfs2_quota_cleanup(sdp);
120
121         return error;
122 }
123
124 /**
125  * gfs2_put_super - Unmount the filesystem
126  * @sb: The VFS superblock
127  *
128  */
129
130 static void gfs2_put_super(struct super_block *sb)
131 {
132         struct gfs2_sbd *sdp = sb->s_fs_info;
133         int error;
134
135         /*  Unfreeze the filesystem, if we need to  */
136
137         mutex_lock(&sdp->sd_freeze_lock);
138         if (sdp->sd_freeze_count)
139                 gfs2_glock_dq_uninit(&sdp->sd_freeze_gh);
140         mutex_unlock(&sdp->sd_freeze_lock);
141
142         kthread_stop(sdp->sd_quotad_process);
143         kthread_stop(sdp->sd_logd_process);
144         kthread_stop(sdp->sd_recoverd_process);
145
146         if (!(sb->s_flags & MS_RDONLY)) {
147                 error = gfs2_make_fs_ro(sdp);
148                 if (error)
149                         gfs2_io_error(sdp);
150         }
151         /*  At this point, we're through modifying the disk  */
152
153         /*  Release stuff  */
154
155         iput(sdp->sd_jindex);
156         iput(sdp->sd_inum_inode);
157         iput(sdp->sd_statfs_inode);
158         iput(sdp->sd_rindex);
159         iput(sdp->sd_quota_inode);
160
161         gfs2_glock_put(sdp->sd_rename_gl);
162         gfs2_glock_put(sdp->sd_trans_gl);
163
164         if (!sdp->sd_args.ar_spectator) {
165                 gfs2_glock_dq_uninit(&sdp->sd_journal_gh);
166                 gfs2_glock_dq_uninit(&sdp->sd_jinode_gh);
167                 gfs2_glock_dq_uninit(&sdp->sd_ir_gh);
168                 gfs2_glock_dq_uninit(&sdp->sd_sc_gh);
169                 gfs2_glock_dq_uninit(&sdp->sd_qc_gh);
170                 iput(sdp->sd_ir_inode);
171                 iput(sdp->sd_sc_inode);
172                 iput(sdp->sd_qc_inode);
173         }
174
175         gfs2_glock_dq_uninit(&sdp->sd_live_gh);
176         gfs2_clear_rgrpd(sdp);
177         gfs2_jindex_free(sdp);
178         /*  Take apart glock structures and buffer lists  */
179         gfs2_gl_hash_clear(sdp);
180         /*  Unmount the locking protocol  */
181         gfs2_lm_unmount(sdp);
182
183         /*  At this point, we're through participating in the lockspace  */
184         gfs2_sys_fs_del(sdp);
185 }
186
187 /**
188  * gfs2_write_super
189  * @sb: the superblock
190  *
191  */
192
193 static void gfs2_write_super(struct super_block *sb)
194 {
195         sb->s_dirt = 0;
196 }
197
198 /**
199  * gfs2_sync_fs - sync the filesystem
200  * @sb: the superblock
201  *
202  * Flushes the log to disk.
203  */
204
205 static int gfs2_sync_fs(struct super_block *sb, int wait)
206 {
207         sb->s_dirt = 0;
208         if (wait && sb->s_fs_info)
209                 gfs2_log_flush(sb->s_fs_info, NULL);
210         return 0;
211 }
212
213 /**
214  * gfs2_write_super_lockfs - prevent further writes to the filesystem
215  * @sb: the VFS structure for the filesystem
216  *
217  */
218
219 static void gfs2_write_super_lockfs(struct super_block *sb)
220 {
221         struct gfs2_sbd *sdp = sb->s_fs_info;
222         int error;
223
224         if (test_bit(SDF_SHUTDOWN, &sdp->sd_flags))
225                 return;
226
227         for (;;) {
228                 error = gfs2_freeze_fs(sdp);
229                 if (!error)
230                         break;
231
232                 switch (error) {
233                 case -EBUSY:
234                         fs_err(sdp, "waiting for recovery before freeze\n");
235                         break;
236
237                 default:
238                         fs_err(sdp, "error freezing FS: %d\n", error);
239                         break;
240                 }
241
242                 fs_err(sdp, "retrying...\n");
243                 msleep(1000);
244         }
245 }
246
247 /**
248  * gfs2_unlockfs - reallow writes to the filesystem
249  * @sb: the VFS structure for the filesystem
250  *
251  */
252
253 static void gfs2_unlockfs(struct super_block *sb)
254 {
255         gfs2_unfreeze_fs(sb->s_fs_info);
256 }
257
258 /**
259  * statfs_fill - fill in the sg for a given RG
260  * @rgd: the RG
261  * @sc: the sc structure
262  *
263  * Returns: 0 on success, -ESTALE if the LVB is invalid
264  */
265
266 static int statfs_slow_fill(struct gfs2_rgrpd *rgd,
267                             struct gfs2_statfs_change_host *sc)
268 {
269         gfs2_rgrp_verify(rgd);
270         sc->sc_total += rgd->rd_data;
271         sc->sc_free += rgd->rd_free;
272         sc->sc_dinodes += rgd->rd_dinodes;
273         return 0;
274 }
275
276 /**
277  * gfs2_statfs_slow - Stat a filesystem using asynchronous locking
278  * @sdp: the filesystem
279  * @sc: the sc info that will be returned
280  *
281  * Any error (other than a signal) will cause this routine to fall back
282  * to the synchronous version.
283  *
284  * FIXME: This really shouldn't busy wait like this.
285  *
286  * Returns: errno
287  */
288
289 static int gfs2_statfs_slow(struct gfs2_sbd *sdp, struct gfs2_statfs_change_host *sc)
290 {
291         struct gfs2_holder ri_gh;
292         struct gfs2_rgrpd *rgd_next;
293         struct gfs2_holder *gha, *gh;
294         unsigned int slots = 64;
295         unsigned int x;
296         int done;
297         int error = 0, err;
298
299         memset(sc, 0, sizeof(struct gfs2_statfs_change_host));
300         gha = kcalloc(slots, sizeof(struct gfs2_holder), GFP_KERNEL);
301         if (!gha)
302                 return -ENOMEM;
303
304         error = gfs2_rindex_hold(sdp, &ri_gh);
305         if (error)
306                 goto out;
307
308         rgd_next = gfs2_rgrpd_get_first(sdp);
309
310         for (;;) {
311                 done = 1;
312
313                 for (x = 0; x < slots; x++) {
314                         gh = gha + x;
315
316                         if (gh->gh_gl && gfs2_glock_poll(gh)) {
317                                 err = gfs2_glock_wait(gh);
318                                 if (err) {
319                                         gfs2_holder_uninit(gh);
320                                         error = err;
321                                 } else {
322                                         if (!error)
323                                                 error = statfs_slow_fill(
324                                                         gh->gh_gl->gl_object, sc);
325                                         gfs2_glock_dq_uninit(gh);
326                                 }
327                         }
328
329                         if (gh->gh_gl)
330                                 done = 0;
331                         else if (rgd_next && !error) {
332                                 error = gfs2_glock_nq_init(rgd_next->rd_gl,
333                                                            LM_ST_SHARED,
334                                                            GL_ASYNC,
335                                                            gh);
336                                 rgd_next = gfs2_rgrpd_get_next(rgd_next);
337                                 done = 0;
338                         }
339
340                         if (signal_pending(current))
341                                 error = -ERESTARTSYS;
342                 }
343
344                 if (done)
345                         break;
346
347                 yield();
348         }
349
350         gfs2_glock_dq_uninit(&ri_gh);
351
352 out:
353         kfree(gha);
354         return error;
355 }
356
357 /**
358  * gfs2_statfs_i - Do a statfs
359  * @sdp: the filesystem
360  * @sg: the sg structure
361  *
362  * Returns: errno
363  */
364
365 static int gfs2_statfs_i(struct gfs2_sbd *sdp, struct gfs2_statfs_change_host *sc)
366 {
367         struct gfs2_statfs_change_host *m_sc = &sdp->sd_statfs_master;
368         struct gfs2_statfs_change_host *l_sc = &sdp->sd_statfs_local;
369
370         spin_lock(&sdp->sd_statfs_spin);
371
372         *sc = *m_sc;
373         sc->sc_total += l_sc->sc_total;
374         sc->sc_free += l_sc->sc_free;
375         sc->sc_dinodes += l_sc->sc_dinodes;
376
377         spin_unlock(&sdp->sd_statfs_spin);
378
379         if (sc->sc_free < 0)
380                 sc->sc_free = 0;
381         if (sc->sc_free > sc->sc_total)
382                 sc->sc_free = sc->sc_total;
383         if (sc->sc_dinodes < 0)
384                 sc->sc_dinodes = 0;
385
386         return 0;
387 }
388
389 /**
390  * gfs2_statfs - Gather and return stats about the filesystem
391  * @sb: The superblock
392  * @statfsbuf: The buffer
393  *
394  * Returns: 0 on success or error code
395  */
396
397 static int gfs2_statfs(struct dentry *dentry, struct kstatfs *buf)
398 {
399         struct super_block *sb = dentry->d_inode->i_sb;
400         struct gfs2_sbd *sdp = sb->s_fs_info;
401         struct gfs2_statfs_change_host sc;
402         int error;
403
404         if (gfs2_tune_get(sdp, gt_statfs_slow))
405                 error = gfs2_statfs_slow(sdp, &sc);
406         else
407                 error = gfs2_statfs_i(sdp, &sc);
408
409         if (error)
410                 return error;
411
412         buf->f_type = GFS2_MAGIC;
413         buf->f_bsize = sdp->sd_sb.sb_bsize;
414         buf->f_blocks = sc.sc_total;
415         buf->f_bfree = sc.sc_free;
416         buf->f_bavail = sc.sc_free;
417         buf->f_files = sc.sc_dinodes + sc.sc_free;
418         buf->f_ffree = sc.sc_free;
419         buf->f_namelen = GFS2_FNAMESIZE;
420
421         return 0;
422 }
423
424 /**
425  * gfs2_remount_fs - called when the FS is remounted
426  * @sb:  the filesystem
427  * @flags:  the remount flags
428  * @data:  extra data passed in (not used right now)
429  *
430  * Returns: errno
431  */
432
433 static int gfs2_remount_fs(struct super_block *sb, int *flags, char *data)
434 {
435         struct gfs2_sbd *sdp = sb->s_fs_info;
436         int error;
437
438         error = gfs2_mount_args(sdp, data, 1);
439         if (error)
440                 return error;
441
442         if (sdp->sd_args.ar_spectator)
443                 *flags |= MS_RDONLY;
444         else {
445                 if (*flags & MS_RDONLY) {
446                         if (!(sb->s_flags & MS_RDONLY))
447                                 error = gfs2_make_fs_ro(sdp);
448                 } else if (!(*flags & MS_RDONLY) &&
449                            (sb->s_flags & MS_RDONLY)) {
450                         error = gfs2_make_fs_rw(sdp);
451                 }
452         }
453
454         return error;
455 }
456
457 /**
458  * gfs2_drop_inode - Drop an inode (test for remote unlink)
459  * @inode: The inode to drop
460  *
461  * If we've received a callback on an iopen lock then its because a
462  * remote node tried to deallocate the inode but failed due to this node
463  * still having the inode open. Here we mark the link count zero
464  * since we know that it must have reached zero if the GLF_DEMOTE flag
465  * is set on the iopen glock. If we didn't do a disk read since the
466  * remote node removed the final link then we might otherwise miss
467  * this event. This check ensures that this node will deallocate the
468  * inode's blocks, or alternatively pass the baton on to another
469  * node for later deallocation.
470  */
471
472 static void gfs2_drop_inode(struct inode *inode)
473 {
474         struct gfs2_inode *ip = GFS2_I(inode);
475
476         if (test_bit(GIF_USER, &ip->i_flags) && inode->i_nlink) {
477                 struct gfs2_glock *gl = ip->i_iopen_gh.gh_gl;
478                 if (gl && test_bit(GLF_DEMOTE, &gl->gl_flags))
479                         clear_nlink(inode);
480         }
481         generic_drop_inode(inode);
482 }
483
484 /**
485  * gfs2_clear_inode - Deallocate an inode when VFS is done with it
486  * @inode: The VFS inode
487  *
488  */
489
490 static void gfs2_clear_inode(struct inode *inode)
491 {
492         struct gfs2_inode *ip = GFS2_I(inode);
493
494         /* This tells us its a "real" inode and not one which only
495          * serves to contain an address space (see rgrp.c, meta_io.c)
496          * which therefore doesn't have its own glocks.
497          */
498         if (test_bit(GIF_USER, &ip->i_flags)) {
499                 ip->i_gl->gl_object = NULL;
500                 gfs2_glock_put(ip->i_gl);
501                 ip->i_gl = NULL;
502                 if (ip->i_iopen_gh.gh_gl) {
503                         ip->i_iopen_gh.gh_gl->gl_object = NULL;
504                         gfs2_glock_dq_uninit(&ip->i_iopen_gh);
505                 }
506         }
507 }
508
509 static int is_ancestor(const struct dentry *d1, const struct dentry *d2)
510 {
511         do {
512                 if (d1 == d2)
513                         return 1;
514                 d1 = d1->d_parent;
515         } while (!IS_ROOT(d1));
516         return 0;
517 }
518
519 /**
520  * gfs2_show_options - Show mount options for /proc/mounts
521  * @s: seq_file structure
522  * @mnt: vfsmount
523  *
524  * Returns: 0 on success or error code
525  */
526
527 static int gfs2_show_options(struct seq_file *s, struct vfsmount *mnt)
528 {
529         struct gfs2_sbd *sdp = mnt->mnt_sb->s_fs_info;
530         struct gfs2_args *args = &sdp->sd_args;
531
532         if (is_ancestor(mnt->mnt_root, sdp->sd_master_dir))
533                 seq_printf(s, ",meta");
534         if (args->ar_lockproto[0])
535                 seq_printf(s, ",lockproto=%s", args->ar_lockproto);
536         if (args->ar_locktable[0])
537                 seq_printf(s, ",locktable=%s", args->ar_locktable);
538         if (args->ar_hostdata[0])
539                 seq_printf(s, ",hostdata=%s", args->ar_hostdata);
540         if (args->ar_spectator)
541                 seq_printf(s, ",spectator");
542         if (args->ar_ignore_local_fs)
543                 seq_printf(s, ",ignore_local_fs");
544         if (args->ar_localflocks)
545                 seq_printf(s, ",localflocks");
546         if (args->ar_localcaching)
547                 seq_printf(s, ",localcaching");
548         if (args->ar_debug)
549                 seq_printf(s, ",debug");
550         if (args->ar_upgrade)
551                 seq_printf(s, ",upgrade");
552         if (args->ar_posix_acl)
553                 seq_printf(s, ",acl");
554         if (args->ar_quota != GFS2_QUOTA_DEFAULT) {
555                 char *state;
556                 switch (args->ar_quota) {
557                 case GFS2_QUOTA_OFF:
558                         state = "off";
559                         break;
560                 case GFS2_QUOTA_ACCOUNT:
561                         state = "account";
562                         break;
563                 case GFS2_QUOTA_ON:
564                         state = "on";
565                         break;
566                 default:
567                         state = "unknown";
568                         break;
569                 }
570                 seq_printf(s, ",quota=%s", state);
571         }
572         if (args->ar_suiddir)
573                 seq_printf(s, ",suiddir");
574         if (args->ar_data != GFS2_DATA_DEFAULT) {
575                 char *state;
576                 switch (args->ar_data) {
577                 case GFS2_DATA_WRITEBACK:
578                         state = "writeback";
579                         break;
580                 case GFS2_DATA_ORDERED:
581                         state = "ordered";
582                         break;
583                 default:
584                         state = "unknown";
585                         break;
586                 }
587                 seq_printf(s, ",data=%s", state);
588         }
589
590         return 0;
591 }
592
593 /*
594  * We have to (at the moment) hold the inodes main lock to cover
595  * the gap between unlocking the shared lock on the iopen lock and
596  * taking the exclusive lock. I'd rather do a shared -> exclusive
597  * conversion on the iopen lock, but we can change that later. This
598  * is safe, just less efficient.
599  */
600
601 static void gfs2_delete_inode(struct inode *inode)
602 {
603         struct gfs2_sbd *sdp = inode->i_sb->s_fs_info;
604         struct gfs2_inode *ip = GFS2_I(inode);
605         struct gfs2_holder gh;
606         int error;
607
608         if (!test_bit(GIF_USER, &ip->i_flags))
609                 goto out;
610
611         error = gfs2_glock_nq_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, &gh);
612         if (unlikely(error)) {
613                 gfs2_glock_dq_uninit(&ip->i_iopen_gh);
614                 goto out;
615         }
616
617         gfs2_glock_dq_wait(&ip->i_iopen_gh);
618         gfs2_holder_reinit(LM_ST_EXCLUSIVE, LM_FLAG_TRY_1CB | GL_NOCACHE, &ip->i_iopen_gh);
619         error = gfs2_glock_nq(&ip->i_iopen_gh);
620         if (error)
621                 goto out_truncate;
622
623         if (S_ISDIR(inode->i_mode) &&
624             (ip->i_diskflags & GFS2_DIF_EXHASH)) {
625                 error = gfs2_dir_exhash_dealloc(ip);
626                 if (error)
627                         goto out_unlock;
628         }
629
630         if (ip->i_eattr) {
631                 error = gfs2_ea_dealloc(ip);
632                 if (error)
633                         goto out_unlock;
634         }
635
636         if (!gfs2_is_stuffed(ip)) {
637                 error = gfs2_file_dealloc(ip);
638                 if (error)
639                         goto out_unlock;
640         }
641
642         error = gfs2_dinode_dealloc(ip);
643         if (error)
644                 goto out_unlock;
645
646 out_truncate:
647         error = gfs2_trans_begin(sdp, 0, sdp->sd_jdesc->jd_blocks);
648         if (error)
649                 goto out_unlock;
650         /* Needs to be done before glock release & also in a transaction */
651         truncate_inode_pages(&inode->i_data, 0);
652         gfs2_trans_end(sdp);
653
654 out_unlock:
655         if (test_bit(HIF_HOLDER, &ip->i_iopen_gh.gh_iflags))
656                 gfs2_glock_dq(&ip->i_iopen_gh);
657         gfs2_holder_uninit(&ip->i_iopen_gh);
658         gfs2_glock_dq_uninit(&gh);
659         if (error && error != GLR_TRYFAILED)
660                 fs_warn(sdp, "gfs2_delete_inode: %d\n", error);
661 out:
662         truncate_inode_pages(&inode->i_data, 0);
663         clear_inode(inode);
664 }
665
666 static struct inode *gfs2_alloc_inode(struct super_block *sb)
667 {
668         struct gfs2_inode *ip;
669
670         ip = kmem_cache_alloc(gfs2_inode_cachep, GFP_KERNEL);
671         if (ip) {
672                 ip->i_flags = 0;
673                 ip->i_gl = NULL;
674         }
675         return &ip->i_inode;
676 }
677
678 static void gfs2_destroy_inode(struct inode *inode)
679 {
680         kmem_cache_free(gfs2_inode_cachep, inode);
681 }
682
683 const struct super_operations gfs2_super_ops = {
684         .alloc_inode            = gfs2_alloc_inode,
685         .destroy_inode          = gfs2_destroy_inode,
686         .write_inode            = gfs2_write_inode,
687         .delete_inode           = gfs2_delete_inode,
688         .put_super              = gfs2_put_super,
689         .write_super            = gfs2_write_super,
690         .sync_fs                = gfs2_sync_fs,
691         .write_super_lockfs     = gfs2_write_super_lockfs,
692         .unlockfs               = gfs2_unlockfs,
693         .statfs                 = gfs2_statfs,
694         .remount_fs             = gfs2_remount_fs,
695         .clear_inode            = gfs2_clear_inode,
696         .drop_inode             = gfs2_drop_inode,
697         .show_options           = gfs2_show_options,
698 };
699