Merge git://git.kernel.org/pub/scm/linux/kernel/git/davem/net-2.6
[linux-2.6] / fs / gfs2 / incore.h
1 /*
2  * Copyright (C) Sistina Software, Inc.  1997-2003 All rights reserved.
3  * Copyright (C) 2004-2008 Red Hat, Inc.  All rights reserved.
4  *
5  * This copyrighted material is made available to anyone wishing to use,
6  * modify, copy, or redistribute it subject to the terms and conditions
7  * of the GNU General Public License version 2.
8  */
9
10 #ifndef __INCORE_DOT_H__
11 #define __INCORE_DOT_H__
12
13 #include <linux/fs.h>
14 #include <linux/workqueue.h>
15
16 #define DIO_WAIT        0x00000010
17 #define DIO_METADATA    0x00000020
18 #define DIO_ALL         0x00000100
19
20 struct gfs2_log_operations;
21 struct gfs2_log_element;
22 struct gfs2_holder;
23 struct gfs2_glock;
24 struct gfs2_quota_data;
25 struct gfs2_trans;
26 struct gfs2_ail;
27 struct gfs2_jdesc;
28 struct gfs2_sbd;
29
30 typedef void (*gfs2_glop_bh_t) (struct gfs2_glock *gl, unsigned int ret);
31
32 struct gfs2_log_header_host {
33         u64 lh_sequence;        /* Sequence number of this transaction */
34         u32 lh_flags;           /* GFS2_LOG_HEAD_... */
35         u32 lh_tail;            /* Block number of log tail */
36         u32 lh_blkno;
37         u32 lh_hash;
38 };
39
40 /*
41  * Structure of operations that are associated with each
42  * type of element in the log.
43  */
44
45 struct gfs2_log_operations {
46         void (*lo_add) (struct gfs2_sbd *sdp, struct gfs2_log_element *le);
47         void (*lo_before_commit) (struct gfs2_sbd *sdp);
48         void (*lo_after_commit) (struct gfs2_sbd *sdp, struct gfs2_ail *ai);
49         void (*lo_before_scan) (struct gfs2_jdesc *jd,
50                                 struct gfs2_log_header_host *head, int pass);
51         int (*lo_scan_elements) (struct gfs2_jdesc *jd, unsigned int start,
52                                  struct gfs2_log_descriptor *ld, __be64 *ptr,
53                                  int pass);
54         void (*lo_after_scan) (struct gfs2_jdesc *jd, int error, int pass);
55         const char *lo_name;
56 };
57
58 struct gfs2_log_element {
59         struct list_head le_list;
60         const struct gfs2_log_operations *le_ops;
61 };
62
63 struct gfs2_bitmap {
64         struct buffer_head *bi_bh;
65         char *bi_clone;
66         u32 bi_offset;
67         u32 bi_start;
68         u32 bi_len;
69 };
70
71 struct gfs2_rgrp_host {
72         u32 rg_free;
73         u32 rg_dinodes;
74         u64 rg_igeneration;
75 };
76
77 struct gfs2_rgrpd {
78         struct list_head rd_list;       /* Link with superblock */
79         struct list_head rd_list_mru;
80         struct list_head rd_recent;     /* Recently used rgrps */
81         struct gfs2_glock *rd_gl;       /* Glock for this rgrp */
82         u64 rd_addr;                    /* grp block disk address */
83         u64 rd_data0;                   /* first data location */
84         u32 rd_length;                  /* length of rgrp header in fs blocks */
85         u32 rd_data;                    /* num of data blocks in rgrp */
86         u32 rd_bitbytes;                /* number of bytes in data bitmaps */
87         struct gfs2_rgrp_host rd_rg;
88         struct gfs2_bitmap *rd_bits;
89         unsigned int rd_bh_count;
90         struct mutex rd_mutex;
91         u32 rd_free_clone;
92         struct gfs2_log_element rd_le;
93         u32 rd_last_alloc;
94         struct gfs2_sbd *rd_sbd;
95         unsigned char rd_flags;
96 #define GFS2_RDF_CHECK        0x01      /* Need to check for unlinked inodes */
97 #define GFS2_RDF_NOALLOC      0x02      /* rg prohibits allocation */
98 #define GFS2_RDF_UPTODATE     0x04      /* rg is up to date */
99 };
100
101 enum gfs2_state_bits {
102         BH_Pinned = BH_PrivateStart,
103         BH_Escaped = BH_PrivateStart + 1,
104 };
105
106 BUFFER_FNS(Pinned, pinned)
107 TAS_BUFFER_FNS(Pinned, pinned)
108 BUFFER_FNS(Escaped, escaped)
109 TAS_BUFFER_FNS(Escaped, escaped)
110
111 struct gfs2_bufdata {
112         struct buffer_head *bd_bh;
113         struct gfs2_glock *bd_gl;
114
115         union {
116                 struct list_head list_tr;
117                 u64 blkno;
118         } u;
119 #define bd_list_tr u.list_tr
120 #define bd_blkno u.blkno
121
122         struct gfs2_log_element bd_le;
123
124         struct gfs2_ail *bd_ail;
125         struct list_head bd_ail_st_list;
126         struct list_head bd_ail_gl_list;
127 };
128
129 struct gfs2_glock_operations {
130         void (*go_xmote_th) (struct gfs2_glock *gl);
131         void (*go_xmote_bh) (struct gfs2_glock *gl);
132         void (*go_inval) (struct gfs2_glock *gl, int flags);
133         int (*go_demote_ok) (struct gfs2_glock *gl);
134         int (*go_lock) (struct gfs2_holder *gh);
135         void (*go_unlock) (struct gfs2_holder *gh);
136         const int go_type;
137         const unsigned long go_min_hold_time;
138 };
139
140 enum {
141         /* States */
142         HIF_HOLDER              = 6,
143         HIF_FIRST               = 7,
144         HIF_ABORTED             = 9,
145         HIF_WAIT                = 10,
146 };
147
148 struct gfs2_holder {
149         struct list_head gh_list;
150
151         struct gfs2_glock *gh_gl;
152         struct pid *gh_owner_pid;
153         unsigned int gh_state;
154         unsigned gh_flags;
155
156         int gh_error;
157         unsigned long gh_iflags;
158         unsigned long gh_ip;
159 };
160
161 enum {
162         GLF_LOCK                = 1,
163         GLF_STICKY              = 2,
164         GLF_DEMOTE              = 3,
165         GLF_PENDING_DEMOTE      = 4,
166         GLF_DIRTY               = 5,
167         GLF_DEMOTE_IN_PROGRESS  = 6,
168         GLF_LFLUSH              = 7,
169         GLF_WAITERS2            = 8,
170         GLF_CONV_DEADLK         = 9,
171 };
172
173 struct gfs2_glock {
174         struct hlist_node gl_list;
175         unsigned long gl_flags;         /* GLF_... */
176         struct lm_lockname gl_name;
177         atomic_t gl_ref;
178
179         spinlock_t gl_spin;
180
181         unsigned int gl_state;
182         unsigned int gl_hash;
183         unsigned int gl_demote_state; /* state requested by remote node */
184         unsigned long gl_demote_time; /* time of first demote request */
185         struct pid *gl_owner_pid;
186         unsigned long gl_ip;
187         struct list_head gl_holders;
188         struct list_head gl_waiters1;   /* HIF_MUTEX */
189         struct list_head gl_waiters3;   /* HIF_PROMOTE */
190
191         const struct gfs2_glock_operations *gl_ops;
192
193         struct gfs2_holder *gl_req_gh;
194
195         void *gl_lock;
196         char *gl_lvb;
197         atomic_t gl_lvb_count;
198
199         unsigned long gl_stamp;
200         unsigned long gl_tchange;
201         void *gl_object;
202
203         struct list_head gl_reclaim;
204
205         struct gfs2_sbd *gl_sbd;
206
207         struct inode *gl_aspace;
208         struct list_head gl_ail_list;
209         atomic_t gl_ail_count;
210         struct delayed_work gl_work;
211 };
212
213 #define GFS2_MIN_LVB_SIZE 32    /* Min size of LVB that gfs2 supports */
214
215 struct gfs2_alloc {
216         /* Quota stuff */
217
218         struct gfs2_quota_data *al_qd[2*MAXQUOTAS];
219         struct gfs2_holder al_qd_ghs[2*MAXQUOTAS];
220         unsigned int al_qd_num;
221
222         u32 al_requested; /* Filled in by caller of gfs2_inplace_reserve() */
223         u32 al_alloced; /* Filled in by gfs2_alloc_*() */
224
225         /* Filled in by gfs2_inplace_reserve() */
226
227         unsigned int al_line;
228         char *al_file;
229         struct gfs2_holder al_ri_gh;
230         struct gfs2_holder al_rgd_gh;
231         struct gfs2_rgrpd *al_rgd;
232
233 };
234
235 enum {
236         GIF_INVALID             = 0,
237         GIF_QD_LOCKED           = 1,
238         GIF_SW_PAGED            = 3,
239 };
240
241 struct gfs2_dinode_host {
242         u64 di_size;            /* number of bytes in file */
243         u64 di_generation;      /* generation number for NFS */
244         u32 di_flags;           /* GFS2_DIF_... */
245         /* These only apply to directories  */
246         u32 di_entries;         /* The number of entries in the directory */
247         u64 di_eattr;           /* extended attribute block number */
248 };
249
250 struct gfs2_inode {
251         struct inode i_inode;
252         u64 i_no_addr;
253         u64 i_no_formal_ino;
254         unsigned long i_flags;          /* GIF_... */
255
256         struct gfs2_dinode_host i_di; /* To be replaced by ref to block */
257
258         struct gfs2_glock *i_gl; /* Move into i_gh? */
259         struct gfs2_holder i_iopen_gh;
260         struct gfs2_holder i_gh; /* for prepare/commit_write only */
261         struct gfs2_alloc *i_alloc;
262         u64 i_goal;     /* goal block for allocations */
263         struct rw_semaphore i_rw_mutex;
264         u8 i_height;
265         u8 i_depth;
266 };
267
268 /*
269  * Since i_inode is the first element of struct gfs2_inode,
270  * this is effectively a cast.
271  */
272 static inline struct gfs2_inode *GFS2_I(struct inode *inode)
273 {
274         return container_of(inode, struct gfs2_inode, i_inode);
275 }
276
277 static inline struct gfs2_sbd *GFS2_SB(const struct inode *inode)
278 {
279         return inode->i_sb->s_fs_info;
280 }
281
282 struct gfs2_file {
283         struct mutex f_fl_mutex;
284         struct gfs2_holder f_fl_gh;
285 };
286
287 struct gfs2_revoke_replay {
288         struct list_head rr_list;
289         u64 rr_blkno;
290         unsigned int rr_where;
291 };
292
293 enum {
294         QDF_USER                = 0,
295         QDF_CHANGE              = 1,
296         QDF_LOCKED              = 2,
297 };
298
299 struct gfs2_quota_data {
300         struct list_head qd_list;
301         unsigned int qd_count;
302
303         u32 qd_id;
304         unsigned long qd_flags;         /* QDF_... */
305
306         s64 qd_change;
307         s64 qd_change_sync;
308
309         unsigned int qd_slot;
310         unsigned int qd_slot_count;
311
312         struct buffer_head *qd_bh;
313         struct gfs2_quota_change *qd_bh_qc;
314         unsigned int qd_bh_count;
315
316         struct gfs2_glock *qd_gl;
317         struct gfs2_quota_lvb qd_qb;
318
319         u64 qd_sync_gen;
320         unsigned long qd_last_warn;
321         unsigned long qd_last_touched;
322 };
323
324 struct gfs2_trans {
325         unsigned long tr_ip;
326
327         unsigned int tr_blocks;
328         unsigned int tr_revokes;
329         unsigned int tr_reserved;
330
331         struct gfs2_holder tr_t_gh;
332
333         int tr_touched;
334
335         unsigned int tr_num_buf;
336         unsigned int tr_num_buf_new;
337         unsigned int tr_num_databuf_new;
338         unsigned int tr_num_buf_rm;
339         unsigned int tr_num_databuf_rm;
340         struct list_head tr_list_buf;
341
342         unsigned int tr_num_revoke;
343         unsigned int tr_num_revoke_rm;
344 };
345
346 struct gfs2_ail {
347         struct list_head ai_list;
348
349         unsigned int ai_first;
350         struct list_head ai_ail1_list;
351         struct list_head ai_ail2_list;
352
353         u64 ai_sync_gen;
354 };
355
356 struct gfs2_journal_extent {
357         struct list_head extent_list;
358
359         unsigned int lblock; /* First logical block */
360         u64 dblock; /* First disk block */
361         u64 blocks;
362 };
363
364 struct gfs2_jdesc {
365         struct list_head jd_list;
366         struct list_head extent_list;
367
368         struct inode *jd_inode;
369         unsigned int jd_jid;
370         int jd_dirty;
371
372         unsigned int jd_blocks;
373 };
374
375 struct gfs2_statfs_change_host {
376         s64 sc_total;
377         s64 sc_free;
378         s64 sc_dinodes;
379 };
380
381 #define GFS2_GLOCKD_DEFAULT     1
382 #define GFS2_GLOCKD_MAX         16
383
384 #define GFS2_QUOTA_DEFAULT      GFS2_QUOTA_OFF
385 #define GFS2_QUOTA_OFF          0
386 #define GFS2_QUOTA_ACCOUNT      1
387 #define GFS2_QUOTA_ON           2
388
389 #define GFS2_DATA_DEFAULT       GFS2_DATA_ORDERED
390 #define GFS2_DATA_WRITEBACK     1
391 #define GFS2_DATA_ORDERED       2
392
393 struct gfs2_args {
394         char ar_lockproto[GFS2_LOCKNAME_LEN]; /* Name of the Lock Protocol */
395         char ar_locktable[GFS2_LOCKNAME_LEN]; /* Name of the Lock Table */
396         char ar_hostdata[GFS2_LOCKNAME_LEN]; /* Host specific data */
397         int ar_spectator; /* Don't get a journal because we're always RO */
398         int ar_ignore_local_fs; /* Don't optimize even if local_fs is 1 */
399         int ar_localflocks; /* Let the VFS do flock|fcntl locks for us */
400         int ar_localcaching; /* Local-style caching (dangerous on multihost) */
401         int ar_debug; /* Oops on errors instead of trying to be graceful */
402         int ar_upgrade; /* Upgrade ondisk/multihost format */
403         unsigned int ar_num_glockd; /* Number of glockd threads */
404         int ar_posix_acl; /* Enable posix acls */
405         int ar_quota; /* off/account/on */
406         int ar_suiddir; /* suiddir support */
407         int ar_data; /* ordered/writeback */
408 };
409
410 struct gfs2_tune {
411         spinlock_t gt_spin;
412
413         unsigned int gt_demote_secs; /* Cache retention for unheld glock */
414         unsigned int gt_incore_log_blocks;
415         unsigned int gt_log_flush_secs;
416
417         unsigned int gt_recoverd_secs;
418         unsigned int gt_logd_secs;
419         unsigned int gt_quotad_secs;
420
421         unsigned int gt_quota_simul_sync; /* Max quotavals to sync at once */
422         unsigned int gt_quota_warn_period; /* Secs between quota warn msgs */
423         unsigned int gt_quota_scale_num; /* Numerator */
424         unsigned int gt_quota_scale_den; /* Denominator */
425         unsigned int gt_quota_cache_secs;
426         unsigned int gt_quota_quantum; /* Secs between syncs to quota file */
427         unsigned int gt_atime_quantum; /* Min secs between atime updates */
428         unsigned int gt_new_files_jdata;
429         unsigned int gt_new_files_directio;
430         unsigned int gt_max_readahead; /* Max bytes to read-ahead from disk */
431         unsigned int gt_stall_secs; /* Detects trouble! */
432         unsigned int gt_complain_secs;
433         unsigned int gt_statfs_quantum;
434         unsigned int gt_statfs_slow;
435 };
436
437 enum {
438         SDF_JOURNAL_CHECKED     = 0,
439         SDF_JOURNAL_LIVE        = 1,
440         SDF_SHUTDOWN            = 2,
441         SDF_NOATIME             = 3,
442 };
443
444 #define GFS2_FSNAME_LEN         256
445
446 struct gfs2_inum_host {
447         u64 no_formal_ino;
448         u64 no_addr;
449 };
450
451 struct gfs2_sb_host {
452         u32 sb_magic;
453         u32 sb_type;
454         u32 sb_format;
455
456         u32 sb_fs_format;
457         u32 sb_multihost_format;
458         u32 sb_bsize;
459         u32 sb_bsize_shift;
460
461         struct gfs2_inum_host sb_master_dir;
462         struct gfs2_inum_host sb_root_dir;
463
464         char sb_lockproto[GFS2_LOCKNAME_LEN];
465         char sb_locktable[GFS2_LOCKNAME_LEN];
466 };
467
468 struct gfs2_sbd {
469         struct super_block *sd_vfs;
470         struct super_block *sd_vfs_meta;
471         struct kobject sd_kobj;
472         unsigned long sd_flags; /* SDF_... */
473         struct gfs2_sb_host sd_sb;
474
475         /* Constants computed on mount */
476
477         u32 sd_fsb2bb;
478         u32 sd_fsb2bb_shift;
479         u32 sd_diptrs;  /* Number of pointers in a dinode */
480         u32 sd_inptrs;  /* Number of pointers in a indirect block */
481         u32 sd_jbsize;  /* Size of a journaled data block */
482         u32 sd_hash_bsize;      /* sizeof(exhash block) */
483         u32 sd_hash_bsize_shift;
484         u32 sd_hash_ptrs;       /* Number of pointers in a hash block */
485         u32 sd_qc_per_block;
486         u32 sd_max_dirres;      /* Max blocks needed to add a directory entry */
487         u32 sd_max_height;      /* Max height of a file's metadata tree */
488         u64 sd_heightsize[GFS2_MAX_META_HEIGHT + 1];
489         u32 sd_max_jheight; /* Max height of journaled file's meta tree */
490         u64 sd_jheightsize[GFS2_MAX_META_HEIGHT + 1];
491
492         struct gfs2_args sd_args;       /* Mount arguments */
493         struct gfs2_tune sd_tune;       /* Filesystem tuning structure */
494
495         /* Lock Stuff */
496
497         struct lm_lockstruct sd_lockstruct;
498         struct list_head sd_reclaim_list;
499         spinlock_t sd_reclaim_lock;
500         wait_queue_head_t sd_reclaim_wq;
501         atomic_t sd_reclaim_count;
502         struct gfs2_holder sd_live_gh;
503         struct gfs2_glock *sd_rename_gl;
504         struct gfs2_glock *sd_trans_gl;
505
506         /* Inode Stuff */
507
508         struct inode *sd_master_dir;
509         struct inode *sd_jindex;
510         struct inode *sd_inum_inode;
511         struct inode *sd_statfs_inode;
512         struct inode *sd_ir_inode;
513         struct inode *sd_sc_inode;
514         struct inode *sd_qc_inode;
515         struct inode *sd_rindex;
516         struct inode *sd_quota_inode;
517
518         /* Inum stuff */
519
520         struct mutex sd_inum_mutex;
521
522         /* StatFS stuff */
523
524         spinlock_t sd_statfs_spin;
525         struct gfs2_statfs_change_host sd_statfs_master;
526         struct gfs2_statfs_change_host sd_statfs_local;
527         unsigned long sd_statfs_sync_time;
528
529         /* Resource group stuff */
530
531         int sd_rindex_uptodate;
532         spinlock_t sd_rindex_spin;
533         struct mutex sd_rindex_mutex;
534         struct list_head sd_rindex_list;
535         struct list_head sd_rindex_mru_list;
536         struct list_head sd_rindex_recent_list;
537         struct gfs2_rgrpd *sd_rindex_forward;
538         unsigned int sd_rgrps;
539
540         /* Journal index stuff */
541
542         struct list_head sd_jindex_list;
543         spinlock_t sd_jindex_spin;
544         struct mutex sd_jindex_mutex;
545         unsigned int sd_journals;
546         unsigned long sd_jindex_refresh_time;
547
548         struct gfs2_jdesc *sd_jdesc;
549         struct gfs2_holder sd_journal_gh;
550         struct gfs2_holder sd_jinode_gh;
551
552         struct gfs2_holder sd_ir_gh;
553         struct gfs2_holder sd_sc_gh;
554         struct gfs2_holder sd_qc_gh;
555
556         /* Daemon stuff */
557
558         struct task_struct *sd_recoverd_process;
559         struct task_struct *sd_logd_process;
560         struct task_struct *sd_quotad_process;
561         struct task_struct *sd_glockd_process[GFS2_GLOCKD_MAX];
562         unsigned int sd_glockd_num;
563
564         /* Quota stuff */
565
566         struct list_head sd_quota_list;
567         atomic_t sd_quota_count;
568         spinlock_t sd_quota_spin;
569         struct mutex sd_quota_mutex;
570
571         unsigned int sd_quota_slots;
572         unsigned int sd_quota_chunks;
573         unsigned char **sd_quota_bitmap;
574
575         u64 sd_quota_sync_gen;
576         unsigned long sd_quota_sync_time;
577
578         /* Log stuff */
579
580         spinlock_t sd_log_lock;
581
582         unsigned int sd_log_blks_reserved;
583         unsigned int sd_log_commited_buf;
584         unsigned int sd_log_commited_databuf;
585         unsigned int sd_log_commited_revoke;
586
587         unsigned int sd_log_num_buf;
588         unsigned int sd_log_num_revoke;
589         unsigned int sd_log_num_rg;
590         unsigned int sd_log_num_databuf;
591
592         struct list_head sd_log_le_buf;
593         struct list_head sd_log_le_revoke;
594         struct list_head sd_log_le_rg;
595         struct list_head sd_log_le_databuf;
596         struct list_head sd_log_le_ordered;
597
598         atomic_t sd_log_blks_free;
599         struct mutex sd_log_reserve_mutex;
600
601         u64 sd_log_sequence;
602         unsigned int sd_log_head;
603         unsigned int sd_log_tail;
604         int sd_log_idle;
605
606         unsigned long sd_log_flush_time;
607         struct rw_semaphore sd_log_flush_lock;
608         atomic_t sd_log_in_flight;
609         wait_queue_head_t sd_log_flush_wait;
610
611         unsigned int sd_log_flush_head;
612         u64 sd_log_flush_wrapped;
613
614         struct list_head sd_ail1_list;
615         struct list_head sd_ail2_list;
616         u64 sd_ail_sync_gen;
617
618         /* Replay stuff */
619
620         struct list_head sd_revoke_list;
621         unsigned int sd_replay_tail;
622
623         unsigned int sd_found_blocks;
624         unsigned int sd_found_revokes;
625         unsigned int sd_replayed_blocks;
626
627         /* For quiescing the filesystem */
628
629         struct gfs2_holder sd_freeze_gh;
630         struct mutex sd_freeze_lock;
631         unsigned int sd_freeze_count;
632
633         /* Counters */
634
635         atomic_t sd_reclaimed;
636
637         char sd_fsname[GFS2_FSNAME_LEN];
638         char sd_table_name[GFS2_FSNAME_LEN];
639         char sd_proto_name[GFS2_FSNAME_LEN];
640
641         /* Debugging crud */
642
643         unsigned long sd_last_warning;
644         struct vfsmount *sd_gfs2mnt;
645         struct dentry *debugfs_dir;    /* debugfs directory */
646         struct dentry *debugfs_dentry_glocks; /* for debugfs */
647 };
648
649 #endif /* __INCORE_DOT_H__ */
650