UBIFS: fix budgeting calculations
[linux-2.6] / fs / ubifs / dir.c
1 /* * This file is part of UBIFS.
2  *
3  * Copyright (C) 2006-2008 Nokia Corporation.
4  * Copyright (C) 2006, 2007 University of Szeged, Hungary
5  *
6  * This program is free software; you can redistribute it and/or modify it
7  * under the terms of the GNU General Public License version 2 as published by
8  * the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but WITHOUT
11  * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
12  * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
13  * more details.
14  *
15  * You should have received a copy of the GNU General Public License along with
16  * this program; if not, write to the Free Software Foundation, Inc., 51
17  * Franklin St, Fifth Floor, Boston, MA 02110-1301 USA
18  *
19  * Authors: Artem Bityutskiy (Битюцкий Артём)
20  *          Adrian Hunter
21  *          Zoltan Sogor
22  */
23
24 /*
25  * This file implements directory operations.
26  *
27  * All FS operations in this file allocate budget before writing anything to the
28  * media. If they fail to allocate it, the error is returned. The only
29  * exceptions are 'ubifs_unlink()' and 'ubifs_rmdir()' which keep working even
30  * if they unable to allocate the budget, because deletion %-ENOSPC failure is
31  * not what users are usually ready to get. UBIFS budgeting subsystem has some
32  * space reserved for these purposes.
33  *
34  * All operations in this file write all inodes which they change straight
35  * away, instead of marking them dirty. For example, 'ubifs_link()' changes
36  * @i_size of the parent inode and writes the parent inode together with the
37  * target inode. This was done to simplify file-system recovery which would
38  * otherwise be very difficult to do. The only exception is rename which marks
39  * the re-named inode dirty (because its @i_ctime is updated) but does not
40  * write it, but just marks it as dirty.
41  */
42
43 #include "ubifs.h"
44
45 /**
46  * inherit_flags - inherit flags of the parent inode.
47  * @dir: parent inode
48  * @mode: new inode mode flags
49  *
50  * This is a helper function for 'ubifs_new_inode()' which inherits flag of the
51  * parent directory inode @dir. UBIFS inodes inherit the following flags:
52  * o %UBIFS_COMPR_FL, which is useful to switch compression on/of on
53  *   sub-directory basis;
54  * o %UBIFS_SYNC_FL - useful for the same reasons;
55  * o %UBIFS_DIRSYNC_FL - similar, but relevant only to directories.
56  *
57  * This function returns the inherited flags.
58  */
59 static int inherit_flags(const struct inode *dir, int mode)
60 {
61         int flags;
62         const struct ubifs_inode *ui = ubifs_inode(dir);
63
64         if (!S_ISDIR(dir->i_mode))
65                 /*
66                  * The parent is not a directory, which means that an extended
67                  * attribute inode is being created. No flags.
68                  */
69                 return 0;
70
71         flags = ui->flags & (UBIFS_COMPR_FL | UBIFS_SYNC_FL | UBIFS_DIRSYNC_FL);
72         if (!S_ISDIR(mode))
73                 /* The "DIRSYNC" flag only applies to directories */
74                 flags &= ~UBIFS_DIRSYNC_FL;
75         return flags;
76 }
77
78 /**
79  * ubifs_new_inode - allocate new UBIFS inode object.
80  * @c: UBIFS file-system description object
81  * @dir: parent directory inode
82  * @mode: inode mode flags
83  *
84  * This function finds an unused inode number, allocates new inode and
85  * initializes it. Returns new inode in case of success and an error code in
86  * case of failure.
87  */
88 struct inode *ubifs_new_inode(struct ubifs_info *c, const struct inode *dir,
89                               int mode)
90 {
91         struct inode *inode;
92         struct ubifs_inode *ui;
93
94         inode = new_inode(c->vfs_sb);
95         ui = ubifs_inode(inode);
96         if (!inode)
97                 return ERR_PTR(-ENOMEM);
98
99         /*
100          * Set 'S_NOCMTIME' to prevent VFS form updating [mc]time of inodes and
101          * marking them dirty in file write path (see 'file_update_time()').
102          * UBIFS has to fully control "clean <-> dirty" transitions of inodes
103          * to make budgeting work.
104          */
105         inode->i_flags |= (S_NOCMTIME);
106
107         inode->i_uid = current->fsuid;
108         if (dir->i_mode & S_ISGID) {
109                 inode->i_gid = dir->i_gid;
110                 if (S_ISDIR(mode))
111                         mode |= S_ISGID;
112         } else
113                 inode->i_gid = current->fsgid;
114         inode->i_mode = mode;
115         inode->i_mtime = inode->i_atime = inode->i_ctime =
116                          ubifs_current_time(inode);
117         inode->i_mapping->nrpages = 0;
118         /* Disable readahead */
119         inode->i_mapping->backing_dev_info = &c->bdi;
120
121         switch (mode & S_IFMT) {
122         case S_IFREG:
123                 inode->i_mapping->a_ops = &ubifs_file_address_operations;
124                 inode->i_op = &ubifs_file_inode_operations;
125                 inode->i_fop = &ubifs_file_operations;
126                 break;
127         case S_IFDIR:
128                 inode->i_op  = &ubifs_dir_inode_operations;
129                 inode->i_fop = &ubifs_dir_operations;
130                 inode->i_size = ui->ui_size = UBIFS_INO_NODE_SZ;
131                 break;
132         case S_IFLNK:
133                 inode->i_op = &ubifs_symlink_inode_operations;
134                 break;
135         case S_IFSOCK:
136         case S_IFIFO:
137         case S_IFBLK:
138         case S_IFCHR:
139                 inode->i_op  = &ubifs_file_inode_operations;
140                 break;
141         default:
142                 BUG();
143         }
144
145         ui->flags = inherit_flags(dir, mode);
146         ubifs_set_inode_flags(inode);
147         if (S_ISREG(mode))
148                 ui->compr_type = c->default_compr;
149         else
150                 ui->compr_type = UBIFS_COMPR_NONE;
151         ui->synced_i_size = 0;
152
153         spin_lock(&c->cnt_lock);
154         /* Inode number overflow is currently not supported */
155         if (c->highest_inum >= INUM_WARN_WATERMARK) {
156                 if (c->highest_inum >= INUM_WATERMARK) {
157                         spin_unlock(&c->cnt_lock);
158                         ubifs_err("out of inode numbers");
159                         make_bad_inode(inode);
160                         iput(inode);
161                         return ERR_PTR(-EINVAL);
162                 }
163                 ubifs_warn("running out of inode numbers (current %lu, max %d)",
164                            c->highest_inum, INUM_WATERMARK);
165         }
166
167         inode->i_ino = ++c->highest_inum;
168         inode->i_generation = ++c->vfs_gen;
169         /*
170          * The creation sequence number remains with this inode for its
171          * lifetime. All nodes for this inode have a greater sequence number,
172          * and so it is possible to distinguish obsolete nodes belonging to a
173          * previous incarnation of the same inode number - for example, for the
174          * purpose of rebuilding the index.
175          */
176         ui->creat_sqnum = ++c->max_sqnum;
177         spin_unlock(&c->cnt_lock);
178         return inode;
179 }
180
181 #ifdef CONFIG_UBIFS_FS_DEBUG
182
183 static int dbg_check_name(struct ubifs_dent_node *dent, struct qstr *nm)
184 {
185         if (!(ubifs_chk_flags & UBIFS_CHK_GEN))
186                 return 0;
187         if (le16_to_cpu(dent->nlen) != nm->len)
188                 return -EINVAL;
189         if (memcmp(dent->name, nm->name, nm->len))
190                 return -EINVAL;
191         return 0;
192 }
193
194 #else
195
196 #define dbg_check_name(dent, nm) 0
197
198 #endif
199
200 static struct dentry *ubifs_lookup(struct inode *dir, struct dentry *dentry,
201                                    struct nameidata *nd)
202 {
203         int err;
204         union ubifs_key key;
205         struct inode *inode = NULL;
206         struct ubifs_dent_node *dent;
207         struct ubifs_info *c = dir->i_sb->s_fs_info;
208
209         dbg_gen("'%.*s' in dir ino %lu",
210                 dentry->d_name.len, dentry->d_name.name, dir->i_ino);
211
212         if (dentry->d_name.len > UBIFS_MAX_NLEN)
213                 return ERR_PTR(-ENAMETOOLONG);
214
215         dent = kmalloc(UBIFS_MAX_DENT_NODE_SZ, GFP_NOFS);
216         if (!dent)
217                 return ERR_PTR(-ENOMEM);
218
219         dent_key_init(c, &key, dir->i_ino, &dentry->d_name);
220
221         err = ubifs_tnc_lookup_nm(c, &key, dent, &dentry->d_name);
222         if (err) {
223                 /*
224                  * Do not hash the direntry if parent 'i_nlink' is zero, because
225                  * this has side-effects - '->delete_inode()' call will not be
226                  * called for the parent orphan inode, because 'd_count' of its
227                  * direntry will stay 1 (it'll be negative direntry I guess)
228                  * and prevent 'iput_final()' until the dentry is destroyed due
229                  * to unmount or memory pressure.
230                  */
231                 if (err == -ENOENT && dir->i_nlink != 0) {
232                         dbg_gen("not found");
233                         goto done;
234                 }
235                 goto out;
236         }
237
238         if (dbg_check_name(dent, &dentry->d_name)) {
239                 err = -EINVAL;
240                 goto out;
241         }
242
243         inode = ubifs_iget(dir->i_sb, le64_to_cpu(dent->inum));
244         if (IS_ERR(inode)) {
245                 /*
246                  * This should not happen. Probably the file-system needs
247                  * checking.
248                  */
249                 err = PTR_ERR(inode);
250                 ubifs_err("dead directory entry '%.*s', error %d",
251                           dentry->d_name.len, dentry->d_name.name, err);
252                 ubifs_ro_mode(c, err);
253                 goto out;
254         }
255
256 done:
257         kfree(dent);
258         /*
259          * Note, d_splice_alias() would be required instead if we supported
260          * NFS.
261          */
262         d_add(dentry, inode);
263         return NULL;
264
265 out:
266         kfree(dent);
267         return ERR_PTR(err);
268 }
269
270 static int ubifs_create(struct inode *dir, struct dentry *dentry, int mode,
271                         struct nameidata *nd)
272 {
273         struct inode *inode;
274         struct ubifs_info *c = dir->i_sb->s_fs_info;
275         int err, sz_change = CALC_DENT_SIZE(dentry->d_name.len);
276         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1,
277                                         .dirtied_ino = 1 };
278         struct ubifs_inode *dir_ui = ubifs_inode(dir);
279
280         /*
281          * Budget request settings: new inode, new direntry, changing the
282          * parent directory inode.
283          */
284
285         dbg_gen("dent '%.*s', mode %#x in dir ino %lu",
286                 dentry->d_name.len, dentry->d_name.name, mode, dir->i_ino);
287
288         err = ubifs_budget_space(c, &req);
289         if (err)
290                 return err;
291
292         inode = ubifs_new_inode(c, dir, mode);
293         if (IS_ERR(inode)) {
294                 err = PTR_ERR(inode);
295                 goto out_budg;
296         }
297
298         mutex_lock(&dir_ui->ui_mutex);
299         dir->i_size += sz_change;
300         dir_ui->ui_size = dir->i_size;
301         dir->i_mtime = dir->i_ctime = inode->i_ctime;
302         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
303         if (err)
304                 goto out_cancel;
305         mutex_unlock(&dir_ui->ui_mutex);
306
307         ubifs_release_budget(c, &req);
308         insert_inode_hash(inode);
309         d_instantiate(dentry, inode);
310         return 0;
311
312 out_cancel:
313         dir->i_size -= sz_change;
314         dir_ui->ui_size = dir->i_size;
315         mutex_unlock(&dir_ui->ui_mutex);
316         make_bad_inode(inode);
317         iput(inode);
318 out_budg:
319         ubifs_release_budget(c, &req);
320         ubifs_err("cannot create regular file, error %d", err);
321         return err;
322 }
323
324 /**
325  * vfs_dent_type - get VFS directory entry type.
326  * @type: UBIFS directory entry type
327  *
328  * This function converts UBIFS directory entry type into VFS directory entry
329  * type.
330  */
331 static unsigned int vfs_dent_type(uint8_t type)
332 {
333         switch (type) {
334         case UBIFS_ITYPE_REG:
335                 return DT_REG;
336         case UBIFS_ITYPE_DIR:
337                 return DT_DIR;
338         case UBIFS_ITYPE_LNK:
339                 return DT_LNK;
340         case UBIFS_ITYPE_BLK:
341                 return DT_BLK;
342         case UBIFS_ITYPE_CHR:
343                 return DT_CHR;
344         case UBIFS_ITYPE_FIFO:
345                 return DT_FIFO;
346         case UBIFS_ITYPE_SOCK:
347                 return DT_SOCK;
348         default:
349                 BUG();
350         }
351         return 0;
352 }
353
354 /*
355  * The classical Unix view for directory is that it is a linear array of
356  * (name, inode number) entries. Linux/VFS assumes this model as well.
357  * Particularly, 'readdir()' call wants us to return a directory entry offset
358  * which later may be used to continue 'readdir()'ing the directory or to
359  * 'seek()' to that specific direntry. Obviously UBIFS does not really fit this
360  * model because directory entries are identified by keys, which may collide.
361  *
362  * UBIFS uses directory entry hash value for directory offsets, so
363  * 'seekdir()'/'telldir()' may not always work because of possible key
364  * collisions. But UBIFS guarantees that consecutive 'readdir()' calls work
365  * properly by means of saving full directory entry name in the private field
366  * of the file description object.
367  *
368  * This means that UBIFS cannot support NFS which requires full
369  * 'seekdir()'/'telldir()' support.
370  */
371 static int ubifs_readdir(struct file *file, void *dirent, filldir_t filldir)
372 {
373         int err, over = 0;
374         struct qstr nm;
375         union ubifs_key key;
376         struct ubifs_dent_node *dent;
377         struct inode *dir = file->f_path.dentry->d_inode;
378         struct ubifs_info *c = dir->i_sb->s_fs_info;
379
380         dbg_gen("dir ino %lu, f_pos %#llx", dir->i_ino, file->f_pos);
381
382         if (file->f_pos > UBIFS_S_KEY_HASH_MASK || file->f_pos == 2)
383                 /*
384                  * The directory was seek'ed to a senseless position or there
385                  * are no more entries.
386                  */
387                 return 0;
388
389         /* File positions 0 and 1 correspond to "." and ".." */
390         if (file->f_pos == 0) {
391                 ubifs_assert(!file->private_data);
392                 over = filldir(dirent, ".", 1, 0, dir->i_ino, DT_DIR);
393                 if (over)
394                         return 0;
395                 file->f_pos = 1;
396         }
397
398         if (file->f_pos == 1) {
399                 ubifs_assert(!file->private_data);
400                 over = filldir(dirent, "..", 2, 1,
401                                parent_ino(file->f_path.dentry), DT_DIR);
402                 if (over)
403                         return 0;
404
405                 /* Find the first entry in TNC and save it */
406                 lowest_dent_key(c, &key, dir->i_ino);
407                 nm.name = NULL;
408                 dent = ubifs_tnc_next_ent(c, &key, &nm);
409                 if (IS_ERR(dent)) {
410                         err = PTR_ERR(dent);
411                         goto out;
412                 }
413
414                 file->f_pos = key_hash_flash(c, &dent->key);
415                 file->private_data = dent;
416         }
417
418         dent = file->private_data;
419         if (!dent) {
420                 /*
421                  * The directory was seek'ed to and is now readdir'ed.
422                  * Find the entry corresponding to @file->f_pos or the
423                  * closest one.
424                  */
425                 dent_key_init_hash(c, &key, dir->i_ino, file->f_pos);
426                 nm.name = NULL;
427                 dent = ubifs_tnc_next_ent(c, &key, &nm);
428                 if (IS_ERR(dent)) {
429                         err = PTR_ERR(dent);
430                         goto out;
431                 }
432                 file->f_pos = key_hash_flash(c, &dent->key);
433                 file->private_data = dent;
434         }
435
436         while (1) {
437                 dbg_gen("feed '%s', ino %llu, new f_pos %#x",
438                         dent->name, le64_to_cpu(dent->inum),
439                         key_hash_flash(c, &dent->key));
440                 ubifs_assert(dent->ch.sqnum > ubifs_inode(dir)->creat_sqnum);
441
442                 nm.len = le16_to_cpu(dent->nlen);
443                 over = filldir(dirent, dent->name, nm.len, file->f_pos,
444                                le64_to_cpu(dent->inum),
445                                vfs_dent_type(dent->type));
446                 if (over)
447                         return 0;
448
449                 /* Switch to the next entry */
450                 key_read(c, &dent->key, &key);
451                 nm.name = dent->name;
452                 dent = ubifs_tnc_next_ent(c, &key, &nm);
453                 if (IS_ERR(dent)) {
454                         err = PTR_ERR(dent);
455                         goto out;
456                 }
457
458                 kfree(file->private_data);
459                 file->f_pos = key_hash_flash(c, &dent->key);
460                 file->private_data = dent;
461                 cond_resched();
462         }
463
464 out:
465         if (err != -ENOENT) {
466                 ubifs_err("cannot find next direntry, error %d", err);
467                 return err;
468         }
469
470         kfree(file->private_data);
471         file->private_data = NULL;
472         file->f_pos = 2;
473         return 0;
474 }
475
476 /* If a directory is seeked, we have to free saved readdir() state */
477 static loff_t ubifs_dir_llseek(struct file *file, loff_t offset, int origin)
478 {
479         kfree(file->private_data);
480         file->private_data = NULL;
481         return generic_file_llseek(file, offset, origin);
482 }
483
484 /* Free saved readdir() state when the directory is closed */
485 static int ubifs_dir_release(struct inode *dir, struct file *file)
486 {
487         kfree(file->private_data);
488         file->private_data = NULL;
489         return 0;
490 }
491
492 /**
493  * lock_2_inodes - lock two UBIFS inodes.
494  * @inode1: first inode
495  * @inode2: second inode
496  */
497 static void lock_2_inodes(struct inode *inode1, struct inode *inode2)
498 {
499         if (inode1->i_ino < inode2->i_ino) {
500                 mutex_lock_nested(&ubifs_inode(inode1)->ui_mutex, WB_MUTEX_2);
501                 mutex_lock_nested(&ubifs_inode(inode2)->ui_mutex, WB_MUTEX_3);
502         } else {
503                 mutex_lock_nested(&ubifs_inode(inode2)->ui_mutex, WB_MUTEX_2);
504                 mutex_lock_nested(&ubifs_inode(inode1)->ui_mutex, WB_MUTEX_3);
505         }
506 }
507
508 /**
509  * unlock_2_inodes - unlock two UBIFS inodes inodes.
510  * @inode1: first inode
511  * @inode2: second inode
512  */
513 static void unlock_2_inodes(struct inode *inode1, struct inode *inode2)
514 {
515         mutex_unlock(&ubifs_inode(inode1)->ui_mutex);
516         mutex_unlock(&ubifs_inode(inode2)->ui_mutex);
517 }
518
519 static int ubifs_link(struct dentry *old_dentry, struct inode *dir,
520                       struct dentry *dentry)
521 {
522         struct ubifs_info *c = dir->i_sb->s_fs_info;
523         struct inode *inode = old_dentry->d_inode;
524         struct ubifs_inode *ui = ubifs_inode(inode);
525         struct ubifs_inode *dir_ui = ubifs_inode(dir);
526         int err, sz_change = CALC_DENT_SIZE(dentry->d_name.len);
527         struct ubifs_budget_req req = { .new_dent = 1, .dirtied_ino = 2,
528                                         .dirtied_ino_d = ui->data_len };
529
530         /*
531          * Budget request settings: new direntry, changing the target inode,
532          * changing the parent inode.
533          */
534
535         dbg_gen("dent '%.*s' to ino %lu (nlink %d) in dir ino %lu",
536                 dentry->d_name.len, dentry->d_name.name, inode->i_ino,
537                 inode->i_nlink, dir->i_ino);
538         err = dbg_check_synced_i_size(inode);
539         if (err)
540                 return err;
541
542         err = ubifs_budget_space(c, &req);
543         if (err)
544                 return err;
545
546         lock_2_inodes(dir, inode);
547         inc_nlink(inode);
548         atomic_inc(&inode->i_count);
549         inode->i_ctime = ubifs_current_time(inode);
550         dir->i_size += sz_change;
551         dir_ui->ui_size = dir->i_size;
552         dir->i_mtime = dir->i_ctime = inode->i_ctime;
553         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
554         if (err)
555                 goto out_cancel;
556         unlock_2_inodes(dir, inode);
557
558         ubifs_release_budget(c, &req);
559         d_instantiate(dentry, inode);
560         return 0;
561
562 out_cancel:
563         dir->i_size -= sz_change;
564         dir_ui->ui_size = dir->i_size;
565         drop_nlink(inode);
566         unlock_2_inodes(dir, inode);
567         ubifs_release_budget(c, &req);
568         iput(inode);
569         return err;
570 }
571
572 static int ubifs_unlink(struct inode *dir, struct dentry *dentry)
573 {
574         struct ubifs_info *c = dir->i_sb->s_fs_info;
575         struct inode *inode = dentry->d_inode;
576         struct ubifs_inode *dir_ui = ubifs_inode(dir);
577         int sz_change = CALC_DENT_SIZE(dentry->d_name.len);
578         int err, budgeted = 1;
579         struct ubifs_budget_req req = { .mod_dent = 1, .dirtied_ino = 2 };
580
581         /*
582          * Budget request settings: deletion direntry, deletion inode (+1 for
583          * @dirtied_ino), changing the parent directory inode. If budgeting
584          * fails, go ahead anyway because we have extra space reserved for
585          * deletions.
586          */
587
588         dbg_gen("dent '%.*s' from ino %lu (nlink %d) in dir ino %lu",
589                 dentry->d_name.len, dentry->d_name.name, inode->i_ino,
590                 inode->i_nlink, dir->i_ino);
591         err = dbg_check_synced_i_size(inode);
592         if (err)
593                 return err;
594
595         err = ubifs_budget_space(c, &req);
596         if (err) {
597                 if (err != -ENOSPC)
598                         return err;
599                 err = 0;
600                 budgeted = 0;
601         }
602
603         lock_2_inodes(dir, inode);
604         inode->i_ctime = ubifs_current_time(dir);
605         drop_nlink(inode);
606         dir->i_size -= sz_change;
607         dir_ui->ui_size = dir->i_size;
608         dir->i_mtime = dir->i_ctime = inode->i_ctime;
609         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 1, 0);
610         if (err)
611                 goto out_cancel;
612         unlock_2_inodes(dir, inode);
613
614         if (budgeted)
615                 ubifs_release_budget(c, &req);
616         else {
617                 /* We've deleted something - clean the "no space" flags */
618                 c->nospace = c->nospace_rp = 0;
619                 smp_wmb();
620         }
621         return 0;
622
623 out_cancel:
624         dir->i_size += sz_change;
625         dir_ui->ui_size = dir->i_size;
626         inc_nlink(inode);
627         unlock_2_inodes(dir, inode);
628         if (budgeted)
629                 ubifs_release_budget(c, &req);
630         return err;
631 }
632
633 /**
634  * check_dir_empty - check if a directory is empty or not.
635  * @c: UBIFS file-system description object
636  * @dir: VFS inode object of the directory to check
637  *
638  * This function checks if directory @dir is empty. Returns zero if the
639  * directory is empty, %-ENOTEMPTY if it is not, and other negative error codes
640  * in case of of errors.
641  */
642 static int check_dir_empty(struct ubifs_info *c, struct inode *dir)
643 {
644         struct qstr nm = { .name = NULL };
645         struct ubifs_dent_node *dent;
646         union ubifs_key key;
647         int err;
648
649         lowest_dent_key(c, &key, dir->i_ino);
650         dent = ubifs_tnc_next_ent(c, &key, &nm);
651         if (IS_ERR(dent)) {
652                 err = PTR_ERR(dent);
653                 if (err == -ENOENT)
654                         err = 0;
655         } else {
656                 kfree(dent);
657                 err = -ENOTEMPTY;
658         }
659         return err;
660 }
661
662 static int ubifs_rmdir(struct inode *dir, struct dentry *dentry)
663 {
664         struct ubifs_info *c = dir->i_sb->s_fs_info;
665         struct inode *inode = dentry->d_inode;
666         int sz_change = CALC_DENT_SIZE(dentry->d_name.len);
667         int err, budgeted = 1;
668         struct ubifs_inode *dir_ui = ubifs_inode(dir);
669         struct ubifs_budget_req req = { .mod_dent = 1, .dirtied_ino = 2 };
670
671         /*
672          * Budget request settings: deletion direntry, deletion inode and
673          * changing the parent inode. If budgeting fails, go ahead anyway
674          * because we have extra space reserved for deletions.
675          */
676
677         dbg_gen("directory '%.*s', ino %lu in dir ino %lu", dentry->d_name.len,
678                 dentry->d_name.name, inode->i_ino, dir->i_ino);
679
680         err = check_dir_empty(c, dentry->d_inode);
681         if (err)
682                 return err;
683
684         err = ubifs_budget_space(c, &req);
685         if (err) {
686                 if (err != -ENOSPC)
687                         return err;
688                 budgeted = 0;
689         }
690
691         lock_2_inodes(dir, inode);
692         inode->i_ctime = ubifs_current_time(dir);
693         clear_nlink(inode);
694         drop_nlink(dir);
695         dir->i_size -= sz_change;
696         dir_ui->ui_size = dir->i_size;
697         dir->i_mtime = dir->i_ctime = inode->i_ctime;
698         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 1, 0);
699         if (err)
700                 goto out_cancel;
701         unlock_2_inodes(dir, inode);
702
703         if (budgeted)
704                 ubifs_release_budget(c, &req);
705         else {
706                 /* We've deleted something - clean the "no space" flags */
707                 c->nospace = c->nospace_rp = 0;
708                 smp_wmb();
709         }
710         return 0;
711
712 out_cancel:
713         dir->i_size += sz_change;
714         dir_ui->ui_size = dir->i_size;
715         inc_nlink(dir);
716         inc_nlink(inode);
717         inc_nlink(inode);
718         unlock_2_inodes(dir, inode);
719         if (budgeted)
720                 ubifs_release_budget(c, &req);
721         return err;
722 }
723
724 static int ubifs_mkdir(struct inode *dir, struct dentry *dentry, int mode)
725 {
726         struct inode *inode;
727         struct ubifs_inode *dir_ui = ubifs_inode(dir);
728         struct ubifs_info *c = dir->i_sb->s_fs_info;
729         int err, sz_change = CALC_DENT_SIZE(dentry->d_name.len);
730         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1 };
731
732         /*
733          * Budget request settings: new inode, new direntry and changing parent
734          * directory inode.
735          */
736
737         dbg_gen("dent '%.*s', mode %#x in dir ino %lu",
738                 dentry->d_name.len, dentry->d_name.name, mode, dir->i_ino);
739
740         err = ubifs_budget_space(c, &req);
741         if (err)
742                 return err;
743
744         inode = ubifs_new_inode(c, dir, S_IFDIR | mode);
745         if (IS_ERR(inode)) {
746                 err = PTR_ERR(inode);
747                 goto out_budg;
748         }
749
750         mutex_lock(&dir_ui->ui_mutex);
751         insert_inode_hash(inode);
752         inc_nlink(inode);
753         inc_nlink(dir);
754         dir->i_size += sz_change;
755         dir_ui->ui_size = dir->i_size;
756         dir->i_mtime = dir->i_ctime = inode->i_ctime;
757         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
758         if (err) {
759                 ubifs_err("cannot create directory, error %d", err);
760                 goto out_cancel;
761         }
762         mutex_unlock(&dir_ui->ui_mutex);
763
764         ubifs_release_budget(c, &req);
765         d_instantiate(dentry, inode);
766         return 0;
767
768 out_cancel:
769         dir->i_size -= sz_change;
770         dir_ui->ui_size = dir->i_size;
771         drop_nlink(dir);
772         mutex_unlock(&dir_ui->ui_mutex);
773         make_bad_inode(inode);
774         iput(inode);
775 out_budg:
776         ubifs_release_budget(c, &req);
777         return err;
778 }
779
780 static int ubifs_mknod(struct inode *dir, struct dentry *dentry,
781                        int mode, dev_t rdev)
782 {
783         struct inode *inode;
784         struct ubifs_inode *ui;
785         struct ubifs_inode *dir_ui = ubifs_inode(dir);
786         struct ubifs_info *c = dir->i_sb->s_fs_info;
787         union ubifs_dev_desc *dev = NULL;
788         int sz_change = CALC_DENT_SIZE(dentry->d_name.len);
789         int err, devlen = 0;
790         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1,
791                                         .new_ino_d = devlen, .dirtied_ino = 1 };
792
793         /*
794          * Budget request settings: new inode, new direntry and changing parent
795          * directory inode.
796          */
797
798         dbg_gen("dent '%.*s' in dir ino %lu",
799                 dentry->d_name.len, dentry->d_name.name, dir->i_ino);
800
801         if (!new_valid_dev(rdev))
802                 return -EINVAL;
803
804         if (S_ISBLK(mode) || S_ISCHR(mode)) {
805                 dev = kmalloc(sizeof(union ubifs_dev_desc), GFP_NOFS);
806                 if (!dev)
807                         return -ENOMEM;
808                 devlen = ubifs_encode_dev(dev, rdev);
809         }
810
811         err = ubifs_budget_space(c, &req);
812         if (err) {
813                 kfree(dev);
814                 return err;
815         }
816
817         inode = ubifs_new_inode(c, dir, mode);
818         if (IS_ERR(inode)) {
819                 kfree(dev);
820                 err = PTR_ERR(inode);
821                 goto out_budg;
822         }
823
824         init_special_inode(inode, inode->i_mode, rdev);
825         inode->i_size = ubifs_inode(inode)->ui_size = devlen;
826         ui = ubifs_inode(inode);
827         ui->data = dev;
828         ui->data_len = devlen;
829
830         mutex_lock(&dir_ui->ui_mutex);
831         dir->i_size += sz_change;
832         dir_ui->ui_size = dir->i_size;
833         dir->i_mtime = dir->i_ctime = inode->i_ctime;
834         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
835         if (err)
836                 goto out_cancel;
837         mutex_unlock(&dir_ui->ui_mutex);
838
839         ubifs_release_budget(c, &req);
840         insert_inode_hash(inode);
841         d_instantiate(dentry, inode);
842         return 0;
843
844 out_cancel:
845         dir->i_size -= sz_change;
846         dir_ui->ui_size = dir->i_size;
847         mutex_unlock(&dir_ui->ui_mutex);
848         make_bad_inode(inode);
849         iput(inode);
850 out_budg:
851         ubifs_release_budget(c, &req);
852         return err;
853 }
854
855 static int ubifs_symlink(struct inode *dir, struct dentry *dentry,
856                          const char *symname)
857 {
858         struct inode *inode;
859         struct ubifs_inode *ui;
860         struct ubifs_inode *dir_ui = ubifs_inode(dir);
861         struct ubifs_info *c = dir->i_sb->s_fs_info;
862         int err, len = strlen(symname);
863         int sz_change = CALC_DENT_SIZE(dentry->d_name.len);
864         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1,
865                                         .new_ino_d = len, .dirtied_ino = 1 };
866
867         /*
868          * Budget request settings: new inode, new direntry and changing parent
869          * directory inode.
870          */
871
872         dbg_gen("dent '%.*s', target '%s' in dir ino %lu", dentry->d_name.len,
873                 dentry->d_name.name, symname, dir->i_ino);
874
875         if (len > UBIFS_MAX_INO_DATA)
876                 return -ENAMETOOLONG;
877
878         err = ubifs_budget_space(c, &req);
879         if (err)
880                 return err;
881
882         inode = ubifs_new_inode(c, dir, S_IFLNK | S_IRWXUGO);
883         if (IS_ERR(inode)) {
884                 err = PTR_ERR(inode);
885                 goto out_budg;
886         }
887
888         ui = ubifs_inode(inode);
889         ui->data = kmalloc(len + 1, GFP_NOFS);
890         if (!ui->data) {
891                 err = -ENOMEM;
892                 goto out_inode;
893         }
894
895         memcpy(ui->data, symname, len);
896         ((char *)ui->data)[len] = '\0';
897         /*
898          * The terminating zero byte is not written to the flash media and it
899          * is put just to make later in-memory string processing simpler. Thus,
900          * data length is @len, not @len + %1.
901          */
902         ui->data_len = len;
903         inode->i_size = ubifs_inode(inode)->ui_size = len;
904
905         mutex_lock(&dir_ui->ui_mutex);
906         dir->i_size += sz_change;
907         dir_ui->ui_size = dir->i_size;
908         dir->i_mtime = dir->i_ctime = inode->i_ctime;
909         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
910         if (err)
911                 goto out_cancel;
912         mutex_unlock(&dir_ui->ui_mutex);
913
914         ubifs_release_budget(c, &req);
915         insert_inode_hash(inode);
916         d_instantiate(dentry, inode);
917         return 0;
918
919 out_cancel:
920         dir->i_size -= sz_change;
921         dir_ui->ui_size = dir->i_size;
922         mutex_unlock(&dir_ui->ui_mutex);
923 out_inode:
924         make_bad_inode(inode);
925         iput(inode);
926 out_budg:
927         ubifs_release_budget(c, &req);
928         return err;
929 }
930
931 /**
932  * lock_3_inodes - lock three UBIFS inodes for rename.
933  * @inode1: first inode
934  * @inode2: second inode
935  * @inode3: third inode
936  *
937  * For 'ubifs_rename()', @inode1 may be the same as @inode2 whereas @inode3 may
938  * be null.
939  */
940 static void lock_3_inodes(struct inode *inode1, struct inode *inode2,
941                           struct inode *inode3)
942 {
943         struct inode *i1, *i2, *i3;
944
945         if (!inode3) {
946                 if (inode1 != inode2) {
947                         lock_2_inodes(inode1, inode2);
948                         return;
949                 }
950                 mutex_lock_nested(&ubifs_inode(inode1)->ui_mutex, WB_MUTEX_1);
951                 return;
952         }
953
954         if (inode1 == inode2) {
955                 lock_2_inodes(inode1, inode3);
956                 return;
957         }
958
959         /* 3 different inodes */
960         if (inode1 < inode2) {
961                 i3 = inode2;
962                 if (inode1 < inode3) {
963                         i1 = inode1;
964                         i2 = inode3;
965                 } else {
966                         i1 = inode3;
967                         i2 = inode1;
968                 }
969         } else {
970                 i3 = inode1;
971                 if (inode2 < inode3) {
972                         i1 = inode2;
973                         i2 = inode3;
974                 } else {
975                         i1 = inode3;
976                         i2 = inode2;
977                 }
978         }
979         mutex_lock_nested(&ubifs_inode(i1)->ui_mutex, WB_MUTEX_1);
980         lock_2_inodes(i2, i3);
981 }
982
983 /**
984  * unlock_3_inodes - unlock three UBIFS inodes for rename.
985  * @inode1: first inode
986  * @inode2: second inode
987  * @inode3: third inode
988  */
989 static void unlock_3_inodes(struct inode *inode1, struct inode *inode2,
990                             struct inode *inode3)
991 {
992         mutex_unlock(&ubifs_inode(inode1)->ui_mutex);
993         if (inode1 != inode2)
994                 mutex_unlock(&ubifs_inode(inode2)->ui_mutex);
995         if (inode3)
996                 mutex_unlock(&ubifs_inode(inode3)->ui_mutex);
997 }
998
999 static int ubifs_rename(struct inode *old_dir, struct dentry *old_dentry,
1000                         struct inode *new_dir, struct dentry *new_dentry)
1001 {
1002         struct ubifs_info *c = old_dir->i_sb->s_fs_info;
1003         struct inode *old_inode = old_dentry->d_inode;
1004         struct inode *new_inode = new_dentry->d_inode;
1005         struct ubifs_inode *old_inode_ui = ubifs_inode(old_inode);
1006         int err, release, sync = 0, move = (new_dir != old_dir);
1007         int is_dir = S_ISDIR(old_inode->i_mode);
1008         int unlink = !!new_inode;
1009         int new_sz = CALC_DENT_SIZE(new_dentry->d_name.len);
1010         int old_sz = CALC_DENT_SIZE(old_dentry->d_name.len);
1011         struct ubifs_budget_req req = { .new_dent = 1, .mod_dent = 1,
1012                                         .dirtied_ino = 3 };
1013         struct ubifs_budget_req ino_req = { .dirtied_ino = 1,
1014                                 .dirtied_ino_d = old_inode_ui->data_len };
1015         struct timespec time;
1016
1017         /*
1018          * Budget request settings: deletion direntry, new direntry, removing
1019          * the old inode, and changing old and new parent directory inodes.
1020          *
1021          * However, this operation also marks the target inode as dirty and
1022          * does not write it, so we allocate budget for the target inode
1023          * separately.
1024          */
1025
1026         dbg_gen("dent '%.*s' ino %lu in dir ino %lu to dent '%.*s' in "
1027                 "dir ino %lu", old_dentry->d_name.len, old_dentry->d_name.name,
1028                 old_inode->i_ino, old_dir->i_ino, new_dentry->d_name.len,
1029                 new_dentry->d_name.name, new_dir->i_ino);
1030
1031         if (unlink && is_dir) {
1032                 err = check_dir_empty(c, new_inode);
1033                 if (err)
1034                         return err;
1035         }
1036
1037         err = ubifs_budget_space(c, &req);
1038         if (err)
1039                 return err;
1040         err = ubifs_budget_space(c, &ino_req);
1041         if (err) {
1042                 ubifs_release_budget(c, &req);
1043                 return err;
1044         }
1045
1046         lock_3_inodes(old_dir, new_dir, new_inode);
1047
1048         /*
1049          * Like most other Unix systems, set the @i_ctime for inodes on a
1050          * rename.
1051          */
1052         time = ubifs_current_time(old_dir);
1053         old_inode->i_ctime = time;
1054
1055         /* We must adjust parent link count when renaming directories */
1056         if (is_dir) {
1057                 if (move) {
1058                         /*
1059                          * @old_dir loses a link because we are moving
1060                          * @old_inode to a different directory.
1061                          */
1062                         drop_nlink(old_dir);
1063                         /*
1064                          * @new_dir only gains a link if we are not also
1065                          * overwriting an existing directory.
1066                          */
1067                         if (!unlink)
1068                                 inc_nlink(new_dir);
1069                 } else {
1070                         /*
1071                          * @old_inode is not moving to a different directory,
1072                          * but @old_dir still loses a link if we are
1073                          * overwriting an existing directory.
1074                          */
1075                         if (unlink)
1076                                 drop_nlink(old_dir);
1077                 }
1078         }
1079
1080         old_dir->i_size -= old_sz;
1081         ubifs_inode(old_dir)->ui_size = old_dir->i_size;
1082         old_dir->i_mtime = old_dir->i_ctime = time;
1083         new_dir->i_mtime = new_dir->i_ctime = time;
1084
1085         /*
1086          * And finally, if we unlinked a direntry which happened to have the
1087          * same name as the moved direntry, we have to decrement @i_nlink of
1088          * the unlinked inode and change its ctime.
1089          */
1090         if (unlink) {
1091                 /*
1092                  * Directories cannot have hard-links, so if this is a
1093                  * directory, decrement its @i_nlink twice because an empty
1094                  * directory has @i_nlink 2.
1095                  */
1096                 if (is_dir)
1097                         drop_nlink(new_inode);
1098                 new_inode->i_ctime = time;
1099                 drop_nlink(new_inode);
1100         } else {
1101                 new_dir->i_size += new_sz;
1102                 ubifs_inode(new_dir)->ui_size = new_dir->i_size;
1103         }
1104
1105         /*
1106          * Do not ask 'ubifs_jnl_rename()' to flush write-buffer if @old_inode
1107          * is dirty, because this will be done later on at the end of
1108          * 'ubifs_rename()'.
1109          */
1110         if (IS_SYNC(old_inode)) {
1111                 sync = IS_DIRSYNC(old_dir) || IS_DIRSYNC(new_dir);
1112                 if (unlink && IS_SYNC(new_inode))
1113                         sync = 1;
1114         }
1115         err = ubifs_jnl_rename(c, old_dir, old_dentry, new_dir, new_dentry,
1116                                sync);
1117         if (err)
1118                 goto out_cancel;
1119
1120         unlock_3_inodes(old_dir, new_dir, new_inode);
1121         ubifs_release_budget(c, &req);
1122
1123         mutex_lock(&old_inode_ui->ui_mutex);
1124         release = old_inode_ui->dirty;
1125         mark_inode_dirty_sync(old_inode);
1126         mutex_unlock(&old_inode_ui->ui_mutex);
1127
1128         if (release)
1129                 ubifs_release_budget(c, &ino_req);
1130         if (IS_SYNC(old_inode))
1131                 err = old_inode->i_sb->s_op->write_inode(old_inode, 1);
1132         return err;
1133
1134 out_cancel:
1135         if (unlink) {
1136                 if (is_dir)
1137                         inc_nlink(new_inode);
1138                 inc_nlink(new_inode);
1139         } else {
1140                 new_dir->i_size -= new_sz;
1141                 ubifs_inode(new_dir)->ui_size = new_dir->i_size;
1142         }
1143         old_dir->i_size += old_sz;
1144         ubifs_inode(old_dir)->ui_size = old_dir->i_size;
1145         if (is_dir) {
1146                 if (move) {
1147                         inc_nlink(old_dir);
1148                         if (!unlink)
1149                                 drop_nlink(new_dir);
1150                 } else {
1151                         if (unlink)
1152                                 inc_nlink(old_dir);
1153                 }
1154         }
1155         unlock_3_inodes(old_dir, new_dir, new_inode);
1156         ubifs_release_budget(c, &ino_req);
1157         ubifs_release_budget(c, &req);
1158         return err;
1159 }
1160
1161 int ubifs_getattr(struct vfsmount *mnt, struct dentry *dentry,
1162                   struct kstat *stat)
1163 {
1164         loff_t size;
1165         struct inode *inode = dentry->d_inode;
1166         struct ubifs_inode *ui = ubifs_inode(inode);
1167
1168         mutex_lock(&ui->ui_mutex);
1169         stat->dev = inode->i_sb->s_dev;
1170         stat->ino = inode->i_ino;
1171         stat->mode = inode->i_mode;
1172         stat->nlink = inode->i_nlink;
1173         stat->uid = inode->i_uid;
1174         stat->gid = inode->i_gid;
1175         stat->rdev = inode->i_rdev;
1176         stat->atime = inode->i_atime;
1177         stat->mtime = inode->i_mtime;
1178         stat->ctime = inode->i_ctime;
1179         stat->blksize = UBIFS_BLOCK_SIZE;
1180         stat->size = ui->ui_size;
1181
1182         /*
1183          * Unfortunately, the 'stat()' system call was designed for block
1184          * device based file systems, and it is not appropriate for UBIFS,
1185          * because UBIFS does not have notion of "block". For example, it is
1186          * difficult to tell how many block a directory takes - it actually
1187          * takes less than 300 bytes, but we have to round it to block size,
1188          * which introduces large mistake. This makes utilities like 'du' to
1189          * report completely senseless numbers. This is the reason why UBIFS
1190          * goes the same way as JFFS2 - it reports zero blocks for everything
1191          * but regular files, which makes more sense than reporting completely
1192          * wrong sizes.
1193          */
1194         if (S_ISREG(inode->i_mode)) {
1195                 size = ui->xattr_size;
1196                 size += stat->size;
1197                 size = ALIGN(size, UBIFS_BLOCK_SIZE);
1198                 /*
1199                  * Note, user-space expects 512-byte blocks count irrespectively
1200                  * of what was reported in @stat->size.
1201                  */
1202                 stat->blocks = size >> 9;
1203         } else
1204                 stat->blocks = 0;
1205         mutex_unlock(&ui->ui_mutex);
1206         return 0;
1207 }
1208
1209 struct inode_operations ubifs_dir_inode_operations = {
1210         .lookup      = ubifs_lookup,
1211         .create      = ubifs_create,
1212         .link        = ubifs_link,
1213         .symlink     = ubifs_symlink,
1214         .unlink      = ubifs_unlink,
1215         .mkdir       = ubifs_mkdir,
1216         .rmdir       = ubifs_rmdir,
1217         .mknod       = ubifs_mknod,
1218         .rename      = ubifs_rename,
1219         .setattr     = ubifs_setattr,
1220         .getattr     = ubifs_getattr,
1221 #ifdef CONFIG_UBIFS_FS_XATTR
1222         .setxattr    = ubifs_setxattr,
1223         .getxattr    = ubifs_getxattr,
1224         .listxattr   = ubifs_listxattr,
1225         .removexattr = ubifs_removexattr,
1226 #endif
1227 };
1228
1229 struct file_operations ubifs_dir_operations = {
1230         .llseek         = ubifs_dir_llseek,
1231         .release        = ubifs_dir_release,
1232         .read           = generic_read_dir,
1233         .readdir        = ubifs_readdir,
1234         .fsync          = ubifs_fsync,
1235         .unlocked_ioctl = ubifs_ioctl,
1236 #ifdef CONFIG_COMPAT
1237         .compat_ioctl   = ubifs_compat_ioctl,
1238 #endif
1239 };