2  *   Copyright (C) International Business Machines Corp., 2000-2004
 
   4  *   This program is free software;  you can redistribute it and/or modify
 
   5  *   it under the terms of the GNU General Public License as published by
 
   6  *   the Free Software Foundation; either version 2 of the License, or
 
   7  *   (at your option) any later version.
 
   9  *   This program is distributed in the hope that it will be useful,
 
  10  *   but WITHOUT ANY WARRANTY;  without even the implied warranty of
 
  11  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See
 
  12  *   the GNU General Public License for more details.
 
  14  *   You should have received a copy of the GNU General Public License
 
  15  *   along with this program;  if not, write to the Free Software
 
  16  *   Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
 
  20  *      jfs_imap.c: inode allocation map manager
 
  23  *   Each AG has a simple lock which is used to control the serialization of
 
  24  *      the AG level lists.  This lock should be taken first whenever an AG
 
  25  *      level list will be modified or accessed.
 
  27  *   Each IAG is locked by obtaining the buffer for the IAG page.
 
  29  *   There is also a inode lock for the inode map inode.  A read lock needs to
 
  30  *      be taken whenever an IAG is read from the map or the global level
 
  31  *      information is read.  A write lock needs to be taken whenever the global
 
  32  *      level information is modified or an atomic operation needs to be used.
 
  34  *      If more than one IAG is read at one time, the read lock may not
 
  35  *      be given up until all of the IAG's are read.  Otherwise, a deadlock
 
  36  *      may occur when trying to obtain the read lock while another thread
 
  37  *      holding the read lock is waiting on the IAG already being held.
 
  39  *   The control page of the inode map is read into memory by diMount().
 
  40  *      Thereafter it should only be modified in memory and then it will be
 
  41  *      written out when the filesystem is unmounted by diUnmount().
 
  45 #include <linux/buffer_head.h>
 
  46 #include <linux/pagemap.h>
 
  47 #include <linux/quotaops.h>
 
  49 #include "jfs_incore.h"
 
  50 #include "jfs_inode.h"
 
  51 #include "jfs_filsys.h"
 
  52 #include "jfs_dinode.h"
 
  55 #include "jfs_metapage.h"
 
  56 #include "jfs_superblock.h"
 
  57 #include "jfs_debug.h"
 
  62 /* iag free list lock */
 
  63 #define IAGFREE_LOCK_INIT(imap)         mutex_init(&imap->im_freelock)
 
  64 #define IAGFREE_LOCK(imap)              mutex_lock(&imap->im_freelock)
 
  65 #define IAGFREE_UNLOCK(imap)            mutex_unlock(&imap->im_freelock)
 
  67 /* per ag iag list locks */
 
  68 #define AG_LOCK_INIT(imap,index)        mutex_init(&(imap->im_aglock[index]))
 
  69 #define AG_LOCK(imap,agno)              mutex_lock(&imap->im_aglock[agno])
 
  70 #define AG_UNLOCK(imap,agno)            mutex_unlock(&imap->im_aglock[agno])
 
  75 static int diAllocAG(struct inomap *, int, bool, struct inode *);
 
  76 static int diAllocAny(struct inomap *, int, bool, struct inode *);
 
  77 static int diAllocBit(struct inomap *, struct iag *, int);
 
  78 static int diAllocExt(struct inomap *, int, struct inode *);
 
  79 static int diAllocIno(struct inomap *, int, struct inode *);
 
  80 static int diFindFree(u32, int);
 
  81 static int diNewExt(struct inomap *, struct iag *, int);
 
  82 static int diNewIAG(struct inomap *, int *, int, struct metapage **);
 
  83 static void duplicateIXtree(struct super_block *, s64, int, s64 *);
 
  85 static int diIAGRead(struct inomap * imap, int, struct metapage **);
 
  86 static int copy_from_dinode(struct dinode *, struct inode *);
 
  87 static void copy_to_dinode(struct dinode *, struct inode *);
 
  92  * FUNCTION:    initialize the incore inode map control structures for
 
  93  *              a fileset or aggregate init time.
 
  95  *              the inode map's control structure (dinomap) is
 
  96  *              brought in from disk and placed in virtual memory.
 
  99  *      ipimap  - pointer to inode map inode for the aggregate or fileset.
 
 103  *      -ENOMEM - insufficient free virtual memory.
 
 106 int diMount(struct inode *ipimap)
 
 111         struct dinomap_disk *dinom_le;
 
 114          * allocate/initialize the in-memory inode map control structure
 
 116         /* allocate the in-memory inode map control structure. */
 
 117         imap = kmalloc(sizeof(struct inomap), GFP_KERNEL);
 
 119                 jfs_err("diMount: kmalloc returned NULL!");
 
 123         /* read the on-disk inode map control structure. */
 
 125         mp = read_metapage(ipimap,
 
 126                            IMAPBLKNO << JFS_SBI(ipimap->i_sb)->l2nbperpage,
 
 133         /* copy the on-disk version to the in-memory version. */
 
 134         dinom_le = (struct dinomap_disk *) mp->data;
 
 135         imap->im_freeiag = le32_to_cpu(dinom_le->in_freeiag);
 
 136         imap->im_nextiag = le32_to_cpu(dinom_le->in_nextiag);
 
 137         atomic_set(&imap->im_numinos, le32_to_cpu(dinom_le->in_numinos));
 
 138         atomic_set(&imap->im_numfree, le32_to_cpu(dinom_le->in_numfree));
 
 139         imap->im_nbperiext = le32_to_cpu(dinom_le->in_nbperiext);
 
 140         imap->im_l2nbperiext = le32_to_cpu(dinom_le->in_l2nbperiext);
 
 141         for (index = 0; index < MAXAG; index++) {
 
 142                 imap->im_agctl[index].inofree =
 
 143                     le32_to_cpu(dinom_le->in_agctl[index].inofree);
 
 144                 imap->im_agctl[index].extfree =
 
 145                     le32_to_cpu(dinom_le->in_agctl[index].extfree);
 
 146                 imap->im_agctl[index].numinos =
 
 147                     le32_to_cpu(dinom_le->in_agctl[index].numinos);
 
 148                 imap->im_agctl[index].numfree =
 
 149                     le32_to_cpu(dinom_le->in_agctl[index].numfree);
 
 152         /* release the buffer. */
 
 153         release_metapage(mp);
 
 156          * allocate/initialize inode allocation map locks
 
 158         /* allocate and init iag free list lock */
 
 159         IAGFREE_LOCK_INIT(imap);
 
 161         /* allocate and init ag list locks */
 
 162         for (index = 0; index < MAXAG; index++) {
 
 163                 AG_LOCK_INIT(imap, index);
 
 166         /* bind the inode map inode and inode map control structure
 
 169         imap->im_ipimap = ipimap;
 
 170         JFS_IP(ipimap)->i_imap = imap;
 
 179  * FUNCTION:    write to disk the incore inode map control structures for
 
 180  *              a fileset or aggregate at unmount time.
 
 183  *      ipimap  - pointer to inode map inode for the aggregate or fileset.
 
 187  *      -ENOMEM - insufficient free virtual memory.
 
 190 int diUnmount(struct inode *ipimap, int mounterror)
 
 192         struct inomap *imap = JFS_IP(ipimap)->i_imap;
 
 195          * update the on-disk inode map control structure
 
 198         if (!(mounterror || isReadOnly(ipimap)))
 
 202          * Invalidate the page cache buffers
 
 204         truncate_inode_pages(ipimap->i_mapping, 0);
 
 207          * free in-memory control structure
 
 218 int diSync(struct inode *ipimap)
 
 220         struct dinomap_disk *dinom_le;
 
 221         struct inomap *imp = JFS_IP(ipimap)->i_imap;
 
 226          * write imap global conrol page
 
 228         /* read the on-disk inode map control structure */
 
 229         mp = get_metapage(ipimap,
 
 230                           IMAPBLKNO << JFS_SBI(ipimap->i_sb)->l2nbperpage,
 
 233                 jfs_err("diSync: get_metapage failed!");
 
 237         /* copy the in-memory version to the on-disk version */
 
 238         dinom_le = (struct dinomap_disk *) mp->data;
 
 239         dinom_le->in_freeiag = cpu_to_le32(imp->im_freeiag);
 
 240         dinom_le->in_nextiag = cpu_to_le32(imp->im_nextiag);
 
 241         dinom_le->in_numinos = cpu_to_le32(atomic_read(&imp->im_numinos));
 
 242         dinom_le->in_numfree = cpu_to_le32(atomic_read(&imp->im_numfree));
 
 243         dinom_le->in_nbperiext = cpu_to_le32(imp->im_nbperiext);
 
 244         dinom_le->in_l2nbperiext = cpu_to_le32(imp->im_l2nbperiext);
 
 245         for (index = 0; index < MAXAG; index++) {
 
 246                 dinom_le->in_agctl[index].inofree =
 
 247                     cpu_to_le32(imp->im_agctl[index].inofree);
 
 248                 dinom_le->in_agctl[index].extfree =
 
 249                     cpu_to_le32(imp->im_agctl[index].extfree);
 
 250                 dinom_le->in_agctl[index].numinos =
 
 251                     cpu_to_le32(imp->im_agctl[index].numinos);
 
 252                 dinom_le->in_agctl[index].numfree =
 
 253                     cpu_to_le32(imp->im_agctl[index].numfree);
 
 256         /* write out the control structure */
 
 260          * write out dirty pages of imap
 
 262         filemap_write_and_wait(ipimap->i_mapping);
 
 264         diWriteSpecial(ipimap, 0);
 
 273  * FUNCTION:    initialize an incore inode from disk.
 
 275  *              on entry, the specifed incore inode should itself
 
 276  *              specify the disk inode number corresponding to the
 
 277  *              incore inode (i.e. i_number should be initialized).
 
 279  *              this routine handles incore inode initialization for
 
 280  *              both "special" and "regular" inodes.  special inodes
 
 281  *              are those required early in the mount process and
 
 282  *              require special handling since much of the file system
 
 283  *              is not yet initialized.  these "special" inodes are
 
 284  *              identified by a NULL inode map inode pointer and are
 
 285  *              actually initialized by a call to diReadSpecial().
 
 287  *              for regular inodes, the iag describing the disk inode
 
 288  *              is read from disk to determine the inode extent address
 
 289  *              for the disk inode.  with the inode extent address in
 
 290  *              hand, the page of the extent that contains the disk
 
 291  *              inode is read and the disk inode is copied to the
 
 295  *      ip      -  pointer to incore inode to be initialized from disk.
 
 300  *      -ENOMEM - insufficient memory
 
 303 int diRead(struct inode *ip)
 
 305         struct jfs_sb_info *sbi = JFS_SBI(ip->i_sb);
 
 306         int iagno, ino, extno, rc;
 
 307         struct inode *ipimap;
 
 315         unsigned long pageno;
 
 318         jfs_info("diRead: ino = %ld", ip->i_ino);
 
 320         ipimap = sbi->ipimap;
 
 321         JFS_IP(ip)->ipimap = ipimap;
 
 323         /* determine the iag number for this inode (number) */
 
 324         iagno = INOTOIAG(ip->i_ino);
 
 327         imap = JFS_IP(ipimap)->i_imap;
 
 328         IREAD_LOCK(ipimap, RDWRLOCK_IMAP);
 
 329         rc = diIAGRead(imap, iagno, &mp);
 
 330         IREAD_UNLOCK(ipimap);
 
 332                 jfs_err("diRead: diIAGRead returned %d", rc);
 
 336         iagp = (struct iag *) mp->data;
 
 338         /* determine inode extent that holds the disk inode */
 
 339         ino = ip->i_ino & (INOSPERIAG - 1);
 
 340         extno = ino >> L2INOSPEREXT;
 
 342         if ((lengthPXD(&iagp->inoext[extno]) != imap->im_nbperiext) ||
 
 343             (addressPXD(&iagp->inoext[extno]) == 0)) {
 
 344                 release_metapage(mp);
 
 348         /* get disk block number of the page within the inode extent
 
 349          * that holds the disk inode.
 
 351         blkno = INOPBLK(&iagp->inoext[extno], ino, sbi->l2nbperpage);
 
 353         /* get the ag for the iag */
 
 354         agstart = le64_to_cpu(iagp->agstart);
 
 356         release_metapage(mp);
 
 358         rel_inode = (ino & (INOSPERPAGE - 1));
 
 359         pageno = blkno >> sbi->l2nbperpage;
 
 361         if ((block_offset = ((u32) blkno & (sbi->nbperpage - 1)))) {
 
 363                  * OS/2 didn't always align inode extents on page boundaries
 
 366                      (sbi->nbperpage - block_offset) << sbi->l2niperblk;
 
 368                 if (rel_inode < inodes_left)
 
 369                         rel_inode += block_offset << sbi->l2niperblk;
 
 372                         rel_inode -= inodes_left;
 
 376         /* read the page of disk inode */
 
 377         mp = read_metapage(ipimap, pageno << sbi->l2nbperpage, PSIZE, 1);
 
 379                 jfs_err("diRead: read_metapage failed");
 
 383         /* locate the disk inode requested */
 
 384         dp = (struct dinode *) mp->data;
 
 387         if (ip->i_ino != le32_to_cpu(dp->di_number)) {
 
 388                 jfs_error(ip->i_sb, "diRead: i_ino != di_number");
 
 390         } else if (le32_to_cpu(dp->di_nlink) == 0)
 
 393                 /* copy the disk inode to the in-memory inode */
 
 394                 rc = copy_from_dinode(dp, ip);
 
 396         release_metapage(mp);
 
 398         /* set the ag for the inode */
 
 399         JFS_IP(ip)->agno = BLKTOAG(agstart, sbi);
 
 400         JFS_IP(ip)->active_ag = -1;
 
 407  * NAME:        diReadSpecial()
 
 409  * FUNCTION:    initialize a 'special' inode from disk.
 
 411  *              this routines handles aggregate level inodes.  The
 
 412  *              inode cache cannot differentiate between the
 
 413  *              aggregate inodes and the filesystem inodes, so we
 
 414  *              handle these here.  We don't actually use the aggregate
 
 415  *              inode map, since these inodes are at a fixed location
 
 416  *              and in some cases the aggregate inode map isn't initialized
 
 420  *      sb - filesystem superblock
 
 421  *      inum - aggregate inode number
 
 422  *      secondary - 1 if secondary aggregate inode table
 
 425  *      new inode       - success
 
 428 struct inode *diReadSpecial(struct super_block *sb, ino_t inum, int secondary)
 
 430         struct jfs_sb_info *sbi = JFS_SBI(sb);
 
 438                 jfs_err("diReadSpecial: new_inode returned NULL!");
 
 443                 address = addressPXD(&sbi->ait2) >> sbi->l2nbperpage;
 
 444                 JFS_IP(ip)->ipimap = sbi->ipaimap2;
 
 446                 address = AITBL_OFF >> L2PSIZE;
 
 447                 JFS_IP(ip)->ipimap = sbi->ipaimap;
 
 450         ASSERT(inum < INOSPEREXT);
 
 454         address += inum >> 3;   /* 8 inodes per 4K page */
 
 456         /* read the page of fixed disk inode (AIT) in raw mode */
 
 457         mp = read_metapage(ip, address << sbi->l2nbperpage, PSIZE, 1);
 
 459                 ip->i_nlink = 1;        /* Don't want iput() deleting it */
 
 464         /* get the pointer to the disk inode of interest */
 
 465         dp = (struct dinode *) (mp->data);
 
 466         dp += inum % 8;         /* 8 inodes per 4K page */
 
 468         /* copy on-disk inode to in-memory inode */
 
 469         if ((copy_from_dinode(dp, ip)) != 0) {
 
 470                 /* handle bad return by returning NULL for ip */
 
 471                 ip->i_nlink = 1;        /* Don't want iput() deleting it */
 
 473                 /* release the page */
 
 474                 release_metapage(mp);
 
 479         ip->i_mapping->a_ops = &jfs_metapage_aops;
 
 480         mapping_set_gfp_mask(ip->i_mapping, GFP_NOFS);
 
 482         /* Allocations to metadata inodes should not affect quotas */
 
 483         ip->i_flags |= S_NOQUOTA;
 
 485         if ((inum == FILESYSTEM_I) && (JFS_IP(ip)->ipimap == sbi->ipaimap)) {
 
 486                 sbi->gengen = le32_to_cpu(dp->di_gengen);
 
 487                 sbi->inostamp = le32_to_cpu(dp->di_inostamp);
 
 490         /* release the page */
 
 491         release_metapage(mp);
 
 494          * __mark_inode_dirty expects inodes to be hashed.  Since we don't
 
 495          * want special inodes in the fileset inode space, we make them
 
 496          * appear hashed, but do not put on any lists.  hlist_del()
 
 497          * will work fine and require no locking.
 
 499         ip->i_hash.pprev = &ip->i_hash.next;
 
 505  * NAME:        diWriteSpecial()
 
 507  * FUNCTION:    Write the special inode to disk
 
 511  *      secondary - 1 if secondary aggregate inode table
 
 513  * RETURN VALUES: none
 
 516 void diWriteSpecial(struct inode *ip, int secondary)
 
 518         struct jfs_sb_info *sbi = JFS_SBI(ip->i_sb);
 
 521         ino_t inum = ip->i_ino;
 
 525                 address = addressPXD(&sbi->ait2) >> sbi->l2nbperpage;
 
 527                 address = AITBL_OFF >> L2PSIZE;
 
 529         ASSERT(inum < INOSPEREXT);
 
 531         address += inum >> 3;   /* 8 inodes per 4K page */
 
 533         /* read the page of fixed disk inode (AIT) in raw mode */
 
 534         mp = read_metapage(ip, address << sbi->l2nbperpage, PSIZE, 1);
 
 536                 jfs_err("diWriteSpecial: failed to read aggregate inode "
 
 541         /* get the pointer to the disk inode of interest */
 
 542         dp = (struct dinode *) (mp->data);
 
 543         dp += inum % 8;         /* 8 inodes per 4K page */
 
 545         /* copy on-disk inode to in-memory inode */
 
 546         copy_to_dinode(dp, ip);
 
 547         memcpy(&dp->di_xtroot, &JFS_IP(ip)->i_xtroot, 288);
 
 549         if (inum == FILESYSTEM_I)
 
 550                 dp->di_gengen = cpu_to_le32(sbi->gengen);
 
 557  * NAME:        diFreeSpecial()
 
 559  * FUNCTION:    Free allocated space for special inode
 
 561 void diFreeSpecial(struct inode *ip)
 
 564                 jfs_err("diFreeSpecial called with NULL ip!");
 
 567         filemap_write_and_wait(ip->i_mapping);
 
 568         truncate_inode_pages(ip->i_mapping, 0);
 
 577  * FUNCTION:    write the on-disk inode portion of the in-memory inode
 
 578  *              to its corresponding on-disk inode.
 
 580  *              on entry, the specifed incore inode should itself
 
 581  *              specify the disk inode number corresponding to the
 
 582  *              incore inode (i.e. i_number should be initialized).
 
 584  *              the inode contains the inode extent address for the disk
 
 585  *              inode.  with the inode extent address in hand, the
 
 586  *              page of the extent that contains the disk inode is
 
 587  *              read and the disk inode portion of the incore inode
 
 588  *              is copied to the disk inode.
 
 591  *      tid -  transacation id
 
 592  *      ip  -  pointer to incore inode to be written to the inode extent.
 
 598 int diWrite(tid_t tid, struct inode *ip)
 
 600         struct jfs_sb_info *sbi = JFS_SBI(ip->i_sb);
 
 601         struct jfs_inode_info *jfs_ip = JFS_IP(ip);
 
 609         unsigned long pageno;
 
 612         struct inode *ipimap;
 
 615         struct tlock *ditlck, *tlck;
 
 616         struct linelock *dilinelock, *ilinelock;
 
 620         ipimap = jfs_ip->ipimap;
 
 622         ino = ip->i_ino & (INOSPERIAG - 1);
 
 624         if (!addressPXD(&(jfs_ip->ixpxd)) ||
 
 625             (lengthPXD(&(jfs_ip->ixpxd)) !=
 
 626              JFS_IP(ipimap)->i_imap->im_nbperiext)) {
 
 627                 jfs_error(ip->i_sb, "diWrite: ixpxd invalid");
 
 632          * read the page of disk inode containing the specified inode:
 
 634         /* compute the block address of the page */
 
 635         blkno = INOPBLK(&(jfs_ip->ixpxd), ino, sbi->l2nbperpage);
 
 637         rel_inode = (ino & (INOSPERPAGE - 1));
 
 638         pageno = blkno >> sbi->l2nbperpage;
 
 640         if ((block_offset = ((u32) blkno & (sbi->nbperpage - 1)))) {
 
 642                  * OS/2 didn't always align inode extents on page boundaries
 
 645                     (sbi->nbperpage - block_offset) << sbi->l2niperblk;
 
 647                 if (rel_inode < inodes_left)
 
 648                         rel_inode += block_offset << sbi->l2niperblk;
 
 651                         rel_inode -= inodes_left;
 
 654         /* read the page of disk inode */
 
 656         mp = read_metapage(ipimap, pageno << sbi->l2nbperpage, PSIZE, 1);
 
 660         /* get the pointer to the disk inode */
 
 661         dp = (struct dinode *) mp->data;
 
 664         dioffset = (ino & (INOSPERPAGE - 1)) << L2DISIZE;
 
 667          * acquire transaction lock on the on-disk inode;
 
 668          * N.B. tlock is acquired on ipimap not ip;
 
 671              txLock(tid, ipimap, mp, tlckINODE | tlckENTRY)) == NULL)
 
 673         dilinelock = (struct linelock *) & ditlck->lock;
 
 676          * copy btree root from in-memory inode to on-disk inode
 
 678          * (tlock is taken from inline B+-tree root in in-memory
 
 679          * inode when the B+-tree root is updated, which is pointed
 
 680          * by jfs_ip->blid as well as being on tx tlock list)
 
 682          * further processing of btree root is based on the copy
 
 683          * in in-memory inode, where txLog() will log from, and,
 
 684          * for xtree root, txUpdateMap() will update map and reset
 
 688         if (S_ISDIR(ip->i_mode) && (lid = jfs_ip->xtlid)) {
 
 690                  * This is the special xtree inside the directory for storing
 
 691                  * the directory table
 
 697                 tlck = lid_to_tlock(lid);
 
 698                 assert(tlck->type & tlckXTREE);
 
 699                 tlck->type |= tlckBTROOT;
 
 701                 ilinelock = (struct linelock *) & tlck->lock;
 
 704                  * copy xtree root from inode to dinode:
 
 706                 p = &jfs_ip->i_xtroot;
 
 707                 xp = (xtpage_t *) &dp->di_dirtable;
 
 709                 for (n = 0; n < ilinelock->index; n++, lv++) {
 
 710                         memcpy(&xp->xad[lv->offset], &p->xad[lv->offset],
 
 711                                lv->length << L2XTSLOTSIZE);
 
 714                 /* reset on-disk (metadata page) xtree XAD_NEW bit */
 
 715                 xad = &xp->xad[XTENTRYSTART];
 
 716                 for (n = XTENTRYSTART;
 
 717                      n < le16_to_cpu(xp->header.nextindex); n++, xad++)
 
 718                         if (xad->flag & (XAD_NEW | XAD_EXTENDED))
 
 719                                 xad->flag &= ~(XAD_NEW | XAD_EXTENDED);
 
 722         if ((lid = jfs_ip->blid) == 0)
 
 726         tlck = lid_to_tlock(lid);
 
 728         tlck->type |= tlckBTROOT;
 
 730         ilinelock = (struct linelock *) & tlck->lock;
 
 733          *      regular file: 16 byte (XAD slot) granularity
 
 735         if (type & tlckXTREE) {
 
 740                  * copy xtree root from inode to dinode:
 
 742                 p = &jfs_ip->i_xtroot;
 
 745                 for (n = 0; n < ilinelock->index; n++, lv++) {
 
 746                         memcpy(&xp->xad[lv->offset], &p->xad[lv->offset],
 
 747                                lv->length << L2XTSLOTSIZE);
 
 750                 /* reset on-disk (metadata page) xtree XAD_NEW bit */
 
 751                 xad = &xp->xad[XTENTRYSTART];
 
 752                 for (n = XTENTRYSTART;
 
 753                      n < le16_to_cpu(xp->header.nextindex); n++, xad++)
 
 754                         if (xad->flag & (XAD_NEW | XAD_EXTENDED))
 
 755                                 xad->flag &= ~(XAD_NEW | XAD_EXTENDED);
 
 758          *      directory: 32 byte (directory entry slot) granularity
 
 760         else if (type & tlckDTREE) {
 
 764                  * copy dtree root from inode to dinode:
 
 766                 p = (dtpage_t *) &jfs_ip->i_dtroot;
 
 767                 xp = (dtpage_t *) & dp->di_dtroot;
 
 769                 for (n = 0; n < ilinelock->index; n++, lv++) {
 
 770                         memcpy(&xp->slot[lv->offset], &p->slot[lv->offset],
 
 771                                lv->length << L2DTSLOTSIZE);
 
 774                 jfs_err("diWrite: UFO tlock");
 
 779          * copy inline symlink from in-memory inode to on-disk inode
 
 781         if (S_ISLNK(ip->i_mode) && ip->i_size < IDATASIZE) {
 
 782                 lv = & dilinelock->lv[dilinelock->index];
 
 783                 lv->offset = (dioffset + 2 * 128) >> L2INODESLOTSIZE;
 
 785                 memcpy(&dp->di_fastsymlink, jfs_ip->i_inline, IDATASIZE);
 
 789          * copy inline data from in-memory inode to on-disk inode:
 
 790          * 128 byte slot granularity
 
 792         if (test_cflag(COMMIT_Inlineea, ip)) {
 
 793                 lv = & dilinelock->lv[dilinelock->index];
 
 794                 lv->offset = (dioffset + 3 * 128) >> L2INODESLOTSIZE;
 
 796                 memcpy(&dp->di_inlineea, jfs_ip->i_inline_ea, INODESLOTSIZE);
 
 799                 clear_cflag(COMMIT_Inlineea, ip);
 
 803          *      lock/copy inode base: 128 byte slot granularity
 
 805         lv = & dilinelock->lv[dilinelock->index];
 
 806         lv->offset = dioffset >> L2INODESLOTSIZE;
 
 807         copy_to_dinode(dp, ip);
 
 808         if (test_and_clear_cflag(COMMIT_Dirtable, ip)) {
 
 810                 memcpy(&dp->di_dirtable, &jfs_ip->i_dirtable, 96);
 
 815         /* release the buffer holding the updated on-disk inode.
 
 816          * the buffer will be later written by commit processing.
 
 827  * FUNCTION:    free a specified inode from the inode working map
 
 828  *              for a fileset or aggregate.
 
 830  *              if the inode to be freed represents the first (only)
 
 831  *              free inode within the iag, the iag will be placed on
 
 832  *              the ag free inode list.
 
 834  *              freeing the inode will cause the inode extent to be
 
 835  *              freed if the inode is the only allocated inode within
 
 836  *              the extent.  in this case all the disk resource backing
 
 837  *              up the inode extent will be freed. in addition, the iag
 
 838  *              will be placed on the ag extent free list if the extent
 
 839  *              is the first free extent in the iag.  if freeing the
 
 840  *              extent also means that no free inodes will exist for
 
 841  *              the iag, the iag will also be removed from the ag free
 
 844  *              the iag describing the inode will be freed if the extent
 
 845  *              is to be freed and it is the only backed extent within
 
 846  *              the iag.  in this case, the iag will be removed from the
 
 847  *              ag free extent list and ag free inode list and placed on
 
 848  *              the inode map's free iag list.
 
 850  *              a careful update approach is used to provide consistency
 
 851  *              in the face of updates to multiple buffers.  under this
 
 852  *              approach, all required buffers are obtained before making
 
 853  *              any updates and are held until all updates are complete.
 
 856  *      ip      - inode to be freed.
 
 862 int diFree(struct inode *ip)
 
 865         ino_t inum = ip->i_ino;
 
 866         struct iag *iagp, *aiagp, *biagp, *ciagp, *diagp;
 
 867         struct metapage *mp, *amp, *bmp, *cmp, *dmp;
 
 868         int iagno, ino, extno, bitno, sword, agno;
 
 871         struct inode *ipimap = JFS_SBI(ip->i_sb)->ipimap;
 
 872         struct inomap *imap = JFS_IP(ipimap)->i_imap;
 
 875         struct inode *iplist[3];
 
 877         struct pxd_lock *pxdlock;
 
 880          * This is just to suppress compiler warnings.  The same logic that
 
 881          * references these variables is used to initialize them.
 
 883         aiagp = biagp = ciagp = diagp = NULL;
 
 885         /* get the iag number containing the inode.
 
 887         iagno = INOTOIAG(inum);
 
 889         /* make sure that the iag is contained within
 
 892         if (iagno >= imap->im_nextiag) {
 
 893                 print_hex_dump(KERN_ERR, "imap: ", DUMP_PREFIX_ADDRESS, 16, 4,
 
 896                           "diFree: inum = %d, iagno = %d, nextiag = %d",
 
 897                           (uint) inum, iagno, imap->im_nextiag);
 
 901         /* get the allocation group for this ino.
 
 903         agno = JFS_IP(ip)->agno;
 
 905         /* Lock the AG specific inode map information
 
 909         /* Obtain read lock in imap inode.  Don't release it until we have
 
 910          * read all of the IAG's that we are going to.
 
 912         IREAD_LOCK(ipimap, RDWRLOCK_IMAP);
 
 916         if ((rc = diIAGRead(imap, iagno, &mp))) {
 
 917                 IREAD_UNLOCK(ipimap);
 
 918                 AG_UNLOCK(imap, agno);
 
 921         iagp = (struct iag *) mp->data;
 
 923         /* get the inode number and extent number of the inode within
 
 924          * the iag and the inode number within the extent.
 
 926         ino = inum & (INOSPERIAG - 1);
 
 927         extno = ino >> L2INOSPEREXT;
 
 928         bitno = ino & (INOSPEREXT - 1);
 
 929         mask = HIGHORDER >> bitno;
 
 931         if (!(le32_to_cpu(iagp->wmap[extno]) & mask)) {
 
 933                           "diFree: wmap shows inode already free");
 
 936         if (!addressPXD(&iagp->inoext[extno])) {
 
 937                 release_metapage(mp);
 
 938                 IREAD_UNLOCK(ipimap);
 
 939                 AG_UNLOCK(imap, agno);
 
 940                 jfs_error(ip->i_sb, "diFree: invalid inoext");
 
 944         /* compute the bitmap for the extent reflecting the freed inode.
 
 946         bitmap = le32_to_cpu(iagp->wmap[extno]) & ~mask;
 
 948         if (imap->im_agctl[agno].numfree > imap->im_agctl[agno].numinos) {
 
 949                 release_metapage(mp);
 
 950                 IREAD_UNLOCK(ipimap);
 
 951                 AG_UNLOCK(imap, agno);
 
 952                 jfs_error(ip->i_sb, "diFree: numfree > numinos");
 
 956          *      inode extent still has some inodes or below low water mark:
 
 957          *      keep the inode extent;
 
 960             imap->im_agctl[agno].numfree < 96 ||
 
 961             (imap->im_agctl[agno].numfree < 288 &&
 
 962              (((imap->im_agctl[agno].numfree * 100) /
 
 963                imap->im_agctl[agno].numinos) <= 25))) {
 
 964                 /* if the iag currently has no free inodes (i.e.,
 
 965                  * the inode being freed is the first free inode of iag),
 
 966                  * insert the iag at head of the inode free list for the ag.
 
 968                 if (iagp->nfreeinos == 0) {
 
 969                         /* check if there are any iags on the ag inode
 
 970                          * free list.  if so, read the first one so that
 
 971                          * we can link the current iag onto the list at
 
 974                         if ((fwd = imap->im_agctl[agno].inofree) >= 0) {
 
 975                                 /* read the iag that currently is the head
 
 978                                 if ((rc = diIAGRead(imap, fwd, &))) {
 
 979                                         IREAD_UNLOCK(ipimap);
 
 980                                         AG_UNLOCK(imap, agno);
 
 981                                         release_metapage(mp);
 
 984                                 aiagp = (struct iag *) amp->data;
 
 986                                 /* make current head point back to the iag.
 
 988                                 aiagp->inofreeback = cpu_to_le32(iagno);
 
 993                         /* iag points forward to current head and iag
 
 994                          * becomes the new head of the list.
 
 997                             cpu_to_le32(imap->im_agctl[agno].inofree);
 
 998                         iagp->inofreeback = cpu_to_le32(-1);
 
 999                         imap->im_agctl[agno].inofree = iagno;
 
1001                 IREAD_UNLOCK(ipimap);
 
1003                 /* update the free inode summary map for the extent if
 
1004                  * freeing the inode means the extent will now have free
 
1005                  * inodes (i.e., the inode being freed is the first free
 
1008                 if (iagp->wmap[extno] == cpu_to_le32(ONES)) {
 
1009                         sword = extno >> L2EXTSPERSUM;
 
1010                         bitno = extno & (EXTSPERSUM - 1);
 
1011                         iagp->inosmap[sword] &=
 
1012                             cpu_to_le32(~(HIGHORDER >> bitno));
 
1015                 /* update the bitmap.
 
1017                 iagp->wmap[extno] = cpu_to_le32(bitmap);
 
1019                 /* update the free inode counts at the iag, ag and
 
1022                 le32_add_cpu(&iagp->nfreeinos, 1);
 
1023                 imap->im_agctl[agno].numfree += 1;
 
1024                 atomic_inc(&imap->im_numfree);
 
1026                 /* release the AG inode map lock
 
1028                 AG_UNLOCK(imap, agno);
 
1038          *      inode extent has become free and above low water mark:
 
1039          *      free the inode extent;
 
1043          *      prepare to update iag list(s) (careful update step 1)
 
1045         amp = bmp = cmp = dmp = NULL;
 
1048         /* check if the iag currently has no free extents.  if so,
 
1049          * it will be placed on the head of the ag extent free list.
 
1051         if (iagp->nfreeexts == 0) {
 
1052                 /* check if the ag extent free list has any iags.
 
1053                  * if so, read the iag at the head of the list now.
 
1054                  * this (head) iag will be updated later to reflect
 
1055                  * the addition of the current iag at the head of
 
1058                 if ((fwd = imap->im_agctl[agno].extfree) >= 0) {
 
1059                         if ((rc = diIAGRead(imap, fwd, &)))
 
1061                         aiagp = (struct iag *) amp->data;
 
1064                 /* iag has free extents. check if the addition of a free
 
1065                  * extent will cause all extents to be free within this
 
1066                  * iag.  if so, the iag will be removed from the ag extent
 
1067                  * free list and placed on the inode map's free iag list.
 
1069                 if (iagp->nfreeexts == cpu_to_le32(EXTSPERIAG - 1)) {
 
1070                         /* in preparation for removing the iag from the
 
1071                          * ag extent free list, read the iags preceeding
 
1072                          * and following the iag on the ag extent free
 
1075                         if ((fwd = le32_to_cpu(iagp->extfreefwd)) >= 0) {
 
1076                                 if ((rc = diIAGRead(imap, fwd, &)))
 
1078                                 aiagp = (struct iag *) amp->data;
 
1081                         if ((back = le32_to_cpu(iagp->extfreeback)) >= 0) {
 
1082                                 if ((rc = diIAGRead(imap, back, &bmp)))
 
1084                                 biagp = (struct iag *) bmp->data;
 
1089         /* remove the iag from the ag inode free list if freeing
 
1090          * this extent cause the iag to have no free inodes.
 
1092         if (iagp->nfreeinos == cpu_to_le32(INOSPEREXT - 1)) {
 
1093                 int inofreeback = le32_to_cpu(iagp->inofreeback);
 
1094                 int inofreefwd = le32_to_cpu(iagp->inofreefwd);
 
1096                 /* in preparation for removing the iag from the
 
1097                  * ag inode free list, read the iags preceeding
 
1098                  * and following the iag on the ag inode free
 
1099                  * list.  before reading these iags, we must make
 
1100                  * sure that we already don't have them in hand
 
1101                  * from up above, since re-reading an iag (buffer)
 
1102                  * we are currently holding would cause a deadlock.
 
1104                 if (inofreefwd >= 0) {
 
1106                         if (inofreefwd == fwd)
 
1107                                 ciagp = (struct iag *) amp->data;
 
1108                         else if (inofreefwd == back)
 
1109                                 ciagp = (struct iag *) bmp->data;
 
1112                                      diIAGRead(imap, inofreefwd, &cmp)))
 
1114                                 ciagp = (struct iag *) cmp->data;
 
1116                         assert(ciagp != NULL);
 
1119                 if (inofreeback >= 0) {
 
1120                         if (inofreeback == fwd)
 
1121                                 diagp = (struct iag *) amp->data;
 
1122                         else if (inofreeback == back)
 
1123                                 diagp = (struct iag *) bmp->data;
 
1126                                      diIAGRead(imap, inofreeback, &dmp)))
 
1128                                 diagp = (struct iag *) dmp->data;
 
1130                         assert(diagp != NULL);
 
1134         IREAD_UNLOCK(ipimap);
 
1137          * invalidate any page of the inode extent freed from buffer cache;
 
1139         freepxd = iagp->inoext[extno];
 
1140         invalidate_pxd_metapages(ip, freepxd);
 
1143          *      update iag list(s) (careful update step 2)
 
1145         /* add the iag to the ag extent free list if this is the
 
1146          * first free extent for the iag.
 
1148         if (iagp->nfreeexts == 0) {
 
1150                         aiagp->extfreeback = cpu_to_le32(iagno);
 
1153                     cpu_to_le32(imap->im_agctl[agno].extfree);
 
1154                 iagp->extfreeback = cpu_to_le32(-1);
 
1155                 imap->im_agctl[agno].extfree = iagno;
 
1157                 /* remove the iag from the ag extent list if all extents
 
1158                  * are now free and place it on the inode map iag free list.
 
1160                 if (iagp->nfreeexts == cpu_to_le32(EXTSPERIAG - 1)) {
 
1162                                 aiagp->extfreeback = iagp->extfreeback;
 
1165                                 biagp->extfreefwd = iagp->extfreefwd;
 
1167                                 imap->im_agctl[agno].extfree =
 
1168                                     le32_to_cpu(iagp->extfreefwd);
 
1170                         iagp->extfreefwd = iagp->extfreeback = cpu_to_le32(-1);
 
1173                         iagp->iagfree = cpu_to_le32(imap->im_freeiag);
 
1174                         imap->im_freeiag = iagno;
 
1175                         IAGFREE_UNLOCK(imap);
 
1179         /* remove the iag from the ag inode free list if freeing
 
1180          * this extent causes the iag to have no free inodes.
 
1182         if (iagp->nfreeinos == cpu_to_le32(INOSPEREXT - 1)) {
 
1183                 if ((int) le32_to_cpu(iagp->inofreefwd) >= 0)
 
1184                         ciagp->inofreeback = iagp->inofreeback;
 
1186                 if ((int) le32_to_cpu(iagp->inofreeback) >= 0)
 
1187                         diagp->inofreefwd = iagp->inofreefwd;
 
1189                         imap->im_agctl[agno].inofree =
 
1190                             le32_to_cpu(iagp->inofreefwd);
 
1192                 iagp->inofreefwd = iagp->inofreeback = cpu_to_le32(-1);
 
1195         /* update the inode extent address and working map
 
1196          * to reflect the free extent.
 
1197          * the permanent map should have been updated already
 
1198          * for the inode being freed.
 
1200         if (iagp->pmap[extno] != 0) {
 
1201                 jfs_error(ip->i_sb, "diFree: the pmap does not show inode free");
 
1203         iagp->wmap[extno] = 0;
 
1204         PXDlength(&iagp->inoext[extno], 0);
 
1205         PXDaddress(&iagp->inoext[extno], 0);
 
1207         /* update the free extent and free inode summary maps
 
1208          * to reflect the freed extent.
 
1209          * the inode summary map is marked to indicate no inodes
 
1210          * available for the freed extent.
 
1212         sword = extno >> L2EXTSPERSUM;
 
1213         bitno = extno & (EXTSPERSUM - 1);
 
1214         mask = HIGHORDER >> bitno;
 
1215         iagp->inosmap[sword] |= cpu_to_le32(mask);
 
1216         iagp->extsmap[sword] &= cpu_to_le32(~mask);
 
1218         /* update the number of free inodes and number of free extents
 
1221         le32_add_cpu(&iagp->nfreeinos, -(INOSPEREXT - 1));
 
1222         le32_add_cpu(&iagp->nfreeexts, 1);
 
1224         /* update the number of free inodes and backed inodes
 
1225          * at the ag and inode map level.
 
1227         imap->im_agctl[agno].numfree -= (INOSPEREXT - 1);
 
1228         imap->im_agctl[agno].numinos -= INOSPEREXT;
 
1229         atomic_sub(INOSPEREXT - 1, &imap->im_numfree);
 
1230         atomic_sub(INOSPEREXT, &imap->im_numinos);
 
1233                 write_metapage(amp);
 
1235                 write_metapage(bmp);
 
1237                 write_metapage(cmp);
 
1239                 write_metapage(dmp);
 
1242          * start transaction to update block allocation map
 
1243          * for the inode extent freed;
 
1245          * N.B. AG_LOCK is released and iag will be released below, and
 
1246          * other thread may allocate inode from/reusing the ixad freed
 
1247          * BUT with new/different backing inode extent from the extent
 
1248          * to be freed by the transaction;
 
1250         tid = txBegin(ipimap->i_sb, COMMIT_FORCE);
 
1251         mutex_lock(&JFS_IP(ipimap)->commit_mutex);
 
1253         /* acquire tlock of the iag page of the freed ixad
 
1254          * to force the page NOHOMEOK (even though no data is
 
1255          * logged from the iag page) until NOREDOPAGE|FREEXTENT log
 
1256          * for the free of the extent is committed;
 
1257          * write FREEXTENT|NOREDOPAGE log record
 
1258          * N.B. linelock is overlaid as freed extent descriptor;
 
1260         tlck = txLock(tid, ipimap, mp, tlckINODE | tlckFREE);
 
1261         pxdlock = (struct pxd_lock *) & tlck->lock;
 
1262         pxdlock->flag = mlckFREEPXD;
 
1263         pxdlock->pxd = freepxd;
 
1271          * logredo needs the IAG number and IAG extent index in order
 
1272          * to ensure that the IMap is consistent.  The least disruptive
 
1273          * way to pass these values through  to the transaction manager
 
1274          * is in the iplist array.
 
1276          * It's not pretty, but it works.
 
1278         iplist[1] = (struct inode *) (size_t)iagno;
 
1279         iplist[2] = (struct inode *) (size_t)extno;
 
1281         rc = txCommit(tid, 1, &iplist[0], COMMIT_FORCE);
 
1284         mutex_unlock(&JFS_IP(ipimap)->commit_mutex);
 
1286         /* unlock the AG inode map information */
 
1287         AG_UNLOCK(imap, agno);
 
1292         IREAD_UNLOCK(ipimap);
 
1295                 release_metapage(amp);
 
1297                 release_metapage(bmp);
 
1299                 release_metapage(cmp);
 
1301                 release_metapage(dmp);
 
1303         AG_UNLOCK(imap, agno);
 
1305         release_metapage(mp);
 
1311  * There are several places in the diAlloc* routines where we initialize
 
1315 diInitInode(struct inode *ip, int iagno, int ino, int extno, struct iag * iagp)
 
1317         struct jfs_sb_info *sbi = JFS_SBI(ip->i_sb);
 
1318         struct jfs_inode_info *jfs_ip = JFS_IP(ip);
 
1320         ip->i_ino = (iagno << L2INOSPERIAG) + ino;
 
1321         jfs_ip->ixpxd = iagp->inoext[extno];
 
1322         jfs_ip->agno = BLKTOAG(le64_to_cpu(iagp->agstart), sbi);
 
1323         jfs_ip->active_ag = -1;
 
1328  * NAME:        diAlloc(pip,dir,ip)
 
1330  * FUNCTION:    allocate a disk inode from the inode working map
 
1331  *              for a fileset or aggregate.
 
1334  *      pip     - pointer to incore inode for the parent inode.
 
1335  *      dir     - 'true' if the new disk inode is for a directory.
 
1336  *      ip      - pointer to a new inode
 
1340  *      -ENOSPC - insufficient disk resources.
 
1343 int diAlloc(struct inode *pip, bool dir, struct inode *ip)
 
1345         int rc, ino, iagno, addext, extno, bitno, sword;
 
1346         int nwords, rem, i, agno;
 
1347         u32 mask, inosmap, extsmap;
 
1348         struct inode *ipimap;
 
1349         struct metapage *mp;
 
1352         struct inomap *imap;
 
1354         /* get the pointers to the inode map inode and the
 
1355          * corresponding imap control structure.
 
1357         ipimap = JFS_SBI(pip->i_sb)->ipimap;
 
1358         imap = JFS_IP(ipimap)->i_imap;
 
1359         JFS_IP(ip)->ipimap = ipimap;
 
1360         JFS_IP(ip)->fileset = FILESYSTEM_I;
 
1362         /* for a directory, the allocation policy is to start
 
1363          * at the ag level using the preferred ag.
 
1366                 agno = dbNextAG(JFS_SBI(pip->i_sb)->ipbmap);
 
1367                 AG_LOCK(imap, agno);
 
1371         /* for files, the policy starts off by trying to allocate from
 
1372          * the same iag containing the parent disk inode:
 
1373          * try to allocate the new disk inode close to the parent disk
 
1374          * inode, using parent disk inode number + 1 as the allocation
 
1375          * hint.  (we use a left-to-right policy to attempt to avoid
 
1376          * moving backward on the disk.)  compute the hint within the
 
1377          * file system and the iag.
 
1380         /* get the ag number of this iag */
 
1381         agno = JFS_IP(pip)->agno;
 
1383         if (atomic_read(&JFS_SBI(pip->i_sb)->bmap->db_active[agno])) {
 
1385                  * There is an open file actively growing.  We want to
 
1386                  * allocate new inodes from a different ag to avoid
 
1387                  * fragmentation problems.
 
1389                 agno = dbNextAG(JFS_SBI(pip->i_sb)->ipbmap);
 
1390                 AG_LOCK(imap, agno);
 
1394         inum = pip->i_ino + 1;
 
1395         ino = inum & (INOSPERIAG - 1);
 
1397         /* back off the hint if it is outside of the iag */
 
1401         /* lock the AG inode map information */
 
1402         AG_LOCK(imap, agno);
 
1404         /* Get read lock on imap inode */
 
1405         IREAD_LOCK(ipimap, RDWRLOCK_IMAP);
 
1407         /* get the iag number and read the iag */
 
1408         iagno = INOTOIAG(inum);
 
1409         if ((rc = diIAGRead(imap, iagno, &mp))) {
 
1410                 IREAD_UNLOCK(ipimap);
 
1411                 AG_UNLOCK(imap, agno);
 
1414         iagp = (struct iag *) mp->data;
 
1416         /* determine if new inode extent is allowed to be added to the iag.
 
1417          * new inode extent can be added to the iag if the ag
 
1418          * has less than 32 free disk inodes and the iag has free extents.
 
1420         addext = (imap->im_agctl[agno].numfree < 32 && iagp->nfreeexts);
 
1423          *      try to allocate from the IAG
 
1425         /* check if the inode may be allocated from the iag
 
1426          * (i.e. the inode has free inodes or new extent can be added).
 
1428         if (iagp->nfreeinos || addext) {
 
1429                 /* determine the extent number of the hint.
 
1431                 extno = ino >> L2INOSPEREXT;
 
1433                 /* check if the extent containing the hint has backed
 
1434                  * inodes.  if so, try to allocate within this extent.
 
1436                 if (addressPXD(&iagp->inoext[extno])) {
 
1437                         bitno = ino & (INOSPEREXT - 1);
 
1439                              diFindFree(le32_to_cpu(iagp->wmap[extno]),
 
1442                                 ino = (extno << L2INOSPEREXT) + bitno;
 
1444                                 /* a free inode (bit) was found within this
 
1445                                  * extent, so allocate it.
 
1447                                 rc = diAllocBit(imap, iagp, ino);
 
1448                                 IREAD_UNLOCK(ipimap);
 
1452                                         /* set the results of the allocation
 
1453                                          * and write the iag.
 
1455                                         diInitInode(ip, iagno, ino, extno,
 
1457                                         mark_metapage_dirty(mp);
 
1459                                 release_metapage(mp);
 
1461                                 /* free the AG lock and return.
 
1463                                 AG_UNLOCK(imap, agno);
 
1470                                      EXTSPERIAG - 1) ? 0 : extno + 1;
 
1474                  * no free inodes within the extent containing the hint.
 
1476                  * try to allocate from the backed extents following
 
1477                  * hint or, if appropriate (i.e. addext is true), allocate
 
1478                  * an extent of free inodes at or following the extent
 
1479                  * containing the hint.
 
1481                  * the free inode and free extent summary maps are used
 
1482                  * here, so determine the starting summary map position
 
1483                  * and the number of words we'll have to examine.  again,
 
1484                  * the approach is to allocate following the hint, so we
 
1485                  * might have to initially ignore prior bits of the summary
 
1486                  * map that represent extents prior to the extent containing
 
1487                  * the hint and later revisit these bits.
 
1489                 bitno = extno & (EXTSPERSUM - 1);
 
1490                 nwords = (bitno == 0) ? SMAPSZ : SMAPSZ + 1;
 
1491                 sword = extno >> L2EXTSPERSUM;
 
1493                 /* mask any prior bits for the starting words of the
 
1496                 mask = ONES << (EXTSPERSUM - bitno);
 
1497                 inosmap = le32_to_cpu(iagp->inosmap[sword]) | mask;
 
1498                 extsmap = le32_to_cpu(iagp->extsmap[sword]) | mask;
 
1500                 /* scan the free inode and free extent summary maps for
 
1503                 for (i = 0; i < nwords; i++) {
 
1504                         /* check if this word of the free inode summary
 
1505                          * map describes an extent with free inodes.
 
1508                                 /* an extent with free inodes has been
 
1509                                  * found. determine the extent number
 
1510                                  * and the inode number within the extent.
 
1512                                 rem = diFindFree(inosmap, 0);
 
1513                                 extno = (sword << L2EXTSPERSUM) + rem;
 
1514                                 rem = diFindFree(le32_to_cpu(iagp->wmap[extno]),
 
1516                                 if (rem >= INOSPEREXT) {
 
1517                                         IREAD_UNLOCK(ipimap);
 
1518                                         release_metapage(mp);
 
1519                                         AG_UNLOCK(imap, agno);
 
1521                                                   "diAlloc: can't find free bit "
 
1526                                 /* determine the inode number within the
 
1527                                  * iag and allocate the inode from the
 
1530                                 ino = (extno << L2INOSPEREXT) + rem;
 
1531                                 rc = diAllocBit(imap, iagp, ino);
 
1532                                 IREAD_UNLOCK(ipimap);
 
1536                                         /* set the results of the allocation
 
1537                                          * and write the iag.
 
1539                                         diInitInode(ip, iagno, ino, extno,
 
1541                                         mark_metapage_dirty(mp);
 
1543                                 release_metapage(mp);
 
1545                                 /* free the AG lock and return.
 
1547                                 AG_UNLOCK(imap, agno);
 
1552                         /* check if we may allocate an extent of free
 
1553                          * inodes and whether this word of the free
 
1554                          * extents summary map describes a free extent.
 
1556                         if (addext && ~extsmap) {
 
1557                                 /* a free extent has been found.  determine
 
1558                                  * the extent number.
 
1560                                 rem = diFindFree(extsmap, 0);
 
1561                                 extno = (sword << L2EXTSPERSUM) + rem;
 
1563                                 /* allocate an extent of free inodes.
 
1565                                 if ((rc = diNewExt(imap, iagp, extno))) {
 
1566                                         /* if there is no disk space for a
 
1567                                          * new extent, try to allocate the
 
1568                                          * disk inode from somewhere else.
 
1575                                         /* set the results of the allocation
 
1576                                          * and write the iag.
 
1578                                         diInitInode(ip, iagno,
 
1579                                                     extno << L2INOSPEREXT,
 
1581                                         mark_metapage_dirty(mp);
 
1583                                 release_metapage(mp);
 
1584                                 /* free the imap inode & the AG lock & return.
 
1586                                 IREAD_UNLOCK(ipimap);
 
1587                                 AG_UNLOCK(imap, agno);
 
1591                         /* move on to the next set of summary map words.
 
1593                         sword = (sword == SMAPSZ - 1) ? 0 : sword + 1;
 
1594                         inosmap = le32_to_cpu(iagp->inosmap[sword]);
 
1595                         extsmap = le32_to_cpu(iagp->extsmap[sword]);
 
1598         /* unlock imap inode */
 
1599         IREAD_UNLOCK(ipimap);
 
1601         /* nothing doing in this iag, so release it. */
 
1602         release_metapage(mp);
 
1606          * try to allocate anywhere within the same AG as the parent inode.
 
1608         rc = diAllocAG(imap, agno, dir, ip);
 
1610         AG_UNLOCK(imap, agno);
 
1616          * try to allocate in any AG.
 
1618         return (diAllocAny(imap, agno, dir, ip));
 
1623  * NAME:        diAllocAG(imap,agno,dir,ip)
 
1625  * FUNCTION:    allocate a disk inode from the allocation group.
 
1627  *              this routine first determines if a new extent of free
 
1628  *              inodes should be added for the allocation group, with
 
1629  *              the current request satisfied from this extent. if this
 
1630  *              is the case, an attempt will be made to do just that.  if
 
1631  *              this attempt fails or it has been determined that a new
 
1632  *              extent should not be added, an attempt is made to satisfy
 
1633  *              the request by allocating an existing (backed) free inode
 
1634  *              from the allocation group.
 
1636  * PRE CONDITION: Already have the AG lock for this AG.
 
1639  *      imap    - pointer to inode map control structure.
 
1640  *      agno    - allocation group to allocate from.
 
1641  *      dir     - 'true' if the new disk inode is for a directory.
 
1642  *      ip      - pointer to the new inode to be filled in on successful return
 
1643  *                with the disk inode number allocated, its extent address
 
1644  *                and the start of the ag.
 
1648  *      -ENOSPC - insufficient disk resources.
 
1652 diAllocAG(struct inomap * imap, int agno, bool dir, struct inode *ip)
 
1654         int rc, addext, numfree, numinos;
 
1656         /* get the number of free and the number of backed disk
 
1657          * inodes currently within the ag.
 
1659         numfree = imap->im_agctl[agno].numfree;
 
1660         numinos = imap->im_agctl[agno].numinos;
 
1662         if (numfree > numinos) {
 
1663                 jfs_error(ip->i_sb, "diAllocAG: numfree > numinos");
 
1667         /* determine if we should allocate a new extent of free inodes
 
1668          * within the ag: for directory inodes, add a new extent
 
1669          * if there are a small number of free inodes or number of free
 
1670          * inodes is a small percentage of the number of backed inodes.
 
1673                 addext = (numfree < 64 ||
 
1675                            && ((numfree * 100) / numinos) <= 20));
 
1677                 addext = (numfree == 0);
 
1680          * try to allocate a new extent of free inodes.
 
1683                 /* if free space is not avaliable for this new extent, try
 
1684                  * below to allocate a free and existing (already backed)
 
1685                  * inode from the ag.
 
1687                 if ((rc = diAllocExt(imap, agno, ip)) != -ENOSPC)
 
1692          * try to allocate an existing free inode from the ag.
 
1694         return (diAllocIno(imap, agno, ip));
 
1699  * NAME:        diAllocAny(imap,agno,dir,iap)
 
1701  * FUNCTION:    allocate a disk inode from any other allocation group.
 
1703  *              this routine is called when an allocation attempt within
 
1704  *              the primary allocation group has failed. if attempts to
 
1705  *              allocate an inode from any allocation group other than the
 
1706  *              specified primary group.
 
1709  *      imap    - pointer to inode map control structure.
 
1710  *      agno    - primary allocation group (to avoid).
 
1711  *      dir     - 'true' if the new disk inode is for a directory.
 
1712  *      ip      - pointer to a new inode to be filled in on successful return
 
1713  *                with the disk inode number allocated, its extent address
 
1714  *                and the start of the ag.
 
1718  *      -ENOSPC - insufficient disk resources.
 
1722 diAllocAny(struct inomap * imap, int agno, bool dir, struct inode *ip)
 
1725         int maxag = JFS_SBI(imap->im_ipimap->i_sb)->bmap->db_maxag;
 
1728         /* try to allocate from the ags following agno up to
 
1729          * the maximum ag number.
 
1731         for (ag = agno + 1; ag <= maxag; ag++) {
 
1734                 rc = diAllocAG(imap, ag, dir, ip);
 
1736                 AG_UNLOCK(imap, ag);
 
1742         /* try to allocate from the ags in front of agno.
 
1744         for (ag = 0; ag < agno; ag++) {
 
1747                 rc = diAllocAG(imap, ag, dir, ip);
 
1749                 AG_UNLOCK(imap, ag);
 
1755         /* no free disk inodes.
 
1762  * NAME:        diAllocIno(imap,agno,ip)
 
1764  * FUNCTION:    allocate a disk inode from the allocation group's free
 
1765  *              inode list, returning an error if this free list is
 
1766  *              empty (i.e. no iags on the list).
 
1768  *              allocation occurs from the first iag on the list using
 
1769  *              the iag's free inode summary map to find the leftmost
 
1770  *              free inode in the iag.
 
1772  * PRE CONDITION: Already have AG lock for this AG.
 
1775  *      imap    - pointer to inode map control structure.
 
1776  *      agno    - allocation group.
 
1777  *      ip      - pointer to new inode to be filled in on successful return
 
1778  *                with the disk inode number allocated, its extent address
 
1779  *                and the start of the ag.
 
1783  *      -ENOSPC - insufficient disk resources.
 
1786 static int diAllocIno(struct inomap * imap, int agno, struct inode *ip)
 
1788         int iagno, ino, rc, rem, extno, sword;
 
1789         struct metapage *mp;
 
1792         /* check if there are iags on the ag's free inode list.
 
1794         if ((iagno = imap->im_agctl[agno].inofree) < 0)
 
1797         /* obtain read lock on imap inode */
 
1798         IREAD_LOCK(imap->im_ipimap, RDWRLOCK_IMAP);
 
1800         /* read the iag at the head of the list.
 
1802         if ((rc = diIAGRead(imap, iagno, &mp))) {
 
1803                 IREAD_UNLOCK(imap->im_ipimap);
 
1806         iagp = (struct iag *) mp->data;
 
1808         /* better be free inodes in this iag if it is on the
 
1811         if (!iagp->nfreeinos) {
 
1812                 IREAD_UNLOCK(imap->im_ipimap);
 
1813                 release_metapage(mp);
 
1815                           "diAllocIno: nfreeinos = 0, but iag on freelist");
 
1819         /* scan the free inode summary map to find an extent
 
1822         for (sword = 0;; sword++) {
 
1823                 if (sword >= SMAPSZ) {
 
1824                         IREAD_UNLOCK(imap->im_ipimap);
 
1825                         release_metapage(mp);
 
1827                                   "diAllocIno: free inode not found in summary map");
 
1831                 if (~iagp->inosmap[sword])
 
1835         /* found a extent with free inodes. determine
 
1836          * the extent number.
 
1838         rem = diFindFree(le32_to_cpu(iagp->inosmap[sword]), 0);
 
1839         if (rem >= EXTSPERSUM) {
 
1840                 IREAD_UNLOCK(imap->im_ipimap);
 
1841                 release_metapage(mp);
 
1842                 jfs_error(ip->i_sb, "diAllocIno: no free extent found");
 
1845         extno = (sword << L2EXTSPERSUM) + rem;
 
1847         /* find the first free inode in the extent.
 
1849         rem = diFindFree(le32_to_cpu(iagp->wmap[extno]), 0);
 
1850         if (rem >= INOSPEREXT) {
 
1851                 IREAD_UNLOCK(imap->im_ipimap);
 
1852                 release_metapage(mp);
 
1853                 jfs_error(ip->i_sb, "diAllocIno: free inode not found");
 
1857         /* compute the inode number within the iag.
 
1859         ino = (extno << L2INOSPEREXT) + rem;
 
1861         /* allocate the inode.
 
1863         rc = diAllocBit(imap, iagp, ino);
 
1864         IREAD_UNLOCK(imap->im_ipimap);
 
1866                 release_metapage(mp);
 
1870         /* set the results of the allocation and write the iag.
 
1872         diInitInode(ip, iagno, ino, extno, iagp);
 
1880  * NAME:        diAllocExt(imap,agno,ip)
 
1882  * FUNCTION:    add a new extent of free inodes to an iag, allocating
 
1883  *              an inode from this extent to satisfy the current allocation
 
1886  *              this routine first tries to find an existing iag with free
 
1887  *              extents through the ag free extent list.  if list is not
 
1888  *              empty, the head of the list will be selected as the home
 
1889  *              of the new extent of free inodes.  otherwise (the list is
 
1890  *              empty), a new iag will be allocated for the ag to contain
 
1893  *              once an iag has been selected, the free extent summary map
 
1894  *              is used to locate a free extent within the iag and diNewExt()
 
1895  *              is called to initialize the extent, with initialization
 
1896  *              including the allocation of the first inode of the extent
 
1897  *              for the purpose of satisfying this request.
 
1900  *      imap    - pointer to inode map control structure.
 
1901  *      agno    - allocation group number.
 
1902  *      ip      - pointer to new inode to be filled in on successful return
 
1903  *                with the disk inode number allocated, its extent address
 
1904  *                and the start of the ag.
 
1908  *      -ENOSPC - insufficient disk resources.
 
1911 static int diAllocExt(struct inomap * imap, int agno, struct inode *ip)
 
1913         int rem, iagno, sword, extno, rc;
 
1914         struct metapage *mp;
 
1917         /* check if the ag has any iags with free extents.  if not,
 
1918          * allocate a new iag for the ag.
 
1920         if ((iagno = imap->im_agctl[agno].extfree) < 0) {
 
1921                 /* If successful, diNewIAG will obtain the read lock on the
 
1924                 if ((rc = diNewIAG(imap, &iagno, agno, &mp))) {
 
1927                 iagp = (struct iag *) mp->data;
 
1929                 /* set the ag number if this a brand new iag
 
1932                     cpu_to_le64(AGTOBLK(agno, imap->im_ipimap));
 
1936                 IREAD_LOCK(imap->im_ipimap, RDWRLOCK_IMAP);
 
1937                 if ((rc = diIAGRead(imap, iagno, &mp))) {
 
1938                         IREAD_UNLOCK(imap->im_ipimap);
 
1939                         jfs_error(ip->i_sb, "diAllocExt: error reading iag");
 
1942                 iagp = (struct iag *) mp->data;
 
1945         /* using the free extent summary map, find a free extent.
 
1947         for (sword = 0;; sword++) {
 
1948                 if (sword >= SMAPSZ) {
 
1949                         release_metapage(mp);
 
1950                         IREAD_UNLOCK(imap->im_ipimap);
 
1952                                   "diAllocExt: free ext summary map not found");
 
1955                 if (~iagp->extsmap[sword])
 
1959         /* determine the extent number of the free extent.
 
1961         rem = diFindFree(le32_to_cpu(iagp->extsmap[sword]), 0);
 
1962         if (rem >= EXTSPERSUM) {
 
1963                 release_metapage(mp);
 
1964                 IREAD_UNLOCK(imap->im_ipimap);
 
1965                 jfs_error(ip->i_sb, "diAllocExt: free extent not found");
 
1968         extno = (sword << L2EXTSPERSUM) + rem;
 
1970         /* initialize the new extent.
 
1972         rc = diNewExt(imap, iagp, extno);
 
1973         IREAD_UNLOCK(imap->im_ipimap);
 
1975                 /* something bad happened.  if a new iag was allocated,
 
1976                  * place it back on the inode map's iag free list, and
 
1977                  * clear the ag number information.
 
1979                 if (iagp->nfreeexts == cpu_to_le32(EXTSPERIAG)) {
 
1981                         iagp->iagfree = cpu_to_le32(imap->im_freeiag);
 
1982                         imap->im_freeiag = iagno;
 
1983                         IAGFREE_UNLOCK(imap);
 
1989         /* set the results of the allocation and write the iag.
 
1991         diInitInode(ip, iagno, extno << L2INOSPEREXT, extno, iagp);
 
2000  * NAME:        diAllocBit(imap,iagp,ino)
 
2002  * FUNCTION:    allocate a backed inode from an iag.
 
2004  *              this routine performs the mechanics of allocating a
 
2005  *              specified inode from a backed extent.
 
2007  *              if the inode to be allocated represents the last free
 
2008  *              inode within the iag, the iag will be removed from the
 
2009  *              ag free inode list.
 
2011  *              a careful update approach is used to provide consistency
 
2012  *              in the face of updates to multiple buffers.  under this
 
2013  *              approach, all required buffers are obtained before making
 
2014  *              any updates and are held all are updates are complete.
 
2016  * PRE CONDITION: Already have buffer lock on iagp.  Already have AG lock on
 
2017  *      this AG.  Must have read lock on imap inode.
 
2020  *      imap    - pointer to inode map control structure.
 
2021  *      iagp    - pointer to iag.
 
2022  *      ino     - inode number to be allocated within the iag.
 
2026  *      -ENOSPC - insufficient disk resources.
 
2029 static int diAllocBit(struct inomap * imap, struct iag * iagp, int ino)
 
2031         int extno, bitno, agno, sword, rc;
 
2032         struct metapage *amp = NULL, *bmp = NULL;
 
2033         struct iag *aiagp = NULL, *biagp = NULL;
 
2036         /* check if this is the last free inode within the iag.
 
2037          * if so, it will have to be removed from the ag free
 
2038          * inode list, so get the iags preceeding and following
 
2041         if (iagp->nfreeinos == cpu_to_le32(1)) {
 
2042                 if ((int) le32_to_cpu(iagp->inofreefwd) >= 0) {
 
2044                              diIAGRead(imap, le32_to_cpu(iagp->inofreefwd),
 
2047                         aiagp = (struct iag *) amp->data;
 
2050                 if ((int) le32_to_cpu(iagp->inofreeback) >= 0) {
 
2053                                        le32_to_cpu(iagp->inofreeback),
 
2056                                         release_metapage(amp);
 
2059                         biagp = (struct iag *) bmp->data;
 
2063         /* get the ag number, extent number, inode number within
 
2066         agno = BLKTOAG(le64_to_cpu(iagp->agstart), JFS_SBI(imap->im_ipimap->i_sb));
 
2067         extno = ino >> L2INOSPEREXT;
 
2068         bitno = ino & (INOSPEREXT - 1);
 
2070         /* compute the mask for setting the map.
 
2072         mask = HIGHORDER >> bitno;
 
2074         /* the inode should be free and backed.
 
2076         if (((le32_to_cpu(iagp->pmap[extno]) & mask) != 0) ||
 
2077             ((le32_to_cpu(iagp->wmap[extno]) & mask) != 0) ||
 
2078             (addressPXD(&iagp->inoext[extno]) == 0)) {
 
2080                         release_metapage(amp);
 
2082                         release_metapage(bmp);
 
2084                 jfs_error(imap->im_ipimap->i_sb,
 
2085                           "diAllocBit: iag inconsistent");
 
2089         /* mark the inode as allocated in the working map.
 
2091         iagp->wmap[extno] |= cpu_to_le32(mask);
 
2093         /* check if all inodes within the extent are now
 
2094          * allocated.  if so, update the free inode summary
 
2095          * map to reflect this.
 
2097         if (iagp->wmap[extno] == cpu_to_le32(ONES)) {
 
2098                 sword = extno >> L2EXTSPERSUM;
 
2099                 bitno = extno & (EXTSPERSUM - 1);
 
2100                 iagp->inosmap[sword] |= cpu_to_le32(HIGHORDER >> bitno);
 
2103         /* if this was the last free inode in the iag, remove the
 
2104          * iag from the ag free inode list.
 
2106         if (iagp->nfreeinos == cpu_to_le32(1)) {
 
2108                         aiagp->inofreeback = iagp->inofreeback;
 
2109                         write_metapage(amp);
 
2113                         biagp->inofreefwd = iagp->inofreefwd;
 
2114                         write_metapage(bmp);
 
2116                         imap->im_agctl[agno].inofree =
 
2117                             le32_to_cpu(iagp->inofreefwd);
 
2119                 iagp->inofreefwd = iagp->inofreeback = cpu_to_le32(-1);
 
2122         /* update the free inode count at the iag, ag, inode
 
2125         le32_add_cpu(&iagp->nfreeinos, -1);
 
2126         imap->im_agctl[agno].numfree -= 1;
 
2127         atomic_dec(&imap->im_numfree);
 
2134  * NAME:        diNewExt(imap,iagp,extno)
 
2136  * FUNCTION:    initialize a new extent of inodes for an iag, allocating
 
2137  *              the first inode of the extent for use for the current
 
2138  *              allocation request.
 
2140  *              disk resources are allocated for the new extent of inodes
 
2141  *              and the inodes themselves are initialized to reflect their
 
2142  *              existence within the extent (i.e. their inode numbers and
 
2143  *              inode extent addresses are set) and their initial state
 
2144  *              (mode and link count are set to zero).
 
2146  *              if the iag is new, it is not yet on an ag extent free list
 
2147  *              but will now be placed on this list.
 
2149  *              if the allocation of the new extent causes the iag to
 
2150  *              have no free extent, the iag will be removed from the
 
2151  *              ag extent free list.
 
2153  *              if the iag has no free backed inodes, it will be placed
 
2154  *              on the ag free inode list, since the addition of the new
 
2155  *              extent will now cause it to have free inodes.
 
2157  *              a careful update approach is used to provide consistency
 
2158  *              (i.e. list consistency) in the face of updates to multiple
 
2159  *              buffers.  under this approach, all required buffers are
 
2160  *              obtained before making any updates and are held until all
 
2161  *              updates are complete.
 
2163  * PRE CONDITION: Already have buffer lock on iagp.  Already have AG lock on
 
2164  *      this AG.  Must have read lock on imap inode.
 
2167  *      imap    - pointer to inode map control structure.
 
2168  *      iagp    - pointer to iag.
 
2169  *      extno   - extent number.
 
2173  *      -ENOSPC - insufficient disk resources.
 
2176 static int diNewExt(struct inomap * imap, struct iag * iagp, int extno)
 
2178         int agno, iagno, fwd, back, freei = 0, sword, rc;
 
2179         struct iag *aiagp = NULL, *biagp = NULL, *ciagp = NULL;
 
2180         struct metapage *amp, *bmp, *cmp, *dmp;
 
2181         struct inode *ipimap;
 
2187         struct jfs_sb_info *sbi;
 
2189         /* better have free extents.
 
2191         if (!iagp->nfreeexts) {
 
2192                 jfs_error(imap->im_ipimap->i_sb, "diNewExt: no free extents");
 
2196         /* get the inode map inode.
 
2198         ipimap = imap->im_ipimap;
 
2199         sbi = JFS_SBI(ipimap->i_sb);
 
2201         amp = bmp = cmp = NULL;
 
2203         /* get the ag and iag numbers for this iag.
 
2205         agno = BLKTOAG(le64_to_cpu(iagp->agstart), sbi);
 
2206         iagno = le32_to_cpu(iagp->iagnum);
 
2208         /* check if this is the last free extent within the
 
2209          * iag.  if so, the iag must be removed from the ag
 
2210          * free extent list, so get the iags preceeding and
 
2211          * following the iag on this list.
 
2213         if (iagp->nfreeexts == cpu_to_le32(1)) {
 
2214                 if ((fwd = le32_to_cpu(iagp->extfreefwd)) >= 0) {
 
2215                         if ((rc = diIAGRead(imap, fwd, &)))
 
2217                         aiagp = (struct iag *) amp->data;
 
2220                 if ((back = le32_to_cpu(iagp->extfreeback)) >= 0) {
 
2221                         if ((rc = diIAGRead(imap, back, &bmp)))
 
2223                         biagp = (struct iag *) bmp->data;
 
2226                 /* the iag has free extents.  if all extents are free
 
2227                  * (as is the case for a newly allocated iag), the iag
 
2228                  * must be added to the ag free extent list, so get
 
2229                  * the iag at the head of the list in preparation for
 
2230                  * adding this iag to this list.
 
2233                 if (iagp->nfreeexts == cpu_to_le32(EXTSPERIAG)) {
 
2234                         if ((fwd = imap->im_agctl[agno].extfree) >= 0) {
 
2235                                 if ((rc = diIAGRead(imap, fwd, &)))
 
2237                                 aiagp = (struct iag *) amp->data;
 
2242         /* check if the iag has no free inodes.  if so, the iag
 
2243          * will have to be added to the ag free inode list, so get
 
2244          * the iag at the head of the list in preparation for
 
2245          * adding this iag to this list.  in doing this, we must
 
2246          * check if we already have the iag at the head of
 
2249         if (iagp->nfreeinos == 0) {
 
2250                 freei = imap->im_agctl[agno].inofree;
 
2255                         } else if (freei == back) {
 
2258                                 if ((rc = diIAGRead(imap, freei, &cmp)))
 
2260                                 ciagp = (struct iag *) cmp->data;
 
2262                         if (ciagp == NULL) {
 
2263                                 jfs_error(imap->im_ipimap->i_sb,
 
2264                                           "diNewExt: ciagp == NULL");
 
2271         /* allocate disk space for the inode extent.
 
2273         if ((extno == 0) || (addressPXD(&iagp->inoext[extno - 1]) == 0))
 
2274                 hint = ((s64) agno << sbi->bmap->db_agl2size) - 1;
 
2276                 hint = addressPXD(&iagp->inoext[extno - 1]) +
 
2277                     lengthPXD(&iagp->inoext[extno - 1]) - 1;
 
2279         if ((rc = dbAlloc(ipimap, hint, (s64) imap->im_nbperiext, &blkno)))
 
2282         /* compute the inode number of the first inode within the
 
2285         ino = (iagno << L2INOSPERIAG) + (extno << L2INOSPEREXT);
 
2287         /* initialize the inodes within the newly allocated extent a
 
2290         for (i = 0; i < imap->im_nbperiext; i += sbi->nbperpage) {
 
2291                 /* get a buffer for this page of disk inodes.
 
2293                 dmp = get_metapage(ipimap, blkno + i, PSIZE, 1);
 
2298                 dp = (struct dinode *) dmp->data;
 
2300                 /* initialize the inode number, mode, link count and
 
2301                  * inode extent address.
 
2303                 for (j = 0; j < INOSPERPAGE; j++, dp++, ino++) {
 
2304                         dp->di_inostamp = cpu_to_le32(sbi->inostamp);
 
2305                         dp->di_number = cpu_to_le32(ino);
 
2306                         dp->di_fileset = cpu_to_le32(FILESYSTEM_I);
 
2309                         PXDaddress(&(dp->di_ixpxd), blkno);
 
2310                         PXDlength(&(dp->di_ixpxd), imap->im_nbperiext);
 
2312                 write_metapage(dmp);
 
2315         /* if this is the last free extent within the iag, remove the
 
2316          * iag from the ag free extent list.
 
2318         if (iagp->nfreeexts == cpu_to_le32(1)) {
 
2320                         aiagp->extfreeback = iagp->extfreeback;
 
2323                         biagp->extfreefwd = iagp->extfreefwd;
 
2325                         imap->im_agctl[agno].extfree =
 
2326                             le32_to_cpu(iagp->extfreefwd);
 
2328                 iagp->extfreefwd = iagp->extfreeback = cpu_to_le32(-1);
 
2330                 /* if the iag has all free extents (newly allocated iag),
 
2331                  * add the iag to the ag free extent list.
 
2333                 if (iagp->nfreeexts == cpu_to_le32(EXTSPERIAG)) {
 
2335                                 aiagp->extfreeback = cpu_to_le32(iagno);
 
2337                         iagp->extfreefwd = cpu_to_le32(fwd);
 
2338                         iagp->extfreeback = cpu_to_le32(-1);
 
2339                         imap->im_agctl[agno].extfree = iagno;
 
2343         /* if the iag has no free inodes, add the iag to the
 
2344          * ag free inode list.
 
2346         if (iagp->nfreeinos == 0) {
 
2348                         ciagp->inofreeback = cpu_to_le32(iagno);
 
2351                     cpu_to_le32(imap->im_agctl[agno].inofree);
 
2352                 iagp->inofreeback = cpu_to_le32(-1);
 
2353                 imap->im_agctl[agno].inofree = iagno;
 
2356         /* initialize the extent descriptor of the extent. */
 
2357         PXDlength(&iagp->inoext[extno], imap->im_nbperiext);
 
2358         PXDaddress(&iagp->inoext[extno], blkno);
 
2360         /* initialize the working and persistent map of the extent.
 
2361          * the working map will be initialized such that
 
2362          * it indicates the first inode of the extent is allocated.
 
2364         iagp->wmap[extno] = cpu_to_le32(HIGHORDER);
 
2365         iagp->pmap[extno] = 0;
 
2367         /* update the free inode and free extent summary maps
 
2368          * for the extent to indicate the extent has free inodes
 
2369          * and no longer represents a free extent.
 
2371         sword = extno >> L2EXTSPERSUM;
 
2372         mask = HIGHORDER >> (extno & (EXTSPERSUM - 1));
 
2373         iagp->extsmap[sword] |= cpu_to_le32(mask);
 
2374         iagp->inosmap[sword] &= cpu_to_le32(~mask);
 
2376         /* update the free inode and free extent counts for the
 
2379         le32_add_cpu(&iagp->nfreeinos, (INOSPEREXT - 1));
 
2380         le32_add_cpu(&iagp->nfreeexts, -1);
 
2382         /* update the free and backed inode counts for the ag.
 
2384         imap->im_agctl[agno].numfree += (INOSPEREXT - 1);
 
2385         imap->im_agctl[agno].numinos += INOSPEREXT;
 
2387         /* update the free and backed inode counts for the inode map.
 
2389         atomic_add(INOSPEREXT - 1, &imap->im_numfree);
 
2390         atomic_add(INOSPEREXT, &imap->im_numinos);
 
2395                 write_metapage(amp);
 
2397                 write_metapage(bmp);
 
2399                 write_metapage(cmp);
 
2405         /* release the iags.
 
2408                 release_metapage(amp);
 
2410                 release_metapage(bmp);
 
2412                 release_metapage(cmp);
 
2419  * NAME:        diNewIAG(imap,iagnop,agno)
 
2421  * FUNCTION:    allocate a new iag for an allocation group.
 
2423  *              first tries to allocate the iag from the inode map
 
2425  *              if the list has free iags, the head of the list is removed
 
2426  *              and returned to satisfy the request.
 
2427  *              if the inode map's iag free list is empty, the inode map
 
2428  *              is extended to hold a new iag. this new iag is initialized
 
2429  *              and returned to satisfy the request.
 
2432  *      imap    - pointer to inode map control structure.
 
2433  *      iagnop  - pointer to an iag number set with the number of the
 
2434  *                newly allocated iag upon successful return.
 
2435  *      agno    - allocation group number.
 
2436  *      bpp     - Buffer pointer to be filled in with new IAG's buffer
 
2440  *      -ENOSPC - insufficient disk resources.
 
2444  *      AG lock held on entry/exit;
 
2445  *      write lock on the map is held inside;
 
2446  *      read lock on the map is held on successful completion;
 
2448  * note: new iag transaction:
 
2449  * . synchronously write iag;
 
2450  * . write log of xtree and inode of imap;
 
2452  * . synchronous write of xtree (right to left, bottom to top);
 
2453  * . at start of logredo(): init in-memory imap with one additional iag page;
 
2454  * . at end of logredo(): re-read imap inode to determine
 
2458 diNewIAG(struct inomap * imap, int *iagnop, int agno, struct metapage ** mpp)
 
2462         struct inode *ipimap;
 
2463         struct super_block *sb;
 
2464         struct jfs_sb_info *sbi;
 
2465         struct metapage *mp;
 
2470         struct inode *iplist[1];
 
2472         /* pick up pointers to the inode map and mount inodes */
 
2473         ipimap = imap->im_ipimap;
 
2477         /* acquire the free iag lock */
 
2480         /* if there are any iags on the inode map free iag list,
 
2481          * allocate the iag from the head of the list.
 
2483         if (imap->im_freeiag >= 0) {
 
2484                 /* pick up the iag number at the head of the list */
 
2485                 iagno = imap->im_freeiag;
 
2487                 /* determine the logical block number of the iag */
 
2488                 blkno = IAGTOLBLK(iagno, sbi->l2nbperpage);
 
2490                 /* no free iags. the inode map will have to be extented
 
2491                  * to include a new iag.
 
2494                 /* acquire inode map lock */
 
2495                 IWRITE_LOCK(ipimap, RDWRLOCK_IMAP);
 
2497                 if (ipimap->i_size >> L2PSIZE != imap->im_nextiag + 1) {
 
2498                         IWRITE_UNLOCK(ipimap);
 
2499                         IAGFREE_UNLOCK(imap);
 
2500                         jfs_error(imap->im_ipimap->i_sb,
 
2501                                   "diNewIAG: ipimap->i_size is wrong");
 
2506                 /* get the next avaliable iag number */
 
2507                 iagno = imap->im_nextiag;
 
2509                 /* make sure that we have not exceeded the maximum inode
 
2512                 if (iagno > (MAXIAGS - 1)) {
 
2513                         /* release the inode map lock */
 
2514                         IWRITE_UNLOCK(ipimap);
 
2521                  * synchronously append new iag page.
 
2523                 /* determine the logical address of iag page to append */
 
2524                 blkno = IAGTOLBLK(iagno, sbi->l2nbperpage);
 
2526                 /* Allocate extent for new iag page */
 
2527                 xlen = sbi->nbperpage;
 
2528                 if ((rc = dbAlloc(ipimap, 0, (s64) xlen, &xaddr))) {
 
2529                         /* release the inode map lock */
 
2530                         IWRITE_UNLOCK(ipimap);
 
2536                  * start transaction of update of the inode map
 
2537                  * addressing structure pointing to the new iag page;
 
2539                 tid = txBegin(sb, COMMIT_FORCE);
 
2540                 mutex_lock(&JFS_IP(ipimap)->commit_mutex);
 
2542                 /* update the inode map addressing structure to point to it */
 
2544                      xtInsert(tid, ipimap, 0, blkno, xlen, &xaddr, 0))) {
 
2546                         mutex_unlock(&JFS_IP(ipimap)->commit_mutex);
 
2547                         /* Free the blocks allocated for the iag since it was
 
2548                          * not successfully added to the inode map
 
2550                         dbFree(ipimap, xaddr, (s64) xlen);
 
2552                         /* release the inode map lock */
 
2553                         IWRITE_UNLOCK(ipimap);
 
2558                 /* update the inode map's inode to reflect the extension */
 
2559                 ipimap->i_size += PSIZE;
 
2560                 inode_add_bytes(ipimap, PSIZE);
 
2562                 /* assign a buffer for the page */
 
2563                 mp = get_metapage(ipimap, blkno, PSIZE, 0);
 
2566                          * This is very unlikely since we just created the
 
2567                          * extent, but let's try to handle it correctly
 
2569                         xtTruncate(tid, ipimap, ipimap->i_size - PSIZE,
 
2575                         /* release the inode map lock */
 
2576                         IWRITE_UNLOCK(ipimap);
 
2581                 iagp = (struct iag *) mp->data;
 
2584                 memset(iagp, 0, sizeof(struct iag));
 
2585                 iagp->iagnum = cpu_to_le32(iagno);
 
2586                 iagp->inofreefwd = iagp->inofreeback = cpu_to_le32(-1);
 
2587                 iagp->extfreefwd = iagp->extfreeback = cpu_to_le32(-1);
 
2588                 iagp->iagfree = cpu_to_le32(-1);
 
2589                 iagp->nfreeinos = 0;
 
2590                 iagp->nfreeexts = cpu_to_le32(EXTSPERIAG);
 
2592                 /* initialize the free inode summary map (free extent
 
2593                  * summary map initialization handled by bzero).
 
2595                 for (i = 0; i < SMAPSZ; i++)
 
2596                         iagp->inosmap[i] = cpu_to_le32(ONES);
 
2599                  * Write and sync the metapage
 
2604                  * txCommit(COMMIT_FORCE) will synchronously write address
 
2605                  * index pages and inode after commit in careful update order
 
2606                  * of address index pages (right to left, bottom up);
 
2609                 rc = txCommit(tid, 1, &iplist[0], COMMIT_FORCE);
 
2612                 mutex_unlock(&JFS_IP(ipimap)->commit_mutex);
 
2614                 duplicateIXtree(sb, blkno, xlen, &xaddr);
 
2616                 /* update the next avaliable iag number */
 
2617                 imap->im_nextiag += 1;
 
2619                 /* Add the iag to the iag free list so we don't lose the iag
 
2620                  * if a failure happens now.
 
2622                 imap->im_freeiag = iagno;
 
2624                 /* Until we have logredo working, we want the imap inode &
 
2625                  * control page to be up to date.
 
2629                 /* release the inode map lock */
 
2630                 IWRITE_UNLOCK(ipimap);
 
2633         /* obtain read lock on map */
 
2634         IREAD_LOCK(ipimap, RDWRLOCK_IMAP);
 
2637         if ((rc = diIAGRead(imap, iagno, &mp))) {
 
2638                 IREAD_UNLOCK(ipimap);
 
2642         iagp = (struct iag *) mp->data;
 
2644         /* remove the iag from the iag free list */
 
2645         imap->im_freeiag = le32_to_cpu(iagp->iagfree);
 
2646         iagp->iagfree = cpu_to_le32(-1);
 
2648         /* set the return iag number and buffer pointer */
 
2653         /* release the iag free lock */
 
2654         IAGFREE_UNLOCK(imap);
 
2662  * FUNCTION:    get the buffer for the specified iag within a fileset
 
2663  *              or aggregate inode map.
 
2666  *      imap    - pointer to inode map control structure.
 
2667  *      iagno   - iag number.
 
2668  *      bpp     - point to buffer pointer to be filled in on successful
 
2672  *      must have read lock on imap inode
 
2673  *      (When called by diExtendFS, the filesystem is quiesced, therefore
 
2674  *       the read lock is unnecessary.)
 
2680 static int diIAGRead(struct inomap * imap, int iagno, struct metapage ** mpp)
 
2682         struct inode *ipimap = imap->im_ipimap;
 
2685         /* compute the logical block number of the iag. */
 
2686         blkno = IAGTOLBLK(iagno, JFS_SBI(ipimap->i_sb)->l2nbperpage);
 
2689         *mpp = read_metapage(ipimap, blkno, PSIZE, 0);
 
2698  * NAME:        diFindFree()
 
2700  * FUNCTION:    find the first free bit in a word starting at
 
2701  *              the specified bit position.
 
2704  *      word    - word to be examined.
 
2705  *      start   - starting bit position.
 
2708  *      bit position of first free bit in the word or 32 if
 
2709  *      no free bits were found.
 
2711 static int diFindFree(u32 word, int start)
 
2715         /* scan the word for the first free bit. */
 
2716         for (word <<= start, bitno = start; bitno < 32;
 
2717              bitno++, word <<= 1) {
 
2718                 if ((word & HIGHORDER) == 0)
 
2725  * NAME:        diUpdatePMap()
 
2727  * FUNCTION: Update the persistent map in an IAG for the allocation or
 
2728  *      freeing of the specified inode.
 
2730  * PRE CONDITIONS: Working map has already been updated for allocate.
 
2733  *      ipimap  - Incore inode map inode
 
2734  *      inum    - Number of inode to mark in permanent map
 
2735  *      is_free - If 'true' indicates inode should be marked freed, otherwise
 
2736  *                indicates inode should be marked allocated.
 
2742 diUpdatePMap(struct inode *ipimap,
 
2743              unsigned long inum, bool is_free, struct tblock * tblk)
 
2747         struct metapage *mp;
 
2748         int iagno, ino, extno, bitno;
 
2749         struct inomap *imap;
 
2751         struct jfs_log *log;
 
2752         int lsn, difft, diffp;
 
2753         unsigned long flags;
 
2755         imap = JFS_IP(ipimap)->i_imap;
 
2756         /* get the iag number containing the inode */
 
2757         iagno = INOTOIAG(inum);
 
2758         /* make sure that the iag is contained within the map */
 
2759         if (iagno >= imap->im_nextiag) {
 
2760                 jfs_error(ipimap->i_sb,
 
2761                           "diUpdatePMap: the iag is outside the map");
 
2765         IREAD_LOCK(ipimap, RDWRLOCK_IMAP);
 
2766         rc = diIAGRead(imap, iagno, &mp);
 
2767         IREAD_UNLOCK(ipimap);
 
2770         metapage_wait_for_io(mp);
 
2771         iagp = (struct iag *) mp->data;
 
2772         /* get the inode number and extent number of the inode within
 
2773          * the iag and the inode number within the extent.
 
2775         ino = inum & (INOSPERIAG - 1);
 
2776         extno = ino >> L2INOSPEREXT;
 
2777         bitno = ino & (INOSPEREXT - 1);
 
2778         mask = HIGHORDER >> bitno;
 
2780          * mark the inode free in persistent map:
 
2783                 /* The inode should have been allocated both in working
 
2784                  * map and in persistent map;
 
2785                  * the inode will be freed from working map at the release
 
2786                  * of last reference release;
 
2788                 if (!(le32_to_cpu(iagp->wmap[extno]) & mask)) {
 
2789                         jfs_error(ipimap->i_sb,
 
2790                                   "diUpdatePMap: inode %ld not marked as "
 
2791                                   "allocated in wmap!", inum);
 
2793                 if (!(le32_to_cpu(iagp->pmap[extno]) & mask)) {
 
2794                         jfs_error(ipimap->i_sb,
 
2795                                   "diUpdatePMap: inode %ld not marked as "
 
2796                                   "allocated in pmap!", inum);
 
2798                 /* update the bitmap for the extent of the freed inode */
 
2799                 iagp->pmap[extno] &= cpu_to_le32(~mask);
 
2802          * mark the inode allocated in persistent map:
 
2805                 /* The inode should be already allocated in the working map
 
2806                  * and should be free in persistent map;
 
2808                 if (!(le32_to_cpu(iagp->wmap[extno]) & mask)) {
 
2809                         release_metapage(mp);
 
2810                         jfs_error(ipimap->i_sb,
 
2811                                   "diUpdatePMap: the inode is not allocated in "
 
2815                 if ((le32_to_cpu(iagp->pmap[extno]) & mask) != 0) {
 
2816                         release_metapage(mp);
 
2817                         jfs_error(ipimap->i_sb,
 
2818                                   "diUpdatePMap: the inode is not free in the "
 
2822                 /* update the bitmap for the extent of the allocated inode */
 
2823                 iagp->pmap[extno] |= cpu_to_le32(mask);
 
2829         log = JFS_SBI(tblk->sb)->log;
 
2830         LOGSYNC_LOCK(log, flags);
 
2832                 /* inherit older/smaller lsn */
 
2833                 logdiff(difft, lsn, log);
 
2834                 logdiff(diffp, mp->lsn, log);
 
2835                 if (difft < diffp) {
 
2837                         /* move mp after tblock in logsync list */
 
2838                         list_move(&mp->synclist, &tblk->synclist);
 
2840                 /* inherit younger/larger clsn */
 
2842                 logdiff(difft, tblk->clsn, log);
 
2843                 logdiff(diffp, mp->clsn, log);
 
2845                         mp->clsn = tblk->clsn;
 
2849                 /* insert mp after tblock in logsync list */
 
2851                 list_add(&mp->synclist, &tblk->synclist);
 
2852                 mp->clsn = tblk->clsn;
 
2854         LOGSYNC_UNLOCK(log, flags);
 
2862  * function: update imap for extendfs();
 
2864  * note: AG size has been increased s.t. each k old contiguous AGs are
 
2865  * coalesced into a new AG;
 
2867 int diExtendFS(struct inode *ipimap, struct inode *ipbmap)
 
2870         struct inomap *imap = JFS_IP(ipimap)->i_imap;
 
2871         struct iag *iagp = NULL, *hiagp = NULL;
 
2872         struct bmap *mp = JFS_SBI(ipbmap->i_sb)->bmap;
 
2873         struct metapage *bp, *hbp;
 
2875         int numinos, xnuminos = 0, xnumfree = 0;
 
2878         jfs_info("diExtendFS: nextiag:%d numinos:%d numfree:%d",
 
2879                    imap->im_nextiag, atomic_read(&imap->im_numinos),
 
2880                    atomic_read(&imap->im_numfree));
 
2885          * coalesce contiguous k (newAGSize/oldAGSize) AGs;
 
2886          * i.e., (AGi, ..., AGj) where i = k*n and j = k*(n+1) - 1 to AGn;
 
2887          * note: new AG size = old AG size * (2**x).
 
2890         /* init per AG control information im_agctl[] */
 
2891         for (i = 0; i < MAXAG; i++) {
 
2892                 imap->im_agctl[i].inofree = -1;
 
2893                 imap->im_agctl[i].extfree = -1;
 
2894                 imap->im_agctl[i].numinos = 0;  /* number of backed inodes */
 
2895                 imap->im_agctl[i].numfree = 0;  /* number of free backed inodes */
 
2899          *      process each iag page of the map.
 
2901          * rebuild AG Free Inode List, AG Free Inode Extent List;
 
2903         for (i = 0; i < imap->im_nextiag; i++) {
 
2904                 if ((rc = diIAGRead(imap, i, &bp))) {
 
2908                 iagp = (struct iag *) bp->data;
 
2909                 if (le32_to_cpu(iagp->iagnum) != i) {
 
2910                         release_metapage(bp);
 
2911                         jfs_error(ipimap->i_sb,
 
2912                                   "diExtendFs: unexpected value of iagnum");
 
2916                 /* leave free iag in the free iag list */
 
2917                 if (iagp->nfreeexts == cpu_to_le32(EXTSPERIAG)) {
 
2918                         release_metapage(bp);
 
2922                 /* agstart that computes to the same ag is treated as same; */
 
2923                 agstart = le64_to_cpu(iagp->agstart);
 
2924                 /* iagp->agstart = agstart & ~(mp->db_agsize - 1); */
 
2925                 n = agstart >> mp->db_agl2size;
 
2927                 /* compute backed inodes */
 
2928                 numinos = (EXTSPERIAG - le32_to_cpu(iagp->nfreeexts))
 
2931                         /* merge AG backed inodes */
 
2932                         imap->im_agctl[n].numinos += numinos;
 
2933                         xnuminos += numinos;
 
2936                 /* if any backed free inodes, insert at AG free inode list */
 
2937                 if ((int) le32_to_cpu(iagp->nfreeinos) > 0) {
 
2938                         if ((head = imap->im_agctl[n].inofree) == -1) {
 
2939                                 iagp->inofreefwd = cpu_to_le32(-1);
 
2940                                 iagp->inofreeback = cpu_to_le32(-1);
 
2942                                 if ((rc = diIAGRead(imap, head, &hbp))) {
 
2946                                 hiagp = (struct iag *) hbp->data;
 
2947                                 hiagp->inofreeback = iagp->iagnum;
 
2948                                 iagp->inofreefwd = cpu_to_le32(head);
 
2949                                 iagp->inofreeback = cpu_to_le32(-1);
 
2950                                 write_metapage(hbp);
 
2953                         imap->im_agctl[n].inofree =
 
2954                             le32_to_cpu(iagp->iagnum);
 
2956                         /* merge AG backed free inodes */
 
2957                         imap->im_agctl[n].numfree +=
 
2958                             le32_to_cpu(iagp->nfreeinos);
 
2959                         xnumfree += le32_to_cpu(iagp->nfreeinos);
 
2962                 /* if any free extents, insert at AG free extent list */
 
2963                 if (le32_to_cpu(iagp->nfreeexts) > 0) {
 
2964                         if ((head = imap->im_agctl[n].extfree) == -1) {
 
2965                                 iagp->extfreefwd = cpu_to_le32(-1);
 
2966                                 iagp->extfreeback = cpu_to_le32(-1);
 
2968                                 if ((rc = diIAGRead(imap, head, &hbp))) {
 
2972                                 hiagp = (struct iag *) hbp->data;
 
2973                                 hiagp->extfreeback = iagp->iagnum;
 
2974                                 iagp->extfreefwd = cpu_to_le32(head);
 
2975                                 iagp->extfreeback = cpu_to_le32(-1);
 
2976                                 write_metapage(hbp);
 
2979                         imap->im_agctl[n].extfree =
 
2980                             le32_to_cpu(iagp->iagnum);
 
2987         if (xnuminos != atomic_read(&imap->im_numinos) ||
 
2988             xnumfree != atomic_read(&imap->im_numfree)) {
 
2989                 jfs_error(ipimap->i_sb,
 
2990                           "diExtendFs: numinos or numfree incorrect");
 
3001  * serialization: IWRITE_LOCK held on entry/exit
 
3003  * note: shadow page with regular inode (rel.2);
 
3005 static void duplicateIXtree(struct super_block *sb, s64 blkno,
 
3006                             int xlen, s64 *xaddr)
 
3008         struct jfs_superblock *j_sb;
 
3009         struct buffer_head *bh;
 
3013         /* if AIT2 ipmap2 is bad, do not try to update it */
 
3014         if (JFS_SBI(sb)->mntflag & JFS_BAD_SAIT)        /* s_flag */
 
3016         ip = diReadSpecial(sb, FILESYSTEM_I, 1);
 
3018                 JFS_SBI(sb)->mntflag |= JFS_BAD_SAIT;
 
3019                 if (readSuper(sb, &bh))
 
3021                 j_sb = (struct jfs_superblock *)bh->b_data;
 
3022                 j_sb->s_flag |= cpu_to_le32(JFS_BAD_SAIT);
 
3024                 mark_buffer_dirty(bh);
 
3025                 sync_dirty_buffer(bh);
 
3030         /* start transaction */
 
3031         tid = txBegin(sb, COMMIT_FORCE);
 
3032         /* update the inode map addressing structure to point to it */
 
3033         if (xtInsert(tid, ip, 0, blkno, xlen, xaddr, 0)) {
 
3034                 JFS_SBI(sb)->mntflag |= JFS_BAD_SAIT;
 
3039         /* update the inode map's inode to reflect the extension */
 
3040         ip->i_size += PSIZE;
 
3041         inode_add_bytes(ip, PSIZE);
 
3042         txCommit(tid, 1, &ip, COMMIT_FORCE);
 
3049  * NAME:        copy_from_dinode()
 
3051  * FUNCTION:    Copies inode info from disk inode to in-memory inode
 
3055  *      -ENOMEM - insufficient memory
 
3057 static int copy_from_dinode(struct dinode * dip, struct inode *ip)
 
3059         struct jfs_inode_info *jfs_ip = JFS_IP(ip);
 
3060         struct jfs_sb_info *sbi = JFS_SBI(ip->i_sb);
 
3062         jfs_ip->fileset = le32_to_cpu(dip->di_fileset);
 
3063         jfs_ip->mode2 = le32_to_cpu(dip->di_mode);
 
3064         jfs_set_inode_flags(ip);
 
3066         ip->i_mode = le32_to_cpu(dip->di_mode) & 0xffff;
 
3067         if (sbi->umask != -1) {
 
3068                 ip->i_mode = (ip->i_mode & ~0777) | (0777 & ~sbi->umask);
 
3069                 /* For directories, add x permission if r is allowed by umask */
 
3070                 if (S_ISDIR(ip->i_mode)) {
 
3071                         if (ip->i_mode & 0400)
 
3073                         if (ip->i_mode & 0040)
 
3075                         if (ip->i_mode & 0004)
 
3079         ip->i_nlink = le32_to_cpu(dip->di_nlink);
 
3081         jfs_ip->saved_uid = le32_to_cpu(dip->di_uid);
 
3083                 ip->i_uid = jfs_ip->saved_uid;
 
3085                 ip->i_uid = sbi->uid;
 
3088         jfs_ip->saved_gid = le32_to_cpu(dip->di_gid);
 
3090                 ip->i_gid = jfs_ip->saved_gid;
 
3092                 ip->i_gid = sbi->gid;
 
3095         ip->i_size = le64_to_cpu(dip->di_size);
 
3096         ip->i_atime.tv_sec = le32_to_cpu(dip->di_atime.tv_sec);
 
3097         ip->i_atime.tv_nsec = le32_to_cpu(dip->di_atime.tv_nsec);
 
3098         ip->i_mtime.tv_sec = le32_to_cpu(dip->di_mtime.tv_sec);
 
3099         ip->i_mtime.tv_nsec = le32_to_cpu(dip->di_mtime.tv_nsec);
 
3100         ip->i_ctime.tv_sec = le32_to_cpu(dip->di_ctime.tv_sec);
 
3101         ip->i_ctime.tv_nsec = le32_to_cpu(dip->di_ctime.tv_nsec);
 
3102         ip->i_blocks = LBLK2PBLK(ip->i_sb, le64_to_cpu(dip->di_nblocks));
 
3103         ip->i_generation = le32_to_cpu(dip->di_gen);
 
3105         jfs_ip->ixpxd = dip->di_ixpxd;  /* in-memory pxd's are little-endian */
 
3106         jfs_ip->acl = dip->di_acl;      /* as are dxd's */
 
3107         jfs_ip->ea = dip->di_ea;
 
3108         jfs_ip->next_index = le32_to_cpu(dip->di_next_index);
 
3109         jfs_ip->otime = le32_to_cpu(dip->di_otime.tv_sec);
 
3110         jfs_ip->acltype = le32_to_cpu(dip->di_acltype);
 
3112         if (S_ISCHR(ip->i_mode) || S_ISBLK(ip->i_mode)) {
 
3113                 jfs_ip->dev = le32_to_cpu(dip->di_rdev);
 
3114                 ip->i_rdev = new_decode_dev(jfs_ip->dev);
 
3117         if (S_ISDIR(ip->i_mode)) {
 
3118                 memcpy(&jfs_ip->i_dirtable, &dip->di_dirtable, 384);
 
3119         } else if (S_ISREG(ip->i_mode) || S_ISLNK(ip->i_mode)) {
 
3120                 memcpy(&jfs_ip->i_xtroot, &dip->di_xtroot, 288);
 
3122                 memcpy(&jfs_ip->i_inline_ea, &dip->di_inlineea, 128);
 
3124         /* Zero the in-memory-only stuff */
 
3126         jfs_ip->btindex = 0;
 
3127         jfs_ip->btorder = 0;
 
3130         jfs_ip->atlhead = 0;
 
3131         jfs_ip->atltail = 0;
 
3137  * NAME:        copy_to_dinode()
 
3139  * FUNCTION:    Copies inode info from in-memory inode to disk inode
 
3141 static void copy_to_dinode(struct dinode * dip, struct inode *ip)
 
3143         struct jfs_inode_info *jfs_ip = JFS_IP(ip);
 
3144         struct jfs_sb_info *sbi = JFS_SBI(ip->i_sb);
 
3146         dip->di_fileset = cpu_to_le32(jfs_ip->fileset);
 
3147         dip->di_inostamp = cpu_to_le32(sbi->inostamp);
 
3148         dip->di_number = cpu_to_le32(ip->i_ino);
 
3149         dip->di_gen = cpu_to_le32(ip->i_generation);
 
3150         dip->di_size = cpu_to_le64(ip->i_size);
 
3151         dip->di_nblocks = cpu_to_le64(PBLK2LBLK(ip->i_sb, ip->i_blocks));
 
3152         dip->di_nlink = cpu_to_le32(ip->i_nlink);
 
3154                 dip->di_uid = cpu_to_le32(ip->i_uid);
 
3156                 dip->di_uid = cpu_to_le32(jfs_ip->saved_uid);
 
3158                 dip->di_gid = cpu_to_le32(ip->i_gid);
 
3160                 dip->di_gid = cpu_to_le32(jfs_ip->saved_gid);
 
3161         jfs_get_inode_flags(jfs_ip);
 
3163          * mode2 is only needed for storing the higher order bits.
 
3164          * Trust i_mode for the lower order ones
 
3166         if (sbi->umask == -1)
 
3167                 dip->di_mode = cpu_to_le32((jfs_ip->mode2 & 0xffff0000) |
 
3169         else /* Leave the original permissions alone */
 
3170                 dip->di_mode = cpu_to_le32(jfs_ip->mode2);
 
3172         dip->di_atime.tv_sec = cpu_to_le32(ip->i_atime.tv_sec);
 
3173         dip->di_atime.tv_nsec = cpu_to_le32(ip->i_atime.tv_nsec);
 
3174         dip->di_ctime.tv_sec = cpu_to_le32(ip->i_ctime.tv_sec);
 
3175         dip->di_ctime.tv_nsec = cpu_to_le32(ip->i_ctime.tv_nsec);
 
3176         dip->di_mtime.tv_sec = cpu_to_le32(ip->i_mtime.tv_sec);
 
3177         dip->di_mtime.tv_nsec = cpu_to_le32(ip->i_mtime.tv_nsec);
 
3178         dip->di_ixpxd = jfs_ip->ixpxd;  /* in-memory pxd's are little-endian */
 
3179         dip->di_acl = jfs_ip->acl;      /* as are dxd's */
 
3180         dip->di_ea = jfs_ip->ea;
 
3181         dip->di_next_index = cpu_to_le32(jfs_ip->next_index);
 
3182         dip->di_otime.tv_sec = cpu_to_le32(jfs_ip->otime);
 
3183         dip->di_otime.tv_nsec = 0;
 
3184         dip->di_acltype = cpu_to_le32(jfs_ip->acltype);
 
3185         if (S_ISCHR(ip->i_mode) || S_ISBLK(ip->i_mode))
 
3186                 dip->di_rdev = cpu_to_le32(jfs_ip->dev);