2  *   Copyright (C) International Business Machines  Corp., 2000-2004
 
   4  *   This program is free software;  you can redistribute it and/or modify
 
   5  *   it under the terms of the GNU General Public License as published by
 
   6  *   the Free Software Foundation; either version 2 of the License, or 
 
   7  *   (at your option) any later version.
 
   9  *   This program is distributed in the hope that it will be useful,
 
  10  *   but WITHOUT ANY WARRANTY;  without even the implied warranty of
 
  11  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See
 
  12  *   the GNU General Public License for more details.
 
  14  *   You should have received a copy of the GNU General Public License
 
  15  *   along with this program;  if not, write to the Free Software 
 
  16  *   Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
 
  20 #include <linux/buffer_head.h>
 
  21 #include <linux/quotaops.h>
 
  22 #include "jfs_incore.h"
 
  23 #include "jfs_filsys.h"
 
  24 #include "jfs_metapage.h"
 
  25 #include "jfs_dinode.h"
 
  28 #include "jfs_superblock.h"
 
  29 #include "jfs_txnmgr.h"
 
  30 #include "jfs_debug.h"
 
  32 #define BITSPERPAGE     (PSIZE << 3)
 
  34 #define MEGABYTE        (1 << L2MEGABYTE)
 
  35 #define MEGABYTE32     (MEGABYTE << 5)
 
  37 /* convert block number to bmap file page number */
 
  38 #define BLKTODMAPN(b)\
 
  39         (((b) >> 13) + ((b) >> 23) + ((b) >> 33) + 3 + 1)
 
  44  * function: extend file system;
 
  46  *   |-------------------------------|----------|----------|
 
  47  *   file system space               fsck       inline log
 
  51  *      new LVSize: in LV blocks (required)
 
  52  *      new LogSize: in LV blocks (optional)
 
  53  *      new FSSize: in LV blocks (optional)
 
  56  * 1. set new LogSize as specified or default from new LVSize;
 
  57  * 2. compute new FSCKSize from new LVSize;
 
  58  * 3. set new FSSize as MIN(FSSize, LVSize-(LogSize+FSCKSize)) where
 
  59  *    assert(new FSSize >= old FSSize),
 
  60  *    i.e., file system must not be shrinked;
 
  62 int jfs_extendfs(struct super_block *sb, s64 newLVSize, int newLogSize)
 
  65         struct jfs_sb_info *sbi = JFS_SBI(sb);
 
  66         struct inode *ipbmap = sbi->ipbmap;
 
  67         struct inode *ipbmap2;
 
  68         struct inode *ipimap = sbi->ipimap;
 
  69         struct jfs_log *log = sbi->log;
 
  70         struct bmap *bmp = sbi->bmap;
 
  71         s64 newLogAddress, newFSCKAddress;
 
  73         s64 newMapSize = 0, mapSize;
 
  74         s64 XAddress, XSize, nblocks, xoff, xaddr, t64;
 
  78         int newNpages = 0, nPages, newPage, xlen, t32;
 
  80         int log_formatted = 0;
 
  81         struct inode *iplist[1];
 
  82         struct jfs_superblock *j_sb, *j_sb2;
 
  84         struct buffer_head *bh, *bh2;
 
  86         /* If the volume hasn't grown, get out now */
 
  88         if (sbi->mntflag & JFS_INLINELOG)
 
  89                 oldLVSize = addressPXD(&sbi->logpxd) + lengthPXD(&sbi->logpxd);
 
  91                 oldLVSize = addressPXD(&sbi->fsckpxd) +
 
  92                     lengthPXD(&sbi->fsckpxd);
 
  94         if (oldLVSize >= newLVSize) {
 
  96                        "jfs_extendfs: volume hasn't grown, returning\n");
 
 100         VolumeSize = sb->s_bdev->bd_inode->i_size >> sb->s_blocksize_bits;
 
 103                 if (newLVSize > VolumeSize) {
 
 104                         printk(KERN_WARNING "jfs_extendfs: invalid size\n");
 
 109                 /* check the device */
 
 110                 bh = sb_bread(sb, newLVSize - 1);
 
 112                         printk(KERN_WARNING "jfs_extendfs: invalid size\n");
 
 119         /* Can't extend write-protected drive */
 
 121         if (isReadOnly(ipbmap)) {
 
 122                 printk(KERN_WARNING "jfs_extendfs: read-only file system\n");
 
 128          *      reconfigure LV spaces
 
 129          *      ---------------------
 
 131          * validate new size, or, if not specified, determine new size
 
 135          * reconfigure inline log space:
 
 137         if ((sbi->mntflag & JFS_INLINELOG)) {
 
 138                 if (newLogSize == 0) {
 
 140                          * no size specified: default to 1/256 of aggregate
 
 141                          * size; rounded up to a megabyte boundary;
 
 143                         newLogSize = newLVSize >> 8;
 
 144                         t32 = (1 << (20 - sbi->l2bsize)) - 1;
 
 145                         newLogSize = (newLogSize + t32) & ~t32;
 
 147                             min(newLogSize, MEGABYTE32 >> sbi->l2bsize);
 
 150                          * convert the newLogSize to fs blocks.
 
 152                          * Since this is given in megabytes, it will always be
 
 153                          * an even number of pages.
 
 155                         newLogSize = (newLogSize * MEGABYTE) >> sbi->l2bsize;
 
 161         newLogAddress = newLVSize - newLogSize;
 
 164          * reconfigure fsck work space:
 
 166          * configure it to the end of the logical volume regardless of
 
 167          * whether file system extends to the end of the aggregate;
 
 168          * Need enough 4k pages to cover:
 
 169          *  - 1 bit per block in aggregate rounded up to BPERDMAP boundary
 
 170          *  - 1 extra page to handle control page and intermediate level pages
 
 171          *  - 50 extra pages for the chkdsk service log
 
 173         t64 = ((newLVSize - newLogSize + BPERDMAP - 1) >> L2BPERDMAP)
 
 175         t32 = ((t64 + (BITSPERPAGE - 1)) / BITSPERPAGE) + 1 + 50;
 
 176         newFSCKSize = t32 << sbi->l2nbperpage;
 
 177         newFSCKAddress = newLogAddress - newFSCKSize;
 
 180          * compute new file system space;
 
 182         newFSSize = newLVSize - newLogSize - newFSCKSize;
 
 184         /* file system cannot be shrinked */
 
 185         if (newFSSize < bmp->db_mapsize) {
 
 191          * If we're expanding enough that the inline log does not overlap
 
 192          * the old one, we can format the new log before we quiesce the
 
 195         if ((sbi->mntflag & JFS_INLINELOG) && (newLogAddress > oldLVSize)) {
 
 196                 if ((rc = lmLogFormat(log, newLogAddress, newLogSize)))
 
 201          *      quiesce file system
 
 203          * (prepare to move the inline log and to prevent map update)
 
 205          * block any new transactions and wait for completion of
 
 206          * all wip transactions and flush modified pages s.t.
 
 207          * on-disk file system is in consistent state and
 
 208          * log is not required for recovery.
 
 212         /* Reset size of direct inode */
 
 213         sbi->direct_inode->i_size =  sb->s_bdev->bd_inode->i_size;
 
 215         if (sbi->mntflag & JFS_INLINELOG) {
 
 217                  * deactivate old inline log
 
 222                  * mark on-disk super block for fs in transition;
 
 224                  * update on-disk superblock for the new space configuration
 
 225                  * of inline log space and fsck work space descriptors:
 
 226                  * N.B. FS descriptor is NOT updated;
 
 229                  * logredo(): if FM_EXTENDFS, return to fsck() for cleanup;
 
 230                  * fsck(): if FM_EXTENDFS, reformat inline log and fsck
 
 231                  * workspace from superblock inline log descriptor and fsck
 
 232                  * workspace descriptor;
 
 235                 /* read in superblock */
 
 236                 if ((rc = readSuper(sb, &bh)))
 
 238                 j_sb = (struct jfs_superblock *)bh->b_data;
 
 240                 /* mark extendfs() in progress */
 
 241                 j_sb->s_state |= cpu_to_le32(FM_EXTENDFS);
 
 242                 j_sb->s_xsize = cpu_to_le64(newFSSize);
 
 243                 PXDaddress(&j_sb->s_xfsckpxd, newFSCKAddress);
 
 244                 PXDlength(&j_sb->s_xfsckpxd, newFSCKSize);
 
 245                 PXDaddress(&j_sb->s_xlogpxd, newLogAddress);
 
 246                 PXDlength(&j_sb->s_xlogpxd, newLogSize);
 
 248                 /* synchronously update superblock */
 
 249                 mark_buffer_dirty(bh);
 
 250                 sync_dirty_buffer(bh);
 
 254                  * format new inline log synchronously;
 
 256                  * crash recovery: if log move in progress,
 
 257                  * reformat log and exit success;
 
 260                         if ((rc = lmLogFormat(log, newLogAddress, newLogSize)))
 
 266                 log->base = newLogAddress;
 
 267                 log->size = newLogSize >> (L2LOGPSIZE - sb->s_blocksize_bits);
 
 268                 if ((rc = lmLogInit(log)))
 
 273          *      extend block allocation map
 
 274          *      ---------------------------
 
 276          * extendfs() for new extension, retry after crash recovery;
 
 278          * note: both logredo() and fsck() rebuild map from
 
 279          * the bitmap and configuration parameter from superblock
 
 280          * (disregarding all other control information in the map);
 
 283          *  s_size: aggregate size in physical blocks;
 
 286          *      compute the new block allocation map configuration
 
 289          *  di_size: map file size in byte;
 
 290          *  di_nblocks: number of blocks allocated for map file;
 
 291          *  di_mapsize: number of blocks in aggregate (covered by map);
 
 293          *  db_mapsize: number of blocks in aggregate (covered by map);
 
 295         newMapSize = newFSSize;
 
 296         /* number of data pages of new bmap file:
 
 297          * roundup new size to full dmap page boundary and
 
 298          * add 1 extra dmap page for next extendfs()
 
 300         t64 = (newMapSize - 1) + BPERDMAP;
 
 301         newNpages = BLKTODMAPN(t64) + 1;
 
 304          *      extend map from current map (WITHOUT growing mapfile)
 
 306          * map new extension with unmapped part of the last partial
 
 307          * dmap page, if applicable, and extra page(s) allocated
 
 308          * at end of bmap by mkfs() or previous extendfs();
 
 311         /* compute number of blocks requested to extend */
 
 312         mapSize = bmp->db_mapsize;
 
 313         XAddress = mapSize;     /* eXtension Address */
 
 314         XSize = newMapSize - mapSize;   /* eXtension Size */
 
 315         old_agsize = bmp->db_agsize;    /* We need to know if this changes */
 
 317         /* compute number of blocks that can be extended by current mapfile */
 
 318         t64 = dbMapFileSizeToMapSize(ipbmap);
 
 320                 printk(KERN_ERR "jfs_extendfs: mapSize (0x%Lx) > t64 (0x%Lx)\n",
 
 321                        (long long) mapSize, (long long) t64);
 
 325         nblocks = min(t64 - mapSize, XSize);
 
 328          * update map pages for new extension:
 
 330          * update/init dmap and bubble up the control hierarchy
 
 331          * incrementally fold up dmaps into upper levels;
 
 332          * update bmap control page;
 
 334         if ((rc = dbExtendFS(ipbmap, XAddress, nblocks)))
 
 337          * the map now has extended to cover additional nblocks:
 
 338          * dn_mapsize = oldMapsize + nblocks;
 
 340         /* ipbmap->i_mapsize += nblocks; */
 
 344          *      grow map file to cover remaining extension
 
 345          *      and/or one extra dmap page for next extendfs();
 
 347          * allocate new map pages and its backing blocks, and
 
 348          * update map file xtree
 
 350         /* compute number of data pages of current bmap file */
 
 351         nPages = ipbmap->i_size >> L2PSIZE;
 
 353         /* need to grow map file ? */
 
 354         if (nPages == newNpages)
 
 358          * grow bmap file for the new map pages required:
 
 360          * allocate growth at the start of newly extended region;
 
 361          * bmap file only grows sequentially, i.e., both data pages
 
 362          * and possibly xtree index pages may grow in append mode,
 
 363          * s.t. logredo() can reconstruct pre-extension state
 
 364          * by washing away bmap file of pages outside s_size boundary;
 
 367          * journal map file growth as if a regular file growth:
 
 368          * (note: bmap is created with di_mode = IFJOURNAL|IFREG);
 
 370          * journaling of bmap file growth is not required since
 
 371          * logredo() do/can not use log records of bmap file growth
 
 372          * but it provides careful write semantics, pmap update, etc.;
 
 374         /* synchronous write of data pages: bmap data pages are
 
 375          * cached in meta-data cache, and not written out
 
 378         filemap_fdatawait(ipbmap->i_mapping);
 
 379         filemap_write_and_wait(ipbmap->i_mapping);
 
 380         diWriteSpecial(ipbmap, 0);
 
 382         newPage = nPages;       /* first new page number */
 
 383         xoff = newPage << sbi->l2nbperpage;
 
 384         xlen = (newNpages - nPages) << sbi->l2nbperpage;
 
 385         xlen = min(xlen, (int) nblocks) & ~(sbi->nbperpage - 1);
 
 388         tid = txBegin(sb, COMMIT_FORCE);
 
 390         if ((rc = xtAppend(tid, ipbmap, 0, xoff, nblocks, &xlen, &xaddr, 0))) {
 
 394         /* update bmap file size */
 
 395         ipbmap->i_size += xlen << sbi->l2bsize;
 
 396         inode_add_bytes(ipbmap, xlen << sbi->l2bsize);
 
 399         rc = txCommit(tid, 1, &iplist[0], COMMIT_FORCE);
 
 407          * map file has been grown now to cover extension to further out;
 
 408          * di_size = new map file size;
 
 410          * if huge extension, the previous extension based on previous
 
 411          * map file size may not have been sufficient to cover whole extension
 
 412          * (it could have been used up for new map pages),
 
 413          * but the newly grown map file now covers lot bigger new free space
 
 414          * available for further extension of map;
 
 416         /* any more blocks to extend ? */
 
 422         dbFinalizeBmap(ipbmap);
 
 425          *      update inode allocation map
 
 426          *      ---------------------------
 
 428          * move iag lists from old to new iag;
 
 429          * agstart field is not updated for logredo() to reconstruct
 
 430          * iag lists if system crash occurs.
 
 431          * (computation of ag number from agstart based on agsize
 
 432          * will correctly identify the new ag);
 
 434         /* if new AG size the same as old AG size, done! */
 
 435         if (bmp->db_agsize != old_agsize) {
 
 436                 if ((rc = diExtendFS(ipimap, ipbmap)))
 
 440                 if ((rc = diSync(ipimap)))
 
 448          * extension is committed when on-disk super block is
 
 449          * updated with new descriptors: logredo will recover
 
 450          * crash before it to pre-extension state;
 
 453         /* sync log to skip log replay of bmap file growth transaction; */
 
 454         /* lmLogSync(log, 1); */
 
 457          * synchronous write bmap global control page;
 
 458          * for crash before completion of write
 
 459          * logredo() will recover to pre-extendfs state;
 
 460          * for crash after completion of write,
 
 461          * logredo() will recover post-extendfs state;
 
 463         if ((rc = dbSync(ipbmap)))
 
 467          * copy primary bmap inode to secondary bmap inode
 
 470         ipbmap2 = diReadSpecial(sb, BMAP_I, 1);
 
 471         if (ipbmap2 == NULL) {
 
 472                 printk(KERN_ERR "jfs_extendfs: diReadSpecial(bmap) failed\n");
 
 475         memcpy(&JFS_IP(ipbmap2)->i_xtroot, &JFS_IP(ipbmap)->i_xtroot, 288);
 
 476         ipbmap2->i_size = ipbmap->i_size;
 
 477         ipbmap2->i_blocks = ipbmap->i_blocks;
 
 479         diWriteSpecial(ipbmap2, 1);
 
 480         diFreeSpecial(ipbmap2);
 
 485         if ((rc = readSuper(sb, &bh)))
 
 487         j_sb = (struct jfs_superblock *)bh->b_data;
 
 489         /* mark extendfs() completion */
 
 490         j_sb->s_state &= cpu_to_le32(~FM_EXTENDFS);
 
 491         j_sb->s_size = cpu_to_le64(bmp->db_mapsize <<
 
 492                                    le16_to_cpu(j_sb->s_l2bfactor));
 
 493         j_sb->s_agsize = cpu_to_le32(bmp->db_agsize);
 
 495         /* update inline log space descriptor */
 
 496         if (sbi->mntflag & JFS_INLINELOG) {
 
 497                 PXDaddress(&(j_sb->s_logpxd), newLogAddress);
 
 498                 PXDlength(&(j_sb->s_logpxd), newLogSize);
 
 501         /* record log's mount serial number */
 
 502         j_sb->s_logserial = cpu_to_le32(log->serial);
 
 504         /* update fsck work space descriptor */
 
 505         PXDaddress(&(j_sb->s_fsckpxd), newFSCKAddress);
 
 506         PXDlength(&(j_sb->s_fsckpxd), newFSCKSize);
 
 508         /* sb->s_fsckloglen remains the same */
 
 510         /* Update secondary superblock */
 
 511         bh2 = sb_bread(sb, SUPER2_OFF >> sb->s_blocksize_bits);
 
 513                 j_sb2 = (struct jfs_superblock *)bh2->b_data;
 
 514                 memcpy(j_sb2, j_sb, sizeof (struct jfs_superblock));
 
 516                 mark_buffer_dirty(bh);
 
 517                 sync_dirty_buffer(bh2);
 
 521         /* write primary superblock */
 
 522         mark_buffer_dirty(bh);
 
 523         sync_dirty_buffer(bh);
 
 529         jfs_error(sb, "jfs_extendfs");
 
 533          *      resume file system transactions