Merge with /home/shaggy/git/linus-clean/
[linux-2.6] / drivers / message / i2o / i2o_block.c
1 /*
2  *      Block OSM
3  *
4  *      Copyright (C) 1999-2002 Red Hat Software
5  *
6  *      Written by Alan Cox, Building Number Three Ltd
7  *
8  *      This program is free software; you can redistribute it and/or modify it
9  *      under the terms of the GNU General Public License as published by the
10  *      Free Software Foundation; either version 2 of the License, or (at your
11  *      option) any later version.
12  *
13  *      This program is distributed in the hope that it will be useful, but
14  *      WITHOUT ANY WARRANTY; without even the implied warranty of
15  *      MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  *      General Public License for more details.
17  *
18  *      For the purpose of avoiding doubt the preferred form of the work
19  *      for making modifications shall be a standards compliant form such
20  *      gzipped tar and not one requiring a proprietary or patent encumbered
21  *      tool to unpack.
22  *
23  *      Fixes/additions:
24  *              Steve Ralston:
25  *                      Multiple device handling error fixes,
26  *                      Added a queue depth.
27  *              Alan Cox:
28  *                      FC920 has an rmw bug. Dont or in the end marker.
29  *                      Removed queue walk, fixed for 64bitness.
30  *                      Rewrote much of the code over time
31  *                      Added indirect block lists
32  *                      Handle 64K limits on many controllers
33  *                      Don't use indirects on the Promise (breaks)
34  *                      Heavily chop down the queue depths
35  *              Deepak Saxena:
36  *                      Independent queues per IOP
37  *                      Support for dynamic device creation/deletion
38  *                      Code cleanup
39  *                      Support for larger I/Os through merge* functions
40  *                      (taken from DAC960 driver)
41  *              Boji T Kannanthanam:
42  *                      Set the I2O Block devices to be detected in increasing
43  *                      order of TIDs during boot.
44  *                      Search and set the I2O block device that we boot off
45  *                      from as the first device to be claimed (as /dev/i2o/hda)
46  *                      Properly attach/detach I2O gendisk structure from the
47  *                      system gendisk list. The I2O block devices now appear in
48  *                      /proc/partitions.
49  *              Markus Lidel <Markus.Lidel@shadowconnect.com>:
50  *                      Minor bugfixes for 2.6.
51  */
52
53 #include <linux/module.h>
54 #include <linux/i2o.h>
55
56 #include <linux/mempool.h>
57
58 #include <linux/genhd.h>
59 #include <linux/blkdev.h>
60 #include <linux/hdreg.h>
61
62 #include <scsi/scsi.h>
63
64 #include "i2o_block.h"
65
66 #define OSM_NAME        "block-osm"
67 #define OSM_VERSION     "1.325"
68 #define OSM_DESCRIPTION "I2O Block Device OSM"
69
70 static struct i2o_driver i2o_block_driver;
71
72 /* global Block OSM request mempool */
73 static struct i2o_block_mempool i2o_blk_req_pool;
74
75 /* Block OSM class handling definition */
76 static struct i2o_class_id i2o_block_class_id[] = {
77         {I2O_CLASS_RANDOM_BLOCK_STORAGE},
78         {I2O_CLASS_END}
79 };
80
81 /**
82  *      i2o_block_device_free - free the memory of the I2O Block device
83  *      @dev: I2O Block device, which should be cleaned up
84  *
85  *      Frees the request queue, gendisk and the i2o_block_device structure.
86  */
87 static void i2o_block_device_free(struct i2o_block_device *dev)
88 {
89         blk_cleanup_queue(dev->gd->queue);
90
91         put_disk(dev->gd);
92
93         kfree(dev);
94 };
95
96 /**
97  *      i2o_block_remove - remove the I2O Block device from the system again
98  *      @dev: I2O Block device which should be removed
99  *
100  *      Remove gendisk from system and free all allocated memory.
101  *
102  *      Always returns 0.
103  */
104 static int i2o_block_remove(struct device *dev)
105 {
106         struct i2o_device *i2o_dev = to_i2o_device(dev);
107         struct i2o_block_device *i2o_blk_dev = dev_get_drvdata(dev);
108
109         osm_info("device removed (TID: %03x): %s\n", i2o_dev->lct_data.tid,
110                  i2o_blk_dev->gd->disk_name);
111
112         i2o_event_register(i2o_dev, &i2o_block_driver, 0, 0);
113
114         del_gendisk(i2o_blk_dev->gd);
115
116         dev_set_drvdata(dev, NULL);
117
118         i2o_device_claim_release(i2o_dev);
119
120         i2o_block_device_free(i2o_blk_dev);
121
122         return 0;
123 };
124
125 /**
126  *      i2o_block_device flush - Flush all dirty data of I2O device dev
127  *      @dev: I2O device which should be flushed
128  *
129  *      Flushes all dirty data on device dev.
130  *
131  *      Returns 0 on success or negative error code on failure.
132  */
133 static int i2o_block_device_flush(struct i2o_device *dev)
134 {
135         struct i2o_message *msg;
136
137         msg = i2o_msg_get_wait(dev->iop, I2O_TIMEOUT_MESSAGE_GET);
138         if (IS_ERR(msg))
139                 return PTR_ERR(msg);
140
141         msg->u.head[0] = cpu_to_le32(FIVE_WORD_MSG_SIZE | SGL_OFFSET_0);
142         msg->u.head[1] =
143             cpu_to_le32(I2O_CMD_BLOCK_CFLUSH << 24 | HOST_TID << 12 | dev->
144                         lct_data.tid);
145         msg->body[0] = cpu_to_le32(60 << 16);
146         osm_debug("Flushing...\n");
147
148         return i2o_msg_post_wait(dev->iop, msg, 60);
149 };
150
151 /**
152  *      i2o_block_issue_flush - device-flush interface for block-layer
153  *      @queue: the request queue of the device which should be flushed
154  *      @disk: gendisk
155  *      @error_sector: error offset
156  *
157  *      Helper function to provide flush functionality to block-layer.
158  *
159  *      Returns 0 on success or negative error code on failure.
160  */
161
162 static int i2o_block_issue_flush(request_queue_t * queue, struct gendisk *disk,
163                                  sector_t * error_sector)
164 {
165         struct i2o_block_device *i2o_blk_dev = queue->queuedata;
166         int rc = -ENODEV;
167
168         if (likely(i2o_blk_dev))
169                 rc = i2o_block_device_flush(i2o_blk_dev->i2o_dev);
170
171         return rc;
172 }
173
174 /**
175  *      i2o_block_device_mount - Mount (load) the media of device dev
176  *      @dev: I2O device which should receive the mount request
177  *      @media_id: Media Identifier
178  *
179  *      Load a media into drive. Identifier should be set to -1, because the
180  *      spec does not support any other value.
181  *
182  *      Returns 0 on success or negative error code on failure.
183  */
184 static int i2o_block_device_mount(struct i2o_device *dev, u32 media_id)
185 {
186         struct i2o_message *msg;
187
188         msg = i2o_msg_get_wait(dev->iop, I2O_TIMEOUT_MESSAGE_GET);
189         if (IS_ERR(msg))
190                 return PTR_ERR(msg);
191
192         msg->u.head[0] = cpu_to_le32(FIVE_WORD_MSG_SIZE | SGL_OFFSET_0);
193         msg->u.head[1] =
194             cpu_to_le32(I2O_CMD_BLOCK_MMOUNT << 24 | HOST_TID << 12 | dev->
195                         lct_data.tid);
196         msg->body[0] = cpu_to_le32(-1);
197         msg->body[1] = cpu_to_le32(0x00000000);
198         osm_debug("Mounting...\n");
199
200         return i2o_msg_post_wait(dev->iop, msg, 2);
201 };
202
203 /**
204  *      i2o_block_device_lock - Locks the media of device dev
205  *      @dev: I2O device which should receive the lock request
206  *      @media_id: Media Identifier
207  *
208  *      Lock media of device dev to prevent removal. The media identifier
209  *      should be set to -1, because the spec does not support any other value.
210  *
211  *      Returns 0 on success or negative error code on failure.
212  */
213 static int i2o_block_device_lock(struct i2o_device *dev, u32 media_id)
214 {
215         struct i2o_message *msg;
216
217         msg = i2o_msg_get_wait(dev->iop, I2O_TIMEOUT_MESSAGE_GET);
218         if (IS_ERR(msg) == I2O_QUEUE_EMPTY)
219                 return PTR_ERR(msg);
220
221         msg->u.head[0] = cpu_to_le32(FIVE_WORD_MSG_SIZE | SGL_OFFSET_0);
222         msg->u.head[1] =
223             cpu_to_le32(I2O_CMD_BLOCK_MLOCK << 24 | HOST_TID << 12 | dev->
224                         lct_data.tid);
225         msg->body[0] = cpu_to_le32(-1);
226         osm_debug("Locking...\n");
227
228         return i2o_msg_post_wait(dev->iop, msg, 2);
229 };
230
231 /**
232  *      i2o_block_device_unlock - Unlocks the media of device dev
233  *      @dev: I2O device which should receive the unlocked request
234  *      @media_id: Media Identifier
235  *
236  *      Unlocks the media in device dev. The media identifier should be set to
237  *      -1, because the spec does not support any other value.
238  *
239  *      Returns 0 on success or negative error code on failure.
240  */
241 static int i2o_block_device_unlock(struct i2o_device *dev, u32 media_id)
242 {
243         struct i2o_message *msg;
244
245         msg = i2o_msg_get_wait(dev->iop, I2O_TIMEOUT_MESSAGE_GET);
246         if (IS_ERR(msg))
247                 return PTR_ERR(msg);
248
249         msg->u.head[0] = cpu_to_le32(FIVE_WORD_MSG_SIZE | SGL_OFFSET_0);
250         msg->u.head[1] =
251             cpu_to_le32(I2O_CMD_BLOCK_MUNLOCK << 24 | HOST_TID << 12 | dev->
252                         lct_data.tid);
253         msg->body[0] = cpu_to_le32(media_id);
254         osm_debug("Unlocking...\n");
255
256         return i2o_msg_post_wait(dev->iop, msg, 2);
257 };
258
259 /**
260  *      i2o_block_device_power - Power management for device dev
261  *      @dev: I2O device which should receive the power management request
262  *      @operation: Operation which should be send
263  *
264  *      Send a power management request to the device dev.
265  *
266  *      Returns 0 on success or negative error code on failure.
267  */
268 static int i2o_block_device_power(struct i2o_block_device *dev, u8 op)
269 {
270         struct i2o_device *i2o_dev = dev->i2o_dev;
271         struct i2o_controller *c = i2o_dev->iop;
272         struct i2o_message *msg;
273         int rc;
274
275         msg = i2o_msg_get_wait(c, I2O_TIMEOUT_MESSAGE_GET);
276         if (IS_ERR(msg))
277                 return PTR_ERR(msg);
278
279         msg->u.head[0] = cpu_to_le32(FOUR_WORD_MSG_SIZE | SGL_OFFSET_0);
280         msg->u.head[1] =
281             cpu_to_le32(I2O_CMD_BLOCK_POWER << 24 | HOST_TID << 12 | i2o_dev->
282                         lct_data.tid);
283         msg->body[0] = cpu_to_le32(op << 24);
284         osm_debug("Power...\n");
285
286         rc = i2o_msg_post_wait(c, msg, 60);
287         if (!rc)
288                 dev->power = op;
289
290         return rc;
291 };
292
293 /**
294  *      i2o_block_request_alloc - Allocate an I2O block request struct
295  *
296  *      Allocates an I2O block request struct and initialize the list.
297  *
298  *      Returns a i2o_block_request pointer on success or negative error code
299  *      on failure.
300  */
301 static inline struct i2o_block_request *i2o_block_request_alloc(void)
302 {
303         struct i2o_block_request *ireq;
304
305         ireq = mempool_alloc(i2o_blk_req_pool.pool, GFP_ATOMIC);
306         if (!ireq)
307                 return ERR_PTR(-ENOMEM);
308
309         INIT_LIST_HEAD(&ireq->queue);
310
311         return ireq;
312 };
313
314 /**
315  *      i2o_block_request_free - Frees a I2O block request
316  *      @ireq: I2O block request which should be freed
317  *
318  *      Fres the allocated memory (give it back to the request mempool).
319  */
320 static inline void i2o_block_request_free(struct i2o_block_request *ireq)
321 {
322         mempool_free(ireq, i2o_blk_req_pool.pool);
323 };
324
325 /**
326  *      i2o_block_sglist_alloc - Allocate the SG list and map it
327  *      @c: I2O controller to which the request belongs
328  *      @ireq: I2O block request
329  *
330  *      Builds the SG list and map it to be accessable by the controller.
331  *
332  *      Returns 0 on failure or 1 on success.
333  */
334 static inline int i2o_block_sglist_alloc(struct i2o_controller *c,
335                                          struct i2o_block_request *ireq,
336                                          u32 ** mptr)
337 {
338         int nents;
339         enum dma_data_direction direction;
340
341         ireq->dev = &c->pdev->dev;
342         nents = blk_rq_map_sg(ireq->req->q, ireq->req, ireq->sg_table);
343
344         if (rq_data_dir(ireq->req) == READ)
345                 direction = PCI_DMA_FROMDEVICE;
346         else
347                 direction = PCI_DMA_TODEVICE;
348
349         ireq->sg_nents = nents;
350
351         return i2o_dma_map_sg(c, ireq->sg_table, nents, direction, mptr);
352 };
353
354 /**
355  *      i2o_block_sglist_free - Frees the SG list
356  *      @ireq: I2O block request from which the SG should be freed
357  *
358  *      Frees the SG list from the I2O block request.
359  */
360 static inline void i2o_block_sglist_free(struct i2o_block_request *ireq)
361 {
362         enum dma_data_direction direction;
363
364         if (rq_data_dir(ireq->req) == READ)
365                 direction = PCI_DMA_FROMDEVICE;
366         else
367                 direction = PCI_DMA_TODEVICE;
368
369         dma_unmap_sg(ireq->dev, ireq->sg_table, ireq->sg_nents, direction);
370 };
371
372 /**
373  *      i2o_block_prep_req_fn - Allocates I2O block device specific struct
374  *      @q: request queue for the request
375  *      @req: the request to prepare
376  *
377  *      Allocate the necessary i2o_block_request struct and connect it to
378  *      the request. This is needed that we not loose the SG list later on.
379  *
380  *      Returns BLKPREP_OK on success or BLKPREP_DEFER on failure.
381  */
382 static int i2o_block_prep_req_fn(struct request_queue *q, struct request *req)
383 {
384         struct i2o_block_device *i2o_blk_dev = q->queuedata;
385         struct i2o_block_request *ireq;
386
387         if (unlikely(!i2o_blk_dev)) {
388                 osm_err("block device already removed\n");
389                 return BLKPREP_KILL;
390         }
391
392         /* request is already processed by us, so return */
393         if (req->flags & REQ_SPECIAL) {
394                 osm_debug("REQ_SPECIAL already set!\n");
395                 req->flags |= REQ_DONTPREP;
396                 return BLKPREP_OK;
397         }
398
399         /* connect the i2o_block_request to the request */
400         if (!req->special) {
401                 ireq = i2o_block_request_alloc();
402                 if (unlikely(IS_ERR(ireq))) {
403                         osm_debug("unable to allocate i2o_block_request!\n");
404                         return BLKPREP_DEFER;
405                 }
406
407                 ireq->i2o_blk_dev = i2o_blk_dev;
408                 req->special = ireq;
409                 ireq->req = req;
410         } else
411                 ireq = req->special;
412
413         /* do not come back here */
414         req->flags |= REQ_DONTPREP | REQ_SPECIAL;
415
416         return BLKPREP_OK;
417 };
418
419 /**
420  *      i2o_block_delayed_request_fn - delayed request queue function
421  *      delayed_request: the delayed request with the queue to start
422  *
423  *      If the request queue is stopped for a disk, and there is no open
424  *      request, a new event is created, which calls this function to start
425  *      the queue after I2O_BLOCK_REQUEST_TIME. Otherwise the queue will never
426  *      be started again.
427  */
428 static void i2o_block_delayed_request_fn(void *delayed_request)
429 {
430         struct i2o_block_delayed_request *dreq = delayed_request;
431         struct request_queue *q = dreq->queue;
432         unsigned long flags;
433
434         spin_lock_irqsave(q->queue_lock, flags);
435         blk_start_queue(q);
436         spin_unlock_irqrestore(q->queue_lock, flags);
437         kfree(dreq);
438 };
439
440 /**
441  *      i2o_block_end_request - Post-processing of completed commands
442  *      @req: request which should be completed
443  *      @uptodate: 1 for success, 0 for I/O error, < 0 for specific error
444  *      @nr_bytes: number of bytes to complete
445  *
446  *      Mark the request as complete. The lock must not be held when entering.
447  *
448  */
449 static void i2o_block_end_request(struct request *req, int uptodate,
450                                   int nr_bytes)
451 {
452         struct i2o_block_request *ireq = req->special;
453         struct i2o_block_device *dev = ireq->i2o_blk_dev;
454         request_queue_t *q = req->q;
455         unsigned long flags;
456
457         if (end_that_request_chunk(req, uptodate, nr_bytes)) {
458                 int leftover = (req->hard_nr_sectors << KERNEL_SECTOR_SHIFT);
459
460                 if (blk_pc_request(req))
461                         leftover = req->data_len;
462
463                 if (end_io_error(uptodate))
464                         end_that_request_chunk(req, 0, leftover);
465         }
466
467         add_disk_randomness(req->rq_disk);
468
469         spin_lock_irqsave(q->queue_lock, flags);
470
471         end_that_request_last(req, uptodate);
472
473         if (likely(dev)) {
474                 dev->open_queue_depth--;
475                 list_del(&ireq->queue);
476         }
477
478         blk_start_queue(q);
479
480         spin_unlock_irqrestore(q->queue_lock, flags);
481
482         i2o_block_sglist_free(ireq);
483         i2o_block_request_free(ireq);
484 };
485
486 /**
487  *      i2o_block_reply - Block OSM reply handler.
488  *      @c: I2O controller from which the message arrives
489  *      @m: message id of reply
490  *      qmsg: the actuall I2O message reply
491  *
492  *      This function gets all the message replies.
493  *
494  */
495 static int i2o_block_reply(struct i2o_controller *c, u32 m,
496                            struct i2o_message *msg)
497 {
498         struct request *req;
499         int uptodate = 1;
500
501         req = i2o_cntxt_list_get(c, le32_to_cpu(msg->u.s.tcntxt));
502         if (unlikely(!req)) {
503                 osm_err("NULL reply received!\n");
504                 return -1;
505         }
506
507         /*
508          *      Lets see what is cooking. We stuffed the
509          *      request in the context.
510          */
511
512         if ((le32_to_cpu(msg->body[0]) >> 24) != 0) {
513                 u32 status = le32_to_cpu(msg->body[0]);
514                 /*
515                  *      Device not ready means two things. One is that the
516                  *      the thing went offline (but not a removal media)
517                  *
518                  *      The second is that you have a SuperTrak 100 and the
519                  *      firmware got constipated. Unlike standard i2o card
520                  *      setups the supertrak returns an error rather than
521                  *      blocking for the timeout in these cases.
522                  *
523                  *      Don't stick a supertrak100 into cache aggressive modes
524                  */
525
526                 osm_err("TID %03x error status: 0x%02x, detailed status: "
527                         "0x%04x\n", (le32_to_cpu(msg->u.head[1]) >> 12 & 0xfff),
528                         status >> 24, status & 0xffff);
529
530                 req->errors++;
531
532                 uptodate = 0;
533         }
534
535         i2o_block_end_request(req, uptodate, le32_to_cpu(msg->body[1]));
536
537         return 1;
538 };
539
540 static void i2o_block_event(struct i2o_event *evt)
541 {
542         osm_debug("event received\n");
543         kfree(evt);
544 };
545
546 /*
547  *      SCSI-CAM for ioctl geometry mapping
548  *      Duplicated with SCSI - this should be moved into somewhere common
549  *      perhaps genhd ?
550  *
551  * LBA -> CHS mapping table taken from:
552  *
553  * "Incorporating the I2O Architecture into BIOS for Intel Architecture
554  *  Platforms"
555  *
556  * This is an I2O document that is only available to I2O members,
557  * not developers.
558  *
559  * From my understanding, this is how all the I2O cards do this
560  *
561  * Disk Size      | Sectors | Heads | Cylinders
562  * ---------------+---------+-------+-------------------
563  * 1 < X <= 528M  | 63      | 16    | X/(63 * 16 * 512)
564  * 528M < X <= 1G | 63      | 32    | X/(63 * 32 * 512)
565  * 1 < X <528M    | 63      | 16    | X/(63 * 16 * 512)
566  * 1 < X <528M    | 63      | 16    | X/(63 * 16 * 512)
567  *
568  */
569 #define BLOCK_SIZE_528M         1081344
570 #define BLOCK_SIZE_1G           2097152
571 #define BLOCK_SIZE_21G          4403200
572 #define BLOCK_SIZE_42G          8806400
573 #define BLOCK_SIZE_84G          17612800
574
575 static void i2o_block_biosparam(unsigned long capacity, unsigned short *cyls,
576                                 unsigned char *hds, unsigned char *secs)
577 {
578         unsigned long heads, sectors, cylinders;
579
580         sectors = 63L;          /* Maximize sectors per track */
581         if (capacity <= BLOCK_SIZE_528M)
582                 heads = 16;
583         else if (capacity <= BLOCK_SIZE_1G)
584                 heads = 32;
585         else if (capacity <= BLOCK_SIZE_21G)
586                 heads = 64;
587         else if (capacity <= BLOCK_SIZE_42G)
588                 heads = 128;
589         else
590                 heads = 255;
591
592         cylinders = (unsigned long)capacity / (heads * sectors);
593
594         *cyls = (unsigned short)cylinders;      /* Stuff return values */
595         *secs = (unsigned char)sectors;
596         *hds = (unsigned char)heads;
597 }
598
599 /**
600  *      i2o_block_open - Open the block device
601  *
602  *      Power up the device, mount and lock the media. This function is called,
603  *      if the block device is opened for access.
604  *
605  *      Returns 0 on success or negative error code on failure.
606  */
607 static int i2o_block_open(struct inode *inode, struct file *file)
608 {
609         struct i2o_block_device *dev = inode->i_bdev->bd_disk->private_data;
610
611         if (!dev->i2o_dev)
612                 return -ENODEV;
613
614         if (dev->power > 0x1f)
615                 i2o_block_device_power(dev, 0x02);
616
617         i2o_block_device_mount(dev->i2o_dev, -1);
618
619         i2o_block_device_lock(dev->i2o_dev, -1);
620
621         osm_debug("Ready.\n");
622
623         return 0;
624 };
625
626 /**
627  *      i2o_block_release - Release the I2O block device
628  *
629  *      Unlock and unmount the media, and power down the device. Gets called if
630  *      the block device is closed.
631  *
632  *      Returns 0 on success or negative error code on failure.
633  */
634 static int i2o_block_release(struct inode *inode, struct file *file)
635 {
636         struct gendisk *disk = inode->i_bdev->bd_disk;
637         struct i2o_block_device *dev = disk->private_data;
638         u8 operation;
639
640         /*
641          * This is to deail with the case of an application
642          * opening a device and then the device dissapears while
643          * it's in use, and then the application tries to release
644          * it.  ex: Unmounting a deleted RAID volume at reboot.
645          * If we send messages, it will just cause FAILs since
646          * the TID no longer exists.
647          */
648         if (!dev->i2o_dev)
649                 return 0;
650
651         i2o_block_device_flush(dev->i2o_dev);
652
653         i2o_block_device_unlock(dev->i2o_dev, -1);
654
655         if (dev->flags & (1 << 3 | 1 << 4))     /* Removable */
656                 operation = 0x21;
657         else
658                 operation = 0x24;
659
660         i2o_block_device_power(dev, operation);
661
662         return 0;
663 }
664
665 static int i2o_block_getgeo(struct block_device *bdev, struct hd_geometry *geo)
666 {
667         i2o_block_biosparam(get_capacity(bdev->bd_disk),
668                             &geo->cylinders, &geo->heads, &geo->sectors);
669         return 0;
670 }
671
672 /**
673  *      i2o_block_ioctl - Issue device specific ioctl calls.
674  *      @cmd: ioctl command
675  *      @arg: arg
676  *
677  *      Handles ioctl request for the block device.
678  *
679  *      Return 0 on success or negative error on failure.
680  */
681 static int i2o_block_ioctl(struct inode *inode, struct file *file,
682                            unsigned int cmd, unsigned long arg)
683 {
684         struct gendisk *disk = inode->i_bdev->bd_disk;
685         struct i2o_block_device *dev = disk->private_data;
686
687         /* Anyone capable of this syscall can do *real bad* things */
688
689         if (!capable(CAP_SYS_ADMIN))
690                 return -EPERM;
691
692         switch (cmd) {
693         case BLKI2OGRSTRAT:
694                 return put_user(dev->rcache, (int __user *)arg);
695         case BLKI2OGWSTRAT:
696                 return put_user(dev->wcache, (int __user *)arg);
697         case BLKI2OSRSTRAT:
698                 if (arg < 0 || arg > CACHE_SMARTFETCH)
699                         return -EINVAL;
700                 dev->rcache = arg;
701                 break;
702         case BLKI2OSWSTRAT:
703                 if (arg != 0
704                     && (arg < CACHE_WRITETHROUGH || arg > CACHE_SMARTBACK))
705                         return -EINVAL;
706                 dev->wcache = arg;
707                 break;
708         }
709         return -ENOTTY;
710 };
711
712 /**
713  *      i2o_block_media_changed - Have we seen a media change?
714  *      @disk: gendisk which should be verified
715  *
716  *      Verifies if the media has changed.
717  *
718  *      Returns 1 if the media was changed or 0 otherwise.
719  */
720 static int i2o_block_media_changed(struct gendisk *disk)
721 {
722         struct i2o_block_device *p = disk->private_data;
723
724         if (p->media_change_flag) {
725                 p->media_change_flag = 0;
726                 return 1;
727         }
728         return 0;
729 }
730
731 /**
732  *      i2o_block_transfer - Transfer a request to/from the I2O controller
733  *      @req: the request which should be transfered
734  *
735  *      This function converts the request into a I2O message. The necessary
736  *      DMA buffers are allocated and after everything is setup post the message
737  *      to the I2O controller. No cleanup is done by this function. It is done
738  *      on the interrupt side when the reply arrives.
739  *
740  *      Return 0 on success or negative error code on failure.
741  */
742 static int i2o_block_transfer(struct request *req)
743 {
744         struct i2o_block_device *dev = req->rq_disk->private_data;
745         struct i2o_controller *c;
746         int tid = dev->i2o_dev->lct_data.tid;
747         struct i2o_message *msg;
748         u32 *mptr;
749         struct i2o_block_request *ireq = req->special;
750         u32 tcntxt;
751         u32 sgl_offset = SGL_OFFSET_8;
752         u32 ctl_flags = 0x00000000;
753         int rc;
754         u32 cmd;
755
756         if (unlikely(!dev->i2o_dev)) {
757                 osm_err("transfer to removed drive\n");
758                 rc = -ENODEV;
759                 goto exit;
760         }
761
762         c = dev->i2o_dev->iop;
763
764         msg = i2o_msg_get(c);
765         if (IS_ERR(msg)) {
766                 rc = PTR_ERR(msg);
767                 goto exit;
768         }
769
770         tcntxt = i2o_cntxt_list_add(c, req);
771         if (!tcntxt) {
772                 rc = -ENOMEM;
773                 goto nop_msg;
774         }
775
776         msg->u.s.icntxt = cpu_to_le32(i2o_block_driver.context);
777         msg->u.s.tcntxt = cpu_to_le32(tcntxt);
778
779         mptr = &msg->body[0];
780
781         if (rq_data_dir(req) == READ) {
782                 cmd = I2O_CMD_BLOCK_READ << 24;
783
784                 switch (dev->rcache) {
785                 case CACHE_PREFETCH:
786                         ctl_flags = 0x201F0008;
787                         break;
788
789                 case CACHE_SMARTFETCH:
790                         if (req->nr_sectors > 16)
791                                 ctl_flags = 0x201F0008;
792                         else
793                                 ctl_flags = 0x001F0000;
794                         break;
795
796                 default:
797                         break;
798                 }
799         } else {
800                 cmd = I2O_CMD_BLOCK_WRITE << 24;
801
802                 switch (dev->wcache) {
803                 case CACHE_WRITETHROUGH:
804                         ctl_flags = 0x001F0008;
805                         break;
806                 case CACHE_WRITEBACK:
807                         ctl_flags = 0x001F0010;
808                         break;
809                 case CACHE_SMARTBACK:
810                         if (req->nr_sectors > 16)
811                                 ctl_flags = 0x001F0004;
812                         else
813                                 ctl_flags = 0x001F0010;
814                         break;
815                 case CACHE_SMARTTHROUGH:
816                         if (req->nr_sectors > 16)
817                                 ctl_flags = 0x001F0004;
818                         else
819                                 ctl_flags = 0x001F0010;
820                 default:
821                         break;
822                 }
823         }
824
825 #ifdef CONFIG_I2O_EXT_ADAPTEC
826         if (c->adaptec) {
827                 u8 cmd[10];
828                 u32 scsi_flags;
829                 u16 hwsec = queue_hardsect_size(req->q) >> KERNEL_SECTOR_SHIFT;
830
831                 memset(cmd, 0, 10);
832
833                 sgl_offset = SGL_OFFSET_12;
834
835                 msg->u.head[1] =
836                     cpu_to_le32(I2O_CMD_PRIVATE << 24 | HOST_TID << 12 | tid);
837
838                 *mptr++ = cpu_to_le32(I2O_VENDOR_DPT << 16 | I2O_CMD_SCSI_EXEC);
839                 *mptr++ = cpu_to_le32(tid);
840
841                 /*
842                  * ENABLE_DISCONNECT
843                  * SIMPLE_TAG
844                  * RETURN_SENSE_DATA_IN_REPLY_MESSAGE_FRAME
845                  */
846                 if (rq_data_dir(req) == READ) {
847                         cmd[0] = READ_10;
848                         scsi_flags = 0x60a0000a;
849                 } else {
850                         cmd[0] = WRITE_10;
851                         scsi_flags = 0xa0a0000a;
852                 }
853
854                 *mptr++ = cpu_to_le32(scsi_flags);
855
856                 *((u32 *) & cmd[2]) = cpu_to_be32(req->sector * hwsec);
857                 *((u16 *) & cmd[7]) = cpu_to_be16(req->nr_sectors * hwsec);
858
859                 memcpy(mptr, cmd, 10);
860                 mptr += 4;
861                 *mptr++ = cpu_to_le32(req->nr_sectors << KERNEL_SECTOR_SHIFT);
862         } else
863 #endif
864         {
865                 msg->u.head[1] = cpu_to_le32(cmd | HOST_TID << 12 | tid);
866                 *mptr++ = cpu_to_le32(ctl_flags);
867                 *mptr++ = cpu_to_le32(req->nr_sectors << KERNEL_SECTOR_SHIFT);
868                 *mptr++ =
869                     cpu_to_le32((u32) (req->sector << KERNEL_SECTOR_SHIFT));
870                 *mptr++ =
871                     cpu_to_le32(req->sector >> (32 - KERNEL_SECTOR_SHIFT));
872         }
873
874         if (!i2o_block_sglist_alloc(c, ireq, &mptr)) {
875                 rc = -ENOMEM;
876                 goto context_remove;
877         }
878
879         msg->u.head[0] =
880             cpu_to_le32(I2O_MESSAGE_SIZE(mptr - &msg->u.head[0]) | sgl_offset);
881
882         list_add_tail(&ireq->queue, &dev->open_queue);
883         dev->open_queue_depth++;
884
885         i2o_msg_post(c, msg);
886
887         return 0;
888
889       context_remove:
890         i2o_cntxt_list_remove(c, req);
891
892       nop_msg:
893         i2o_msg_nop(c, msg);
894
895       exit:
896         return rc;
897 };
898
899 /**
900  *      i2o_block_request_fn - request queue handling function
901  *      q: request queue from which the request could be fetched
902  *
903  *      Takes the next request from the queue, transfers it and if no error
904  *      occurs dequeue it from the queue. On arrival of the reply the message
905  *      will be processed further. If an error occurs requeue the request.
906  */
907 static void i2o_block_request_fn(struct request_queue *q)
908 {
909         struct request *req;
910
911         while (!blk_queue_plugged(q)) {
912                 req = elv_next_request(q);
913                 if (!req)
914                         break;
915
916                 if (blk_fs_request(req)) {
917                         struct i2o_block_delayed_request *dreq;
918                         struct i2o_block_request *ireq = req->special;
919                         unsigned int queue_depth;
920
921                         queue_depth = ireq->i2o_blk_dev->open_queue_depth;
922
923                         if (queue_depth < I2O_BLOCK_MAX_OPEN_REQUESTS) {
924                                 if (!i2o_block_transfer(req)) {
925                                         blkdev_dequeue_request(req);
926                                         continue;
927                                 } else
928                                         osm_info("transfer error\n");
929                         }
930
931                         if (queue_depth)
932                                 break;
933
934                         /* stop the queue and retry later */
935                         dreq = kmalloc(sizeof(*dreq), GFP_ATOMIC);
936                         if (!dreq)
937                                 continue;
938
939                         dreq->queue = q;
940                         INIT_WORK(&dreq->work, i2o_block_delayed_request_fn,
941                                   dreq);
942
943                         if (!queue_delayed_work(i2o_block_driver.event_queue,
944                                                 &dreq->work,
945                                                 I2O_BLOCK_RETRY_TIME))
946                                 kfree(dreq);
947                         else {
948                                 blk_stop_queue(q);
949                                 break;
950                         }
951                 } else
952                         end_request(req, 0);
953         }
954 };
955
956 /* I2O Block device operations definition */
957 static struct block_device_operations i2o_block_fops = {
958         .owner = THIS_MODULE,
959         .open = i2o_block_open,
960         .release = i2o_block_release,
961         .ioctl = i2o_block_ioctl,
962         .getgeo = i2o_block_getgeo,
963         .media_changed = i2o_block_media_changed
964 };
965
966 /**
967  *      i2o_block_device_alloc - Allocate memory for a I2O Block device
968  *
969  *      Allocate memory for the i2o_block_device struct, gendisk and request
970  *      queue and initialize them as far as no additional information is needed.
971  *
972  *      Returns a pointer to the allocated I2O Block device on succes or a
973  *      negative error code on failure.
974  */
975 static struct i2o_block_device *i2o_block_device_alloc(void)
976 {
977         struct i2o_block_device *dev;
978         struct gendisk *gd;
979         struct request_queue *queue;
980         int rc;
981
982         dev = kzalloc(sizeof(*dev), GFP_KERNEL);
983         if (!dev) {
984                 osm_err("Insufficient memory to allocate I2O Block disk.\n");
985                 rc = -ENOMEM;
986                 goto exit;
987         }
988
989         INIT_LIST_HEAD(&dev->open_queue);
990         spin_lock_init(&dev->lock);
991         dev->rcache = CACHE_PREFETCH;
992         dev->wcache = CACHE_WRITEBACK;
993
994         /* allocate a gendisk with 16 partitions */
995         gd = alloc_disk(16);
996         if (!gd) {
997                 osm_err("Insufficient memory to allocate gendisk.\n");
998                 rc = -ENOMEM;
999                 goto cleanup_dev;
1000         }
1001
1002         /* initialize the request queue */
1003         queue = blk_init_queue(i2o_block_request_fn, &dev->lock);
1004         if (!queue) {
1005                 osm_err("Insufficient memory to allocate request queue.\n");
1006                 rc = -ENOMEM;
1007                 goto cleanup_queue;
1008         }
1009
1010         blk_queue_prep_rq(queue, i2o_block_prep_req_fn);
1011         blk_queue_issue_flush_fn(queue, i2o_block_issue_flush);
1012
1013         gd->major = I2O_MAJOR;
1014         gd->queue = queue;
1015         gd->fops = &i2o_block_fops;
1016         gd->private_data = dev;
1017
1018         dev->gd = gd;
1019
1020         return dev;
1021
1022       cleanup_queue:
1023         put_disk(gd);
1024
1025       cleanup_dev:
1026         kfree(dev);
1027
1028       exit:
1029         return ERR_PTR(rc);
1030 };
1031
1032 /**
1033  *      i2o_block_probe - verify if dev is a I2O Block device and install it
1034  *      @dev: device to verify if it is a I2O Block device
1035  *
1036  *      We only verify if the user_tid of the device is 0xfff and then install
1037  *      the device. Otherwise it is used by some other device (e. g. RAID).
1038  *
1039  *      Returns 0 on success or negative error code on failure.
1040  */
1041 static int i2o_block_probe(struct device *dev)
1042 {
1043         struct i2o_device *i2o_dev = to_i2o_device(dev);
1044         struct i2o_controller *c = i2o_dev->iop;
1045         struct i2o_block_device *i2o_blk_dev;
1046         struct gendisk *gd;
1047         struct request_queue *queue;
1048         static int unit = 0;
1049         int rc;
1050         u64 size;
1051         u32 blocksize;
1052         u16 body_size = 4;
1053         u16 power;
1054         unsigned short max_sectors;
1055
1056 #ifdef CONFIG_I2O_EXT_ADAPTEC
1057         if (c->adaptec)
1058                 body_size = 8;
1059 #endif
1060
1061         if (c->limit_sectors)
1062                 max_sectors = I2O_MAX_SECTORS_LIMITED;
1063         else
1064                 max_sectors = I2O_MAX_SECTORS;
1065
1066         /* skip devices which are used by IOP */
1067         if (i2o_dev->lct_data.user_tid != 0xfff) {
1068                 osm_debug("skipping used device %03x\n", i2o_dev->lct_data.tid);
1069                 return -ENODEV;
1070         }
1071
1072         if (i2o_device_claim(i2o_dev)) {
1073                 osm_warn("Unable to claim device. Installation aborted\n");
1074                 rc = -EFAULT;
1075                 goto exit;
1076         }
1077
1078         i2o_blk_dev = i2o_block_device_alloc();
1079         if (IS_ERR(i2o_blk_dev)) {
1080                 osm_err("could not alloc a new I2O block device");
1081                 rc = PTR_ERR(i2o_blk_dev);
1082                 goto claim_release;
1083         }
1084
1085         i2o_blk_dev->i2o_dev = i2o_dev;
1086         dev_set_drvdata(dev, i2o_blk_dev);
1087
1088         /* setup gendisk */
1089         gd = i2o_blk_dev->gd;
1090         gd->first_minor = unit << 4;
1091         sprintf(gd->disk_name, "i2o/hd%c", 'a' + unit);
1092         sprintf(gd->devfs_name, "i2o/hd%c", 'a' + unit);
1093         gd->driverfs_dev = &i2o_dev->device;
1094
1095         /* setup request queue */
1096         queue = gd->queue;
1097         queue->queuedata = i2o_blk_dev;
1098
1099         blk_queue_max_phys_segments(queue, I2O_MAX_PHYS_SEGMENTS);
1100         blk_queue_max_sectors(queue, max_sectors);
1101         blk_queue_max_hw_segments(queue, i2o_sg_tablesize(c, body_size));
1102
1103         osm_debug("max sectors = %d\n", queue->max_phys_segments);
1104         osm_debug("phys segments = %d\n", queue->max_sectors);
1105         osm_debug("max hw segments = %d\n", queue->max_hw_segments);
1106
1107         /*
1108          *      Ask for the current media data. If that isn't supported
1109          *      then we ask for the device capacity data
1110          */
1111         if (!i2o_parm_field_get(i2o_dev, 0x0004, 1, &blocksize, 4) ||
1112             !i2o_parm_field_get(i2o_dev, 0x0000, 3, &blocksize, 4)) {
1113                 blk_queue_hardsect_size(queue, le32_to_cpu(blocksize));
1114         } else
1115                 osm_warn("unable to get blocksize of %s\n", gd->disk_name);
1116
1117         if (!i2o_parm_field_get(i2o_dev, 0x0004, 0, &size, 8) ||
1118             !i2o_parm_field_get(i2o_dev, 0x0000, 4, &size, 8)) {
1119                 set_capacity(gd, le64_to_cpu(size) >> KERNEL_SECTOR_SHIFT);
1120         } else
1121                 osm_warn("could not get size of %s\n", gd->disk_name);
1122
1123         if (!i2o_parm_field_get(i2o_dev, 0x0000, 2, &power, 2))
1124                 i2o_blk_dev->power = power;
1125
1126         i2o_event_register(i2o_dev, &i2o_block_driver, 0, 0xffffffff);
1127
1128         add_disk(gd);
1129
1130         unit++;
1131
1132         osm_info("device added (TID: %03x): %s\n", i2o_dev->lct_data.tid,
1133                  i2o_blk_dev->gd->disk_name);
1134
1135         return 0;
1136
1137       claim_release:
1138         i2o_device_claim_release(i2o_dev);
1139
1140       exit:
1141         return rc;
1142 };
1143
1144 /* Block OSM driver struct */
1145 static struct i2o_driver i2o_block_driver = {
1146         .name = OSM_NAME,
1147         .event = i2o_block_event,
1148         .reply = i2o_block_reply,
1149         .classes = i2o_block_class_id,
1150         .driver = {
1151                    .probe = i2o_block_probe,
1152                    .remove = i2o_block_remove,
1153                    },
1154 };
1155
1156 /**
1157  *      i2o_block_init - Block OSM initialization function
1158  *
1159  *      Allocate the slab and mempool for request structs, registers i2o_block
1160  *      block device and finally register the Block OSM in the I2O core.
1161  *
1162  *      Returns 0 on success or negative error code on failure.
1163  */
1164 static int __init i2o_block_init(void)
1165 {
1166         int rc;
1167         int size;
1168
1169         printk(KERN_INFO OSM_DESCRIPTION " v" OSM_VERSION "\n");
1170
1171         /* Allocate request mempool and slab */
1172         size = sizeof(struct i2o_block_request);
1173         i2o_blk_req_pool.slab = kmem_cache_create("i2o_block_req", size, 0,
1174                                                   SLAB_HWCACHE_ALIGN, NULL,
1175                                                   NULL);
1176         if (!i2o_blk_req_pool.slab) {
1177                 osm_err("can't init request slab\n");
1178                 rc = -ENOMEM;
1179                 goto exit;
1180         }
1181
1182         i2o_blk_req_pool.pool = mempool_create(I2O_BLOCK_REQ_MEMPOOL_SIZE,
1183                                                mempool_alloc_slab,
1184                                                mempool_free_slab,
1185                                                i2o_blk_req_pool.slab);
1186         if (!i2o_blk_req_pool.pool) {
1187                 osm_err("can't init request mempool\n");
1188                 rc = -ENOMEM;
1189                 goto free_slab;
1190         }
1191
1192         /* Register the block device interfaces */
1193         rc = register_blkdev(I2O_MAJOR, "i2o_block");
1194         if (rc) {
1195                 osm_err("unable to register block device\n");
1196                 goto free_mempool;
1197         }
1198 #ifdef MODULE
1199         osm_info("registered device at major %d\n", I2O_MAJOR);
1200 #endif
1201
1202         /* Register Block OSM into I2O core */
1203         rc = i2o_driver_register(&i2o_block_driver);
1204         if (rc) {
1205                 osm_err("Could not register Block driver\n");
1206                 goto unregister_blkdev;
1207         }
1208
1209         return 0;
1210
1211       unregister_blkdev:
1212         unregister_blkdev(I2O_MAJOR, "i2o_block");
1213
1214       free_mempool:
1215         mempool_destroy(i2o_blk_req_pool.pool);
1216
1217       free_slab:
1218         kmem_cache_destroy(i2o_blk_req_pool.slab);
1219
1220       exit:
1221         return rc;
1222 };
1223
1224 /**
1225  *      i2o_block_exit - Block OSM exit function
1226  *
1227  *      Unregisters Block OSM from I2O core, unregisters i2o_block block device
1228  *      and frees the mempool and slab.
1229  */
1230 static void __exit i2o_block_exit(void)
1231 {
1232         /* Unregister I2O Block OSM from I2O core */
1233         i2o_driver_unregister(&i2o_block_driver);
1234
1235         /* Unregister block device */
1236         unregister_blkdev(I2O_MAJOR, "i2o_block");
1237
1238         /* Free request mempool and slab */
1239         mempool_destroy(i2o_blk_req_pool.pool);
1240         kmem_cache_destroy(i2o_blk_req_pool.slab);
1241 };
1242
1243 MODULE_AUTHOR("Red Hat");
1244 MODULE_LICENSE("GPL");
1245 MODULE_DESCRIPTION(OSM_DESCRIPTION);
1246 MODULE_VERSION(OSM_VERSION);
1247
1248 module_init(i2o_block_init);
1249 module_exit(i2o_block_exit);