Merge branch 'upstream'
[linux-2.6] / drivers / scsi / sata_mv.c
1 /*
2  * sata_mv.c - Marvell SATA support
3  *
4  * Copyright 2005: EMC Corporation, all rights reserved. 
5  *
6  * Please ALWAYS copy linux-ide@vger.kernel.org on emails.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License as published by
10  * the Free Software Foundation; version 2 of the License.
11  *
12  * This program is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with this program; if not, write to the Free Software
19  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
20  *
21  */
22
23 #include <linux/kernel.h>
24 #include <linux/module.h>
25 #include <linux/pci.h>
26 #include <linux/init.h>
27 #include <linux/blkdev.h>
28 #include <linux/delay.h>
29 #include <linux/interrupt.h>
30 #include <linux/sched.h>
31 #include <linux/dma-mapping.h>
32 #include "scsi.h"
33 #include <scsi/scsi_host.h>
34 #include <linux/libata.h>
35 #include <asm/io.h>
36
37 #define DRV_NAME        "sata_mv"
38 #define DRV_VERSION     "0.24"
39
40 enum {
41         /* BAR's are enumerated in terms of pci_resource_start() terms */
42         MV_PRIMARY_BAR          = 0,    /* offset 0x10: memory space */
43         MV_IO_BAR               = 2,    /* offset 0x18: IO space */
44         MV_MISC_BAR             = 3,    /* offset 0x1c: FLASH, NVRAM, SRAM */
45
46         MV_MAJOR_REG_AREA_SZ    = 0x10000,      /* 64KB */
47         MV_MINOR_REG_AREA_SZ    = 0x2000,       /* 8KB */
48
49         MV_PCI_REG_BASE         = 0,
50         MV_IRQ_COAL_REG_BASE    = 0x18000,      /* 6xxx part only */
51         MV_SATAHC0_REG_BASE     = 0x20000,
52
53         MV_PCI_REG_SZ           = MV_MAJOR_REG_AREA_SZ,
54         MV_SATAHC_REG_SZ        = MV_MAJOR_REG_AREA_SZ,
55         MV_SATAHC_ARBTR_REG_SZ  = MV_MINOR_REG_AREA_SZ,         /* arbiter */
56         MV_PORT_REG_SZ          = MV_MINOR_REG_AREA_SZ,
57
58         MV_USE_Q_DEPTH          = ATA_DEF_QUEUE,
59
60         MV_MAX_Q_DEPTH          = 32,
61         MV_MAX_Q_DEPTH_MASK     = MV_MAX_Q_DEPTH - 1,
62
63         /* CRQB needs alignment on a 1KB boundary. Size == 1KB
64          * CRPB needs alignment on a 256B boundary. Size == 256B
65          * SG count of 176 leads to MV_PORT_PRIV_DMA_SZ == 4KB
66          * ePRD (SG) entries need alignment on a 16B boundary. Size == 16B
67          */
68         MV_CRQB_Q_SZ            = (32 * MV_MAX_Q_DEPTH),
69         MV_CRPB_Q_SZ            = (8 * MV_MAX_Q_DEPTH),
70         MV_MAX_SG_CT            = 176,
71         MV_SG_TBL_SZ            = (16 * MV_MAX_SG_CT),
72         MV_PORT_PRIV_DMA_SZ     = (MV_CRQB_Q_SZ + MV_CRPB_Q_SZ + MV_SG_TBL_SZ),
73
74         /* Our DMA boundary is determined by an ePRD being unable to handle
75          * anything larger than 64KB
76          */
77         MV_DMA_BOUNDARY         = 0xffffU,
78
79         MV_PORTS_PER_HC         = 4,
80         /* == (port / MV_PORTS_PER_HC) to determine HC from 0-7 port */
81         MV_PORT_HC_SHIFT        = 2,
82         /* == (port % MV_PORTS_PER_HC) to determine hard port from 0-7 port */
83         MV_PORT_MASK            = 3,
84
85         /* Host Flags */
86         MV_FLAG_DUAL_HC         = (1 << 30),  /* two SATA Host Controllers */
87         MV_FLAG_IRQ_COALESCE    = (1 << 29),  /* IRQ coalescing capability */
88         MV_FLAG_GLBL_SFT_RST    = (1 << 28),  /* Global Soft Reset support */
89         MV_COMMON_FLAGS         = (ATA_FLAG_SATA | ATA_FLAG_NO_LEGACY |
90                                    ATA_FLAG_SATA_RESET | ATA_FLAG_MMIO),
91         MV_6XXX_FLAGS           = (MV_FLAG_IRQ_COALESCE | 
92                                    MV_FLAG_GLBL_SFT_RST),
93
94         chip_504x               = 0,
95         chip_508x               = 1,
96         chip_604x               = 2,
97         chip_608x               = 3,
98
99         CRQB_FLAG_READ          = (1 << 0),
100         CRQB_TAG_SHIFT          = 1,
101         CRQB_CMD_ADDR_SHIFT     = 8,
102         CRQB_CMD_CS             = (0x2 << 11),
103         CRQB_CMD_LAST           = (1 << 15),
104
105         CRPB_FLAG_STATUS_SHIFT  = 8,
106
107         EPRD_FLAG_END_OF_TBL    = (1 << 31),
108
109         /* PCI interface registers */
110
111         PCI_COMMAND_OFS         = 0xc00,
112
113         PCI_MAIN_CMD_STS_OFS    = 0xd30,
114         STOP_PCI_MASTER         = (1 << 2),
115         PCI_MASTER_EMPTY        = (1 << 3),
116         GLOB_SFT_RST            = (1 << 4),
117
118         PCI_IRQ_CAUSE_OFS       = 0x1d58,
119         PCI_IRQ_MASK_OFS        = 0x1d5c,
120         PCI_UNMASK_ALL_IRQS     = 0x7fffff,     /* bits 22-0 */
121
122         HC_MAIN_IRQ_CAUSE_OFS   = 0x1d60,
123         HC_MAIN_IRQ_MASK_OFS    = 0x1d64,
124         PORT0_ERR               = (1 << 0),     /* shift by port # */
125         PORT0_DONE              = (1 << 1),     /* shift by port # */
126         HC0_IRQ_PEND            = 0x1ff,        /* bits 0-8 = HC0's ports */
127         HC_SHIFT                = 9,            /* bits 9-17 = HC1's ports */
128         PCI_ERR                 = (1 << 18),
129         TRAN_LO_DONE            = (1 << 19),    /* 6xxx: IRQ coalescing */
130         TRAN_HI_DONE            = (1 << 20),    /* 6xxx: IRQ coalescing */
131         PORTS_0_7_COAL_DONE     = (1 << 21),    /* 6xxx: IRQ coalescing */
132         GPIO_INT                = (1 << 22),
133         SELF_INT                = (1 << 23),
134         TWSI_INT                = (1 << 24),
135         HC_MAIN_RSVD            = (0x7f << 25), /* bits 31-25 */
136         HC_MAIN_MASKED_IRQS     = (TRAN_LO_DONE | TRAN_HI_DONE | 
137                                    PORTS_0_7_COAL_DONE | GPIO_INT | TWSI_INT |
138                                    HC_MAIN_RSVD),
139
140         /* SATAHC registers */
141         HC_CFG_OFS              = 0,
142
143         HC_IRQ_CAUSE_OFS        = 0x14,
144         CRPB_DMA_DONE           = (1 << 0),     /* shift by port # */
145         HC_IRQ_COAL             = (1 << 4),     /* IRQ coalescing */
146         DEV_IRQ                 = (1 << 8),     /* shift by port # */
147
148         /* Shadow block registers */
149         SHD_BLK_OFS             = 0x100,
150         SHD_CTL_AST_OFS         = 0x20,         /* ofs from SHD_BLK_OFS */
151
152         /* SATA registers */
153         SATA_STATUS_OFS         = 0x300,  /* ctrl, err regs follow status */
154         SATA_ACTIVE_OFS         = 0x350,
155
156         /* Port registers */
157         EDMA_CFG_OFS            = 0,
158         EDMA_CFG_Q_DEPTH        = 0,                    /* queueing disabled */
159         EDMA_CFG_NCQ            = (1 << 5),
160         EDMA_CFG_NCQ_GO_ON_ERR  = (1 << 14),            /* continue on error */
161         EDMA_CFG_RD_BRST_EXT    = (1 << 11),            /* read burst 512B */
162         EDMA_CFG_WR_BUFF_LEN    = (1 << 13),            /* write buffer 512B */
163
164         EDMA_ERR_IRQ_CAUSE_OFS  = 0x8,
165         EDMA_ERR_IRQ_MASK_OFS   = 0xc,
166         EDMA_ERR_D_PAR          = (1 << 0),
167         EDMA_ERR_PRD_PAR        = (1 << 1),
168         EDMA_ERR_DEV            = (1 << 2),
169         EDMA_ERR_DEV_DCON       = (1 << 3),
170         EDMA_ERR_DEV_CON        = (1 << 4),
171         EDMA_ERR_SERR           = (1 << 5),
172         EDMA_ERR_SELF_DIS       = (1 << 7),
173         EDMA_ERR_BIST_ASYNC     = (1 << 8),
174         EDMA_ERR_CRBQ_PAR       = (1 << 9),
175         EDMA_ERR_CRPB_PAR       = (1 << 10),
176         EDMA_ERR_INTRL_PAR      = (1 << 11),
177         EDMA_ERR_IORDY          = (1 << 12),
178         EDMA_ERR_LNK_CTRL_RX    = (0xf << 13),
179         EDMA_ERR_LNK_CTRL_RX_2  = (1 << 15),
180         EDMA_ERR_LNK_DATA_RX    = (0xf << 17),
181         EDMA_ERR_LNK_CTRL_TX    = (0x1f << 21),
182         EDMA_ERR_LNK_DATA_TX    = (0x1f << 26),
183         EDMA_ERR_TRANS_PROTO    = (1 << 31),
184         EDMA_ERR_FATAL          = (EDMA_ERR_D_PAR | EDMA_ERR_PRD_PAR | 
185                                    EDMA_ERR_DEV_DCON | EDMA_ERR_CRBQ_PAR |
186                                    EDMA_ERR_CRPB_PAR | EDMA_ERR_INTRL_PAR |
187                                    EDMA_ERR_IORDY | EDMA_ERR_LNK_CTRL_RX_2 | 
188                                    EDMA_ERR_LNK_DATA_RX |
189                                    EDMA_ERR_LNK_DATA_TX | 
190                                    EDMA_ERR_TRANS_PROTO),
191
192         EDMA_REQ_Q_BASE_HI_OFS  = 0x10,
193         EDMA_REQ_Q_IN_PTR_OFS   = 0x14,         /* also contains BASE_LO */
194         EDMA_REQ_Q_BASE_LO_MASK = 0xfffffc00U,
195
196         EDMA_REQ_Q_OUT_PTR_OFS  = 0x18,
197         EDMA_REQ_Q_PTR_SHIFT    = 5,
198
199         EDMA_RSP_Q_BASE_HI_OFS  = 0x1c,
200         EDMA_RSP_Q_IN_PTR_OFS   = 0x20,
201         EDMA_RSP_Q_OUT_PTR_OFS  = 0x24,         /* also contains BASE_LO */
202         EDMA_RSP_Q_BASE_LO_MASK = 0xffffff00U,
203         EDMA_RSP_Q_PTR_SHIFT    = 3,
204
205         EDMA_CMD_OFS            = 0x28,
206         EDMA_EN                 = (1 << 0),
207         EDMA_DS                 = (1 << 1),
208         ATA_RST                 = (1 << 2),
209
210         /* Host private flags (hp_flags) */
211         MV_HP_FLAG_MSI          = (1 << 0),
212
213         /* Port private flags (pp_flags) */
214         MV_PP_FLAG_EDMA_EN      = (1 << 0),
215         MV_PP_FLAG_EDMA_DS_ACT  = (1 << 1),
216 };
217
218 /* Command ReQuest Block: 32B */
219 struct mv_crqb {
220         u32                     sg_addr;
221         u32                     sg_addr_hi;
222         u16                     ctrl_flags;
223         u16                     ata_cmd[11];
224 };
225
226 /* Command ResPonse Block: 8B */
227 struct mv_crpb {
228         u16                     id;
229         u16                     flags;
230         u32                     tmstmp;
231 };
232
233 /* EDMA Physical Region Descriptor (ePRD); A.K.A. SG */
234 struct mv_sg {
235         u32                     addr;
236         u32                     flags_size;
237         u32                     addr_hi;
238         u32                     reserved;
239 };
240
241 struct mv_port_priv {
242         struct mv_crqb          *crqb;
243         dma_addr_t              crqb_dma;
244         struct mv_crpb          *crpb;
245         dma_addr_t              crpb_dma;
246         struct mv_sg            *sg_tbl;
247         dma_addr_t              sg_tbl_dma;
248
249         unsigned                req_producer;           /* cp of req_in_ptr */
250         unsigned                rsp_consumer;           /* cp of rsp_out_ptr */
251         u32                     pp_flags;
252 };
253
254 struct mv_host_priv {
255         u32                     hp_flags;
256 };
257
258 static void mv_irq_clear(struct ata_port *ap);
259 static u32 mv_scr_read(struct ata_port *ap, unsigned int sc_reg_in);
260 static void mv_scr_write(struct ata_port *ap, unsigned int sc_reg_in, u32 val);
261 static u8 mv_check_err(struct ata_port *ap);
262 static void mv_phy_reset(struct ata_port *ap);
263 static void mv_host_stop(struct ata_host_set *host_set);
264 static int mv_port_start(struct ata_port *ap);
265 static void mv_port_stop(struct ata_port *ap);
266 static void mv_qc_prep(struct ata_queued_cmd *qc);
267 static int mv_qc_issue(struct ata_queued_cmd *qc);
268 static irqreturn_t mv_interrupt(int irq, void *dev_instance,
269                                 struct pt_regs *regs);
270 static void mv_eng_timeout(struct ata_port *ap);
271 static int mv_init_one(struct pci_dev *pdev, const struct pci_device_id *ent);
272
273 static Scsi_Host_Template mv_sht = {
274         .module                 = THIS_MODULE,
275         .name                   = DRV_NAME,
276         .ioctl                  = ata_scsi_ioctl,
277         .queuecommand           = ata_scsi_queuecmd,
278         .eh_strategy_handler    = ata_scsi_error,
279         .can_queue              = MV_USE_Q_DEPTH,
280         .this_id                = ATA_SHT_THIS_ID,
281         .sg_tablesize           = MV_MAX_SG_CT,
282         .max_sectors            = ATA_MAX_SECTORS,
283         .cmd_per_lun            = ATA_SHT_CMD_PER_LUN,
284         .emulated               = ATA_SHT_EMULATED,
285         .use_clustering         = ATA_SHT_USE_CLUSTERING,
286         .proc_name              = DRV_NAME,
287         .dma_boundary           = MV_DMA_BOUNDARY,
288         .slave_configure        = ata_scsi_slave_config,
289         .bios_param             = ata_std_bios_param,
290         .ordered_flush          = 1,
291 };
292
293 static struct ata_port_operations mv_ops = {
294         .port_disable           = ata_port_disable,
295
296         .tf_load                = ata_tf_load,
297         .tf_read                = ata_tf_read,
298         .check_status           = ata_check_status,
299         .check_err              = mv_check_err,
300         .exec_command           = ata_exec_command,
301         .dev_select             = ata_std_dev_select,
302
303         .phy_reset              = mv_phy_reset,
304
305         .qc_prep                = mv_qc_prep,
306         .qc_issue               = mv_qc_issue,
307
308         .eng_timeout            = mv_eng_timeout,
309
310         .irq_handler            = mv_interrupt,
311         .irq_clear              = mv_irq_clear,
312
313         .scr_read               = mv_scr_read,
314         .scr_write              = mv_scr_write,
315
316         .port_start             = mv_port_start,
317         .port_stop              = mv_port_stop,
318         .host_stop              = mv_host_stop,
319 };
320
321 static struct ata_port_info mv_port_info[] = {
322         {  /* chip_504x */
323                 .sht            = &mv_sht,
324                 .host_flags     = MV_COMMON_FLAGS,
325                 .pio_mask       = 0x1f, /* pio0-4 */
326                 .udma_mask      = 0,    /* 0x7f (udma0-6 disabled for now) */
327                 .port_ops       = &mv_ops,
328         },
329         {  /* chip_508x */
330                 .sht            = &mv_sht,
331                 .host_flags     = (MV_COMMON_FLAGS | MV_FLAG_DUAL_HC),
332                 .pio_mask       = 0x1f, /* pio0-4 */
333                 .udma_mask      = 0,    /* 0x7f (udma0-6 disabled for now) */
334                 .port_ops       = &mv_ops,
335         },
336         {  /* chip_604x */
337                 .sht            = &mv_sht,
338                 .host_flags     = (MV_COMMON_FLAGS | MV_6XXX_FLAGS),
339                 .pio_mask       = 0x1f, /* pio0-4 */
340                 .udma_mask      = 0x7f, /* udma0-6 */
341                 .port_ops       = &mv_ops,
342         },
343         {  /* chip_608x */
344                 .sht            = &mv_sht,
345                 .host_flags     = (MV_COMMON_FLAGS | MV_6XXX_FLAGS | 
346                                    MV_FLAG_DUAL_HC),
347                 .pio_mask       = 0x1f, /* pio0-4 */
348                 .udma_mask      = 0x7f, /* udma0-6 */
349                 .port_ops       = &mv_ops,
350         },
351 };
352
353 static struct pci_device_id mv_pci_tbl[] = {
354         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x5040), 0, 0, chip_504x},
355         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x5041), 0, 0, chip_504x},
356         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x5080), 0, 0, chip_508x},
357         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x5081), 0, 0, chip_508x},
358
359         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x6040), 0, 0, chip_604x},
360         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x6041), 0, 0, chip_604x},
361         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x6080), 0, 0, chip_608x},
362         {PCI_DEVICE(PCI_VENDOR_ID_MARVELL, 0x6081), 0, 0, chip_608x},
363         {}                      /* terminate list */
364 };
365
366 static struct pci_driver mv_pci_driver = {
367         .name                   = DRV_NAME,
368         .id_table               = mv_pci_tbl,
369         .probe                  = mv_init_one,
370         .remove                 = ata_pci_remove_one,
371 };
372
373 /*
374  * Functions
375  */
376
377 static inline void writelfl(unsigned long data, void __iomem *addr)
378 {
379         writel(data, addr);
380         (void) readl(addr);     /* flush to avoid PCI posted write */
381 }
382
383 static inline void __iomem *mv_hc_base(void __iomem *base, unsigned int hc)
384 {
385         return (base + MV_SATAHC0_REG_BASE + (hc * MV_SATAHC_REG_SZ));
386 }
387
388 static inline void __iomem *mv_port_base(void __iomem *base, unsigned int port)
389 {
390         return (mv_hc_base(base, port >> MV_PORT_HC_SHIFT) +
391                 MV_SATAHC_ARBTR_REG_SZ + 
392                 ((port & MV_PORT_MASK) * MV_PORT_REG_SZ));
393 }
394
395 static inline void __iomem *mv_ap_base(struct ata_port *ap)
396 {
397         return mv_port_base(ap->host_set->mmio_base, ap->port_no);
398 }
399
400 static inline int mv_get_hc_count(unsigned long hp_flags)
401 {
402         return ((hp_flags & MV_FLAG_DUAL_HC) ? 2 : 1);
403 }
404
405 static void mv_irq_clear(struct ata_port *ap)
406 {
407 }
408
409 /**
410  *      mv_start_dma - Enable eDMA engine
411  *      @base: port base address
412  *      @pp: port private data
413  *
414  *      Verify the local cache of the eDMA state is accurate with an
415  *      assert.
416  *
417  *      LOCKING:
418  *      Inherited from caller.
419  */
420 static void mv_start_dma(void __iomem *base, struct mv_port_priv *pp)
421 {
422         if (!(MV_PP_FLAG_EDMA_EN & pp->pp_flags)) {
423                 writelfl(EDMA_EN, base + EDMA_CMD_OFS);
424                 pp->pp_flags |= MV_PP_FLAG_EDMA_EN;
425         }
426         assert(EDMA_EN & readl(base + EDMA_CMD_OFS));
427 }
428
429 /**
430  *      mv_stop_dma - Disable eDMA engine
431  *      @ap: ATA channel to manipulate
432  *
433  *      Verify the local cache of the eDMA state is accurate with an
434  *      assert.
435  *
436  *      LOCKING:
437  *      Inherited from caller.
438  */
439 static void mv_stop_dma(struct ata_port *ap)
440 {
441         void __iomem *port_mmio = mv_ap_base(ap);
442         struct mv_port_priv *pp = ap->private_data;
443         u32 reg;
444         int i;
445
446         if (MV_PP_FLAG_EDMA_EN & pp->pp_flags) {
447                 /* Disable EDMA if active.   The disable bit auto clears.
448                  */
449                 writelfl(EDMA_DS, port_mmio + EDMA_CMD_OFS);
450                 pp->pp_flags &= ~MV_PP_FLAG_EDMA_EN;
451         } else {
452                 assert(!(EDMA_EN & readl(port_mmio + EDMA_CMD_OFS)));
453         }
454         
455         /* now properly wait for the eDMA to stop */
456         for (i = 1000; i > 0; i--) {
457                 reg = readl(port_mmio + EDMA_CMD_OFS);
458                 if (!(EDMA_EN & reg)) {
459                         break;
460                 }
461                 udelay(100);
462         }
463
464         if (EDMA_EN & reg) {
465                 printk(KERN_ERR "ata%u: Unable to stop eDMA\n", ap->id);
466                 /* FIXME: Consider doing a reset here to recover */
467         }
468 }
469
470 #ifdef ATA_DEBUG
471 static void mv_dump_mem(void __iomem *start, unsigned bytes)
472 {
473         int b, w;
474         for (b = 0; b < bytes; ) {
475                 DPRINTK("%p: ", start + b);
476                 for (w = 0; b < bytes && w < 4; w++) {
477                         printk("%08x ",readl(start + b));
478                         b += sizeof(u32);
479                 }
480                 printk("\n");
481         }
482 }
483 #endif
484
485 static void mv_dump_pci_cfg(struct pci_dev *pdev, unsigned bytes)
486 {
487 #ifdef ATA_DEBUG
488         int b, w;
489         u32 dw;
490         for (b = 0; b < bytes; ) {
491                 DPRINTK("%02x: ", b);
492                 for (w = 0; b < bytes && w < 4; w++) {
493                         (void) pci_read_config_dword(pdev,b,&dw);
494                         printk("%08x ",dw);
495                         b += sizeof(u32);
496                 }
497                 printk("\n");
498         }
499 #endif
500 }
501 static void mv_dump_all_regs(void __iomem *mmio_base, int port,
502                              struct pci_dev *pdev)
503 {
504 #ifdef ATA_DEBUG
505         void __iomem *hc_base = mv_hc_base(mmio_base, 
506                                            port >> MV_PORT_HC_SHIFT);
507         void __iomem *port_base;
508         int start_port, num_ports, p, start_hc, num_hcs, hc;
509
510         if (0 > port) {
511                 start_hc = start_port = 0;
512                 num_ports = 8;          /* shld be benign for 4 port devs */
513                 num_hcs = 2;
514         } else {
515                 start_hc = port >> MV_PORT_HC_SHIFT;
516                 start_port = port;
517                 num_ports = num_hcs = 1;
518         }
519         DPRINTK("All registers for port(s) %u-%u:\n", start_port, 
520                 num_ports > 1 ? num_ports - 1 : start_port);
521
522         if (NULL != pdev) {
523                 DPRINTK("PCI config space regs:\n");
524                 mv_dump_pci_cfg(pdev, 0x68);
525         }
526         DPRINTK("PCI regs:\n");
527         mv_dump_mem(mmio_base+0xc00, 0x3c);
528         mv_dump_mem(mmio_base+0xd00, 0x34);
529         mv_dump_mem(mmio_base+0xf00, 0x4);
530         mv_dump_mem(mmio_base+0x1d00, 0x6c);
531         for (hc = start_hc; hc < start_hc + num_hcs; hc++) {
532                 hc_base = mv_hc_base(mmio_base, port >> MV_PORT_HC_SHIFT);
533                 DPRINTK("HC regs (HC %i):\n", hc);
534                 mv_dump_mem(hc_base, 0x1c);
535         }
536         for (p = start_port; p < start_port + num_ports; p++) {
537                 port_base = mv_port_base(mmio_base, p);
538                 DPRINTK("EDMA regs (port %i):\n",p);
539                 mv_dump_mem(port_base, 0x54);
540                 DPRINTK("SATA regs (port %i):\n",p);
541                 mv_dump_mem(port_base+0x300, 0x60);
542         }
543 #endif
544 }
545
546 static unsigned int mv_scr_offset(unsigned int sc_reg_in)
547 {
548         unsigned int ofs;
549
550         switch (sc_reg_in) {
551         case SCR_STATUS:
552         case SCR_CONTROL:
553         case SCR_ERROR:
554                 ofs = SATA_STATUS_OFS + (sc_reg_in * sizeof(u32));
555                 break;
556         case SCR_ACTIVE:
557                 ofs = SATA_ACTIVE_OFS;   /* active is not with the others */
558                 break;
559         default:
560                 ofs = 0xffffffffU;
561                 break;
562         }
563         return ofs;
564 }
565
566 static u32 mv_scr_read(struct ata_port *ap, unsigned int sc_reg_in)
567 {
568         unsigned int ofs = mv_scr_offset(sc_reg_in);
569
570         if (0xffffffffU != ofs) {
571                 return readl(mv_ap_base(ap) + ofs);
572         } else {
573                 return (u32) ofs;
574         }
575 }
576
577 static void mv_scr_write(struct ata_port *ap, unsigned int sc_reg_in, u32 val)
578 {
579         unsigned int ofs = mv_scr_offset(sc_reg_in);
580
581         if (0xffffffffU != ofs) {
582                 writelfl(val, mv_ap_base(ap) + ofs);
583         }
584 }
585
586 /**
587  *      mv_global_soft_reset - Perform the 6xxx global soft reset
588  *      @mmio_base: base address of the HBA
589  *
590  *      This routine only applies to 6xxx parts.
591  *
592  *      LOCKING:
593  *      Inherited from caller.
594  */
595 static int mv_global_soft_reset(void __iomem *mmio_base)
596 {
597         void __iomem *reg = mmio_base + PCI_MAIN_CMD_STS_OFS;
598         int i, rc = 0;
599         u32 t;
600
601         /* Following procedure defined in PCI "main command and status
602          * register" table.
603          */
604         t = readl(reg);
605         writel(t | STOP_PCI_MASTER, reg);
606
607         for (i = 0; i < 1000; i++) {
608                 udelay(1);
609                 t = readl(reg);
610                 if (PCI_MASTER_EMPTY & t) {
611                         break;
612                 }
613         }
614         if (!(PCI_MASTER_EMPTY & t)) {
615                 printk(KERN_ERR DRV_NAME ": PCI master won't flush\n");
616                 rc = 1;
617                 goto done;
618         }
619
620         /* set reset */
621         i = 5;
622         do {
623                 writel(t | GLOB_SFT_RST, reg);
624                 t = readl(reg);
625                 udelay(1);
626         } while (!(GLOB_SFT_RST & t) && (i-- > 0));
627
628         if (!(GLOB_SFT_RST & t)) {
629                 printk(KERN_ERR DRV_NAME ": can't set global reset\n");
630                 rc = 1;
631                 goto done;
632         }
633
634         /* clear reset and *reenable the PCI master* (not mentioned in spec) */
635         i = 5;
636         do {
637                 writel(t & ~(GLOB_SFT_RST | STOP_PCI_MASTER), reg);
638                 t = readl(reg);
639                 udelay(1);
640         } while ((GLOB_SFT_RST & t) && (i-- > 0));
641
642         if (GLOB_SFT_RST & t) {
643                 printk(KERN_ERR DRV_NAME ": can't clear global reset\n");
644                 rc = 1;
645         }
646 done:
647         return rc;
648 }
649
650 /**
651  *      mv_host_stop - Host specific cleanup/stop routine.
652  *      @host_set: host data structure
653  *
654  *      Disable ints, cleanup host memory, call general purpose
655  *      host_stop.
656  *
657  *      LOCKING:
658  *      Inherited from caller.
659  */
660 static void mv_host_stop(struct ata_host_set *host_set)
661 {
662         struct mv_host_priv *hpriv = host_set->private_data;
663         struct pci_dev *pdev = to_pci_dev(host_set->dev);
664
665         if (hpriv->hp_flags & MV_HP_FLAG_MSI) {
666                 pci_disable_msi(pdev);
667         } else {
668                 pci_intx(pdev, 0);
669         }
670         kfree(hpriv);
671         ata_host_stop(host_set);
672 }
673
674 /**
675  *      mv_port_start - Port specific init/start routine.
676  *      @ap: ATA channel to manipulate
677  *
678  *      Allocate and point to DMA memory, init port private memory,
679  *      zero indices.
680  *
681  *      LOCKING:
682  *      Inherited from caller.
683  */
684 static int mv_port_start(struct ata_port *ap)
685 {
686         struct device *dev = ap->host_set->dev;
687         struct mv_port_priv *pp;
688         void __iomem *port_mmio = mv_ap_base(ap);
689         void *mem;
690         dma_addr_t mem_dma;
691
692         pp = kmalloc(sizeof(*pp), GFP_KERNEL);
693         if (!pp) {
694                 return -ENOMEM;
695         }
696         memset(pp, 0, sizeof(*pp));
697
698         mem = dma_alloc_coherent(dev, MV_PORT_PRIV_DMA_SZ, &mem_dma, 
699                                  GFP_KERNEL);
700         if (!mem) {
701                 kfree(pp);
702                 return -ENOMEM;
703         }
704         memset(mem, 0, MV_PORT_PRIV_DMA_SZ);
705
706         /* First item in chunk of DMA memory: 
707          * 32-slot command request table (CRQB), 32 bytes each in size
708          */
709         pp->crqb = mem;
710         pp->crqb_dma = mem_dma;
711         mem += MV_CRQB_Q_SZ;
712         mem_dma += MV_CRQB_Q_SZ;
713
714         /* Second item: 
715          * 32-slot command response table (CRPB), 8 bytes each in size
716          */
717         pp->crpb = mem;
718         pp->crpb_dma = mem_dma;
719         mem += MV_CRPB_Q_SZ;
720         mem_dma += MV_CRPB_Q_SZ;
721
722         /* Third item:
723          * Table of scatter-gather descriptors (ePRD), 16 bytes each
724          */
725         pp->sg_tbl = mem;
726         pp->sg_tbl_dma = mem_dma;
727
728         writelfl(EDMA_CFG_Q_DEPTH | EDMA_CFG_RD_BRST_EXT | 
729                  EDMA_CFG_WR_BUFF_LEN, port_mmio + EDMA_CFG_OFS);
730
731         writel((pp->crqb_dma >> 16) >> 16, port_mmio + EDMA_REQ_Q_BASE_HI_OFS);
732         writelfl(pp->crqb_dma & EDMA_REQ_Q_BASE_LO_MASK, 
733                  port_mmio + EDMA_REQ_Q_IN_PTR_OFS);
734
735         writelfl(0, port_mmio + EDMA_REQ_Q_OUT_PTR_OFS);
736         writelfl(0, port_mmio + EDMA_RSP_Q_IN_PTR_OFS);
737
738         writel((pp->crpb_dma >> 16) >> 16, port_mmio + EDMA_RSP_Q_BASE_HI_OFS);
739         writelfl(pp->crpb_dma & EDMA_RSP_Q_BASE_LO_MASK, 
740                  port_mmio + EDMA_RSP_Q_OUT_PTR_OFS);
741
742         pp->req_producer = pp->rsp_consumer = 0;
743
744         /* Don't turn on EDMA here...do it before DMA commands only.  Else
745          * we'll be unable to send non-data, PIO, etc due to restricted access
746          * to shadow regs.
747          */
748         ap->private_data = pp;
749         return 0;
750 }
751
752 /**
753  *      mv_port_stop - Port specific cleanup/stop routine.
754  *      @ap: ATA channel to manipulate
755  *
756  *      Stop DMA, cleanup port memory.
757  *
758  *      LOCKING:
759  *      This routine uses the host_set lock to protect the DMA stop.
760  */
761 static void mv_port_stop(struct ata_port *ap)
762 {
763         struct device *dev = ap->host_set->dev;
764         struct mv_port_priv *pp = ap->private_data;
765         unsigned long flags;
766
767         spin_lock_irqsave(&ap->host_set->lock, flags);
768         mv_stop_dma(ap);
769         spin_unlock_irqrestore(&ap->host_set->lock, flags);
770
771         ap->private_data = NULL;
772         dma_free_coherent(dev, MV_PORT_PRIV_DMA_SZ, pp->crpb, pp->crpb_dma);
773         kfree(pp);
774 }
775
776 /**
777  *      mv_fill_sg - Fill out the Marvell ePRD (scatter gather) entries
778  *      @qc: queued command whose SG list to source from
779  *
780  *      Populate the SG list and mark the last entry.
781  *
782  *      LOCKING:
783  *      Inherited from caller.
784  */
785 static void mv_fill_sg(struct ata_queued_cmd *qc)
786 {
787         struct mv_port_priv *pp = qc->ap->private_data;
788         unsigned int i;
789
790         for (i = 0; i < qc->n_elem; i++) {
791                 u32 sg_len;
792                 dma_addr_t addr;
793
794                 addr = sg_dma_address(&qc->sg[i]);
795                 sg_len = sg_dma_len(&qc->sg[i]);
796
797                 pp->sg_tbl[i].addr = cpu_to_le32(addr & 0xffffffff);
798                 pp->sg_tbl[i].addr_hi = cpu_to_le32((addr >> 16) >> 16);
799                 assert(0 == (sg_len & ~MV_DMA_BOUNDARY));
800                 pp->sg_tbl[i].flags_size = cpu_to_le32(sg_len);
801         }
802         if (0 < qc->n_elem) {
803                 pp->sg_tbl[qc->n_elem - 1].flags_size |= EPRD_FLAG_END_OF_TBL;
804         }
805 }
806
807 static inline unsigned mv_inc_q_index(unsigned *index)
808 {
809         *index = (*index + 1) & MV_MAX_Q_DEPTH_MASK;
810         return *index;
811 }
812
813 static inline void mv_crqb_pack_cmd(u16 *cmdw, u8 data, u8 addr, unsigned last)
814 {
815         *cmdw = data | (addr << CRQB_CMD_ADDR_SHIFT) | CRQB_CMD_CS |
816                 (last ? CRQB_CMD_LAST : 0);
817 }
818
819 /**
820  *      mv_qc_prep - Host specific command preparation.
821  *      @qc: queued command to prepare
822  *
823  *      This routine simply redirects to the general purpose routine
824  *      if command is not DMA.  Else, it handles prep of the CRQB
825  *      (command request block), does some sanity checking, and calls
826  *      the SG load routine.
827  *
828  *      LOCKING:
829  *      Inherited from caller.
830  */
831 static void mv_qc_prep(struct ata_queued_cmd *qc)
832 {
833         struct ata_port *ap = qc->ap;
834         struct mv_port_priv *pp = ap->private_data;
835         u16 *cw;
836         struct ata_taskfile *tf;
837         u16 flags = 0;
838
839         if (ATA_PROT_DMA != qc->tf.protocol) {
840                 return;
841         }
842
843         /* the req producer index should be the same as we remember it */
844         assert(((readl(mv_ap_base(qc->ap) + EDMA_REQ_Q_IN_PTR_OFS) >> 
845                  EDMA_REQ_Q_PTR_SHIFT) & MV_MAX_Q_DEPTH_MASK) ==
846                pp->req_producer);
847
848         /* Fill in command request block
849          */
850         if (!(qc->tf.flags & ATA_TFLAG_WRITE)) {
851                 flags |= CRQB_FLAG_READ;
852         }
853         assert(MV_MAX_Q_DEPTH > qc->tag);
854         flags |= qc->tag << CRQB_TAG_SHIFT;
855
856         pp->crqb[pp->req_producer].sg_addr = 
857                 cpu_to_le32(pp->sg_tbl_dma & 0xffffffff);
858         pp->crqb[pp->req_producer].sg_addr_hi = 
859                 cpu_to_le32((pp->sg_tbl_dma >> 16) >> 16);
860         pp->crqb[pp->req_producer].ctrl_flags = cpu_to_le16(flags);
861
862         cw = &pp->crqb[pp->req_producer].ata_cmd[0];
863         tf = &qc->tf;
864
865         /* Sadly, the CRQB cannot accomodate all registers--there are
866          * only 11 bytes...so we must pick and choose required
867          * registers based on the command.  So, we drop feature and
868          * hob_feature for [RW] DMA commands, but they are needed for
869          * NCQ.  NCQ will drop hob_nsect.
870          */
871         switch (tf->command) {
872         case ATA_CMD_READ:
873         case ATA_CMD_READ_EXT:
874         case ATA_CMD_WRITE:
875         case ATA_CMD_WRITE_EXT:
876                 mv_crqb_pack_cmd(cw++, tf->hob_nsect, ATA_REG_NSECT, 0);
877                 break;
878 #ifdef LIBATA_NCQ               /* FIXME: remove this line when NCQ added */
879         case ATA_CMD_FPDMA_READ:
880         case ATA_CMD_FPDMA_WRITE:
881                 mv_crqb_pack_cmd(cw++, tf->hob_feature, ATA_REG_FEATURE, 0); 
882                 mv_crqb_pack_cmd(cw++, tf->feature, ATA_REG_FEATURE, 0);
883                 break;
884 #endif                          /* FIXME: remove this line when NCQ added */
885         default:
886                 /* The only other commands EDMA supports in non-queued and
887                  * non-NCQ mode are: [RW] STREAM DMA and W DMA FUA EXT, none
888                  * of which are defined/used by Linux.  If we get here, this
889                  * driver needs work.
890                  *
891                  * FIXME: modify libata to give qc_prep a return value and
892                  * return error here.
893                  */
894                 BUG_ON(tf->command);
895                 break;
896         }
897         mv_crqb_pack_cmd(cw++, tf->nsect, ATA_REG_NSECT, 0);
898         mv_crqb_pack_cmd(cw++, tf->hob_lbal, ATA_REG_LBAL, 0);
899         mv_crqb_pack_cmd(cw++, tf->lbal, ATA_REG_LBAL, 0);
900         mv_crqb_pack_cmd(cw++, tf->hob_lbam, ATA_REG_LBAM, 0);
901         mv_crqb_pack_cmd(cw++, tf->lbam, ATA_REG_LBAM, 0);
902         mv_crqb_pack_cmd(cw++, tf->hob_lbah, ATA_REG_LBAH, 0);
903         mv_crqb_pack_cmd(cw++, tf->lbah, ATA_REG_LBAH, 0);
904         mv_crqb_pack_cmd(cw++, tf->device, ATA_REG_DEVICE, 0);
905         mv_crqb_pack_cmd(cw++, tf->command, ATA_REG_CMD, 1);    /* last */
906
907         if (!(qc->flags & ATA_QCFLAG_DMAMAP)) {
908                 return;
909         }
910         mv_fill_sg(qc);
911 }
912
913 /**
914  *      mv_qc_issue - Initiate a command to the host
915  *      @qc: queued command to start
916  *
917  *      This routine simply redirects to the general purpose routine
918  *      if command is not DMA.  Else, it sanity checks our local
919  *      caches of the request producer/consumer indices then enables
920  *      DMA and bumps the request producer index.
921  *
922  *      LOCKING:
923  *      Inherited from caller.
924  */
925 static int mv_qc_issue(struct ata_queued_cmd *qc)
926 {
927         void __iomem *port_mmio = mv_ap_base(qc->ap);
928         struct mv_port_priv *pp = qc->ap->private_data;
929         u32 in_ptr;
930
931         if (ATA_PROT_DMA != qc->tf.protocol) {
932                 /* We're about to send a non-EDMA capable command to the
933                  * port.  Turn off EDMA so there won't be problems accessing
934                  * shadow block, etc registers.
935                  */
936                 mv_stop_dma(qc->ap);
937                 return ata_qc_issue_prot(qc);
938         }
939
940         in_ptr = readl(port_mmio + EDMA_REQ_Q_IN_PTR_OFS);
941
942         /* the req producer index should be the same as we remember it */
943         assert(((in_ptr >> EDMA_REQ_Q_PTR_SHIFT) & MV_MAX_Q_DEPTH_MASK) ==
944                pp->req_producer);
945         /* until we do queuing, the queue should be empty at this point */
946         assert(((in_ptr >> EDMA_REQ_Q_PTR_SHIFT) & MV_MAX_Q_DEPTH_MASK) ==
947                ((readl(port_mmio + EDMA_REQ_Q_OUT_PTR_OFS) >> 
948                  EDMA_REQ_Q_PTR_SHIFT) & MV_MAX_Q_DEPTH_MASK));
949
950         mv_inc_q_index(&pp->req_producer);      /* now incr producer index */
951
952         mv_start_dma(port_mmio, pp);
953
954         /* and write the request in pointer to kick the EDMA to life */
955         in_ptr &= EDMA_REQ_Q_BASE_LO_MASK;
956         in_ptr |= pp->req_producer << EDMA_REQ_Q_PTR_SHIFT;
957         writelfl(in_ptr, port_mmio + EDMA_REQ_Q_IN_PTR_OFS);
958
959         return 0;
960 }
961
962 /**
963  *      mv_get_crpb_status - get status from most recently completed cmd
964  *      @ap: ATA channel to manipulate
965  *
966  *      This routine is for use when the port is in DMA mode, when it
967  *      will be using the CRPB (command response block) method of
968  *      returning command completion information.  We assert indices
969  *      are good, grab status, and bump the response consumer index to
970  *      prove that we're up to date.
971  *
972  *      LOCKING:
973  *      Inherited from caller.
974  */
975 static u8 mv_get_crpb_status(struct ata_port *ap)
976 {
977         void __iomem *port_mmio = mv_ap_base(ap);
978         struct mv_port_priv *pp = ap->private_data;
979         u32 out_ptr;
980
981         out_ptr = readl(port_mmio + EDMA_RSP_Q_OUT_PTR_OFS);
982
983         /* the response consumer index should be the same as we remember it */
984         assert(((out_ptr >> EDMA_RSP_Q_PTR_SHIFT) & MV_MAX_Q_DEPTH_MASK) == 
985                pp->rsp_consumer);
986
987         /* increment our consumer index... */
988         pp->rsp_consumer = mv_inc_q_index(&pp->rsp_consumer);
989         
990         /* and, until we do NCQ, there should only be 1 CRPB waiting */
991         assert(((readl(port_mmio + EDMA_RSP_Q_IN_PTR_OFS) >> 
992                  EDMA_RSP_Q_PTR_SHIFT) & MV_MAX_Q_DEPTH_MASK) == 
993                pp->rsp_consumer);
994
995         /* write out our inc'd consumer index so EDMA knows we're caught up */
996         out_ptr &= EDMA_RSP_Q_BASE_LO_MASK;
997         out_ptr |= pp->rsp_consumer << EDMA_RSP_Q_PTR_SHIFT;
998         writelfl(out_ptr, port_mmio + EDMA_RSP_Q_OUT_PTR_OFS);
999
1000         /* Return ATA status register for completed CRPB */
1001         return (pp->crpb[pp->rsp_consumer].flags >> CRPB_FLAG_STATUS_SHIFT);
1002 }
1003
1004 /**
1005  *      mv_err_intr - Handle error interrupts on the port
1006  *      @ap: ATA channel to manipulate
1007  *
1008  *      In most cases, just clear the interrupt and move on.  However,
1009  *      some cases require an eDMA reset, which is done right before
1010  *      the COMRESET in mv_phy_reset().  The SERR case requires a
1011  *      clear of pending errors in the SATA SERROR register.  Finally,
1012  *      if the port disabled DMA, update our cached copy to match.
1013  *
1014  *      LOCKING:
1015  *      Inherited from caller.
1016  */
1017 static void mv_err_intr(struct ata_port *ap)
1018 {
1019         void __iomem *port_mmio = mv_ap_base(ap);
1020         u32 edma_err_cause, serr = 0;
1021
1022         edma_err_cause = readl(port_mmio + EDMA_ERR_IRQ_CAUSE_OFS);
1023
1024         if (EDMA_ERR_SERR & edma_err_cause) {
1025                 serr = scr_read(ap, SCR_ERROR);
1026                 scr_write_flush(ap, SCR_ERROR, serr);
1027         }
1028         if (EDMA_ERR_SELF_DIS & edma_err_cause) {
1029                 struct mv_port_priv *pp = ap->private_data;
1030                 pp->pp_flags &= ~MV_PP_FLAG_EDMA_EN;
1031         }
1032         DPRINTK(KERN_ERR "ata%u: port error; EDMA err cause: 0x%08x "
1033                 "SERR: 0x%08x\n", ap->id, edma_err_cause, serr);
1034
1035         /* Clear EDMA now that SERR cleanup done */
1036         writelfl(0, port_mmio + EDMA_ERR_IRQ_CAUSE_OFS);
1037
1038         /* check for fatal here and recover if needed */
1039         if (EDMA_ERR_FATAL & edma_err_cause) {
1040                 mv_phy_reset(ap);
1041         }
1042 }
1043
1044 /**
1045  *      mv_host_intr - Handle all interrupts on the given host controller
1046  *      @host_set: host specific structure
1047  *      @relevant: port error bits relevant to this host controller
1048  *      @hc: which host controller we're to look at
1049  *
1050  *      Read then write clear the HC interrupt status then walk each
1051  *      port connected to the HC and see if it needs servicing.  Port
1052  *      success ints are reported in the HC interrupt status reg, the
1053  *      port error ints are reported in the higher level main
1054  *      interrupt status register and thus are passed in via the
1055  *      'relevant' argument.
1056  *
1057  *      LOCKING:
1058  *      Inherited from caller.
1059  */
1060 static void mv_host_intr(struct ata_host_set *host_set, u32 relevant,
1061                          unsigned int hc)
1062 {
1063         void __iomem *mmio = host_set->mmio_base;
1064         void __iomem *hc_mmio = mv_hc_base(mmio, hc);
1065         struct ata_port *ap;
1066         struct ata_queued_cmd *qc;
1067         u32 hc_irq_cause;
1068         int shift, port, port0, hard_port, handled;
1069         u8 ata_status = 0;
1070
1071         if (hc == 0) {
1072                 port0 = 0;
1073         } else {
1074                 port0 = MV_PORTS_PER_HC;
1075         }
1076
1077         /* we'll need the HC success int register in most cases */
1078         hc_irq_cause = readl(hc_mmio + HC_IRQ_CAUSE_OFS);
1079         if (hc_irq_cause) {
1080                 writelfl(~hc_irq_cause, hc_mmio + HC_IRQ_CAUSE_OFS);
1081         }
1082
1083         VPRINTK("ENTER, hc%u relevant=0x%08x HC IRQ cause=0x%08x\n",
1084                 hc,relevant,hc_irq_cause);
1085
1086         for (port = port0; port < port0 + MV_PORTS_PER_HC; port++) {
1087                 ap = host_set->ports[port];
1088                 hard_port = port & MV_PORT_MASK;        /* range 0-3 */
1089                 handled = 0;    /* ensure ata_status is set if handled++ */
1090
1091                 if ((CRPB_DMA_DONE << hard_port) & hc_irq_cause) {
1092                         /* new CRPB on the queue; just one at a time until NCQ
1093                          */
1094                         ata_status = mv_get_crpb_status(ap);
1095                         handled++;
1096                 } else if ((DEV_IRQ << hard_port) & hc_irq_cause) {
1097                         /* received ATA IRQ; read the status reg to clear INTRQ
1098                          */
1099                         ata_status = readb((void __iomem *)
1100                                            ap->ioaddr.status_addr);
1101                         handled++;
1102                 }
1103
1104                 shift = port << 1;              /* (port * 2) */
1105                 if (port >= MV_PORTS_PER_HC) {
1106                         shift++;        /* skip bit 8 in the HC Main IRQ reg */
1107                 }
1108                 if ((PORT0_ERR << shift) & relevant) {
1109                         mv_err_intr(ap);
1110                         /* OR in ATA_ERR to ensure libata knows we took one */
1111                         ata_status = readb((void __iomem *)
1112                                            ap->ioaddr.status_addr) | ATA_ERR;
1113                         handled++;
1114                 }
1115                 
1116                 if (handled && ap) {
1117                         qc = ata_qc_from_tag(ap, ap->active_tag);
1118                         if (NULL != qc) {
1119                                 VPRINTK("port %u IRQ found for qc, "
1120                                         "ata_status 0x%x\n", port,ata_status);
1121                                 /* mark qc status appropriately */
1122                                 ata_qc_complete(qc, ata_status);
1123                         }
1124                 }
1125         }
1126         VPRINTK("EXIT\n");
1127 }
1128
1129 /**
1130  *      mv_interrupt - 
1131  *      @irq: unused
1132  *      @dev_instance: private data; in this case the host structure
1133  *      @regs: unused
1134  *
1135  *      Read the read only register to determine if any host
1136  *      controllers have pending interrupts.  If so, call lower level
1137  *      routine to handle.  Also check for PCI errors which are only
1138  *      reported here.
1139  *
1140  *      LOCKING: 
1141  *      This routine holds the host_set lock while processing pending
1142  *      interrupts.
1143  */
1144 static irqreturn_t mv_interrupt(int irq, void *dev_instance,
1145                                 struct pt_regs *regs)
1146 {
1147         struct ata_host_set *host_set = dev_instance;
1148         unsigned int hc, handled = 0, n_hcs;
1149         void __iomem *mmio = host_set->mmio_base;
1150         u32 irq_stat;
1151
1152         irq_stat = readl(mmio + HC_MAIN_IRQ_CAUSE_OFS);
1153
1154         /* check the cases where we either have nothing pending or have read
1155          * a bogus register value which can indicate HW removal or PCI fault
1156          */
1157         if (!irq_stat || (0xffffffffU == irq_stat)) {
1158                 return IRQ_NONE;
1159         }
1160
1161         n_hcs = mv_get_hc_count(host_set->ports[0]->flags);
1162         spin_lock(&host_set->lock);
1163
1164         for (hc = 0; hc < n_hcs; hc++) {
1165                 u32 relevant = irq_stat & (HC0_IRQ_PEND << (hc * HC_SHIFT));
1166                 if (relevant) {
1167                         mv_host_intr(host_set, relevant, hc);
1168                         handled++;
1169                 }
1170         }
1171         if (PCI_ERR & irq_stat) {
1172                 printk(KERN_ERR DRV_NAME ": PCI ERROR; PCI IRQ cause=0x%08x\n",
1173                        readl(mmio + PCI_IRQ_CAUSE_OFS));
1174
1175                 DPRINTK("All regs @ PCI error\n");
1176                 mv_dump_all_regs(mmio, -1, to_pci_dev(host_set->dev));
1177
1178                 writelfl(0, mmio + PCI_IRQ_CAUSE_OFS);
1179                 handled++;
1180         }
1181         spin_unlock(&host_set->lock);
1182
1183         return IRQ_RETVAL(handled);
1184 }
1185
1186 /**
1187  *      mv_check_err - Return the error shadow register to caller.
1188  *      @ap: ATA channel to manipulate
1189  *
1190  *      Marvell requires DMA to be stopped before accessing shadow
1191  *      registers.  So we do that, then return the needed register.
1192  *
1193  *      LOCKING:
1194  *      Inherited from caller.  FIXME: protect mv_stop_dma with lock?
1195  */
1196 static u8 mv_check_err(struct ata_port *ap)
1197 {
1198         mv_stop_dma(ap);                /* can't read shadow regs if DMA on */
1199         return readb((void __iomem *) ap->ioaddr.error_addr);
1200 }
1201
1202 /**
1203  *      mv_phy_reset - Perform eDMA reset followed by COMRESET
1204  *      @ap: ATA channel to manipulate
1205  *
1206  *      Part of this is taken from __sata_phy_reset and modified to
1207  *      not sleep since this routine gets called from interrupt level.
1208  *
1209  *      LOCKING:
1210  *      Inherited from caller.  This is coded to safe to call at
1211  *      interrupt level, i.e. it does not sleep.
1212  */
1213 static void mv_phy_reset(struct ata_port *ap)
1214 {
1215         void __iomem *port_mmio = mv_ap_base(ap);
1216         struct ata_taskfile tf;
1217         struct ata_device *dev = &ap->device[0];
1218         unsigned long timeout;
1219
1220         VPRINTK("ENTER, port %u, mmio 0x%p\n", ap->port_no, port_mmio);
1221
1222         mv_stop_dma(ap);
1223
1224         writelfl(ATA_RST, port_mmio + EDMA_CMD_OFS);
1225         udelay(25);             /* allow reset propagation */
1226
1227         /* Spec never mentions clearing the bit.  Marvell's driver does
1228          * clear the bit, however.
1229          */
1230         writelfl(0, port_mmio + EDMA_CMD_OFS);
1231
1232         VPRINTK("S-regs after ATA_RST: SStat 0x%08x SErr 0x%08x "
1233                 "SCtrl 0x%08x\n", mv_scr_read(ap, SCR_STATUS),
1234                 mv_scr_read(ap, SCR_ERROR), mv_scr_read(ap, SCR_CONTROL));
1235
1236         /* proceed to init communications via the scr_control reg */
1237         scr_write_flush(ap, SCR_CONTROL, 0x301);
1238         mdelay(1);
1239         scr_write_flush(ap, SCR_CONTROL, 0x300);
1240         timeout = jiffies + (HZ * 1);
1241         do {
1242                 mdelay(10);
1243                 if ((scr_read(ap, SCR_STATUS) & 0xf) != 1)
1244                         break;
1245         } while (time_before(jiffies, timeout));
1246
1247         VPRINTK("S-regs after PHY wake: SStat 0x%08x SErr 0x%08x "
1248                 "SCtrl 0x%08x\n", mv_scr_read(ap, SCR_STATUS),
1249                 mv_scr_read(ap, SCR_ERROR), mv_scr_read(ap, SCR_CONTROL));
1250
1251         if (sata_dev_present(ap)) {
1252                 ata_port_probe(ap);
1253         } else {
1254                 printk(KERN_INFO "ata%u: no device found (phy stat %08x)\n",
1255                        ap->id, scr_read(ap, SCR_STATUS));
1256                 ata_port_disable(ap);
1257                 return;
1258         }
1259         ap->cbl = ATA_CBL_SATA;
1260
1261         tf.lbah = readb((void __iomem *) ap->ioaddr.lbah_addr);
1262         tf.lbam = readb((void __iomem *) ap->ioaddr.lbam_addr);
1263         tf.lbal = readb((void __iomem *) ap->ioaddr.lbal_addr);
1264         tf.nsect = readb((void __iomem *) ap->ioaddr.nsect_addr);
1265
1266         dev->class = ata_dev_classify(&tf);
1267         if (!ata_dev_present(dev)) {
1268                 VPRINTK("Port disabled post-sig: No device present.\n");
1269                 ata_port_disable(ap);
1270         }
1271         VPRINTK("EXIT\n");
1272 }
1273
1274 /**
1275  *      mv_eng_timeout - Routine called by libata when SCSI times out I/O
1276  *      @ap: ATA channel to manipulate
1277  *
1278  *      Intent is to clear all pending error conditions, reset the
1279  *      chip/bus, fail the command, and move on.
1280  *
1281  *      LOCKING:
1282  *      This routine holds the host_set lock while failing the command.
1283  */
1284 static void mv_eng_timeout(struct ata_port *ap)
1285 {
1286         struct ata_queued_cmd *qc;
1287         unsigned long flags;
1288
1289         printk(KERN_ERR "ata%u: Entering mv_eng_timeout\n",ap->id);
1290         DPRINTK("All regs @ start of eng_timeout\n");
1291         mv_dump_all_regs(ap->host_set->mmio_base, ap->port_no, 
1292                          to_pci_dev(ap->host_set->dev));
1293
1294         qc = ata_qc_from_tag(ap, ap->active_tag);
1295         printk(KERN_ERR "mmio_base %p ap %p qc %p scsi_cmnd %p &cmnd %p\n",
1296                ap->host_set->mmio_base, ap, qc, qc->scsicmd, 
1297                &qc->scsicmd->cmnd);
1298
1299         mv_err_intr(ap);
1300         mv_phy_reset(ap);
1301
1302         if (!qc) {
1303                 printk(KERN_ERR "ata%u: BUG: timeout without command\n",
1304                        ap->id);
1305         } else {
1306                 /* hack alert!  We cannot use the supplied completion
1307                  * function from inside the ->eh_strategy_handler() thread.
1308                  * libata is the only user of ->eh_strategy_handler() in
1309                  * any kernel, so the default scsi_done() assumes it is
1310                  * not being called from the SCSI EH.
1311                  */
1312                 spin_lock_irqsave(&ap->host_set->lock, flags);
1313                 qc->scsidone = scsi_finish_command;
1314                 ata_qc_complete(qc, ATA_ERR);
1315                 spin_unlock_irqrestore(&ap->host_set->lock, flags);
1316         }
1317 }
1318
1319 /**
1320  *      mv_port_init - Perform some early initialization on a single port.
1321  *      @port: libata data structure storing shadow register addresses
1322  *      @port_mmio: base address of the port
1323  *
1324  *      Initialize shadow register mmio addresses, clear outstanding
1325  *      interrupts on the port, and unmask interrupts for the future
1326  *      start of the port.
1327  *
1328  *      LOCKING:
1329  *      Inherited from caller.
1330  */
1331 static void mv_port_init(struct ata_ioports *port,  void __iomem *port_mmio)
1332 {
1333         unsigned long shd_base = (unsigned long) port_mmio + SHD_BLK_OFS;
1334         unsigned serr_ofs;
1335
1336         /* PIO related setup 
1337          */
1338         port->data_addr = shd_base + (sizeof(u32) * ATA_REG_DATA);
1339         port->error_addr = 
1340                 port->feature_addr = shd_base + (sizeof(u32) * ATA_REG_ERR);
1341         port->nsect_addr = shd_base + (sizeof(u32) * ATA_REG_NSECT);
1342         port->lbal_addr = shd_base + (sizeof(u32) * ATA_REG_LBAL);
1343         port->lbam_addr = shd_base + (sizeof(u32) * ATA_REG_LBAM);
1344         port->lbah_addr = shd_base + (sizeof(u32) * ATA_REG_LBAH);
1345         port->device_addr = shd_base + (sizeof(u32) * ATA_REG_DEVICE);
1346         port->status_addr = 
1347                 port->command_addr = shd_base + (sizeof(u32) * ATA_REG_STATUS);
1348         /* special case: control/altstatus doesn't have ATA_REG_ address */
1349         port->altstatus_addr = port->ctl_addr = shd_base + SHD_CTL_AST_OFS;
1350
1351         /* unused: */
1352         port->cmd_addr = port->bmdma_addr = port->scr_addr = 0;
1353
1354         /* Clear any currently outstanding port interrupt conditions */
1355         serr_ofs = mv_scr_offset(SCR_ERROR);
1356         writelfl(readl(port_mmio + serr_ofs), port_mmio + serr_ofs);
1357         writelfl(0, port_mmio + EDMA_ERR_IRQ_CAUSE_OFS);
1358
1359         /* unmask all EDMA error interrupts */
1360         writelfl(~0, port_mmio + EDMA_ERR_IRQ_MASK_OFS);
1361
1362         VPRINTK("EDMA cfg=0x%08x EDMA IRQ err cause/mask=0x%08x/0x%08x\n", 
1363                 readl(port_mmio + EDMA_CFG_OFS),
1364                 readl(port_mmio + EDMA_ERR_IRQ_CAUSE_OFS),
1365                 readl(port_mmio + EDMA_ERR_IRQ_MASK_OFS));
1366 }
1367
1368 /**
1369  *      mv_host_init - Perform some early initialization of the host.
1370  *      @probe_ent: early data struct representing the host
1371  *
1372  *      If possible, do an early global reset of the host.  Then do
1373  *      our port init and clear/unmask all/relevant host interrupts.
1374  *
1375  *      LOCKING:
1376  *      Inherited from caller.
1377  */
1378 static int mv_host_init(struct ata_probe_ent *probe_ent)
1379 {
1380         int rc = 0, n_hc, port, hc;
1381         void __iomem *mmio = probe_ent->mmio_base;
1382         void __iomem *port_mmio;
1383
1384         if ((MV_FLAG_GLBL_SFT_RST & probe_ent->host_flags) && 
1385             mv_global_soft_reset(probe_ent->mmio_base)) {
1386                 rc = 1;
1387                 goto done;
1388         }
1389
1390         n_hc = mv_get_hc_count(probe_ent->host_flags);
1391         probe_ent->n_ports = MV_PORTS_PER_HC * n_hc;
1392
1393         for (port = 0; port < probe_ent->n_ports; port++) {
1394                 port_mmio = mv_port_base(mmio, port);
1395                 mv_port_init(&probe_ent->port[port], port_mmio);
1396         }
1397
1398         for (hc = 0; hc < n_hc; hc++) {
1399                 void __iomem *hc_mmio = mv_hc_base(mmio, hc);
1400
1401                 VPRINTK("HC%i: HC config=0x%08x HC IRQ cause "
1402                         "(before clear)=0x%08x\n", hc,
1403                         readl(hc_mmio + HC_CFG_OFS),
1404                         readl(hc_mmio + HC_IRQ_CAUSE_OFS));
1405
1406                 /* Clear any currently outstanding hc interrupt conditions */
1407                 writelfl(0, hc_mmio + HC_IRQ_CAUSE_OFS);
1408         }
1409
1410         /* Clear any currently outstanding host interrupt conditions */
1411         writelfl(0, mmio + PCI_IRQ_CAUSE_OFS);
1412
1413         /* and unmask interrupt generation for host regs */
1414         writelfl(PCI_UNMASK_ALL_IRQS, mmio + PCI_IRQ_MASK_OFS);
1415         writelfl(~HC_MAIN_MASKED_IRQS, mmio + HC_MAIN_IRQ_MASK_OFS);
1416
1417         VPRINTK("HC MAIN IRQ cause/mask=0x%08x/0x%08x "
1418                 "PCI int cause/mask=0x%08x/0x%08x\n", 
1419                 readl(mmio + HC_MAIN_IRQ_CAUSE_OFS),
1420                 readl(mmio + HC_MAIN_IRQ_MASK_OFS),
1421                 readl(mmio + PCI_IRQ_CAUSE_OFS),
1422                 readl(mmio + PCI_IRQ_MASK_OFS));
1423 done:
1424         return rc;
1425 }
1426
1427 /**
1428  *      mv_print_info - Dump key info to kernel log for perusal.
1429  *      @probe_ent: early data struct representing the host
1430  *
1431  *      FIXME: complete this.
1432  *
1433  *      LOCKING:
1434  *      Inherited from caller.
1435  */
1436 static void mv_print_info(struct ata_probe_ent *probe_ent)
1437 {
1438         struct pci_dev *pdev = to_pci_dev(probe_ent->dev);
1439         struct mv_host_priv *hpriv = probe_ent->private_data;
1440         u8 rev_id, scc;
1441         const char *scc_s;
1442
1443         /* Use this to determine the HW stepping of the chip so we know
1444          * what errata to workaround
1445          */
1446         pci_read_config_byte(pdev, PCI_REVISION_ID, &rev_id);
1447
1448         pci_read_config_byte(pdev, PCI_CLASS_DEVICE, &scc);
1449         if (scc == 0)
1450                 scc_s = "SCSI";
1451         else if (scc == 0x01)
1452                 scc_s = "RAID";
1453         else
1454                 scc_s = "unknown";
1455
1456         printk(KERN_INFO DRV_NAME 
1457                "(%s) %u slots %u ports %s mode IRQ via %s\n",
1458                pci_name(pdev), (unsigned)MV_MAX_Q_DEPTH, probe_ent->n_ports, 
1459                scc_s, (MV_HP_FLAG_MSI & hpriv->hp_flags) ? "MSI" : "INTx");
1460 }
1461
1462 /**
1463  *      mv_init_one - handle a positive probe of a Marvell host
1464  *      @pdev: PCI device found
1465  *      @ent: PCI device ID entry for the matched host
1466  *
1467  *      LOCKING:
1468  *      Inherited from caller.
1469  */
1470 static int mv_init_one(struct pci_dev *pdev, const struct pci_device_id *ent)
1471 {
1472         static int printed_version = 0;
1473         struct ata_probe_ent *probe_ent = NULL;
1474         struct mv_host_priv *hpriv;
1475         unsigned int board_idx = (unsigned int)ent->driver_data;
1476         void __iomem *mmio_base;
1477         int pci_dev_busy = 0, rc;
1478
1479         if (!printed_version++) {
1480                 printk(KERN_INFO DRV_NAME " version " DRV_VERSION "\n");
1481         }
1482
1483         rc = pci_enable_device(pdev);
1484         if (rc) {
1485                 return rc;
1486         }
1487
1488         rc = pci_request_regions(pdev, DRV_NAME);
1489         if (rc) {
1490                 pci_dev_busy = 1;
1491                 goto err_out;
1492         }
1493
1494         probe_ent = kmalloc(sizeof(*probe_ent), GFP_KERNEL);
1495         if (probe_ent == NULL) {
1496                 rc = -ENOMEM;
1497                 goto err_out_regions;
1498         }
1499
1500         memset(probe_ent, 0, sizeof(*probe_ent));
1501         probe_ent->dev = pci_dev_to_dev(pdev);
1502         INIT_LIST_HEAD(&probe_ent->node);
1503
1504         mmio_base = pci_iomap(pdev, MV_PRIMARY_BAR, 0);
1505         if (mmio_base == NULL) {
1506                 rc = -ENOMEM;
1507                 goto err_out_free_ent;
1508         }
1509
1510         hpriv = kmalloc(sizeof(*hpriv), GFP_KERNEL);
1511         if (!hpriv) {
1512                 rc = -ENOMEM;
1513                 goto err_out_iounmap;
1514         }
1515         memset(hpriv, 0, sizeof(*hpriv));
1516
1517         probe_ent->sht = mv_port_info[board_idx].sht;
1518         probe_ent->host_flags = mv_port_info[board_idx].host_flags;
1519         probe_ent->pio_mask = mv_port_info[board_idx].pio_mask;
1520         probe_ent->udma_mask = mv_port_info[board_idx].udma_mask;
1521         probe_ent->port_ops = mv_port_info[board_idx].port_ops;
1522
1523         probe_ent->irq = pdev->irq;
1524         probe_ent->irq_flags = SA_SHIRQ;
1525         probe_ent->mmio_base = mmio_base;
1526         probe_ent->private_data = hpriv;
1527
1528         /* initialize adapter */
1529         rc = mv_host_init(probe_ent);
1530         if (rc) {
1531                 goto err_out_hpriv;
1532         }
1533
1534         /* Enable interrupts */
1535         if (pci_enable_msi(pdev) == 0) {
1536                 hpriv->hp_flags |= MV_HP_FLAG_MSI;
1537         } else {
1538                 pci_intx(pdev, 1);
1539         }
1540
1541         mv_dump_pci_cfg(pdev, 0x68);
1542         mv_print_info(probe_ent);
1543
1544         if (ata_device_add(probe_ent) == 0) {
1545                 rc = -ENODEV;           /* No devices discovered */
1546                 goto err_out_dev_add;
1547         }
1548
1549         kfree(probe_ent);
1550         return 0;
1551
1552 err_out_dev_add:
1553         if (MV_HP_FLAG_MSI & hpriv->hp_flags) {
1554                 pci_disable_msi(pdev);
1555         } else {
1556                 pci_intx(pdev, 0);
1557         }
1558 err_out_hpriv:
1559         kfree(hpriv);
1560 err_out_iounmap:
1561         pci_iounmap(pdev, mmio_base);
1562 err_out_free_ent:
1563         kfree(probe_ent);
1564 err_out_regions:
1565         pci_release_regions(pdev);
1566 err_out:
1567         if (!pci_dev_busy) {
1568                 pci_disable_device(pdev);
1569         }
1570
1571         return rc;
1572 }
1573
1574 static int __init mv_init(void)
1575 {
1576         return pci_module_init(&mv_pci_driver);
1577 }
1578
1579 static void __exit mv_exit(void)
1580 {
1581         pci_unregister_driver(&mv_pci_driver);
1582 }
1583
1584 MODULE_AUTHOR("Brett Russ");
1585 MODULE_DESCRIPTION("SCSI low-level driver for Marvell SATA controllers");
1586 MODULE_LICENSE("GPL");
1587 MODULE_DEVICE_TABLE(pci, mv_pci_tbl);
1588 MODULE_VERSION(DRV_VERSION);
1589
1590 module_init(mv_init);
1591 module_exit(mv_exit);