Merge branch 'x86/cpu' into x86/xsave
[linux-2.6] / arch / arm / mach-ixp4xx / ixp4xx_npe.c
1 /*
2  * Intel IXP4xx Network Processor Engine driver for Linux
3  *
4  * Copyright (C) 2007 Krzysztof Halasa <khc@pm.waw.pl>
5  *
6  * This program is free software; you can redistribute it and/or modify it
7  * under the terms of version 2 of the GNU General Public License
8  * as published by the Free Software Foundation.
9  *
10  * The code is based on publicly available information:
11  * - Intel IXP4xx Developer's Manual and other e-papers
12  * - Intel IXP400 Access Library Software (BSD license)
13  * - previous works by Christian Hohnstaedt <chohnstaedt@innominate.com>
14  *   Thanks, Christian.
15  */
16
17 #include <linux/delay.h>
18 #include <linux/dma-mapping.h>
19 #include <linux/firmware.h>
20 #include <linux/io.h>
21 #include <linux/kernel.h>
22 #include <linux/module.h>
23 #include <linux/slab.h>
24 #include <mach/npe.h>
25
26 #define DEBUG_MSG                       0
27 #define DEBUG_FW                        0
28
29 #define NPE_COUNT                       3
30 #define MAX_RETRIES                     1000    /* microseconds */
31 #define NPE_42X_DATA_SIZE               0x800   /* in dwords */
32 #define NPE_46X_DATA_SIZE               0x1000
33 #define NPE_A_42X_INSTR_SIZE            0x1000
34 #define NPE_B_AND_C_42X_INSTR_SIZE      0x800
35 #define NPE_46X_INSTR_SIZE              0x1000
36 #define REGS_SIZE                       0x1000
37
38 #define NPE_PHYS_REG                    32
39
40 #define FW_MAGIC                        0xFEEDF00D
41 #define FW_BLOCK_TYPE_INSTR             0x0
42 #define FW_BLOCK_TYPE_DATA              0x1
43 #define FW_BLOCK_TYPE_EOF               0xF
44
45 /* NPE exec status (read) and command (write) */
46 #define CMD_NPE_STEP                    0x01
47 #define CMD_NPE_START                   0x02
48 #define CMD_NPE_STOP                    0x03
49 #define CMD_NPE_CLR_PIPE                0x04
50 #define CMD_CLR_PROFILE_CNT             0x0C
51 #define CMD_RD_INS_MEM                  0x10 /* instruction memory */
52 #define CMD_WR_INS_MEM                  0x11
53 #define CMD_RD_DATA_MEM                 0x12 /* data memory */
54 #define CMD_WR_DATA_MEM                 0x13
55 #define CMD_RD_ECS_REG                  0x14 /* exec access register */
56 #define CMD_WR_ECS_REG                  0x15
57
58 #define STAT_RUN                        0x80000000
59 #define STAT_STOP                       0x40000000
60 #define STAT_CLEAR                      0x20000000
61 #define STAT_ECS_K                      0x00800000 /* pipeline clean */
62
63 #define NPE_STEVT                       0x1B
64 #define NPE_STARTPC                     0x1C
65 #define NPE_REGMAP                      0x1E
66 #define NPE_CINDEX                      0x1F
67
68 #define INSTR_WR_REG_SHORT              0x0000C000
69 #define INSTR_WR_REG_BYTE               0x00004000
70 #define INSTR_RD_FIFO                   0x0F888220
71 #define INSTR_RESET_MBOX                0x0FAC8210
72
73 #define ECS_BG_CTXT_REG_0               0x00 /* Background Executing Context */
74 #define ECS_BG_CTXT_REG_1               0x01 /*         Stack level */
75 #define ECS_BG_CTXT_REG_2               0x02
76 #define ECS_PRI_1_CTXT_REG_0            0x04 /* Priority 1 Executing Context */
77 #define ECS_PRI_1_CTXT_REG_1            0x05 /*         Stack level */
78 #define ECS_PRI_1_CTXT_REG_2            0x06
79 #define ECS_PRI_2_CTXT_REG_0            0x08 /* Priority 2 Executing Context */
80 #define ECS_PRI_2_CTXT_REG_1            0x09 /*         Stack level */
81 #define ECS_PRI_2_CTXT_REG_2            0x0A
82 #define ECS_DBG_CTXT_REG_0              0x0C /* Debug Executing Context */
83 #define ECS_DBG_CTXT_REG_1              0x0D /*         Stack level */
84 #define ECS_DBG_CTXT_REG_2              0x0E
85 #define ECS_INSTRUCT_REG                0x11 /* NPE Instruction Register */
86
87 #define ECS_REG_0_ACTIVE                0x80000000 /* all levels */
88 #define ECS_REG_0_NEXTPC_MASK           0x1FFF0000 /* BG/PRI1/PRI2 levels */
89 #define ECS_REG_0_LDUR_BITS             8
90 #define ECS_REG_0_LDUR_MASK             0x00000700 /* all levels */
91 #define ECS_REG_1_CCTXT_BITS            16
92 #define ECS_REG_1_CCTXT_MASK            0x000F0000 /* all levels */
93 #define ECS_REG_1_SELCTXT_BITS          0
94 #define ECS_REG_1_SELCTXT_MASK          0x0000000F /* all levels */
95 #define ECS_DBG_REG_2_IF                0x00100000 /* debug level */
96 #define ECS_DBG_REG_2_IE                0x00080000 /* debug level */
97
98 /* NPE watchpoint_fifo register bit */
99 #define WFIFO_VALID                     0x80000000
100
101 /* NPE messaging_status register bit definitions */
102 #define MSGSTAT_OFNE    0x00010000 /* OutFifoNotEmpty */
103 #define MSGSTAT_IFNF    0x00020000 /* InFifoNotFull */
104 #define MSGSTAT_OFNF    0x00040000 /* OutFifoNotFull */
105 #define MSGSTAT_IFNE    0x00080000 /* InFifoNotEmpty */
106 #define MSGSTAT_MBINT   0x00100000 /* Mailbox interrupt */
107 #define MSGSTAT_IFINT   0x00200000 /* InFifo interrupt */
108 #define MSGSTAT_OFINT   0x00400000 /* OutFifo interrupt */
109 #define MSGSTAT_WFINT   0x00800000 /* WatchFifo interrupt */
110
111 /* NPE messaging_control register bit definitions */
112 #define MSGCTL_OUT_FIFO                 0x00010000 /* enable output FIFO */
113 #define MSGCTL_IN_FIFO                  0x00020000 /* enable input FIFO */
114 #define MSGCTL_OUT_FIFO_WRITE           0x01000000 /* enable FIFO + WRITE */
115 #define MSGCTL_IN_FIFO_WRITE            0x02000000
116
117 /* NPE mailbox_status value for reset */
118 #define RESET_MBOX_STAT                 0x0000F0F0
119
120 const char *npe_names[] = { "NPE-A", "NPE-B", "NPE-C" };
121
122 #define print_npe(pri, npe, fmt, ...)                                   \
123         printk(pri "%s: " fmt, npe_name(npe), ## __VA_ARGS__)
124
125 #if DEBUG_MSG
126 #define debug_msg(npe, fmt, ...)                                        \
127         print_npe(KERN_DEBUG, npe, fmt, ## __VA_ARGS__)
128 #else
129 #define debug_msg(npe, fmt, ...)
130 #endif
131
132 static struct {
133         u32 reg, val;
134 } ecs_reset[] = {
135         { ECS_BG_CTXT_REG_0,    0xA0000000 },
136         { ECS_BG_CTXT_REG_1,    0x01000000 },
137         { ECS_BG_CTXT_REG_2,    0x00008000 },
138         { ECS_PRI_1_CTXT_REG_0, 0x20000080 },
139         { ECS_PRI_1_CTXT_REG_1, 0x01000000 },
140         { ECS_PRI_1_CTXT_REG_2, 0x00008000 },
141         { ECS_PRI_2_CTXT_REG_0, 0x20000080 },
142         { ECS_PRI_2_CTXT_REG_1, 0x01000000 },
143         { ECS_PRI_2_CTXT_REG_2, 0x00008000 },
144         { ECS_DBG_CTXT_REG_0,   0x20000000 },
145         { ECS_DBG_CTXT_REG_1,   0x00000000 },
146         { ECS_DBG_CTXT_REG_2,   0x001E0000 },
147         { ECS_INSTRUCT_REG,     0x1003C00F },
148 };
149
150 static struct npe npe_tab[NPE_COUNT] = {
151         {
152                 .id     = 0,
153                 .regs   = (struct npe_regs __iomem *)IXP4XX_NPEA_BASE_VIRT,
154                 .regs_phys = IXP4XX_NPEA_BASE_PHYS,
155         }, {
156                 .id     = 1,
157                 .regs   = (struct npe_regs __iomem *)IXP4XX_NPEB_BASE_VIRT,
158                 .regs_phys = IXP4XX_NPEB_BASE_PHYS,
159         }, {
160                 .id     = 2,
161                 .regs   = (struct npe_regs __iomem *)IXP4XX_NPEC_BASE_VIRT,
162                 .regs_phys = IXP4XX_NPEC_BASE_PHYS,
163         }
164 };
165
166 int npe_running(struct npe *npe)
167 {
168         return (__raw_readl(&npe->regs->exec_status_cmd) & STAT_RUN) != 0;
169 }
170
171 static void npe_cmd_write(struct npe *npe, u32 addr, int cmd, u32 data)
172 {
173         __raw_writel(data, &npe->regs->exec_data);
174         __raw_writel(addr, &npe->regs->exec_addr);
175         __raw_writel(cmd, &npe->regs->exec_status_cmd);
176 }
177
178 static u32 npe_cmd_read(struct npe *npe, u32 addr, int cmd)
179 {
180         __raw_writel(addr, &npe->regs->exec_addr);
181         __raw_writel(cmd, &npe->regs->exec_status_cmd);
182         /* Iintroduce extra read cycles after issuing read command to NPE
183            so that we read the register after the NPE has updated it.
184            This is to overcome race condition between XScale and NPE */
185         __raw_readl(&npe->regs->exec_data);
186         __raw_readl(&npe->regs->exec_data);
187         return __raw_readl(&npe->regs->exec_data);
188 }
189
190 static void npe_clear_active(struct npe *npe, u32 reg)
191 {
192         u32 val = npe_cmd_read(npe, reg, CMD_RD_ECS_REG);
193         npe_cmd_write(npe, reg, CMD_WR_ECS_REG, val & ~ECS_REG_0_ACTIVE);
194 }
195
196 static void npe_start(struct npe *npe)
197 {
198         /* ensure only Background Context Stack Level is active */
199         npe_clear_active(npe, ECS_PRI_1_CTXT_REG_0);
200         npe_clear_active(npe, ECS_PRI_2_CTXT_REG_0);
201         npe_clear_active(npe, ECS_DBG_CTXT_REG_0);
202
203         __raw_writel(CMD_NPE_CLR_PIPE, &npe->regs->exec_status_cmd);
204         __raw_writel(CMD_NPE_START, &npe->regs->exec_status_cmd);
205 }
206
207 static void npe_stop(struct npe *npe)
208 {
209         __raw_writel(CMD_NPE_STOP, &npe->regs->exec_status_cmd);
210         __raw_writel(CMD_NPE_CLR_PIPE, &npe->regs->exec_status_cmd); /*FIXME?*/
211 }
212
213 static int __must_check npe_debug_instr(struct npe *npe, u32 instr, u32 ctx,
214                                         u32 ldur)
215 {
216         u32 wc;
217         int i;
218
219         /* set the Active bit, and the LDUR, in the debug level */
220         npe_cmd_write(npe, ECS_DBG_CTXT_REG_0, CMD_WR_ECS_REG,
221                       ECS_REG_0_ACTIVE | (ldur << ECS_REG_0_LDUR_BITS));
222
223         /* set CCTXT at ECS DEBUG L3 to specify in which context to execute
224            the instruction, and set SELCTXT at ECS DEBUG Level to specify
225            which context store to access.
226            Debug ECS Level Reg 1 has form 0x000n000n, where n = context number
227         */
228         npe_cmd_write(npe, ECS_DBG_CTXT_REG_1, CMD_WR_ECS_REG,
229                       (ctx << ECS_REG_1_CCTXT_BITS) |
230                       (ctx << ECS_REG_1_SELCTXT_BITS));
231
232         /* clear the pipeline */
233         __raw_writel(CMD_NPE_CLR_PIPE, &npe->regs->exec_status_cmd);
234
235         /* load NPE instruction into the instruction register */
236         npe_cmd_write(npe, ECS_INSTRUCT_REG, CMD_WR_ECS_REG, instr);
237
238         /* we need this value later to wait for completion of NPE execution
239            step */
240         wc = __raw_readl(&npe->regs->watch_count);
241
242         /* issue a Step One command via the Execution Control register */
243         __raw_writel(CMD_NPE_STEP, &npe->regs->exec_status_cmd);
244
245         /* Watch Count register increments when NPE completes an instruction */
246         for (i = 0; i < MAX_RETRIES; i++) {
247                 if (wc != __raw_readl(&npe->regs->watch_count))
248                         return 0;
249                 udelay(1);
250         }
251
252         print_npe(KERN_ERR, npe, "reset: npe_debug_instr(): timeout\n");
253         return -ETIMEDOUT;
254 }
255
256 static int __must_check npe_logical_reg_write8(struct npe *npe, u32 addr,
257                                                u8 val, u32 ctx)
258 {
259         /* here we build the NPE assembler instruction: mov8 d0, #0 */
260         u32 instr = INSTR_WR_REG_BYTE | /* OpCode */
261                 addr << 9 |             /* base Operand */
262                 (val & 0x1F) << 4 |     /* lower 5 bits to immediate data */
263                 (val & ~0x1F) << (18 - 5);/* higher 3 bits to CoProc instr. */
264         return npe_debug_instr(npe, instr, ctx, 1); /* execute it */
265 }
266
267 static int __must_check npe_logical_reg_write16(struct npe *npe, u32 addr,
268                                                 u16 val, u32 ctx)
269 {
270         /* here we build the NPE assembler instruction: mov16 d0, #0 */
271         u32 instr = INSTR_WR_REG_SHORT | /* OpCode */
272                 addr << 9 |             /* base Operand */
273                 (val & 0x1F) << 4 |     /* lower 5 bits to immediate data */
274                 (val & ~0x1F) << (18 - 5);/* higher 11 bits to CoProc instr. */
275         return npe_debug_instr(npe, instr, ctx, 1); /* execute it */
276 }
277
278 static int __must_check npe_logical_reg_write32(struct npe *npe, u32 addr,
279                                                 u32 val, u32 ctx)
280 {
281         /* write in 16 bit steps first the high and then the low value */
282         if (npe_logical_reg_write16(npe, addr, val >> 16, ctx))
283                 return -ETIMEDOUT;
284         return npe_logical_reg_write16(npe, addr + 2, val & 0xFFFF, ctx);
285 }
286
287 static int npe_reset(struct npe *npe)
288 {
289         u32 val, ctl, exec_count, ctx_reg2;
290         int i;
291
292         ctl = (__raw_readl(&npe->regs->messaging_control) | 0x3F000000) &
293                 0x3F3FFFFF;
294
295         /* disable parity interrupt */
296         __raw_writel(ctl & 0x3F00FFFF, &npe->regs->messaging_control);
297
298         /* pre exec - debug instruction */
299         /* turn off the halt bit by clearing Execution Count register. */
300         exec_count = __raw_readl(&npe->regs->exec_count);
301         __raw_writel(0, &npe->regs->exec_count);
302         /* ensure that IF and IE are on (temporarily), so that we don't end up
303            stepping forever */
304         ctx_reg2 = npe_cmd_read(npe, ECS_DBG_CTXT_REG_2, CMD_RD_ECS_REG);
305         npe_cmd_write(npe, ECS_DBG_CTXT_REG_2, CMD_WR_ECS_REG, ctx_reg2 |
306                       ECS_DBG_REG_2_IF | ECS_DBG_REG_2_IE);
307
308         /* clear the FIFOs */
309         while (__raw_readl(&npe->regs->watchpoint_fifo) & WFIFO_VALID)
310                 ;
311         while (__raw_readl(&npe->regs->messaging_status) & MSGSTAT_OFNE)
312                 /* read from the outFIFO until empty */
313                 print_npe(KERN_DEBUG, npe, "npe_reset: read FIFO = 0x%X\n",
314                           __raw_readl(&npe->regs->in_out_fifo));
315
316         while (__raw_readl(&npe->regs->messaging_status) & MSGSTAT_IFNE)
317                 /* step execution of the NPE intruction to read inFIFO using
318                    the Debug Executing Context stack */
319                 if (npe_debug_instr(npe, INSTR_RD_FIFO, 0, 0))
320                         return -ETIMEDOUT;
321
322         /* reset the mailbox reg from the XScale side */
323         __raw_writel(RESET_MBOX_STAT, &npe->regs->mailbox_status);
324         /* from NPE side */
325         if (npe_debug_instr(npe, INSTR_RESET_MBOX, 0, 0))
326                 return -ETIMEDOUT;
327
328         /* Reset the physical registers in the NPE register file */
329         for (val = 0; val < NPE_PHYS_REG; val++) {
330                 if (npe_logical_reg_write16(npe, NPE_REGMAP, val >> 1, 0))
331                         return -ETIMEDOUT;
332                 /* address is either 0 or 4 */
333                 if (npe_logical_reg_write32(npe, (val & 1) * 4, 0, 0))
334                         return -ETIMEDOUT;
335         }
336
337         /* Reset the context store = each context's Context Store registers */
338
339         /* Context 0 has no STARTPC. Instead, this value is used to set NextPC
340            for Background ECS, to set where NPE starts executing code */
341         val = npe_cmd_read(npe, ECS_BG_CTXT_REG_0, CMD_RD_ECS_REG);
342         val &= ~ECS_REG_0_NEXTPC_MASK;
343         val |= (0 /* NextPC */ << 16) & ECS_REG_0_NEXTPC_MASK;
344         npe_cmd_write(npe, ECS_BG_CTXT_REG_0, CMD_WR_ECS_REG, val);
345
346         for (i = 0; i < 16; i++) {
347                 if (i) {        /* Context 0 has no STEVT nor STARTPC */
348                         /* STEVT = off, 0x80 */
349                         if (npe_logical_reg_write8(npe, NPE_STEVT, 0x80, i))
350                                 return -ETIMEDOUT;
351                         if (npe_logical_reg_write16(npe, NPE_STARTPC, 0, i))
352                                 return -ETIMEDOUT;
353                 }
354                 /* REGMAP = d0->p0, d8->p2, d16->p4 */
355                 if (npe_logical_reg_write16(npe, NPE_REGMAP, 0x820, i))
356                         return -ETIMEDOUT;
357                 if (npe_logical_reg_write8(npe, NPE_CINDEX, 0, i))
358                         return -ETIMEDOUT;
359         }
360
361         /* post exec */
362         /* clear active bit in debug level */
363         npe_cmd_write(npe, ECS_DBG_CTXT_REG_0, CMD_WR_ECS_REG, 0);
364         /* clear the pipeline */
365         __raw_writel(CMD_NPE_CLR_PIPE, &npe->regs->exec_status_cmd);
366         /* restore previous values */
367         __raw_writel(exec_count, &npe->regs->exec_count);
368         npe_cmd_write(npe, ECS_DBG_CTXT_REG_2, CMD_WR_ECS_REG, ctx_reg2);
369
370         /* write reset values to Execution Context Stack registers */
371         for (val = 0; val < ARRAY_SIZE(ecs_reset); val++)
372                 npe_cmd_write(npe, ecs_reset[val].reg, CMD_WR_ECS_REG,
373                               ecs_reset[val].val);
374
375         /* clear the profile counter */
376         __raw_writel(CMD_CLR_PROFILE_CNT, &npe->regs->exec_status_cmd);
377
378         __raw_writel(0, &npe->regs->exec_count);
379         __raw_writel(0, &npe->regs->action_points[0]);
380         __raw_writel(0, &npe->regs->action_points[1]);
381         __raw_writel(0, &npe->regs->action_points[2]);
382         __raw_writel(0, &npe->regs->action_points[3]);
383         __raw_writel(0, &npe->regs->watch_count);
384
385         val = ixp4xx_read_feature_bits();
386         /* reset the NPE */
387         ixp4xx_write_feature_bits(val &
388                                   ~(IXP4XX_FEATURE_RESET_NPEA << npe->id));
389         for (i = 0; i < MAX_RETRIES; i++) {
390                 if (!(ixp4xx_read_feature_bits() &
391                       (IXP4XX_FEATURE_RESET_NPEA << npe->id)))
392                         break;  /* reset completed */
393                 udelay(1);
394         }
395         if (i == MAX_RETRIES)
396                 return -ETIMEDOUT;
397
398         /* deassert reset */
399         ixp4xx_write_feature_bits(val |
400                                   (IXP4XX_FEATURE_RESET_NPEA << npe->id));
401         for (i = 0; i < MAX_RETRIES; i++) {
402                 if (ixp4xx_read_feature_bits() &
403                     (IXP4XX_FEATURE_RESET_NPEA << npe->id))
404                         break;  /* NPE is back alive */
405                 udelay(1);
406         }
407         if (i == MAX_RETRIES)
408                 return -ETIMEDOUT;
409
410         npe_stop(npe);
411
412         /* restore NPE configuration bus Control Register - parity settings */
413         __raw_writel(ctl, &npe->regs->messaging_control);
414         return 0;
415 }
416
417
418 int npe_send_message(struct npe *npe, const void *msg, const char *what)
419 {
420         const u32 *send = msg;
421         int cycles = 0;
422
423         debug_msg(npe, "Trying to send message %s [%08X:%08X]\n",
424                   what, send[0], send[1]);
425
426         if (__raw_readl(&npe->regs->messaging_status) & MSGSTAT_IFNE) {
427                 debug_msg(npe, "NPE input FIFO not empty\n");
428                 return -EIO;
429         }
430
431         __raw_writel(send[0], &npe->regs->in_out_fifo);
432
433         if (!(__raw_readl(&npe->regs->messaging_status) & MSGSTAT_IFNF)) {
434                 debug_msg(npe, "NPE input FIFO full\n");
435                 return -EIO;
436         }
437
438         __raw_writel(send[1], &npe->regs->in_out_fifo);
439
440         while ((cycles < MAX_RETRIES) &&
441                (__raw_readl(&npe->regs->messaging_status) & MSGSTAT_IFNE)) {
442                 udelay(1);
443                 cycles++;
444         }
445
446         if (cycles == MAX_RETRIES) {
447                 debug_msg(npe, "Timeout sending message\n");
448                 return -ETIMEDOUT;
449         }
450
451 #if DEBUG_MSG > 1
452         debug_msg(npe, "Sending a message took %i cycles\n", cycles);
453 #endif
454         return 0;
455 }
456
457 int npe_recv_message(struct npe *npe, void *msg, const char *what)
458 {
459         u32 *recv = msg;
460         int cycles = 0, cnt = 0;
461
462         debug_msg(npe, "Trying to receive message %s\n", what);
463
464         while (cycles < MAX_RETRIES) {
465                 if (__raw_readl(&npe->regs->messaging_status) & MSGSTAT_OFNE) {
466                         recv[cnt++] = __raw_readl(&npe->regs->in_out_fifo);
467                         if (cnt == 2)
468                                 break;
469                 } else {
470                         udelay(1);
471                         cycles++;
472                 }
473         }
474
475         switch(cnt) {
476         case 1:
477                 debug_msg(npe, "Received [%08X]\n", recv[0]);
478                 break;
479         case 2:
480                 debug_msg(npe, "Received [%08X:%08X]\n", recv[0], recv[1]);
481                 break;
482         }
483
484         if (cycles == MAX_RETRIES) {
485                 debug_msg(npe, "Timeout waiting for message\n");
486                 return -ETIMEDOUT;
487         }
488
489 #if DEBUG_MSG > 1
490         debug_msg(npe, "Receiving a message took %i cycles\n", cycles);
491 #endif
492         return 0;
493 }
494
495 int npe_send_recv_message(struct npe *npe, void *msg, const char *what)
496 {
497         int result;
498         u32 *send = msg, recv[2];
499
500         if ((result = npe_send_message(npe, msg, what)) != 0)
501                 return result;
502         if ((result = npe_recv_message(npe, recv, what)) != 0)
503                 return result;
504
505         if ((recv[0] != send[0]) || (recv[1] != send[1])) {
506                 debug_msg(npe, "Message %s: unexpected message received\n",
507                           what);
508                 return -EIO;
509         }
510         return 0;
511 }
512
513
514 int npe_load_firmware(struct npe *npe, const char *name, struct device *dev)
515 {
516         const struct firmware *fw_entry;
517
518         struct dl_block {
519                 u32 type;
520                 u32 offset;
521         } *blk;
522
523         struct dl_image {
524                 u32 magic;
525                 u32 id;
526                 u32 size;
527                 union {
528                         u32 data[0];
529                         struct dl_block blocks[0];
530                 };
531         } *image;
532
533         struct dl_codeblock {
534                 u32 npe_addr;
535                 u32 size;
536                 u32 data[0];
537         } *cb;
538
539         int i, j, err, data_size, instr_size, blocks, table_end;
540         u32 cmd;
541
542         if ((err = request_firmware(&fw_entry, name, dev)) != 0)
543                 return err;
544
545         err = -EINVAL;
546         if (fw_entry->size < sizeof(struct dl_image)) {
547                 print_npe(KERN_ERR, npe, "incomplete firmware file\n");
548                 goto err;
549         }
550         image = (struct dl_image*)fw_entry->data;
551
552 #if DEBUG_FW
553         print_npe(KERN_DEBUG, npe, "firmware: %08X %08X %08X (0x%X bytes)\n",
554                   image->magic, image->id, image->size, image->size * 4);
555 #endif
556
557         if (image->magic == swab32(FW_MAGIC)) { /* swapped file */
558                 image->id = swab32(image->id);
559                 image->size = swab32(image->size);
560         } else if (image->magic != FW_MAGIC) {
561                 print_npe(KERN_ERR, npe, "bad firmware file magic: 0x%X\n",
562                           image->magic);
563                 goto err;
564         }
565         if ((image->size * 4 + sizeof(struct dl_image)) != fw_entry->size) {
566                 print_npe(KERN_ERR, npe,
567                           "inconsistent size of firmware file\n");
568                 goto err;
569         }
570         if (((image->id >> 24) & 0xF /* NPE ID */) != npe->id) {
571                 print_npe(KERN_ERR, npe, "firmware file NPE ID mismatch\n");
572                 goto err;
573         }
574         if (image->magic == swab32(FW_MAGIC))
575                 for (i = 0; i < image->size; i++)
576                         image->data[i] = swab32(image->data[i]);
577
578         if (!cpu_is_ixp46x() && ((image->id >> 28) & 0xF /* device ID */)) {
579                 print_npe(KERN_INFO, npe, "IXP46x firmware ignored on "
580                           "IXP42x\n");
581                 goto err;
582         }
583
584         if (npe_running(npe)) {
585                 print_npe(KERN_INFO, npe, "unable to load firmware, NPE is "
586                           "already running\n");
587                 err = -EBUSY;
588                 goto err;
589         }
590 #if 0
591         npe_stop(npe);
592         npe_reset(npe);
593 #endif
594
595         print_npe(KERN_INFO, npe, "firmware functionality 0x%X, "
596                   "revision 0x%X:%X\n", (image->id >> 16) & 0xFF,
597                   (image->id >> 8) & 0xFF, image->id & 0xFF);
598
599         if (!cpu_is_ixp46x()) {
600                 if (!npe->id)
601                         instr_size = NPE_A_42X_INSTR_SIZE;
602                 else
603                         instr_size = NPE_B_AND_C_42X_INSTR_SIZE;
604                 data_size = NPE_42X_DATA_SIZE;
605         } else {
606                 instr_size = NPE_46X_INSTR_SIZE;
607                 data_size = NPE_46X_DATA_SIZE;
608         }
609
610         for (blocks = 0; blocks * sizeof(struct dl_block) / 4 < image->size;
611              blocks++)
612                 if (image->blocks[blocks].type == FW_BLOCK_TYPE_EOF)
613                         break;
614         if (blocks * sizeof(struct dl_block) / 4 >= image->size) {
615                 print_npe(KERN_INFO, npe, "firmware EOF block marker not "
616                           "found\n");
617                 goto err;
618         }
619
620 #if DEBUG_FW
621         print_npe(KERN_DEBUG, npe, "%i firmware blocks found\n", blocks);
622 #endif
623
624         table_end = blocks * sizeof(struct dl_block) / 4 + 1 /* EOF marker */;
625         for (i = 0, blk = image->blocks; i < blocks; i++, blk++) {
626                 if (blk->offset > image->size - sizeof(struct dl_codeblock) / 4
627                     || blk->offset < table_end) {
628                         print_npe(KERN_INFO, npe, "invalid offset 0x%X of "
629                                   "firmware block #%i\n", blk->offset, i);
630                         goto err;
631                 }
632
633                 cb = (struct dl_codeblock*)&image->data[blk->offset];
634                 if (blk->type == FW_BLOCK_TYPE_INSTR) {
635                         if (cb->npe_addr + cb->size > instr_size)
636                                 goto too_big;
637                         cmd = CMD_WR_INS_MEM;
638                 } else if (blk->type == FW_BLOCK_TYPE_DATA) {
639                         if (cb->npe_addr + cb->size > data_size)
640                                 goto too_big;
641                         cmd = CMD_WR_DATA_MEM;
642                 } else {
643                         print_npe(KERN_INFO, npe, "invalid firmware block #%i "
644                                   "type 0x%X\n", i, blk->type);
645                         goto err;
646                 }
647                 if (blk->offset + sizeof(*cb) / 4 + cb->size > image->size) {
648                         print_npe(KERN_INFO, npe, "firmware block #%i doesn't "
649                                   "fit in firmware image: type %c, start 0x%X,"
650                                   " length 0x%X\n", i,
651                                   blk->type == FW_BLOCK_TYPE_INSTR ? 'I' : 'D',
652                                   cb->npe_addr, cb->size);
653                         goto err;
654                 }
655
656                 for (j = 0; j < cb->size; j++)
657                         npe_cmd_write(npe, cb->npe_addr + j, cmd, cb->data[j]);
658         }
659
660         npe_start(npe);
661         if (!npe_running(npe))
662                 print_npe(KERN_ERR, npe, "unable to start\n");
663         release_firmware(fw_entry);
664         return 0;
665
666 too_big:
667         print_npe(KERN_INFO, npe, "firmware block #%i doesn't fit in NPE "
668                   "memory: type %c, start 0x%X, length 0x%X\n", i,
669                   blk->type == FW_BLOCK_TYPE_INSTR ? 'I' : 'D',
670                   cb->npe_addr, cb->size);
671 err:
672         release_firmware(fw_entry);
673         return err;
674 }
675
676
677 struct npe *npe_request(int id)
678 {
679         if (id < NPE_COUNT)
680                 if (npe_tab[id].valid)
681                         if (try_module_get(THIS_MODULE))
682                                 return &npe_tab[id];
683         return NULL;
684 }
685
686 void npe_release(struct npe *npe)
687 {
688         module_put(THIS_MODULE);
689 }
690
691
692 static int __init npe_init_module(void)
693 {
694
695         int i, found = 0;
696
697         for (i = 0; i < NPE_COUNT; i++) {
698                 struct npe *npe = &npe_tab[i];
699                 if (!(ixp4xx_read_feature_bits() &
700                       (IXP4XX_FEATURE_RESET_NPEA << i)))
701                         continue; /* NPE already disabled or not present */
702                 if (!(npe->mem_res = request_mem_region(npe->regs_phys,
703                                                         REGS_SIZE,
704                                                         npe_name(npe)))) {
705                         print_npe(KERN_ERR, npe,
706                                   "failed to request memory region\n");
707                         continue;
708                 }
709
710                 if (npe_reset(npe))
711                         continue;
712                 npe->valid = 1;
713                 found++;
714         }
715
716         if (!found)
717                 return -ENOSYS;
718         return 0;
719 }
720
721 static void __exit npe_cleanup_module(void)
722 {
723         int i;
724
725         for (i = 0; i < NPE_COUNT; i++)
726                 if (npe_tab[i].mem_res) {
727                         npe_reset(&npe_tab[i]);
728                         release_resource(npe_tab[i].mem_res);
729                 }
730 }
731
732 module_init(npe_init_module);
733 module_exit(npe_cleanup_module);
734
735 MODULE_AUTHOR("Krzysztof Halasa");
736 MODULE_LICENSE("GPL v2");
737
738 EXPORT_SYMBOL(npe_names);
739 EXPORT_SYMBOL(npe_running);
740 EXPORT_SYMBOL(npe_request);
741 EXPORT_SYMBOL(npe_release);
742 EXPORT_SYMBOL(npe_load_firmware);
743 EXPORT_SYMBOL(npe_send_message);
744 EXPORT_SYMBOL(npe_recv_message);
745 EXPORT_SYMBOL(npe_send_recv_message);