sfc: Match calls to netif_napi_add() and netif_napi_del()
[linux-2.6] / drivers / net / mv643xx_eth.c
1 /*
2  * Driver for Marvell Discovery (MV643XX) and Marvell Orion ethernet ports
3  * Copyright (C) 2002 Matthew Dharm <mdharm@momenco.com>
4  *
5  * Based on the 64360 driver from:
6  * Copyright (C) 2002 Rabeeh Khoury <rabeeh@galileo.co.il>
7  *                    Rabeeh Khoury <rabeeh@marvell.com>
8  *
9  * Copyright (C) 2003 PMC-Sierra, Inc.,
10  *      written by Manish Lachwani
11  *
12  * Copyright (C) 2003 Ralf Baechle <ralf@linux-mips.org>
13  *
14  * Copyright (C) 2004-2006 MontaVista Software, Inc.
15  *                         Dale Farnsworth <dale@farnsworth.org>
16  *
17  * Copyright (C) 2004 Steven J. Hill <sjhill1@rockwellcollins.com>
18  *                                   <sjhill@realitydiluted.com>
19  *
20  * Copyright (C) 2007-2008 Marvell Semiconductor
21  *                         Lennert Buytenhek <buytenh@marvell.com>
22  *
23  * This program is free software; you can redistribute it and/or
24  * modify it under the terms of the GNU General Public License
25  * as published by the Free Software Foundation; either version 2
26  * of the License, or (at your option) any later version.
27  *
28  * This program is distributed in the hope that it will be useful,
29  * but WITHOUT ANY WARRANTY; without even the implied warranty of
30  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
31  * GNU General Public License for more details.
32  *
33  * You should have received a copy of the GNU General Public License
34  * along with this program; if not, write to the Free Software
35  * Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.
36  */
37
38 #include <linux/init.h>
39 #include <linux/dma-mapping.h>
40 #include <linux/in.h>
41 #include <linux/ip.h>
42 #include <linux/tcp.h>
43 #include <linux/udp.h>
44 #include <linux/etherdevice.h>
45 #include <linux/delay.h>
46 #include <linux/ethtool.h>
47 #include <linux/platform_device.h>
48 #include <linux/module.h>
49 #include <linux/kernel.h>
50 #include <linux/spinlock.h>
51 #include <linux/workqueue.h>
52 #include <linux/phy.h>
53 #include <linux/mv643xx_eth.h>
54 #include <linux/io.h>
55 #include <linux/types.h>
56 #include <linux/inet_lro.h>
57 #include <asm/system.h>
58
59 static char mv643xx_eth_driver_name[] = "mv643xx_eth";
60 static char mv643xx_eth_driver_version[] = "1.4";
61
62
63 /*
64  * Registers shared between all ports.
65  */
66 #define PHY_ADDR                        0x0000
67 #define SMI_REG                         0x0004
68 #define  SMI_BUSY                       0x10000000
69 #define  SMI_READ_VALID                 0x08000000
70 #define  SMI_OPCODE_READ                0x04000000
71 #define  SMI_OPCODE_WRITE               0x00000000
72 #define ERR_INT_CAUSE                   0x0080
73 #define  ERR_INT_SMI_DONE               0x00000010
74 #define ERR_INT_MASK                    0x0084
75 #define WINDOW_BASE(w)                  (0x0200 + ((w) << 3))
76 #define WINDOW_SIZE(w)                  (0x0204 + ((w) << 3))
77 #define WINDOW_REMAP_HIGH(w)            (0x0280 + ((w) << 2))
78 #define WINDOW_BAR_ENABLE               0x0290
79 #define WINDOW_PROTECT(w)               (0x0294 + ((w) << 4))
80
81 /*
82  * Main per-port registers.  These live at offset 0x0400 for
83  * port #0, 0x0800 for port #1, and 0x0c00 for port #2.
84  */
85 #define PORT_CONFIG                     0x0000
86 #define  UNICAST_PROMISCUOUS_MODE       0x00000001
87 #define PORT_CONFIG_EXT                 0x0004
88 #define MAC_ADDR_LOW                    0x0014
89 #define MAC_ADDR_HIGH                   0x0018
90 #define SDMA_CONFIG                     0x001c
91 #define PORT_SERIAL_CONTROL             0x003c
92 #define PORT_STATUS                     0x0044
93 #define  TX_FIFO_EMPTY                  0x00000400
94 #define  TX_IN_PROGRESS                 0x00000080
95 #define  PORT_SPEED_MASK                0x00000030
96 #define  PORT_SPEED_1000                0x00000010
97 #define  PORT_SPEED_100                 0x00000020
98 #define  PORT_SPEED_10                  0x00000000
99 #define  FLOW_CONTROL_ENABLED           0x00000008
100 #define  FULL_DUPLEX                    0x00000004
101 #define  LINK_UP                        0x00000002
102 #define TXQ_COMMAND                     0x0048
103 #define TXQ_FIX_PRIO_CONF               0x004c
104 #define TX_BW_RATE                      0x0050
105 #define TX_BW_MTU                       0x0058
106 #define TX_BW_BURST                     0x005c
107 #define INT_CAUSE                       0x0060
108 #define  INT_TX_END                     0x07f80000
109 #define  INT_RX                         0x000003fc
110 #define  INT_EXT                        0x00000002
111 #define INT_CAUSE_EXT                   0x0064
112 #define  INT_EXT_LINK_PHY               0x00110000
113 #define  INT_EXT_TX                     0x000000ff
114 #define INT_MASK                        0x0068
115 #define INT_MASK_EXT                    0x006c
116 #define TX_FIFO_URGENT_THRESHOLD        0x0074
117 #define TXQ_FIX_PRIO_CONF_MOVED         0x00dc
118 #define TX_BW_RATE_MOVED                0x00e0
119 #define TX_BW_MTU_MOVED                 0x00e8
120 #define TX_BW_BURST_MOVED               0x00ec
121 #define RXQ_CURRENT_DESC_PTR(q)         (0x020c + ((q) << 4))
122 #define RXQ_COMMAND                     0x0280
123 #define TXQ_CURRENT_DESC_PTR(q)         (0x02c0 + ((q) << 2))
124 #define TXQ_BW_TOKENS(q)                (0x0300 + ((q) << 4))
125 #define TXQ_BW_CONF(q)                  (0x0304 + ((q) << 4))
126 #define TXQ_BW_WRR_CONF(q)              (0x0308 + ((q) << 4))
127
128 /*
129  * Misc per-port registers.
130  */
131 #define MIB_COUNTERS(p)                 (0x1000 + ((p) << 7))
132 #define SPECIAL_MCAST_TABLE(p)          (0x1400 + ((p) << 10))
133 #define OTHER_MCAST_TABLE(p)            (0x1500 + ((p) << 10))
134 #define UNICAST_TABLE(p)                (0x1600 + ((p) << 10))
135
136
137 /*
138  * SDMA configuration register.
139  */
140 #define RX_BURST_SIZE_4_64BIT           (2 << 1)
141 #define RX_BURST_SIZE_16_64BIT          (4 << 1)
142 #define BLM_RX_NO_SWAP                  (1 << 4)
143 #define BLM_TX_NO_SWAP                  (1 << 5)
144 #define TX_BURST_SIZE_4_64BIT           (2 << 22)
145 #define TX_BURST_SIZE_16_64BIT          (4 << 22)
146
147 #if defined(__BIG_ENDIAN)
148 #define PORT_SDMA_CONFIG_DEFAULT_VALUE          \
149                 (RX_BURST_SIZE_4_64BIT  |       \
150                  TX_BURST_SIZE_4_64BIT)
151 #elif defined(__LITTLE_ENDIAN)
152 #define PORT_SDMA_CONFIG_DEFAULT_VALUE          \
153                 (RX_BURST_SIZE_4_64BIT  |       \
154                  BLM_RX_NO_SWAP         |       \
155                  BLM_TX_NO_SWAP         |       \
156                  TX_BURST_SIZE_4_64BIT)
157 #else
158 #error One of __BIG_ENDIAN or __LITTLE_ENDIAN must be defined
159 #endif
160
161
162 /*
163  * Port serial control register.
164  */
165 #define SET_MII_SPEED_TO_100                    (1 << 24)
166 #define SET_GMII_SPEED_TO_1000                  (1 << 23)
167 #define SET_FULL_DUPLEX_MODE                    (1 << 21)
168 #define MAX_RX_PACKET_9700BYTE                  (5 << 17)
169 #define DISABLE_AUTO_NEG_SPEED_GMII             (1 << 13)
170 #define DO_NOT_FORCE_LINK_FAIL                  (1 << 10)
171 #define SERIAL_PORT_CONTROL_RESERVED            (1 << 9)
172 #define DISABLE_AUTO_NEG_FOR_FLOW_CTRL          (1 << 3)
173 #define DISABLE_AUTO_NEG_FOR_DUPLEX             (1 << 2)
174 #define FORCE_LINK_PASS                         (1 << 1)
175 #define SERIAL_PORT_ENABLE                      (1 << 0)
176
177 #define DEFAULT_RX_QUEUE_SIZE           128
178 #define DEFAULT_TX_QUEUE_SIZE           256
179
180
181 /*
182  * RX/TX descriptors.
183  */
184 #if defined(__BIG_ENDIAN)
185 struct rx_desc {
186         u16 byte_cnt;           /* Descriptor buffer byte count         */
187         u16 buf_size;           /* Buffer size                          */
188         u32 cmd_sts;            /* Descriptor command status            */
189         u32 next_desc_ptr;      /* Next descriptor pointer              */
190         u32 buf_ptr;            /* Descriptor buffer pointer            */
191 };
192
193 struct tx_desc {
194         u16 byte_cnt;           /* buffer byte count                    */
195         u16 l4i_chk;            /* CPU provided TCP checksum            */
196         u32 cmd_sts;            /* Command/status field                 */
197         u32 next_desc_ptr;      /* Pointer to next descriptor           */
198         u32 buf_ptr;            /* pointer to buffer for this descriptor*/
199 };
200 #elif defined(__LITTLE_ENDIAN)
201 struct rx_desc {
202         u32 cmd_sts;            /* Descriptor command status            */
203         u16 buf_size;           /* Buffer size                          */
204         u16 byte_cnt;           /* Descriptor buffer byte count         */
205         u32 buf_ptr;            /* Descriptor buffer pointer            */
206         u32 next_desc_ptr;      /* Next descriptor pointer              */
207 };
208
209 struct tx_desc {
210         u32 cmd_sts;            /* Command/status field                 */
211         u16 l4i_chk;            /* CPU provided TCP checksum            */
212         u16 byte_cnt;           /* buffer byte count                    */
213         u32 buf_ptr;            /* pointer to buffer for this descriptor*/
214         u32 next_desc_ptr;      /* Pointer to next descriptor           */
215 };
216 #else
217 #error One of __BIG_ENDIAN or __LITTLE_ENDIAN must be defined
218 #endif
219
220 /* RX & TX descriptor command */
221 #define BUFFER_OWNED_BY_DMA             0x80000000
222
223 /* RX & TX descriptor status */
224 #define ERROR_SUMMARY                   0x00000001
225
226 /* RX descriptor status */
227 #define LAYER_4_CHECKSUM_OK             0x40000000
228 #define RX_ENABLE_INTERRUPT             0x20000000
229 #define RX_FIRST_DESC                   0x08000000
230 #define RX_LAST_DESC                    0x04000000
231 #define RX_IP_HDR_OK                    0x02000000
232 #define RX_PKT_IS_IPV4                  0x01000000
233 #define RX_PKT_IS_ETHERNETV2            0x00800000
234 #define RX_PKT_LAYER4_TYPE_MASK         0x00600000
235 #define RX_PKT_LAYER4_TYPE_TCP_IPV4     0x00000000
236 #define RX_PKT_IS_VLAN_TAGGED           0x00080000
237
238 /* TX descriptor command */
239 #define TX_ENABLE_INTERRUPT             0x00800000
240 #define GEN_CRC                         0x00400000
241 #define TX_FIRST_DESC                   0x00200000
242 #define TX_LAST_DESC                    0x00100000
243 #define ZERO_PADDING                    0x00080000
244 #define GEN_IP_V4_CHECKSUM              0x00040000
245 #define GEN_TCP_UDP_CHECKSUM            0x00020000
246 #define UDP_FRAME                       0x00010000
247 #define MAC_HDR_EXTRA_4_BYTES           0x00008000
248 #define MAC_HDR_EXTRA_8_BYTES           0x00000200
249
250 #define TX_IHL_SHIFT                    11
251
252
253 /* global *******************************************************************/
254 struct mv643xx_eth_shared_private {
255         /*
256          * Ethernet controller base address.
257          */
258         void __iomem *base;
259
260         /*
261          * Points at the right SMI instance to use.
262          */
263         struct mv643xx_eth_shared_private *smi;
264
265         /*
266          * Provides access to local SMI interface.
267          */
268         struct mii_bus *smi_bus;
269
270         /*
271          * If we have access to the error interrupt pin (which is
272          * somewhat misnamed as it not only reflects internal errors
273          * but also reflects SMI completion), use that to wait for
274          * SMI access completion instead of polling the SMI busy bit.
275          */
276         int err_interrupt;
277         wait_queue_head_t smi_busy_wait;
278
279         /*
280          * Per-port MBUS window access register value.
281          */
282         u32 win_protect;
283
284         /*
285          * Hardware-specific parameters.
286          */
287         unsigned int t_clk;
288         int extended_rx_coal_limit;
289         int tx_bw_control;
290 };
291
292 #define TX_BW_CONTROL_ABSENT            0
293 #define TX_BW_CONTROL_OLD_LAYOUT        1
294 #define TX_BW_CONTROL_NEW_LAYOUT        2
295
296 static int mv643xx_eth_open(struct net_device *dev);
297 static int mv643xx_eth_stop(struct net_device *dev);
298
299
300 /* per-port *****************************************************************/
301 struct mib_counters {
302         u64 good_octets_received;
303         u32 bad_octets_received;
304         u32 internal_mac_transmit_err;
305         u32 good_frames_received;
306         u32 bad_frames_received;
307         u32 broadcast_frames_received;
308         u32 multicast_frames_received;
309         u32 frames_64_octets;
310         u32 frames_65_to_127_octets;
311         u32 frames_128_to_255_octets;
312         u32 frames_256_to_511_octets;
313         u32 frames_512_to_1023_octets;
314         u32 frames_1024_to_max_octets;
315         u64 good_octets_sent;
316         u32 good_frames_sent;
317         u32 excessive_collision;
318         u32 multicast_frames_sent;
319         u32 broadcast_frames_sent;
320         u32 unrec_mac_control_received;
321         u32 fc_sent;
322         u32 good_fc_received;
323         u32 bad_fc_received;
324         u32 undersize_received;
325         u32 fragments_received;
326         u32 oversize_received;
327         u32 jabber_received;
328         u32 mac_receive_error;
329         u32 bad_crc_event;
330         u32 collision;
331         u32 late_collision;
332 };
333
334 struct lro_counters {
335         u32 lro_aggregated;
336         u32 lro_flushed;
337         u32 lro_no_desc;
338 };
339
340 struct rx_queue {
341         int index;
342
343         int rx_ring_size;
344
345         int rx_desc_count;
346         int rx_curr_desc;
347         int rx_used_desc;
348
349         struct rx_desc *rx_desc_area;
350         dma_addr_t rx_desc_dma;
351         int rx_desc_area_size;
352         struct sk_buff **rx_skb;
353
354         struct net_lro_mgr lro_mgr;
355         struct net_lro_desc lro_arr[8];
356 };
357
358 struct tx_queue {
359         int index;
360
361         int tx_ring_size;
362
363         int tx_desc_count;
364         int tx_curr_desc;
365         int tx_used_desc;
366
367         struct tx_desc *tx_desc_area;
368         dma_addr_t tx_desc_dma;
369         int tx_desc_area_size;
370
371         struct sk_buff_head tx_skb;
372
373         unsigned long tx_packets;
374         unsigned long tx_bytes;
375         unsigned long tx_dropped;
376 };
377
378 struct mv643xx_eth_private {
379         struct mv643xx_eth_shared_private *shared;
380         void __iomem *base;
381         int port_num;
382
383         struct net_device *dev;
384
385         struct phy_device *phy;
386
387         struct timer_list mib_counters_timer;
388         spinlock_t mib_counters_lock;
389         struct mib_counters mib_counters;
390
391         struct lro_counters lro_counters;
392
393         struct work_struct tx_timeout_task;
394
395         struct napi_struct napi;
396         u8 work_link;
397         u8 work_tx;
398         u8 work_tx_end;
399         u8 work_rx;
400         u8 work_rx_refill;
401         u8 work_rx_oom;
402
403         int skb_size;
404         struct sk_buff_head rx_recycle;
405
406         /*
407          * RX state.
408          */
409         int rx_ring_size;
410         unsigned long rx_desc_sram_addr;
411         int rx_desc_sram_size;
412         int rxq_count;
413         struct timer_list rx_oom;
414         struct rx_queue rxq[8];
415
416         /*
417          * TX state.
418          */
419         int tx_ring_size;
420         unsigned long tx_desc_sram_addr;
421         int tx_desc_sram_size;
422         int txq_count;
423         struct tx_queue txq[8];
424 };
425
426
427 /* port register accessors **************************************************/
428 static inline u32 rdl(struct mv643xx_eth_private *mp, int offset)
429 {
430         return readl(mp->shared->base + offset);
431 }
432
433 static inline u32 rdlp(struct mv643xx_eth_private *mp, int offset)
434 {
435         return readl(mp->base + offset);
436 }
437
438 static inline void wrl(struct mv643xx_eth_private *mp, int offset, u32 data)
439 {
440         writel(data, mp->shared->base + offset);
441 }
442
443 static inline void wrlp(struct mv643xx_eth_private *mp, int offset, u32 data)
444 {
445         writel(data, mp->base + offset);
446 }
447
448
449 /* rxq/txq helper functions *************************************************/
450 static struct mv643xx_eth_private *rxq_to_mp(struct rx_queue *rxq)
451 {
452         return container_of(rxq, struct mv643xx_eth_private, rxq[rxq->index]);
453 }
454
455 static struct mv643xx_eth_private *txq_to_mp(struct tx_queue *txq)
456 {
457         return container_of(txq, struct mv643xx_eth_private, txq[txq->index]);
458 }
459
460 static void rxq_enable(struct rx_queue *rxq)
461 {
462         struct mv643xx_eth_private *mp = rxq_to_mp(rxq);
463         wrlp(mp, RXQ_COMMAND, 1 << rxq->index);
464 }
465
466 static void rxq_disable(struct rx_queue *rxq)
467 {
468         struct mv643xx_eth_private *mp = rxq_to_mp(rxq);
469         u8 mask = 1 << rxq->index;
470
471         wrlp(mp, RXQ_COMMAND, mask << 8);
472         while (rdlp(mp, RXQ_COMMAND) & mask)
473                 udelay(10);
474 }
475
476 static void txq_reset_hw_ptr(struct tx_queue *txq)
477 {
478         struct mv643xx_eth_private *mp = txq_to_mp(txq);
479         u32 addr;
480
481         addr = (u32)txq->tx_desc_dma;
482         addr += txq->tx_curr_desc * sizeof(struct tx_desc);
483         wrlp(mp, TXQ_CURRENT_DESC_PTR(txq->index), addr);
484 }
485
486 static void txq_enable(struct tx_queue *txq)
487 {
488         struct mv643xx_eth_private *mp = txq_to_mp(txq);
489         wrlp(mp, TXQ_COMMAND, 1 << txq->index);
490 }
491
492 static void txq_disable(struct tx_queue *txq)
493 {
494         struct mv643xx_eth_private *mp = txq_to_mp(txq);
495         u8 mask = 1 << txq->index;
496
497         wrlp(mp, TXQ_COMMAND, mask << 8);
498         while (rdlp(mp, TXQ_COMMAND) & mask)
499                 udelay(10);
500 }
501
502 static void txq_maybe_wake(struct tx_queue *txq)
503 {
504         struct mv643xx_eth_private *mp = txq_to_mp(txq);
505         struct netdev_queue *nq = netdev_get_tx_queue(mp->dev, txq->index);
506
507         if (netif_tx_queue_stopped(nq)) {
508                 __netif_tx_lock(nq, smp_processor_id());
509                 if (txq->tx_ring_size - txq->tx_desc_count >= MAX_SKB_FRAGS + 1)
510                         netif_tx_wake_queue(nq);
511                 __netif_tx_unlock(nq);
512         }
513 }
514
515
516 /* rx napi ******************************************************************/
517 static int
518 mv643xx_get_skb_header(struct sk_buff *skb, void **iphdr, void **tcph,
519                        u64 *hdr_flags, void *priv)
520 {
521         unsigned long cmd_sts = (unsigned long)priv;
522
523         /*
524          * Make sure that this packet is Ethernet II, is not VLAN
525          * tagged, is IPv4, has a valid IP header, and is TCP.
526          */
527         if ((cmd_sts & (RX_IP_HDR_OK | RX_PKT_IS_IPV4 |
528                        RX_PKT_IS_ETHERNETV2 | RX_PKT_LAYER4_TYPE_MASK |
529                        RX_PKT_IS_VLAN_TAGGED)) !=
530             (RX_IP_HDR_OK | RX_PKT_IS_IPV4 |
531              RX_PKT_IS_ETHERNETV2 | RX_PKT_LAYER4_TYPE_TCP_IPV4))
532                 return -1;
533
534         skb_reset_network_header(skb);
535         skb_set_transport_header(skb, ip_hdrlen(skb));
536         *iphdr = ip_hdr(skb);
537         *tcph = tcp_hdr(skb);
538         *hdr_flags = LRO_IPV4 | LRO_TCP;
539
540         return 0;
541 }
542
543 static int rxq_process(struct rx_queue *rxq, int budget)
544 {
545         struct mv643xx_eth_private *mp = rxq_to_mp(rxq);
546         struct net_device_stats *stats = &mp->dev->stats;
547         int lro_flush_needed;
548         int rx;
549
550         lro_flush_needed = 0;
551         rx = 0;
552         while (rx < budget && rxq->rx_desc_count) {
553                 struct rx_desc *rx_desc;
554                 unsigned int cmd_sts;
555                 struct sk_buff *skb;
556                 u16 byte_cnt;
557
558                 rx_desc = &rxq->rx_desc_area[rxq->rx_curr_desc];
559
560                 cmd_sts = rx_desc->cmd_sts;
561                 if (cmd_sts & BUFFER_OWNED_BY_DMA)
562                         break;
563                 rmb();
564
565                 skb = rxq->rx_skb[rxq->rx_curr_desc];
566                 rxq->rx_skb[rxq->rx_curr_desc] = NULL;
567
568                 rxq->rx_curr_desc++;
569                 if (rxq->rx_curr_desc == rxq->rx_ring_size)
570                         rxq->rx_curr_desc = 0;
571
572                 dma_unmap_single(NULL, rx_desc->buf_ptr,
573                                  rx_desc->buf_size, DMA_FROM_DEVICE);
574                 rxq->rx_desc_count--;
575                 rx++;
576
577                 mp->work_rx_refill |= 1 << rxq->index;
578
579                 byte_cnt = rx_desc->byte_cnt;
580
581                 /*
582                  * Update statistics.
583                  *
584                  * Note that the descriptor byte count includes 2 dummy
585                  * bytes automatically inserted by the hardware at the
586                  * start of the packet (which we don't count), and a 4
587                  * byte CRC at the end of the packet (which we do count).
588                  */
589                 stats->rx_packets++;
590                 stats->rx_bytes += byte_cnt - 2;
591
592                 /*
593                  * In case we received a packet without first / last bits
594                  * on, or the error summary bit is set, the packet needs
595                  * to be dropped.
596                  */
597                 if ((cmd_sts & (RX_FIRST_DESC | RX_LAST_DESC | ERROR_SUMMARY))
598                         != (RX_FIRST_DESC | RX_LAST_DESC))
599                         goto err;
600
601                 /*
602                  * The -4 is for the CRC in the trailer of the
603                  * received packet
604                  */
605                 skb_put(skb, byte_cnt - 2 - 4);
606
607                 if (cmd_sts & LAYER_4_CHECKSUM_OK)
608                         skb->ip_summed = CHECKSUM_UNNECESSARY;
609                 skb->protocol = eth_type_trans(skb, mp->dev);
610
611                 if (skb->dev->features & NETIF_F_LRO &&
612                     skb->ip_summed == CHECKSUM_UNNECESSARY) {
613                         lro_receive_skb(&rxq->lro_mgr, skb, (void *)cmd_sts);
614                         lro_flush_needed = 1;
615                 } else
616                         netif_receive_skb(skb);
617
618                 continue;
619
620 err:
621                 stats->rx_dropped++;
622
623                 if ((cmd_sts & (RX_FIRST_DESC | RX_LAST_DESC)) !=
624                         (RX_FIRST_DESC | RX_LAST_DESC)) {
625                         if (net_ratelimit())
626                                 dev_printk(KERN_ERR, &mp->dev->dev,
627                                            "received packet spanning "
628                                            "multiple descriptors\n");
629                 }
630
631                 if (cmd_sts & ERROR_SUMMARY)
632                         stats->rx_errors++;
633
634                 dev_kfree_skb(skb);
635         }
636
637         if (lro_flush_needed)
638                 lro_flush_all(&rxq->lro_mgr);
639
640         if (rx < budget)
641                 mp->work_rx &= ~(1 << rxq->index);
642
643         return rx;
644 }
645
646 static int rxq_refill(struct rx_queue *rxq, int budget)
647 {
648         struct mv643xx_eth_private *mp = rxq_to_mp(rxq);
649         int refilled;
650
651         refilled = 0;
652         while (refilled < budget && rxq->rx_desc_count < rxq->rx_ring_size) {
653                 struct sk_buff *skb;
654                 int unaligned;
655                 int rx;
656                 struct rx_desc *rx_desc;
657
658                 skb = __skb_dequeue(&mp->rx_recycle);
659                 if (skb == NULL)
660                         skb = dev_alloc_skb(mp->skb_size +
661                                             dma_get_cache_alignment() - 1);
662
663                 if (skb == NULL) {
664                         mp->work_rx_oom |= 1 << rxq->index;
665                         goto oom;
666                 }
667
668                 unaligned = (u32)skb->data & (dma_get_cache_alignment() - 1);
669                 if (unaligned)
670                         skb_reserve(skb, dma_get_cache_alignment() - unaligned);
671
672                 refilled++;
673                 rxq->rx_desc_count++;
674
675                 rx = rxq->rx_used_desc++;
676                 if (rxq->rx_used_desc == rxq->rx_ring_size)
677                         rxq->rx_used_desc = 0;
678
679                 rx_desc = rxq->rx_desc_area + rx;
680
681                 rx_desc->buf_ptr = dma_map_single(NULL, skb->data,
682                                         mp->skb_size, DMA_FROM_DEVICE);
683                 rx_desc->buf_size = mp->skb_size;
684                 rxq->rx_skb[rx] = skb;
685                 wmb();
686                 rx_desc->cmd_sts = BUFFER_OWNED_BY_DMA | RX_ENABLE_INTERRUPT;
687                 wmb();
688
689                 /*
690                  * The hardware automatically prepends 2 bytes of
691                  * dummy data to each received packet, so that the
692                  * IP header ends up 16-byte aligned.
693                  */
694                 skb_reserve(skb, 2);
695         }
696
697         if (refilled < budget)
698                 mp->work_rx_refill &= ~(1 << rxq->index);
699
700 oom:
701         return refilled;
702 }
703
704
705 /* tx ***********************************************************************/
706 static inline unsigned int has_tiny_unaligned_frags(struct sk_buff *skb)
707 {
708         int frag;
709
710         for (frag = 0; frag < skb_shinfo(skb)->nr_frags; frag++) {
711                 skb_frag_t *fragp = &skb_shinfo(skb)->frags[frag];
712                 if (fragp->size <= 8 && fragp->page_offset & 7)
713                         return 1;
714         }
715
716         return 0;
717 }
718
719 static void txq_submit_frag_skb(struct tx_queue *txq, struct sk_buff *skb)
720 {
721         int nr_frags = skb_shinfo(skb)->nr_frags;
722         int frag;
723
724         for (frag = 0; frag < nr_frags; frag++) {
725                 skb_frag_t *this_frag;
726                 int tx_index;
727                 struct tx_desc *desc;
728
729                 this_frag = &skb_shinfo(skb)->frags[frag];
730                 tx_index = txq->tx_curr_desc++;
731                 if (txq->tx_curr_desc == txq->tx_ring_size)
732                         txq->tx_curr_desc = 0;
733                 desc = &txq->tx_desc_area[tx_index];
734
735                 /*
736                  * The last fragment will generate an interrupt
737                  * which will free the skb on TX completion.
738                  */
739                 if (frag == nr_frags - 1) {
740                         desc->cmd_sts = BUFFER_OWNED_BY_DMA |
741                                         ZERO_PADDING | TX_LAST_DESC |
742                                         TX_ENABLE_INTERRUPT;
743                 } else {
744                         desc->cmd_sts = BUFFER_OWNED_BY_DMA;
745                 }
746
747                 desc->l4i_chk = 0;
748                 desc->byte_cnt = this_frag->size;
749                 desc->buf_ptr = dma_map_page(NULL, this_frag->page,
750                                                 this_frag->page_offset,
751                                                 this_frag->size,
752                                                 DMA_TO_DEVICE);
753         }
754 }
755
756 static inline __be16 sum16_as_be(__sum16 sum)
757 {
758         return (__force __be16)sum;
759 }
760
761 static int txq_submit_skb(struct tx_queue *txq, struct sk_buff *skb)
762 {
763         struct mv643xx_eth_private *mp = txq_to_mp(txq);
764         int nr_frags = skb_shinfo(skb)->nr_frags;
765         int tx_index;
766         struct tx_desc *desc;
767         u32 cmd_sts;
768         u16 l4i_chk;
769         int length;
770
771         cmd_sts = TX_FIRST_DESC | GEN_CRC | BUFFER_OWNED_BY_DMA;
772         l4i_chk = 0;
773
774         if (skb->ip_summed == CHECKSUM_PARTIAL) {
775                 int tag_bytes;
776
777                 BUG_ON(skb->protocol != htons(ETH_P_IP) &&
778                        skb->protocol != htons(ETH_P_8021Q));
779
780                 tag_bytes = (void *)ip_hdr(skb) - (void *)skb->data - ETH_HLEN;
781                 if (unlikely(tag_bytes & ~12)) {
782                         if (skb_checksum_help(skb) == 0)
783                                 goto no_csum;
784                         kfree_skb(skb);
785                         return 1;
786                 }
787
788                 if (tag_bytes & 4)
789                         cmd_sts |= MAC_HDR_EXTRA_4_BYTES;
790                 if (tag_bytes & 8)
791                         cmd_sts |= MAC_HDR_EXTRA_8_BYTES;
792
793                 cmd_sts |= GEN_TCP_UDP_CHECKSUM |
794                            GEN_IP_V4_CHECKSUM   |
795                            ip_hdr(skb)->ihl << TX_IHL_SHIFT;
796
797                 switch (ip_hdr(skb)->protocol) {
798                 case IPPROTO_UDP:
799                         cmd_sts |= UDP_FRAME;
800                         l4i_chk = ntohs(sum16_as_be(udp_hdr(skb)->check));
801                         break;
802                 case IPPROTO_TCP:
803                         l4i_chk = ntohs(sum16_as_be(tcp_hdr(skb)->check));
804                         break;
805                 default:
806                         BUG();
807                 }
808         } else {
809 no_csum:
810                 /* Errata BTS #50, IHL must be 5 if no HW checksum */
811                 cmd_sts |= 5 << TX_IHL_SHIFT;
812         }
813
814         tx_index = txq->tx_curr_desc++;
815         if (txq->tx_curr_desc == txq->tx_ring_size)
816                 txq->tx_curr_desc = 0;
817         desc = &txq->tx_desc_area[tx_index];
818
819         if (nr_frags) {
820                 txq_submit_frag_skb(txq, skb);
821                 length = skb_headlen(skb);
822         } else {
823                 cmd_sts |= ZERO_PADDING | TX_LAST_DESC | TX_ENABLE_INTERRUPT;
824                 length = skb->len;
825         }
826
827         desc->l4i_chk = l4i_chk;
828         desc->byte_cnt = length;
829         desc->buf_ptr = dma_map_single(NULL, skb->data, length, DMA_TO_DEVICE);
830
831         __skb_queue_tail(&txq->tx_skb, skb);
832
833         /* ensure all other descriptors are written before first cmd_sts */
834         wmb();
835         desc->cmd_sts = cmd_sts;
836
837         /* clear TX_END status */
838         mp->work_tx_end &= ~(1 << txq->index);
839
840         /* ensure all descriptors are written before poking hardware */
841         wmb();
842         txq_enable(txq);
843
844         txq->tx_desc_count += nr_frags + 1;
845
846         return 0;
847 }
848
849 static int mv643xx_eth_xmit(struct sk_buff *skb, struct net_device *dev)
850 {
851         struct mv643xx_eth_private *mp = netdev_priv(dev);
852         int queue;
853         struct tx_queue *txq;
854         struct netdev_queue *nq;
855
856         queue = skb_get_queue_mapping(skb);
857         txq = mp->txq + queue;
858         nq = netdev_get_tx_queue(dev, queue);
859
860         if (has_tiny_unaligned_frags(skb) && __skb_linearize(skb)) {
861                 txq->tx_dropped++;
862                 dev_printk(KERN_DEBUG, &dev->dev,
863                            "failed to linearize skb with tiny "
864                            "unaligned fragment\n");
865                 return NETDEV_TX_BUSY;
866         }
867
868         if (txq->tx_ring_size - txq->tx_desc_count < MAX_SKB_FRAGS + 1) {
869                 if (net_ratelimit())
870                         dev_printk(KERN_ERR, &dev->dev, "tx queue full?!\n");
871                 kfree_skb(skb);
872                 return NETDEV_TX_OK;
873         }
874
875         if (!txq_submit_skb(txq, skb)) {
876                 int entries_left;
877
878                 txq->tx_bytes += skb->len;
879                 txq->tx_packets++;
880                 dev->trans_start = jiffies;
881
882                 entries_left = txq->tx_ring_size - txq->tx_desc_count;
883                 if (entries_left < MAX_SKB_FRAGS + 1)
884                         netif_tx_stop_queue(nq);
885         }
886
887         return NETDEV_TX_OK;
888 }
889
890
891 /* tx napi ******************************************************************/
892 static void txq_kick(struct tx_queue *txq)
893 {
894         struct mv643xx_eth_private *mp = txq_to_mp(txq);
895         struct netdev_queue *nq = netdev_get_tx_queue(mp->dev, txq->index);
896         u32 hw_desc_ptr;
897         u32 expected_ptr;
898
899         __netif_tx_lock(nq, smp_processor_id());
900
901         if (rdlp(mp, TXQ_COMMAND) & (1 << txq->index))
902                 goto out;
903
904         hw_desc_ptr = rdlp(mp, TXQ_CURRENT_DESC_PTR(txq->index));
905         expected_ptr = (u32)txq->tx_desc_dma +
906                                 txq->tx_curr_desc * sizeof(struct tx_desc);
907
908         if (hw_desc_ptr != expected_ptr)
909                 txq_enable(txq);
910
911 out:
912         __netif_tx_unlock(nq);
913
914         mp->work_tx_end &= ~(1 << txq->index);
915 }
916
917 static int txq_reclaim(struct tx_queue *txq, int budget, int force)
918 {
919         struct mv643xx_eth_private *mp = txq_to_mp(txq);
920         struct netdev_queue *nq = netdev_get_tx_queue(mp->dev, txq->index);
921         int reclaimed;
922
923         __netif_tx_lock(nq, smp_processor_id());
924
925         reclaimed = 0;
926         while (reclaimed < budget && txq->tx_desc_count > 0) {
927                 int tx_index;
928                 struct tx_desc *desc;
929                 u32 cmd_sts;
930                 struct sk_buff *skb;
931
932                 tx_index = txq->tx_used_desc;
933                 desc = &txq->tx_desc_area[tx_index];
934                 cmd_sts = desc->cmd_sts;
935
936                 if (cmd_sts & BUFFER_OWNED_BY_DMA) {
937                         if (!force)
938                                 break;
939                         desc->cmd_sts = cmd_sts & ~BUFFER_OWNED_BY_DMA;
940                 }
941
942                 txq->tx_used_desc = tx_index + 1;
943                 if (txq->tx_used_desc == txq->tx_ring_size)
944                         txq->tx_used_desc = 0;
945
946                 reclaimed++;
947                 txq->tx_desc_count--;
948
949                 skb = NULL;
950                 if (cmd_sts & TX_LAST_DESC)
951                         skb = __skb_dequeue(&txq->tx_skb);
952
953                 if (cmd_sts & ERROR_SUMMARY) {
954                         dev_printk(KERN_INFO, &mp->dev->dev, "tx error\n");
955                         mp->dev->stats.tx_errors++;
956                 }
957
958                 if (cmd_sts & TX_FIRST_DESC) {
959                         dma_unmap_single(NULL, desc->buf_ptr,
960                                          desc->byte_cnt, DMA_TO_DEVICE);
961                 } else {
962                         dma_unmap_page(NULL, desc->buf_ptr,
963                                        desc->byte_cnt, DMA_TO_DEVICE);
964                 }
965
966                 if (skb != NULL) {
967                         if (skb_queue_len(&mp->rx_recycle) <
968                                         mp->rx_ring_size &&
969                             skb_recycle_check(skb, mp->skb_size +
970                                         dma_get_cache_alignment() - 1))
971                                 __skb_queue_head(&mp->rx_recycle, skb);
972                         else
973                                 dev_kfree_skb(skb);
974                 }
975         }
976
977         __netif_tx_unlock(nq);
978
979         if (reclaimed < budget)
980                 mp->work_tx &= ~(1 << txq->index);
981
982         return reclaimed;
983 }
984
985
986 /* tx rate control **********************************************************/
987 /*
988  * Set total maximum TX rate (shared by all TX queues for this port)
989  * to 'rate' bits per second, with a maximum burst of 'burst' bytes.
990  */
991 static void tx_set_rate(struct mv643xx_eth_private *mp, int rate, int burst)
992 {
993         int token_rate;
994         int mtu;
995         int bucket_size;
996
997         token_rate = ((rate / 1000) * 64) / (mp->shared->t_clk / 1000);
998         if (token_rate > 1023)
999                 token_rate = 1023;
1000
1001         mtu = (mp->dev->mtu + 255) >> 8;
1002         if (mtu > 63)
1003                 mtu = 63;
1004
1005         bucket_size = (burst + 255) >> 8;
1006         if (bucket_size > 65535)
1007                 bucket_size = 65535;
1008
1009         switch (mp->shared->tx_bw_control) {
1010         case TX_BW_CONTROL_OLD_LAYOUT:
1011                 wrlp(mp, TX_BW_RATE, token_rate);
1012                 wrlp(mp, TX_BW_MTU, mtu);
1013                 wrlp(mp, TX_BW_BURST, bucket_size);
1014                 break;
1015         case TX_BW_CONTROL_NEW_LAYOUT:
1016                 wrlp(mp, TX_BW_RATE_MOVED, token_rate);
1017                 wrlp(mp, TX_BW_MTU_MOVED, mtu);
1018                 wrlp(mp, TX_BW_BURST_MOVED, bucket_size);
1019                 break;
1020         }
1021 }
1022
1023 static void txq_set_rate(struct tx_queue *txq, int rate, int burst)
1024 {
1025         struct mv643xx_eth_private *mp = txq_to_mp(txq);
1026         int token_rate;
1027         int bucket_size;
1028
1029         token_rate = ((rate / 1000) * 64) / (mp->shared->t_clk / 1000);
1030         if (token_rate > 1023)
1031                 token_rate = 1023;
1032
1033         bucket_size = (burst + 255) >> 8;
1034         if (bucket_size > 65535)
1035                 bucket_size = 65535;
1036
1037         wrlp(mp, TXQ_BW_TOKENS(txq->index), token_rate << 14);
1038         wrlp(mp, TXQ_BW_CONF(txq->index), (bucket_size << 10) | token_rate);
1039 }
1040
1041 static void txq_set_fixed_prio_mode(struct tx_queue *txq)
1042 {
1043         struct mv643xx_eth_private *mp = txq_to_mp(txq);
1044         int off;
1045         u32 val;
1046
1047         /*
1048          * Turn on fixed priority mode.
1049          */
1050         off = 0;
1051         switch (mp->shared->tx_bw_control) {
1052         case TX_BW_CONTROL_OLD_LAYOUT:
1053                 off = TXQ_FIX_PRIO_CONF;
1054                 break;
1055         case TX_BW_CONTROL_NEW_LAYOUT:
1056                 off = TXQ_FIX_PRIO_CONF_MOVED;
1057                 break;
1058         }
1059
1060         if (off) {
1061                 val = rdlp(mp, off);
1062                 val |= 1 << txq->index;
1063                 wrlp(mp, off, val);
1064         }
1065 }
1066
1067 static void txq_set_wrr(struct tx_queue *txq, int weight)
1068 {
1069         struct mv643xx_eth_private *mp = txq_to_mp(txq);
1070         int off;
1071         u32 val;
1072
1073         /*
1074          * Turn off fixed priority mode.
1075          */
1076         off = 0;
1077         switch (mp->shared->tx_bw_control) {
1078         case TX_BW_CONTROL_OLD_LAYOUT:
1079                 off = TXQ_FIX_PRIO_CONF;
1080                 break;
1081         case TX_BW_CONTROL_NEW_LAYOUT:
1082                 off = TXQ_FIX_PRIO_CONF_MOVED;
1083                 break;
1084         }
1085
1086         if (off) {
1087                 val = rdlp(mp, off);
1088                 val &= ~(1 << txq->index);
1089                 wrlp(mp, off, val);
1090
1091                 /*
1092                  * Configure WRR weight for this queue.
1093                  */
1094
1095                 val = rdlp(mp, off);
1096                 val = (val & ~0xff) | (weight & 0xff);
1097                 wrlp(mp, TXQ_BW_WRR_CONF(txq->index), val);
1098         }
1099 }
1100
1101
1102 /* mii management interface *************************************************/
1103 static irqreturn_t mv643xx_eth_err_irq(int irq, void *dev_id)
1104 {
1105         struct mv643xx_eth_shared_private *msp = dev_id;
1106
1107         if (readl(msp->base + ERR_INT_CAUSE) & ERR_INT_SMI_DONE) {
1108                 writel(~ERR_INT_SMI_DONE, msp->base + ERR_INT_CAUSE);
1109                 wake_up(&msp->smi_busy_wait);
1110                 return IRQ_HANDLED;
1111         }
1112
1113         return IRQ_NONE;
1114 }
1115
1116 static int smi_is_done(struct mv643xx_eth_shared_private *msp)
1117 {
1118         return !(readl(msp->base + SMI_REG) & SMI_BUSY);
1119 }
1120
1121 static int smi_wait_ready(struct mv643xx_eth_shared_private *msp)
1122 {
1123         if (msp->err_interrupt == NO_IRQ) {
1124                 int i;
1125
1126                 for (i = 0; !smi_is_done(msp); i++) {
1127                         if (i == 10)
1128                                 return -ETIMEDOUT;
1129                         msleep(10);
1130                 }
1131
1132                 return 0;
1133         }
1134
1135         if (!smi_is_done(msp)) {
1136                 wait_event_timeout(msp->smi_busy_wait, smi_is_done(msp),
1137                                    msecs_to_jiffies(100));
1138                 if (!smi_is_done(msp))
1139                         return -ETIMEDOUT;
1140         }
1141
1142         return 0;
1143 }
1144
1145 static int smi_bus_read(struct mii_bus *bus, int addr, int reg)
1146 {
1147         struct mv643xx_eth_shared_private *msp = bus->priv;
1148         void __iomem *smi_reg = msp->base + SMI_REG;
1149         int ret;
1150
1151         if (smi_wait_ready(msp)) {
1152                 printk(KERN_WARNING "mv643xx_eth: SMI bus busy timeout\n");
1153                 return -ETIMEDOUT;
1154         }
1155
1156         writel(SMI_OPCODE_READ | (reg << 21) | (addr << 16), smi_reg);
1157
1158         if (smi_wait_ready(msp)) {
1159                 printk(KERN_WARNING "mv643xx_eth: SMI bus busy timeout\n");
1160                 return -ETIMEDOUT;
1161         }
1162
1163         ret = readl(smi_reg);
1164         if (!(ret & SMI_READ_VALID)) {
1165                 printk(KERN_WARNING "mv643xx_eth: SMI bus read not valid\n");
1166                 return -ENODEV;
1167         }
1168
1169         return ret & 0xffff;
1170 }
1171
1172 static int smi_bus_write(struct mii_bus *bus, int addr, int reg, u16 val)
1173 {
1174         struct mv643xx_eth_shared_private *msp = bus->priv;
1175         void __iomem *smi_reg = msp->base + SMI_REG;
1176
1177         if (smi_wait_ready(msp)) {
1178                 printk(KERN_WARNING "mv643xx_eth: SMI bus busy timeout\n");
1179                 return -ETIMEDOUT;
1180         }
1181
1182         writel(SMI_OPCODE_WRITE | (reg << 21) |
1183                 (addr << 16) | (val & 0xffff), smi_reg);
1184
1185         if (smi_wait_ready(msp)) {
1186                 printk(KERN_WARNING "mv643xx_eth: SMI bus busy timeout\n");
1187                 return -ETIMEDOUT;
1188         }
1189
1190         return 0;
1191 }
1192
1193
1194 /* statistics ***************************************************************/
1195 static struct net_device_stats *mv643xx_eth_get_stats(struct net_device *dev)
1196 {
1197         struct mv643xx_eth_private *mp = netdev_priv(dev);
1198         struct net_device_stats *stats = &dev->stats;
1199         unsigned long tx_packets = 0;
1200         unsigned long tx_bytes = 0;
1201         unsigned long tx_dropped = 0;
1202         int i;
1203
1204         for (i = 0; i < mp->txq_count; i++) {
1205                 struct tx_queue *txq = mp->txq + i;
1206
1207                 tx_packets += txq->tx_packets;
1208                 tx_bytes += txq->tx_bytes;
1209                 tx_dropped += txq->tx_dropped;
1210         }
1211
1212         stats->tx_packets = tx_packets;
1213         stats->tx_bytes = tx_bytes;
1214         stats->tx_dropped = tx_dropped;
1215
1216         return stats;
1217 }
1218
1219 static void mv643xx_eth_grab_lro_stats(struct mv643xx_eth_private *mp)
1220 {
1221         u32 lro_aggregated = 0;
1222         u32 lro_flushed = 0;
1223         u32 lro_no_desc = 0;
1224         int i;
1225
1226         for (i = 0; i < mp->rxq_count; i++) {
1227                 struct rx_queue *rxq = mp->rxq + i;
1228
1229                 lro_aggregated += rxq->lro_mgr.stats.aggregated;
1230                 lro_flushed += rxq->lro_mgr.stats.flushed;
1231                 lro_no_desc += rxq->lro_mgr.stats.no_desc;
1232         }
1233
1234         mp->lro_counters.lro_aggregated = lro_aggregated;
1235         mp->lro_counters.lro_flushed = lro_flushed;
1236         mp->lro_counters.lro_no_desc = lro_no_desc;
1237 }
1238
1239 static inline u32 mib_read(struct mv643xx_eth_private *mp, int offset)
1240 {
1241         return rdl(mp, MIB_COUNTERS(mp->port_num) + offset);
1242 }
1243
1244 static void mib_counters_clear(struct mv643xx_eth_private *mp)
1245 {
1246         int i;
1247
1248         for (i = 0; i < 0x80; i += 4)
1249                 mib_read(mp, i);
1250 }
1251
1252 static void mib_counters_update(struct mv643xx_eth_private *mp)
1253 {
1254         struct mib_counters *p = &mp->mib_counters;
1255
1256         spin_lock_bh(&mp->mib_counters_lock);
1257         p->good_octets_received += mib_read(mp, 0x00);
1258         p->good_octets_received += (u64)mib_read(mp, 0x04) << 32;
1259         p->bad_octets_received += mib_read(mp, 0x08);
1260         p->internal_mac_transmit_err += mib_read(mp, 0x0c);
1261         p->good_frames_received += mib_read(mp, 0x10);
1262         p->bad_frames_received += mib_read(mp, 0x14);
1263         p->broadcast_frames_received += mib_read(mp, 0x18);
1264         p->multicast_frames_received += mib_read(mp, 0x1c);
1265         p->frames_64_octets += mib_read(mp, 0x20);
1266         p->frames_65_to_127_octets += mib_read(mp, 0x24);
1267         p->frames_128_to_255_octets += mib_read(mp, 0x28);
1268         p->frames_256_to_511_octets += mib_read(mp, 0x2c);
1269         p->frames_512_to_1023_octets += mib_read(mp, 0x30);
1270         p->frames_1024_to_max_octets += mib_read(mp, 0x34);
1271         p->good_octets_sent += mib_read(mp, 0x38);
1272         p->good_octets_sent += (u64)mib_read(mp, 0x3c) << 32;
1273         p->good_frames_sent += mib_read(mp, 0x40);
1274         p->excessive_collision += mib_read(mp, 0x44);
1275         p->multicast_frames_sent += mib_read(mp, 0x48);
1276         p->broadcast_frames_sent += mib_read(mp, 0x4c);
1277         p->unrec_mac_control_received += mib_read(mp, 0x50);
1278         p->fc_sent += mib_read(mp, 0x54);
1279         p->good_fc_received += mib_read(mp, 0x58);
1280         p->bad_fc_received += mib_read(mp, 0x5c);
1281         p->undersize_received += mib_read(mp, 0x60);
1282         p->fragments_received += mib_read(mp, 0x64);
1283         p->oversize_received += mib_read(mp, 0x68);
1284         p->jabber_received += mib_read(mp, 0x6c);
1285         p->mac_receive_error += mib_read(mp, 0x70);
1286         p->bad_crc_event += mib_read(mp, 0x74);
1287         p->collision += mib_read(mp, 0x78);
1288         p->late_collision += mib_read(mp, 0x7c);
1289         spin_unlock_bh(&mp->mib_counters_lock);
1290
1291         mod_timer(&mp->mib_counters_timer, jiffies + 30 * HZ);
1292 }
1293
1294 static void mib_counters_timer_wrapper(unsigned long _mp)
1295 {
1296         struct mv643xx_eth_private *mp = (void *)_mp;
1297
1298         mib_counters_update(mp);
1299 }
1300
1301
1302 /* interrupt coalescing *****************************************************/
1303 /*
1304  * Hardware coalescing parameters are set in units of 64 t_clk
1305  * cycles.  I.e.:
1306  *
1307  *      coal_delay_in_usec = 64000000 * register_value / t_clk_rate
1308  *
1309  *      register_value = coal_delay_in_usec * t_clk_rate / 64000000
1310  *
1311  * In the ->set*() methods, we round the computed register value
1312  * to the nearest integer.
1313  */
1314 static unsigned int get_rx_coal(struct mv643xx_eth_private *mp)
1315 {
1316         u32 val = rdlp(mp, SDMA_CONFIG);
1317         u64 temp;
1318
1319         if (mp->shared->extended_rx_coal_limit)
1320                 temp = ((val & 0x02000000) >> 10) | ((val & 0x003fff80) >> 7);
1321         else
1322                 temp = (val & 0x003fff00) >> 8;
1323
1324         temp *= 64000000;
1325         do_div(temp, mp->shared->t_clk);
1326
1327         return (unsigned int)temp;
1328 }
1329
1330 static void set_rx_coal(struct mv643xx_eth_private *mp, unsigned int usec)
1331 {
1332         u64 temp;
1333         u32 val;
1334
1335         temp = (u64)usec * mp->shared->t_clk;
1336         temp += 31999999;
1337         do_div(temp, 64000000);
1338
1339         val = rdlp(mp, SDMA_CONFIG);
1340         if (mp->shared->extended_rx_coal_limit) {
1341                 if (temp > 0xffff)
1342                         temp = 0xffff;
1343                 val &= ~0x023fff80;
1344                 val |= (temp & 0x8000) << 10;
1345                 val |= (temp & 0x7fff) << 7;
1346         } else {
1347                 if (temp > 0x3fff)
1348                         temp = 0x3fff;
1349                 val &= ~0x003fff00;
1350                 val |= (temp & 0x3fff) << 8;
1351         }
1352         wrlp(mp, SDMA_CONFIG, val);
1353 }
1354
1355 static unsigned int get_tx_coal(struct mv643xx_eth_private *mp)
1356 {
1357         u64 temp;
1358
1359         temp = (rdlp(mp, TX_FIFO_URGENT_THRESHOLD) & 0x3fff0) >> 4;
1360         temp *= 64000000;
1361         do_div(temp, mp->shared->t_clk);
1362
1363         return (unsigned int)temp;
1364 }
1365
1366 static void set_tx_coal(struct mv643xx_eth_private *mp, unsigned int usec)
1367 {
1368         u64 temp;
1369
1370         temp = (u64)usec * mp->shared->t_clk;
1371         temp += 31999999;
1372         do_div(temp, 64000000);
1373
1374         if (temp > 0x3fff)
1375                 temp = 0x3fff;
1376
1377         wrlp(mp, TX_FIFO_URGENT_THRESHOLD, temp << 4);
1378 }
1379
1380
1381 /* ethtool ******************************************************************/
1382 struct mv643xx_eth_stats {
1383         char stat_string[ETH_GSTRING_LEN];
1384         int sizeof_stat;
1385         int netdev_off;
1386         int mp_off;
1387 };
1388
1389 #define SSTAT(m)                                                \
1390         { #m, FIELD_SIZEOF(struct net_device_stats, m),         \
1391           offsetof(struct net_device, stats.m), -1 }
1392
1393 #define MIBSTAT(m)                                              \
1394         { #m, FIELD_SIZEOF(struct mib_counters, m),             \
1395           -1, offsetof(struct mv643xx_eth_private, mib_counters.m) }
1396
1397 #define LROSTAT(m)                                              \
1398         { #m, FIELD_SIZEOF(struct lro_counters, m),             \
1399           -1, offsetof(struct mv643xx_eth_private, lro_counters.m) }
1400
1401 static const struct mv643xx_eth_stats mv643xx_eth_stats[] = {
1402         SSTAT(rx_packets),
1403         SSTAT(tx_packets),
1404         SSTAT(rx_bytes),
1405         SSTAT(tx_bytes),
1406         SSTAT(rx_errors),
1407         SSTAT(tx_errors),
1408         SSTAT(rx_dropped),
1409         SSTAT(tx_dropped),
1410         MIBSTAT(good_octets_received),
1411         MIBSTAT(bad_octets_received),
1412         MIBSTAT(internal_mac_transmit_err),
1413         MIBSTAT(good_frames_received),
1414         MIBSTAT(bad_frames_received),
1415         MIBSTAT(broadcast_frames_received),
1416         MIBSTAT(multicast_frames_received),
1417         MIBSTAT(frames_64_octets),
1418         MIBSTAT(frames_65_to_127_octets),
1419         MIBSTAT(frames_128_to_255_octets),
1420         MIBSTAT(frames_256_to_511_octets),
1421         MIBSTAT(frames_512_to_1023_octets),
1422         MIBSTAT(frames_1024_to_max_octets),
1423         MIBSTAT(good_octets_sent),
1424         MIBSTAT(good_frames_sent),
1425         MIBSTAT(excessive_collision),
1426         MIBSTAT(multicast_frames_sent),
1427         MIBSTAT(broadcast_frames_sent),
1428         MIBSTAT(unrec_mac_control_received),
1429         MIBSTAT(fc_sent),
1430         MIBSTAT(good_fc_received),
1431         MIBSTAT(bad_fc_received),
1432         MIBSTAT(undersize_received),
1433         MIBSTAT(fragments_received),
1434         MIBSTAT(oversize_received),
1435         MIBSTAT(jabber_received),
1436         MIBSTAT(mac_receive_error),
1437         MIBSTAT(bad_crc_event),
1438         MIBSTAT(collision),
1439         MIBSTAT(late_collision),
1440         LROSTAT(lro_aggregated),
1441         LROSTAT(lro_flushed),
1442         LROSTAT(lro_no_desc),
1443 };
1444
1445 static int
1446 mv643xx_eth_get_settings_phy(struct mv643xx_eth_private *mp,
1447                              struct ethtool_cmd *cmd)
1448 {
1449         int err;
1450
1451         err = phy_read_status(mp->phy);
1452         if (err == 0)
1453                 err = phy_ethtool_gset(mp->phy, cmd);
1454
1455         /*
1456          * The MAC does not support 1000baseT_Half.
1457          */
1458         cmd->supported &= ~SUPPORTED_1000baseT_Half;
1459         cmd->advertising &= ~ADVERTISED_1000baseT_Half;
1460
1461         return err;
1462 }
1463
1464 static int
1465 mv643xx_eth_get_settings_phyless(struct mv643xx_eth_private *mp,
1466                                  struct ethtool_cmd *cmd)
1467 {
1468         u32 port_status;
1469
1470         port_status = rdlp(mp, PORT_STATUS);
1471
1472         cmd->supported = SUPPORTED_MII;
1473         cmd->advertising = ADVERTISED_MII;
1474         switch (port_status & PORT_SPEED_MASK) {
1475         case PORT_SPEED_10:
1476                 cmd->speed = SPEED_10;
1477                 break;
1478         case PORT_SPEED_100:
1479                 cmd->speed = SPEED_100;
1480                 break;
1481         case PORT_SPEED_1000:
1482                 cmd->speed = SPEED_1000;
1483                 break;
1484         default:
1485                 cmd->speed = -1;
1486                 break;
1487         }
1488         cmd->duplex = (port_status & FULL_DUPLEX) ? DUPLEX_FULL : DUPLEX_HALF;
1489         cmd->port = PORT_MII;
1490         cmd->phy_address = 0;
1491         cmd->transceiver = XCVR_INTERNAL;
1492         cmd->autoneg = AUTONEG_DISABLE;
1493         cmd->maxtxpkt = 1;
1494         cmd->maxrxpkt = 1;
1495
1496         return 0;
1497 }
1498
1499 static int
1500 mv643xx_eth_get_settings(struct net_device *dev, struct ethtool_cmd *cmd)
1501 {
1502         struct mv643xx_eth_private *mp = netdev_priv(dev);
1503
1504         if (mp->phy != NULL)
1505                 return mv643xx_eth_get_settings_phy(mp, cmd);
1506         else
1507                 return mv643xx_eth_get_settings_phyless(mp, cmd);
1508 }
1509
1510 static int
1511 mv643xx_eth_set_settings(struct net_device *dev, struct ethtool_cmd *cmd)
1512 {
1513         struct mv643xx_eth_private *mp = netdev_priv(dev);
1514
1515         if (mp->phy == NULL)
1516                 return -EINVAL;
1517
1518         /*
1519          * The MAC does not support 1000baseT_Half.
1520          */
1521         cmd->advertising &= ~ADVERTISED_1000baseT_Half;
1522
1523         return phy_ethtool_sset(mp->phy, cmd);
1524 }
1525
1526 static void mv643xx_eth_get_drvinfo(struct net_device *dev,
1527                                     struct ethtool_drvinfo *drvinfo)
1528 {
1529         strncpy(drvinfo->driver,  mv643xx_eth_driver_name, 32);
1530         strncpy(drvinfo->version, mv643xx_eth_driver_version, 32);
1531         strncpy(drvinfo->fw_version, "N/A", 32);
1532         strncpy(drvinfo->bus_info, "platform", 32);
1533         drvinfo->n_stats = ARRAY_SIZE(mv643xx_eth_stats);
1534 }
1535
1536 static int mv643xx_eth_nway_reset(struct net_device *dev)
1537 {
1538         struct mv643xx_eth_private *mp = netdev_priv(dev);
1539
1540         if (mp->phy == NULL)
1541                 return -EINVAL;
1542
1543         return genphy_restart_aneg(mp->phy);
1544 }
1545
1546 static u32 mv643xx_eth_get_link(struct net_device *dev)
1547 {
1548         return !!netif_carrier_ok(dev);
1549 }
1550
1551 static int
1552 mv643xx_eth_get_coalesce(struct net_device *dev, struct ethtool_coalesce *ec)
1553 {
1554         struct mv643xx_eth_private *mp = netdev_priv(dev);
1555
1556         ec->rx_coalesce_usecs = get_rx_coal(mp);
1557         ec->tx_coalesce_usecs = get_tx_coal(mp);
1558
1559         return 0;
1560 }
1561
1562 static int
1563 mv643xx_eth_set_coalesce(struct net_device *dev, struct ethtool_coalesce *ec)
1564 {
1565         struct mv643xx_eth_private *mp = netdev_priv(dev);
1566
1567         set_rx_coal(mp, ec->rx_coalesce_usecs);
1568         set_tx_coal(mp, ec->tx_coalesce_usecs);
1569
1570         return 0;
1571 }
1572
1573 static void
1574 mv643xx_eth_get_ringparam(struct net_device *dev, struct ethtool_ringparam *er)
1575 {
1576         struct mv643xx_eth_private *mp = netdev_priv(dev);
1577
1578         er->rx_max_pending = 4096;
1579         er->tx_max_pending = 4096;
1580         er->rx_mini_max_pending = 0;
1581         er->rx_jumbo_max_pending = 0;
1582
1583         er->rx_pending = mp->rx_ring_size;
1584         er->tx_pending = mp->tx_ring_size;
1585         er->rx_mini_pending = 0;
1586         er->rx_jumbo_pending = 0;
1587 }
1588
1589 static int
1590 mv643xx_eth_set_ringparam(struct net_device *dev, struct ethtool_ringparam *er)
1591 {
1592         struct mv643xx_eth_private *mp = netdev_priv(dev);
1593
1594         if (er->rx_mini_pending || er->rx_jumbo_pending)
1595                 return -EINVAL;
1596
1597         mp->rx_ring_size = er->rx_pending < 4096 ? er->rx_pending : 4096;
1598         mp->tx_ring_size = er->tx_pending < 4096 ? er->tx_pending : 4096;
1599
1600         if (netif_running(dev)) {
1601                 mv643xx_eth_stop(dev);
1602                 if (mv643xx_eth_open(dev)) {
1603                         dev_printk(KERN_ERR, &dev->dev,
1604                                    "fatal error on re-opening device after "
1605                                    "ring param change\n");
1606                         return -ENOMEM;
1607                 }
1608         }
1609
1610         return 0;
1611 }
1612
1613 static u32
1614 mv643xx_eth_get_rx_csum(struct net_device *dev)
1615 {
1616         struct mv643xx_eth_private *mp = netdev_priv(dev);
1617
1618         return !!(rdlp(mp, PORT_CONFIG) & 0x02000000);
1619 }
1620
1621 static int
1622 mv643xx_eth_set_rx_csum(struct net_device *dev, u32 rx_csum)
1623 {
1624         struct mv643xx_eth_private *mp = netdev_priv(dev);
1625
1626         wrlp(mp, PORT_CONFIG, rx_csum ? 0x02000000 : 0x00000000);
1627
1628         return 0;
1629 }
1630
1631 static void mv643xx_eth_get_strings(struct net_device *dev,
1632                                     uint32_t stringset, uint8_t *data)
1633 {
1634         int i;
1635
1636         if (stringset == ETH_SS_STATS) {
1637                 for (i = 0; i < ARRAY_SIZE(mv643xx_eth_stats); i++) {
1638                         memcpy(data + i * ETH_GSTRING_LEN,
1639                                 mv643xx_eth_stats[i].stat_string,
1640                                 ETH_GSTRING_LEN);
1641                 }
1642         }
1643 }
1644
1645 static void mv643xx_eth_get_ethtool_stats(struct net_device *dev,
1646                                           struct ethtool_stats *stats,
1647                                           uint64_t *data)
1648 {
1649         struct mv643xx_eth_private *mp = netdev_priv(dev);
1650         int i;
1651
1652         mv643xx_eth_get_stats(dev);
1653         mib_counters_update(mp);
1654         mv643xx_eth_grab_lro_stats(mp);
1655
1656         for (i = 0; i < ARRAY_SIZE(mv643xx_eth_stats); i++) {
1657                 const struct mv643xx_eth_stats *stat;
1658                 void *p;
1659
1660                 stat = mv643xx_eth_stats + i;
1661
1662                 if (stat->netdev_off >= 0)
1663                         p = ((void *)mp->dev) + stat->netdev_off;
1664                 else
1665                         p = ((void *)mp) + stat->mp_off;
1666
1667                 data[i] = (stat->sizeof_stat == 8) ?
1668                                 *(uint64_t *)p : *(uint32_t *)p;
1669         }
1670 }
1671
1672 static int mv643xx_eth_get_sset_count(struct net_device *dev, int sset)
1673 {
1674         if (sset == ETH_SS_STATS)
1675                 return ARRAY_SIZE(mv643xx_eth_stats);
1676
1677         return -EOPNOTSUPP;
1678 }
1679
1680 static const struct ethtool_ops mv643xx_eth_ethtool_ops = {
1681         .get_settings           = mv643xx_eth_get_settings,
1682         .set_settings           = mv643xx_eth_set_settings,
1683         .get_drvinfo            = mv643xx_eth_get_drvinfo,
1684         .nway_reset             = mv643xx_eth_nway_reset,
1685         .get_link               = mv643xx_eth_get_link,
1686         .get_coalesce           = mv643xx_eth_get_coalesce,
1687         .set_coalesce           = mv643xx_eth_set_coalesce,
1688         .get_ringparam          = mv643xx_eth_get_ringparam,
1689         .set_ringparam          = mv643xx_eth_set_ringparam,
1690         .get_rx_csum            = mv643xx_eth_get_rx_csum,
1691         .set_rx_csum            = mv643xx_eth_set_rx_csum,
1692         .set_tx_csum            = ethtool_op_set_tx_csum,
1693         .set_sg                 = ethtool_op_set_sg,
1694         .get_strings            = mv643xx_eth_get_strings,
1695         .get_ethtool_stats      = mv643xx_eth_get_ethtool_stats,
1696         .get_flags              = ethtool_op_get_flags,
1697         .set_flags              = ethtool_op_set_flags,
1698         .get_sset_count         = mv643xx_eth_get_sset_count,
1699 };
1700
1701
1702 /* address handling *********************************************************/
1703 static void uc_addr_get(struct mv643xx_eth_private *mp, unsigned char *addr)
1704 {
1705         unsigned int mac_h = rdlp(mp, MAC_ADDR_HIGH);
1706         unsigned int mac_l = rdlp(mp, MAC_ADDR_LOW);
1707
1708         addr[0] = (mac_h >> 24) & 0xff;
1709         addr[1] = (mac_h >> 16) & 0xff;
1710         addr[2] = (mac_h >> 8) & 0xff;
1711         addr[3] = mac_h & 0xff;
1712         addr[4] = (mac_l >> 8) & 0xff;
1713         addr[5] = mac_l & 0xff;
1714 }
1715
1716 static void uc_addr_set(struct mv643xx_eth_private *mp, unsigned char *addr)
1717 {
1718         wrlp(mp, MAC_ADDR_HIGH,
1719                 (addr[0] << 24) | (addr[1] << 16) | (addr[2] << 8) | addr[3]);
1720         wrlp(mp, MAC_ADDR_LOW, (addr[4] << 8) | addr[5]);
1721 }
1722
1723 static u32 uc_addr_filter_mask(struct net_device *dev)
1724 {
1725         struct dev_addr_list *uc_ptr;
1726         u32 nibbles;
1727
1728         if (dev->flags & IFF_PROMISC)
1729                 return 0;
1730
1731         nibbles = 1 << (dev->dev_addr[5] & 0x0f);
1732         for (uc_ptr = dev->uc_list; uc_ptr != NULL; uc_ptr = uc_ptr->next) {
1733                 if (memcmp(dev->dev_addr, uc_ptr->da_addr, 5))
1734                         return 0;
1735                 if ((dev->dev_addr[5] ^ uc_ptr->da_addr[5]) & 0xf0)
1736                         return 0;
1737
1738                 nibbles |= 1 << (uc_ptr->da_addr[5] & 0x0f);
1739         }
1740
1741         return nibbles;
1742 }
1743
1744 static void mv643xx_eth_program_unicast_filter(struct net_device *dev)
1745 {
1746         struct mv643xx_eth_private *mp = netdev_priv(dev);
1747         u32 port_config;
1748         u32 nibbles;
1749         int i;
1750
1751         uc_addr_set(mp, dev->dev_addr);
1752
1753         port_config = rdlp(mp, PORT_CONFIG);
1754         nibbles = uc_addr_filter_mask(dev);
1755         if (!nibbles) {
1756                 port_config |= UNICAST_PROMISCUOUS_MODE;
1757                 wrlp(mp, PORT_CONFIG, port_config);
1758                 return;
1759         }
1760
1761         for (i = 0; i < 16; i += 4) {
1762                 int off = UNICAST_TABLE(mp->port_num) + i;
1763                 u32 v;
1764
1765                 v = 0;
1766                 if (nibbles & 1)
1767                         v |= 0x00000001;
1768                 if (nibbles & 2)
1769                         v |= 0x00000100;
1770                 if (nibbles & 4)
1771                         v |= 0x00010000;
1772                 if (nibbles & 8)
1773                         v |= 0x01000000;
1774                 nibbles >>= 4;
1775
1776                 wrl(mp, off, v);
1777         }
1778
1779         port_config &= ~UNICAST_PROMISCUOUS_MODE;
1780         wrlp(mp, PORT_CONFIG, port_config);
1781 }
1782
1783 static int addr_crc(unsigned char *addr)
1784 {
1785         int crc = 0;
1786         int i;
1787
1788         for (i = 0; i < 6; i++) {
1789                 int j;
1790
1791                 crc = (crc ^ addr[i]) << 8;
1792                 for (j = 7; j >= 0; j--) {
1793                         if (crc & (0x100 << j))
1794                                 crc ^= 0x107 << j;
1795                 }
1796         }
1797
1798         return crc;
1799 }
1800
1801 static void mv643xx_eth_program_multicast_filter(struct net_device *dev)
1802 {
1803         struct mv643xx_eth_private *mp = netdev_priv(dev);
1804         u32 *mc_spec;
1805         u32 *mc_other;
1806         struct dev_addr_list *addr;
1807         int i;
1808
1809         if (dev->flags & (IFF_PROMISC | IFF_ALLMULTI)) {
1810                 int port_num;
1811                 u32 accept;
1812                 int i;
1813
1814 oom:
1815                 port_num = mp->port_num;
1816                 accept = 0x01010101;
1817                 for (i = 0; i < 0x100; i += 4) {
1818                         wrl(mp, SPECIAL_MCAST_TABLE(port_num) + i, accept);
1819                         wrl(mp, OTHER_MCAST_TABLE(port_num) + i, accept);
1820                 }
1821                 return;
1822         }
1823
1824         mc_spec = kmalloc(0x200, GFP_ATOMIC);
1825         if (mc_spec == NULL)
1826                 goto oom;
1827         mc_other = mc_spec + (0x100 >> 2);
1828
1829         memset(mc_spec, 0, 0x100);
1830         memset(mc_other, 0, 0x100);
1831
1832         for (addr = dev->mc_list; addr != NULL; addr = addr->next) {
1833                 u8 *a = addr->da_addr;
1834                 u32 *table;
1835                 int entry;
1836
1837                 if (memcmp(a, "\x01\x00\x5e\x00\x00", 5) == 0) {
1838                         table = mc_spec;
1839                         entry = a[5];
1840                 } else {
1841                         table = mc_other;
1842                         entry = addr_crc(a);
1843                 }
1844
1845                 table[entry >> 2] |= 1 << (8 * (entry & 3));
1846         }
1847
1848         for (i = 0; i < 0x100; i += 4) {
1849                 wrl(mp, SPECIAL_MCAST_TABLE(mp->port_num) + i, mc_spec[i >> 2]);
1850                 wrl(mp, OTHER_MCAST_TABLE(mp->port_num) + i, mc_other[i >> 2]);
1851         }
1852
1853         kfree(mc_spec);
1854 }
1855
1856 static void mv643xx_eth_set_rx_mode(struct net_device *dev)
1857 {
1858         mv643xx_eth_program_unicast_filter(dev);
1859         mv643xx_eth_program_multicast_filter(dev);
1860 }
1861
1862 static int mv643xx_eth_set_mac_address(struct net_device *dev, void *addr)
1863 {
1864         struct sockaddr *sa = addr;
1865
1866         memcpy(dev->dev_addr, sa->sa_data, ETH_ALEN);
1867
1868         netif_addr_lock_bh(dev);
1869         mv643xx_eth_program_unicast_filter(dev);
1870         netif_addr_unlock_bh(dev);
1871
1872         return 0;
1873 }
1874
1875
1876 /* rx/tx queue initialisation ***********************************************/
1877 static int rxq_init(struct mv643xx_eth_private *mp, int index)
1878 {
1879         struct rx_queue *rxq = mp->rxq + index;
1880         struct rx_desc *rx_desc;
1881         int size;
1882         int i;
1883
1884         rxq->index = index;
1885
1886         rxq->rx_ring_size = mp->rx_ring_size;
1887
1888         rxq->rx_desc_count = 0;
1889         rxq->rx_curr_desc = 0;
1890         rxq->rx_used_desc = 0;
1891
1892         size = rxq->rx_ring_size * sizeof(struct rx_desc);
1893
1894         if (index == 0 && size <= mp->rx_desc_sram_size) {
1895                 rxq->rx_desc_area = ioremap(mp->rx_desc_sram_addr,
1896                                                 mp->rx_desc_sram_size);
1897                 rxq->rx_desc_dma = mp->rx_desc_sram_addr;
1898         } else {
1899                 rxq->rx_desc_area = dma_alloc_coherent(NULL, size,
1900                                                         &rxq->rx_desc_dma,
1901                                                         GFP_KERNEL);
1902         }
1903
1904         if (rxq->rx_desc_area == NULL) {
1905                 dev_printk(KERN_ERR, &mp->dev->dev,
1906                            "can't allocate rx ring (%d bytes)\n", size);
1907                 goto out;
1908         }
1909         memset(rxq->rx_desc_area, 0, size);
1910
1911         rxq->rx_desc_area_size = size;
1912         rxq->rx_skb = kmalloc(rxq->rx_ring_size * sizeof(*rxq->rx_skb),
1913                                                                 GFP_KERNEL);
1914         if (rxq->rx_skb == NULL) {
1915                 dev_printk(KERN_ERR, &mp->dev->dev,
1916                            "can't allocate rx skb ring\n");
1917                 goto out_free;
1918         }
1919
1920         rx_desc = (struct rx_desc *)rxq->rx_desc_area;
1921         for (i = 0; i < rxq->rx_ring_size; i++) {
1922                 int nexti;
1923
1924                 nexti = i + 1;
1925                 if (nexti == rxq->rx_ring_size)
1926                         nexti = 0;
1927
1928                 rx_desc[i].next_desc_ptr = rxq->rx_desc_dma +
1929                                         nexti * sizeof(struct rx_desc);
1930         }
1931
1932         rxq->lro_mgr.dev = mp->dev;
1933         memset(&rxq->lro_mgr.stats, 0, sizeof(rxq->lro_mgr.stats));
1934         rxq->lro_mgr.features = LRO_F_NAPI;
1935         rxq->lro_mgr.ip_summed = CHECKSUM_UNNECESSARY;
1936         rxq->lro_mgr.ip_summed_aggr = CHECKSUM_UNNECESSARY;
1937         rxq->lro_mgr.max_desc = ARRAY_SIZE(rxq->lro_arr);
1938         rxq->lro_mgr.max_aggr = 32;
1939         rxq->lro_mgr.frag_align_pad = 0;
1940         rxq->lro_mgr.lro_arr = rxq->lro_arr;
1941         rxq->lro_mgr.get_skb_header = mv643xx_get_skb_header;
1942
1943         memset(&rxq->lro_arr, 0, sizeof(rxq->lro_arr));
1944
1945         return 0;
1946
1947
1948 out_free:
1949         if (index == 0 && size <= mp->rx_desc_sram_size)
1950                 iounmap(rxq->rx_desc_area);
1951         else
1952                 dma_free_coherent(NULL, size,
1953                                   rxq->rx_desc_area,
1954                                   rxq->rx_desc_dma);
1955
1956 out:
1957         return -ENOMEM;
1958 }
1959
1960 static void rxq_deinit(struct rx_queue *rxq)
1961 {
1962         struct mv643xx_eth_private *mp = rxq_to_mp(rxq);
1963         int i;
1964
1965         rxq_disable(rxq);
1966
1967         for (i = 0; i < rxq->rx_ring_size; i++) {
1968                 if (rxq->rx_skb[i]) {
1969                         dev_kfree_skb(rxq->rx_skb[i]);
1970                         rxq->rx_desc_count--;
1971                 }
1972         }
1973
1974         if (rxq->rx_desc_count) {
1975                 dev_printk(KERN_ERR, &mp->dev->dev,
1976                            "error freeing rx ring -- %d skbs stuck\n",
1977                            rxq->rx_desc_count);
1978         }
1979
1980         if (rxq->index == 0 &&
1981             rxq->rx_desc_area_size <= mp->rx_desc_sram_size)
1982                 iounmap(rxq->rx_desc_area);
1983         else
1984                 dma_free_coherent(NULL, rxq->rx_desc_area_size,
1985                                   rxq->rx_desc_area, rxq->rx_desc_dma);
1986
1987         kfree(rxq->rx_skb);
1988 }
1989
1990 static int txq_init(struct mv643xx_eth_private *mp, int index)
1991 {
1992         struct tx_queue *txq = mp->txq + index;
1993         struct tx_desc *tx_desc;
1994         int size;
1995         int i;
1996
1997         txq->index = index;
1998
1999         txq->tx_ring_size = mp->tx_ring_size;
2000
2001         txq->tx_desc_count = 0;
2002         txq->tx_curr_desc = 0;
2003         txq->tx_used_desc = 0;
2004
2005         size = txq->tx_ring_size * sizeof(struct tx_desc);
2006
2007         if (index == 0 && size <= mp->tx_desc_sram_size) {
2008                 txq->tx_desc_area = ioremap(mp->tx_desc_sram_addr,
2009                                                 mp->tx_desc_sram_size);
2010                 txq->tx_desc_dma = mp->tx_desc_sram_addr;
2011         } else {
2012                 txq->tx_desc_area = dma_alloc_coherent(NULL, size,
2013                                                         &txq->tx_desc_dma,
2014                                                         GFP_KERNEL);
2015         }
2016
2017         if (txq->tx_desc_area == NULL) {
2018                 dev_printk(KERN_ERR, &mp->dev->dev,
2019                            "can't allocate tx ring (%d bytes)\n", size);
2020                 return -ENOMEM;
2021         }
2022         memset(txq->tx_desc_area, 0, size);
2023
2024         txq->tx_desc_area_size = size;
2025
2026         tx_desc = (struct tx_desc *)txq->tx_desc_area;
2027         for (i = 0; i < txq->tx_ring_size; i++) {
2028                 struct tx_desc *txd = tx_desc + i;
2029                 int nexti;
2030
2031                 nexti = i + 1;
2032                 if (nexti == txq->tx_ring_size)
2033                         nexti = 0;
2034
2035                 txd->cmd_sts = 0;
2036                 txd->next_desc_ptr = txq->tx_desc_dma +
2037                                         nexti * sizeof(struct tx_desc);
2038         }
2039
2040         skb_queue_head_init(&txq->tx_skb);
2041
2042         return 0;
2043 }
2044
2045 static void txq_deinit(struct tx_queue *txq)
2046 {
2047         struct mv643xx_eth_private *mp = txq_to_mp(txq);
2048
2049         txq_disable(txq);
2050         txq_reclaim(txq, txq->tx_ring_size, 1);
2051
2052         BUG_ON(txq->tx_used_desc != txq->tx_curr_desc);
2053
2054         if (txq->index == 0 &&
2055             txq->tx_desc_area_size <= mp->tx_desc_sram_size)
2056                 iounmap(txq->tx_desc_area);
2057         else
2058                 dma_free_coherent(NULL, txq->tx_desc_area_size,
2059                                   txq->tx_desc_area, txq->tx_desc_dma);
2060 }
2061
2062
2063 /* netdev ops and related ***************************************************/
2064 static int mv643xx_eth_collect_events(struct mv643xx_eth_private *mp)
2065 {
2066         u32 int_cause;
2067         u32 int_cause_ext;
2068
2069         int_cause = rdlp(mp, INT_CAUSE) & (INT_TX_END | INT_RX | INT_EXT);
2070         if (int_cause == 0)
2071                 return 0;
2072
2073         int_cause_ext = 0;
2074         if (int_cause & INT_EXT)
2075                 int_cause_ext = rdlp(mp, INT_CAUSE_EXT);
2076
2077         int_cause &= INT_TX_END | INT_RX;
2078         if (int_cause) {
2079                 wrlp(mp, INT_CAUSE, ~int_cause);
2080                 mp->work_tx_end |= ((int_cause & INT_TX_END) >> 19) &
2081                                 ~(rdlp(mp, TXQ_COMMAND) & 0xff);
2082                 mp->work_rx |= (int_cause & INT_RX) >> 2;
2083         }
2084
2085         int_cause_ext &= INT_EXT_LINK_PHY | INT_EXT_TX;
2086         if (int_cause_ext) {
2087                 wrlp(mp, INT_CAUSE_EXT, ~int_cause_ext);
2088                 if (int_cause_ext & INT_EXT_LINK_PHY)
2089                         mp->work_link = 1;
2090                 mp->work_tx |= int_cause_ext & INT_EXT_TX;
2091         }
2092
2093         return 1;
2094 }
2095
2096 static irqreturn_t mv643xx_eth_irq(int irq, void *dev_id)
2097 {
2098         struct net_device *dev = (struct net_device *)dev_id;
2099         struct mv643xx_eth_private *mp = netdev_priv(dev);
2100
2101         if (unlikely(!mv643xx_eth_collect_events(mp)))
2102                 return IRQ_NONE;
2103
2104         wrlp(mp, INT_MASK, 0);
2105         napi_schedule(&mp->napi);
2106
2107         return IRQ_HANDLED;
2108 }
2109
2110 static void handle_link_event(struct mv643xx_eth_private *mp)
2111 {
2112         struct net_device *dev = mp->dev;
2113         u32 port_status;
2114         int speed;
2115         int duplex;
2116         int fc;
2117
2118         port_status = rdlp(mp, PORT_STATUS);
2119         if (!(port_status & LINK_UP)) {
2120                 if (netif_carrier_ok(dev)) {
2121                         int i;
2122
2123                         printk(KERN_INFO "%s: link down\n", dev->name);
2124
2125                         netif_carrier_off(dev);
2126
2127                         for (i = 0; i < mp->txq_count; i++) {
2128                                 struct tx_queue *txq = mp->txq + i;
2129
2130                                 txq_reclaim(txq, txq->tx_ring_size, 1);
2131                                 txq_reset_hw_ptr(txq);
2132                         }
2133                 }
2134                 return;
2135         }
2136
2137         switch (port_status & PORT_SPEED_MASK) {
2138         case PORT_SPEED_10:
2139                 speed = 10;
2140                 break;
2141         case PORT_SPEED_100:
2142                 speed = 100;
2143                 break;
2144         case PORT_SPEED_1000:
2145                 speed = 1000;
2146                 break;
2147         default:
2148                 speed = -1;
2149                 break;
2150         }
2151         duplex = (port_status & FULL_DUPLEX) ? 1 : 0;
2152         fc = (port_status & FLOW_CONTROL_ENABLED) ? 1 : 0;
2153
2154         printk(KERN_INFO "%s: link up, %d Mb/s, %s duplex, "
2155                          "flow control %sabled\n", dev->name,
2156                          speed, duplex ? "full" : "half",
2157                          fc ? "en" : "dis");
2158
2159         if (!netif_carrier_ok(dev))
2160                 netif_carrier_on(dev);
2161 }
2162
2163 static int mv643xx_eth_poll(struct napi_struct *napi, int budget)
2164 {
2165         struct mv643xx_eth_private *mp;
2166         int work_done;
2167
2168         mp = container_of(napi, struct mv643xx_eth_private, napi);
2169
2170         mp->work_rx_refill |= mp->work_rx_oom;
2171         mp->work_rx_oom = 0;
2172
2173         work_done = 0;
2174         while (work_done < budget) {
2175                 u8 queue_mask;
2176                 int queue;
2177                 int work_tbd;
2178
2179                 if (mp->work_link) {
2180                         mp->work_link = 0;
2181                         handle_link_event(mp);
2182                         continue;
2183                 }
2184
2185                 queue_mask = mp->work_tx | mp->work_tx_end |
2186                                 mp->work_rx | mp->work_rx_refill;
2187                 if (!queue_mask) {
2188                         if (mv643xx_eth_collect_events(mp))
2189                                 continue;
2190                         break;
2191                 }
2192
2193                 queue = fls(queue_mask) - 1;
2194                 queue_mask = 1 << queue;
2195
2196                 work_tbd = budget - work_done;
2197                 if (work_tbd > 16)
2198                         work_tbd = 16;
2199
2200                 if (mp->work_tx_end & queue_mask) {
2201                         txq_kick(mp->txq + queue);
2202                 } else if (mp->work_tx & queue_mask) {
2203                         work_done += txq_reclaim(mp->txq + queue, work_tbd, 0);
2204                         txq_maybe_wake(mp->txq + queue);
2205                 } else if (mp->work_rx & queue_mask) {
2206                         work_done += rxq_process(mp->rxq + queue, work_tbd);
2207                 } else if (mp->work_rx_refill & queue_mask) {
2208                         work_done += rxq_refill(mp->rxq + queue, work_tbd);
2209                 } else {
2210                         BUG();
2211                 }
2212         }
2213
2214         if (work_done < budget) {
2215                 if (mp->work_rx_oom)
2216                         mod_timer(&mp->rx_oom, jiffies + (HZ / 10));
2217                 napi_complete(napi);
2218                 wrlp(mp, INT_MASK, INT_TX_END | INT_RX | INT_EXT);
2219         }
2220
2221         return work_done;
2222 }
2223
2224 static inline void oom_timer_wrapper(unsigned long data)
2225 {
2226         struct mv643xx_eth_private *mp = (void *)data;
2227
2228         napi_schedule(&mp->napi);
2229 }
2230
2231 static void phy_reset(struct mv643xx_eth_private *mp)
2232 {
2233         int data;
2234
2235         data = phy_read(mp->phy, MII_BMCR);
2236         if (data < 0)
2237                 return;
2238
2239         data |= BMCR_RESET;
2240         if (phy_write(mp->phy, MII_BMCR, data) < 0)
2241                 return;
2242
2243         do {
2244                 data = phy_read(mp->phy, MII_BMCR);
2245         } while (data >= 0 && data & BMCR_RESET);
2246 }
2247
2248 static void port_start(struct mv643xx_eth_private *mp)
2249 {
2250         u32 pscr;
2251         int i;
2252
2253         /*
2254          * Perform PHY reset, if there is a PHY.
2255          */
2256         if (mp->phy != NULL) {
2257                 struct ethtool_cmd cmd;
2258
2259                 mv643xx_eth_get_settings(mp->dev, &cmd);
2260                 phy_reset(mp);
2261                 mv643xx_eth_set_settings(mp->dev, &cmd);
2262         }
2263
2264         /*
2265          * Configure basic link parameters.
2266          */
2267         pscr = rdlp(mp, PORT_SERIAL_CONTROL);
2268
2269         pscr |= SERIAL_PORT_ENABLE;
2270         wrlp(mp, PORT_SERIAL_CONTROL, pscr);
2271
2272         pscr |= DO_NOT_FORCE_LINK_FAIL;
2273         if (mp->phy == NULL)
2274                 pscr |= FORCE_LINK_PASS;
2275         wrlp(mp, PORT_SERIAL_CONTROL, pscr);
2276
2277         /*
2278          * Configure TX path and queues.
2279          */
2280         tx_set_rate(mp, 1000000000, 16777216);
2281         for (i = 0; i < mp->txq_count; i++) {
2282                 struct tx_queue *txq = mp->txq + i;
2283
2284                 txq_reset_hw_ptr(txq);
2285                 txq_set_rate(txq, 1000000000, 16777216);
2286                 txq_set_fixed_prio_mode(txq);
2287         }
2288
2289         /*
2290          * Receive all unmatched unicast, TCP, UDP, BPDU and broadcast
2291          * frames to RX queue #0, and include the pseudo-header when
2292          * calculating receive checksums.
2293          */
2294         wrlp(mp, PORT_CONFIG, 0x02000000);
2295
2296         /*
2297          * Treat BPDUs as normal multicasts, and disable partition mode.
2298          */
2299         wrlp(mp, PORT_CONFIG_EXT, 0x00000000);
2300
2301         /*
2302          * Add configured unicast addresses to address filter table.
2303          */
2304         mv643xx_eth_program_unicast_filter(mp->dev);
2305
2306         /*
2307          * Enable the receive queues.
2308          */
2309         for (i = 0; i < mp->rxq_count; i++) {
2310                 struct rx_queue *rxq = mp->rxq + i;
2311                 u32 addr;
2312
2313                 addr = (u32)rxq->rx_desc_dma;
2314                 addr += rxq->rx_curr_desc * sizeof(struct rx_desc);
2315                 wrlp(mp, RXQ_CURRENT_DESC_PTR(i), addr);
2316
2317                 rxq_enable(rxq);
2318         }
2319 }
2320
2321 static void mv643xx_eth_recalc_skb_size(struct mv643xx_eth_private *mp)
2322 {
2323         int skb_size;
2324
2325         /*
2326          * Reserve 2+14 bytes for an ethernet header (the hardware
2327          * automatically prepends 2 bytes of dummy data to each
2328          * received packet), 16 bytes for up to four VLAN tags, and
2329          * 4 bytes for the trailing FCS -- 36 bytes total.
2330          */
2331         skb_size = mp->dev->mtu + 36;
2332
2333         /*
2334          * Make sure that the skb size is a multiple of 8 bytes, as
2335          * the lower three bits of the receive descriptor's buffer
2336          * size field are ignored by the hardware.
2337          */
2338         mp->skb_size = (skb_size + 7) & ~7;
2339 }
2340
2341 static int mv643xx_eth_open(struct net_device *dev)
2342 {
2343         struct mv643xx_eth_private *mp = netdev_priv(dev);
2344         int err;
2345         int i;
2346
2347         wrlp(mp, INT_CAUSE, 0);
2348         wrlp(mp, INT_CAUSE_EXT, 0);
2349         rdlp(mp, INT_CAUSE_EXT);
2350
2351         err = request_irq(dev->irq, mv643xx_eth_irq,
2352                           IRQF_SHARED, dev->name, dev);
2353         if (err) {
2354                 dev_printk(KERN_ERR, &dev->dev, "can't assign irq\n");
2355                 return -EAGAIN;
2356         }
2357
2358         mv643xx_eth_recalc_skb_size(mp);
2359
2360         napi_enable(&mp->napi);
2361
2362         skb_queue_head_init(&mp->rx_recycle);
2363
2364         for (i = 0; i < mp->rxq_count; i++) {
2365                 err = rxq_init(mp, i);
2366                 if (err) {
2367                         while (--i >= 0)
2368                                 rxq_deinit(mp->rxq + i);
2369                         goto out;
2370                 }
2371
2372                 rxq_refill(mp->rxq + i, INT_MAX);
2373         }
2374
2375         if (mp->work_rx_oom) {
2376                 mp->rx_oom.expires = jiffies + (HZ / 10);
2377                 add_timer(&mp->rx_oom);
2378         }
2379
2380         for (i = 0; i < mp->txq_count; i++) {
2381                 err = txq_init(mp, i);
2382                 if (err) {
2383                         while (--i >= 0)
2384                                 txq_deinit(mp->txq + i);
2385                         goto out_free;
2386                 }
2387         }
2388
2389         port_start(mp);
2390
2391         wrlp(mp, INT_MASK_EXT, INT_EXT_LINK_PHY | INT_EXT_TX);
2392         wrlp(mp, INT_MASK, INT_TX_END | INT_RX | INT_EXT);
2393
2394         return 0;
2395
2396
2397 out_free:
2398         for (i = 0; i < mp->rxq_count; i++)
2399                 rxq_deinit(mp->rxq + i);
2400 out:
2401         free_irq(dev->irq, dev);
2402
2403         return err;
2404 }
2405
2406 static void port_reset(struct mv643xx_eth_private *mp)
2407 {
2408         unsigned int data;
2409         int i;
2410
2411         for (i = 0; i < mp->rxq_count; i++)
2412                 rxq_disable(mp->rxq + i);
2413         for (i = 0; i < mp->txq_count; i++)
2414                 txq_disable(mp->txq + i);
2415
2416         while (1) {
2417                 u32 ps = rdlp(mp, PORT_STATUS);
2418
2419                 if ((ps & (TX_IN_PROGRESS | TX_FIFO_EMPTY)) == TX_FIFO_EMPTY)
2420                         break;
2421                 udelay(10);
2422         }
2423
2424         /* Reset the Enable bit in the Configuration Register */
2425         data = rdlp(mp, PORT_SERIAL_CONTROL);
2426         data &= ~(SERIAL_PORT_ENABLE            |
2427                   DO_NOT_FORCE_LINK_FAIL        |
2428                   FORCE_LINK_PASS);
2429         wrlp(mp, PORT_SERIAL_CONTROL, data);
2430 }
2431
2432 static int mv643xx_eth_stop(struct net_device *dev)
2433 {
2434         struct mv643xx_eth_private *mp = netdev_priv(dev);
2435         int i;
2436
2437         wrlp(mp, INT_MASK_EXT, 0x00000000);
2438         wrlp(mp, INT_MASK, 0x00000000);
2439         rdlp(mp, INT_MASK);
2440
2441         napi_disable(&mp->napi);
2442
2443         del_timer_sync(&mp->rx_oom);
2444
2445         netif_carrier_off(dev);
2446
2447         free_irq(dev->irq, dev);
2448
2449         port_reset(mp);
2450         mv643xx_eth_get_stats(dev);
2451         mib_counters_update(mp);
2452         del_timer_sync(&mp->mib_counters_timer);
2453
2454         skb_queue_purge(&mp->rx_recycle);
2455
2456         for (i = 0; i < mp->rxq_count; i++)
2457                 rxq_deinit(mp->rxq + i);
2458         for (i = 0; i < mp->txq_count; i++)
2459                 txq_deinit(mp->txq + i);
2460
2461         return 0;
2462 }
2463
2464 static int mv643xx_eth_ioctl(struct net_device *dev, struct ifreq *ifr, int cmd)
2465 {
2466         struct mv643xx_eth_private *mp = netdev_priv(dev);
2467
2468         if (mp->phy != NULL)
2469                 return phy_mii_ioctl(mp->phy, if_mii(ifr), cmd);
2470
2471         return -EOPNOTSUPP;
2472 }
2473
2474 static int mv643xx_eth_change_mtu(struct net_device *dev, int new_mtu)
2475 {
2476         struct mv643xx_eth_private *mp = netdev_priv(dev);
2477
2478         if (new_mtu < 64 || new_mtu > 9500)
2479                 return -EINVAL;
2480
2481         dev->mtu = new_mtu;
2482         mv643xx_eth_recalc_skb_size(mp);
2483         tx_set_rate(mp, 1000000000, 16777216);
2484
2485         if (!netif_running(dev))
2486                 return 0;
2487
2488         /*
2489          * Stop and then re-open the interface. This will allocate RX
2490          * skbs of the new MTU.
2491          * There is a possible danger that the open will not succeed,
2492          * due to memory being full.
2493          */
2494         mv643xx_eth_stop(dev);
2495         if (mv643xx_eth_open(dev)) {
2496                 dev_printk(KERN_ERR, &dev->dev,
2497                            "fatal error on re-opening device after "
2498                            "MTU change\n");
2499         }
2500
2501         return 0;
2502 }
2503
2504 static void tx_timeout_task(struct work_struct *ugly)
2505 {
2506         struct mv643xx_eth_private *mp;
2507
2508         mp = container_of(ugly, struct mv643xx_eth_private, tx_timeout_task);
2509         if (netif_running(mp->dev)) {
2510                 netif_tx_stop_all_queues(mp->dev);
2511                 port_reset(mp);
2512                 port_start(mp);
2513                 netif_tx_wake_all_queues(mp->dev);
2514         }
2515 }
2516
2517 static void mv643xx_eth_tx_timeout(struct net_device *dev)
2518 {
2519         struct mv643xx_eth_private *mp = netdev_priv(dev);
2520
2521         dev_printk(KERN_INFO, &dev->dev, "tx timeout\n");
2522
2523         schedule_work(&mp->tx_timeout_task);
2524 }
2525
2526 #ifdef CONFIG_NET_POLL_CONTROLLER
2527 static void mv643xx_eth_netpoll(struct net_device *dev)
2528 {
2529         struct mv643xx_eth_private *mp = netdev_priv(dev);
2530
2531         wrlp(mp, INT_MASK, 0x00000000);
2532         rdlp(mp, INT_MASK);
2533
2534         mv643xx_eth_irq(dev->irq, dev);
2535
2536         wrlp(mp, INT_MASK, INT_TX_END | INT_RX | INT_EXT);
2537 }
2538 #endif
2539
2540
2541 /* platform glue ************************************************************/
2542 static void
2543 mv643xx_eth_conf_mbus_windows(struct mv643xx_eth_shared_private *msp,
2544                               struct mbus_dram_target_info *dram)
2545 {
2546         void __iomem *base = msp->base;
2547         u32 win_enable;
2548         u32 win_protect;
2549         int i;
2550
2551         for (i = 0; i < 6; i++) {
2552                 writel(0, base + WINDOW_BASE(i));
2553                 writel(0, base + WINDOW_SIZE(i));
2554                 if (i < 4)
2555                         writel(0, base + WINDOW_REMAP_HIGH(i));
2556         }
2557
2558         win_enable = 0x3f;
2559         win_protect = 0;
2560
2561         for (i = 0; i < dram->num_cs; i++) {
2562                 struct mbus_dram_window *cs = dram->cs + i;
2563
2564                 writel((cs->base & 0xffff0000) |
2565                         (cs->mbus_attr << 8) |
2566                         dram->mbus_dram_target_id, base + WINDOW_BASE(i));
2567                 writel((cs->size - 1) & 0xffff0000, base + WINDOW_SIZE(i));
2568
2569                 win_enable &= ~(1 << i);
2570                 win_protect |= 3 << (2 * i);
2571         }
2572
2573         writel(win_enable, base + WINDOW_BAR_ENABLE);
2574         msp->win_protect = win_protect;
2575 }
2576
2577 static void infer_hw_params(struct mv643xx_eth_shared_private *msp)
2578 {
2579         /*
2580          * Check whether we have a 14-bit coal limit field in bits
2581          * [21:8], or a 16-bit coal limit in bits [25,21:7] of the
2582          * SDMA config register.
2583          */
2584         writel(0x02000000, msp->base + 0x0400 + SDMA_CONFIG);
2585         if (readl(msp->base + 0x0400 + SDMA_CONFIG) & 0x02000000)
2586                 msp->extended_rx_coal_limit = 1;
2587         else
2588                 msp->extended_rx_coal_limit = 0;
2589
2590         /*
2591          * Check whether the MAC supports TX rate control, and if
2592          * yes, whether its associated registers are in the old or
2593          * the new place.
2594          */
2595         writel(1, msp->base + 0x0400 + TX_BW_MTU_MOVED);
2596         if (readl(msp->base + 0x0400 + TX_BW_MTU_MOVED) & 1) {
2597                 msp->tx_bw_control = TX_BW_CONTROL_NEW_LAYOUT;
2598         } else {
2599                 writel(7, msp->base + 0x0400 + TX_BW_RATE);
2600                 if (readl(msp->base + 0x0400 + TX_BW_RATE) & 7)
2601                         msp->tx_bw_control = TX_BW_CONTROL_OLD_LAYOUT;
2602                 else
2603                         msp->tx_bw_control = TX_BW_CONTROL_ABSENT;
2604         }
2605 }
2606
2607 static int mv643xx_eth_shared_probe(struct platform_device *pdev)
2608 {
2609         static int mv643xx_eth_version_printed;
2610         struct mv643xx_eth_shared_platform_data *pd = pdev->dev.platform_data;
2611         struct mv643xx_eth_shared_private *msp;
2612         struct resource *res;
2613         int ret;
2614
2615         if (!mv643xx_eth_version_printed++)
2616                 printk(KERN_NOTICE "MV-643xx 10/100/1000 ethernet "
2617                         "driver version %s\n", mv643xx_eth_driver_version);
2618
2619         ret = -EINVAL;
2620         res = platform_get_resource(pdev, IORESOURCE_MEM, 0);
2621         if (res == NULL)
2622                 goto out;
2623
2624         ret = -ENOMEM;
2625         msp = kmalloc(sizeof(*msp), GFP_KERNEL);
2626         if (msp == NULL)
2627                 goto out;
2628         memset(msp, 0, sizeof(*msp));
2629
2630         msp->base = ioremap(res->start, res->end - res->start + 1);
2631         if (msp->base == NULL)
2632                 goto out_free;
2633
2634         /*
2635          * Set up and register SMI bus.
2636          */
2637         if (pd == NULL || pd->shared_smi == NULL) {
2638                 msp->smi_bus = mdiobus_alloc();
2639                 if (msp->smi_bus == NULL)
2640                         goto out_unmap;
2641
2642                 msp->smi_bus->priv = msp;
2643                 msp->smi_bus->name = "mv643xx_eth smi";
2644                 msp->smi_bus->read = smi_bus_read;
2645                 msp->smi_bus->write = smi_bus_write,
2646                 snprintf(msp->smi_bus->id, MII_BUS_ID_SIZE, "%d", pdev->id);
2647                 msp->smi_bus->parent = &pdev->dev;
2648                 msp->smi_bus->phy_mask = 0xffffffff;
2649                 if (mdiobus_register(msp->smi_bus) < 0)
2650                         goto out_free_mii_bus;
2651                 msp->smi = msp;
2652         } else {
2653                 msp->smi = platform_get_drvdata(pd->shared_smi);
2654         }
2655
2656         msp->err_interrupt = NO_IRQ;
2657         init_waitqueue_head(&msp->smi_busy_wait);
2658
2659         /*
2660          * Check whether the error interrupt is hooked up.
2661          */
2662         res = platform_get_resource(pdev, IORESOURCE_IRQ, 0);
2663         if (res != NULL) {
2664                 int err;
2665
2666                 err = request_irq(res->start, mv643xx_eth_err_irq,
2667                                   IRQF_SHARED, "mv643xx_eth", msp);
2668                 if (!err) {
2669                         writel(ERR_INT_SMI_DONE, msp->base + ERR_INT_MASK);
2670                         msp->err_interrupt = res->start;
2671                 }
2672         }
2673
2674         /*
2675          * (Re-)program MBUS remapping windows if we are asked to.
2676          */
2677         if (pd != NULL && pd->dram != NULL)
2678                 mv643xx_eth_conf_mbus_windows(msp, pd->dram);
2679
2680         /*
2681          * Detect hardware parameters.
2682          */
2683         msp->t_clk = (pd != NULL && pd->t_clk != 0) ? pd->t_clk : 133000000;
2684         infer_hw_params(msp);
2685
2686         platform_set_drvdata(pdev, msp);
2687
2688         return 0;
2689
2690 out_free_mii_bus:
2691         mdiobus_free(msp->smi_bus);
2692 out_unmap:
2693         iounmap(msp->base);
2694 out_free:
2695         kfree(msp);
2696 out:
2697         return ret;
2698 }
2699
2700 static int mv643xx_eth_shared_remove(struct platform_device *pdev)
2701 {
2702         struct mv643xx_eth_shared_private *msp = platform_get_drvdata(pdev);
2703         struct mv643xx_eth_shared_platform_data *pd = pdev->dev.platform_data;
2704
2705         if (pd == NULL || pd->shared_smi == NULL) {
2706                 mdiobus_unregister(msp->smi_bus);
2707                 mdiobus_free(msp->smi_bus);
2708         }
2709         if (msp->err_interrupt != NO_IRQ)
2710                 free_irq(msp->err_interrupt, msp);
2711         iounmap(msp->base);
2712         kfree(msp);
2713
2714         return 0;
2715 }
2716
2717 static struct platform_driver mv643xx_eth_shared_driver = {
2718         .probe          = mv643xx_eth_shared_probe,
2719         .remove         = mv643xx_eth_shared_remove,
2720         .driver = {
2721                 .name   = MV643XX_ETH_SHARED_NAME,
2722                 .owner  = THIS_MODULE,
2723         },
2724 };
2725
2726 static void phy_addr_set(struct mv643xx_eth_private *mp, int phy_addr)
2727 {
2728         int addr_shift = 5 * mp->port_num;
2729         u32 data;
2730
2731         data = rdl(mp, PHY_ADDR);
2732         data &= ~(0x1f << addr_shift);
2733         data |= (phy_addr & 0x1f) << addr_shift;
2734         wrl(mp, PHY_ADDR, data);
2735 }
2736
2737 static int phy_addr_get(struct mv643xx_eth_private *mp)
2738 {
2739         unsigned int data;
2740
2741         data = rdl(mp, PHY_ADDR);
2742
2743         return (data >> (5 * mp->port_num)) & 0x1f;
2744 }
2745
2746 static void set_params(struct mv643xx_eth_private *mp,
2747                        struct mv643xx_eth_platform_data *pd)
2748 {
2749         struct net_device *dev = mp->dev;
2750
2751         if (is_valid_ether_addr(pd->mac_addr))
2752                 memcpy(dev->dev_addr, pd->mac_addr, 6);
2753         else
2754                 uc_addr_get(mp, dev->dev_addr);
2755
2756         mp->rx_ring_size = DEFAULT_RX_QUEUE_SIZE;
2757         if (pd->rx_queue_size)
2758                 mp->rx_ring_size = pd->rx_queue_size;
2759         mp->rx_desc_sram_addr = pd->rx_sram_addr;
2760         mp->rx_desc_sram_size = pd->rx_sram_size;
2761
2762         mp->rxq_count = pd->rx_queue_count ? : 1;
2763
2764         mp->tx_ring_size = DEFAULT_TX_QUEUE_SIZE;
2765         if (pd->tx_queue_size)
2766                 mp->tx_ring_size = pd->tx_queue_size;
2767         mp->tx_desc_sram_addr = pd->tx_sram_addr;
2768         mp->tx_desc_sram_size = pd->tx_sram_size;
2769
2770         mp->txq_count = pd->tx_queue_count ? : 1;
2771 }
2772
2773 static struct phy_device *phy_scan(struct mv643xx_eth_private *mp,
2774                                    int phy_addr)
2775 {
2776         struct mii_bus *bus = mp->shared->smi->smi_bus;
2777         struct phy_device *phydev;
2778         int start;
2779         int num;
2780         int i;
2781
2782         if (phy_addr == MV643XX_ETH_PHY_ADDR_DEFAULT) {
2783                 start = phy_addr_get(mp) & 0x1f;
2784                 num = 32;
2785         } else {
2786                 start = phy_addr & 0x1f;
2787                 num = 1;
2788         }
2789
2790         phydev = NULL;
2791         for (i = 0; i < num; i++) {
2792                 int addr = (start + i) & 0x1f;
2793
2794                 if (bus->phy_map[addr] == NULL)
2795                         mdiobus_scan(bus, addr);
2796
2797                 if (phydev == NULL) {
2798                         phydev = bus->phy_map[addr];
2799                         if (phydev != NULL)
2800                                 phy_addr_set(mp, addr);
2801                 }
2802         }
2803
2804         return phydev;
2805 }
2806
2807 static void phy_init(struct mv643xx_eth_private *mp, int speed, int duplex)
2808 {
2809         struct phy_device *phy = mp->phy;
2810
2811         phy_reset(mp);
2812
2813         phy_attach(mp->dev, dev_name(&phy->dev), 0, PHY_INTERFACE_MODE_GMII);
2814
2815         if (speed == 0) {
2816                 phy->autoneg = AUTONEG_ENABLE;
2817                 phy->speed = 0;
2818                 phy->duplex = 0;
2819                 phy->advertising = phy->supported | ADVERTISED_Autoneg;
2820         } else {
2821                 phy->autoneg = AUTONEG_DISABLE;
2822                 phy->advertising = 0;
2823                 phy->speed = speed;
2824                 phy->duplex = duplex;
2825         }
2826         phy_start_aneg(phy);
2827 }
2828
2829 static void init_pscr(struct mv643xx_eth_private *mp, int speed, int duplex)
2830 {
2831         u32 pscr;
2832
2833         pscr = rdlp(mp, PORT_SERIAL_CONTROL);
2834         if (pscr & SERIAL_PORT_ENABLE) {
2835                 pscr &= ~SERIAL_PORT_ENABLE;
2836                 wrlp(mp, PORT_SERIAL_CONTROL, pscr);
2837         }
2838
2839         pscr = MAX_RX_PACKET_9700BYTE | SERIAL_PORT_CONTROL_RESERVED;
2840         if (mp->phy == NULL) {
2841                 pscr |= DISABLE_AUTO_NEG_SPEED_GMII;
2842                 if (speed == SPEED_1000)
2843                         pscr |= SET_GMII_SPEED_TO_1000;
2844                 else if (speed == SPEED_100)
2845                         pscr |= SET_MII_SPEED_TO_100;
2846
2847                 pscr |= DISABLE_AUTO_NEG_FOR_FLOW_CTRL;
2848
2849                 pscr |= DISABLE_AUTO_NEG_FOR_DUPLEX;
2850                 if (duplex == DUPLEX_FULL)
2851                         pscr |= SET_FULL_DUPLEX_MODE;
2852         }
2853
2854         wrlp(mp, PORT_SERIAL_CONTROL, pscr);
2855 }
2856
2857 static const struct net_device_ops mv643xx_eth_netdev_ops = {
2858         .ndo_open               = mv643xx_eth_open,
2859         .ndo_stop               = mv643xx_eth_stop,
2860         .ndo_start_xmit         = mv643xx_eth_xmit,
2861         .ndo_set_rx_mode        = mv643xx_eth_set_rx_mode,
2862         .ndo_set_mac_address    = mv643xx_eth_set_mac_address,
2863         .ndo_do_ioctl           = mv643xx_eth_ioctl,
2864         .ndo_change_mtu         = mv643xx_eth_change_mtu,
2865         .ndo_tx_timeout         = mv643xx_eth_tx_timeout,
2866         .ndo_get_stats          = mv643xx_eth_get_stats,
2867 #ifdef CONFIG_NET_POLL_CONTROLLER
2868         .ndo_poll_controller    = mv643xx_eth_netpoll,
2869 #endif
2870 };
2871
2872 static int mv643xx_eth_probe(struct platform_device *pdev)
2873 {
2874         struct mv643xx_eth_platform_data *pd;
2875         struct mv643xx_eth_private *mp;
2876         struct net_device *dev;
2877         struct resource *res;
2878         int err;
2879
2880         pd = pdev->dev.platform_data;
2881         if (pd == NULL) {
2882                 dev_printk(KERN_ERR, &pdev->dev,
2883                            "no mv643xx_eth_platform_data\n");
2884                 return -ENODEV;
2885         }
2886
2887         if (pd->shared == NULL) {
2888                 dev_printk(KERN_ERR, &pdev->dev,
2889                            "no mv643xx_eth_platform_data->shared\n");
2890                 return -ENODEV;
2891         }
2892
2893         dev = alloc_etherdev_mq(sizeof(struct mv643xx_eth_private), 8);
2894         if (!dev)
2895                 return -ENOMEM;
2896
2897         mp = netdev_priv(dev);
2898         platform_set_drvdata(pdev, mp);
2899
2900         mp->shared = platform_get_drvdata(pd->shared);
2901         mp->base = mp->shared->base + 0x0400 + (pd->port_number << 10);
2902         mp->port_num = pd->port_number;
2903
2904         mp->dev = dev;
2905
2906         set_params(mp, pd);
2907         dev->real_num_tx_queues = mp->txq_count;
2908
2909         if (pd->phy_addr != MV643XX_ETH_PHY_NONE)
2910                 mp->phy = phy_scan(mp, pd->phy_addr);
2911
2912         if (mp->phy != NULL)
2913                 phy_init(mp, pd->speed, pd->duplex);
2914
2915         SET_ETHTOOL_OPS(dev, &mv643xx_eth_ethtool_ops);
2916
2917         init_pscr(mp, pd->speed, pd->duplex);
2918
2919
2920         mib_counters_clear(mp);
2921
2922         init_timer(&mp->mib_counters_timer);
2923         mp->mib_counters_timer.data = (unsigned long)mp;
2924         mp->mib_counters_timer.function = mib_counters_timer_wrapper;
2925         mp->mib_counters_timer.expires = jiffies + 30 * HZ;
2926         add_timer(&mp->mib_counters_timer);
2927
2928         spin_lock_init(&mp->mib_counters_lock);
2929
2930         INIT_WORK(&mp->tx_timeout_task, tx_timeout_task);
2931
2932         netif_napi_add(dev, &mp->napi, mv643xx_eth_poll, 128);
2933
2934         init_timer(&mp->rx_oom);
2935         mp->rx_oom.data = (unsigned long)mp;
2936         mp->rx_oom.function = oom_timer_wrapper;
2937
2938
2939         res = platform_get_resource(pdev, IORESOURCE_IRQ, 0);
2940         BUG_ON(!res);
2941         dev->irq = res->start;
2942
2943         dev->netdev_ops = &mv643xx_eth_netdev_ops;
2944
2945         dev->watchdog_timeo = 2 * HZ;
2946         dev->base_addr = 0;
2947
2948         dev->features = NETIF_F_SG | NETIF_F_IP_CSUM;
2949         dev->vlan_features = NETIF_F_SG | NETIF_F_IP_CSUM;
2950
2951         SET_NETDEV_DEV(dev, &pdev->dev);
2952
2953         if (mp->shared->win_protect)
2954                 wrl(mp, WINDOW_PROTECT(mp->port_num), mp->shared->win_protect);
2955
2956         netif_carrier_off(dev);
2957
2958         wrlp(mp, SDMA_CONFIG, PORT_SDMA_CONFIG_DEFAULT_VALUE);
2959
2960         set_rx_coal(mp, 250);
2961         set_tx_coal(mp, 0);
2962
2963         err = register_netdev(dev);
2964         if (err)
2965                 goto out;
2966
2967         dev_printk(KERN_NOTICE, &dev->dev, "port %d with MAC address %pM\n",
2968                    mp->port_num, dev->dev_addr);
2969
2970         if (mp->tx_desc_sram_size > 0)
2971                 dev_printk(KERN_NOTICE, &dev->dev, "configured with sram\n");
2972
2973         return 0;
2974
2975 out:
2976         free_netdev(dev);
2977
2978         return err;
2979 }
2980
2981 static int mv643xx_eth_remove(struct platform_device *pdev)
2982 {
2983         struct mv643xx_eth_private *mp = platform_get_drvdata(pdev);
2984
2985         unregister_netdev(mp->dev);
2986         if (mp->phy != NULL)
2987                 phy_detach(mp->phy);
2988         flush_scheduled_work();
2989         free_netdev(mp->dev);
2990
2991         platform_set_drvdata(pdev, NULL);
2992
2993         return 0;
2994 }
2995
2996 static void mv643xx_eth_shutdown(struct platform_device *pdev)
2997 {
2998         struct mv643xx_eth_private *mp = platform_get_drvdata(pdev);
2999
3000         /* Mask all interrupts on ethernet port */
3001         wrlp(mp, INT_MASK, 0);
3002         rdlp(mp, INT_MASK);
3003
3004         if (netif_running(mp->dev))
3005                 port_reset(mp);
3006 }
3007
3008 static struct platform_driver mv643xx_eth_driver = {
3009         .probe          = mv643xx_eth_probe,
3010         .remove         = mv643xx_eth_remove,
3011         .shutdown       = mv643xx_eth_shutdown,
3012         .driver = {
3013                 .name   = MV643XX_ETH_NAME,
3014                 .owner  = THIS_MODULE,
3015         },
3016 };
3017
3018 static int __init mv643xx_eth_init_module(void)
3019 {
3020         int rc;
3021
3022         rc = platform_driver_register(&mv643xx_eth_shared_driver);
3023         if (!rc) {
3024                 rc = platform_driver_register(&mv643xx_eth_driver);
3025                 if (rc)
3026                         platform_driver_unregister(&mv643xx_eth_shared_driver);
3027         }
3028
3029         return rc;
3030 }
3031 module_init(mv643xx_eth_init_module);
3032
3033 static void __exit mv643xx_eth_cleanup_module(void)
3034 {
3035         platform_driver_unregister(&mv643xx_eth_driver);
3036         platform_driver_unregister(&mv643xx_eth_shared_driver);
3037 }
3038 module_exit(mv643xx_eth_cleanup_module);
3039
3040 MODULE_AUTHOR("Rabeeh Khoury, Assaf Hoffman, Matthew Dharm, "
3041               "Manish Lachwani, Dale Farnsworth and Lennert Buytenhek");
3042 MODULE_DESCRIPTION("Ethernet driver for Marvell MV643XX");
3043 MODULE_LICENSE("GPL");
3044 MODULE_ALIAS("platform:" MV643XX_ETH_SHARED_NAME);
3045 MODULE_ALIAS("platform:" MV643XX_ETH_NAME);