2  * Copyright (c) 2007 Mellanox Technologies. All rights reserved.
 
   4  * This software is available to you under a choice of one of two
 
   5  * licenses.  You may choose to be licensed under the terms of the GNU
 
   6  * General Public License (GPL) Version 2, available from the file
 
   7  * COPYING in the main directory of this source tree, or the
 
   8  * OpenIB.org BSD license below:
 
  10  *     Redistribution and use in source and binary forms, with or
 
  11  *     without modification, are permitted provided that the following
 
  14  *      - Redistributions of source code must retain the above
 
  15  *        copyright notice, this list of conditions and the following
 
  18  *      - Redistributions in binary form must reproduce the above
 
  19  *        copyright notice, this list of conditions and the following
 
  20  *        disclaimer in the documentation and/or other materials
 
  21  *        provided with the distribution.
 
  23  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
 
  24  * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
 
  25  * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
 
  26  * NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS
 
  27  * BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
 
  28  * ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN
 
  29  * CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
 
  37 #include <linux/compiler.h>
 
  38 #include <linux/list.h>
 
  39 #include <linux/mutex.h>
 
  40 #include <linux/netdevice.h>
 
  41 #include <linux/inet_lro.h>
 
  43 #include <linux/mlx4/device.h>
 
  44 #include <linux/mlx4/qp.h>
 
  45 #include <linux/mlx4/cq.h>
 
  46 #include <linux/mlx4/srq.h>
 
  47 #include <linux/mlx4/doorbell.h>
 
  51 #define DRV_NAME        "mlx4_en"
 
  52 #define DRV_VERSION     "1.4.0"
 
  53 #define DRV_RELDATE     "Sep 2008"
 
  56 #define MLX4_EN_MSG_LEVEL       (NETIF_MSG_LINK | NETIF_MSG_IFDOWN)
 
  58 #define mlx4_dbg(mlevel, priv, format, arg...)  \
 
  59         if (NETIF_MSG_##mlevel & priv->msg_enable) \
 
  60         printk(KERN_DEBUG "%s %s: " format , DRV_NAME ,\
 
  61                 (dev_name(&priv->mdev->pdev->dev)) , ## arg)
 
  63 #define mlx4_err(mdev, format, arg...) \
 
  64         printk(KERN_ERR "%s %s: " format , DRV_NAME ,\
 
  65                 (dev_name(&mdev->pdev->dev)) , ## arg)
 
  66 #define mlx4_info(mdev, format, arg...) \
 
  67         printk(KERN_INFO "%s %s: " format , DRV_NAME ,\
 
  68                 (dev_name(&mdev->pdev->dev)) , ## arg)
 
  69 #define mlx4_warn(mdev, format, arg...) \
 
  70         printk(KERN_WARNING "%s %s: " format , DRV_NAME ,\
 
  71                 (dev_name(&mdev->pdev->dev)) , ## arg)
 
  78 #define MLX4_EN_PAGE_SHIFT      12
 
  79 #define MLX4_EN_PAGE_SIZE       (1 << MLX4_EN_PAGE_SHIFT)
 
  80 #define MAX_TX_RINGS            16
 
  81 #define MAX_RX_RINGS            16
 
  82 #define MAX_RSS_MAP_SIZE        64
 
  85 #define HEADROOM                (2048 / TXBB_SIZE + 1)
 
  86 #define MAX_LSO_HDR_SIZE        92
 
  87 #define STAMP_STRIDE            64
 
  88 #define STAMP_DWORDS            (STAMP_STRIDE / 4)
 
  89 #define STAMP_SHIFT             31
 
  90 #define STAMP_VAL               0x7fffffff
 
  91 #define STATS_DELAY             (HZ / 4)
 
  93 /* Typical TSO descriptor with 16 gather entries is 352 bytes... */
 
  94 #define MAX_DESC_SIZE           512
 
  95 #define MAX_DESC_TXBBS          (MAX_DESC_SIZE / TXBB_SIZE)
 
  98  * OS related constants and tunables
 
 101 #define MLX4_EN_WATCHDOG_TIMEOUT        (15 * HZ)
 
 103 #define MLX4_EN_ALLOC_ORDER     2
 
 104 #define MLX4_EN_ALLOC_SIZE      (PAGE_SIZE << MLX4_EN_ALLOC_ORDER)
 
 106 #define MLX4_EN_MAX_LRO_DESCRIPTORS     32
 
 108 /* Receive fragment sizes; we use at most 4 fragments (for 9600 byte MTU
 
 109  * and 4K allocations) */
 
 111         FRAG_SZ0 = 512 - NET_IP_ALIGN,
 
 114         FRAG_SZ3 = MLX4_EN_ALLOC_SIZE
 
 116 #define MLX4_EN_MAX_RX_FRAGS    4
 
 118 /* Maximum ring sizes */
 
 119 #define MLX4_EN_MAX_TX_SIZE     8192
 
 120 #define MLX4_EN_MAX_RX_SIZE     8192
 
 122 /* Minimum ring size for our page-allocation sceme to work */
 
 123 #define MLX4_EN_MIN_RX_SIZE     (MLX4_EN_ALLOC_SIZE / SMP_CACHE_BYTES)
 
 124 #define MLX4_EN_MIN_TX_SIZE     (4096 / TXBB_SIZE)
 
 126 #define MLX4_EN_TX_RING_NUM             9
 
 127 #define MLX4_EN_DEF_TX_RING_SIZE        1024
 
 128 #define MLX4_EN_DEF_RX_RING_SIZE        1024
 
 130 /* Target number of bytes to coalesce with interrupt moderation */
 
 131 #define MLX4_EN_RX_COAL_TARGET  0x20000
 
 132 #define MLX4_EN_RX_COAL_TIME    0x10
 
 134 #define MLX4_EN_TX_COAL_PKTS    5
 
 135 #define MLX4_EN_TX_COAL_TIME    0x80
 
 137 #define MLX4_EN_RX_RATE_LOW             400000
 
 138 #define MLX4_EN_RX_COAL_TIME_LOW        0
 
 139 #define MLX4_EN_RX_RATE_HIGH            450000
 
 140 #define MLX4_EN_RX_COAL_TIME_HIGH       128
 
 141 #define MLX4_EN_RX_SIZE_THRESH          1024
 
 142 #define MLX4_EN_RX_RATE_THRESH          (1000000 / MLX4_EN_RX_COAL_TIME_HIGH)
 
 143 #define MLX4_EN_SAMPLE_INTERVAL         0
 
 145 #define MLX4_EN_AUTO_CONF       0xffff
 
 147 #define MLX4_EN_DEF_RX_PAUSE    1
 
 148 #define MLX4_EN_DEF_TX_PAUSE    1
 
 150 /* Interval between sucessive polls in the Tx routine when polling is used
 
 151    instead of interrupts (in per-core Tx rings) - should be power of 2 */
 
 152 #define MLX4_EN_TX_POLL_MODER   16
 
 153 #define MLX4_EN_TX_POLL_TIMEOUT (HZ / 4)
 
 155 #define ETH_LLC_SNAP_SIZE       8
 
 157 #define SMALL_PACKET_SIZE      (256 - NET_IP_ALIGN)
 
 158 #define HEADER_COPY_SIZE       (128 - NET_IP_ALIGN)
 
 160 #define MLX4_EN_MIN_MTU         46
 
 161 #define ETH_BCAST               0xffffffffffffULL
 
 163 #ifdef MLX4_EN_PERF_STAT
 
 164 /* Number of samples to 'average' */
 
 166 #define AVG_FACTOR                      1024
 
 167 #define NUM_PERF_STATS                  NUM_PERF_COUNTERS
 
 169 #define INC_PERF_COUNTER(cnt)           (++(cnt))
 
 170 #define ADD_PERF_COUNTER(cnt, add)      ((cnt) += (add))
 
 171 #define AVG_PERF_COUNTER(cnt, sample) \
 
 172         ((cnt) = ((cnt) * (AVG_SIZE - 1) + (sample) * AVG_FACTOR) / AVG_SIZE)
 
 173 #define GET_PERF_COUNTER(cnt)           (cnt)
 
 174 #define GET_AVG_PERF_COUNTER(cnt)       ((cnt) / AVG_FACTOR)
 
 178 #define NUM_PERF_STATS                  0
 
 179 #define INC_PERF_COUNTER(cnt)           do {} while (0)
 
 180 #define ADD_PERF_COUNTER(cnt, add)      do {} while (0)
 
 181 #define AVG_PERF_COUNTER(cnt, sample)   do {} while (0)
 
 182 #define GET_PERF_COUNTER(cnt)           (0)
 
 183 #define GET_AVG_PERF_COUNTER(cnt)       (0)
 
 184 #endif /* MLX4_EN_PERF_STAT */
 
 199 #define ROUNDUP_LOG2(x)         ilog2(roundup_pow_of_two(x))
 
 200 #define XNOR(x, y)              (!(x) == !(y))
 
 201 #define ILLEGAL_MAC(addr)       (addr == 0xffffffffffffULL || addr == 0x0)
 
 204 struct mlx4_en_tx_info {
 
 213 #define MLX4_EN_BIT_DESC_OWN    0x80000000
 
 214 #define CTRL_SIZE       sizeof(struct mlx4_wqe_ctrl_seg)
 
 215 #define MLX4_EN_MEMTYPE_PAD     0x100
 
 216 #define DS_SIZE         sizeof(struct mlx4_wqe_data_seg)
 
 219 struct mlx4_en_tx_desc {
 
 220         struct mlx4_wqe_ctrl_seg ctrl;
 
 222                 struct mlx4_wqe_data_seg data; /* at least one data segment */
 
 223                 struct mlx4_wqe_lso_seg lso;
 
 224                 struct mlx4_wqe_inline_seg inl;
 
 228 #define MLX4_EN_USE_SRQ         0x01000000
 
 230 struct mlx4_en_rx_alloc {
 
 235 struct mlx4_en_tx_ring {
 
 236         struct mlx4_hwq_resources wqres;
 
 237         u32 size ; /* number of TXBBs */
 
 240         u16 cqn;        /* index of port CQ associated with this ring */
 
 248         struct mlx4_en_tx_info *tx_info;
 
 252         struct mlx4_qp_context context;
 
 254         enum mlx4_qp_state qp_state;
 
 255         struct mlx4_srq dummy;
 
 257         unsigned long packets;
 
 258         spinlock_t comp_lock;
 
 261 struct mlx4_en_rx_desc {
 
 262         struct mlx4_wqe_srq_next_seg next;
 
 263         /* actual number of entries depends on rx ring stride */
 
 264         struct mlx4_wqe_data_seg data[0];
 
 267 struct mlx4_en_rx_ring {
 
 269         struct mlx4_hwq_resources wqres;
 
 270         struct mlx4_en_rx_alloc page_alloc[MLX4_EN_MAX_RX_FRAGS];
 
 271         struct net_lro_mgr lro;
 
 272         u32 size ;      /* number of Rx descs*/
 
 277         u16 cqn;        /* index of port CQ associated with this ring */
 
 286         unsigned long packets;
 
 290 static inline int mlx4_en_can_lro(__be16 status)
 
 292         return (status & cpu_to_be16(MLX4_CQE_STATUS_IPV4       |
 
 293                                      MLX4_CQE_STATUS_IPV4F      |
 
 294                                      MLX4_CQE_STATUS_IPV6       |
 
 295                                      MLX4_CQE_STATUS_IPV4OPT    |
 
 296                                      MLX4_CQE_STATUS_TCP        |
 
 297                                      MLX4_CQE_STATUS_UDP        |
 
 298                                      MLX4_CQE_STATUS_IPOK)) ==
 
 299                 cpu_to_be16(MLX4_CQE_STATUS_IPV4 |
 
 300                             MLX4_CQE_STATUS_IPOK |
 
 301                             MLX4_CQE_STATUS_TCP);
 
 306         struct mlx4_hwq_resources wqres;
 
 309         struct net_device      *dev;
 
 310         struct napi_struct      napi;
 
 311         /* Per-core Tx cq processing support */
 
 312         struct timer_list timer;
 
 319         struct mlx4_cqe *buf;
 
 320 #define MLX4_EN_OPCODE_ERROR    0x1e
 
 323 struct mlx4_en_port_profile {
 
 335 struct mlx4_en_profile {
 
 342         struct mlx4_en_port_profile prof[MLX4_MAX_PORTS + 1];
 
 346         struct mlx4_dev         *dev;
 
 347         struct pci_dev          *pdev;
 
 348         struct mutex            state_lock;
 
 349         struct net_device       *pndev[MLX4_MAX_PORTS + 1];
 
 352         struct mlx4_en_profile  profile;
 
 354         struct workqueue_struct *workqueue;
 
 355         struct device           *dma_device;
 
 356         void __iomem            *uar_map;
 
 357         struct mlx4_uar         priv_uar;
 
 364 struct mlx4_en_rss_map {
 
 367         u16 map[MAX_RSS_MAP_SIZE];
 
 368         struct mlx4_qp qps[MAX_RSS_MAP_SIZE];
 
 369         enum mlx4_qp_state state[MAX_RSS_MAP_SIZE];
 
 370         struct mlx4_qp indir_qp;
 
 371         enum mlx4_qp_state indir_state;
 
 374 struct mlx4_en_rss_context {
 
 383 struct mlx4_en_pkt_stats {
 
 384         unsigned long broadcast;
 
 385         unsigned long rx_prio[8];
 
 386         unsigned long tx_prio[8];
 
 387 #define NUM_PKT_STATS           17
 
 390 struct mlx4_en_port_stats {
 
 391         unsigned long lro_aggregated;
 
 392         unsigned long lro_flushed;
 
 393         unsigned long lro_no_desc;
 
 394         unsigned long tso_packets;
 
 395         unsigned long queue_stopped;
 
 396         unsigned long wake_queue;
 
 397         unsigned long tx_timeout;
 
 398         unsigned long rx_alloc_failed;
 
 399         unsigned long rx_chksum_good;
 
 400         unsigned long rx_chksum_none;
 
 401         unsigned long tx_chksum_offload;
 
 402 #define NUM_PORT_STATS          11
 
 405 struct mlx4_en_perf_stats {
 
 412 #define NUM_PERF_COUNTERS               6
 
 415 struct mlx4_en_frag_info {
 
 417         u16 frag_prefix_size;
 
 424 struct mlx4_en_priv {
 
 425         struct mlx4_en_dev *mdev;
 
 426         struct mlx4_en_port_profile *prof;
 
 427         struct net_device *dev;
 
 428         struct vlan_group *vlgrp;
 
 429         struct net_device_stats stats;
 
 430         struct net_device_stats ret_stats;
 
 431         spinlock_t stats_lock;
 
 433         unsigned long last_moder_packets;
 
 434         unsigned long last_moder_tx_packets;
 
 435         unsigned long last_moder_bytes;
 
 436         unsigned long last_moder_jiffies;
 
 447         u16 adaptive_rx_coal;
 
 450         struct mlx4_hwq_resources res;
 
 464         struct mlx4_en_rss_map rss_map;
 
 467 #define MLX4_EN_FLAG_PROMISC    0x1
 
 471         struct mlx4_en_frag_info frag_info[MLX4_EN_MAX_RX_FRAGS];
 
 475         struct mlx4_en_tx_ring tx_ring[MAX_TX_RINGS];
 
 476         struct mlx4_en_rx_ring rx_ring[MAX_RX_RINGS];
 
 477         struct mlx4_en_cq tx_cq[MAX_TX_RINGS];
 
 478         struct mlx4_en_cq rx_cq[MAX_RX_RINGS];
 
 479         struct work_struct mcast_task;
 
 480         struct work_struct mac_task;
 
 481         struct delayed_work refill_task;
 
 482         struct work_struct watchdog_task;
 
 483         struct work_struct linkstate_task;
 
 484         struct delayed_work stats_task;
 
 485         struct mlx4_en_perf_stats pstats;
 
 486         struct mlx4_en_pkt_stats pkstats;
 
 487         struct mlx4_en_port_stats port_stats;
 
 488         struct dev_mc_list *mc_list;
 
 489         struct mlx4_en_stat_out_mbox hw_stats;
 
 493 void mlx4_en_destroy_netdev(struct net_device *dev);
 
 494 int mlx4_en_init_netdev(struct mlx4_en_dev *mdev, int port,
 
 495                         struct mlx4_en_port_profile *prof);
 
 497 int mlx4_en_start_port(struct net_device *dev);
 
 498 void mlx4_en_stop_port(struct net_device *dev);
 
 500 void mlx4_en_free_resources(struct mlx4_en_priv *priv);
 
 501 int mlx4_en_alloc_resources(struct mlx4_en_priv *priv);
 
 503 int mlx4_en_get_profile(struct mlx4_en_dev *mdev);
 
 505 int mlx4_en_create_cq(struct mlx4_en_priv *priv, struct mlx4_en_cq *cq,
 
 506                       int entries, int ring, enum cq_type mode);
 
 507 void mlx4_en_destroy_cq(struct mlx4_en_priv *priv, struct mlx4_en_cq *cq);
 
 508 int mlx4_en_activate_cq(struct mlx4_en_priv *priv, struct mlx4_en_cq *cq);
 
 509 void mlx4_en_deactivate_cq(struct mlx4_en_priv *priv, struct mlx4_en_cq *cq);
 
 510 int mlx4_en_set_cq_moder(struct mlx4_en_priv *priv, struct mlx4_en_cq *cq);
 
 511 int mlx4_en_arm_cq(struct mlx4_en_priv *priv, struct mlx4_en_cq *cq);
 
 513 void mlx4_en_poll_tx_cq(unsigned long data);
 
 514 void mlx4_en_tx_irq(struct mlx4_cq *mcq);
 
 515 int mlx4_en_xmit(struct sk_buff *skb, struct net_device *dev);
 
 517 int mlx4_en_create_tx_ring(struct mlx4_en_priv *priv, struct mlx4_en_tx_ring *ring,
 
 518                            u32 size, u16 stride);
 
 519 void mlx4_en_destroy_tx_ring(struct mlx4_en_priv *priv, struct mlx4_en_tx_ring *ring);
 
 520 int mlx4_en_activate_tx_ring(struct mlx4_en_priv *priv,
 
 521                              struct mlx4_en_tx_ring *ring,
 
 523 void mlx4_en_deactivate_tx_ring(struct mlx4_en_priv *priv,
 
 524                                 struct mlx4_en_tx_ring *ring);
 
 526 int mlx4_en_create_rx_ring(struct mlx4_en_priv *priv,
 
 527                            struct mlx4_en_rx_ring *ring,
 
 528                            u32 size, u16 stride);
 
 529 void mlx4_en_destroy_rx_ring(struct mlx4_en_priv *priv,
 
 530                              struct mlx4_en_rx_ring *ring);
 
 531 int mlx4_en_activate_rx_rings(struct mlx4_en_priv *priv);
 
 532 void mlx4_en_deactivate_rx_ring(struct mlx4_en_priv *priv,
 
 533                                 struct mlx4_en_rx_ring *ring);
 
 534 int mlx4_en_process_rx_cq(struct net_device *dev,
 
 535                           struct mlx4_en_cq *cq,
 
 537 int mlx4_en_poll_rx_cq(struct napi_struct *napi, int budget);
 
 538 void mlx4_en_fill_qp_context(struct mlx4_en_priv *priv, int size, int stride,
 
 539                              int is_tx, int rss, int qpn, int cqn, int srqn,
 
 540                              struct mlx4_qp_context *context);
 
 541 int mlx4_en_map_buffer(struct mlx4_buf *buf);
 
 542 void mlx4_en_unmap_buffer(struct mlx4_buf *buf);
 
 544 void mlx4_en_calc_rx_buf(struct net_device *dev);
 
 545 void mlx4_en_set_default_rss_map(struct mlx4_en_priv *priv,
 
 546                                  struct mlx4_en_rss_map *rss_map,
 
 547                                  int num_entries, int num_rings);
 
 548 void mlx4_en_set_prio_map(struct mlx4_en_priv *priv, u16 *prio_map, u32 ring_num);
 
 549 int mlx4_en_config_rss_steer(struct mlx4_en_priv *priv);
 
 550 void mlx4_en_release_rss_steer(struct mlx4_en_priv *priv);
 
 551 int mlx4_en_free_tx_buf(struct net_device *dev, struct mlx4_en_tx_ring *ring);
 
 552 void mlx4_en_rx_refill(struct work_struct *work);
 
 553 void mlx4_en_rx_irq(struct mlx4_cq *mcq);
 
 555 int mlx4_SET_MCAST_FLTR(struct mlx4_dev *dev, u8 port, u64 mac, u64 clear, u8 mode);
 
 556 int mlx4_SET_VLAN_FLTR(struct mlx4_dev *dev, u8 port, struct vlan_group *grp);
 
 557 int mlx4_SET_PORT_general(struct mlx4_dev *dev, u8 port, int mtu,
 
 558                           u8 pptx, u8 pfctx, u8 pprx, u8 pfcrx);
 
 559 int mlx4_SET_PORT_qpn_calc(struct mlx4_dev *dev, u8 port, u32 base_qpn,
 
 562 int mlx4_en_DUMP_ETH_STATS(struct mlx4_en_dev *mdev, u8 port, u8 reset);
 
 567 extern const struct ethtool_ops mlx4_en_ethtool_ops;