RDMA/nes: Fix hang issues for large cluster dynamic connections
authorFaisal Latif <faisal.latif@intel.com>
Mon, 27 Apr 2009 20:41:06 +0000 (13:41 -0700)
committerRoland Dreier <rolandd@cisco.com>
Mon, 27 Apr 2009 20:41:06 +0000 (13:41 -0700)
commit109d67e4f12b828113ca8ccf4a735972dd984f40
tree44b21f18ea6cb05ec6411b4ec00028152f4f1c5d
parent4e9c390036196f89208cf9574dfd19daae146776
RDMA/nes: Fix hang issues for large cluster dynamic connections

Running large cluster setup, we are hanging after many hours of
testing.  Fixing this required going over the code and making sure the
rexmit entry was properly removed based on the cm_node's state and
packet received.  Also when receiving a FIN packet, check seq# and
make sure there were no errors before calling handle_fin().

Following are the changes done in nes_cm.c:

* handle_ack_pkt() needs to return error value, so in case of error,
  handle_fin() is not called. Some cleanup done while going over the code.

* handle_rst_pkt(), handling of cm_node's NES_CM_STATE_LAST_ACK is missing.

* process_packet(), in case of FIN only packet is received, call
  check_seq() before processing.

* in handle_fin_pkt(), we are calling cleanup_retrans_entry() for all
  conditions, even if the packets need to be dropped.

Signed-off-by: Faisal Latif <faisal.latif@intel.com>
Signed-off-by: Roland Dreier <rolandd@cisco.com>
drivers/infiniband/hw/nes/nes_cm.c