Merge master.kernel.org:/home/rmk/linux-2.6-serial
[linux-2.6] / net / sctp / associola.c
1 /* SCTP kernel reference Implementation
2  * (C) Copyright IBM Corp. 2001, 2004
3  * Copyright (c) 1999-2000 Cisco, Inc.
4  * Copyright (c) 1999-2001 Motorola, Inc.
5  * Copyright (c) 2001 Intel Corp.
6  * Copyright (c) 2001 La Monte H.P. Yarroll
7  *
8  * This file is part of the SCTP kernel reference Implementation
9  *
10  * This module provides the abstraction for an SCTP association.
11  *
12  * The SCTP reference implementation is free software;
13  * you can redistribute it and/or modify it under the terms of
14  * the GNU General Public License as published by
15  * the Free Software Foundation; either version 2, or (at your option)
16  * any later version.
17  *
18  * The SCTP reference implementation is distributed in the hope that it
19  * will be useful, but WITHOUT ANY WARRANTY; without even the implied
20  *                 ************************
21  * warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
22  * See the GNU General Public License for more details.
23  *
24  * You should have received a copy of the GNU General Public License
25  * along with GNU CC; see the file COPYING.  If not, write to
26  * the Free Software Foundation, 59 Temple Place - Suite 330,
27  * Boston, MA 02111-1307, USA.
28  *
29  * Please send any bug reports or fixes you make to the
30  * email address(es):
31  *    lksctp developers <lksctp-developers@lists.sourceforge.net>
32  *
33  * Or submit a bug report through the following website:
34  *    http://www.sf.net/projects/lksctp
35  *
36  * Written or modified by:
37  *    La Monte H.P. Yarroll <piggy@acm.org>
38  *    Karl Knutson          <karl@athena.chicago.il.us>
39  *    Jon Grimm             <jgrimm@us.ibm.com>
40  *    Xingang Guo           <xingang.guo@intel.com>
41  *    Hui Huang             <hui.huang@nokia.com>
42  *    Sridhar Samudrala     <sri@us.ibm.com>
43  *    Daisy Chang           <daisyc@us.ibm.com>
44  *    Ryan Layer            <rmlayer@us.ibm.com>
45  *    Kevin Gao             <kevin.gao@intel.com>
46  *
47  * Any bugs reported given to us we will try to fix... any fixes shared will
48  * be incorporated into the next SCTP release.
49  */
50
51 #include <linux/types.h>
52 #include <linux/fcntl.h>
53 #include <linux/poll.h>
54 #include <linux/init.h>
55 #include <linux/sched.h>
56
57 #include <linux/slab.h>
58 #include <linux/in.h>
59 #include <net/ipv6.h>
60 #include <net/sctp/sctp.h>
61 #include <net/sctp/sm.h>
62
63 /* Forward declarations for internal functions. */
64 static void sctp_assoc_bh_rcv(struct sctp_association *asoc);
65
66
67 /* 1st Level Abstractions. */
68
69 /* Initialize a new association from provided memory. */
70 static struct sctp_association *sctp_association_init(struct sctp_association *asoc,
71                                           const struct sctp_endpoint *ep,
72                                           const struct sock *sk,
73                                           sctp_scope_t scope,
74                                           gfp_t gfp)
75 {
76         struct sctp_sock *sp;
77         int i;
78
79         /* Retrieve the SCTP per socket area.  */
80         sp = sctp_sk((struct sock *)sk);
81
82         /* Init all variables to a known value.  */
83         memset(asoc, 0, sizeof(struct sctp_association));
84
85         /* Discarding const is appropriate here.  */
86         asoc->ep = (struct sctp_endpoint *)ep;
87         sctp_endpoint_hold(asoc->ep);
88
89         /* Hold the sock.  */
90         asoc->base.sk = (struct sock *)sk;
91         sock_hold(asoc->base.sk);
92
93         /* Initialize the common base substructure.  */
94         asoc->base.type = SCTP_EP_TYPE_ASSOCIATION;
95
96         /* Initialize the object handling fields.  */
97         atomic_set(&asoc->base.refcnt, 1);
98         asoc->base.dead = 0;
99         asoc->base.malloced = 0;
100
101         /* Initialize the bind addr area.  */
102         sctp_bind_addr_init(&asoc->base.bind_addr, ep->base.bind_addr.port);
103         rwlock_init(&asoc->base.addr_lock);
104
105         asoc->state = SCTP_STATE_CLOSED;
106
107         /* Set these values from the socket values, a conversion between
108          * millsecons to seconds/microseconds must also be done.
109          */
110         asoc->cookie_life.tv_sec = sp->assocparams.sasoc_cookie_life / 1000;
111         asoc->cookie_life.tv_usec = (sp->assocparams.sasoc_cookie_life % 1000)
112                                         * 1000;
113         asoc->pmtu = 0;
114         asoc->frag_point = 0;
115
116         /* Set the association max_retrans and RTO values from the
117          * socket values.
118          */
119         asoc->max_retrans = sp->assocparams.sasoc_asocmaxrxt;
120         asoc->rto_initial = msecs_to_jiffies(sp->rtoinfo.srto_initial);
121         asoc->rto_max = msecs_to_jiffies(sp->rtoinfo.srto_max);
122         asoc->rto_min = msecs_to_jiffies(sp->rtoinfo.srto_min);
123
124         asoc->overall_error_count = 0;
125
126         /* Initialize the maximum mumber of new data packets that can be sent
127          * in a burst.
128          */
129         asoc->max_burst = sctp_max_burst;
130
131         /* Copy things from the endpoint.  */
132         for (i = SCTP_EVENT_TIMEOUT_NONE; i < SCTP_NUM_TIMEOUT_TYPES; ++i) {
133                 asoc->timeouts[i] = ep->timeouts[i];
134                 init_timer(&asoc->timers[i]);
135                 asoc->timers[i].function = sctp_timer_events[i];
136                 asoc->timers[i].data = (unsigned long) asoc;
137         }
138
139         /* Pull default initialization values from the sock options.
140          * Note: This assumes that the values have already been
141          * validated in the sock.
142          */
143         asoc->c.sinit_max_instreams = sp->initmsg.sinit_max_instreams;
144         asoc->c.sinit_num_ostreams  = sp->initmsg.sinit_num_ostreams;
145         asoc->max_init_attempts = sp->initmsg.sinit_max_attempts;
146
147         asoc->max_init_timeo =
148                  msecs_to_jiffies(sp->initmsg.sinit_max_init_timeo);
149
150         /* Allocate storage for the ssnmap after the inbound and outbound
151          * streams have been negotiated during Init.
152          */
153         asoc->ssnmap = NULL;
154
155         /* Set the local window size for receive.
156          * This is also the rcvbuf space per association.
157          * RFC 6 - A SCTP receiver MUST be able to receive a minimum of
158          * 1500 bytes in one SCTP packet.
159          */
160         if (sk->sk_rcvbuf < SCTP_DEFAULT_MINWINDOW)
161                 asoc->rwnd = SCTP_DEFAULT_MINWINDOW;
162         else
163                 asoc->rwnd = sk->sk_rcvbuf;
164
165         asoc->a_rwnd = asoc->rwnd;
166
167         asoc->rwnd_over = 0;
168
169         /* Use my own max window until I learn something better.  */
170         asoc->peer.rwnd = SCTP_DEFAULT_MAXWINDOW;
171
172         /* Set the sndbuf size for transmit.  */
173         asoc->sndbuf_used = 0;
174
175         init_waitqueue_head(&asoc->wait);
176
177         asoc->c.my_vtag = sctp_generate_tag(ep);
178         asoc->peer.i.init_tag = 0;     /* INIT needs a vtag of 0. */
179         asoc->c.peer_vtag = 0;
180         asoc->c.my_ttag   = 0;
181         asoc->c.peer_ttag = 0;
182         asoc->c.my_port = ep->base.bind_addr.port;
183
184         asoc->c.initial_tsn = sctp_generate_tsn(ep);
185
186         asoc->next_tsn = asoc->c.initial_tsn;
187
188         asoc->ctsn_ack_point = asoc->next_tsn - 1;
189         asoc->adv_peer_ack_point = asoc->ctsn_ack_point;
190         asoc->highest_sacked = asoc->ctsn_ack_point;
191         asoc->last_cwr_tsn = asoc->ctsn_ack_point;
192         asoc->unack_data = 0;
193
194         /* ADDIP Section 4.1 Asconf Chunk Procedures
195          *
196          * When an endpoint has an ASCONF signaled change to be sent to the
197          * remote endpoint it should do the following:
198          * ...
199          * A2) a serial number should be assigned to the chunk. The serial
200          * number SHOULD be a monotonically increasing number. The serial
201          * numbers SHOULD be initialized at the start of the
202          * association to the same value as the initial TSN.
203          */
204         asoc->addip_serial = asoc->c.initial_tsn;
205
206         INIT_LIST_HEAD(&asoc->addip_chunk_list);
207
208         /* Make an empty list of remote transport addresses.  */
209         INIT_LIST_HEAD(&asoc->peer.transport_addr_list);
210         asoc->peer.transport_count = 0;
211
212         /* RFC 2960 5.1 Normal Establishment of an Association
213          *
214          * After the reception of the first data chunk in an
215          * association the endpoint must immediately respond with a
216          * sack to acknowledge the data chunk.  Subsequent
217          * acknowledgements should be done as described in Section
218          * 6.2.
219          *
220          * [We implement this by telling a new association that it
221          * already received one packet.]
222          */
223         asoc->peer.sack_needed = 1;
224
225         /* Assume that the peer recongizes ASCONF until reported otherwise
226          * via an ERROR chunk.
227          */
228         asoc->peer.asconf_capable = 1;
229
230         /* Create an input queue.  */
231         sctp_inq_init(&asoc->base.inqueue);
232         sctp_inq_set_th_handler(&asoc->base.inqueue,
233                                     (void (*)(void *))sctp_assoc_bh_rcv,
234                                     asoc);
235
236         /* Create an output queue.  */
237         sctp_outq_init(asoc, &asoc->outqueue);
238
239         if (!sctp_ulpq_init(&asoc->ulpq, asoc))
240                 goto fail_init;
241
242         /* Set up the tsn tracking. */
243         sctp_tsnmap_init(&asoc->peer.tsn_map, SCTP_TSN_MAP_SIZE, 0);
244
245         asoc->need_ecne = 0;
246
247         asoc->assoc_id = 0;
248
249         /* Assume that peer would support both address types unless we are
250          * told otherwise.
251          */
252         asoc->peer.ipv4_address = 1;
253         asoc->peer.ipv6_address = 1;
254         INIT_LIST_HEAD(&asoc->asocs);
255
256         asoc->autoclose = sp->autoclose;
257
258         asoc->default_stream = sp->default_stream;
259         asoc->default_ppid = sp->default_ppid;
260         asoc->default_flags = sp->default_flags;
261         asoc->default_context = sp->default_context;
262         asoc->default_timetolive = sp->default_timetolive;
263
264         return asoc;
265
266 fail_init:
267         sctp_endpoint_put(asoc->ep);
268         sock_put(asoc->base.sk);
269         return NULL;
270 }
271
272 /* Allocate and initialize a new association */
273 struct sctp_association *sctp_association_new(const struct sctp_endpoint *ep,
274                                          const struct sock *sk,
275                                          sctp_scope_t scope,
276                                          gfp_t gfp)
277 {
278         struct sctp_association *asoc;
279
280         asoc = t_new(struct sctp_association, gfp);
281         if (!asoc)
282                 goto fail;
283
284         if (!sctp_association_init(asoc, ep, sk, scope, gfp))
285                 goto fail_init;
286
287         asoc->base.malloced = 1;
288         SCTP_DBG_OBJCNT_INC(assoc);
289         SCTP_DEBUG_PRINTK("Created asoc %p\n", asoc);
290
291         return asoc;
292
293 fail_init:
294         kfree(asoc);
295 fail:
296         return NULL;
297 }
298
299 /* Free this association if possible.  There may still be users, so
300  * the actual deallocation may be delayed.
301  */
302 void sctp_association_free(struct sctp_association *asoc)
303 {
304         struct sock *sk = asoc->base.sk;
305         struct sctp_transport *transport;
306         struct list_head *pos, *temp;
307         int i;
308
309         list_del(&asoc->asocs);
310
311         /* Decrement the backlog value for a TCP-style listening socket. */
312         if (sctp_style(sk, TCP) && sctp_sstate(sk, LISTENING))
313                 sk->sk_ack_backlog--;
314
315         /* Mark as dead, so other users can know this structure is
316          * going away.
317          */
318         asoc->base.dead = 1;
319
320         /* Dispose of any data lying around in the outqueue. */
321         sctp_outq_free(&asoc->outqueue);
322
323         /* Dispose of any pending messages for the upper layer. */
324         sctp_ulpq_free(&asoc->ulpq);
325
326         /* Dispose of any pending chunks on the inqueue. */
327         sctp_inq_free(&asoc->base.inqueue);
328
329         /* Free ssnmap storage. */
330         sctp_ssnmap_free(asoc->ssnmap);
331
332         /* Clean up the bound address list. */
333         sctp_bind_addr_free(&asoc->base.bind_addr);
334
335         /* Do we need to go through all of our timers and
336          * delete them?   To be safe we will try to delete all, but we
337          * should be able to go through and make a guess based
338          * on our state.
339          */
340         for (i = SCTP_EVENT_TIMEOUT_NONE; i < SCTP_NUM_TIMEOUT_TYPES; ++i) {
341                 if (timer_pending(&asoc->timers[i]) &&
342                     del_timer(&asoc->timers[i]))
343                         sctp_association_put(asoc);
344         }
345
346         /* Free peer's cached cookie. */
347         kfree(asoc->peer.cookie);
348
349         /* Release the transport structures. */
350         list_for_each_safe(pos, temp, &asoc->peer.transport_addr_list) {
351                 transport = list_entry(pos, struct sctp_transport, transports);
352                 list_del(pos);
353                 sctp_transport_free(transport);
354         }
355
356         asoc->peer.transport_count = 0;
357
358         /* Free any cached ASCONF_ACK chunk. */
359         if (asoc->addip_last_asconf_ack)
360                 sctp_chunk_free(asoc->addip_last_asconf_ack);
361
362         /* Free any cached ASCONF chunk. */
363         if (asoc->addip_last_asconf)
364                 sctp_chunk_free(asoc->addip_last_asconf);
365
366         sctp_association_put(asoc);
367 }
368
369 /* Cleanup and free up an association. */
370 static void sctp_association_destroy(struct sctp_association *asoc)
371 {
372         SCTP_ASSERT(asoc->base.dead, "Assoc is not dead", return);
373
374         sctp_endpoint_put(asoc->ep);
375         sock_put(asoc->base.sk);
376
377         if (asoc->assoc_id != 0) {
378                 spin_lock_bh(&sctp_assocs_id_lock);
379                 idr_remove(&sctp_assocs_id, asoc->assoc_id);
380                 spin_unlock_bh(&sctp_assocs_id_lock);
381         }
382
383         if (asoc->base.malloced) {
384                 kfree(asoc);
385                 SCTP_DBG_OBJCNT_DEC(assoc);
386         }
387 }
388
389 /* Change the primary destination address for the peer. */
390 void sctp_assoc_set_primary(struct sctp_association *asoc,
391                             struct sctp_transport *transport)
392 {
393         asoc->peer.primary_path = transport;
394
395         /* Set a default msg_name for events. */
396         memcpy(&asoc->peer.primary_addr, &transport->ipaddr,
397                sizeof(union sctp_addr));
398
399         /* If the primary path is changing, assume that the
400          * user wants to use this new path.
401          */
402         if (transport->state != SCTP_INACTIVE)
403                 asoc->peer.active_path = transport;
404
405         /*
406          * SFR-CACC algorithm:
407          * Upon the receipt of a request to change the primary
408          * destination address, on the data structure for the new
409          * primary destination, the sender MUST do the following:
410          *
411          * 1) If CHANGEOVER_ACTIVE is set, then there was a switch
412          * to this destination address earlier. The sender MUST set
413          * CYCLING_CHANGEOVER to indicate that this switch is a
414          * double switch to the same destination address.
415          */
416         if (transport->cacc.changeover_active)
417                 transport->cacc.cycling_changeover = 1;
418
419         /* 2) The sender MUST set CHANGEOVER_ACTIVE to indicate that
420          * a changeover has occurred.
421          */
422         transport->cacc.changeover_active = 1;
423
424         /* 3) The sender MUST store the next TSN to be sent in
425          * next_tsn_at_change.
426          */
427         transport->cacc.next_tsn_at_change = asoc->next_tsn;
428 }
429
430 /* Remove a transport from an association.  */
431 void sctp_assoc_rm_peer(struct sctp_association *asoc,
432                         struct sctp_transport *peer)
433 {
434         struct list_head        *pos;
435         struct sctp_transport   *transport;
436
437         SCTP_DEBUG_PRINTK_IPADDR("sctp_assoc_rm_peer:association %p addr: ",
438                                  " port: %d\n",
439                                  asoc,
440                                  (&peer->ipaddr),
441                                  peer->ipaddr.v4.sin_port);
442
443         /* If we are to remove the current retran_path, update it
444          * to the next peer before removing this peer from the list.
445          */
446         if (asoc->peer.retran_path == peer)
447                 sctp_assoc_update_retran_path(asoc);
448
449         /* Remove this peer from the list. */
450         list_del(&peer->transports);
451
452         /* Get the first transport of asoc. */
453         pos = asoc->peer.transport_addr_list.next;
454         transport = list_entry(pos, struct sctp_transport, transports);
455
456         /* Update any entries that match the peer to be deleted. */
457         if (asoc->peer.primary_path == peer)
458                 sctp_assoc_set_primary(asoc, transport);
459         if (asoc->peer.active_path == peer)
460                 asoc->peer.active_path = transport;
461         if (asoc->peer.last_data_from == peer)
462                 asoc->peer.last_data_from = transport;
463
464         /* If we remove the transport an INIT was last sent to, set it to
465          * NULL. Combined with the update of the retran path above, this
466          * will cause the next INIT to be sent to the next available
467          * transport, maintaining the cycle.
468          */
469         if (asoc->init_last_sent_to == peer)
470                 asoc->init_last_sent_to = NULL;
471
472         asoc->peer.transport_count--;
473
474         sctp_transport_free(peer);
475 }
476
477 /* Add a transport address to an association.  */
478 struct sctp_transport *sctp_assoc_add_peer(struct sctp_association *asoc,
479                                            const union sctp_addr *addr,
480                                            const gfp_t gfp,
481                                            const int peer_state)
482 {
483         struct sctp_transport *peer;
484         struct sctp_sock *sp;
485         unsigned short port;
486
487         sp = sctp_sk(asoc->base.sk);
488
489         /* AF_INET and AF_INET6 share common port field. */
490         port = addr->v4.sin_port;
491
492         SCTP_DEBUG_PRINTK_IPADDR("sctp_assoc_add_peer:association %p addr: ",
493                                  " port: %d state:%s\n",
494                                  asoc,
495                                  addr,
496                                  addr->v4.sin_port,
497                                  peer_state == SCTP_UNKNOWN?"UNKNOWN":"ACTIVE");
498
499         /* Set the port if it has not been set yet.  */
500         if (0 == asoc->peer.port)
501                 asoc->peer.port = port;
502
503         /* Check to see if this is a duplicate. */
504         peer = sctp_assoc_lookup_paddr(asoc, addr);
505         if (peer) {
506                 if (peer_state == SCTP_ACTIVE &&
507                     peer->state == SCTP_UNKNOWN)
508                      peer->state = SCTP_ACTIVE;
509                 return peer;
510         }
511
512         peer = sctp_transport_new(addr, gfp);
513         if (!peer)
514                 return NULL;
515
516         sctp_transport_set_owner(peer, asoc);
517
518         /* Initialize the pmtu of the transport. */
519         sctp_transport_pmtu(peer);
520
521         /* If this is the first transport addr on this association,
522          * initialize the association PMTU to the peer's PMTU.
523          * If not and the current association PMTU is higher than the new
524          * peer's PMTU, reset the association PMTU to the new peer's PMTU.
525          */
526         if (asoc->pmtu)
527                 asoc->pmtu = min_t(int, peer->pmtu, asoc->pmtu);
528         else
529                 asoc->pmtu = peer->pmtu;
530
531         SCTP_DEBUG_PRINTK("sctp_assoc_add_peer:association %p PMTU set to "
532                           "%d\n", asoc, asoc->pmtu);
533
534         asoc->frag_point = sctp_frag_point(sp, asoc->pmtu);
535
536         /* The asoc->peer.port might not be meaningful yet, but
537          * initialize the packet structure anyway.
538          */
539         sctp_packet_init(&peer->packet, peer, asoc->base.bind_addr.port,
540                          asoc->peer.port);
541
542         /* 7.2.1 Slow-Start
543          *
544          * o The initial cwnd before DATA transmission or after a sufficiently
545          *   long idle period MUST be set to
546          *      min(4*MTU, max(2*MTU, 4380 bytes))
547          *
548          * o The initial value of ssthresh MAY be arbitrarily high
549          *   (for example, implementations MAY use the size of the
550          *   receiver advertised window).
551          */
552         peer->cwnd = min(4*asoc->pmtu, max_t(__u32, 2*asoc->pmtu, 4380));
553
554         /* At this point, we may not have the receiver's advertised window,
555          * so initialize ssthresh to the default value and it will be set
556          * later when we process the INIT.
557          */
558         peer->ssthresh = SCTP_DEFAULT_MAXWINDOW;
559
560         peer->partial_bytes_acked = 0;
561         peer->flight_size = 0;
562
563         /* By default, enable heartbeat for peer address. */
564         peer->hb_allowed = 1;
565
566         /* Initialize the peer's heartbeat interval based on the
567          * sock configured value.
568          */
569         peer->hb_interval = msecs_to_jiffies(sp->paddrparam.spp_hbinterval);
570
571         /* Set the path max_retrans.  */
572         peer->max_retrans = sp->paddrparam.spp_pathmaxrxt;
573
574         /* Set the transport's RTO.initial value */
575         peer->rto = asoc->rto_initial;
576
577         /* Set the peer's active state. */
578         peer->state = peer_state;
579
580         /* Attach the remote transport to our asoc.  */
581         list_add_tail(&peer->transports, &asoc->peer.transport_addr_list);
582         asoc->peer.transport_count++;
583
584         /* If we do not yet have a primary path, set one.  */
585         if (!asoc->peer.primary_path) {
586                 sctp_assoc_set_primary(asoc, peer);
587                 asoc->peer.retran_path = peer;
588         }
589
590         if (asoc->peer.active_path == asoc->peer.retran_path) {
591                 asoc->peer.retran_path = peer;
592         }
593
594         return peer;
595 }
596
597 /* Delete a transport address from an association.  */
598 void sctp_assoc_del_peer(struct sctp_association *asoc,
599                          const union sctp_addr *addr)
600 {
601         struct list_head        *pos;
602         struct list_head        *temp;
603         struct sctp_transport   *transport;
604
605         list_for_each_safe(pos, temp, &asoc->peer.transport_addr_list) {
606                 transport = list_entry(pos, struct sctp_transport, transports);
607                 if (sctp_cmp_addr_exact(addr, &transport->ipaddr)) {
608                         /* Do book keeping for removing the peer and free it. */
609                         sctp_assoc_rm_peer(asoc, transport);
610                         break;
611                 }
612         }
613 }
614
615 /* Lookup a transport by address. */
616 struct sctp_transport *sctp_assoc_lookup_paddr(
617                                         const struct sctp_association *asoc,
618                                         const union sctp_addr *address)
619 {
620         struct sctp_transport *t;
621         struct list_head *pos;
622
623         /* Cycle through all transports searching for a peer address. */
624
625         list_for_each(pos, &asoc->peer.transport_addr_list) {
626                 t = list_entry(pos, struct sctp_transport, transports);
627                 if (sctp_cmp_addr_exact(address, &t->ipaddr))
628                         return t;
629         }
630
631         return NULL;
632 }
633
634 /* Engage in transport control operations.
635  * Mark the transport up or down and send a notification to the user.
636  * Select and update the new active and retran paths.
637  */
638 void sctp_assoc_control_transport(struct sctp_association *asoc,
639                                   struct sctp_transport *transport,
640                                   sctp_transport_cmd_t command,
641                                   sctp_sn_error_t error)
642 {
643         struct sctp_transport *t = NULL;
644         struct sctp_transport *first;
645         struct sctp_transport *second;
646         struct sctp_ulpevent *event;
647         struct list_head *pos;
648         int spc_state = 0;
649
650         /* Record the transition on the transport.  */
651         switch (command) {
652         case SCTP_TRANSPORT_UP:
653                 transport->state = SCTP_ACTIVE;
654                 spc_state = SCTP_ADDR_AVAILABLE;
655                 break;
656
657         case SCTP_TRANSPORT_DOWN:
658                 transport->state = SCTP_INACTIVE;
659                 spc_state = SCTP_ADDR_UNREACHABLE;
660                 break;
661
662         default:
663                 return;
664         };
665
666         /* Generate and send a SCTP_PEER_ADDR_CHANGE notification to the
667          * user.
668          */
669         event = sctp_ulpevent_make_peer_addr_change(asoc,
670                                 (struct sockaddr_storage *) &transport->ipaddr,
671                                 0, spc_state, error, GFP_ATOMIC);
672         if (event)
673                 sctp_ulpq_tail_event(&asoc->ulpq, event);
674
675         /* Select new active and retran paths. */
676
677         /* Look for the two most recently used active transports.
678          *
679          * This code produces the wrong ordering whenever jiffies
680          * rolls over, but we still get usable transports, so we don't
681          * worry about it.
682          */
683         first = NULL; second = NULL;
684
685         list_for_each(pos, &asoc->peer.transport_addr_list) {
686                 t = list_entry(pos, struct sctp_transport, transports);
687
688                 if (t->state == SCTP_INACTIVE)
689                         continue;
690                 if (!first || t->last_time_heard > first->last_time_heard) {
691                         second = first;
692                         first = t;
693                 }
694                 if (!second || t->last_time_heard > second->last_time_heard)
695                         second = t;
696         }
697
698         /* RFC 2960 6.4 Multi-Homed SCTP Endpoints
699          *
700          * By default, an endpoint should always transmit to the
701          * primary path, unless the SCTP user explicitly specifies the
702          * destination transport address (and possibly source
703          * transport address) to use.
704          *
705          * [If the primary is active but not most recent, bump the most
706          * recently used transport.]
707          */
708         if (asoc->peer.primary_path->state != SCTP_INACTIVE &&
709             first != asoc->peer.primary_path) {
710                 second = first;
711                 first = asoc->peer.primary_path;
712         }
713
714         /* If we failed to find a usable transport, just camp on the
715          * primary, even if it is inactive.
716          */
717         if (!first) {
718                 first = asoc->peer.primary_path;
719                 second = asoc->peer.primary_path;
720         }
721
722         /* Set the active and retran transports.  */
723         asoc->peer.active_path = first;
724         asoc->peer.retran_path = second;
725 }
726
727 /* Hold a reference to an association. */
728 void sctp_association_hold(struct sctp_association *asoc)
729 {
730         atomic_inc(&asoc->base.refcnt);
731 }
732
733 /* Release a reference to an association and cleanup
734  * if there are no more references.
735  */
736 void sctp_association_put(struct sctp_association *asoc)
737 {
738         if (atomic_dec_and_test(&asoc->base.refcnt))
739                 sctp_association_destroy(asoc);
740 }
741
742 /* Allocate the next TSN, Transmission Sequence Number, for the given
743  * association.
744  */
745 __u32 sctp_association_get_next_tsn(struct sctp_association *asoc)
746 {
747         /* From Section 1.6 Serial Number Arithmetic:
748          * Transmission Sequence Numbers wrap around when they reach
749          * 2**32 - 1.  That is, the next TSN a DATA chunk MUST use
750          * after transmitting TSN = 2*32 - 1 is TSN = 0.
751          */
752         __u32 retval = asoc->next_tsn;
753         asoc->next_tsn++;
754         asoc->unack_data++;
755
756         return retval;
757 }
758
759 /* Compare two addresses to see if they match.  Wildcard addresses
760  * only match themselves.
761  */
762 int sctp_cmp_addr_exact(const union sctp_addr *ss1,
763                         const union sctp_addr *ss2)
764 {
765         struct sctp_af *af;
766
767         af = sctp_get_af_specific(ss1->sa.sa_family);
768         if (unlikely(!af))
769                 return 0;
770
771         return af->cmp_addr(ss1, ss2);
772 }
773
774 /* Return an ecne chunk to get prepended to a packet.
775  * Note:  We are sly and return a shared, prealloced chunk.  FIXME:
776  * No we don't, but we could/should.
777  */
778 struct sctp_chunk *sctp_get_ecne_prepend(struct sctp_association *asoc)
779 {
780         struct sctp_chunk *chunk;
781
782         /* Send ECNE if needed.
783          * Not being able to allocate a chunk here is not deadly.
784          */
785         if (asoc->need_ecne)
786                 chunk = sctp_make_ecne(asoc, asoc->last_ecne_tsn);
787         else
788                 chunk = NULL;
789
790         return chunk;
791 }
792
793 /*
794  * Find which transport this TSN was sent on.
795  */
796 struct sctp_transport *sctp_assoc_lookup_tsn(struct sctp_association *asoc,
797                                              __u32 tsn)
798 {
799         struct sctp_transport *active;
800         struct sctp_transport *match;
801         struct list_head *entry, *pos;
802         struct sctp_transport *transport;
803         struct sctp_chunk *chunk;
804         __u32 key = htonl(tsn);
805
806         match = NULL;
807
808         /*
809          * FIXME: In general, find a more efficient data structure for
810          * searching.
811          */
812
813         /*
814          * The general strategy is to search each transport's transmitted
815          * list.   Return which transport this TSN lives on.
816          *
817          * Let's be hopeful and check the active_path first.
818          * Another optimization would be to know if there is only one
819          * outbound path and not have to look for the TSN at all.
820          *
821          */
822
823         active = asoc->peer.active_path;
824
825         list_for_each(entry, &active->transmitted) {
826                 chunk = list_entry(entry, struct sctp_chunk, transmitted_list);
827
828                 if (key == chunk->subh.data_hdr->tsn) {
829                         match = active;
830                         goto out;
831                 }
832         }
833
834         /* If not found, go search all the other transports. */
835         list_for_each(pos, &asoc->peer.transport_addr_list) {
836                 transport = list_entry(pos, struct sctp_transport, transports);
837
838                 if (transport == active)
839                         break;
840                 list_for_each(entry, &transport->transmitted) {
841                         chunk = list_entry(entry, struct sctp_chunk,
842                                            transmitted_list);
843                         if (key == chunk->subh.data_hdr->tsn) {
844                                 match = transport;
845                                 goto out;
846                         }
847                 }
848         }
849 out:
850         return match;
851 }
852
853 /* Is this the association we are looking for? */
854 struct sctp_transport *sctp_assoc_is_match(struct sctp_association *asoc,
855                                            const union sctp_addr *laddr,
856                                            const union sctp_addr *paddr)
857 {
858         struct sctp_transport *transport;
859
860         sctp_read_lock(&asoc->base.addr_lock);
861
862         if ((asoc->base.bind_addr.port == laddr->v4.sin_port) &&
863             (asoc->peer.port == paddr->v4.sin_port)) {
864                 transport = sctp_assoc_lookup_paddr(asoc, paddr);
865                 if (!transport)
866                         goto out;
867
868                 if (sctp_bind_addr_match(&asoc->base.bind_addr, laddr,
869                                          sctp_sk(asoc->base.sk)))
870                         goto out;
871         }
872         transport = NULL;
873
874 out:
875         sctp_read_unlock(&asoc->base.addr_lock);
876         return transport;
877 }
878
879 /* Do delayed input processing.  This is scheduled by sctp_rcv(). */
880 static void sctp_assoc_bh_rcv(struct sctp_association *asoc)
881 {
882         struct sctp_endpoint *ep;
883         struct sctp_chunk *chunk;
884         struct sock *sk;
885         struct sctp_inq *inqueue;
886         int state;
887         sctp_subtype_t subtype;
888         int error = 0;
889
890         /* The association should be held so we should be safe. */
891         ep = asoc->ep;
892         sk = asoc->base.sk;
893
894         inqueue = &asoc->base.inqueue;
895         sctp_association_hold(asoc);
896         while (NULL != (chunk = sctp_inq_pop(inqueue))) {
897                 state = asoc->state;
898                 subtype = SCTP_ST_CHUNK(chunk->chunk_hdr->type);
899
900                 /* Remember where the last DATA chunk came from so we
901                  * know where to send the SACK.
902                  */
903                 if (sctp_chunk_is_data(chunk))
904                         asoc->peer.last_data_from = chunk->transport;
905                 else
906                         SCTP_INC_STATS(SCTP_MIB_INCTRLCHUNKS);
907
908                 if (chunk->transport)
909                         chunk->transport->last_time_heard = jiffies;
910
911                 /* Run through the state machine. */
912                 error = sctp_do_sm(SCTP_EVENT_T_CHUNK, subtype,
913                                    state, ep, asoc, chunk, GFP_ATOMIC);
914
915                 /* Check to see if the association is freed in response to
916                  * the incoming chunk.  If so, get out of the while loop.
917                  */
918                 if (asoc->base.dead)
919                         break;
920
921                 /* If there is an error on chunk, discard this packet. */
922                 if (error && chunk)
923                         chunk->pdiscard = 1;
924         }
925         sctp_association_put(asoc);
926 }
927
928 /* This routine moves an association from its old sk to a new sk.  */
929 void sctp_assoc_migrate(struct sctp_association *assoc, struct sock *newsk)
930 {
931         struct sctp_sock *newsp = sctp_sk(newsk);
932         struct sock *oldsk = assoc->base.sk;
933
934         /* Delete the association from the old endpoint's list of
935          * associations.
936          */
937         list_del_init(&assoc->asocs);
938
939         /* Decrement the backlog value for a TCP-style socket. */
940         if (sctp_style(oldsk, TCP))
941                 oldsk->sk_ack_backlog--;
942
943         /* Release references to the old endpoint and the sock.  */
944         sctp_endpoint_put(assoc->ep);
945         sock_put(assoc->base.sk);
946
947         /* Get a reference to the new endpoint.  */
948         assoc->ep = newsp->ep;
949         sctp_endpoint_hold(assoc->ep);
950
951         /* Get a reference to the new sock.  */
952         assoc->base.sk = newsk;
953         sock_hold(assoc->base.sk);
954
955         /* Add the association to the new endpoint's list of associations.  */
956         sctp_endpoint_add_asoc(newsp->ep, assoc);
957 }
958
959 /* Update an association (possibly from unexpected COOKIE-ECHO processing).  */
960 void sctp_assoc_update(struct sctp_association *asoc,
961                        struct sctp_association *new)
962 {
963         struct sctp_transport *trans;
964         struct list_head *pos, *temp;
965
966         /* Copy in new parameters of peer. */
967         asoc->c = new->c;
968         asoc->peer.rwnd = new->peer.rwnd;
969         asoc->peer.sack_needed = new->peer.sack_needed;
970         asoc->peer.i = new->peer.i;
971         sctp_tsnmap_init(&asoc->peer.tsn_map, SCTP_TSN_MAP_SIZE,
972                          asoc->peer.i.initial_tsn);
973
974         /* Remove any peer addresses not present in the new association. */
975         list_for_each_safe(pos, temp, &asoc->peer.transport_addr_list) {
976                 trans = list_entry(pos, struct sctp_transport, transports);
977                 if (!sctp_assoc_lookup_paddr(new, &trans->ipaddr))
978                         sctp_assoc_del_peer(asoc, &trans->ipaddr);
979         }
980
981         /* If the case is A (association restart), use
982          * initial_tsn as next_tsn. If the case is B, use
983          * current next_tsn in case data sent to peer
984          * has been discarded and needs retransmission.
985          */
986         if (asoc->state >= SCTP_STATE_ESTABLISHED) {
987                 asoc->next_tsn = new->next_tsn;
988                 asoc->ctsn_ack_point = new->ctsn_ack_point;
989                 asoc->adv_peer_ack_point = new->adv_peer_ack_point;
990
991                 /* Reinitialize SSN for both local streams
992                  * and peer's streams.
993                  */
994                 sctp_ssnmap_clear(asoc->ssnmap);
995
996         } else {
997                 /* Add any peer addresses from the new association. */
998                 list_for_each(pos, &new->peer.transport_addr_list) {
999                         trans = list_entry(pos, struct sctp_transport,
1000                                            transports);
1001                         if (!sctp_assoc_lookup_paddr(asoc, &trans->ipaddr))
1002                                 sctp_assoc_add_peer(asoc, &trans->ipaddr,
1003                                                     GFP_ATOMIC, SCTP_ACTIVE);
1004                 }
1005
1006                 asoc->ctsn_ack_point = asoc->next_tsn - 1;
1007                 asoc->adv_peer_ack_point = asoc->ctsn_ack_point;
1008                 if (!asoc->ssnmap) {
1009                         /* Move the ssnmap. */
1010                         asoc->ssnmap = new->ssnmap;
1011                         new->ssnmap = NULL;
1012                 }
1013         }
1014 }
1015
1016 /* Update the retran path for sending a retransmitted packet.
1017  * Round-robin through the active transports, else round-robin
1018  * through the inactive transports as this is the next best thing
1019  * we can try.
1020  */
1021 void sctp_assoc_update_retran_path(struct sctp_association *asoc)
1022 {
1023         struct sctp_transport *t, *next;
1024         struct list_head *head = &asoc->peer.transport_addr_list;
1025         struct list_head *pos;
1026
1027         /* Find the next transport in a round-robin fashion. */
1028         t = asoc->peer.retran_path;
1029         pos = &t->transports;
1030         next = NULL;
1031
1032         while (1) {
1033                 /* Skip the head. */
1034                 if (pos->next == head)
1035                         pos = head->next;
1036                 else
1037                         pos = pos->next;
1038
1039                 t = list_entry(pos, struct sctp_transport, transports);
1040
1041                 /* Try to find an active transport. */
1042
1043                 if (t->state != SCTP_INACTIVE) {
1044                         break;
1045                 } else {
1046                         /* Keep track of the next transport in case
1047                          * we don't find any active transport.
1048                          */
1049                         if (!next)
1050                                 next = t;
1051                 }
1052
1053                 /* We have exhausted the list, but didn't find any
1054                  * other active transports.  If so, use the next
1055                  * transport.
1056                  */
1057                 if (t == asoc->peer.retran_path) {
1058                         t = next;
1059                         break;
1060                 }
1061         }
1062
1063         asoc->peer.retran_path = t;
1064
1065         SCTP_DEBUG_PRINTK_IPADDR("sctp_assoc_update_retran_path:association"
1066                                  " %p addr: ",
1067                                  " port: %d\n",
1068                                  asoc,
1069                                  (&t->ipaddr),
1070                                  t->ipaddr.v4.sin_port);
1071 }
1072
1073 /* Choose the transport for sending a INIT packet.  */
1074 struct sctp_transport *sctp_assoc_choose_init_transport(
1075         struct sctp_association *asoc)
1076 {
1077         struct sctp_transport *t;
1078
1079         /* Use the retran path. If the last INIT was sent over the
1080          * retran path, update the retran path and use it.
1081          */
1082         if (!asoc->init_last_sent_to) {
1083                 t = asoc->peer.active_path;
1084         } else {
1085                 if (asoc->init_last_sent_to == asoc->peer.retran_path)
1086                         sctp_assoc_update_retran_path(asoc);
1087                 t = asoc->peer.retran_path;
1088         }
1089
1090         SCTP_DEBUG_PRINTK_IPADDR("sctp_assoc_update_retran_path:association"
1091                                  " %p addr: ",
1092                                  " port: %d\n",
1093                                  asoc,
1094                                  (&t->ipaddr),
1095                                  t->ipaddr.v4.sin_port);
1096
1097         return t;
1098 }
1099
1100 /* Choose the transport for sending a SHUTDOWN packet.  */
1101 struct sctp_transport *sctp_assoc_choose_shutdown_transport(
1102         struct sctp_association *asoc)
1103 {
1104         /* If this is the first time SHUTDOWN is sent, use the active path,
1105          * else use the retran path. If the last SHUTDOWN was sent over the
1106          * retran path, update the retran path and use it.
1107          */
1108         if (!asoc->shutdown_last_sent_to)
1109                 return asoc->peer.active_path;
1110         else {
1111                 if (asoc->shutdown_last_sent_to == asoc->peer.retran_path)
1112                         sctp_assoc_update_retran_path(asoc);
1113                 return asoc->peer.retran_path;
1114         }
1115
1116 }
1117
1118 /* Update the association's pmtu and frag_point by going through all the
1119  * transports. This routine is called when a transport's PMTU has changed.
1120  */
1121 void sctp_assoc_sync_pmtu(struct sctp_association *asoc)
1122 {
1123         struct sctp_transport *t;
1124         struct list_head *pos;
1125         __u32 pmtu = 0;
1126
1127         if (!asoc)
1128                 return;
1129
1130         /* Get the lowest pmtu of all the transports. */
1131         list_for_each(pos, &asoc->peer.transport_addr_list) {
1132                 t = list_entry(pos, struct sctp_transport, transports);
1133                 if (!pmtu || (t->pmtu < pmtu))
1134                         pmtu = t->pmtu;
1135         }
1136
1137         if (pmtu) {
1138                 struct sctp_sock *sp = sctp_sk(asoc->base.sk);
1139                 asoc->pmtu = pmtu;
1140                 asoc->frag_point = sctp_frag_point(sp, pmtu);
1141         }
1142
1143         SCTP_DEBUG_PRINTK("%s: asoc:%p, pmtu:%d, frag_point:%d\n",
1144                           __FUNCTION__, asoc, asoc->pmtu, asoc->frag_point);
1145 }
1146
1147 /* Should we send a SACK to update our peer? */
1148 static inline int sctp_peer_needs_update(struct sctp_association *asoc)
1149 {
1150         switch (asoc->state) {
1151         case SCTP_STATE_ESTABLISHED:
1152         case SCTP_STATE_SHUTDOWN_PENDING:
1153         case SCTP_STATE_SHUTDOWN_RECEIVED:
1154         case SCTP_STATE_SHUTDOWN_SENT:
1155                 if ((asoc->rwnd > asoc->a_rwnd) &&
1156                     ((asoc->rwnd - asoc->a_rwnd) >=
1157                      min_t(__u32, (asoc->base.sk->sk_rcvbuf >> 1), asoc->pmtu)))
1158                         return 1;
1159                 break;
1160         default:
1161                 break;
1162         }
1163         return 0;
1164 }
1165
1166 /* Increase asoc's rwnd by len and send any window update SACK if needed. */
1167 void sctp_assoc_rwnd_increase(struct sctp_association *asoc, unsigned len)
1168 {
1169         struct sctp_chunk *sack;
1170         struct timer_list *timer;
1171
1172         if (asoc->rwnd_over) {
1173                 if (asoc->rwnd_over >= len) {
1174                         asoc->rwnd_over -= len;
1175                 } else {
1176                         asoc->rwnd += (len - asoc->rwnd_over);
1177                         asoc->rwnd_over = 0;
1178                 }
1179         } else {
1180                 asoc->rwnd += len;
1181         }
1182
1183         SCTP_DEBUG_PRINTK("%s: asoc %p rwnd increased by %d to (%u, %u) "
1184                           "- %u\n", __FUNCTION__, asoc, len, asoc->rwnd,
1185                           asoc->rwnd_over, asoc->a_rwnd);
1186
1187         /* Send a window update SACK if the rwnd has increased by at least the
1188          * minimum of the association's PMTU and half of the receive buffer.
1189          * The algorithm used is similar to the one described in
1190          * Section 4.2.3.3 of RFC 1122.
1191          */
1192         if (sctp_peer_needs_update(asoc)) {
1193                 asoc->a_rwnd = asoc->rwnd;
1194                 SCTP_DEBUG_PRINTK("%s: Sending window update SACK- asoc: %p "
1195                                   "rwnd: %u a_rwnd: %u\n", __FUNCTION__,
1196                                   asoc, asoc->rwnd, asoc->a_rwnd);
1197                 sack = sctp_make_sack(asoc);
1198                 if (!sack)
1199                         return;
1200
1201                 asoc->peer.sack_needed = 0;
1202
1203                 sctp_outq_tail(&asoc->outqueue, sack);
1204
1205                 /* Stop the SACK timer.  */
1206                 timer = &asoc->timers[SCTP_EVENT_TIMEOUT_SACK];
1207                 if (timer_pending(timer) && del_timer(timer))
1208                         sctp_association_put(asoc);
1209         }
1210 }
1211
1212 /* Decrease asoc's rwnd by len. */
1213 void sctp_assoc_rwnd_decrease(struct sctp_association *asoc, unsigned len)
1214 {
1215         SCTP_ASSERT(asoc->rwnd, "rwnd zero", return);
1216         SCTP_ASSERT(!asoc->rwnd_over, "rwnd_over not zero", return);
1217         if (asoc->rwnd >= len) {
1218                 asoc->rwnd -= len;
1219         } else {
1220                 asoc->rwnd_over = len - asoc->rwnd;
1221                 asoc->rwnd = 0;
1222         }
1223         SCTP_DEBUG_PRINTK("%s: asoc %p rwnd decreased by %d to (%u, %u)\n",
1224                           __FUNCTION__, asoc, len, asoc->rwnd,
1225                           asoc->rwnd_over);
1226 }
1227
1228 /* Build the bind address list for the association based on info from the
1229  * local endpoint and the remote peer.
1230  */
1231 int sctp_assoc_set_bind_addr_from_ep(struct sctp_association *asoc,
1232                                      gfp_t gfp)
1233 {
1234         sctp_scope_t scope;
1235         int flags;
1236
1237         /* Use scoping rules to determine the subset of addresses from
1238          * the endpoint.
1239          */
1240         scope = sctp_scope(&asoc->peer.active_path->ipaddr);
1241         flags = (PF_INET6 == asoc->base.sk->sk_family) ? SCTP_ADDR6_ALLOWED : 0;
1242         if (asoc->peer.ipv4_address)
1243                 flags |= SCTP_ADDR4_PEERSUPP;
1244         if (asoc->peer.ipv6_address)
1245                 flags |= SCTP_ADDR6_PEERSUPP;
1246
1247         return sctp_bind_addr_copy(&asoc->base.bind_addr,
1248                                    &asoc->ep->base.bind_addr,
1249                                    scope, gfp, flags);
1250 }
1251
1252 /* Build the association's bind address list from the cookie.  */
1253 int sctp_assoc_set_bind_addr_from_cookie(struct sctp_association *asoc,
1254                                          struct sctp_cookie *cookie,
1255                                          gfp_t gfp)
1256 {
1257         int var_size2 = ntohs(cookie->peer_init->chunk_hdr.length);
1258         int var_size3 = cookie->raw_addr_list_len;
1259         __u8 *raw = (__u8 *)cookie->peer_init + var_size2;
1260
1261         return sctp_raw_to_bind_addrs(&asoc->base.bind_addr, raw, var_size3,
1262                                       asoc->ep->base.bind_addr.port, gfp);
1263 }
1264
1265 /* Lookup laddr in the bind address list of an association. */ 
1266 int sctp_assoc_lookup_laddr(struct sctp_association *asoc, 
1267                             const union sctp_addr *laddr)
1268 {
1269         int found;
1270
1271         sctp_read_lock(&asoc->base.addr_lock);
1272         if ((asoc->base.bind_addr.port == ntohs(laddr->v4.sin_port)) &&
1273             sctp_bind_addr_match(&asoc->base.bind_addr, laddr,
1274                                  sctp_sk(asoc->base.sk))) {
1275                 found = 1;
1276                 goto out;
1277         }
1278
1279         found = 0;
1280 out:
1281         sctp_read_unlock(&asoc->base.addr_lock);
1282         return found;
1283 }