Merge git://git.kernel.org/pub/scm/linux/kernel/git/mingo/linux-2.6-sched
[linux-2.6] / drivers / net / pppoe.c
1 /** -*- linux-c -*- ***********************************************************
2  * Linux PPP over Ethernet (PPPoX/PPPoE) Sockets
3  *
4  * PPPoX --- Generic PPP encapsulation socket family
5  * PPPoE --- PPP over Ethernet (RFC 2516)
6  *
7  *
8  * Version:     0.7.0
9  *
10  * 070228 :     Fix to allow multiple sessions with same remote MAC and same
11  *              session id by including the local device ifindex in the
12  *              tuple identifying a session. This also ensures packets can't
13  *              be injected into a session from interfaces other than the one
14  *              specified by userspace. Florian Zumbiehl <florz@florz.de>
15  *              (Oh, BTW, this one is YYMMDD, in case you were wondering ...)
16  * 220102 :     Fix module use count on failure in pppoe_create, pppox_sk -acme
17  * 030700 :     Fixed connect logic to allow for disconnect.
18  * 270700 :     Fixed potential SMP problems; we must protect against
19  *              simultaneous invocation of ppp_input
20  *              and ppp_unregister_channel.
21  * 040800 :     Respect reference count mechanisms on net-devices.
22  * 200800 :     fix kfree(skb) in pppoe_rcv (acme)
23  *              Module reference count is decremented in the right spot now,
24  *              guards against sock_put not actually freeing the sk
25  *              in pppoe_release.
26  * 051000 :     Initialization cleanup.
27  * 111100 :     Fix recvmsg.
28  * 050101 :     Fix PADT procesing.
29  * 140501 :     Use pppoe_rcv_core to handle all backlog. (Alexey)
30  * 170701 :     Do not lock_sock with rwlock held. (DaveM)
31  *              Ignore discovery frames if user has socket
32  *              locked. (DaveM)
33  *              Ignore return value of dev_queue_xmit in __pppoe_xmit
34  *              or else we may kfree an SKB twice. (DaveM)
35  * 190701 :     When doing copies of skb's in __pppoe_xmit, always delete
36  *              the original skb that was passed in on success, never on
37  *              failure.  Delete the copy of the skb on failure to avoid
38  *              a memory leak.
39  * 081001 :     Misc. cleanup (licence string, non-blocking, prevent
40  *              reference of device on close).
41  * 121301 :     New ppp channels interface; cannot unregister a channel
42  *              from interrupts.  Thus, we mark the socket as a ZOMBIE
43  *              and do the unregistration later.
44  * 081002 :     seq_file support for proc stuff -acme
45  * 111602 :     Merge all 2.4 fixes into 2.5/2.6 tree.  Label 2.5/2.6
46  *              as version 0.7.  Spacing cleanup.
47  * Author:      Michal Ostrowski <mostrows@speakeasy.net>
48  * Contributors:
49  *              Arnaldo Carvalho de Melo <acme@conectiva.com.br>
50  *              David S. Miller (davem@redhat.com)
51  *
52  * License:
53  *              This program is free software; you can redistribute it and/or
54  *              modify it under the terms of the GNU General Public License
55  *              as published by the Free Software Foundation; either version
56  *              2 of the License, or (at your option) any later version.
57  *
58  */
59
60 #include <linux/string.h>
61 #include <linux/module.h>
62 #include <linux/kernel.h>
63 #include <linux/slab.h>
64 #include <linux/errno.h>
65 #include <linux/netdevice.h>
66 #include <linux/net.h>
67 #include <linux/inetdevice.h>
68 #include <linux/etherdevice.h>
69 #include <linux/skbuff.h>
70 #include <linux/init.h>
71 #include <linux/if_ether.h>
72 #include <linux/if_pppox.h>
73 #include <linux/ppp_channel.h>
74 #include <linux/ppp_defs.h>
75 #include <linux/if_ppp.h>
76 #include <linux/notifier.h>
77 #include <linux/file.h>
78 #include <linux/proc_fs.h>
79 #include <linux/seq_file.h>
80
81 #include <net/net_namespace.h>
82 #include <net/sock.h>
83
84 #include <asm/uaccess.h>
85
86 #define PPPOE_HASH_BITS 4
87 #define PPPOE_HASH_SIZE (1<<PPPOE_HASH_BITS)
88
89 static struct ppp_channel_ops pppoe_chan_ops;
90
91 static int pppoe_ioctl(struct socket *sock, unsigned int cmd, unsigned long arg);
92 static int pppoe_xmit(struct ppp_channel *chan, struct sk_buff *skb);
93 static int __pppoe_xmit(struct sock *sk, struct sk_buff *skb);
94
95 static const struct proto_ops pppoe_ops;
96 static DEFINE_RWLOCK(pppoe_hash_lock);
97
98 static struct ppp_channel_ops pppoe_chan_ops;
99
100 static inline int cmp_2_addr(struct pppoe_addr *a, struct pppoe_addr *b)
101 {
102         return (a->sid == b->sid &&
103                 (memcmp(a->remote, b->remote, ETH_ALEN) == 0));
104 }
105
106 static inline int cmp_addr(struct pppoe_addr *a, __be16 sid, char *addr)
107 {
108         return (a->sid == sid &&
109                 (memcmp(a->remote,addr,ETH_ALEN) == 0));
110 }
111
112 #if 8%PPPOE_HASH_BITS
113 #error 8 must be a multiple of PPPOE_HASH_BITS
114 #endif
115
116 static int hash_item(__be16 sid, unsigned char *addr)
117 {
118         unsigned char hash = 0;
119         unsigned int i;
120
121         for (i = 0 ; i < ETH_ALEN ; i++) {
122                 hash ^= addr[i];
123         }
124         for (i = 0 ; i < sizeof(sid_t)*8 ; i += 8 ){
125                 hash ^= (__force __u32)sid>>i;
126         }
127         for (i = 8 ; (i>>=1) >= PPPOE_HASH_BITS ; ) {
128                 hash ^= hash>>i;
129         }
130
131         return hash & ( PPPOE_HASH_SIZE - 1 );
132 }
133
134 /* zeroed because its in .bss */
135 static struct pppox_sock *item_hash_table[PPPOE_HASH_SIZE];
136
137 /**********************************************************************
138  *
139  *  Set/get/delete/rehash items  (internal versions)
140  *
141  **********************************************************************/
142 static struct pppox_sock *__get_item(__be16 sid, unsigned char *addr, int ifindex)
143 {
144         int hash = hash_item(sid, addr);
145         struct pppox_sock *ret;
146
147         ret = item_hash_table[hash];
148
149         while (ret && !(cmp_addr(&ret->pppoe_pa, sid, addr) && ret->pppoe_ifindex == ifindex))
150                 ret = ret->next;
151
152         return ret;
153 }
154
155 static int __set_item(struct pppox_sock *po)
156 {
157         int hash = hash_item(po->pppoe_pa.sid, po->pppoe_pa.remote);
158         struct pppox_sock *ret;
159
160         ret = item_hash_table[hash];
161         while (ret) {
162                 if (cmp_2_addr(&ret->pppoe_pa, &po->pppoe_pa) && ret->pppoe_ifindex == po->pppoe_ifindex)
163                         return -EALREADY;
164
165                 ret = ret->next;
166         }
167
168         po->next = item_hash_table[hash];
169         item_hash_table[hash] = po;
170
171         return 0;
172 }
173
174 static struct pppox_sock *__delete_item(__be16 sid, char *addr, int ifindex)
175 {
176         int hash = hash_item(sid, addr);
177         struct pppox_sock *ret, **src;
178
179         ret = item_hash_table[hash];
180         src = &item_hash_table[hash];
181
182         while (ret) {
183                 if (cmp_addr(&ret->pppoe_pa, sid, addr) && ret->pppoe_ifindex == ifindex) {
184                         *src = ret->next;
185                         break;
186                 }
187
188                 src = &ret->next;
189                 ret = ret->next;
190         }
191
192         return ret;
193 }
194
195 /**********************************************************************
196  *
197  *  Set/get/delete/rehash items
198  *
199  **********************************************************************/
200 static inline struct pppox_sock *get_item(__be16 sid,
201                                          unsigned char *addr, int ifindex)
202 {
203         struct pppox_sock *po;
204
205         read_lock_bh(&pppoe_hash_lock);
206         po = __get_item(sid, addr, ifindex);
207         if (po)
208                 sock_hold(sk_pppox(po));
209         read_unlock_bh(&pppoe_hash_lock);
210
211         return po;
212 }
213
214 static inline struct pppox_sock *get_item_by_addr(struct sockaddr_pppox *sp)
215 {
216         struct net_device *dev;
217         int ifindex;
218
219         dev = dev_get_by_name(&init_net, sp->sa_addr.pppoe.dev);
220         if(!dev)
221                 return NULL;
222         ifindex = dev->ifindex;
223         dev_put(dev);
224         return get_item(sp->sa_addr.pppoe.sid, sp->sa_addr.pppoe.remote, ifindex);
225 }
226
227 static inline struct pppox_sock *delete_item(__be16 sid, char *addr, int ifindex)
228 {
229         struct pppox_sock *ret;
230
231         write_lock_bh(&pppoe_hash_lock);
232         ret = __delete_item(sid, addr, ifindex);
233         write_unlock_bh(&pppoe_hash_lock);
234
235         return ret;
236 }
237
238
239
240 /***************************************************************************
241  *
242  *  Handler for device events.
243  *  Certain device events require that sockets be unconnected.
244  *
245  **************************************************************************/
246
247 static void pppoe_flush_dev(struct net_device *dev)
248 {
249         int hash;
250         BUG_ON(dev == NULL);
251
252         write_lock_bh(&pppoe_hash_lock);
253         for (hash = 0; hash < PPPOE_HASH_SIZE; hash++) {
254                 struct pppox_sock *po = item_hash_table[hash];
255
256                 while (po != NULL) {
257                         struct sock *sk = sk_pppox(po);
258                         if (po->pppoe_dev != dev) {
259                                 po = po->next;
260                                 continue;
261                         }
262                         po->pppoe_dev = NULL;
263                         dev_put(dev);
264
265
266                         /* We always grab the socket lock, followed by the
267                          * pppoe_hash_lock, in that order.  Since we should
268                          * hold the sock lock while doing any unbinding,
269                          * we need to release the lock we're holding.
270                          * Hold a reference to the sock so it doesn't disappear
271                          * as we're jumping between locks.
272                          */
273
274                         sock_hold(sk);
275
276                         write_unlock_bh(&pppoe_hash_lock);
277                         lock_sock(sk);
278
279                         if (sk->sk_state & (PPPOX_CONNECTED | PPPOX_BOUND)) {
280                                 pppox_unbind_sock(sk);
281                                 sk->sk_state = PPPOX_ZOMBIE;
282                                 sk->sk_state_change(sk);
283                         }
284
285                         release_sock(sk);
286                         sock_put(sk);
287
288                         /* Restart scan at the beginning of this hash chain.
289                          * While the lock was dropped the chain contents may
290                          * have changed.
291                          */
292                         write_lock_bh(&pppoe_hash_lock);
293                         po = item_hash_table[hash];
294                 }
295         }
296         write_unlock_bh(&pppoe_hash_lock);
297 }
298
299 static int pppoe_device_event(struct notifier_block *this,
300                               unsigned long event, void *ptr)
301 {
302         struct net_device *dev = (struct net_device *) ptr;
303
304         if (dev->nd_net != &init_net)
305                 return NOTIFY_DONE;
306
307         /* Only look at sockets that are using this specific device. */
308         switch (event) {
309         case NETDEV_CHANGEMTU:
310                 /* A change in mtu is a bad thing, requiring
311                  * LCP re-negotiation.
312                  */
313
314         case NETDEV_GOING_DOWN:
315         case NETDEV_DOWN:
316                 /* Find every socket on this device and kill it. */
317                 pppoe_flush_dev(dev);
318                 break;
319
320         default:
321                 break;
322         };
323
324         return NOTIFY_DONE;
325 }
326
327
328 static struct notifier_block pppoe_notifier = {
329         .notifier_call = pppoe_device_event,
330 };
331
332
333 /************************************************************************
334  *
335  * Do the real work of receiving a PPPoE Session frame.
336  *
337  ***********************************************************************/
338 static int pppoe_rcv_core(struct sock *sk, struct sk_buff *skb)
339 {
340         struct pppox_sock *po = pppox_sk(sk);
341         struct pppox_sock *relay_po;
342
343         if (sk->sk_state & PPPOX_BOUND) {
344                 struct pppoe_hdr *ph = pppoe_hdr(skb);
345                 int len = ntohs(ph->length);
346                 skb_pull_rcsum(skb, sizeof(struct pppoe_hdr));
347                 if (pskb_trim_rcsum(skb, len))
348                         goto abort_kfree;
349
350                 ppp_input(&po->chan, skb);
351         } else if (sk->sk_state & PPPOX_RELAY) {
352                 relay_po = get_item_by_addr(&po->pppoe_relay);
353
354                 if (relay_po == NULL)
355                         goto abort_kfree;
356
357                 if ((sk_pppox(relay_po)->sk_state & PPPOX_CONNECTED) == 0)
358                         goto abort_put;
359
360                 skb_pull(skb, sizeof(struct pppoe_hdr));
361                 if (!__pppoe_xmit(sk_pppox(relay_po), skb))
362                         goto abort_put;
363         } else {
364                 if (sock_queue_rcv_skb(sk, skb))
365                         goto abort_kfree;
366         }
367
368         return NET_RX_SUCCESS;
369
370 abort_put:
371         sock_put(sk_pppox(relay_po));
372
373 abort_kfree:
374         kfree_skb(skb);
375         return NET_RX_DROP;
376 }
377
378 /************************************************************************
379  *
380  * Receive wrapper called in BH context.
381  *
382  ***********************************************************************/
383 static int pppoe_rcv(struct sk_buff *skb,
384                      struct net_device *dev,
385                      struct packet_type *pt,
386                      struct net_device *orig_dev)
387
388 {
389         struct pppoe_hdr *ph;
390         struct pppox_sock *po;
391
392         if (!(skb = skb_share_check(skb, GFP_ATOMIC)))
393                 goto out;
394
395         if (dev->nd_net != &init_net)
396                 goto drop;
397
398         if (!pskb_may_pull(skb, sizeof(struct pppoe_hdr)))
399                 goto drop;
400
401         ph = pppoe_hdr(skb);
402
403         po = get_item(ph->sid, eth_hdr(skb)->h_source, dev->ifindex);
404         if (po != NULL)
405                 return sk_receive_skb(sk_pppox(po), skb, 0);
406 drop:
407         kfree_skb(skb);
408 out:
409         return NET_RX_DROP;
410 }
411
412 /************************************************************************
413  *
414  * Receive a PPPoE Discovery frame.
415  * This is solely for detection of PADT frames
416  *
417  ***********************************************************************/
418 static int pppoe_disc_rcv(struct sk_buff *skb,
419                           struct net_device *dev,
420                           struct packet_type *pt,
421                           struct net_device *orig_dev)
422
423 {
424         struct pppoe_hdr *ph;
425         struct pppox_sock *po;
426
427         if (dev->nd_net != &init_net)
428                 goto abort;
429
430         if (!pskb_may_pull(skb, sizeof(struct pppoe_hdr)))
431                 goto abort;
432
433         if (!(skb = skb_share_check(skb, GFP_ATOMIC)))
434                 goto out;
435
436         ph = pppoe_hdr(skb);
437         if (ph->code != PADT_CODE)
438                 goto abort;
439
440         po = get_item(ph->sid, eth_hdr(skb)->h_source, dev->ifindex);
441         if (po) {
442                 struct sock *sk = sk_pppox(po);
443
444                 bh_lock_sock(sk);
445
446                 /* If the user has locked the socket, just ignore
447                  * the packet.  With the way two rcv protocols hook into
448                  * one socket family type, we cannot (easily) distinguish
449                  * what kind of SKB it is during backlog rcv.
450                  */
451                 if (sock_owned_by_user(sk) == 0) {
452                         /* We're no longer connect at the PPPOE layer,
453                          * and must wait for ppp channel to disconnect us.
454                          */
455                         sk->sk_state = PPPOX_ZOMBIE;
456                 }
457
458                 bh_unlock_sock(sk);
459                 sock_put(sk);
460         }
461
462 abort:
463         kfree_skb(skb);
464 out:
465         return NET_RX_SUCCESS; /* Lies... :-) */
466 }
467
468 static struct packet_type pppoes_ptype = {
469         .type   = __constant_htons(ETH_P_PPP_SES),
470         .func   = pppoe_rcv,
471 };
472
473 static struct packet_type pppoed_ptype = {
474         .type   = __constant_htons(ETH_P_PPP_DISC),
475         .func   = pppoe_disc_rcv,
476 };
477
478 static struct proto pppoe_sk_proto = {
479         .name     = "PPPOE",
480         .owner    = THIS_MODULE,
481         .obj_size = sizeof(struct pppox_sock),
482 };
483
484 /***********************************************************************
485  *
486  * Initialize a new struct sock.
487  *
488  **********************************************************************/
489 static int pppoe_create(struct net *net, struct socket *sock)
490 {
491         int error = -ENOMEM;
492         struct sock *sk;
493
494         sk = sk_alloc(net, PF_PPPOX, GFP_KERNEL, &pppoe_sk_proto);
495         if (!sk)
496                 goto out;
497
498         sock_init_data(sock, sk);
499
500         sock->state = SS_UNCONNECTED;
501         sock->ops   = &pppoe_ops;
502
503         sk->sk_backlog_rcv = pppoe_rcv_core;
504         sk->sk_state       = PPPOX_NONE;
505         sk->sk_type        = SOCK_STREAM;
506         sk->sk_family      = PF_PPPOX;
507         sk->sk_protocol    = PX_PROTO_OE;
508
509         error = 0;
510 out:    return error;
511 }
512
513 static int pppoe_release(struct socket *sock)
514 {
515         struct sock *sk = sock->sk;
516         struct pppox_sock *po;
517
518         if (!sk)
519                 return 0;
520
521         lock_sock(sk);
522         if (sock_flag(sk, SOCK_DEAD)){
523                 release_sock(sk);
524                 return -EBADF;
525         }
526
527         pppox_unbind_sock(sk);
528
529         /* Signal the death of the socket. */
530         sk->sk_state = PPPOX_DEAD;
531
532
533         /* Write lock on hash lock protects the entire "po" struct from
534          * concurrent updates via pppoe_flush_dev. The "po" struct should
535          * be considered part of the hash table contents, thus protected
536          * by the hash table lock */
537         write_lock_bh(&pppoe_hash_lock);
538
539         po = pppox_sk(sk);
540         if (po->pppoe_pa.sid) {
541                 __delete_item(po->pppoe_pa.sid,
542                               po->pppoe_pa.remote, po->pppoe_ifindex);
543         }
544
545         if (po->pppoe_dev) {
546                 dev_put(po->pppoe_dev);
547                 po->pppoe_dev = NULL;
548         }
549
550         write_unlock_bh(&pppoe_hash_lock);
551
552         sock_orphan(sk);
553         sock->sk = NULL;
554
555         skb_queue_purge(&sk->sk_receive_queue);
556         release_sock(sk);
557         sock_put(sk);
558
559         return 0;
560 }
561
562
563 static int pppoe_connect(struct socket *sock, struct sockaddr *uservaddr,
564                   int sockaddr_len, int flags)
565 {
566         struct sock *sk = sock->sk;
567         struct net_device *dev;
568         struct sockaddr_pppox *sp = (struct sockaddr_pppox *) uservaddr;
569         struct pppox_sock *po = pppox_sk(sk);
570         int error;
571
572         lock_sock(sk);
573
574         error = -EINVAL;
575         if (sp->sa_protocol != PX_PROTO_OE)
576                 goto end;
577
578         /* Check for already bound sockets */
579         error = -EBUSY;
580         if ((sk->sk_state & PPPOX_CONNECTED) && sp->sa_addr.pppoe.sid)
581                 goto end;
582
583         /* Check for already disconnected sockets, on attempts to disconnect */
584         error = -EALREADY;
585         if ((sk->sk_state & PPPOX_DEAD) && !sp->sa_addr.pppoe.sid )
586                 goto end;
587
588         error = 0;
589         if (po->pppoe_pa.sid) {
590                 pppox_unbind_sock(sk);
591
592                 /* Delete the old binding */
593                 delete_item(po->pppoe_pa.sid,po->pppoe_pa.remote,po->pppoe_ifindex);
594
595                 if(po->pppoe_dev)
596                         dev_put(po->pppoe_dev);
597
598                 memset(sk_pppox(po) + 1, 0,
599                        sizeof(struct pppox_sock) - sizeof(struct sock));
600
601                 sk->sk_state = PPPOX_NONE;
602         }
603
604         /* Don't re-bind if sid==0 */
605         if (sp->sa_addr.pppoe.sid != 0) {
606                 dev = dev_get_by_name(&init_net, sp->sa_addr.pppoe.dev);
607
608                 error = -ENODEV;
609                 if (!dev)
610                         goto end;
611
612                 po->pppoe_dev = dev;
613                 po->pppoe_ifindex = dev->ifindex;
614
615                 write_lock_bh(&pppoe_hash_lock);
616                 if (!(dev->flags & IFF_UP)){
617                         write_unlock_bh(&pppoe_hash_lock);
618                         goto err_put;
619                 }
620
621                 memcpy(&po->pppoe_pa,
622                        &sp->sa_addr.pppoe,
623                        sizeof(struct pppoe_addr));
624
625                 error = __set_item(po);
626                 write_unlock_bh(&pppoe_hash_lock);
627                 if (error < 0)
628                         goto err_put;
629
630                 po->chan.hdrlen = (sizeof(struct pppoe_hdr) +
631                                    dev->hard_header_len);
632
633                 po->chan.mtu = dev->mtu - sizeof(struct pppoe_hdr);
634                 po->chan.private = sk;
635                 po->chan.ops = &pppoe_chan_ops;
636
637                 error = ppp_register_channel(&po->chan);
638                 if (error)
639                         goto err_put;
640
641                 sk->sk_state = PPPOX_CONNECTED;
642         }
643
644         po->num = sp->sa_addr.pppoe.sid;
645
646  end:
647         release_sock(sk);
648         return error;
649 err_put:
650         if (po->pppoe_dev) {
651                 dev_put(po->pppoe_dev);
652                 po->pppoe_dev = NULL;
653         }
654         goto end;
655 }
656
657
658 static int pppoe_getname(struct socket *sock, struct sockaddr *uaddr,
659                   int *usockaddr_len, int peer)
660 {
661         int len = sizeof(struct sockaddr_pppox);
662         struct sockaddr_pppox sp;
663
664         sp.sa_family    = AF_PPPOX;
665         sp.sa_protocol  = PX_PROTO_OE;
666         memcpy(&sp.sa_addr.pppoe, &pppox_sk(sock->sk)->pppoe_pa,
667                sizeof(struct pppoe_addr));
668
669         memcpy(uaddr, &sp, len);
670
671         *usockaddr_len = len;
672
673         return 0;
674 }
675
676
677 static int pppoe_ioctl(struct socket *sock, unsigned int cmd,
678                 unsigned long arg)
679 {
680         struct sock *sk = sock->sk;
681         struct pppox_sock *po = pppox_sk(sk);
682         int val;
683         int err;
684
685         switch (cmd) {
686         case PPPIOCGMRU:
687                 err = -ENXIO;
688
689                 if (!(sk->sk_state & PPPOX_CONNECTED))
690                         break;
691
692                 err = -EFAULT;
693                 if (put_user(po->pppoe_dev->mtu -
694                              sizeof(struct pppoe_hdr) -
695                              PPP_HDRLEN,
696                              (int __user *) arg))
697                         break;
698                 err = 0;
699                 break;
700
701         case PPPIOCSMRU:
702                 err = -ENXIO;
703                 if (!(sk->sk_state & PPPOX_CONNECTED))
704                         break;
705
706                 err = -EFAULT;
707                 if (get_user(val,(int __user *) arg))
708                         break;
709
710                 if (val < (po->pppoe_dev->mtu
711                            - sizeof(struct pppoe_hdr)
712                            - PPP_HDRLEN))
713                         err = 0;
714                 else
715                         err = -EINVAL;
716                 break;
717
718         case PPPIOCSFLAGS:
719                 err = -EFAULT;
720                 if (get_user(val, (int __user *) arg))
721                         break;
722                 err = 0;
723                 break;
724
725         case PPPOEIOCSFWD:
726         {
727                 struct pppox_sock *relay_po;
728
729                 err = -EBUSY;
730                 if (sk->sk_state & (PPPOX_BOUND | PPPOX_ZOMBIE | PPPOX_DEAD))
731                         break;
732
733                 err = -ENOTCONN;
734                 if (!(sk->sk_state & PPPOX_CONNECTED))
735                         break;
736
737                 /* PPPoE address from the user specifies an outbound
738                    PPPoE address which frames are forwarded to */
739                 err = -EFAULT;
740                 if (copy_from_user(&po->pppoe_relay,
741                                    (void __user *)arg,
742                                    sizeof(struct sockaddr_pppox)))
743                         break;
744
745                 err = -EINVAL;
746                 if (po->pppoe_relay.sa_family != AF_PPPOX ||
747                     po->pppoe_relay.sa_protocol!= PX_PROTO_OE)
748                         break;
749
750                 /* Check that the socket referenced by the address
751                    actually exists. */
752                 relay_po = get_item_by_addr(&po->pppoe_relay);
753
754                 if (!relay_po)
755                         break;
756
757                 sock_put(sk_pppox(relay_po));
758                 sk->sk_state |= PPPOX_RELAY;
759                 err = 0;
760                 break;
761         }
762
763         case PPPOEIOCDFWD:
764                 err = -EALREADY;
765                 if (!(sk->sk_state & PPPOX_RELAY))
766                         break;
767
768                 sk->sk_state &= ~PPPOX_RELAY;
769                 err = 0;
770                 break;
771
772         default:
773                 err = -ENOTTY;
774         }
775
776         return err;
777 }
778
779
780 static int pppoe_sendmsg(struct kiocb *iocb, struct socket *sock,
781                   struct msghdr *m, size_t total_len)
782 {
783         struct sk_buff *skb;
784         struct sock *sk = sock->sk;
785         struct pppox_sock *po = pppox_sk(sk);
786         int error;
787         struct pppoe_hdr hdr;
788         struct pppoe_hdr *ph;
789         struct net_device *dev;
790         char *start;
791
792         lock_sock(sk);
793         if (sock_flag(sk, SOCK_DEAD) || !(sk->sk_state & PPPOX_CONNECTED)) {
794                 error = -ENOTCONN;
795                 goto end;
796         }
797
798         hdr.ver = 1;
799         hdr.type = 1;
800         hdr.code = 0;
801         hdr.sid = po->num;
802
803         dev = po->pppoe_dev;
804
805         error = -EMSGSIZE;
806         if (total_len > (dev->mtu + dev->hard_header_len))
807                 goto end;
808
809
810         skb = sock_wmalloc(sk, total_len + dev->hard_header_len + 32,
811                            0, GFP_KERNEL);
812         if (!skb) {
813                 error = -ENOMEM;
814                 goto end;
815         }
816
817         /* Reserve space for headers. */
818         skb_reserve(skb, dev->hard_header_len);
819         skb_reset_network_header(skb);
820
821         skb->dev = dev;
822
823         skb->priority = sk->sk_priority;
824         skb->protocol = __constant_htons(ETH_P_PPP_SES);
825
826         ph = (struct pppoe_hdr *) skb_put(skb, total_len + sizeof(struct pppoe_hdr));
827         start = (char *) &ph->tag[0];
828
829         error = memcpy_fromiovec(start, m->msg_iov, total_len);
830
831         if (error < 0) {
832                 kfree_skb(skb);
833                 goto end;
834         }
835
836         error = total_len;
837         dev_hard_header(skb, dev, ETH_P_PPP_SES,
838                         po->pppoe_pa.remote, NULL, total_len);
839
840         memcpy(ph, &hdr, sizeof(struct pppoe_hdr));
841
842         ph->length = htons(total_len);
843
844         dev_queue_xmit(skb);
845
846 end:
847         release_sock(sk);
848         return error;
849 }
850
851
852 /************************************************************************
853  *
854  * xmit function for internal use.
855  *
856  ***********************************************************************/
857 static int __pppoe_xmit(struct sock *sk, struct sk_buff *skb)
858 {
859         struct pppox_sock *po = pppox_sk(sk);
860         struct net_device *dev = po->pppoe_dev;
861         struct pppoe_hdr *ph;
862         int data_len = skb->len;
863
864         if (sock_flag(sk, SOCK_DEAD) || !(sk->sk_state & PPPOX_CONNECTED))
865                 goto abort;
866
867         if (!dev)
868                 goto abort;
869
870         /* Copy the data if there is no space for the header or if it's
871          * read-only.
872          */
873         if (skb_cow_head(skb, sizeof(*ph) + dev->hard_header_len))
874                 goto abort;
875
876         __skb_push(skb, sizeof(*ph));
877         skb_reset_network_header(skb);
878
879         ph = pppoe_hdr(skb);
880         ph->ver = 1;
881         ph->type = 1;
882         ph->code = 0;
883         ph->sid = po->num;
884         ph->length = htons(data_len);
885
886         skb->protocol = __constant_htons(ETH_P_PPP_SES);
887         skb->dev = dev;
888
889         dev_hard_header(skb, dev, ETH_P_PPP_SES,
890                         po->pppoe_pa.remote, NULL, data_len);
891
892         dev_queue_xmit(skb);
893
894         return 1;
895
896 abort:
897         kfree_skb(skb);
898         return 1;
899 }
900
901
902 /************************************************************************
903  *
904  * xmit function called by generic PPP driver
905  * sends PPP frame over PPPoE socket
906  *
907  ***********************************************************************/
908 static int pppoe_xmit(struct ppp_channel *chan, struct sk_buff *skb)
909 {
910         struct sock *sk = (struct sock *) chan->private;
911         return __pppoe_xmit(sk, skb);
912 }
913
914
915 static struct ppp_channel_ops pppoe_chan_ops = {
916         .start_xmit = pppoe_xmit,
917 };
918
919 static int pppoe_recvmsg(struct kiocb *iocb, struct socket *sock,
920                   struct msghdr *m, size_t total_len, int flags)
921 {
922         struct sock *sk = sock->sk;
923         struct sk_buff *skb;
924         int error = 0;
925
926         if (sk->sk_state & PPPOX_BOUND) {
927                 error = -EIO;
928                 goto end;
929         }
930
931         skb = skb_recv_datagram(sk, flags & ~MSG_DONTWAIT,
932                                 flags & MSG_DONTWAIT, &error);
933
934         if (error < 0)
935                 goto end;
936
937         m->msg_namelen = 0;
938
939         if (skb) {
940                 struct pppoe_hdr *ph = pppoe_hdr(skb);
941                 const int len = ntohs(ph->length);
942
943                 error = memcpy_toiovec(m->msg_iov, (unsigned char *) &ph->tag[0], len);
944                 if (error == 0)
945                         error = len;
946         }
947
948         kfree_skb(skb);
949 end:
950         return error;
951 }
952
953 #ifdef CONFIG_PROC_FS
954 static int pppoe_seq_show(struct seq_file *seq, void *v)
955 {
956         struct pppox_sock *po;
957         char *dev_name;
958         DECLARE_MAC_BUF(mac);
959
960         if (v == SEQ_START_TOKEN) {
961                 seq_puts(seq, "Id       Address              Device\n");
962                 goto out;
963         }
964
965         po = v;
966         dev_name = po->pppoe_pa.dev;
967
968         seq_printf(seq, "%08X %s %8s\n",
969                    po->pppoe_pa.sid, print_mac(mac, po->pppoe_pa.remote), dev_name);
970 out:
971         return 0;
972 }
973
974 static __inline__ struct pppox_sock *pppoe_get_idx(loff_t pos)
975 {
976         struct pppox_sock *po;
977         int i = 0;
978
979         for (; i < PPPOE_HASH_SIZE; i++) {
980                 po = item_hash_table[i];
981                 while (po) {
982                         if (!pos--)
983                                 goto out;
984                         po = po->next;
985                 }
986         }
987 out:
988         return po;
989 }
990
991 static void *pppoe_seq_start(struct seq_file *seq, loff_t *pos)
992 {
993         loff_t l = *pos;
994
995         read_lock_bh(&pppoe_hash_lock);
996         return l ? pppoe_get_idx(--l) : SEQ_START_TOKEN;
997 }
998
999 static void *pppoe_seq_next(struct seq_file *seq, void *v, loff_t *pos)
1000 {
1001         struct pppox_sock *po;
1002
1003         ++*pos;
1004         if (v == SEQ_START_TOKEN) {
1005                 po = pppoe_get_idx(0);
1006                 goto out;
1007         }
1008         po = v;
1009         if (po->next)
1010                 po = po->next;
1011         else {
1012                 int hash = hash_item(po->pppoe_pa.sid, po->pppoe_pa.remote);
1013
1014                 while (++hash < PPPOE_HASH_SIZE) {
1015                         po = item_hash_table[hash];
1016                         if (po)
1017                                 break;
1018                 }
1019         }
1020 out:
1021         return po;
1022 }
1023
1024 static void pppoe_seq_stop(struct seq_file *seq, void *v)
1025 {
1026         read_unlock_bh(&pppoe_hash_lock);
1027 }
1028
1029 static struct seq_operations pppoe_seq_ops = {
1030         .start          = pppoe_seq_start,
1031         .next           = pppoe_seq_next,
1032         .stop           = pppoe_seq_stop,
1033         .show           = pppoe_seq_show,
1034 };
1035
1036 static int pppoe_seq_open(struct inode *inode, struct file *file)
1037 {
1038         return seq_open(file, &pppoe_seq_ops);
1039 }
1040
1041 static const struct file_operations pppoe_seq_fops = {
1042         .owner          = THIS_MODULE,
1043         .open           = pppoe_seq_open,
1044         .read           = seq_read,
1045         .llseek         = seq_lseek,
1046         .release        = seq_release,
1047 };
1048
1049 static int __init pppoe_proc_init(void)
1050 {
1051         struct proc_dir_entry *p;
1052
1053         p = create_proc_entry("pppoe", S_IRUGO, init_net.proc_net);
1054         if (!p)
1055                 return -ENOMEM;
1056
1057         p->proc_fops = &pppoe_seq_fops;
1058         return 0;
1059 }
1060 #else /* CONFIG_PROC_FS */
1061 static inline int pppoe_proc_init(void) { return 0; }
1062 #endif /* CONFIG_PROC_FS */
1063
1064 static const struct proto_ops pppoe_ops = {
1065     .family             = AF_PPPOX,
1066     .owner              = THIS_MODULE,
1067     .release            = pppoe_release,
1068     .bind               = sock_no_bind,
1069     .connect            = pppoe_connect,
1070     .socketpair         = sock_no_socketpair,
1071     .accept             = sock_no_accept,
1072     .getname            = pppoe_getname,
1073     .poll               = datagram_poll,
1074     .listen             = sock_no_listen,
1075     .shutdown           = sock_no_shutdown,
1076     .setsockopt         = sock_no_setsockopt,
1077     .getsockopt         = sock_no_getsockopt,
1078     .sendmsg            = pppoe_sendmsg,
1079     .recvmsg            = pppoe_recvmsg,
1080     .mmap               = sock_no_mmap,
1081     .ioctl              = pppox_ioctl,
1082 };
1083
1084 static struct pppox_proto pppoe_proto = {
1085     .create     = pppoe_create,
1086     .ioctl      = pppoe_ioctl,
1087     .owner      = THIS_MODULE,
1088 };
1089
1090
1091 static int __init pppoe_init(void)
1092 {
1093         int err = proto_register(&pppoe_sk_proto, 0);
1094
1095         if (err)
1096                 goto out;
1097
1098         err = register_pppox_proto(PX_PROTO_OE, &pppoe_proto);
1099         if (err)
1100                 goto out_unregister_pppoe_proto;
1101
1102         err = pppoe_proc_init();
1103         if (err)
1104                 goto out_unregister_pppox_proto;
1105
1106         dev_add_pack(&pppoes_ptype);
1107         dev_add_pack(&pppoed_ptype);
1108         register_netdevice_notifier(&pppoe_notifier);
1109 out:
1110         return err;
1111 out_unregister_pppox_proto:
1112         unregister_pppox_proto(PX_PROTO_OE);
1113 out_unregister_pppoe_proto:
1114         proto_unregister(&pppoe_sk_proto);
1115         goto out;
1116 }
1117
1118 static void __exit pppoe_exit(void)
1119 {
1120         unregister_pppox_proto(PX_PROTO_OE);
1121         dev_remove_pack(&pppoes_ptype);
1122         dev_remove_pack(&pppoed_ptype);
1123         unregister_netdevice_notifier(&pppoe_notifier);
1124         remove_proc_entry("pppoe", init_net.proc_net);
1125         proto_unregister(&pppoe_sk_proto);
1126 }
1127
1128 module_init(pppoe_init);
1129 module_exit(pppoe_exit);
1130
1131 MODULE_AUTHOR("Michal Ostrowski <mostrows@speakeasy.net>");
1132 MODULE_DESCRIPTION("PPP over Ethernet driver");
1133 MODULE_LICENSE("GPL");
1134 MODULE_ALIAS_NETPROTO(PF_PPPOX);