Merge commit 'v2.6.29-rc7' into core/locking
[linux-2.6] / drivers / net / pppoe.c
1 /** -*- linux-c -*- ***********************************************************
2  * Linux PPP over Ethernet (PPPoX/PPPoE) Sockets
3  *
4  * PPPoX --- Generic PPP encapsulation socket family
5  * PPPoE --- PPP over Ethernet (RFC 2516)
6  *
7  *
8  * Version:     0.7.0
9  *
10  * 070228 :     Fix to allow multiple sessions with same remote MAC and same
11  *              session id by including the local device ifindex in the
12  *              tuple identifying a session. This also ensures packets can't
13  *              be injected into a session from interfaces other than the one
14  *              specified by userspace. Florian Zumbiehl <florz@florz.de>
15  *              (Oh, BTW, this one is YYMMDD, in case you were wondering ...)
16  * 220102 :     Fix module use count on failure in pppoe_create, pppox_sk -acme
17  * 030700 :     Fixed connect logic to allow for disconnect.
18  * 270700 :     Fixed potential SMP problems; we must protect against
19  *              simultaneous invocation of ppp_input
20  *              and ppp_unregister_channel.
21  * 040800 :     Respect reference count mechanisms on net-devices.
22  * 200800 :     fix kfree(skb) in pppoe_rcv (acme)
23  *              Module reference count is decremented in the right spot now,
24  *              guards against sock_put not actually freeing the sk
25  *              in pppoe_release.
26  * 051000 :     Initialization cleanup.
27  * 111100 :     Fix recvmsg.
28  * 050101 :     Fix PADT procesing.
29  * 140501 :     Use pppoe_rcv_core to handle all backlog. (Alexey)
30  * 170701 :     Do not lock_sock with rwlock held. (DaveM)
31  *              Ignore discovery frames if user has socket
32  *              locked. (DaveM)
33  *              Ignore return value of dev_queue_xmit in __pppoe_xmit
34  *              or else we may kfree an SKB twice. (DaveM)
35  * 190701 :     When doing copies of skb's in __pppoe_xmit, always delete
36  *              the original skb that was passed in on success, never on
37  *              failure.  Delete the copy of the skb on failure to avoid
38  *              a memory leak.
39  * 081001 :     Misc. cleanup (licence string, non-blocking, prevent
40  *              reference of device on close).
41  * 121301 :     New ppp channels interface; cannot unregister a channel
42  *              from interrupts.  Thus, we mark the socket as a ZOMBIE
43  *              and do the unregistration later.
44  * 081002 :     seq_file support for proc stuff -acme
45  * 111602 :     Merge all 2.4 fixes into 2.5/2.6 tree.  Label 2.5/2.6
46  *              as version 0.7.  Spacing cleanup.
47  * Author:      Michal Ostrowski <mostrows@speakeasy.net>
48  * Contributors:
49  *              Arnaldo Carvalho de Melo <acme@conectiva.com.br>
50  *              David S. Miller (davem@redhat.com)
51  *
52  * License:
53  *              This program is free software; you can redistribute it and/or
54  *              modify it under the terms of the GNU General Public License
55  *              as published by the Free Software Foundation; either version
56  *              2 of the License, or (at your option) any later version.
57  *
58  */
59
60 #include <linux/string.h>
61 #include <linux/module.h>
62 #include <linux/kernel.h>
63 #include <linux/slab.h>
64 #include <linux/errno.h>
65 #include <linux/netdevice.h>
66 #include <linux/net.h>
67 #include <linux/inetdevice.h>
68 #include <linux/etherdevice.h>
69 #include <linux/skbuff.h>
70 #include <linux/init.h>
71 #include <linux/if_ether.h>
72 #include <linux/if_pppox.h>
73 #include <linux/ppp_channel.h>
74 #include <linux/ppp_defs.h>
75 #include <linux/if_ppp.h>
76 #include <linux/notifier.h>
77 #include <linux/file.h>
78 #include <linux/proc_fs.h>
79 #include <linux/seq_file.h>
80
81 #include <net/net_namespace.h>
82 #include <net/sock.h>
83
84 #include <asm/uaccess.h>
85
86 #define PPPOE_HASH_BITS 4
87 #define PPPOE_HASH_SIZE (1<<PPPOE_HASH_BITS)
88
89 static struct ppp_channel_ops pppoe_chan_ops;
90
91 static int pppoe_ioctl(struct socket *sock, unsigned int cmd, unsigned long arg);
92 static int pppoe_xmit(struct ppp_channel *chan, struct sk_buff *skb);
93 static int __pppoe_xmit(struct sock *sk, struct sk_buff *skb);
94
95 static const struct proto_ops pppoe_ops;
96 static DEFINE_RWLOCK(pppoe_hash_lock);
97
98 static struct ppp_channel_ops pppoe_chan_ops;
99
100 static inline int cmp_2_addr(struct pppoe_addr *a, struct pppoe_addr *b)
101 {
102         return (a->sid == b->sid &&
103                 (memcmp(a->remote, b->remote, ETH_ALEN) == 0));
104 }
105
106 static inline int cmp_addr(struct pppoe_addr *a, __be16 sid, char *addr)
107 {
108         return (a->sid == sid &&
109                 (memcmp(a->remote,addr,ETH_ALEN) == 0));
110 }
111
112 #if 8%PPPOE_HASH_BITS
113 #error 8 must be a multiple of PPPOE_HASH_BITS
114 #endif
115
116 static int hash_item(__be16 sid, unsigned char *addr)
117 {
118         unsigned char hash = 0;
119         unsigned int i;
120
121         for (i = 0 ; i < ETH_ALEN ; i++) {
122                 hash ^= addr[i];
123         }
124         for (i = 0 ; i < sizeof(sid_t)*8 ; i += 8 ){
125                 hash ^= (__force __u32)sid>>i;
126         }
127         for (i = 8 ; (i>>=1) >= PPPOE_HASH_BITS ; ) {
128                 hash ^= hash>>i;
129         }
130
131         return hash & ( PPPOE_HASH_SIZE - 1 );
132 }
133
134 /* zeroed because its in .bss */
135 static struct pppox_sock *item_hash_table[PPPOE_HASH_SIZE];
136
137 /**********************************************************************
138  *
139  *  Set/get/delete/rehash items  (internal versions)
140  *
141  **********************************************************************/
142 static struct pppox_sock *__get_item(__be16 sid, unsigned char *addr, int ifindex)
143 {
144         int hash = hash_item(sid, addr);
145         struct pppox_sock *ret;
146
147         ret = item_hash_table[hash];
148
149         while (ret && !(cmp_addr(&ret->pppoe_pa, sid, addr) && ret->pppoe_ifindex == ifindex))
150                 ret = ret->next;
151
152         return ret;
153 }
154
155 static int __set_item(struct pppox_sock *po)
156 {
157         int hash = hash_item(po->pppoe_pa.sid, po->pppoe_pa.remote);
158         struct pppox_sock *ret;
159
160         ret = item_hash_table[hash];
161         while (ret) {
162                 if (cmp_2_addr(&ret->pppoe_pa, &po->pppoe_pa) && ret->pppoe_ifindex == po->pppoe_ifindex)
163                         return -EALREADY;
164
165                 ret = ret->next;
166         }
167
168         po->next = item_hash_table[hash];
169         item_hash_table[hash] = po;
170
171         return 0;
172 }
173
174 static struct pppox_sock *__delete_item(__be16 sid, char *addr, int ifindex)
175 {
176         int hash = hash_item(sid, addr);
177         struct pppox_sock *ret, **src;
178
179         ret = item_hash_table[hash];
180         src = &item_hash_table[hash];
181
182         while (ret) {
183                 if (cmp_addr(&ret->pppoe_pa, sid, addr) && ret->pppoe_ifindex == ifindex) {
184                         *src = ret->next;
185                         break;
186                 }
187
188                 src = &ret->next;
189                 ret = ret->next;
190         }
191
192         return ret;
193 }
194
195 /**********************************************************************
196  *
197  *  Set/get/delete/rehash items
198  *
199  **********************************************************************/
200 static inline struct pppox_sock *get_item(__be16 sid,
201                                          unsigned char *addr, int ifindex)
202 {
203         struct pppox_sock *po;
204
205         read_lock_bh(&pppoe_hash_lock);
206         po = __get_item(sid, addr, ifindex);
207         if (po)
208                 sock_hold(sk_pppox(po));
209         read_unlock_bh(&pppoe_hash_lock);
210
211         return po;
212 }
213
214 static inline struct pppox_sock *get_item_by_addr(struct sockaddr_pppox *sp)
215 {
216         struct net_device *dev;
217         int ifindex;
218
219         dev = dev_get_by_name(&init_net, sp->sa_addr.pppoe.dev);
220         if(!dev)
221                 return NULL;
222         ifindex = dev->ifindex;
223         dev_put(dev);
224         return get_item(sp->sa_addr.pppoe.sid, sp->sa_addr.pppoe.remote, ifindex);
225 }
226
227 static inline struct pppox_sock *delete_item(__be16 sid, char *addr, int ifindex)
228 {
229         struct pppox_sock *ret;
230
231         write_lock_bh(&pppoe_hash_lock);
232         ret = __delete_item(sid, addr, ifindex);
233         write_unlock_bh(&pppoe_hash_lock);
234
235         return ret;
236 }
237
238
239
240 /***************************************************************************
241  *
242  *  Handler for device events.
243  *  Certain device events require that sockets be unconnected.
244  *
245  **************************************************************************/
246
247 static void pppoe_flush_dev(struct net_device *dev)
248 {
249         int hash;
250         BUG_ON(dev == NULL);
251
252         write_lock_bh(&pppoe_hash_lock);
253         for (hash = 0; hash < PPPOE_HASH_SIZE; hash++) {
254                 struct pppox_sock *po = item_hash_table[hash];
255
256                 while (po != NULL) {
257                         struct sock *sk = sk_pppox(po);
258                         if (po->pppoe_dev != dev) {
259                                 po = po->next;
260                                 continue;
261                         }
262                         po->pppoe_dev = NULL;
263                         dev_put(dev);
264
265
266                         /* We always grab the socket lock, followed by the
267                          * pppoe_hash_lock, in that order.  Since we should
268                          * hold the sock lock while doing any unbinding,
269                          * we need to release the lock we're holding.
270                          * Hold a reference to the sock so it doesn't disappear
271                          * as we're jumping between locks.
272                          */
273
274                         sock_hold(sk);
275
276                         write_unlock_bh(&pppoe_hash_lock);
277                         lock_sock(sk);
278
279                         if (sk->sk_state & (PPPOX_CONNECTED | PPPOX_BOUND)) {
280                                 pppox_unbind_sock(sk);
281                                 sk->sk_state = PPPOX_ZOMBIE;
282                                 sk->sk_state_change(sk);
283                         }
284
285                         release_sock(sk);
286                         sock_put(sk);
287
288                         /* Restart scan at the beginning of this hash chain.
289                          * While the lock was dropped the chain contents may
290                          * have changed.
291                          */
292                         write_lock_bh(&pppoe_hash_lock);
293                         po = item_hash_table[hash];
294                 }
295         }
296         write_unlock_bh(&pppoe_hash_lock);
297 }
298
299 static int pppoe_device_event(struct notifier_block *this,
300                               unsigned long event, void *ptr)
301 {
302         struct net_device *dev = (struct net_device *) ptr;
303
304         if (dev_net(dev) != &init_net)
305                 return NOTIFY_DONE;
306
307         /* Only look at sockets that are using this specific device. */
308         switch (event) {
309         case NETDEV_CHANGEMTU:
310                 /* A change in mtu is a bad thing, requiring
311                  * LCP re-negotiation.
312                  */
313
314         case NETDEV_GOING_DOWN:
315         case NETDEV_DOWN:
316                 /* Find every socket on this device and kill it. */
317                 pppoe_flush_dev(dev);
318                 break;
319
320         default:
321                 break;
322         };
323
324         return NOTIFY_DONE;
325 }
326
327
328 static struct notifier_block pppoe_notifier = {
329         .notifier_call = pppoe_device_event,
330 };
331
332
333 /************************************************************************
334  *
335  * Do the real work of receiving a PPPoE Session frame.
336  *
337  ***********************************************************************/
338 static int pppoe_rcv_core(struct sock *sk, struct sk_buff *skb)
339 {
340         struct pppox_sock *po = pppox_sk(sk);
341         struct pppox_sock *relay_po;
342
343         if (sk->sk_state & PPPOX_BOUND) {
344                 ppp_input(&po->chan, skb);
345         } else if (sk->sk_state & PPPOX_RELAY) {
346                 relay_po = get_item_by_addr(&po->pppoe_relay);
347
348                 if (relay_po == NULL)
349                         goto abort_kfree;
350
351                 if ((sk_pppox(relay_po)->sk_state & PPPOX_CONNECTED) == 0)
352                         goto abort_put;
353
354                 if (!__pppoe_xmit(sk_pppox(relay_po), skb))
355                         goto abort_put;
356         } else {
357                 if (sock_queue_rcv_skb(sk, skb))
358                         goto abort_kfree;
359         }
360
361         return NET_RX_SUCCESS;
362
363 abort_put:
364         sock_put(sk_pppox(relay_po));
365
366 abort_kfree:
367         kfree_skb(skb);
368         return NET_RX_DROP;
369 }
370
371 /************************************************************************
372  *
373  * Receive wrapper called in BH context.
374  *
375  ***********************************************************************/
376 static int pppoe_rcv(struct sk_buff *skb,
377                      struct net_device *dev,
378                      struct packet_type *pt,
379                      struct net_device *orig_dev)
380
381 {
382         struct pppoe_hdr *ph;
383         struct pppox_sock *po;
384         int len;
385
386         if (!(skb = skb_share_check(skb, GFP_ATOMIC)))
387                 goto out;
388
389         if (dev_net(dev) != &init_net)
390                 goto drop;
391
392         if (!pskb_may_pull(skb, sizeof(struct pppoe_hdr)))
393                 goto drop;
394
395         ph = pppoe_hdr(skb);
396         len = ntohs(ph->length);
397
398         skb_pull_rcsum(skb, sizeof(*ph));
399         if (skb->len < len)
400                 goto drop;
401
402         if (pskb_trim_rcsum(skb, len))
403                 goto drop;
404
405         po = get_item(ph->sid, eth_hdr(skb)->h_source, dev->ifindex);
406         if (!po)
407                 goto drop;
408
409         return sk_receive_skb(sk_pppox(po), skb, 0);
410
411 drop:
412         kfree_skb(skb);
413 out:
414         return NET_RX_DROP;
415 }
416
417 /************************************************************************
418  *
419  * Receive a PPPoE Discovery frame.
420  * This is solely for detection of PADT frames
421  *
422  ***********************************************************************/
423 static int pppoe_disc_rcv(struct sk_buff *skb,
424                           struct net_device *dev,
425                           struct packet_type *pt,
426                           struct net_device *orig_dev)
427
428 {
429         struct pppoe_hdr *ph;
430         struct pppox_sock *po;
431
432         if (dev_net(dev) != &init_net)
433                 goto abort;
434
435         if (!(skb = skb_share_check(skb, GFP_ATOMIC)))
436                 goto out;
437
438         if (!pskb_may_pull(skb, sizeof(struct pppoe_hdr)))
439                 goto abort;
440
441         ph = pppoe_hdr(skb);
442         if (ph->code != PADT_CODE)
443                 goto abort;
444
445         po = get_item(ph->sid, eth_hdr(skb)->h_source, dev->ifindex);
446         if (po) {
447                 struct sock *sk = sk_pppox(po);
448
449                 bh_lock_sock(sk);
450
451                 /* If the user has locked the socket, just ignore
452                  * the packet.  With the way two rcv protocols hook into
453                  * one socket family type, we cannot (easily) distinguish
454                  * what kind of SKB it is during backlog rcv.
455                  */
456                 if (sock_owned_by_user(sk) == 0) {
457                         /* We're no longer connect at the PPPOE layer,
458                          * and must wait for ppp channel to disconnect us.
459                          */
460                         sk->sk_state = PPPOX_ZOMBIE;
461                 }
462
463                 bh_unlock_sock(sk);
464                 sock_put(sk);
465         }
466
467 abort:
468         kfree_skb(skb);
469 out:
470         return NET_RX_SUCCESS; /* Lies... :-) */
471 }
472
473 static struct packet_type pppoes_ptype = {
474         .type   = __constant_htons(ETH_P_PPP_SES),
475         .func   = pppoe_rcv,
476 };
477
478 static struct packet_type pppoed_ptype = {
479         .type   = __constant_htons(ETH_P_PPP_DISC),
480         .func   = pppoe_disc_rcv,
481 };
482
483 static struct proto pppoe_sk_proto = {
484         .name     = "PPPOE",
485         .owner    = THIS_MODULE,
486         .obj_size = sizeof(struct pppox_sock),
487 };
488
489 /***********************************************************************
490  *
491  * Initialize a new struct sock.
492  *
493  **********************************************************************/
494 static int pppoe_create(struct net *net, struct socket *sock)
495 {
496         int error = -ENOMEM;
497         struct sock *sk;
498
499         sk = sk_alloc(net, PF_PPPOX, GFP_KERNEL, &pppoe_sk_proto);
500         if (!sk)
501                 goto out;
502
503         sock_init_data(sock, sk);
504
505         sock->state = SS_UNCONNECTED;
506         sock->ops   = &pppoe_ops;
507
508         sk->sk_backlog_rcv = pppoe_rcv_core;
509         sk->sk_state       = PPPOX_NONE;
510         sk->sk_type        = SOCK_STREAM;
511         sk->sk_family      = PF_PPPOX;
512         sk->sk_protocol    = PX_PROTO_OE;
513
514         error = 0;
515 out:    return error;
516 }
517
518 static int pppoe_release(struct socket *sock)
519 {
520         struct sock *sk = sock->sk;
521         struct pppox_sock *po;
522
523         if (!sk)
524                 return 0;
525
526         lock_sock(sk);
527         if (sock_flag(sk, SOCK_DEAD)){
528                 release_sock(sk);
529                 return -EBADF;
530         }
531
532         pppox_unbind_sock(sk);
533
534         /* Signal the death of the socket. */
535         sk->sk_state = PPPOX_DEAD;
536
537
538         /* Write lock on hash lock protects the entire "po" struct from
539          * concurrent updates via pppoe_flush_dev. The "po" struct should
540          * be considered part of the hash table contents, thus protected
541          * by the hash table lock */
542         write_lock_bh(&pppoe_hash_lock);
543
544         po = pppox_sk(sk);
545         if (po->pppoe_pa.sid) {
546                 __delete_item(po->pppoe_pa.sid,
547                               po->pppoe_pa.remote, po->pppoe_ifindex);
548         }
549
550         if (po->pppoe_dev) {
551                 dev_put(po->pppoe_dev);
552                 po->pppoe_dev = NULL;
553         }
554
555         write_unlock_bh(&pppoe_hash_lock);
556
557         sock_orphan(sk);
558         sock->sk = NULL;
559
560         skb_queue_purge(&sk->sk_receive_queue);
561         release_sock(sk);
562         sock_put(sk);
563
564         return 0;
565 }
566
567
568 static int pppoe_connect(struct socket *sock, struct sockaddr *uservaddr,
569                   int sockaddr_len, int flags)
570 {
571         struct sock *sk = sock->sk;
572         struct net_device *dev;
573         struct sockaddr_pppox *sp = (struct sockaddr_pppox *) uservaddr;
574         struct pppox_sock *po = pppox_sk(sk);
575         int error;
576
577         lock_sock(sk);
578
579         error = -EINVAL;
580         if (sp->sa_protocol != PX_PROTO_OE)
581                 goto end;
582
583         /* Check for already bound sockets */
584         error = -EBUSY;
585         if ((sk->sk_state & PPPOX_CONNECTED) && sp->sa_addr.pppoe.sid)
586                 goto end;
587
588         /* Check for already disconnected sockets, on attempts to disconnect */
589         error = -EALREADY;
590         if ((sk->sk_state & PPPOX_DEAD) && !sp->sa_addr.pppoe.sid )
591                 goto end;
592
593         error = 0;
594         if (po->pppoe_pa.sid) {
595                 pppox_unbind_sock(sk);
596
597                 /* Delete the old binding */
598                 delete_item(po->pppoe_pa.sid,po->pppoe_pa.remote,po->pppoe_ifindex);
599
600                 if(po->pppoe_dev)
601                         dev_put(po->pppoe_dev);
602
603                 memset(sk_pppox(po) + 1, 0,
604                        sizeof(struct pppox_sock) - sizeof(struct sock));
605
606                 sk->sk_state = PPPOX_NONE;
607         }
608
609         /* Don't re-bind if sid==0 */
610         if (sp->sa_addr.pppoe.sid != 0) {
611                 dev = dev_get_by_name(&init_net, sp->sa_addr.pppoe.dev);
612
613                 error = -ENODEV;
614                 if (!dev)
615                         goto end;
616
617                 po->pppoe_dev = dev;
618                 po->pppoe_ifindex = dev->ifindex;
619
620                 write_lock_bh(&pppoe_hash_lock);
621                 if (!(dev->flags & IFF_UP)){
622                         write_unlock_bh(&pppoe_hash_lock);
623                         goto err_put;
624                 }
625
626                 memcpy(&po->pppoe_pa,
627                        &sp->sa_addr.pppoe,
628                        sizeof(struct pppoe_addr));
629
630                 error = __set_item(po);
631                 write_unlock_bh(&pppoe_hash_lock);
632                 if (error < 0)
633                         goto err_put;
634
635                 po->chan.hdrlen = (sizeof(struct pppoe_hdr) +
636                                    dev->hard_header_len);
637
638                 po->chan.mtu = dev->mtu - sizeof(struct pppoe_hdr);
639                 po->chan.private = sk;
640                 po->chan.ops = &pppoe_chan_ops;
641
642                 error = ppp_register_channel(&po->chan);
643                 if (error)
644                         goto err_put;
645
646                 sk->sk_state = PPPOX_CONNECTED;
647         }
648
649         po->num = sp->sa_addr.pppoe.sid;
650
651  end:
652         release_sock(sk);
653         return error;
654 err_put:
655         if (po->pppoe_dev) {
656                 dev_put(po->pppoe_dev);
657                 po->pppoe_dev = NULL;
658         }
659         goto end;
660 }
661
662
663 static int pppoe_getname(struct socket *sock, struct sockaddr *uaddr,
664                   int *usockaddr_len, int peer)
665 {
666         int len = sizeof(struct sockaddr_pppox);
667         struct sockaddr_pppox sp;
668
669         sp.sa_family    = AF_PPPOX;
670         sp.sa_protocol  = PX_PROTO_OE;
671         memcpy(&sp.sa_addr.pppoe, &pppox_sk(sock->sk)->pppoe_pa,
672                sizeof(struct pppoe_addr));
673
674         memcpy(uaddr, &sp, len);
675
676         *usockaddr_len = len;
677
678         return 0;
679 }
680
681
682 static int pppoe_ioctl(struct socket *sock, unsigned int cmd,
683                 unsigned long arg)
684 {
685         struct sock *sk = sock->sk;
686         struct pppox_sock *po = pppox_sk(sk);
687         int val;
688         int err;
689
690         switch (cmd) {
691         case PPPIOCGMRU:
692                 err = -ENXIO;
693
694                 if (!(sk->sk_state & PPPOX_CONNECTED))
695                         break;
696
697                 err = -EFAULT;
698                 if (put_user(po->pppoe_dev->mtu -
699                              sizeof(struct pppoe_hdr) -
700                              PPP_HDRLEN,
701                              (int __user *) arg))
702                         break;
703                 err = 0;
704                 break;
705
706         case PPPIOCSMRU:
707                 err = -ENXIO;
708                 if (!(sk->sk_state & PPPOX_CONNECTED))
709                         break;
710
711                 err = -EFAULT;
712                 if (get_user(val,(int __user *) arg))
713                         break;
714
715                 if (val < (po->pppoe_dev->mtu
716                            - sizeof(struct pppoe_hdr)
717                            - PPP_HDRLEN))
718                         err = 0;
719                 else
720                         err = -EINVAL;
721                 break;
722
723         case PPPIOCSFLAGS:
724                 err = -EFAULT;
725                 if (get_user(val, (int __user *) arg))
726                         break;
727                 err = 0;
728                 break;
729
730         case PPPOEIOCSFWD:
731         {
732                 struct pppox_sock *relay_po;
733
734                 err = -EBUSY;
735                 if (sk->sk_state & (PPPOX_BOUND | PPPOX_ZOMBIE | PPPOX_DEAD))
736                         break;
737
738                 err = -ENOTCONN;
739                 if (!(sk->sk_state & PPPOX_CONNECTED))
740                         break;
741
742                 /* PPPoE address from the user specifies an outbound
743                    PPPoE address which frames are forwarded to */
744                 err = -EFAULT;
745                 if (copy_from_user(&po->pppoe_relay,
746                                    (void __user *)arg,
747                                    sizeof(struct sockaddr_pppox)))
748                         break;
749
750                 err = -EINVAL;
751                 if (po->pppoe_relay.sa_family != AF_PPPOX ||
752                     po->pppoe_relay.sa_protocol!= PX_PROTO_OE)
753                         break;
754
755                 /* Check that the socket referenced by the address
756                    actually exists. */
757                 relay_po = get_item_by_addr(&po->pppoe_relay);
758
759                 if (!relay_po)
760                         break;
761
762                 sock_put(sk_pppox(relay_po));
763                 sk->sk_state |= PPPOX_RELAY;
764                 err = 0;
765                 break;
766         }
767
768         case PPPOEIOCDFWD:
769                 err = -EALREADY;
770                 if (!(sk->sk_state & PPPOX_RELAY))
771                         break;
772
773                 sk->sk_state &= ~PPPOX_RELAY;
774                 err = 0;
775                 break;
776
777         default:
778                 err = -ENOTTY;
779         }
780
781         return err;
782 }
783
784
785 static int pppoe_sendmsg(struct kiocb *iocb, struct socket *sock,
786                   struct msghdr *m, size_t total_len)
787 {
788         struct sk_buff *skb;
789         struct sock *sk = sock->sk;
790         struct pppox_sock *po = pppox_sk(sk);
791         int error;
792         struct pppoe_hdr hdr;
793         struct pppoe_hdr *ph;
794         struct net_device *dev;
795         char *start;
796
797         lock_sock(sk);
798         if (sock_flag(sk, SOCK_DEAD) || !(sk->sk_state & PPPOX_CONNECTED)) {
799                 error = -ENOTCONN;
800                 goto end;
801         }
802
803         hdr.ver = 1;
804         hdr.type = 1;
805         hdr.code = 0;
806         hdr.sid = po->num;
807
808         dev = po->pppoe_dev;
809
810         error = -EMSGSIZE;
811         if (total_len > (dev->mtu + dev->hard_header_len))
812                 goto end;
813
814
815         skb = sock_wmalloc(sk, total_len + dev->hard_header_len + 32,
816                            0, GFP_KERNEL);
817         if (!skb) {
818                 error = -ENOMEM;
819                 goto end;
820         }
821
822         /* Reserve space for headers. */
823         skb_reserve(skb, dev->hard_header_len);
824         skb_reset_network_header(skb);
825
826         skb->dev = dev;
827
828         skb->priority = sk->sk_priority;
829         skb->protocol = __constant_htons(ETH_P_PPP_SES);
830
831         ph = (struct pppoe_hdr *) skb_put(skb, total_len + sizeof(struct pppoe_hdr));
832         start = (char *) &ph->tag[0];
833
834         error = memcpy_fromiovec(start, m->msg_iov, total_len);
835
836         if (error < 0) {
837                 kfree_skb(skb);
838                 goto end;
839         }
840
841         error = total_len;
842         dev_hard_header(skb, dev, ETH_P_PPP_SES,
843                         po->pppoe_pa.remote, NULL, total_len);
844
845         memcpy(ph, &hdr, sizeof(struct pppoe_hdr));
846
847         ph->length = htons(total_len);
848
849         dev_queue_xmit(skb);
850
851 end:
852         release_sock(sk);
853         return error;
854 }
855
856
857 /************************************************************************
858  *
859  * xmit function for internal use.
860  *
861  ***********************************************************************/
862 static int __pppoe_xmit(struct sock *sk, struct sk_buff *skb)
863 {
864         struct pppox_sock *po = pppox_sk(sk);
865         struct net_device *dev = po->pppoe_dev;
866         struct pppoe_hdr *ph;
867         int data_len = skb->len;
868
869         if (sock_flag(sk, SOCK_DEAD) || !(sk->sk_state & PPPOX_CONNECTED))
870                 goto abort;
871
872         if (!dev)
873                 goto abort;
874
875         /* Copy the data if there is no space for the header or if it's
876          * read-only.
877          */
878         if (skb_cow_head(skb, sizeof(*ph) + dev->hard_header_len))
879                 goto abort;
880
881         __skb_push(skb, sizeof(*ph));
882         skb_reset_network_header(skb);
883
884         ph = pppoe_hdr(skb);
885         ph->ver = 1;
886         ph->type = 1;
887         ph->code = 0;
888         ph->sid = po->num;
889         ph->length = htons(data_len);
890
891         skb->protocol = __constant_htons(ETH_P_PPP_SES);
892         skb->dev = dev;
893
894         dev_hard_header(skb, dev, ETH_P_PPP_SES,
895                         po->pppoe_pa.remote, NULL, data_len);
896
897         dev_queue_xmit(skb);
898
899         return 1;
900
901 abort:
902         kfree_skb(skb);
903         return 1;
904 }
905
906
907 /************************************************************************
908  *
909  * xmit function called by generic PPP driver
910  * sends PPP frame over PPPoE socket
911  *
912  ***********************************************************************/
913 static int pppoe_xmit(struct ppp_channel *chan, struct sk_buff *skb)
914 {
915         struct sock *sk = (struct sock *) chan->private;
916         return __pppoe_xmit(sk, skb);
917 }
918
919
920 static struct ppp_channel_ops pppoe_chan_ops = {
921         .start_xmit = pppoe_xmit,
922 };
923
924 static int pppoe_recvmsg(struct kiocb *iocb, struct socket *sock,
925                   struct msghdr *m, size_t total_len, int flags)
926 {
927         struct sock *sk = sock->sk;
928         struct sk_buff *skb;
929         int error = 0;
930
931         if (sk->sk_state & PPPOX_BOUND) {
932                 error = -EIO;
933                 goto end;
934         }
935
936         skb = skb_recv_datagram(sk, flags & ~MSG_DONTWAIT,
937                                 flags & MSG_DONTWAIT, &error);
938
939         if (error < 0)
940                 goto end;
941
942         m->msg_namelen = 0;
943
944         if (skb) {
945                 total_len = min_t(size_t, total_len, skb->len);
946                 error = skb_copy_datagram_iovec(skb, 0, m->msg_iov, total_len);
947                 if (error == 0)
948                         error = total_len;
949         }
950
951         kfree_skb(skb);
952 end:
953         return error;
954 }
955
956 #ifdef CONFIG_PROC_FS
957 static int pppoe_seq_show(struct seq_file *seq, void *v)
958 {
959         struct pppox_sock *po;
960         char *dev_name;
961
962         if (v == SEQ_START_TOKEN) {
963                 seq_puts(seq, "Id       Address              Device\n");
964                 goto out;
965         }
966
967         po = v;
968         dev_name = po->pppoe_pa.dev;
969
970         seq_printf(seq, "%08X %pM %8s\n",
971                    po->pppoe_pa.sid, po->pppoe_pa.remote, dev_name);
972 out:
973         return 0;
974 }
975
976 static __inline__ struct pppox_sock *pppoe_get_idx(loff_t pos)
977 {
978         struct pppox_sock *po;
979         int i = 0;
980
981         for (; i < PPPOE_HASH_SIZE; i++) {
982                 po = item_hash_table[i];
983                 while (po) {
984                         if (!pos--)
985                                 goto out;
986                         po = po->next;
987                 }
988         }
989 out:
990         return po;
991 }
992
993 static void *pppoe_seq_start(struct seq_file *seq, loff_t *pos)
994         __acquires(pppoe_hash_lock)
995 {
996         loff_t l = *pos;
997
998         read_lock_bh(&pppoe_hash_lock);
999         return l ? pppoe_get_idx(--l) : SEQ_START_TOKEN;
1000 }
1001
1002 static void *pppoe_seq_next(struct seq_file *seq, void *v, loff_t *pos)
1003 {
1004         struct pppox_sock *po;
1005
1006         ++*pos;
1007         if (v == SEQ_START_TOKEN) {
1008                 po = pppoe_get_idx(0);
1009                 goto out;
1010         }
1011         po = v;
1012         if (po->next)
1013                 po = po->next;
1014         else {
1015                 int hash = hash_item(po->pppoe_pa.sid, po->pppoe_pa.remote);
1016
1017                 while (++hash < PPPOE_HASH_SIZE) {
1018                         po = item_hash_table[hash];
1019                         if (po)
1020                                 break;
1021                 }
1022         }
1023 out:
1024         return po;
1025 }
1026
1027 static void pppoe_seq_stop(struct seq_file *seq, void *v)
1028         __releases(pppoe_hash_lock)
1029 {
1030         read_unlock_bh(&pppoe_hash_lock);
1031 }
1032
1033 static struct seq_operations pppoe_seq_ops = {
1034         .start          = pppoe_seq_start,
1035         .next           = pppoe_seq_next,
1036         .stop           = pppoe_seq_stop,
1037         .show           = pppoe_seq_show,
1038 };
1039
1040 static int pppoe_seq_open(struct inode *inode, struct file *file)
1041 {
1042         return seq_open(file, &pppoe_seq_ops);
1043 }
1044
1045 static const struct file_operations pppoe_seq_fops = {
1046         .owner          = THIS_MODULE,
1047         .open           = pppoe_seq_open,
1048         .read           = seq_read,
1049         .llseek         = seq_lseek,
1050         .release        = seq_release,
1051 };
1052
1053 static int __init pppoe_proc_init(void)
1054 {
1055         struct proc_dir_entry *p;
1056
1057         p = proc_net_fops_create(&init_net, "pppoe", S_IRUGO, &pppoe_seq_fops);
1058         if (!p)
1059                 return -ENOMEM;
1060         return 0;
1061 }
1062 #else /* CONFIG_PROC_FS */
1063 static inline int pppoe_proc_init(void) { return 0; }
1064 #endif /* CONFIG_PROC_FS */
1065
1066 static const struct proto_ops pppoe_ops = {
1067     .family             = AF_PPPOX,
1068     .owner              = THIS_MODULE,
1069     .release            = pppoe_release,
1070     .bind               = sock_no_bind,
1071     .connect            = pppoe_connect,
1072     .socketpair         = sock_no_socketpair,
1073     .accept             = sock_no_accept,
1074     .getname            = pppoe_getname,
1075     .poll               = datagram_poll,
1076     .listen             = sock_no_listen,
1077     .shutdown           = sock_no_shutdown,
1078     .setsockopt         = sock_no_setsockopt,
1079     .getsockopt         = sock_no_getsockopt,
1080     .sendmsg            = pppoe_sendmsg,
1081     .recvmsg            = pppoe_recvmsg,
1082     .mmap               = sock_no_mmap,
1083     .ioctl              = pppox_ioctl,
1084 };
1085
1086 static struct pppox_proto pppoe_proto = {
1087     .create     = pppoe_create,
1088     .ioctl      = pppoe_ioctl,
1089     .owner      = THIS_MODULE,
1090 };
1091
1092
1093 static int __init pppoe_init(void)
1094 {
1095         int err = proto_register(&pppoe_sk_proto, 0);
1096
1097         if (err)
1098                 goto out;
1099
1100         err = register_pppox_proto(PX_PROTO_OE, &pppoe_proto);
1101         if (err)
1102                 goto out_unregister_pppoe_proto;
1103
1104         err = pppoe_proc_init();
1105         if (err)
1106                 goto out_unregister_pppox_proto;
1107
1108         dev_add_pack(&pppoes_ptype);
1109         dev_add_pack(&pppoed_ptype);
1110         register_netdevice_notifier(&pppoe_notifier);
1111 out:
1112         return err;
1113 out_unregister_pppox_proto:
1114         unregister_pppox_proto(PX_PROTO_OE);
1115 out_unregister_pppoe_proto:
1116         proto_unregister(&pppoe_sk_proto);
1117         goto out;
1118 }
1119
1120 static void __exit pppoe_exit(void)
1121 {
1122         unregister_pppox_proto(PX_PROTO_OE);
1123         dev_remove_pack(&pppoes_ptype);
1124         dev_remove_pack(&pppoed_ptype);
1125         unregister_netdevice_notifier(&pppoe_notifier);
1126         remove_proc_entry("pppoe", init_net.proc_net);
1127         proto_unregister(&pppoe_sk_proto);
1128 }
1129
1130 module_init(pppoe_init);
1131 module_exit(pppoe_exit);
1132
1133 MODULE_AUTHOR("Michal Ostrowski <mostrows@speakeasy.net>");
1134 MODULE_DESCRIPTION("PPP over Ethernet driver");
1135 MODULE_LICENSE("GPL");
1136 MODULE_ALIAS_NETPROTO(PF_PPPOX);