2  * NET4:        Implementation of BSD Unix domain sockets.
 
   4  * Authors:     Alan Cox, <alan.cox@linux.org>
 
   6  *              This program is free software; you can redistribute it and/or
 
   7  *              modify it under the terms of the GNU General Public License
 
   8  *              as published by the Free Software Foundation; either version
 
   9  *              2 of the License, or (at your option) any later version.
 
  11  * Version:     $Id: af_unix.c,v 1.133 2002/02/08 03:57:19 davem Exp $
 
  14  *              Linus Torvalds  :       Assorted bug cures.
 
  15  *              Niibe Yutaka    :       async I/O support.
 
  16  *              Carsten Paeth   :       PF_UNIX check, address fixes.
 
  17  *              Alan Cox        :       Limit size of allocated blocks.
 
  18  *              Alan Cox        :       Fixed the stupid socketpair bug.
 
  19  *              Alan Cox        :       BSD compatibility fine tuning.
 
  20  *              Alan Cox        :       Fixed a bug in connect when interrupted.
 
  21  *              Alan Cox        :       Sorted out a proper draft version of
 
  22  *                                      file descriptor passing hacked up from
 
  24  *              Marty Leisner   :       Fixes to fd passing
 
  25  *              Nick Nevin      :       recvmsg bugfix.
 
  26  *              Alan Cox        :       Started proper garbage collector
 
  27  *              Heiko EiBfeldt  :       Missing verify_area check
 
  28  *              Alan Cox        :       Started POSIXisms
 
  29  *              Andreas Schwab  :       Replace inode by dentry for proper
 
  31  *              Kirk Petersen   :       Made this a module
 
  32  *          Christoph Rohland   :       Elegant non-blocking accept/connect algorithm.
 
  34  *           Alexey Kuznetosv   :       Repaired (I hope) bugs introduces
 
  35  *                                      by above two patches.
 
  36  *           Andrea Arcangeli   :       If possible we block in connect(2)
 
  37  *                                      if the max backlog of the listen socket
 
  38  *                                      is been reached. This won't break
 
  39  *                                      old apps and it will avoid huge amount
 
  40  *                                      of socks hashed (this for unix_gc()
 
  41  *                                      performances reasons).
 
  42  *                                      Security fix that limits the max
 
  43  *                                      number of socks to 2*max_files and
 
  44  *                                      the number of skb queueable in the
 
  46  *              Artur Skawina   :       Hash function optimizations
 
  47  *           Alexey Kuznetsov   :       Full scale SMP. Lot of bugs are introduced 8)
 
  48  *            Malcolm Beattie   :       Set peercred for socketpair
 
  49  *           Michal Ostrowski   :       Module initialization cleanup.
 
  50  *           Arnaldo C. Melo    :       Remove MOD_{INC,DEC}_USE_COUNT,
 
  51  *                                      the core infrastructure is doing that
 
  52  *                                      for all net proto families now (2.5.69+)
 
  55  * Known differences from reference BSD that was tested:
 
  58  *      ECONNREFUSED is not returned from one end of a connected() socket to the
 
  59  *              other the moment one end closes.
 
  60  *      fstat() doesn't return st_dev=0, and give the blksize as high water mark
 
  61  *              and a fake inode identifier (nor the BSD first socket fstat twice bug).
 
  63  *      accept() returns a path name even if the connecting socket has closed
 
  64  *              in the meantime (BSD loses the path and gives up).
 
  65  *      accept() returns 0 length path for an unbound connector. BSD returns 16
 
  66  *              and a null first byte in the path (but not for gethost/peername - BSD bug ??)
 
  67  *      socketpair(...SOCK_RAW..) doesn't panic the kernel.
 
  68  *      BSD af_unix apparently has connect forgetting to block properly.
 
  69  *              (need to check this with the POSIX spec in detail)
 
  71  * Differences from 2.0.0-11-... (ANK)
 
  72  *      Bug fixes and improvements.
 
  73  *              - client shutdown killed server socket.
 
  74  *              - removed all useless cli/sti pairs.
 
  76  *      Semantic changes/extensions.
 
  77  *              - generic control message passing.
 
  78  *              - SCM_CREDENTIALS control message.
 
  79  *              - "Abstract" (not FS based) socket bindings.
 
  80  *                Abstract names are sequences of bytes (not zero terminated)
 
  81  *                started by 0, so that this name space does not intersect
 
  85 #include <linux/module.h>
 
  86 #include <linux/config.h>
 
  87 #include <linux/kernel.h>
 
  88 #include <linux/signal.h>
 
  89 #include <linux/sched.h>
 
  90 #include <linux/errno.h>
 
  91 #include <linux/string.h>
 
  92 #include <linux/stat.h>
 
  93 #include <linux/dcache.h>
 
  94 #include <linux/namei.h>
 
  95 #include <linux/socket.h>
 
  97 #include <linux/fcntl.h>
 
  98 #include <linux/termios.h>
 
  99 #include <linux/sockios.h>
 
 100 #include <linux/net.h>
 
 101 #include <linux/in.h>
 
 102 #include <linux/fs.h>
 
 103 #include <linux/slab.h>
 
 104 #include <asm/uaccess.h>
 
 105 #include <linux/skbuff.h>
 
 106 #include <linux/netdevice.h>
 
 107 #include <net/sock.h>
 
 108 #include <net/tcp_states.h>
 
 109 #include <net/af_unix.h>
 
 110 #include <linux/proc_fs.h>
 
 111 #include <linux/seq_file.h>
 
 113 #include <linux/init.h>
 
 114 #include <linux/poll.h>
 
 115 #include <linux/smp_lock.h>
 
 116 #include <linux/rtnetlink.h>
 
 117 #include <linux/mount.h>
 
 118 #include <net/checksum.h>
 
 119 #include <linux/security.h>
 
 121 int sysctl_unix_max_dgram_qlen = 10;
 
 123 struct hlist_head unix_socket_table[UNIX_HASH_SIZE + 1];
 
 124 DEFINE_SPINLOCK(unix_table_lock);
 
 125 static atomic_t unix_nr_socks = ATOMIC_INIT(0);
 
 127 #define unix_sockets_unbound    (&unix_socket_table[UNIX_HASH_SIZE])
 
 129 #define UNIX_ABSTRACT(sk)       (unix_sk(sk)->addr->hash != UNIX_HASH_SIZE)
 
 132  *  SMP locking strategy:
 
 133  *    hash table is protected with spinlock unix_table_lock
 
 134  *    each socket state is protected by separate rwlock.
 
 137 static inline unsigned unix_hash_fold(unsigned hash)
 
 141         return hash&(UNIX_HASH_SIZE-1);
 
 144 #define unix_peer(sk) (unix_sk(sk)->peer)
 
 146 static inline int unix_our_peer(struct sock *sk, struct sock *osk)
 
 148         return unix_peer(osk) == sk;
 
 151 static inline int unix_may_send(struct sock *sk, struct sock *osk)
 
 153         return (unix_peer(osk) == NULL || unix_our_peer(sk, osk));
 
 156 static struct sock *unix_peer_get(struct sock *s)
 
 164         unix_state_runlock(s);
 
 168 static inline void unix_release_addr(struct unix_address *addr)
 
 170         if (atomic_dec_and_test(&addr->refcnt))
 
 175  *      Check unix socket name:
 
 176  *              - should be not zero length.
 
 177  *              - if started by not zero, should be NULL terminated (FS object)
 
 178  *              - if started by zero, it is abstract name.
 
 181 static int unix_mkname(struct sockaddr_un * sunaddr, int len, unsigned *hashp)
 
 183         if (len <= sizeof(short) || len > sizeof(*sunaddr))
 
 185         if (!sunaddr || sunaddr->sun_family != AF_UNIX)
 
 187         if (sunaddr->sun_path[0]) {
 
 189                  * This may look like an off by one error but it is a bit more
 
 190                  * subtle. 108 is the longest valid AF_UNIX path for a binding.
 
 191                  * sun_path[108] doesnt as such exist.  However in kernel space
 
 192                  * we are guaranteed that it is a valid memory location in our
 
 193                  * kernel address buffer.
 
 195                 ((char *)sunaddr)[len]=0;
 
 196                 len = strlen(sunaddr->sun_path)+1+sizeof(short);
 
 200         *hashp = unix_hash_fold(csum_partial((char*)sunaddr, len, 0));
 
 204 static void __unix_remove_socket(struct sock *sk)
 
 206         sk_del_node_init(sk);
 
 209 static void __unix_insert_socket(struct hlist_head *list, struct sock *sk)
 
 211         BUG_TRAP(sk_unhashed(sk));
 
 212         sk_add_node(sk, list);
 
 215 static inline void unix_remove_socket(struct sock *sk)
 
 217         spin_lock(&unix_table_lock);
 
 218         __unix_remove_socket(sk);
 
 219         spin_unlock(&unix_table_lock);
 
 222 static inline void unix_insert_socket(struct hlist_head *list, struct sock *sk)
 
 224         spin_lock(&unix_table_lock);
 
 225         __unix_insert_socket(list, sk);
 
 226         spin_unlock(&unix_table_lock);
 
 229 static struct sock *__unix_find_socket_byname(struct sockaddr_un *sunname,
 
 230                                               int len, int type, unsigned hash)
 
 233         struct hlist_node *node;
 
 235         sk_for_each(s, node, &unix_socket_table[hash ^ type]) {
 
 236                 struct unix_sock *u = unix_sk(s);
 
 238                 if (u->addr->len == len &&
 
 239                     !memcmp(u->addr->name, sunname, len))
 
 247 static inline struct sock *unix_find_socket_byname(struct sockaddr_un *sunname,
 
 253         spin_lock(&unix_table_lock);
 
 254         s = __unix_find_socket_byname(sunname, len, type, hash);
 
 257         spin_unlock(&unix_table_lock);
 
 261 static struct sock *unix_find_socket_byinode(struct inode *i)
 
 264         struct hlist_node *node;
 
 266         spin_lock(&unix_table_lock);
 
 268                     &unix_socket_table[i->i_ino & (UNIX_HASH_SIZE - 1)]) {
 
 269                 struct dentry *dentry = unix_sk(s)->dentry;
 
 271                 if(dentry && dentry->d_inode == i)
 
 279         spin_unlock(&unix_table_lock);
 
 283 static inline int unix_writable(struct sock *sk)
 
 285         return (atomic_read(&sk->sk_wmem_alloc) << 2) <= sk->sk_sndbuf;
 
 288 static void unix_write_space(struct sock *sk)
 
 290         read_lock(&sk->sk_callback_lock);
 
 291         if (unix_writable(sk)) {
 
 292                 if (sk->sk_sleep && waitqueue_active(sk->sk_sleep))
 
 293                         wake_up_interruptible(sk->sk_sleep);
 
 294                 sk_wake_async(sk, 2, POLL_OUT);
 
 296         read_unlock(&sk->sk_callback_lock);
 
 299 /* When dgram socket disconnects (or changes its peer), we clear its receive
 
 300  * queue of packets arrived from previous peer. First, it allows to do
 
 301  * flow control based only on wmem_alloc; second, sk connected to peer
 
 302  * may receive messages only from that peer. */
 
 303 static void unix_dgram_disconnected(struct sock *sk, struct sock *other)
 
 305         if (!skb_queue_empty(&sk->sk_receive_queue)) {
 
 306                 skb_queue_purge(&sk->sk_receive_queue);
 
 307                 wake_up_interruptible_all(&unix_sk(sk)->peer_wait);
 
 309                 /* If one link of bidirectional dgram pipe is disconnected,
 
 310                  * we signal error. Messages are lost. Do not make this,
 
 311                  * when peer was not connected to us.
 
 313                 if (!sock_flag(other, SOCK_DEAD) && unix_peer(other) == sk) {
 
 314                         other->sk_err = ECONNRESET;
 
 315                         other->sk_error_report(other);
 
 320 static void unix_sock_destructor(struct sock *sk)
 
 322         struct unix_sock *u = unix_sk(sk);
 
 324         skb_queue_purge(&sk->sk_receive_queue);
 
 326         BUG_TRAP(!atomic_read(&sk->sk_wmem_alloc));
 
 327         BUG_TRAP(sk_unhashed(sk));
 
 328         BUG_TRAP(!sk->sk_socket);
 
 329         if (!sock_flag(sk, SOCK_DEAD)) {
 
 330                 printk("Attempt to release alive unix socket: %p\n", sk);
 
 335                 unix_release_addr(u->addr);
 
 337         atomic_dec(&unix_nr_socks);
 
 338 #ifdef UNIX_REFCNT_DEBUG
 
 339         printk(KERN_DEBUG "UNIX %p is destroyed, %d are still alive.\n", sk, atomic_read(&unix_nr_socks));
 
 343 static int unix_release_sock (struct sock *sk, int embrion)
 
 345         struct unix_sock *u = unix_sk(sk);
 
 346         struct dentry *dentry;
 
 347         struct vfsmount *mnt;
 
 352         unix_remove_socket(sk);
 
 355         unix_state_wlock(sk);
 
 357         sk->sk_shutdown = SHUTDOWN_MASK;
 
 362         state = sk->sk_state;
 
 363         sk->sk_state = TCP_CLOSE;
 
 364         unix_state_wunlock(sk);
 
 366         wake_up_interruptible_all(&u->peer_wait);
 
 368         skpair=unix_peer(sk);
 
 371                 if (sk->sk_type == SOCK_STREAM || sk->sk_type == SOCK_SEQPACKET) {
 
 372                         unix_state_wlock(skpair);
 
 374                         skpair->sk_shutdown = SHUTDOWN_MASK;
 
 375                         if (!skb_queue_empty(&sk->sk_receive_queue) || embrion)
 
 376                                 skpair->sk_err = ECONNRESET;
 
 377                         unix_state_wunlock(skpair);
 
 378                         skpair->sk_state_change(skpair);
 
 379                         read_lock(&skpair->sk_callback_lock);
 
 380                         sk_wake_async(skpair,1,POLL_HUP);
 
 381                         read_unlock(&skpair->sk_callback_lock);
 
 383                 sock_put(skpair); /* It may now die */
 
 384                 unix_peer(sk) = NULL;
 
 387         /* Try to flush out this socket. Throw out buffers at least */
 
 389         while ((skb = skb_dequeue(&sk->sk_receive_queue)) != NULL) {
 
 390                 if (state==TCP_LISTEN)
 
 391                         unix_release_sock(skb->sk, 1);
 
 392                 /* passed fds are erased in the kfree_skb hook        */
 
 403         /* ---- Socket is dead now and most probably destroyed ---- */
 
 406          * Fixme: BSD difference: In BSD all sockets connected to use get
 
 407          *        ECONNRESET and we die on the spot. In Linux we behave
 
 408          *        like files and pipes do and wait for the last
 
 411          * Can't we simply set sock->err?
 
 413          *        What the above comment does talk about? --ANK(980817)
 
 416         if (atomic_read(&unix_tot_inflight))
 
 417                 unix_gc();              /* Garbage collect fds */       
 
 422 static int unix_listen(struct socket *sock, int backlog)
 
 425         struct sock *sk = sock->sk;
 
 426         struct unix_sock *u = unix_sk(sk);
 
 429         if (sock->type!=SOCK_STREAM && sock->type!=SOCK_SEQPACKET)
 
 430                 goto out;                       /* Only stream/seqpacket sockets accept */
 
 433                 goto out;                       /* No listens on an unbound socket */
 
 434         unix_state_wlock(sk);
 
 435         if (sk->sk_state != TCP_CLOSE && sk->sk_state != TCP_LISTEN)
 
 437         if (backlog > sk->sk_max_ack_backlog)
 
 438                 wake_up_interruptible_all(&u->peer_wait);
 
 439         sk->sk_max_ack_backlog  = backlog;
 
 440         sk->sk_state            = TCP_LISTEN;
 
 441         /* set credentials so connect can copy them */
 
 442         sk->sk_peercred.pid     = current->tgid;
 
 443         sk->sk_peercred.uid     = current->euid;
 
 444         sk->sk_peercred.gid     = current->egid;
 
 448         unix_state_wunlock(sk);
 
 453 static int unix_release(struct socket *);
 
 454 static int unix_bind(struct socket *, struct sockaddr *, int);
 
 455 static int unix_stream_connect(struct socket *, struct sockaddr *,
 
 456                                int addr_len, int flags);
 
 457 static int unix_socketpair(struct socket *, struct socket *);
 
 458 static int unix_accept(struct socket *, struct socket *, int);
 
 459 static int unix_getname(struct socket *, struct sockaddr *, int *, int);
 
 460 static unsigned int unix_poll(struct file *, struct socket *, poll_table *);
 
 461 static int unix_ioctl(struct socket *, unsigned int, unsigned long);
 
 462 static int unix_shutdown(struct socket *, int);
 
 463 static int unix_stream_sendmsg(struct kiocb *, struct socket *,
 
 464                                struct msghdr *, size_t);
 
 465 static int unix_stream_recvmsg(struct kiocb *, struct socket *,
 
 466                                struct msghdr *, size_t, int);
 
 467 static int unix_dgram_sendmsg(struct kiocb *, struct socket *,
 
 468                               struct msghdr *, size_t);
 
 469 static int unix_dgram_recvmsg(struct kiocb *, struct socket *,
 
 470                               struct msghdr *, size_t, int);
 
 471 static int unix_dgram_connect(struct socket *, struct sockaddr *,
 
 473 static int unix_seqpacket_sendmsg(struct kiocb *, struct socket *,
 
 474                                   struct msghdr *, size_t);
 
 476 static const struct proto_ops unix_stream_ops = {
 
 478         .owner =        THIS_MODULE,
 
 479         .release =      unix_release,
 
 481         .connect =      unix_stream_connect,
 
 482         .socketpair =   unix_socketpair,
 
 483         .accept =       unix_accept,
 
 484         .getname =      unix_getname,
 
 487         .listen =       unix_listen,
 
 488         .shutdown =     unix_shutdown,
 
 489         .setsockopt =   sock_no_setsockopt,
 
 490         .getsockopt =   sock_no_getsockopt,
 
 491         .sendmsg =      unix_stream_sendmsg,
 
 492         .recvmsg =      unix_stream_recvmsg,
 
 493         .mmap =         sock_no_mmap,
 
 494         .sendpage =     sock_no_sendpage,
 
 497 static const struct proto_ops unix_dgram_ops = {
 
 499         .owner =        THIS_MODULE,
 
 500         .release =      unix_release,
 
 502         .connect =      unix_dgram_connect,
 
 503         .socketpair =   unix_socketpair,
 
 504         .accept =       sock_no_accept,
 
 505         .getname =      unix_getname,
 
 506         .poll =         datagram_poll,
 
 508         .listen =       sock_no_listen,
 
 509         .shutdown =     unix_shutdown,
 
 510         .setsockopt =   sock_no_setsockopt,
 
 511         .getsockopt =   sock_no_getsockopt,
 
 512         .sendmsg =      unix_dgram_sendmsg,
 
 513         .recvmsg =      unix_dgram_recvmsg,
 
 514         .mmap =         sock_no_mmap,
 
 515         .sendpage =     sock_no_sendpage,
 
 518 static const struct proto_ops unix_seqpacket_ops = {
 
 520         .owner =        THIS_MODULE,
 
 521         .release =      unix_release,
 
 523         .connect =      unix_stream_connect,
 
 524         .socketpair =   unix_socketpair,
 
 525         .accept =       unix_accept,
 
 526         .getname =      unix_getname,
 
 527         .poll =         datagram_poll,
 
 529         .listen =       unix_listen,
 
 530         .shutdown =     unix_shutdown,
 
 531         .setsockopt =   sock_no_setsockopt,
 
 532         .getsockopt =   sock_no_getsockopt,
 
 533         .sendmsg =      unix_seqpacket_sendmsg,
 
 534         .recvmsg =      unix_dgram_recvmsg,
 
 535         .mmap =         sock_no_mmap,
 
 536         .sendpage =     sock_no_sendpage,
 
 539 static struct proto unix_proto = {
 
 541         .owner    = THIS_MODULE,
 
 542         .obj_size = sizeof(struct unix_sock),
 
 545 static struct sock * unix_create1(struct socket *sock)
 
 547         struct sock *sk = NULL;
 
 550         if (atomic_read(&unix_nr_socks) >= 2*files_stat.max_files)
 
 553         sk = sk_alloc(PF_UNIX, GFP_KERNEL, &unix_proto, 1);
 
 557         atomic_inc(&unix_nr_socks);
 
 559         sock_init_data(sock,sk);
 
 561         sk->sk_write_space      = unix_write_space;
 
 562         sk->sk_max_ack_backlog  = sysctl_unix_max_dgram_qlen;
 
 563         sk->sk_destruct         = unix_sock_destructor;
 
 567         spin_lock_init(&u->lock);
 
 568         atomic_set(&u->inflight, sock ? 0 : -1);
 
 569         init_MUTEX(&u->readsem); /* single task reading lock */
 
 570         init_waitqueue_head(&u->peer_wait);
 
 571         unix_insert_socket(unix_sockets_unbound, sk);
 
 576 static int unix_create(struct socket *sock, int protocol)
 
 578         if (protocol && protocol != PF_UNIX)
 
 579                 return -EPROTONOSUPPORT;
 
 581         sock->state = SS_UNCONNECTED;
 
 583         switch (sock->type) {
 
 585                 sock->ops = &unix_stream_ops;
 
 588                  *      Believe it or not BSD has AF_UNIX, SOCK_RAW though
 
 592                 sock->type=SOCK_DGRAM;
 
 594                 sock->ops = &unix_dgram_ops;
 
 597                 sock->ops = &unix_seqpacket_ops;
 
 600                 return -ESOCKTNOSUPPORT;
 
 603         return unix_create1(sock) ? 0 : -ENOMEM;
 
 606 static int unix_release(struct socket *sock)
 
 608         struct sock *sk = sock->sk;
 
 615         return unix_release_sock (sk, 0);
 
 618 static int unix_autobind(struct socket *sock)
 
 620         struct sock *sk = sock->sk;
 
 621         struct unix_sock *u = unix_sk(sk);
 
 622         static u32 ordernum = 1;
 
 623         struct unix_address * addr;
 
 633         addr = kmalloc(sizeof(*addr) + sizeof(short) + 16, GFP_KERNEL);
 
 637         memset(addr, 0, sizeof(*addr) + sizeof(short) + 16);
 
 638         addr->name->sun_family = AF_UNIX;
 
 639         atomic_set(&addr->refcnt, 1);
 
 642         addr->len = sprintf(addr->name->sun_path+1, "%05x", ordernum) + 1 + sizeof(short);
 
 643         addr->hash = unix_hash_fold(csum_partial((void*)addr->name, addr->len, 0));
 
 645         spin_lock(&unix_table_lock);
 
 646         ordernum = (ordernum+1)&0xFFFFF;
 
 648         if (__unix_find_socket_byname(addr->name, addr->len, sock->type,
 
 650                 spin_unlock(&unix_table_lock);
 
 651                 /* Sanity yield. It is unusual case, but yet... */
 
 652                 if (!(ordernum&0xFF))
 
 656         addr->hash ^= sk->sk_type;
 
 658         __unix_remove_socket(sk);
 
 660         __unix_insert_socket(&unix_socket_table[addr->hash], sk);
 
 661         spin_unlock(&unix_table_lock);
 
 664 out:    up(&u->readsem);
 
 668 static struct sock *unix_find_other(struct sockaddr_un *sunname, int len,
 
 669                                     int type, unsigned hash, int *error)
 
 675         if (sunname->sun_path[0]) {
 
 676                 err = path_lookup(sunname->sun_path, LOOKUP_FOLLOW, &nd);
 
 679                 err = vfs_permission(&nd, MAY_WRITE);
 
 684                 if (!S_ISSOCK(nd.dentry->d_inode->i_mode))
 
 686                 u=unix_find_socket_byinode(nd.dentry->d_inode);
 
 690                 if (u->sk_type == type)
 
 691                         touch_atime(nd.mnt, nd.dentry);
 
 696                 if (u->sk_type != type) {
 
 702                 u=unix_find_socket_byname(sunname, len, type, hash);
 
 704                         struct dentry *dentry;
 
 705                         dentry = unix_sk(u)->dentry;
 
 707                                 touch_atime(unix_sk(u)->mnt, dentry);
 
 721 static int unix_bind(struct socket *sock, struct sockaddr *uaddr, int addr_len)
 
 723         struct sock *sk = sock->sk;
 
 724         struct unix_sock *u = unix_sk(sk);
 
 725         struct sockaddr_un *sunaddr=(struct sockaddr_un *)uaddr;
 
 726         struct dentry * dentry = NULL;
 
 730         struct unix_address *addr;
 
 731         struct hlist_head *list;
 
 734         if (sunaddr->sun_family != AF_UNIX)
 
 737         if (addr_len==sizeof(short)) {
 
 738                 err = unix_autobind(sock);
 
 742         err = unix_mkname(sunaddr, addr_len, &hash);
 
 754         addr = kmalloc(sizeof(*addr)+addr_len, GFP_KERNEL);
 
 758         memcpy(addr->name, sunaddr, addr_len);
 
 759         addr->len = addr_len;
 
 760         addr->hash = hash ^ sk->sk_type;
 
 761         atomic_set(&addr->refcnt, 1);
 
 763         if (sunaddr->sun_path[0]) {
 
 767                  * Get the parent directory, calculate the hash for last
 
 770                 err = path_lookup(sunaddr->sun_path, LOOKUP_PARENT, &nd);
 
 772                         goto out_mknod_parent;
 
 774                 dentry = lookup_create(&nd, 0);
 
 775                 err = PTR_ERR(dentry);
 
 777                         goto out_mknod_unlock;
 
 780                  * All right, let's create it.
 
 783                        (SOCK_INODE(sock)->i_mode & ~current->fs->umask);
 
 784                 err = vfs_mknod(nd.dentry->d_inode, dentry, mode, 0);
 
 787                 mutex_unlock(&nd.dentry->d_inode->i_mutex);
 
 791                 addr->hash = UNIX_HASH_SIZE;
 
 794         spin_lock(&unix_table_lock);
 
 796         if (!sunaddr->sun_path[0]) {
 
 798                 if (__unix_find_socket_byname(sunaddr, addr_len,
 
 799                                               sk->sk_type, hash)) {
 
 800                         unix_release_addr(addr);
 
 804                 list = &unix_socket_table[addr->hash];
 
 806                 list = &unix_socket_table[dentry->d_inode->i_ino & (UNIX_HASH_SIZE-1)];
 
 807                 u->dentry = nd.dentry;
 
 812         __unix_remove_socket(sk);
 
 814         __unix_insert_socket(list, sk);
 
 817         spin_unlock(&unix_table_lock);
 
 826         mutex_unlock(&nd.dentry->d_inode->i_mutex);
 
 831         unix_release_addr(addr);
 
 835 static int unix_dgram_connect(struct socket *sock, struct sockaddr *addr,
 
 838         struct sock *sk = sock->sk;
 
 839         struct sockaddr_un *sunaddr=(struct sockaddr_un*)addr;
 
 844         if (addr->sa_family != AF_UNSPEC) {
 
 845                 err = unix_mkname(sunaddr, alen, &hash);
 
 850                 if (test_bit(SOCK_PASSCRED, &sock->flags) &&
 
 851                     !unix_sk(sk)->addr && (err = unix_autobind(sock)) != 0)
 
 854                 other=unix_find_other(sunaddr, alen, sock->type, hash, &err);
 
 858                 unix_state_wlock(sk);
 
 861                 if (!unix_may_send(sk, other))
 
 864                 err = security_unix_may_send(sk->sk_socket, other->sk_socket);
 
 870                  *      1003.1g breaking connected state with AF_UNSPEC
 
 873                 unix_state_wlock(sk);
 
 877          * If it was connected, reconnect.
 
 880                 struct sock *old_peer = unix_peer(sk);
 
 882                 unix_state_wunlock(sk);
 
 884                 if (other != old_peer)
 
 885                         unix_dgram_disconnected(sk, old_peer);
 
 889                 unix_state_wunlock(sk);
 
 894         unix_state_wunlock(sk);
 
 900 static long unix_wait_for_peer(struct sock *other, long timeo)
 
 902         struct unix_sock *u = unix_sk(other);
 
 906         prepare_to_wait_exclusive(&u->peer_wait, &wait, TASK_INTERRUPTIBLE);
 
 908         sched = !sock_flag(other, SOCK_DEAD) &&
 
 909                 !(other->sk_shutdown & RCV_SHUTDOWN) &&
 
 910                 (skb_queue_len(&other->sk_receive_queue) >
 
 911                  other->sk_max_ack_backlog);
 
 913         unix_state_runlock(other);
 
 916                 timeo = schedule_timeout(timeo);
 
 918         finish_wait(&u->peer_wait, &wait);
 
 922 static int unix_stream_connect(struct socket *sock, struct sockaddr *uaddr,
 
 923                                int addr_len, int flags)
 
 925         struct sockaddr_un *sunaddr=(struct sockaddr_un *)uaddr;
 
 926         struct sock *sk = sock->sk;
 
 927         struct unix_sock *u = unix_sk(sk), *newu, *otheru;
 
 928         struct sock *newsk = NULL;
 
 929         struct sock *other = NULL;
 
 930         struct sk_buff *skb = NULL;
 
 936         err = unix_mkname(sunaddr, addr_len, &hash);
 
 941         if (test_bit(SOCK_PASSCRED, &sock->flags)
 
 942                 && !u->addr && (err = unix_autobind(sock)) != 0)
 
 945         timeo = sock_sndtimeo(sk, flags & O_NONBLOCK);
 
 947         /* First of all allocate resources.
 
 948            If we will make it after state is locked,
 
 949            we will have to recheck all again in any case.
 
 954         /* create new sock for complete connection */
 
 955         newsk = unix_create1(NULL);
 
 959         /* Allocate skb for sending to listening sock */
 
 960         skb = sock_wmalloc(newsk, 1, 0, GFP_KERNEL);
 
 965         /*  Find listening sock. */
 
 966         other = unix_find_other(sunaddr, addr_len, sk->sk_type, hash, &err);
 
 970         /* Latch state of peer */
 
 971         unix_state_rlock(other);
 
 973         /* Apparently VFS overslept socket death. Retry. */
 
 974         if (sock_flag(other, SOCK_DEAD)) {
 
 975                 unix_state_runlock(other);
 
 981         if (other->sk_state != TCP_LISTEN)
 
 984         if (skb_queue_len(&other->sk_receive_queue) >
 
 985             other->sk_max_ack_backlog) {
 
 990                 timeo = unix_wait_for_peer(other, timeo);
 
 992                 err = sock_intr_errno(timeo);
 
 993                 if (signal_pending(current))
 
1001            It is tricky place. We need to grab write lock and cannot
 
1002            drop lock on peer. It is dangerous because deadlock is
 
1003            possible. Connect to self case and simultaneous
 
1004            attempt to connect are eliminated by checking socket
 
1005            state. other is TCP_LISTEN, if sk is TCP_LISTEN we
 
1006            check this before attempt to grab lock.
 
1008            Well, and we have to recheck the state after socket locked.
 
1014                 /* This is ok... continue with connect */
 
1016         case TCP_ESTABLISHED:
 
1017                 /* Socket is already connected */
 
1025         unix_state_wlock(sk);
 
1027         if (sk->sk_state != st) {
 
1028                 unix_state_wunlock(sk);
 
1029                 unix_state_runlock(other);
 
1034         err = security_unix_stream_connect(sock, other->sk_socket, newsk);
 
1036                 unix_state_wunlock(sk);
 
1040         /* The way is open! Fastly set all the necessary fields... */
 
1043         unix_peer(newsk)        = sk;
 
1044         newsk->sk_state         = TCP_ESTABLISHED;
 
1045         newsk->sk_type          = sk->sk_type;
 
1046         newsk->sk_peercred.pid  = current->tgid;
 
1047         newsk->sk_peercred.uid  = current->euid;
 
1048         newsk->sk_peercred.gid  = current->egid;
 
1049         newu = unix_sk(newsk);
 
1050         newsk->sk_sleep         = &newu->peer_wait;
 
1051         otheru = unix_sk(other);
 
1053         /* copy address information from listening to new sock*/
 
1055                 atomic_inc(&otheru->addr->refcnt);
 
1056                 newu->addr = otheru->addr;
 
1058         if (otheru->dentry) {
 
1059                 newu->dentry    = dget(otheru->dentry);
 
1060                 newu->mnt       = mntget(otheru->mnt);
 
1063         /* Set credentials */
 
1064         sk->sk_peercred = other->sk_peercred;
 
1066         sock->state     = SS_CONNECTED;
 
1067         sk->sk_state    = TCP_ESTABLISHED;
 
1070         smp_mb__after_atomic_inc();     /* sock_hold() does an atomic_inc() */
 
1071         unix_peer(sk)   = newsk;
 
1073         unix_state_wunlock(sk);
 
1075         /* take ten and and send info to listening sock */
 
1076         spin_lock(&other->sk_receive_queue.lock);
 
1077         __skb_queue_tail(&other->sk_receive_queue, skb);
 
1078         /* Undo artificially decreased inflight after embrion
 
1079          * is installed to listening socket. */
 
1080         atomic_inc(&newu->inflight);
 
1081         spin_unlock(&other->sk_receive_queue.lock);
 
1082         unix_state_runlock(other);
 
1083         other->sk_data_ready(other, 0);
 
1089                 unix_state_runlock(other);
 
1095                 unix_release_sock(newsk, 0);
 
1101 static int unix_socketpair(struct socket *socka, struct socket *sockb)
 
1103         struct sock *ska=socka->sk, *skb = sockb->sk;
 
1105         /* Join our sockets back to back */
 
1110         ska->sk_peercred.pid = skb->sk_peercred.pid = current->tgid;
 
1111         ska->sk_peercred.uid = skb->sk_peercred.uid = current->euid;
 
1112         ska->sk_peercred.gid = skb->sk_peercred.gid = current->egid;
 
1114         if (ska->sk_type != SOCK_DGRAM) {
 
1115                 ska->sk_state = TCP_ESTABLISHED;
 
1116                 skb->sk_state = TCP_ESTABLISHED;
 
1117                 socka->state  = SS_CONNECTED;
 
1118                 sockb->state  = SS_CONNECTED;
 
1123 static int unix_accept(struct socket *sock, struct socket *newsock, int flags)
 
1125         struct sock *sk = sock->sk;
 
1127         struct sk_buff *skb;
 
1131         if (sock->type!=SOCK_STREAM && sock->type!=SOCK_SEQPACKET)
 
1135         if (sk->sk_state != TCP_LISTEN)
 
1138         /* If socket state is TCP_LISTEN it cannot change (for now...),
 
1139          * so that no locks are necessary.
 
1142         skb = skb_recv_datagram(sk, 0, flags&O_NONBLOCK, &err);
 
1144                 /* This means receive shutdown. */
 
1151         skb_free_datagram(sk, skb);
 
1152         wake_up_interruptible(&unix_sk(sk)->peer_wait);
 
1154         /* attach accepted sock to socket */
 
1155         unix_state_wlock(tsk);
 
1156         newsock->state = SS_CONNECTED;
 
1157         sock_graft(tsk, newsock);
 
1158         unix_state_wunlock(tsk);
 
1166 static int unix_getname(struct socket *sock, struct sockaddr *uaddr, int *uaddr_len, int peer)
 
1168         struct sock *sk = sock->sk;
 
1169         struct unix_sock *u;
 
1170         struct sockaddr_un *sunaddr=(struct sockaddr_un *)uaddr;
 
1174                 sk = unix_peer_get(sk);
 
1185         unix_state_rlock(sk);
 
1187                 sunaddr->sun_family = AF_UNIX;
 
1188                 sunaddr->sun_path[0] = 0;
 
1189                 *uaddr_len = sizeof(short);
 
1191                 struct unix_address *addr = u->addr;
 
1193                 *uaddr_len = addr->len;
 
1194                 memcpy(sunaddr, addr->name, *uaddr_len);
 
1196         unix_state_runlock(sk);
 
1202 static void unix_detach_fds(struct scm_cookie *scm, struct sk_buff *skb)
 
1206         scm->fp = UNIXCB(skb).fp;
 
1207         skb->destructor = sock_wfree;
 
1208         UNIXCB(skb).fp = NULL;
 
1210         for (i=scm->fp->count-1; i>=0; i--)
 
1211                 unix_notinflight(scm->fp->fp[i]);
 
1214 static void unix_destruct_fds(struct sk_buff *skb)
 
1216         struct scm_cookie scm;
 
1217         memset(&scm, 0, sizeof(scm));
 
1218         unix_detach_fds(&scm, skb);
 
1220         /* Alas, it calls VFS */
 
1221         /* So fscking what? fput() had been SMP-safe since the last Summer */
 
1226 static void unix_attach_fds(struct scm_cookie *scm, struct sk_buff *skb)
 
1229         for (i=scm->fp->count-1; i>=0; i--)
 
1230                 unix_inflight(scm->fp->fp[i]);
 
1231         UNIXCB(skb).fp = scm->fp;
 
1232         skb->destructor = unix_destruct_fds;
 
1237  *      Send AF_UNIX data.
 
1240 static int unix_dgram_sendmsg(struct kiocb *kiocb, struct socket *sock,
 
1241                               struct msghdr *msg, size_t len)
 
1243         struct sock_iocb *siocb = kiocb_to_siocb(kiocb);
 
1244         struct sock *sk = sock->sk;
 
1245         struct unix_sock *u = unix_sk(sk);
 
1246         struct sockaddr_un *sunaddr=msg->msg_name;
 
1247         struct sock *other = NULL;
 
1248         int namelen = 0; /* fake GCC */
 
1251         struct sk_buff *skb;
 
1253         struct scm_cookie tmp_scm;
 
1255         if (NULL == siocb->scm)
 
1256                 siocb->scm = &tmp_scm;
 
1257         err = scm_send(sock, msg, siocb->scm);
 
1262         if (msg->msg_flags&MSG_OOB)
 
1265         if (msg->msg_namelen) {
 
1266                 err = unix_mkname(sunaddr, msg->msg_namelen, &hash);
 
1273                 other = unix_peer_get(sk);
 
1278         if (test_bit(SOCK_PASSCRED, &sock->flags)
 
1279                 && !u->addr && (err = unix_autobind(sock)) != 0)
 
1283         if (len > sk->sk_sndbuf - 32)
 
1286         skb = sock_alloc_send_skb(sk, len, msg->msg_flags&MSG_DONTWAIT, &err);
 
1290         memcpy(UNIXCREDS(skb), &siocb->scm->creds, sizeof(struct ucred));
 
1292                 unix_attach_fds(siocb->scm, skb);
 
1294         skb->h.raw = skb->data;
 
1295         err = memcpy_fromiovec(skb_put(skb,len), msg->msg_iov, len);
 
1299         timeo = sock_sndtimeo(sk, msg->msg_flags & MSG_DONTWAIT);
 
1304                 if (sunaddr == NULL)
 
1307                 other = unix_find_other(sunaddr, namelen, sk->sk_type,
 
1313         unix_state_rlock(other);
 
1315         if (!unix_may_send(sk, other))
 
1318         if (sock_flag(other, SOCK_DEAD)) {
 
1320                  *      Check with 1003.1g - what should
 
1323                 unix_state_runlock(other);
 
1327                 unix_state_wlock(sk);
 
1328                 if (unix_peer(sk) == other) {
 
1330                         unix_state_wunlock(sk);
 
1332                         unix_dgram_disconnected(sk, other);
 
1334                         err = -ECONNREFUSED;
 
1336                         unix_state_wunlock(sk);
 
1346         if (other->sk_shutdown & RCV_SHUTDOWN)
 
1349         if (sk->sk_type != SOCK_SEQPACKET) {
 
1350                 err = security_unix_may_send(sk->sk_socket, other->sk_socket);
 
1355         if (unix_peer(other) != sk &&
 
1356             (skb_queue_len(&other->sk_receive_queue) >
 
1357              other->sk_max_ack_backlog)) {
 
1363                 timeo = unix_wait_for_peer(other, timeo);
 
1365                 err = sock_intr_errno(timeo);
 
1366                 if (signal_pending(current))
 
1372         skb_queue_tail(&other->sk_receive_queue, skb);
 
1373         unix_state_runlock(other);
 
1374         other->sk_data_ready(other, len);
 
1376         scm_destroy(siocb->scm);
 
1380         unix_state_runlock(other);
 
1386         scm_destroy(siocb->scm);
 
1391 static int unix_stream_sendmsg(struct kiocb *kiocb, struct socket *sock,
 
1392                                struct msghdr *msg, size_t len)
 
1394         struct sock_iocb *siocb = kiocb_to_siocb(kiocb);
 
1395         struct sock *sk = sock->sk;
 
1396         struct sock *other = NULL;
 
1397         struct sockaddr_un *sunaddr=msg->msg_name;
 
1399         struct sk_buff *skb;
 
1401         struct scm_cookie tmp_scm;
 
1403         if (NULL == siocb->scm)
 
1404                 siocb->scm = &tmp_scm;
 
1405         err = scm_send(sock, msg, siocb->scm);
 
1410         if (msg->msg_flags&MSG_OOB)
 
1413         if (msg->msg_namelen) {
 
1414                 err = sk->sk_state == TCP_ESTABLISHED ? -EISCONN : -EOPNOTSUPP;
 
1419                 other = unix_peer(sk);
 
1424         if (sk->sk_shutdown & SEND_SHUTDOWN)
 
1430                  *      Optimisation for the fact that under 0.01% of X messages typically
 
1436                 /* Keep two messages in the pipe so it schedules better */
 
1437                 if (size > sk->sk_sndbuf / 2 - 64)
 
1438                         size = sk->sk_sndbuf / 2 - 64;
 
1440                 if (size > SKB_MAX_ALLOC)
 
1441                         size = SKB_MAX_ALLOC;
 
1447                 skb=sock_alloc_send_skb(sk,size,msg->msg_flags&MSG_DONTWAIT, &err);
 
1453                  *      If you pass two values to the sock_alloc_send_skb
 
1454                  *      it tries to grab the large buffer with GFP_NOFS
 
1455                  *      (which can fail easily), and if it fails grab the
 
1456                  *      fallback size buffer which is under a page and will
 
1459                 size = min_t(int, size, skb_tailroom(skb));
 
1461                 memcpy(UNIXCREDS(skb), &siocb->scm->creds, sizeof(struct ucred));
 
1463                         unix_attach_fds(siocb->scm, skb);
 
1465                 if ((err = memcpy_fromiovec(skb_put(skb,size), msg->msg_iov, size)) != 0) {
 
1470                 unix_state_rlock(other);
 
1472                 if (sock_flag(other, SOCK_DEAD) ||
 
1473                     (other->sk_shutdown & RCV_SHUTDOWN))
 
1476                 skb_queue_tail(&other->sk_receive_queue, skb);
 
1477                 unix_state_runlock(other);
 
1478                 other->sk_data_ready(other, size);
 
1482         scm_destroy(siocb->scm);
 
1488         unix_state_runlock(other);
 
1491         if (sent==0 && !(msg->msg_flags&MSG_NOSIGNAL))
 
1492                 send_sig(SIGPIPE,current,0);
 
1495         scm_destroy(siocb->scm);
 
1497         return sent ? : err;
 
1500 static int unix_seqpacket_sendmsg(struct kiocb *kiocb, struct socket *sock,
 
1501                                   struct msghdr *msg, size_t len)
 
1504         struct sock *sk = sock->sk;
 
1506         err = sock_error(sk);
 
1510         if (sk->sk_state != TCP_ESTABLISHED)
 
1513         if (msg->msg_namelen)
 
1514                 msg->msg_namelen = 0;
 
1516         return unix_dgram_sendmsg(kiocb, sock, msg, len);
 
1519 static void unix_copy_addr(struct msghdr *msg, struct sock *sk)
 
1521         struct unix_sock *u = unix_sk(sk);
 
1523         msg->msg_namelen = 0;
 
1525                 msg->msg_namelen = u->addr->len;
 
1526                 memcpy(msg->msg_name, u->addr->name, u->addr->len);
 
1530 static int unix_dgram_recvmsg(struct kiocb *iocb, struct socket *sock,
 
1531                               struct msghdr *msg, size_t size,
 
1534         struct sock_iocb *siocb = kiocb_to_siocb(iocb);
 
1535         struct scm_cookie tmp_scm;
 
1536         struct sock *sk = sock->sk;
 
1537         struct unix_sock *u = unix_sk(sk);
 
1538         int noblock = flags & MSG_DONTWAIT;
 
1539         struct sk_buff *skb;
 
1546         msg->msg_namelen = 0;
 
1550         skb = skb_recv_datagram(sk, flags, noblock, &err);
 
1554         wake_up_interruptible(&u->peer_wait);
 
1557                 unix_copy_addr(msg, skb->sk);
 
1559         if (size > skb->len)
 
1561         else if (size < skb->len)
 
1562                 msg->msg_flags |= MSG_TRUNC;
 
1564         err = skb_copy_datagram_iovec(skb, 0, msg->msg_iov, size);
 
1569                 siocb->scm = &tmp_scm;
 
1570                 memset(&tmp_scm, 0, sizeof(tmp_scm));
 
1572         siocb->scm->creds = *UNIXCREDS(skb);
 
1574         if (!(flags & MSG_PEEK))
 
1577                         unix_detach_fds(siocb->scm, skb);
 
1581                 /* It is questionable: on PEEK we could:
 
1582                    - do not return fds - good, but too simple 8)
 
1583                    - return fds, and do not return them on read (old strategy,
 
1585                    - clone fds (I chose it for now, it is the most universal
 
1588                    POSIX 1003.1g does not actually define this clearly
 
1589                    at all. POSIX 1003.1g doesn't define a lot of things
 
1594                         siocb->scm->fp = scm_fp_dup(UNIXCB(skb).fp);
 
1598         scm_recv(sock, msg, siocb->scm, flags);
 
1601         skb_free_datagram(sk,skb);
 
1609  *      Sleep until data has arrive. But check for races..
 
1612 static long unix_stream_data_wait(struct sock * sk, long timeo)
 
1616         unix_state_rlock(sk);
 
1619                 prepare_to_wait(sk->sk_sleep, &wait, TASK_INTERRUPTIBLE);
 
1621                 if (!skb_queue_empty(&sk->sk_receive_queue) ||
 
1623                     (sk->sk_shutdown & RCV_SHUTDOWN) ||
 
1624                     signal_pending(current) ||
 
1628                 set_bit(SOCK_ASYNC_WAITDATA, &sk->sk_socket->flags);
 
1629                 unix_state_runlock(sk);
 
1630                 timeo = schedule_timeout(timeo);
 
1631                 unix_state_rlock(sk);
 
1632                 clear_bit(SOCK_ASYNC_WAITDATA, &sk->sk_socket->flags);
 
1635         finish_wait(sk->sk_sleep, &wait);
 
1636         unix_state_runlock(sk);
 
1642 static int unix_stream_recvmsg(struct kiocb *iocb, struct socket *sock,
 
1643                                struct msghdr *msg, size_t size,
 
1646         struct sock_iocb *siocb = kiocb_to_siocb(iocb);
 
1647         struct scm_cookie tmp_scm;
 
1648         struct sock *sk = sock->sk;
 
1649         struct unix_sock *u = unix_sk(sk);
 
1650         struct sockaddr_un *sunaddr=msg->msg_name;
 
1652         int check_creds = 0;
 
1658         if (sk->sk_state != TCP_ESTABLISHED)
 
1665         target = sock_rcvlowat(sk, flags&MSG_WAITALL, size);
 
1666         timeo = sock_rcvtimeo(sk, flags&MSG_DONTWAIT);
 
1668         msg->msg_namelen = 0;
 
1670         /* Lock the socket to prevent queue disordering
 
1671          * while sleeps in memcpy_tomsg
 
1675                 siocb->scm = &tmp_scm;
 
1676                 memset(&tmp_scm, 0, sizeof(tmp_scm));
 
1684                 struct sk_buff *skb;
 
1686                 skb = skb_dequeue(&sk->sk_receive_queue);
 
1689                         if (copied >= target)
 
1693                          *      POSIX 1003.1g mandates this order.
 
1696                         if ((err = sock_error(sk)) != 0)
 
1698                         if (sk->sk_shutdown & RCV_SHUTDOWN)
 
1705                         timeo = unix_stream_data_wait(sk, timeo);
 
1707                         if (signal_pending(current)) {
 
1708                                 err = sock_intr_errno(timeo);
 
1716                         /* Never glue messages from different writers */
 
1717                         if (memcmp(UNIXCREDS(skb), &siocb->scm->creds, sizeof(siocb->scm->creds)) != 0) {
 
1718                                 skb_queue_head(&sk->sk_receive_queue, skb);
 
1722                         /* Copy credentials */
 
1723                         siocb->scm->creds = *UNIXCREDS(skb);
 
1727                 /* Copy address just once */
 
1730                         unix_copy_addr(msg, skb->sk);
 
1734                 chunk = min_t(unsigned int, skb->len, size);
 
1735                 if (memcpy_toiovec(msg->msg_iov, skb->data, chunk)) {
 
1736                         skb_queue_head(&sk->sk_receive_queue, skb);
 
1744                 /* Mark read part of skb as used */
 
1745                 if (!(flags & MSG_PEEK))
 
1747                         skb_pull(skb, chunk);
 
1750                                 unix_detach_fds(siocb->scm, skb);
 
1752                         /* put the skb back if we didn't use it up.. */
 
1755                                 skb_queue_head(&sk->sk_receive_queue, skb);
 
1766                         /* It is questionable, see note in unix_dgram_recvmsg.
 
1769                                 siocb->scm->fp = scm_fp_dup(UNIXCB(skb).fp);
 
1771                         /* put message back and return */
 
1772                         skb_queue_head(&sk->sk_receive_queue, skb);
 
1778         scm_recv(sock, msg, siocb->scm, flags);
 
1780         return copied ? : err;
 
1783 static int unix_shutdown(struct socket *sock, int mode)
 
1785         struct sock *sk = sock->sk;
 
1788         mode = (mode+1)&(RCV_SHUTDOWN|SEND_SHUTDOWN);
 
1791                 unix_state_wlock(sk);
 
1792                 sk->sk_shutdown |= mode;
 
1793                 other=unix_peer(sk);
 
1796                 unix_state_wunlock(sk);
 
1797                 sk->sk_state_change(sk);
 
1800                         (sk->sk_type == SOCK_STREAM || sk->sk_type == SOCK_SEQPACKET)) {
 
1804                         if (mode&RCV_SHUTDOWN)
 
1805                                 peer_mode |= SEND_SHUTDOWN;
 
1806                         if (mode&SEND_SHUTDOWN)
 
1807                                 peer_mode |= RCV_SHUTDOWN;
 
1808                         unix_state_wlock(other);
 
1809                         other->sk_shutdown |= peer_mode;
 
1810                         unix_state_wunlock(other);
 
1811                         other->sk_state_change(other);
 
1812                         read_lock(&other->sk_callback_lock);
 
1813                         if (peer_mode == SHUTDOWN_MASK)
 
1814                                 sk_wake_async(other,1,POLL_HUP);
 
1815                         else if (peer_mode & RCV_SHUTDOWN)
 
1816                                 sk_wake_async(other,1,POLL_IN);
 
1817                         read_unlock(&other->sk_callback_lock);
 
1825 static int unix_ioctl(struct socket *sock, unsigned int cmd, unsigned long arg)
 
1827         struct sock *sk = sock->sk;
 
1834                         amount = atomic_read(&sk->sk_wmem_alloc);
 
1835                         err = put_user(amount, (int __user *)arg);
 
1839                         struct sk_buff *skb;
 
1841                         if (sk->sk_state == TCP_LISTEN) {
 
1846                         spin_lock(&sk->sk_receive_queue.lock);
 
1847                         if (sk->sk_type == SOCK_STREAM ||
 
1848                             sk->sk_type == SOCK_SEQPACKET) {
 
1849                                 skb_queue_walk(&sk->sk_receive_queue, skb)
 
1852                                 skb = skb_peek(&sk->sk_receive_queue);
 
1856                         spin_unlock(&sk->sk_receive_queue.lock);
 
1857                         err = put_user(amount, (int __user *)arg);
 
1868 static unsigned int unix_poll(struct file * file, struct socket *sock, poll_table *wait)
 
1870         struct sock *sk = sock->sk;
 
1873         poll_wait(file, sk->sk_sleep, wait);
 
1876         /* exceptional events? */
 
1879         if (sk->sk_shutdown == SHUTDOWN_MASK)
 
1883         if (!skb_queue_empty(&sk->sk_receive_queue) ||
 
1884             (sk->sk_shutdown & RCV_SHUTDOWN))
 
1885                 mask |= POLLIN | POLLRDNORM;
 
1887         /* Connection-based need to check for termination and startup */
 
1888         if ((sk->sk_type == SOCK_STREAM || sk->sk_type == SOCK_SEQPACKET) && sk->sk_state == TCP_CLOSE)
 
1892          * we set writable also when the other side has shut down the
 
1893          * connection. This prevents stuck sockets.
 
1895         if (unix_writable(sk))
 
1896                 mask |= POLLOUT | POLLWRNORM | POLLWRBAND;
 
1902 #ifdef CONFIG_PROC_FS
 
1903 static struct sock *unix_seq_idx(int *iter, loff_t pos)
 
1908         for (s = first_unix_socket(iter); s; s = next_unix_socket(iter, s)) {
 
1917 static void *unix_seq_start(struct seq_file *seq, loff_t *pos)
 
1919         spin_lock(&unix_table_lock);
 
1920         return *pos ? unix_seq_idx(seq->private, *pos - 1) : ((void *) 1);
 
1923 static void *unix_seq_next(struct seq_file *seq, void *v, loff_t *pos)
 
1928                 return first_unix_socket(seq->private);
 
1929         return next_unix_socket(seq->private, v);
 
1932 static void unix_seq_stop(struct seq_file *seq, void *v)
 
1934         spin_unlock(&unix_table_lock);
 
1937 static int unix_seq_show(struct seq_file *seq, void *v)
 
1941                 seq_puts(seq, "Num       RefCount Protocol Flags    Type St "
 
1945                 struct unix_sock *u = unix_sk(s);
 
1946                 unix_state_rlock(s);
 
1948                 seq_printf(seq, "%p: %08X %08X %08X %04X %02X %5lu",
 
1950                         atomic_read(&s->sk_refcnt),
 
1952                         s->sk_state == TCP_LISTEN ? __SO_ACCEPTCON : 0,
 
1955                         (s->sk_state == TCP_ESTABLISHED ? SS_CONNECTED : SS_UNCONNECTED) :
 
1956                         (s->sk_state == TCP_ESTABLISHED ? SS_CONNECTING : SS_DISCONNECTING),
 
1964                         len = u->addr->len - sizeof(short);
 
1965                         if (!UNIX_ABSTRACT(s))
 
1971                         for ( ; i < len; i++)
 
1972                                 seq_putc(seq, u->addr->name->sun_path[i]);
 
1974                 unix_state_runlock(s);
 
1975                 seq_putc(seq, '\n');
 
1981 static struct seq_operations unix_seq_ops = {
 
1982         .start  = unix_seq_start,
 
1983         .next   = unix_seq_next,
 
1984         .stop   = unix_seq_stop,
 
1985         .show   = unix_seq_show,
 
1989 static int unix_seq_open(struct inode *inode, struct file *file)
 
1991         struct seq_file *seq;
 
1993         int *iter = kmalloc(sizeof(int), GFP_KERNEL);
 
1998         rc = seq_open(file, &unix_seq_ops);
 
2002         seq          = file->private_data;
 
2003         seq->private = iter;
 
2012 static struct file_operations unix_seq_fops = {
 
2013         .owner          = THIS_MODULE,
 
2014         .open           = unix_seq_open,
 
2016         .llseek         = seq_lseek,
 
2017         .release        = seq_release_private,
 
2022 static struct net_proto_family unix_family_ops = {
 
2024         .create = unix_create,
 
2025         .owner  = THIS_MODULE,
 
2028 static int __init af_unix_init(void)
 
2031         struct sk_buff *dummy_skb;
 
2033         if (sizeof(struct unix_skb_parms) > sizeof(dummy_skb->cb)) {
 
2034                 printk(KERN_CRIT "%s: panic\n", __FUNCTION__);
 
2038         rc = proto_register(&unix_proto, 1);
 
2040                 printk(KERN_CRIT "%s: Cannot create unix_sock SLAB cache!\n",
 
2045         sock_register(&unix_family_ops);
 
2046 #ifdef CONFIG_PROC_FS
 
2047         proc_net_fops_create("unix", 0, &unix_seq_fops);
 
2049         unix_sysctl_register();
 
2054 static void __exit af_unix_exit(void)
 
2056         sock_unregister(PF_UNIX);
 
2057         unix_sysctl_unregister();
 
2058         proc_net_remove("unix");
 
2059         proto_unregister(&unix_proto);
 
2062 module_init(af_unix_init);
 
2063 module_exit(af_unix_exit);
 
2065 MODULE_LICENSE("GPL");
 
2066 MODULE_ALIAS_NETPROTO(PF_UNIX);