Merge branch 'upstream-linus' of master.kernel.org:/pub/scm/linux/kernel/git/jgarzik...
[linux-2.6] / kernel / module.c
1 /*
2    Copyright (C) 2002 Richard Henderson
3    Copyright (C) 2001 Rusty Russell, 2002 Rusty Russell IBM.
4
5     This program is free software; you can redistribute it and/or modify
6     it under the terms of the GNU General Public License as published by
7     the Free Software Foundation; either version 2 of the License, or
8     (at your option) any later version.
9
10     This program is distributed in the hope that it will be useful,
11     but WITHOUT ANY WARRANTY; without even the implied warranty of
12     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13     GNU General Public License for more details.
14
15     You should have received a copy of the GNU General Public License
16     along with this program; if not, write to the Free Software
17     Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18 */
19 #include <linux/module.h>
20 #include <linux/moduleloader.h>
21 #include <linux/init.h>
22 #include <linux/kallsyms.h>
23 #include <linux/sysfs.h>
24 #include <linux/kernel.h>
25 #include <linux/slab.h>
26 #include <linux/vmalloc.h>
27 #include <linux/elf.h>
28 #include <linux/seq_file.h>
29 #include <linux/syscalls.h>
30 #include <linux/fcntl.h>
31 #include <linux/rcupdate.h>
32 #include <linux/capability.h>
33 #include <linux/cpu.h>
34 #include <linux/moduleparam.h>
35 #include <linux/errno.h>
36 #include <linux/err.h>
37 #include <linux/vermagic.h>
38 #include <linux/notifier.h>
39 #include <linux/sched.h>
40 #include <linux/stop_machine.h>
41 #include <linux/device.h>
42 #include <linux/string.h>
43 #include <linux/mutex.h>
44 #include <linux/unwind.h>
45 #include <asm/uaccess.h>
46 #include <asm/semaphore.h>
47 #include <asm/cacheflush.h>
48 #include <linux/license.h>
49
50 extern int module_sysfs_initialized;
51
52 #if 0
53 #define DEBUGP printk
54 #else
55 #define DEBUGP(fmt , a...)
56 #endif
57
58 #ifndef ARCH_SHF_SMALL
59 #define ARCH_SHF_SMALL 0
60 #endif
61
62 /* If this is set, the section belongs in the init part of the module */
63 #define INIT_OFFSET_MASK (1UL << (BITS_PER_LONG-1))
64
65 /* List of modules, protected by module_mutex or preempt_disable
66  * (add/delete uses stop_machine). */
67 static DEFINE_MUTEX(module_mutex);
68 static LIST_HEAD(modules);
69
70 static BLOCKING_NOTIFIER_HEAD(module_notify_list);
71
72 int register_module_notifier(struct notifier_block * nb)
73 {
74         return blocking_notifier_chain_register(&module_notify_list, nb);
75 }
76 EXPORT_SYMBOL(register_module_notifier);
77
78 int unregister_module_notifier(struct notifier_block * nb)
79 {
80         return blocking_notifier_chain_unregister(&module_notify_list, nb);
81 }
82 EXPORT_SYMBOL(unregister_module_notifier);
83
84 /* We require a truly strong try_module_get() */
85 static inline int strong_try_module_get(struct module *mod)
86 {
87         if (mod && mod->state == MODULE_STATE_COMING)
88                 return 0;
89         return try_module_get(mod);
90 }
91
92 static inline void add_taint_module(struct module *mod, unsigned flag)
93 {
94         add_taint(flag);
95         mod->taints |= flag;
96 }
97
98 /*
99  * A thread that wants to hold a reference to a module only while it
100  * is running can call this to safely exit.  nfsd and lockd use this.
101  */
102 void __module_put_and_exit(struct module *mod, long code)
103 {
104         module_put(mod);
105         do_exit(code);
106 }
107 EXPORT_SYMBOL(__module_put_and_exit);
108
109 /* Find a module section: 0 means not found. */
110 static unsigned int find_sec(Elf_Ehdr *hdr,
111                              Elf_Shdr *sechdrs,
112                              const char *secstrings,
113                              const char *name)
114 {
115         unsigned int i;
116
117         for (i = 1; i < hdr->e_shnum; i++)
118                 /* Alloc bit cleared means "ignore it." */
119                 if ((sechdrs[i].sh_flags & SHF_ALLOC)
120                     && strcmp(secstrings+sechdrs[i].sh_name, name) == 0)
121                         return i;
122         return 0;
123 }
124
125 /* Provided by the linker */
126 extern const struct kernel_symbol __start___ksymtab[];
127 extern const struct kernel_symbol __stop___ksymtab[];
128 extern const struct kernel_symbol __start___ksymtab_gpl[];
129 extern const struct kernel_symbol __stop___ksymtab_gpl[];
130 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
131 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
132 extern const struct kernel_symbol __start___ksymtab_unused[];
133 extern const struct kernel_symbol __stop___ksymtab_unused[];
134 extern const struct kernel_symbol __start___ksymtab_unused_gpl[];
135 extern const struct kernel_symbol __stop___ksymtab_unused_gpl[];
136 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
137 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
138 extern const unsigned long __start___kcrctab[];
139 extern const unsigned long __start___kcrctab_gpl[];
140 extern const unsigned long __start___kcrctab_gpl_future[];
141 extern const unsigned long __start___kcrctab_unused[];
142 extern const unsigned long __start___kcrctab_unused_gpl[];
143
144 #ifndef CONFIG_MODVERSIONS
145 #define symversion(base, idx) NULL
146 #else
147 #define symversion(base, idx) ((base != NULL) ? ((base) + (idx)) : NULL)
148 #endif
149
150 /* lookup symbol in given range of kernel_symbols */
151 static const struct kernel_symbol *lookup_symbol(const char *name,
152         const struct kernel_symbol *start,
153         const struct kernel_symbol *stop)
154 {
155         const struct kernel_symbol *ks = start;
156         for (; ks < stop; ks++)
157                 if (strcmp(ks->name, name) == 0)
158                         return ks;
159         return NULL;
160 }
161
162 static void printk_unused_warning(const char *name)
163 {
164         printk(KERN_WARNING "Symbol %s is marked as UNUSED, "
165                 "however this module is using it.\n", name);
166         printk(KERN_WARNING "This symbol will go away in the future.\n");
167         printk(KERN_WARNING "Please evalute if this is the right api to use, "
168                 "and if it really is, submit a report the linux kernel "
169                 "mailinglist together with submitting your code for "
170                 "inclusion.\n");
171 }
172
173 /* Find a symbol, return value, crc and module which owns it */
174 static unsigned long __find_symbol(const char *name,
175                                    struct module **owner,
176                                    const unsigned long **crc,
177                                    int gplok)
178 {
179         struct module *mod;
180         const struct kernel_symbol *ks;
181
182         /* Core kernel first. */
183         *owner = NULL;
184         ks = lookup_symbol(name, __start___ksymtab, __stop___ksymtab);
185         if (ks) {
186                 *crc = symversion(__start___kcrctab, (ks - __start___ksymtab));
187                 return ks->value;
188         }
189         if (gplok) {
190                 ks = lookup_symbol(name, __start___ksymtab_gpl,
191                                          __stop___ksymtab_gpl);
192                 if (ks) {
193                         *crc = symversion(__start___kcrctab_gpl,
194                                           (ks - __start___ksymtab_gpl));
195                         return ks->value;
196                 }
197         }
198         ks = lookup_symbol(name, __start___ksymtab_gpl_future,
199                                  __stop___ksymtab_gpl_future);
200         if (ks) {
201                 if (!gplok) {
202                         printk(KERN_WARNING "Symbol %s is being used "
203                                "by a non-GPL module, which will not "
204                                "be allowed in the future\n", name);
205                         printk(KERN_WARNING "Please see the file "
206                                "Documentation/feature-removal-schedule.txt "
207                                "in the kernel source tree for more "
208                                "details.\n");
209                 }
210                 *crc = symversion(__start___kcrctab_gpl_future,
211                                   (ks - __start___ksymtab_gpl_future));
212                 return ks->value;
213         }
214
215         ks = lookup_symbol(name, __start___ksymtab_unused,
216                                  __stop___ksymtab_unused);
217         if (ks) {
218                 printk_unused_warning(name);
219                 *crc = symversion(__start___kcrctab_unused,
220                                   (ks - __start___ksymtab_unused));
221                 return ks->value;
222         }
223
224         if (gplok)
225                 ks = lookup_symbol(name, __start___ksymtab_unused_gpl,
226                                  __stop___ksymtab_unused_gpl);
227         if (ks) {
228                 printk_unused_warning(name);
229                 *crc = symversion(__start___kcrctab_unused_gpl,
230                                   (ks - __start___ksymtab_unused_gpl));
231                 return ks->value;
232         }
233
234         /* Now try modules. */
235         list_for_each_entry(mod, &modules, list) {
236                 *owner = mod;
237                 ks = lookup_symbol(name, mod->syms, mod->syms + mod->num_syms);
238                 if (ks) {
239                         *crc = symversion(mod->crcs, (ks - mod->syms));
240                         return ks->value;
241                 }
242
243                 if (gplok) {
244                         ks = lookup_symbol(name, mod->gpl_syms,
245                                            mod->gpl_syms + mod->num_gpl_syms);
246                         if (ks) {
247                                 *crc = symversion(mod->gpl_crcs,
248                                                   (ks - mod->gpl_syms));
249                                 return ks->value;
250                         }
251                 }
252                 ks = lookup_symbol(name, mod->unused_syms, mod->unused_syms + mod->num_unused_syms);
253                 if (ks) {
254                         printk_unused_warning(name);
255                         *crc = symversion(mod->unused_crcs, (ks - mod->unused_syms));
256                         return ks->value;
257                 }
258
259                 if (gplok) {
260                         ks = lookup_symbol(name, mod->unused_gpl_syms,
261                                            mod->unused_gpl_syms + mod->num_unused_gpl_syms);
262                         if (ks) {
263                                 printk_unused_warning(name);
264                                 *crc = symversion(mod->unused_gpl_crcs,
265                                                   (ks - mod->unused_gpl_syms));
266                                 return ks->value;
267                         }
268                 }
269                 ks = lookup_symbol(name, mod->gpl_future_syms,
270                                    (mod->gpl_future_syms +
271                                     mod->num_gpl_future_syms));
272                 if (ks) {
273                         if (!gplok) {
274                                 printk(KERN_WARNING "Symbol %s is being used "
275                                        "by a non-GPL module, which will not "
276                                        "be allowed in the future\n", name);
277                                 printk(KERN_WARNING "Please see the file "
278                                        "Documentation/feature-removal-schedule.txt "
279                                        "in the kernel source tree for more "
280                                        "details.\n");
281                         }
282                         *crc = symversion(mod->gpl_future_crcs,
283                                           (ks - mod->gpl_future_syms));
284                         return ks->value;
285                 }
286         }
287         DEBUGP("Failed to find symbol %s\n", name);
288         return 0;
289 }
290
291 /* Search for module by name: must hold module_mutex. */
292 static struct module *find_module(const char *name)
293 {
294         struct module *mod;
295
296         list_for_each_entry(mod, &modules, list) {
297                 if (strcmp(mod->name, name) == 0)
298                         return mod;
299         }
300         return NULL;
301 }
302
303 #ifdef CONFIG_SMP
304 /* Number of blocks used and allocated. */
305 static unsigned int pcpu_num_used, pcpu_num_allocated;
306 /* Size of each block.  -ve means used. */
307 static int *pcpu_size;
308
309 static int split_block(unsigned int i, unsigned short size)
310 {
311         /* Reallocation required? */
312         if (pcpu_num_used + 1 > pcpu_num_allocated) {
313                 int *new;
314
315                 new = krealloc(pcpu_size, sizeof(new[0])*pcpu_num_allocated*2,
316                                GFP_KERNEL);
317                 if (!new)
318                         return 0;
319
320                 pcpu_num_allocated *= 2;
321                 pcpu_size = new;
322         }
323
324         /* Insert a new subblock */
325         memmove(&pcpu_size[i+1], &pcpu_size[i],
326                 sizeof(pcpu_size[0]) * (pcpu_num_used - i));
327         pcpu_num_used++;
328
329         pcpu_size[i+1] -= size;
330         pcpu_size[i] = size;
331         return 1;
332 }
333
334 static inline unsigned int block_size(int val)
335 {
336         if (val < 0)
337                 return -val;
338         return val;
339 }
340
341 /* Created by linker magic */
342 extern char __per_cpu_start[], __per_cpu_end[];
343
344 static void *percpu_modalloc(unsigned long size, unsigned long align,
345                              const char *name)
346 {
347         unsigned long extra;
348         unsigned int i;
349         void *ptr;
350
351         if (align > PAGE_SIZE) {
352                 printk(KERN_WARNING "%s: per-cpu alignment %li > %li\n",
353                        name, align, PAGE_SIZE);
354                 align = PAGE_SIZE;
355         }
356
357         ptr = __per_cpu_start;
358         for (i = 0; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
359                 /* Extra for alignment requirement. */
360                 extra = ALIGN((unsigned long)ptr, align) - (unsigned long)ptr;
361                 BUG_ON(i == 0 && extra != 0);
362
363                 if (pcpu_size[i] < 0 || pcpu_size[i] < extra + size)
364                         continue;
365
366                 /* Transfer extra to previous block. */
367                 if (pcpu_size[i-1] < 0)
368                         pcpu_size[i-1] -= extra;
369                 else
370                         pcpu_size[i-1] += extra;
371                 pcpu_size[i] -= extra;
372                 ptr += extra;
373
374                 /* Split block if warranted */
375                 if (pcpu_size[i] - size > sizeof(unsigned long))
376                         if (!split_block(i, size))
377                                 return NULL;
378
379                 /* Mark allocated */
380                 pcpu_size[i] = -pcpu_size[i];
381                 return ptr;
382         }
383
384         printk(KERN_WARNING "Could not allocate %lu bytes percpu data\n",
385                size);
386         return NULL;
387 }
388
389 static void percpu_modfree(void *freeme)
390 {
391         unsigned int i;
392         void *ptr = __per_cpu_start + block_size(pcpu_size[0]);
393
394         /* First entry is core kernel percpu data. */
395         for (i = 1; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
396                 if (ptr == freeme) {
397                         pcpu_size[i] = -pcpu_size[i];
398                         goto free;
399                 }
400         }
401         BUG();
402
403  free:
404         /* Merge with previous? */
405         if (pcpu_size[i-1] >= 0) {
406                 pcpu_size[i-1] += pcpu_size[i];
407                 pcpu_num_used--;
408                 memmove(&pcpu_size[i], &pcpu_size[i+1],
409                         (pcpu_num_used - i) * sizeof(pcpu_size[0]));
410                 i--;
411         }
412         /* Merge with next? */
413         if (i+1 < pcpu_num_used && pcpu_size[i+1] >= 0) {
414                 pcpu_size[i] += pcpu_size[i+1];
415                 pcpu_num_used--;
416                 memmove(&pcpu_size[i+1], &pcpu_size[i+2],
417                         (pcpu_num_used - (i+1)) * sizeof(pcpu_size[0]));
418         }
419 }
420
421 static unsigned int find_pcpusec(Elf_Ehdr *hdr,
422                                  Elf_Shdr *sechdrs,
423                                  const char *secstrings)
424 {
425         return find_sec(hdr, sechdrs, secstrings, ".data.percpu");
426 }
427
428 static int percpu_modinit(void)
429 {
430         pcpu_num_used = 2;
431         pcpu_num_allocated = 2;
432         pcpu_size = kmalloc(sizeof(pcpu_size[0]) * pcpu_num_allocated,
433                             GFP_KERNEL);
434         /* Static in-kernel percpu data (used). */
435         pcpu_size[0] = -(__per_cpu_end-__per_cpu_start);
436         /* Free room. */
437         pcpu_size[1] = PERCPU_ENOUGH_ROOM + pcpu_size[0];
438         if (pcpu_size[1] < 0) {
439                 printk(KERN_ERR "No per-cpu room for modules.\n");
440                 pcpu_num_used = 1;
441         }
442
443         return 0;
444 }
445 __initcall(percpu_modinit);
446 #else /* ... !CONFIG_SMP */
447 static inline void *percpu_modalloc(unsigned long size, unsigned long align,
448                                     const char *name)
449 {
450         return NULL;
451 }
452 static inline void percpu_modfree(void *pcpuptr)
453 {
454         BUG();
455 }
456 static inline unsigned int find_pcpusec(Elf_Ehdr *hdr,
457                                         Elf_Shdr *sechdrs,
458                                         const char *secstrings)
459 {
460         return 0;
461 }
462 static inline void percpu_modcopy(void *pcpudst, const void *src,
463                                   unsigned long size)
464 {
465         /* pcpusec should be 0, and size of that section should be 0. */
466         BUG_ON(size != 0);
467 }
468 #endif /* CONFIG_SMP */
469
470 #define MODINFO_ATTR(field)     \
471 static void setup_modinfo_##field(struct module *mod, const char *s)  \
472 {                                                                     \
473         mod->field = kstrdup(s, GFP_KERNEL);                          \
474 }                                                                     \
475 static ssize_t show_modinfo_##field(struct module_attribute *mattr,   \
476                         struct module *mod, char *buffer)             \
477 {                                                                     \
478         return sprintf(buffer, "%s\n", mod->field);                   \
479 }                                                                     \
480 static int modinfo_##field##_exists(struct module *mod)               \
481 {                                                                     \
482         return mod->field != NULL;                                    \
483 }                                                                     \
484 static void free_modinfo_##field(struct module *mod)                  \
485 {                                                                     \
486         kfree(mod->field);                                            \
487         mod->field = NULL;                                            \
488 }                                                                     \
489 static struct module_attribute modinfo_##field = {                    \
490         .attr = { .name = __stringify(field), .mode = 0444 },         \
491         .show = show_modinfo_##field,                                 \
492         .setup = setup_modinfo_##field,                               \
493         .test = modinfo_##field##_exists,                             \
494         .free = free_modinfo_##field,                                 \
495 };
496
497 MODINFO_ATTR(version);
498 MODINFO_ATTR(srcversion);
499
500 #ifdef CONFIG_MODULE_UNLOAD
501 /* Init the unload section of the module. */
502 static void module_unload_init(struct module *mod)
503 {
504         unsigned int i;
505
506         INIT_LIST_HEAD(&mod->modules_which_use_me);
507         for (i = 0; i < NR_CPUS; i++)
508                 local_set(&mod->ref[i].count, 0);
509         /* Hold reference count during initialization. */
510         local_set(&mod->ref[raw_smp_processor_id()].count, 1);
511         /* Backwards compatibility macros put refcount during init. */
512         mod->waiter = current;
513 }
514
515 /* modules using other modules */
516 struct module_use
517 {
518         struct list_head list;
519         struct module *module_which_uses;
520 };
521
522 /* Does a already use b? */
523 static int already_uses(struct module *a, struct module *b)
524 {
525         struct module_use *use;
526
527         list_for_each_entry(use, &b->modules_which_use_me, list) {
528                 if (use->module_which_uses == a) {
529                         DEBUGP("%s uses %s!\n", a->name, b->name);
530                         return 1;
531                 }
532         }
533         DEBUGP("%s does not use %s!\n", a->name, b->name);
534         return 0;
535 }
536
537 /* Module a uses b */
538 static int use_module(struct module *a, struct module *b)
539 {
540         struct module_use *use;
541         int no_warn;
542
543         if (b == NULL || already_uses(a, b)) return 1;
544
545         if (!strong_try_module_get(b))
546                 return 0;
547
548         DEBUGP("Allocating new usage for %s.\n", a->name);
549         use = kmalloc(sizeof(*use), GFP_ATOMIC);
550         if (!use) {
551                 printk("%s: out of memory loading\n", a->name);
552                 module_put(b);
553                 return 0;
554         }
555
556         use->module_which_uses = a;
557         list_add(&use->list, &b->modules_which_use_me);
558         no_warn = sysfs_create_link(b->holders_dir, &a->mkobj.kobj, a->name);
559         return 1;
560 }
561
562 /* Clear the unload stuff of the module. */
563 static void module_unload_free(struct module *mod)
564 {
565         struct module *i;
566
567         list_for_each_entry(i, &modules, list) {
568                 struct module_use *use;
569
570                 list_for_each_entry(use, &i->modules_which_use_me, list) {
571                         if (use->module_which_uses == mod) {
572                                 DEBUGP("%s unusing %s\n", mod->name, i->name);
573                                 module_put(i);
574                                 list_del(&use->list);
575                                 kfree(use);
576                                 sysfs_remove_link(i->holders_dir, mod->name);
577                                 /* There can be at most one match. */
578                                 break;
579                         }
580                 }
581         }
582 }
583
584 #ifdef CONFIG_MODULE_FORCE_UNLOAD
585 static inline int try_force_unload(unsigned int flags)
586 {
587         int ret = (flags & O_TRUNC);
588         if (ret)
589                 add_taint(TAINT_FORCED_RMMOD);
590         return ret;
591 }
592 #else
593 static inline int try_force_unload(unsigned int flags)
594 {
595         return 0;
596 }
597 #endif /* CONFIG_MODULE_FORCE_UNLOAD */
598
599 struct stopref
600 {
601         struct module *mod;
602         int flags;
603         int *forced;
604 };
605
606 /* Whole machine is stopped with interrupts off when this runs. */
607 static int __try_stop_module(void *_sref)
608 {
609         struct stopref *sref = _sref;
610
611         /* If it's not unused, quit unless we are told to block. */
612         if ((sref->flags & O_NONBLOCK) && module_refcount(sref->mod) != 0) {
613                 if (!(*sref->forced = try_force_unload(sref->flags)))
614                         return -EWOULDBLOCK;
615         }
616
617         /* Mark it as dying. */
618         sref->mod->state = MODULE_STATE_GOING;
619         return 0;
620 }
621
622 static int try_stop_module(struct module *mod, int flags, int *forced)
623 {
624         struct stopref sref = { mod, flags, forced };
625
626         return stop_machine_run(__try_stop_module, &sref, NR_CPUS);
627 }
628
629 unsigned int module_refcount(struct module *mod)
630 {
631         unsigned int i, total = 0;
632
633         for (i = 0; i < NR_CPUS; i++)
634                 total += local_read(&mod->ref[i].count);
635         return total;
636 }
637 EXPORT_SYMBOL(module_refcount);
638
639 /* This exists whether we can unload or not */
640 static void free_module(struct module *mod);
641
642 static void wait_for_zero_refcount(struct module *mod)
643 {
644         /* Since we might sleep for some time, drop the semaphore first */
645         mutex_unlock(&module_mutex);
646         for (;;) {
647                 DEBUGP("Looking at refcount...\n");
648                 set_current_state(TASK_UNINTERRUPTIBLE);
649                 if (module_refcount(mod) == 0)
650                         break;
651                 schedule();
652         }
653         current->state = TASK_RUNNING;
654         mutex_lock(&module_mutex);
655 }
656
657 asmlinkage long
658 sys_delete_module(const char __user *name_user, unsigned int flags)
659 {
660         struct module *mod;
661         char name[MODULE_NAME_LEN];
662         int ret, forced = 0;
663
664         if (!capable(CAP_SYS_MODULE))
665                 return -EPERM;
666
667         if (strncpy_from_user(name, name_user, MODULE_NAME_LEN-1) < 0)
668                 return -EFAULT;
669         name[MODULE_NAME_LEN-1] = '\0';
670
671         if (mutex_lock_interruptible(&module_mutex) != 0)
672                 return -EINTR;
673
674         mod = find_module(name);
675         if (!mod) {
676                 ret = -ENOENT;
677                 goto out;
678         }
679
680         if (!list_empty(&mod->modules_which_use_me)) {
681                 /* Other modules depend on us: get rid of them first. */
682                 ret = -EWOULDBLOCK;
683                 goto out;
684         }
685
686         /* Doing init or already dying? */
687         if (mod->state != MODULE_STATE_LIVE) {
688                 /* FIXME: if (force), slam module count and wake up
689                    waiter --RR */
690                 DEBUGP("%s already dying\n", mod->name);
691                 ret = -EBUSY;
692                 goto out;
693         }
694
695         /* If it has an init func, it must have an exit func to unload */
696         if (mod->init && !mod->exit) {
697                 forced = try_force_unload(flags);
698                 if (!forced) {
699                         /* This module can't be removed */
700                         ret = -EBUSY;
701                         goto out;
702                 }
703         }
704
705         /* Set this up before setting mod->state */
706         mod->waiter = current;
707
708         /* Stop the machine so refcounts can't move and disable module. */
709         ret = try_stop_module(mod, flags, &forced);
710         if (ret != 0)
711                 goto out;
712
713         /* Never wait if forced. */
714         if (!forced && module_refcount(mod) != 0)
715                 wait_for_zero_refcount(mod);
716
717         /* Final destruction now noone is using it. */
718         if (mod->exit != NULL) {
719                 mutex_unlock(&module_mutex);
720                 mod->exit();
721                 mutex_lock(&module_mutex);
722         }
723         free_module(mod);
724
725  out:
726         mutex_unlock(&module_mutex);
727         return ret;
728 }
729
730 static void print_unload_info(struct seq_file *m, struct module *mod)
731 {
732         struct module_use *use;
733         int printed_something = 0;
734
735         seq_printf(m, " %u ", module_refcount(mod));
736
737         /* Always include a trailing , so userspace can differentiate
738            between this and the old multi-field proc format. */
739         list_for_each_entry(use, &mod->modules_which_use_me, list) {
740                 printed_something = 1;
741                 seq_printf(m, "%s,", use->module_which_uses->name);
742         }
743
744         if (mod->init != NULL && mod->exit == NULL) {
745                 printed_something = 1;
746                 seq_printf(m, "[permanent],");
747         }
748
749         if (!printed_something)
750                 seq_printf(m, "-");
751 }
752
753 void __symbol_put(const char *symbol)
754 {
755         struct module *owner;
756         const unsigned long *crc;
757
758         preempt_disable();
759         if (!__find_symbol(symbol, &owner, &crc, 1))
760                 BUG();
761         module_put(owner);
762         preempt_enable();
763 }
764 EXPORT_SYMBOL(__symbol_put);
765
766 void symbol_put_addr(void *addr)
767 {
768         struct module *modaddr;
769
770         if (core_kernel_text((unsigned long)addr))
771                 return;
772
773         if (!(modaddr = module_text_address((unsigned long)addr)))
774                 BUG();
775         module_put(modaddr);
776 }
777 EXPORT_SYMBOL_GPL(symbol_put_addr);
778
779 static ssize_t show_refcnt(struct module_attribute *mattr,
780                            struct module *mod, char *buffer)
781 {
782         return sprintf(buffer, "%u\n", module_refcount(mod));
783 }
784
785 static struct module_attribute refcnt = {
786         .attr = { .name = "refcnt", .mode = 0444 },
787         .show = show_refcnt,
788 };
789
790 void module_put(struct module *module)
791 {
792         if (module) {
793                 unsigned int cpu = get_cpu();
794                 local_dec(&module->ref[cpu].count);
795                 /* Maybe they're waiting for us to drop reference? */
796                 if (unlikely(!module_is_live(module)))
797                         wake_up_process(module->waiter);
798                 put_cpu();
799         }
800 }
801 EXPORT_SYMBOL(module_put);
802
803 #else /* !CONFIG_MODULE_UNLOAD */
804 static void print_unload_info(struct seq_file *m, struct module *mod)
805 {
806         /* We don't know the usage count, or what modules are using. */
807         seq_printf(m, " - -");
808 }
809
810 static inline void module_unload_free(struct module *mod)
811 {
812 }
813
814 static inline int use_module(struct module *a, struct module *b)
815 {
816         return strong_try_module_get(b);
817 }
818
819 static inline void module_unload_init(struct module *mod)
820 {
821 }
822 #endif /* CONFIG_MODULE_UNLOAD */
823
824 static ssize_t show_initstate(struct module_attribute *mattr,
825                            struct module *mod, char *buffer)
826 {
827         const char *state = "unknown";
828
829         switch (mod->state) {
830         case MODULE_STATE_LIVE:
831                 state = "live";
832                 break;
833         case MODULE_STATE_COMING:
834                 state = "coming";
835                 break;
836         case MODULE_STATE_GOING:
837                 state = "going";
838                 break;
839         }
840         return sprintf(buffer, "%s\n", state);
841 }
842
843 static struct module_attribute initstate = {
844         .attr = { .name = "initstate", .mode = 0444 },
845         .show = show_initstate,
846 };
847
848 static struct module_attribute *modinfo_attrs[] = {
849         &modinfo_version,
850         &modinfo_srcversion,
851         &initstate,
852 #ifdef CONFIG_MODULE_UNLOAD
853         &refcnt,
854 #endif
855         NULL,
856 };
857
858 static const char vermagic[] = VERMAGIC_STRING;
859
860 #ifdef CONFIG_MODVERSIONS
861 static int check_version(Elf_Shdr *sechdrs,
862                          unsigned int versindex,
863                          const char *symname,
864                          struct module *mod, 
865                          const unsigned long *crc)
866 {
867         unsigned int i, num_versions;
868         struct modversion_info *versions;
869
870         /* Exporting module didn't supply crcs?  OK, we're already tainted. */
871         if (!crc)
872                 return 1;
873
874         versions = (void *) sechdrs[versindex].sh_addr;
875         num_versions = sechdrs[versindex].sh_size
876                 / sizeof(struct modversion_info);
877
878         for (i = 0; i < num_versions; i++) {
879                 if (strcmp(versions[i].name, symname) != 0)
880                         continue;
881
882                 if (versions[i].crc == *crc)
883                         return 1;
884                 printk("%s: disagrees about version of symbol %s\n",
885                        mod->name, symname);
886                 DEBUGP("Found checksum %lX vs module %lX\n",
887                        *crc, versions[i].crc);
888                 return 0;
889         }
890         /* Not in module's version table.  OK, but that taints the kernel. */
891         if (!(tainted & TAINT_FORCED_MODULE))
892                 printk("%s: no version for \"%s\" found: kernel tainted.\n",
893                        mod->name, symname);
894         add_taint_module(mod, TAINT_FORCED_MODULE);
895         return 1;
896 }
897
898 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
899                                           unsigned int versindex,
900                                           struct module *mod)
901 {
902         const unsigned long *crc;
903         struct module *owner;
904
905         if (!__find_symbol("struct_module", &owner, &crc, 1))
906                 BUG();
907         return check_version(sechdrs, versindex, "struct_module", mod,
908                              crc);
909 }
910
911 /* First part is kernel version, which we ignore. */
912 static inline int same_magic(const char *amagic, const char *bmagic)
913 {
914         amagic += strcspn(amagic, " ");
915         bmagic += strcspn(bmagic, " ");
916         return strcmp(amagic, bmagic) == 0;
917 }
918 #else
919 static inline int check_version(Elf_Shdr *sechdrs,
920                                 unsigned int versindex,
921                                 const char *symname,
922                                 struct module *mod, 
923                                 const unsigned long *crc)
924 {
925         return 1;
926 }
927
928 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
929                                           unsigned int versindex,
930                                           struct module *mod)
931 {
932         return 1;
933 }
934
935 static inline int same_magic(const char *amagic, const char *bmagic)
936 {
937         return strcmp(amagic, bmagic) == 0;
938 }
939 #endif /* CONFIG_MODVERSIONS */
940
941 /* Resolve a symbol for this module.  I.e. if we find one, record usage.
942    Must be holding module_mutex. */
943 static unsigned long resolve_symbol(Elf_Shdr *sechdrs,
944                                     unsigned int versindex,
945                                     const char *name,
946                                     struct module *mod)
947 {
948         struct module *owner;
949         unsigned long ret;
950         const unsigned long *crc;
951
952         ret = __find_symbol(name, &owner, &crc,
953                         !(mod->taints & TAINT_PROPRIETARY_MODULE));
954         if (ret) {
955                 /* use_module can fail due to OOM, or module unloading */
956                 if (!check_version(sechdrs, versindex, name, mod, crc) ||
957                     !use_module(mod, owner))
958                         ret = 0;
959         }
960         return ret;
961 }
962
963
964 /*
965  * /sys/module/foo/sections stuff
966  * J. Corbet <corbet@lwn.net>
967  */
968 #ifdef CONFIG_KALLSYMS
969 static ssize_t module_sect_show(struct module_attribute *mattr,
970                                 struct module *mod, char *buf)
971 {
972         struct module_sect_attr *sattr =
973                 container_of(mattr, struct module_sect_attr, mattr);
974         return sprintf(buf, "0x%lx\n", sattr->address);
975 }
976
977 static void free_sect_attrs(struct module_sect_attrs *sect_attrs)
978 {
979         int section;
980
981         for (section = 0; section < sect_attrs->nsections; section++)
982                 kfree(sect_attrs->attrs[section].name);
983         kfree(sect_attrs);
984 }
985
986 static void add_sect_attrs(struct module *mod, unsigned int nsect,
987                 char *secstrings, Elf_Shdr *sechdrs)
988 {
989         unsigned int nloaded = 0, i, size[2];
990         struct module_sect_attrs *sect_attrs;
991         struct module_sect_attr *sattr;
992         struct attribute **gattr;
993
994         /* Count loaded sections and allocate structures */
995         for (i = 0; i < nsect; i++)
996                 if (sechdrs[i].sh_flags & SHF_ALLOC)
997                         nloaded++;
998         size[0] = ALIGN(sizeof(*sect_attrs)
999                         + nloaded * sizeof(sect_attrs->attrs[0]),
1000                         sizeof(sect_attrs->grp.attrs[0]));
1001         size[1] = (nloaded + 1) * sizeof(sect_attrs->grp.attrs[0]);
1002         sect_attrs = kzalloc(size[0] + size[1], GFP_KERNEL);
1003         if (sect_attrs == NULL)
1004                 return;
1005
1006         /* Setup section attributes. */
1007         sect_attrs->grp.name = "sections";
1008         sect_attrs->grp.attrs = (void *)sect_attrs + size[0];
1009
1010         sect_attrs->nsections = 0;
1011         sattr = &sect_attrs->attrs[0];
1012         gattr = &sect_attrs->grp.attrs[0];
1013         for (i = 0; i < nsect; i++) {
1014                 if (! (sechdrs[i].sh_flags & SHF_ALLOC))
1015                         continue;
1016                 sattr->address = sechdrs[i].sh_addr;
1017                 sattr->name = kstrdup(secstrings + sechdrs[i].sh_name,
1018                                         GFP_KERNEL);
1019                 if (sattr->name == NULL)
1020                         goto out;
1021                 sect_attrs->nsections++;
1022                 sattr->mattr.show = module_sect_show;
1023                 sattr->mattr.store = NULL;
1024                 sattr->mattr.attr.name = sattr->name;
1025                 sattr->mattr.attr.mode = S_IRUGO;
1026                 *(gattr++) = &(sattr++)->mattr.attr;
1027         }
1028         *gattr = NULL;
1029
1030         if (sysfs_create_group(&mod->mkobj.kobj, &sect_attrs->grp))
1031                 goto out;
1032
1033         mod->sect_attrs = sect_attrs;
1034         return;
1035   out:
1036         free_sect_attrs(sect_attrs);
1037 }
1038
1039 static void remove_sect_attrs(struct module *mod)
1040 {
1041         if (mod->sect_attrs) {
1042                 sysfs_remove_group(&mod->mkobj.kobj,
1043                                    &mod->sect_attrs->grp);
1044                 /* We are positive that no one is using any sect attrs
1045                  * at this point.  Deallocate immediately. */
1046                 free_sect_attrs(mod->sect_attrs);
1047                 mod->sect_attrs = NULL;
1048         }
1049 }
1050
1051 /*
1052  * /sys/module/foo/notes/.section.name gives contents of SHT_NOTE sections.
1053  */
1054
1055 struct module_notes_attrs {
1056         struct kobject *dir;
1057         unsigned int notes;
1058         struct bin_attribute attrs[0];
1059 };
1060
1061 static ssize_t module_notes_read(struct kobject *kobj,
1062                                  struct bin_attribute *bin_attr,
1063                                  char *buf, loff_t pos, size_t count)
1064 {
1065         /*
1066          * The caller checked the pos and count against our size.
1067          */
1068         memcpy(buf, bin_attr->private + pos, count);
1069         return count;
1070 }
1071
1072 static void free_notes_attrs(struct module_notes_attrs *notes_attrs,
1073                              unsigned int i)
1074 {
1075         if (notes_attrs->dir) {
1076                 while (i-- > 0)
1077                         sysfs_remove_bin_file(notes_attrs->dir,
1078                                               &notes_attrs->attrs[i]);
1079                 kobject_del(notes_attrs->dir);
1080         }
1081         kfree(notes_attrs);
1082 }
1083
1084 static void add_notes_attrs(struct module *mod, unsigned int nsect,
1085                             char *secstrings, Elf_Shdr *sechdrs)
1086 {
1087         unsigned int notes, loaded, i;
1088         struct module_notes_attrs *notes_attrs;
1089         struct bin_attribute *nattr;
1090
1091         /* Count notes sections and allocate structures.  */
1092         notes = 0;
1093         for (i = 0; i < nsect; i++)
1094                 if ((sechdrs[i].sh_flags & SHF_ALLOC) &&
1095                     (sechdrs[i].sh_type == SHT_NOTE))
1096                         ++notes;
1097
1098         if (notes == 0)
1099                 return;
1100
1101         notes_attrs = kzalloc(sizeof(*notes_attrs)
1102                               + notes * sizeof(notes_attrs->attrs[0]),
1103                               GFP_KERNEL);
1104         if (notes_attrs == NULL)
1105                 return;
1106
1107         notes_attrs->notes = notes;
1108         nattr = &notes_attrs->attrs[0];
1109         for (loaded = i = 0; i < nsect; ++i) {
1110                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
1111                         continue;
1112                 if (sechdrs[i].sh_type == SHT_NOTE) {
1113                         nattr->attr.name = mod->sect_attrs->attrs[loaded].name;
1114                         nattr->attr.mode = S_IRUGO;
1115                         nattr->size = sechdrs[i].sh_size;
1116                         nattr->private = (void *) sechdrs[i].sh_addr;
1117                         nattr->read = module_notes_read;
1118                         ++nattr;
1119                 }
1120                 ++loaded;
1121         }
1122
1123         notes_attrs->dir = kobject_add_dir(&mod->mkobj.kobj, "notes");
1124         if (!notes_attrs->dir)
1125                 goto out;
1126
1127         for (i = 0; i < notes; ++i)
1128                 if (sysfs_create_bin_file(notes_attrs->dir,
1129                                           &notes_attrs->attrs[i]))
1130                         goto out;
1131
1132         mod->notes_attrs = notes_attrs;
1133         return;
1134
1135   out:
1136         free_notes_attrs(notes_attrs, i);
1137 }
1138
1139 static void remove_notes_attrs(struct module *mod)
1140 {
1141         if (mod->notes_attrs)
1142                 free_notes_attrs(mod->notes_attrs, mod->notes_attrs->notes);
1143 }
1144
1145 #else
1146
1147 static inline void add_sect_attrs(struct module *mod, unsigned int nsect,
1148                 char *sectstrings, Elf_Shdr *sechdrs)
1149 {
1150 }
1151
1152 static inline void remove_sect_attrs(struct module *mod)
1153 {
1154 }
1155
1156 static inline void add_notes_attrs(struct module *mod, unsigned int nsect,
1157                                    char *sectstrings, Elf_Shdr *sechdrs)
1158 {
1159 }
1160
1161 static inline void remove_notes_attrs(struct module *mod)
1162 {
1163 }
1164 #endif /* CONFIG_KALLSYMS */
1165
1166 #ifdef CONFIG_SYSFS
1167 int module_add_modinfo_attrs(struct module *mod)
1168 {
1169         struct module_attribute *attr;
1170         struct module_attribute *temp_attr;
1171         int error = 0;
1172         int i;
1173
1174         mod->modinfo_attrs = kzalloc((sizeof(struct module_attribute) *
1175                                         (ARRAY_SIZE(modinfo_attrs) + 1)),
1176                                         GFP_KERNEL);
1177         if (!mod->modinfo_attrs)
1178                 return -ENOMEM;
1179
1180         temp_attr = mod->modinfo_attrs;
1181         for (i = 0; (attr = modinfo_attrs[i]) && !error; i++) {
1182                 if (!attr->test ||
1183                     (attr->test && attr->test(mod))) {
1184                         memcpy(temp_attr, attr, sizeof(*temp_attr));
1185                         error = sysfs_create_file(&mod->mkobj.kobj,&temp_attr->attr);
1186                         ++temp_attr;
1187                 }
1188         }
1189         return error;
1190 }
1191
1192 void module_remove_modinfo_attrs(struct module *mod)
1193 {
1194         struct module_attribute *attr;
1195         int i;
1196
1197         for (i = 0; (attr = &mod->modinfo_attrs[i]); i++) {
1198                 /* pick a field to test for end of list */
1199                 if (!attr->attr.name)
1200                         break;
1201                 sysfs_remove_file(&mod->mkobj.kobj,&attr->attr);
1202                 if (attr->free)
1203                         attr->free(mod);
1204         }
1205         kfree(mod->modinfo_attrs);
1206 }
1207 #endif
1208
1209 #ifdef CONFIG_SYSFS
1210 int mod_sysfs_init(struct module *mod)
1211 {
1212         int err;
1213
1214         if (!module_sysfs_initialized) {
1215                 printk(KERN_ERR "%s: module sysfs not initialized\n",
1216                        mod->name);
1217                 err = -EINVAL;
1218                 goto out;
1219         }
1220         memset(&mod->mkobj.kobj, 0, sizeof(mod->mkobj.kobj));
1221         err = kobject_set_name(&mod->mkobj.kobj, "%s", mod->name);
1222         if (err)
1223                 goto out;
1224         kobj_set_kset_s(&mod->mkobj, module_subsys);
1225         mod->mkobj.mod = mod;
1226
1227         kobject_init(&mod->mkobj.kobj);
1228
1229 out:
1230         return err;
1231 }
1232
1233 int mod_sysfs_setup(struct module *mod,
1234                            struct kernel_param *kparam,
1235                            unsigned int num_params)
1236 {
1237         int err;
1238
1239         /* delay uevent until full sysfs population */
1240         err = kobject_add(&mod->mkobj.kobj);
1241         if (err)
1242                 goto out;
1243
1244         mod->holders_dir = kobject_add_dir(&mod->mkobj.kobj, "holders");
1245         if (!mod->holders_dir) {
1246                 err = -ENOMEM;
1247                 goto out_unreg;
1248         }
1249
1250         err = module_param_sysfs_setup(mod, kparam, num_params);
1251         if (err)
1252                 goto out_unreg_holders;
1253
1254         err = module_add_modinfo_attrs(mod);
1255         if (err)
1256                 goto out_unreg_param;
1257
1258         kobject_uevent(&mod->mkobj.kobj, KOBJ_ADD);
1259         return 0;
1260
1261 out_unreg_param:
1262         module_param_sysfs_remove(mod);
1263 out_unreg_holders:
1264         kobject_unregister(mod->holders_dir);
1265 out_unreg:
1266         kobject_del(&mod->mkobj.kobj);
1267         kobject_put(&mod->mkobj.kobj);
1268 out:
1269         return err;
1270 }
1271 #endif
1272
1273 static void mod_kobject_remove(struct module *mod)
1274 {
1275         module_remove_modinfo_attrs(mod);
1276         module_param_sysfs_remove(mod);
1277         kobject_unregister(mod->mkobj.drivers_dir);
1278         kobject_unregister(mod->holders_dir);
1279         kobject_unregister(&mod->mkobj.kobj);
1280 }
1281
1282 /*
1283  * unlink the module with the whole machine is stopped with interrupts off
1284  * - this defends against kallsyms not taking locks
1285  */
1286 static int __unlink_module(void *_mod)
1287 {
1288         struct module *mod = _mod;
1289         list_del(&mod->list);
1290         return 0;
1291 }
1292
1293 /* Free a module, remove from lists, etc (must hold module_mutex). */
1294 static void free_module(struct module *mod)
1295 {
1296         /* Delete from various lists */
1297         stop_machine_run(__unlink_module, mod, NR_CPUS);
1298         remove_notes_attrs(mod);
1299         remove_sect_attrs(mod);
1300         mod_kobject_remove(mod);
1301
1302         unwind_remove_table(mod->unwind_info, 0);
1303
1304         /* Arch-specific cleanup. */
1305         module_arch_cleanup(mod);
1306
1307         /* Module unload stuff */
1308         module_unload_free(mod);
1309
1310         /* This may be NULL, but that's OK */
1311         module_free(mod, mod->module_init);
1312         kfree(mod->args);
1313         if (mod->percpu)
1314                 percpu_modfree(mod->percpu);
1315
1316         /* Free lock-classes: */
1317         lockdep_free_key_range(mod->module_core, mod->core_size);
1318
1319         /* Finally, free the core (containing the module structure) */
1320         module_free(mod, mod->module_core);
1321 }
1322
1323 void *__symbol_get(const char *symbol)
1324 {
1325         struct module *owner;
1326         unsigned long value;
1327         const unsigned long *crc;
1328
1329         preempt_disable();
1330         value = __find_symbol(symbol, &owner, &crc, 1);
1331         if (value && !strong_try_module_get(owner))
1332                 value = 0;
1333         preempt_enable();
1334
1335         return (void *)value;
1336 }
1337 EXPORT_SYMBOL_GPL(__symbol_get);
1338
1339 /*
1340  * Ensure that an exported symbol [global namespace] does not already exist
1341  * in the kernel or in some other module's exported symbol table.
1342  */
1343 static int verify_export_symbols(struct module *mod)
1344 {
1345         const char *name = NULL;
1346         unsigned long i, ret = 0;
1347         struct module *owner;
1348         const unsigned long *crc;
1349
1350         for (i = 0; i < mod->num_syms; i++)
1351                 if (__find_symbol(mod->syms[i].name, &owner, &crc, 1)) {
1352                         name = mod->syms[i].name;
1353                         ret = -ENOEXEC;
1354                         goto dup;
1355                 }
1356
1357         for (i = 0; i < mod->num_gpl_syms; i++)
1358                 if (__find_symbol(mod->gpl_syms[i].name, &owner, &crc, 1)) {
1359                         name = mod->gpl_syms[i].name;
1360                         ret = -ENOEXEC;
1361                         goto dup;
1362                 }
1363
1364 dup:
1365         if (ret)
1366                 printk(KERN_ERR "%s: exports duplicate symbol %s (owned by %s)\n",
1367                         mod->name, name, module_name(owner));
1368
1369         return ret;
1370 }
1371
1372 /* Change all symbols so that sh_value encodes the pointer directly. */
1373 static int simplify_symbols(Elf_Shdr *sechdrs,
1374                             unsigned int symindex,
1375                             const char *strtab,
1376                             unsigned int versindex,
1377                             unsigned int pcpuindex,
1378                             struct module *mod)
1379 {
1380         Elf_Sym *sym = (void *)sechdrs[symindex].sh_addr;
1381         unsigned long secbase;
1382         unsigned int i, n = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1383         int ret = 0;
1384
1385         for (i = 1; i < n; i++) {
1386                 switch (sym[i].st_shndx) {
1387                 case SHN_COMMON:
1388                         /* We compiled with -fno-common.  These are not
1389                            supposed to happen.  */
1390                         DEBUGP("Common symbol: %s\n", strtab + sym[i].st_name);
1391                         printk("%s: please compile with -fno-common\n",
1392                                mod->name);
1393                         ret = -ENOEXEC;
1394                         break;
1395
1396                 case SHN_ABS:
1397                         /* Don't need to do anything */
1398                         DEBUGP("Absolute symbol: 0x%08lx\n",
1399                                (long)sym[i].st_value);
1400                         break;
1401
1402                 case SHN_UNDEF:
1403                         sym[i].st_value
1404                           = resolve_symbol(sechdrs, versindex,
1405                                            strtab + sym[i].st_name, mod);
1406
1407                         /* Ok if resolved.  */
1408                         if (sym[i].st_value != 0)
1409                                 break;
1410                         /* Ok if weak.  */
1411                         if (ELF_ST_BIND(sym[i].st_info) == STB_WEAK)
1412                                 break;
1413
1414                         printk(KERN_WARNING "%s: Unknown symbol %s\n",
1415                                mod->name, strtab + sym[i].st_name);
1416                         ret = -ENOENT;
1417                         break;
1418
1419                 default:
1420                         /* Divert to percpu allocation if a percpu var. */
1421                         if (sym[i].st_shndx == pcpuindex)
1422                                 secbase = (unsigned long)mod->percpu;
1423                         else
1424                                 secbase = sechdrs[sym[i].st_shndx].sh_addr;
1425                         sym[i].st_value += secbase;
1426                         break;
1427                 }
1428         }
1429
1430         return ret;
1431 }
1432
1433 /* Update size with this section: return offset. */
1434 static long get_offset(unsigned long *size, Elf_Shdr *sechdr)
1435 {
1436         long ret;
1437
1438         ret = ALIGN(*size, sechdr->sh_addralign ?: 1);
1439         *size = ret + sechdr->sh_size;
1440         return ret;
1441 }
1442
1443 /* Lay out the SHF_ALLOC sections in a way not dissimilar to how ld
1444    might -- code, read-only data, read-write data, small data.  Tally
1445    sizes, and place the offsets into sh_entsize fields: high bit means it
1446    belongs in init. */
1447 static void layout_sections(struct module *mod,
1448                             const Elf_Ehdr *hdr,
1449                             Elf_Shdr *sechdrs,
1450                             const char *secstrings)
1451 {
1452         static unsigned long const masks[][2] = {
1453                 /* NOTE: all executable code must be the first section
1454                  * in this array; otherwise modify the text_size
1455                  * finder in the two loops below */
1456                 { SHF_EXECINSTR | SHF_ALLOC, ARCH_SHF_SMALL },
1457                 { SHF_ALLOC, SHF_WRITE | ARCH_SHF_SMALL },
1458                 { SHF_WRITE | SHF_ALLOC, ARCH_SHF_SMALL },
1459                 { ARCH_SHF_SMALL | SHF_ALLOC, 0 }
1460         };
1461         unsigned int m, i;
1462
1463         for (i = 0; i < hdr->e_shnum; i++)
1464                 sechdrs[i].sh_entsize = ~0UL;
1465
1466         DEBUGP("Core section allocation order:\n");
1467         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1468                 for (i = 0; i < hdr->e_shnum; ++i) {
1469                         Elf_Shdr *s = &sechdrs[i];
1470
1471                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1472                             || (s->sh_flags & masks[m][1])
1473                             || s->sh_entsize != ~0UL
1474                             || strncmp(secstrings + s->sh_name,
1475                                        ".init", 5) == 0)
1476                                 continue;
1477                         s->sh_entsize = get_offset(&mod->core_size, s);
1478                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1479                 }
1480                 if (m == 0)
1481                         mod->core_text_size = mod->core_size;
1482         }
1483
1484         DEBUGP("Init section allocation order:\n");
1485         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1486                 for (i = 0; i < hdr->e_shnum; ++i) {
1487                         Elf_Shdr *s = &sechdrs[i];
1488
1489                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1490                             || (s->sh_flags & masks[m][1])
1491                             || s->sh_entsize != ~0UL
1492                             || strncmp(secstrings + s->sh_name,
1493                                        ".init", 5) != 0)
1494                                 continue;
1495                         s->sh_entsize = (get_offset(&mod->init_size, s)
1496                                          | INIT_OFFSET_MASK);
1497                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1498                 }
1499                 if (m == 0)
1500                         mod->init_text_size = mod->init_size;
1501         }
1502 }
1503
1504 static void set_license(struct module *mod, const char *license)
1505 {
1506         if (!license)
1507                 license = "unspecified";
1508
1509         if (!license_is_gpl_compatible(license)) {
1510                 if (!(tainted & TAINT_PROPRIETARY_MODULE))
1511                         printk(KERN_WARNING "%s: module license '%s' taints "
1512                                 "kernel.\n", mod->name, license);
1513                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1514         }
1515 }
1516
1517 /* Parse tag=value strings from .modinfo section */
1518 static char *next_string(char *string, unsigned long *secsize)
1519 {
1520         /* Skip non-zero chars */
1521         while (string[0]) {
1522                 string++;
1523                 if ((*secsize)-- <= 1)
1524                         return NULL;
1525         }
1526
1527         /* Skip any zero padding. */
1528         while (!string[0]) {
1529                 string++;
1530                 if ((*secsize)-- <= 1)
1531                         return NULL;
1532         }
1533         return string;
1534 }
1535
1536 static char *get_modinfo(Elf_Shdr *sechdrs,
1537                          unsigned int info,
1538                          const char *tag)
1539 {
1540         char *p;
1541         unsigned int taglen = strlen(tag);
1542         unsigned long size = sechdrs[info].sh_size;
1543
1544         for (p = (char *)sechdrs[info].sh_addr; p; p = next_string(p, &size)) {
1545                 if (strncmp(p, tag, taglen) == 0 && p[taglen] == '=')
1546                         return p + taglen + 1;
1547         }
1548         return NULL;
1549 }
1550
1551 static void setup_modinfo(struct module *mod, Elf_Shdr *sechdrs,
1552                           unsigned int infoindex)
1553 {
1554         struct module_attribute *attr;
1555         int i;
1556
1557         for (i = 0; (attr = modinfo_attrs[i]); i++) {
1558                 if (attr->setup)
1559                         attr->setup(mod,
1560                                     get_modinfo(sechdrs,
1561                                                 infoindex,
1562                                                 attr->attr.name));
1563         }
1564 }
1565
1566 #ifdef CONFIG_KALLSYMS
1567 static int is_exported(const char *name, const struct module *mod)
1568 {
1569         if (!mod && lookup_symbol(name, __start___ksymtab, __stop___ksymtab))
1570                 return 1;
1571         else
1572                 if (mod && lookup_symbol(name, mod->syms, mod->syms + mod->num_syms))
1573                         return 1;
1574                 else
1575                         return 0;
1576 }
1577
1578 /* As per nm */
1579 static char elf_type(const Elf_Sym *sym,
1580                      Elf_Shdr *sechdrs,
1581                      const char *secstrings,
1582                      struct module *mod)
1583 {
1584         if (ELF_ST_BIND(sym->st_info) == STB_WEAK) {
1585                 if (ELF_ST_TYPE(sym->st_info) == STT_OBJECT)
1586                         return 'v';
1587                 else
1588                         return 'w';
1589         }
1590         if (sym->st_shndx == SHN_UNDEF)
1591                 return 'U';
1592         if (sym->st_shndx == SHN_ABS)
1593                 return 'a';
1594         if (sym->st_shndx >= SHN_LORESERVE)
1595                 return '?';
1596         if (sechdrs[sym->st_shndx].sh_flags & SHF_EXECINSTR)
1597                 return 't';
1598         if (sechdrs[sym->st_shndx].sh_flags & SHF_ALLOC
1599             && sechdrs[sym->st_shndx].sh_type != SHT_NOBITS) {
1600                 if (!(sechdrs[sym->st_shndx].sh_flags & SHF_WRITE))
1601                         return 'r';
1602                 else if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1603                         return 'g';
1604                 else
1605                         return 'd';
1606         }
1607         if (sechdrs[sym->st_shndx].sh_type == SHT_NOBITS) {
1608                 if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1609                         return 's';
1610                 else
1611                         return 'b';
1612         }
1613         if (strncmp(secstrings + sechdrs[sym->st_shndx].sh_name,
1614                     ".debug", strlen(".debug")) == 0)
1615                 return 'n';
1616         return '?';
1617 }
1618
1619 static void add_kallsyms(struct module *mod,
1620                          Elf_Shdr *sechdrs,
1621                          unsigned int symindex,
1622                          unsigned int strindex,
1623                          const char *secstrings)
1624 {
1625         unsigned int i;
1626
1627         mod->symtab = (void *)sechdrs[symindex].sh_addr;
1628         mod->num_symtab = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1629         mod->strtab = (void *)sechdrs[strindex].sh_addr;
1630
1631         /* Set types up while we still have access to sections. */
1632         for (i = 0; i < mod->num_symtab; i++)
1633                 mod->symtab[i].st_info
1634                         = elf_type(&mod->symtab[i], sechdrs, secstrings, mod);
1635 }
1636 #else
1637 static inline void add_kallsyms(struct module *mod,
1638                                 Elf_Shdr *sechdrs,
1639                                 unsigned int symindex,
1640                                 unsigned int strindex,
1641                                 const char *secstrings)
1642 {
1643 }
1644 #endif /* CONFIG_KALLSYMS */
1645
1646 /* Allocate and load the module: note that size of section 0 is always
1647    zero, and we rely on this for optional sections. */
1648 static struct module *load_module(void __user *umod,
1649                                   unsigned long len,
1650                                   const char __user *uargs)
1651 {
1652         Elf_Ehdr *hdr;
1653         Elf_Shdr *sechdrs;
1654         char *secstrings, *args, *modmagic, *strtab = NULL;
1655         unsigned int i;
1656         unsigned int symindex = 0;
1657         unsigned int strindex = 0;
1658         unsigned int setupindex;
1659         unsigned int exindex;
1660         unsigned int exportindex;
1661         unsigned int modindex;
1662         unsigned int obsparmindex;
1663         unsigned int infoindex;
1664         unsigned int gplindex;
1665         unsigned int crcindex;
1666         unsigned int gplcrcindex;
1667         unsigned int versindex;
1668         unsigned int pcpuindex;
1669         unsigned int gplfutureindex;
1670         unsigned int gplfuturecrcindex;
1671         unsigned int unwindex = 0;
1672         unsigned int unusedindex;
1673         unsigned int unusedcrcindex;
1674         unsigned int unusedgplindex;
1675         unsigned int unusedgplcrcindex;
1676         struct module *mod;
1677         long err = 0;
1678         void *percpu = NULL, *ptr = NULL; /* Stops spurious gcc warning */
1679         struct exception_table_entry *extable;
1680         mm_segment_t old_fs;
1681
1682         DEBUGP("load_module: umod=%p, len=%lu, uargs=%p\n",
1683                umod, len, uargs);
1684         if (len < sizeof(*hdr))
1685                 return ERR_PTR(-ENOEXEC);
1686
1687         /* Suck in entire file: we'll want most of it. */
1688         /* vmalloc barfs on "unusual" numbers.  Check here */
1689         if (len > 64 * 1024 * 1024 || (hdr = vmalloc(len)) == NULL)
1690                 return ERR_PTR(-ENOMEM);
1691         if (copy_from_user(hdr, umod, len) != 0) {
1692                 err = -EFAULT;
1693                 goto free_hdr;
1694         }
1695
1696         /* Sanity checks against insmoding binaries or wrong arch,
1697            weird elf version */
1698         if (memcmp(hdr->e_ident, ELFMAG, 4) != 0
1699             || hdr->e_type != ET_REL
1700             || !elf_check_arch(hdr)
1701             || hdr->e_shentsize != sizeof(*sechdrs)) {
1702                 err = -ENOEXEC;
1703                 goto free_hdr;
1704         }
1705
1706         if (len < hdr->e_shoff + hdr->e_shnum * sizeof(Elf_Shdr))
1707                 goto truncated;
1708
1709         /* Convenience variables */
1710         sechdrs = (void *)hdr + hdr->e_shoff;
1711         secstrings = (void *)hdr + sechdrs[hdr->e_shstrndx].sh_offset;
1712         sechdrs[0].sh_addr = 0;
1713
1714         for (i = 1; i < hdr->e_shnum; i++) {
1715                 if (sechdrs[i].sh_type != SHT_NOBITS
1716                     && len < sechdrs[i].sh_offset + sechdrs[i].sh_size)
1717                         goto truncated;
1718
1719                 /* Mark all sections sh_addr with their address in the
1720                    temporary image. */
1721                 sechdrs[i].sh_addr = (size_t)hdr + sechdrs[i].sh_offset;
1722
1723                 /* Internal symbols and strings. */
1724                 if (sechdrs[i].sh_type == SHT_SYMTAB) {
1725                         symindex = i;
1726                         strindex = sechdrs[i].sh_link;
1727                         strtab = (char *)hdr + sechdrs[strindex].sh_offset;
1728                 }
1729 #ifndef CONFIG_MODULE_UNLOAD
1730                 /* Don't load .exit sections */
1731                 if (strncmp(secstrings+sechdrs[i].sh_name, ".exit", 5) == 0)
1732                         sechdrs[i].sh_flags &= ~(unsigned long)SHF_ALLOC;
1733 #endif
1734         }
1735
1736         modindex = find_sec(hdr, sechdrs, secstrings,
1737                             ".gnu.linkonce.this_module");
1738         if (!modindex) {
1739                 printk(KERN_WARNING "No module found in object\n");
1740                 err = -ENOEXEC;
1741                 goto free_hdr;
1742         }
1743         mod = (void *)sechdrs[modindex].sh_addr;
1744
1745         if (symindex == 0) {
1746                 printk(KERN_WARNING "%s: module has no symbols (stripped?)\n",
1747                        mod->name);
1748                 err = -ENOEXEC;
1749                 goto free_hdr;
1750         }
1751
1752         /* Optional sections */
1753         exportindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab");
1754         gplindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_gpl");
1755         gplfutureindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_gpl_future");
1756         unusedindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_unused");
1757         unusedgplindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_unused_gpl");
1758         crcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab");
1759         gplcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_gpl");
1760         gplfuturecrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_gpl_future");
1761         unusedcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_unused");
1762         unusedgplcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_unused_gpl");
1763         setupindex = find_sec(hdr, sechdrs, secstrings, "__param");
1764         exindex = find_sec(hdr, sechdrs, secstrings, "__ex_table");
1765         obsparmindex = find_sec(hdr, sechdrs, secstrings, "__obsparm");
1766         versindex = find_sec(hdr, sechdrs, secstrings, "__versions");
1767         infoindex = find_sec(hdr, sechdrs, secstrings, ".modinfo");
1768         pcpuindex = find_pcpusec(hdr, sechdrs, secstrings);
1769 #ifdef ARCH_UNWIND_SECTION_NAME
1770         unwindex = find_sec(hdr, sechdrs, secstrings, ARCH_UNWIND_SECTION_NAME);
1771 #endif
1772
1773         /* Don't keep modinfo section */
1774         sechdrs[infoindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1775 #ifdef CONFIG_KALLSYMS
1776         /* Keep symbol and string tables for decoding later. */
1777         sechdrs[symindex].sh_flags |= SHF_ALLOC;
1778         sechdrs[strindex].sh_flags |= SHF_ALLOC;
1779 #endif
1780         if (unwindex)
1781                 sechdrs[unwindex].sh_flags |= SHF_ALLOC;
1782
1783         /* Check module struct version now, before we try to use module. */
1784         if (!check_modstruct_version(sechdrs, versindex, mod)) {
1785                 err = -ENOEXEC;
1786                 goto free_hdr;
1787         }
1788
1789         modmagic = get_modinfo(sechdrs, infoindex, "vermagic");
1790         /* This is allowed: modprobe --force will invalidate it. */
1791         if (!modmagic) {
1792                 add_taint_module(mod, TAINT_FORCED_MODULE);
1793                 printk(KERN_WARNING "%s: no version magic, tainting kernel.\n",
1794                        mod->name);
1795         } else if (!same_magic(modmagic, vermagic)) {
1796                 printk(KERN_ERR "%s: version magic '%s' should be '%s'\n",
1797                        mod->name, modmagic, vermagic);
1798                 err = -ENOEXEC;
1799                 goto free_hdr;
1800         }
1801
1802         /* Now copy in args */
1803         args = strndup_user(uargs, ~0UL >> 1);
1804         if (IS_ERR(args)) {
1805                 err = PTR_ERR(args);
1806                 goto free_hdr;
1807         }
1808
1809         if (find_module(mod->name)) {
1810                 err = -EEXIST;
1811                 goto free_mod;
1812         }
1813
1814         mod->state = MODULE_STATE_COMING;
1815
1816         /* Allow arches to frob section contents and sizes.  */
1817         err = module_frob_arch_sections(hdr, sechdrs, secstrings, mod);
1818         if (err < 0)
1819                 goto free_mod;
1820
1821         if (pcpuindex) {
1822                 /* We have a special allocation for this section. */
1823                 percpu = percpu_modalloc(sechdrs[pcpuindex].sh_size,
1824                                          sechdrs[pcpuindex].sh_addralign,
1825                                          mod->name);
1826                 if (!percpu) {
1827                         err = -ENOMEM;
1828                         goto free_mod;
1829                 }
1830                 sechdrs[pcpuindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1831                 mod->percpu = percpu;
1832         }
1833
1834         /* Determine total sizes, and put offsets in sh_entsize.  For now
1835            this is done generically; there doesn't appear to be any
1836            special cases for the architectures. */
1837         layout_sections(mod, hdr, sechdrs, secstrings);
1838
1839         /* Do the allocs. */
1840         ptr = module_alloc(mod->core_size);
1841         if (!ptr) {
1842                 err = -ENOMEM;
1843                 goto free_percpu;
1844         }
1845         memset(ptr, 0, mod->core_size);
1846         mod->module_core = ptr;
1847
1848         ptr = module_alloc(mod->init_size);
1849         if (!ptr && mod->init_size) {
1850                 err = -ENOMEM;
1851                 goto free_core;
1852         }
1853         memset(ptr, 0, mod->init_size);
1854         mod->module_init = ptr;
1855
1856         /* Transfer each section which specifies SHF_ALLOC */
1857         DEBUGP("final section addresses:\n");
1858         for (i = 0; i < hdr->e_shnum; i++) {
1859                 void *dest;
1860
1861                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
1862                         continue;
1863
1864                 if (sechdrs[i].sh_entsize & INIT_OFFSET_MASK)
1865                         dest = mod->module_init
1866                                 + (sechdrs[i].sh_entsize & ~INIT_OFFSET_MASK);
1867                 else
1868                         dest = mod->module_core + sechdrs[i].sh_entsize;
1869
1870                 if (sechdrs[i].sh_type != SHT_NOBITS)
1871                         memcpy(dest, (void *)sechdrs[i].sh_addr,
1872                                sechdrs[i].sh_size);
1873                 /* Update sh_addr to point to copy in image. */
1874                 sechdrs[i].sh_addr = (unsigned long)dest;
1875                 DEBUGP("\t0x%lx %s\n", sechdrs[i].sh_addr, secstrings + sechdrs[i].sh_name);
1876         }
1877         /* Module has been moved. */
1878         mod = (void *)sechdrs[modindex].sh_addr;
1879
1880         /* Now we've moved module, initialize linked lists, etc. */
1881         module_unload_init(mod);
1882
1883         /* Initialize kobject, so we can reference it. */
1884         err = mod_sysfs_init(mod);
1885         if (err)
1886                 goto cleanup;
1887
1888         /* Set up license info based on the info section */
1889         set_license(mod, get_modinfo(sechdrs, infoindex, "license"));
1890
1891         if (strcmp(mod->name, "ndiswrapper") == 0)
1892                 add_taint(TAINT_PROPRIETARY_MODULE);
1893         if (strcmp(mod->name, "driverloader") == 0)
1894                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1895
1896         /* Set up MODINFO_ATTR fields */
1897         setup_modinfo(mod, sechdrs, infoindex);
1898
1899         /* Fix up syms, so that st_value is a pointer to location. */
1900         err = simplify_symbols(sechdrs, symindex, strtab, versindex, pcpuindex,
1901                                mod);
1902         if (err < 0)
1903                 goto cleanup;
1904
1905         /* Set up EXPORTed & EXPORT_GPLed symbols (section 0 is 0 length) */
1906         mod->num_syms = sechdrs[exportindex].sh_size / sizeof(*mod->syms);
1907         mod->syms = (void *)sechdrs[exportindex].sh_addr;
1908         if (crcindex)
1909                 mod->crcs = (void *)sechdrs[crcindex].sh_addr;
1910         mod->num_gpl_syms = sechdrs[gplindex].sh_size / sizeof(*mod->gpl_syms);
1911         mod->gpl_syms = (void *)sechdrs[gplindex].sh_addr;
1912         if (gplcrcindex)
1913                 mod->gpl_crcs = (void *)sechdrs[gplcrcindex].sh_addr;
1914         mod->num_gpl_future_syms = sechdrs[gplfutureindex].sh_size /
1915                                         sizeof(*mod->gpl_future_syms);
1916         mod->num_unused_syms = sechdrs[unusedindex].sh_size /
1917                                         sizeof(*mod->unused_syms);
1918         mod->num_unused_gpl_syms = sechdrs[unusedgplindex].sh_size /
1919                                         sizeof(*mod->unused_gpl_syms);
1920         mod->gpl_future_syms = (void *)sechdrs[gplfutureindex].sh_addr;
1921         if (gplfuturecrcindex)
1922                 mod->gpl_future_crcs = (void *)sechdrs[gplfuturecrcindex].sh_addr;
1923
1924         mod->unused_syms = (void *)sechdrs[unusedindex].sh_addr;
1925         if (unusedcrcindex)
1926                 mod->unused_crcs = (void *)sechdrs[unusedcrcindex].sh_addr;
1927         mod->unused_gpl_syms = (void *)sechdrs[unusedgplindex].sh_addr;
1928         if (unusedgplcrcindex)
1929                 mod->unused_crcs = (void *)sechdrs[unusedgplcrcindex].sh_addr;
1930
1931 #ifdef CONFIG_MODVERSIONS
1932         if ((mod->num_syms && !crcindex) ||
1933             (mod->num_gpl_syms && !gplcrcindex) ||
1934             (mod->num_gpl_future_syms && !gplfuturecrcindex) ||
1935             (mod->num_unused_syms && !unusedcrcindex) ||
1936             (mod->num_unused_gpl_syms && !unusedgplcrcindex)) {
1937                 printk(KERN_WARNING "%s: No versions for exported symbols."
1938                        " Tainting kernel.\n", mod->name);
1939                 add_taint_module(mod, TAINT_FORCED_MODULE);
1940         }
1941 #endif
1942
1943         /* Now do relocations. */
1944         for (i = 1; i < hdr->e_shnum; i++) {
1945                 const char *strtab = (char *)sechdrs[strindex].sh_addr;
1946                 unsigned int info = sechdrs[i].sh_info;
1947
1948                 /* Not a valid relocation section? */
1949                 if (info >= hdr->e_shnum)
1950                         continue;
1951
1952                 /* Don't bother with non-allocated sections */
1953                 if (!(sechdrs[info].sh_flags & SHF_ALLOC))
1954                         continue;
1955
1956                 if (sechdrs[i].sh_type == SHT_REL)
1957                         err = apply_relocate(sechdrs, strtab, symindex, i,mod);
1958                 else if (sechdrs[i].sh_type == SHT_RELA)
1959                         err = apply_relocate_add(sechdrs, strtab, symindex, i,
1960                                                  mod);
1961                 if (err < 0)
1962                         goto cleanup;
1963         }
1964
1965         /* Find duplicate symbols */
1966         err = verify_export_symbols(mod);
1967
1968         if (err < 0)
1969                 goto cleanup;
1970
1971         /* Set up and sort exception table */
1972         mod->num_exentries = sechdrs[exindex].sh_size / sizeof(*mod->extable);
1973         mod->extable = extable = (void *)sechdrs[exindex].sh_addr;
1974         sort_extable(extable, extable + mod->num_exentries);
1975
1976         /* Finally, copy percpu area over. */
1977         percpu_modcopy(mod->percpu, (void *)sechdrs[pcpuindex].sh_addr,
1978                        sechdrs[pcpuindex].sh_size);
1979
1980         add_kallsyms(mod, sechdrs, symindex, strindex, secstrings);
1981
1982         err = module_finalize(hdr, sechdrs, mod);
1983         if (err < 0)
1984                 goto cleanup;
1985
1986         /* flush the icache in correct context */
1987         old_fs = get_fs();
1988         set_fs(KERNEL_DS);
1989
1990         /*
1991          * Flush the instruction cache, since we've played with text.
1992          * Do it before processing of module parameters, so the module
1993          * can provide parameter accessor functions of its own.
1994          */
1995         if (mod->module_init)
1996                 flush_icache_range((unsigned long)mod->module_init,
1997                                    (unsigned long)mod->module_init
1998                                    + mod->init_size);
1999         flush_icache_range((unsigned long)mod->module_core,
2000                            (unsigned long)mod->module_core + mod->core_size);
2001
2002         set_fs(old_fs);
2003
2004         mod->args = args;
2005         if (obsparmindex)
2006                 printk(KERN_WARNING "%s: Ignoring obsolete parameters\n",
2007                        mod->name);
2008
2009         /* Size of section 0 is 0, so this works well if no params */
2010         err = parse_args(mod->name, mod->args,
2011                          (struct kernel_param *)
2012                          sechdrs[setupindex].sh_addr,
2013                          sechdrs[setupindex].sh_size
2014                          / sizeof(struct kernel_param),
2015                          NULL);
2016         if (err < 0)
2017                 goto arch_cleanup;
2018
2019         err = mod_sysfs_setup(mod,
2020                               (struct kernel_param *)
2021                               sechdrs[setupindex].sh_addr,
2022                               sechdrs[setupindex].sh_size
2023                               / sizeof(struct kernel_param));
2024         if (err < 0)
2025                 goto arch_cleanup;
2026         add_sect_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
2027         add_notes_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
2028
2029         /* Size of section 0 is 0, so this works well if no unwind info. */
2030         mod->unwind_info = unwind_add_table(mod,
2031                                             (void *)sechdrs[unwindex].sh_addr,
2032                                             sechdrs[unwindex].sh_size);
2033
2034         /* Get rid of temporary copy */
2035         vfree(hdr);
2036
2037         /* Done! */
2038         return mod;
2039
2040  arch_cleanup:
2041         module_arch_cleanup(mod);
2042  cleanup:
2043         module_unload_free(mod);
2044         module_free(mod, mod->module_init);
2045  free_core:
2046         module_free(mod, mod->module_core);
2047  free_percpu:
2048         if (percpu)
2049                 percpu_modfree(percpu);
2050  free_mod:
2051         kfree(args);
2052  free_hdr:
2053         vfree(hdr);
2054         return ERR_PTR(err);
2055
2056  truncated:
2057         printk(KERN_ERR "Module len %lu truncated\n", len);
2058         err = -ENOEXEC;
2059         goto free_hdr;
2060 }
2061
2062 /*
2063  * link the module with the whole machine is stopped with interrupts off
2064  * - this defends against kallsyms not taking locks
2065  */
2066 static int __link_module(void *_mod)
2067 {
2068         struct module *mod = _mod;
2069         list_add(&mod->list, &modules);
2070         return 0;
2071 }
2072
2073 /* This is where the real work happens */
2074 asmlinkage long
2075 sys_init_module(void __user *umod,
2076                 unsigned long len,
2077                 const char __user *uargs)
2078 {
2079         struct module *mod;
2080         int ret = 0;
2081
2082         /* Must have permission */
2083         if (!capable(CAP_SYS_MODULE))
2084                 return -EPERM;
2085
2086         /* Only one module load at a time, please */
2087         if (mutex_lock_interruptible(&module_mutex) != 0)
2088                 return -EINTR;
2089
2090         /* Do all the hard work */
2091         mod = load_module(umod, len, uargs);
2092         if (IS_ERR(mod)) {
2093                 mutex_unlock(&module_mutex);
2094                 return PTR_ERR(mod);
2095         }
2096
2097         /* Now sew it into the lists.  They won't access us, since
2098            strong_try_module_get() will fail. */
2099         stop_machine_run(__link_module, mod, NR_CPUS);
2100
2101         /* Drop lock so they can recurse */
2102         mutex_unlock(&module_mutex);
2103
2104         blocking_notifier_call_chain(&module_notify_list,
2105                         MODULE_STATE_COMING, mod);
2106
2107         /* Start the module */
2108         if (mod->init != NULL)
2109                 ret = mod->init();
2110         if (ret < 0) {
2111                 /* Init routine failed: abort.  Try to protect us from
2112                    buggy refcounters. */
2113                 mod->state = MODULE_STATE_GOING;
2114                 synchronize_sched();
2115                 module_put(mod);
2116                 mutex_lock(&module_mutex);
2117                 free_module(mod);
2118                 mutex_unlock(&module_mutex);
2119                 return ret;
2120         }
2121
2122         /* Now it's a first class citizen! */
2123         mutex_lock(&module_mutex);
2124         mod->state = MODULE_STATE_LIVE;
2125         /* Drop initial reference. */
2126         module_put(mod);
2127         unwind_remove_table(mod->unwind_info, 1);
2128         module_free(mod, mod->module_init);
2129         mod->module_init = NULL;
2130         mod->init_size = 0;
2131         mod->init_text_size = 0;
2132         mutex_unlock(&module_mutex);
2133
2134         return 0;
2135 }
2136
2137 static inline int within(unsigned long addr, void *start, unsigned long size)
2138 {
2139         return ((void *)addr >= start && (void *)addr < start + size);
2140 }
2141
2142 #ifdef CONFIG_KALLSYMS
2143 /*
2144  * This ignores the intensely annoying "mapping symbols" found
2145  * in ARM ELF files: $a, $t and $d.
2146  */
2147 static inline int is_arm_mapping_symbol(const char *str)
2148 {
2149         return str[0] == '$' && strchr("atd", str[1])
2150                && (str[2] == '\0' || str[2] == '.');
2151 }
2152
2153 static const char *get_ksymbol(struct module *mod,
2154                                unsigned long addr,
2155                                unsigned long *size,
2156                                unsigned long *offset)
2157 {
2158         unsigned int i, best = 0;
2159         unsigned long nextval;
2160
2161         /* At worse, next value is at end of module */
2162         if (within(addr, mod->module_init, mod->init_size))
2163                 nextval = (unsigned long)mod->module_init+mod->init_text_size;
2164         else
2165                 nextval = (unsigned long)mod->module_core+mod->core_text_size;
2166
2167         /* Scan for closest preceeding symbol, and next symbol. (ELF
2168            starts real symbols at 1). */
2169         for (i = 1; i < mod->num_symtab; i++) {
2170                 if (mod->symtab[i].st_shndx == SHN_UNDEF)
2171                         continue;
2172
2173                 /* We ignore unnamed symbols: they're uninformative
2174                  * and inserted at a whim. */
2175                 if (mod->symtab[i].st_value <= addr
2176                     && mod->symtab[i].st_value > mod->symtab[best].st_value
2177                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2178                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2179                         best = i;
2180                 if (mod->symtab[i].st_value > addr
2181                     && mod->symtab[i].st_value < nextval
2182                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2183                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2184                         nextval = mod->symtab[i].st_value;
2185         }
2186
2187         if (!best)
2188                 return NULL;
2189
2190         if (size)
2191                 *size = nextval - mod->symtab[best].st_value;
2192         if (offset)
2193                 *offset = addr - mod->symtab[best].st_value;
2194         return mod->strtab + mod->symtab[best].st_name;
2195 }
2196
2197 /* For kallsyms to ask for address resolution.  NULL means not found.
2198    We don't lock, as this is used for oops resolution and races are a
2199    lesser concern. */
2200 const char *module_address_lookup(unsigned long addr,
2201                                   unsigned long *size,
2202                                   unsigned long *offset,
2203                                   char **modname)
2204 {
2205         struct module *mod;
2206
2207         list_for_each_entry(mod, &modules, list) {
2208                 if (within(addr, mod->module_init, mod->init_size)
2209                     || within(addr, mod->module_core, mod->core_size)) {
2210                         if (modname)
2211                                 *modname = mod->name;
2212                         return get_ksymbol(mod, addr, size, offset);
2213                 }
2214         }
2215         return NULL;
2216 }
2217
2218 int lookup_module_symbol_name(unsigned long addr, char *symname)
2219 {
2220         struct module *mod;
2221
2222         mutex_lock(&module_mutex);
2223         list_for_each_entry(mod, &modules, list) {
2224                 if (within(addr, mod->module_init, mod->init_size) ||
2225                     within(addr, mod->module_core, mod->core_size)) {
2226                         const char *sym;
2227
2228                         sym = get_ksymbol(mod, addr, NULL, NULL);
2229                         if (!sym)
2230                                 goto out;
2231                         strlcpy(symname, sym, KSYM_NAME_LEN);
2232                         mutex_unlock(&module_mutex);
2233                         return 0;
2234                 }
2235         }
2236 out:
2237         mutex_unlock(&module_mutex);
2238         return -ERANGE;
2239 }
2240
2241 int lookup_module_symbol_attrs(unsigned long addr, unsigned long *size,
2242                         unsigned long *offset, char *modname, char *name)
2243 {
2244         struct module *mod;
2245
2246         mutex_lock(&module_mutex);
2247         list_for_each_entry(mod, &modules, list) {
2248                 if (within(addr, mod->module_init, mod->init_size) ||
2249                     within(addr, mod->module_core, mod->core_size)) {
2250                         const char *sym;
2251
2252                         sym = get_ksymbol(mod, addr, size, offset);
2253                         if (!sym)
2254                                 goto out;
2255                         if (modname)
2256                                 strlcpy(modname, mod->name, MODULE_NAME_LEN);
2257                         if (name)
2258                                 strlcpy(name, sym, KSYM_NAME_LEN);
2259                         mutex_unlock(&module_mutex);
2260                         return 0;
2261                 }
2262         }
2263 out:
2264         mutex_unlock(&module_mutex);
2265         return -ERANGE;
2266 }
2267
2268 int module_get_kallsym(unsigned int symnum, unsigned long *value, char *type,
2269                         char *name, char *module_name, int *exported)
2270 {
2271         struct module *mod;
2272
2273         mutex_lock(&module_mutex);
2274         list_for_each_entry(mod, &modules, list) {
2275                 if (symnum < mod->num_symtab) {
2276                         *value = mod->symtab[symnum].st_value;
2277                         *type = mod->symtab[symnum].st_info;
2278                         strlcpy(name, mod->strtab + mod->symtab[symnum].st_name,
2279                                 KSYM_NAME_LEN);
2280                         strlcpy(module_name, mod->name, MODULE_NAME_LEN);
2281                         *exported = is_exported(name, mod);
2282                         mutex_unlock(&module_mutex);
2283                         return 0;
2284                 }
2285                 symnum -= mod->num_symtab;
2286         }
2287         mutex_unlock(&module_mutex);
2288         return -ERANGE;
2289 }
2290
2291 static unsigned long mod_find_symname(struct module *mod, const char *name)
2292 {
2293         unsigned int i;
2294
2295         for (i = 0; i < mod->num_symtab; i++)
2296                 if (strcmp(name, mod->strtab+mod->symtab[i].st_name) == 0 &&
2297                     mod->symtab[i].st_info != 'U')
2298                         return mod->symtab[i].st_value;
2299         return 0;
2300 }
2301
2302 /* Look for this name: can be of form module:name. */
2303 unsigned long module_kallsyms_lookup_name(const char *name)
2304 {
2305         struct module *mod;
2306         char *colon;
2307         unsigned long ret = 0;
2308
2309         /* Don't lock: we're in enough trouble already. */
2310         if ((colon = strchr(name, ':')) != NULL) {
2311                 *colon = '\0';
2312                 if ((mod = find_module(name)) != NULL)
2313                         ret = mod_find_symname(mod, colon+1);
2314                 *colon = ':';
2315         } else {
2316                 list_for_each_entry(mod, &modules, list)
2317                         if ((ret = mod_find_symname(mod, name)) != 0)
2318                                 break;
2319         }
2320         return ret;
2321 }
2322 #endif /* CONFIG_KALLSYMS */
2323
2324 /* Called by the /proc file system to return a list of modules. */
2325 static void *m_start(struct seq_file *m, loff_t *pos)
2326 {
2327         mutex_lock(&module_mutex);
2328         return seq_list_start(&modules, *pos);
2329 }
2330
2331 static void *m_next(struct seq_file *m, void *p, loff_t *pos)
2332 {
2333         return seq_list_next(p, &modules, pos);
2334 }
2335
2336 static void m_stop(struct seq_file *m, void *p)
2337 {
2338         mutex_unlock(&module_mutex);
2339 }
2340
2341 static char *taint_flags(unsigned int taints, char *buf)
2342 {
2343         int bx = 0;
2344
2345         if (taints) {
2346                 buf[bx++] = '(';
2347                 if (taints & TAINT_PROPRIETARY_MODULE)
2348                         buf[bx++] = 'P';
2349                 if (taints & TAINT_FORCED_MODULE)
2350                         buf[bx++] = 'F';
2351                 /*
2352                  * TAINT_FORCED_RMMOD: could be added.
2353                  * TAINT_UNSAFE_SMP, TAINT_MACHINE_CHECK, TAINT_BAD_PAGE don't
2354                  * apply to modules.
2355                  */
2356                 buf[bx++] = ')';
2357         }
2358         buf[bx] = '\0';
2359
2360         return buf;
2361 }
2362
2363 static int m_show(struct seq_file *m, void *p)
2364 {
2365         struct module *mod = list_entry(p, struct module, list);
2366         char buf[8];
2367
2368         seq_printf(m, "%s %lu",
2369                    mod->name, mod->init_size + mod->core_size);
2370         print_unload_info(m, mod);
2371
2372         /* Informative for users. */
2373         seq_printf(m, " %s",
2374                    mod->state == MODULE_STATE_GOING ? "Unloading":
2375                    mod->state == MODULE_STATE_COMING ? "Loading":
2376                    "Live");
2377         /* Used by oprofile and other similar tools. */
2378         seq_printf(m, " 0x%p", mod->module_core);
2379
2380         /* Taints info */
2381         if (mod->taints)
2382                 seq_printf(m, " %s", taint_flags(mod->taints, buf));
2383
2384         seq_printf(m, "\n");
2385         return 0;
2386 }
2387
2388 /* Format: modulename size refcount deps address
2389
2390    Where refcount is a number or -, and deps is a comma-separated list
2391    of depends or -.
2392 */
2393 const struct seq_operations modules_op = {
2394         .start  = m_start,
2395         .next   = m_next,
2396         .stop   = m_stop,
2397         .show   = m_show
2398 };
2399
2400 /* Given an address, look for it in the module exception tables. */
2401 const struct exception_table_entry *search_module_extables(unsigned long addr)
2402 {
2403         const struct exception_table_entry *e = NULL;
2404         struct module *mod;
2405
2406         preempt_disable();
2407         list_for_each_entry(mod, &modules, list) {
2408                 if (mod->num_exentries == 0)
2409                         continue;
2410
2411                 e = search_extable(mod->extable,
2412                                    mod->extable + mod->num_exentries - 1,
2413                                    addr);
2414                 if (e)
2415                         break;
2416         }
2417         preempt_enable();
2418
2419         /* Now, if we found one, we are running inside it now, hence
2420            we cannot unload the module, hence no refcnt needed. */
2421         return e;
2422 }
2423
2424 /*
2425  * Is this a valid module address?
2426  */
2427 int is_module_address(unsigned long addr)
2428 {
2429         struct module *mod;
2430
2431         preempt_disable();
2432
2433         list_for_each_entry(mod, &modules, list) {
2434                 if (within(addr, mod->module_core, mod->core_size)) {
2435                         preempt_enable();
2436                         return 1;
2437                 }
2438         }
2439
2440         preempt_enable();
2441
2442         return 0;
2443 }
2444
2445
2446 /* Is this a valid kernel address? */
2447 struct module *__module_text_address(unsigned long addr)
2448 {
2449         struct module *mod;
2450
2451         list_for_each_entry(mod, &modules, list)
2452                 if (within(addr, mod->module_init, mod->init_text_size)
2453                     || within(addr, mod->module_core, mod->core_text_size))
2454                         return mod;
2455         return NULL;
2456 }
2457
2458 struct module *module_text_address(unsigned long addr)
2459 {
2460         struct module *mod;
2461
2462         preempt_disable();
2463         mod = __module_text_address(addr);
2464         preempt_enable();
2465
2466         return mod;
2467 }
2468
2469 /* Don't grab lock, we're oopsing. */
2470 void print_modules(void)
2471 {
2472         struct module *mod;
2473         char buf[8];
2474
2475         printk("Modules linked in:");
2476         list_for_each_entry(mod, &modules, list)
2477                 printk(" %s%s", mod->name, taint_flags(mod->taints, buf));
2478         printk("\n");
2479 }
2480
2481 #ifdef CONFIG_SYSFS
2482 static char *make_driver_name(struct device_driver *drv)
2483 {
2484         char *driver_name;
2485
2486         driver_name = kmalloc(strlen(drv->name) + strlen(drv->bus->name) + 2,
2487                               GFP_KERNEL);
2488         if (!driver_name)
2489                 return NULL;
2490
2491         sprintf(driver_name, "%s:%s", drv->bus->name, drv->name);
2492         return driver_name;
2493 }
2494
2495 static void module_create_drivers_dir(struct module_kobject *mk)
2496 {
2497         if (!mk || mk->drivers_dir)
2498                 return;
2499
2500         mk->drivers_dir = kobject_add_dir(&mk->kobj, "drivers");
2501 }
2502
2503 void module_add_driver(struct module *mod, struct device_driver *drv)
2504 {
2505         char *driver_name;
2506         int no_warn;
2507         struct module_kobject *mk = NULL;
2508
2509         if (!drv)
2510                 return;
2511
2512         if (mod)
2513                 mk = &mod->mkobj;
2514         else if (drv->mod_name) {
2515                 struct kobject *mkobj;
2516
2517                 /* Lookup built-in module entry in /sys/modules */
2518                 mkobj = kset_find_obj(&module_subsys, drv->mod_name);
2519                 if (mkobj) {
2520                         mk = container_of(mkobj, struct module_kobject, kobj);
2521                         /* remember our module structure */
2522                         drv->mkobj = mk;
2523                         /* kset_find_obj took a reference */
2524                         kobject_put(mkobj);
2525                 }
2526         }
2527
2528         if (!mk)
2529                 return;
2530
2531         /* Don't check return codes; these calls are idempotent */
2532         no_warn = sysfs_create_link(&drv->kobj, &mk->kobj, "module");
2533         driver_name = make_driver_name(drv);
2534         if (driver_name) {
2535                 module_create_drivers_dir(mk);
2536                 no_warn = sysfs_create_link(mk->drivers_dir, &drv->kobj,
2537                                             driver_name);
2538                 kfree(driver_name);
2539         }
2540 }
2541 EXPORT_SYMBOL(module_add_driver);
2542
2543 void module_remove_driver(struct device_driver *drv)
2544 {
2545         struct module_kobject *mk = NULL;
2546         char *driver_name;
2547
2548         if (!drv)
2549                 return;
2550
2551         sysfs_remove_link(&drv->kobj, "module");
2552
2553         if (drv->owner)
2554                 mk = &drv->owner->mkobj;
2555         else if (drv->mkobj)
2556                 mk = drv->mkobj;
2557         if (mk && mk->drivers_dir) {
2558                 driver_name = make_driver_name(drv);
2559                 if (driver_name) {
2560                         sysfs_remove_link(mk->drivers_dir, driver_name);
2561                         kfree(driver_name);
2562                 }
2563         }
2564 }
2565 EXPORT_SYMBOL(module_remove_driver);
2566 #endif
2567
2568 #ifdef CONFIG_MODVERSIONS
2569 /* Generate the signature for struct module here, too, for modversions. */
2570 void struct_module(struct module *mod) { return; }
2571 EXPORT_SYMBOL(struct_module);
2572 #endif