x25_asy: Fix ref count rule violation
[linux-2.6] / kernel / module.c
1 /*
2    Copyright (C) 2002 Richard Henderson
3    Copyright (C) 2001 Rusty Russell, 2002 Rusty Russell IBM.
4
5     This program is free software; you can redistribute it and/or modify
6     it under the terms of the GNU General Public License as published by
7     the Free Software Foundation; either version 2 of the License, or
8     (at your option) any later version.
9
10     This program is distributed in the hope that it will be useful,
11     but WITHOUT ANY WARRANTY; without even the implied warranty of
12     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13     GNU General Public License for more details.
14
15     You should have received a copy of the GNU General Public License
16     along with this program; if not, write to the Free Software
17     Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18 */
19 #include <linux/module.h>
20 #include <linux/moduleloader.h>
21 #include <linux/init.h>
22 #include <linux/kallsyms.h>
23 #include <linux/sysfs.h>
24 #include <linux/kernel.h>
25 #include <linux/slab.h>
26 #include <linux/vmalloc.h>
27 #include <linux/elf.h>
28 #include <linux/seq_file.h>
29 #include <linux/syscalls.h>
30 #include <linux/fcntl.h>
31 #include <linux/rcupdate.h>
32 #include <linux/capability.h>
33 #include <linux/cpu.h>
34 #include <linux/moduleparam.h>
35 #include <linux/errno.h>
36 #include <linux/err.h>
37 #include <linux/vermagic.h>
38 #include <linux/notifier.h>
39 #include <linux/sched.h>
40 #include <linux/stop_machine.h>
41 #include <linux/device.h>
42 #include <linux/string.h>
43 #include <linux/mutex.h>
44 #include <linux/unwind.h>
45 #include <asm/uaccess.h>
46 #include <asm/semaphore.h>
47 #include <asm/cacheflush.h>
48 #include <linux/license.h>
49 #include <asm/sections.h>
50
51 #if 0
52 #define DEBUGP printk
53 #else
54 #define DEBUGP(fmt , a...)
55 #endif
56
57 #ifndef ARCH_SHF_SMALL
58 #define ARCH_SHF_SMALL 0
59 #endif
60
61 /* If this is set, the section belongs in the init part of the module */
62 #define INIT_OFFSET_MASK (1UL << (BITS_PER_LONG-1))
63
64 /* List of modules, protected by module_mutex or preempt_disable
65  * (add/delete uses stop_machine). */
66 static DEFINE_MUTEX(module_mutex);
67 static LIST_HEAD(modules);
68
69 /* Waiting for a module to finish initializing? */
70 static DECLARE_WAIT_QUEUE_HEAD(module_wq);
71
72 static BLOCKING_NOTIFIER_HEAD(module_notify_list);
73
74 int register_module_notifier(struct notifier_block * nb)
75 {
76         return blocking_notifier_chain_register(&module_notify_list, nb);
77 }
78 EXPORT_SYMBOL(register_module_notifier);
79
80 int unregister_module_notifier(struct notifier_block * nb)
81 {
82         return blocking_notifier_chain_unregister(&module_notify_list, nb);
83 }
84 EXPORT_SYMBOL(unregister_module_notifier);
85
86 /* We require a truly strong try_module_get(): 0 means failure due to
87    ongoing or failed initialization etc. */
88 static inline int strong_try_module_get(struct module *mod)
89 {
90         if (mod && mod->state == MODULE_STATE_COMING)
91                 return -EBUSY;
92         if (try_module_get(mod))
93                 return 0;
94         else
95                 return -ENOENT;
96 }
97
98 static inline void add_taint_module(struct module *mod, unsigned flag)
99 {
100         add_taint(flag);
101         mod->taints |= flag;
102 }
103
104 /*
105  * A thread that wants to hold a reference to a module only while it
106  * is running can call this to safely exit.  nfsd and lockd use this.
107  */
108 void __module_put_and_exit(struct module *mod, long code)
109 {
110         module_put(mod);
111         do_exit(code);
112 }
113 EXPORT_SYMBOL(__module_put_and_exit);
114
115 /* Find a module section: 0 means not found. */
116 static unsigned int find_sec(Elf_Ehdr *hdr,
117                              Elf_Shdr *sechdrs,
118                              const char *secstrings,
119                              const char *name)
120 {
121         unsigned int i;
122
123         for (i = 1; i < hdr->e_shnum; i++)
124                 /* Alloc bit cleared means "ignore it." */
125                 if ((sechdrs[i].sh_flags & SHF_ALLOC)
126                     && strcmp(secstrings+sechdrs[i].sh_name, name) == 0)
127                         return i;
128         return 0;
129 }
130
131 /* Provided by the linker */
132 extern const struct kernel_symbol __start___ksymtab[];
133 extern const struct kernel_symbol __stop___ksymtab[];
134 extern const struct kernel_symbol __start___ksymtab_gpl[];
135 extern const struct kernel_symbol __stop___ksymtab_gpl[];
136 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
137 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
138 extern const struct kernel_symbol __start___ksymtab_unused[];
139 extern const struct kernel_symbol __stop___ksymtab_unused[];
140 extern const struct kernel_symbol __start___ksymtab_unused_gpl[];
141 extern const struct kernel_symbol __stop___ksymtab_unused_gpl[];
142 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
143 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
144 extern const unsigned long __start___kcrctab[];
145 extern const unsigned long __start___kcrctab_gpl[];
146 extern const unsigned long __start___kcrctab_gpl_future[];
147 extern const unsigned long __start___kcrctab_unused[];
148 extern const unsigned long __start___kcrctab_unused_gpl[];
149
150 #ifndef CONFIG_MODVERSIONS
151 #define symversion(base, idx) NULL
152 #else
153 #define symversion(base, idx) ((base != NULL) ? ((base) + (idx)) : NULL)
154 #endif
155
156 /* lookup symbol in given range of kernel_symbols */
157 static const struct kernel_symbol *lookup_symbol(const char *name,
158         const struct kernel_symbol *start,
159         const struct kernel_symbol *stop)
160 {
161         const struct kernel_symbol *ks = start;
162         for (; ks < stop; ks++)
163                 if (strcmp(ks->name, name) == 0)
164                         return ks;
165         return NULL;
166 }
167
168 static void printk_unused_warning(const char *name)
169 {
170         printk(KERN_WARNING "Symbol %s is marked as UNUSED, "
171                 "however this module is using it.\n", name);
172         printk(KERN_WARNING "This symbol will go away in the future.\n");
173         printk(KERN_WARNING "Please evalute if this is the right api to use, "
174                 "and if it really is, submit a report the linux kernel "
175                 "mailinglist together with submitting your code for "
176                 "inclusion.\n");
177 }
178
179 /* Find a symbol, return value, crc and module which owns it */
180 static unsigned long __find_symbol(const char *name,
181                                    struct module **owner,
182                                    const unsigned long **crc,
183                                    int gplok)
184 {
185         struct module *mod;
186         const struct kernel_symbol *ks;
187
188         /* Core kernel first. */
189         *owner = NULL;
190         ks = lookup_symbol(name, __start___ksymtab, __stop___ksymtab);
191         if (ks) {
192                 *crc = symversion(__start___kcrctab, (ks - __start___ksymtab));
193                 return ks->value;
194         }
195         if (gplok) {
196                 ks = lookup_symbol(name, __start___ksymtab_gpl,
197                                          __stop___ksymtab_gpl);
198                 if (ks) {
199                         *crc = symversion(__start___kcrctab_gpl,
200                                           (ks - __start___ksymtab_gpl));
201                         return ks->value;
202                 }
203         }
204         ks = lookup_symbol(name, __start___ksymtab_gpl_future,
205                                  __stop___ksymtab_gpl_future);
206         if (ks) {
207                 if (!gplok) {
208                         printk(KERN_WARNING "Symbol %s is being used "
209                                "by a non-GPL module, which will not "
210                                "be allowed in the future\n", name);
211                         printk(KERN_WARNING "Please see the file "
212                                "Documentation/feature-removal-schedule.txt "
213                                "in the kernel source tree for more "
214                                "details.\n");
215                 }
216                 *crc = symversion(__start___kcrctab_gpl_future,
217                                   (ks - __start___ksymtab_gpl_future));
218                 return ks->value;
219         }
220
221         ks = lookup_symbol(name, __start___ksymtab_unused,
222                                  __stop___ksymtab_unused);
223         if (ks) {
224                 printk_unused_warning(name);
225                 *crc = symversion(__start___kcrctab_unused,
226                                   (ks - __start___ksymtab_unused));
227                 return ks->value;
228         }
229
230         if (gplok)
231                 ks = lookup_symbol(name, __start___ksymtab_unused_gpl,
232                                  __stop___ksymtab_unused_gpl);
233         if (ks) {
234                 printk_unused_warning(name);
235                 *crc = symversion(__start___kcrctab_unused_gpl,
236                                   (ks - __start___ksymtab_unused_gpl));
237                 return ks->value;
238         }
239
240         /* Now try modules. */
241         list_for_each_entry(mod, &modules, list) {
242                 *owner = mod;
243                 ks = lookup_symbol(name, mod->syms, mod->syms + mod->num_syms);
244                 if (ks) {
245                         *crc = symversion(mod->crcs, (ks - mod->syms));
246                         return ks->value;
247                 }
248
249                 if (gplok) {
250                         ks = lookup_symbol(name, mod->gpl_syms,
251                                            mod->gpl_syms + mod->num_gpl_syms);
252                         if (ks) {
253                                 *crc = symversion(mod->gpl_crcs,
254                                                   (ks - mod->gpl_syms));
255                                 return ks->value;
256                         }
257                 }
258                 ks = lookup_symbol(name, mod->unused_syms, mod->unused_syms + mod->num_unused_syms);
259                 if (ks) {
260                         printk_unused_warning(name);
261                         *crc = symversion(mod->unused_crcs, (ks - mod->unused_syms));
262                         return ks->value;
263                 }
264
265                 if (gplok) {
266                         ks = lookup_symbol(name, mod->unused_gpl_syms,
267                                            mod->unused_gpl_syms + mod->num_unused_gpl_syms);
268                         if (ks) {
269                                 printk_unused_warning(name);
270                                 *crc = symversion(mod->unused_gpl_crcs,
271                                                   (ks - mod->unused_gpl_syms));
272                                 return ks->value;
273                         }
274                 }
275                 ks = lookup_symbol(name, mod->gpl_future_syms,
276                                    (mod->gpl_future_syms +
277                                     mod->num_gpl_future_syms));
278                 if (ks) {
279                         if (!gplok) {
280                                 printk(KERN_WARNING "Symbol %s is being used "
281                                        "by a non-GPL module, which will not "
282                                        "be allowed in the future\n", name);
283                                 printk(KERN_WARNING "Please see the file "
284                                        "Documentation/feature-removal-schedule.txt "
285                                        "in the kernel source tree for more "
286                                        "details.\n");
287                         }
288                         *crc = symversion(mod->gpl_future_crcs,
289                                           (ks - mod->gpl_future_syms));
290                         return ks->value;
291                 }
292         }
293         DEBUGP("Failed to find symbol %s\n", name);
294         return -ENOENT;
295 }
296
297 /* Search for module by name: must hold module_mutex. */
298 static struct module *find_module(const char *name)
299 {
300         struct module *mod;
301
302         list_for_each_entry(mod, &modules, list) {
303                 if (strcmp(mod->name, name) == 0)
304                         return mod;
305         }
306         return NULL;
307 }
308
309 #ifdef CONFIG_SMP
310 /* Number of blocks used and allocated. */
311 static unsigned int pcpu_num_used, pcpu_num_allocated;
312 /* Size of each block.  -ve means used. */
313 static int *pcpu_size;
314
315 static int split_block(unsigned int i, unsigned short size)
316 {
317         /* Reallocation required? */
318         if (pcpu_num_used + 1 > pcpu_num_allocated) {
319                 int *new;
320
321                 new = krealloc(pcpu_size, sizeof(new[0])*pcpu_num_allocated*2,
322                                GFP_KERNEL);
323                 if (!new)
324                         return 0;
325
326                 pcpu_num_allocated *= 2;
327                 pcpu_size = new;
328         }
329
330         /* Insert a new subblock */
331         memmove(&pcpu_size[i+1], &pcpu_size[i],
332                 sizeof(pcpu_size[0]) * (pcpu_num_used - i));
333         pcpu_num_used++;
334
335         pcpu_size[i+1] -= size;
336         pcpu_size[i] = size;
337         return 1;
338 }
339
340 static inline unsigned int block_size(int val)
341 {
342         if (val < 0)
343                 return -val;
344         return val;
345 }
346
347 static void *percpu_modalloc(unsigned long size, unsigned long align,
348                              const char *name)
349 {
350         unsigned long extra;
351         unsigned int i;
352         void *ptr;
353
354         if (align > PAGE_SIZE) {
355                 printk(KERN_WARNING "%s: per-cpu alignment %li > %li\n",
356                        name, align, PAGE_SIZE);
357                 align = PAGE_SIZE;
358         }
359
360         ptr = __per_cpu_start;
361         for (i = 0; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
362                 /* Extra for alignment requirement. */
363                 extra = ALIGN((unsigned long)ptr, align) - (unsigned long)ptr;
364                 BUG_ON(i == 0 && extra != 0);
365
366                 if (pcpu_size[i] < 0 || pcpu_size[i] < extra + size)
367                         continue;
368
369                 /* Transfer extra to previous block. */
370                 if (pcpu_size[i-1] < 0)
371                         pcpu_size[i-1] -= extra;
372                 else
373                         pcpu_size[i-1] += extra;
374                 pcpu_size[i] -= extra;
375                 ptr += extra;
376
377                 /* Split block if warranted */
378                 if (pcpu_size[i] - size > sizeof(unsigned long))
379                         if (!split_block(i, size))
380                                 return NULL;
381
382                 /* Mark allocated */
383                 pcpu_size[i] = -pcpu_size[i];
384                 return ptr;
385         }
386
387         printk(KERN_WARNING "Could not allocate %lu bytes percpu data\n",
388                size);
389         return NULL;
390 }
391
392 static void percpu_modfree(void *freeme)
393 {
394         unsigned int i;
395         void *ptr = __per_cpu_start + block_size(pcpu_size[0]);
396
397         /* First entry is core kernel percpu data. */
398         for (i = 1; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
399                 if (ptr == freeme) {
400                         pcpu_size[i] = -pcpu_size[i];
401                         goto free;
402                 }
403         }
404         BUG();
405
406  free:
407         /* Merge with previous? */
408         if (pcpu_size[i-1] >= 0) {
409                 pcpu_size[i-1] += pcpu_size[i];
410                 pcpu_num_used--;
411                 memmove(&pcpu_size[i], &pcpu_size[i+1],
412                         (pcpu_num_used - i) * sizeof(pcpu_size[0]));
413                 i--;
414         }
415         /* Merge with next? */
416         if (i+1 < pcpu_num_used && pcpu_size[i+1] >= 0) {
417                 pcpu_size[i] += pcpu_size[i+1];
418                 pcpu_num_used--;
419                 memmove(&pcpu_size[i+1], &pcpu_size[i+2],
420                         (pcpu_num_used - (i+1)) * sizeof(pcpu_size[0]));
421         }
422 }
423
424 static unsigned int find_pcpusec(Elf_Ehdr *hdr,
425                                  Elf_Shdr *sechdrs,
426                                  const char *secstrings)
427 {
428         return find_sec(hdr, sechdrs, secstrings, ".data.percpu");
429 }
430
431 static void percpu_modcopy(void *pcpudest, const void *from, unsigned long size)
432 {
433         int cpu;
434
435         for_each_possible_cpu(cpu)
436                 memcpy(pcpudest + per_cpu_offset(cpu), from, size);
437 }
438
439 static int percpu_modinit(void)
440 {
441         pcpu_num_used = 2;
442         pcpu_num_allocated = 2;
443         pcpu_size = kmalloc(sizeof(pcpu_size[0]) * pcpu_num_allocated,
444                             GFP_KERNEL);
445         /* Static in-kernel percpu data (used). */
446         pcpu_size[0] = -(__per_cpu_end-__per_cpu_start);
447         /* Free room. */
448         pcpu_size[1] = PERCPU_ENOUGH_ROOM + pcpu_size[0];
449         if (pcpu_size[1] < 0) {
450                 printk(KERN_ERR "No per-cpu room for modules.\n");
451                 pcpu_num_used = 1;
452         }
453
454         return 0;
455 }
456 __initcall(percpu_modinit);
457 #else /* ... !CONFIG_SMP */
458 static inline void *percpu_modalloc(unsigned long size, unsigned long align,
459                                     const char *name)
460 {
461         return NULL;
462 }
463 static inline void percpu_modfree(void *pcpuptr)
464 {
465         BUG();
466 }
467 static inline unsigned int find_pcpusec(Elf_Ehdr *hdr,
468                                         Elf_Shdr *sechdrs,
469                                         const char *secstrings)
470 {
471         return 0;
472 }
473 static inline void percpu_modcopy(void *pcpudst, const void *src,
474                                   unsigned long size)
475 {
476         /* pcpusec should be 0, and size of that section should be 0. */
477         BUG_ON(size != 0);
478 }
479 #endif /* CONFIG_SMP */
480
481 #define MODINFO_ATTR(field)     \
482 static void setup_modinfo_##field(struct module *mod, const char *s)  \
483 {                                                                     \
484         mod->field = kstrdup(s, GFP_KERNEL);                          \
485 }                                                                     \
486 static ssize_t show_modinfo_##field(struct module_attribute *mattr,   \
487                         struct module *mod, char *buffer)             \
488 {                                                                     \
489         return sprintf(buffer, "%s\n", mod->field);                   \
490 }                                                                     \
491 static int modinfo_##field##_exists(struct module *mod)               \
492 {                                                                     \
493         return mod->field != NULL;                                    \
494 }                                                                     \
495 static void free_modinfo_##field(struct module *mod)                  \
496 {                                                                     \
497         kfree(mod->field);                                            \
498         mod->field = NULL;                                            \
499 }                                                                     \
500 static struct module_attribute modinfo_##field = {                    \
501         .attr = { .name = __stringify(field), .mode = 0444 },         \
502         .show = show_modinfo_##field,                                 \
503         .setup = setup_modinfo_##field,                               \
504         .test = modinfo_##field##_exists,                             \
505         .free = free_modinfo_##field,                                 \
506 };
507
508 MODINFO_ATTR(version);
509 MODINFO_ATTR(srcversion);
510
511 static char last_unloaded_module[MODULE_NAME_LEN+1];
512
513 #ifdef CONFIG_MODULE_UNLOAD
514 /* Init the unload section of the module. */
515 static void module_unload_init(struct module *mod)
516 {
517         unsigned int i;
518
519         INIT_LIST_HEAD(&mod->modules_which_use_me);
520         for (i = 0; i < NR_CPUS; i++)
521                 local_set(&mod->ref[i].count, 0);
522         /* Hold reference count during initialization. */
523         local_set(&mod->ref[raw_smp_processor_id()].count, 1);
524         /* Backwards compatibility macros put refcount during init. */
525         mod->waiter = current;
526 }
527
528 /* modules using other modules */
529 struct module_use
530 {
531         struct list_head list;
532         struct module *module_which_uses;
533 };
534
535 /* Does a already use b? */
536 static int already_uses(struct module *a, struct module *b)
537 {
538         struct module_use *use;
539
540         list_for_each_entry(use, &b->modules_which_use_me, list) {
541                 if (use->module_which_uses == a) {
542                         DEBUGP("%s uses %s!\n", a->name, b->name);
543                         return 1;
544                 }
545         }
546         DEBUGP("%s does not use %s!\n", a->name, b->name);
547         return 0;
548 }
549
550 /* Module a uses b */
551 static int use_module(struct module *a, struct module *b)
552 {
553         struct module_use *use;
554         int no_warn, err;
555
556         if (b == NULL || already_uses(a, b)) return 1;
557
558         /* If we're interrupted or time out, we fail. */
559         if (wait_event_interruptible_timeout(
560                     module_wq, (err = strong_try_module_get(b)) != -EBUSY,
561                     30 * HZ) <= 0) {
562                 printk("%s: gave up waiting for init of module %s.\n",
563                        a->name, b->name);
564                 return 0;
565         }
566
567         /* If strong_try_module_get() returned a different error, we fail. */
568         if (err)
569                 return 0;
570
571         DEBUGP("Allocating new usage for %s.\n", a->name);
572         use = kmalloc(sizeof(*use), GFP_ATOMIC);
573         if (!use) {
574                 printk("%s: out of memory loading\n", a->name);
575                 module_put(b);
576                 return 0;
577         }
578
579         use->module_which_uses = a;
580         list_add(&use->list, &b->modules_which_use_me);
581         no_warn = sysfs_create_link(b->holders_dir, &a->mkobj.kobj, a->name);
582         return 1;
583 }
584
585 /* Clear the unload stuff of the module. */
586 static void module_unload_free(struct module *mod)
587 {
588         struct module *i;
589
590         list_for_each_entry(i, &modules, list) {
591                 struct module_use *use;
592
593                 list_for_each_entry(use, &i->modules_which_use_me, list) {
594                         if (use->module_which_uses == mod) {
595                                 DEBUGP("%s unusing %s\n", mod->name, i->name);
596                                 module_put(i);
597                                 list_del(&use->list);
598                                 kfree(use);
599                                 sysfs_remove_link(i->holders_dir, mod->name);
600                                 /* There can be at most one match. */
601                                 break;
602                         }
603                 }
604         }
605 }
606
607 #ifdef CONFIG_MODULE_FORCE_UNLOAD
608 static inline int try_force_unload(unsigned int flags)
609 {
610         int ret = (flags & O_TRUNC);
611         if (ret)
612                 add_taint(TAINT_FORCED_RMMOD);
613         return ret;
614 }
615 #else
616 static inline int try_force_unload(unsigned int flags)
617 {
618         return 0;
619 }
620 #endif /* CONFIG_MODULE_FORCE_UNLOAD */
621
622 struct stopref
623 {
624         struct module *mod;
625         int flags;
626         int *forced;
627 };
628
629 /* Whole machine is stopped with interrupts off when this runs. */
630 static int __try_stop_module(void *_sref)
631 {
632         struct stopref *sref = _sref;
633
634         /* If it's not unused, quit unless we are told to block. */
635         if ((sref->flags & O_NONBLOCK) && module_refcount(sref->mod) != 0) {
636                 if (!(*sref->forced = try_force_unload(sref->flags)))
637                         return -EWOULDBLOCK;
638         }
639
640         /* Mark it as dying. */
641         sref->mod->state = MODULE_STATE_GOING;
642         return 0;
643 }
644
645 static int try_stop_module(struct module *mod, int flags, int *forced)
646 {
647         struct stopref sref = { mod, flags, forced };
648
649         return stop_machine_run(__try_stop_module, &sref, NR_CPUS);
650 }
651
652 unsigned int module_refcount(struct module *mod)
653 {
654         unsigned int i, total = 0;
655
656         for (i = 0; i < NR_CPUS; i++)
657                 total += local_read(&mod->ref[i].count);
658         return total;
659 }
660 EXPORT_SYMBOL(module_refcount);
661
662 /* This exists whether we can unload or not */
663 static void free_module(struct module *mod);
664
665 static void wait_for_zero_refcount(struct module *mod)
666 {
667         /* Since we might sleep for some time, drop the semaphore first */
668         mutex_unlock(&module_mutex);
669         for (;;) {
670                 DEBUGP("Looking at refcount...\n");
671                 set_current_state(TASK_UNINTERRUPTIBLE);
672                 if (module_refcount(mod) == 0)
673                         break;
674                 schedule();
675         }
676         current->state = TASK_RUNNING;
677         mutex_lock(&module_mutex);
678 }
679
680 asmlinkage long
681 sys_delete_module(const char __user *name_user, unsigned int flags)
682 {
683         struct module *mod;
684         char name[MODULE_NAME_LEN];
685         int ret, forced = 0;
686
687         if (!capable(CAP_SYS_MODULE))
688                 return -EPERM;
689
690         if (strncpy_from_user(name, name_user, MODULE_NAME_LEN-1) < 0)
691                 return -EFAULT;
692         name[MODULE_NAME_LEN-1] = '\0';
693
694         if (mutex_lock_interruptible(&module_mutex) != 0)
695                 return -EINTR;
696
697         mod = find_module(name);
698         if (!mod) {
699                 ret = -ENOENT;
700                 goto out;
701         }
702
703         if (!list_empty(&mod->modules_which_use_me)) {
704                 /* Other modules depend on us: get rid of them first. */
705                 ret = -EWOULDBLOCK;
706                 goto out;
707         }
708
709         /* Doing init or already dying? */
710         if (mod->state != MODULE_STATE_LIVE) {
711                 /* FIXME: if (force), slam module count and wake up
712                    waiter --RR */
713                 DEBUGP("%s already dying\n", mod->name);
714                 ret = -EBUSY;
715                 goto out;
716         }
717
718         /* If it has an init func, it must have an exit func to unload */
719         if (mod->init && !mod->exit) {
720                 forced = try_force_unload(flags);
721                 if (!forced) {
722                         /* This module can't be removed */
723                         ret = -EBUSY;
724                         goto out;
725                 }
726         }
727
728         /* Set this up before setting mod->state */
729         mod->waiter = current;
730
731         /* Stop the machine so refcounts can't move and disable module. */
732         ret = try_stop_module(mod, flags, &forced);
733         if (ret != 0)
734                 goto out;
735
736         /* Never wait if forced. */
737         if (!forced && module_refcount(mod) != 0)
738                 wait_for_zero_refcount(mod);
739
740         /* Final destruction now noone is using it. */
741         if (mod->exit != NULL) {
742                 mutex_unlock(&module_mutex);
743                 mod->exit();
744                 mutex_lock(&module_mutex);
745         }
746         /* Store the name of the last unloaded module for diagnostic purposes */
747         strlcpy(last_unloaded_module, mod->name, sizeof(last_unloaded_module));
748         free_module(mod);
749
750  out:
751         mutex_unlock(&module_mutex);
752         return ret;
753 }
754
755 static void print_unload_info(struct seq_file *m, struct module *mod)
756 {
757         struct module_use *use;
758         int printed_something = 0;
759
760         seq_printf(m, " %u ", module_refcount(mod));
761
762         /* Always include a trailing , so userspace can differentiate
763            between this and the old multi-field proc format. */
764         list_for_each_entry(use, &mod->modules_which_use_me, list) {
765                 printed_something = 1;
766                 seq_printf(m, "%s,", use->module_which_uses->name);
767         }
768
769         if (mod->init != NULL && mod->exit == NULL) {
770                 printed_something = 1;
771                 seq_printf(m, "[permanent],");
772         }
773
774         if (!printed_something)
775                 seq_printf(m, "-");
776 }
777
778 void __symbol_put(const char *symbol)
779 {
780         struct module *owner;
781         const unsigned long *crc;
782
783         preempt_disable();
784         if (IS_ERR_VALUE(__find_symbol(symbol, &owner, &crc, 1)))
785                 BUG();
786         module_put(owner);
787         preempt_enable();
788 }
789 EXPORT_SYMBOL(__symbol_put);
790
791 void symbol_put_addr(void *addr)
792 {
793         struct module *modaddr;
794
795         if (core_kernel_text((unsigned long)addr))
796                 return;
797
798         if (!(modaddr = module_text_address((unsigned long)addr)))
799                 BUG();
800         module_put(modaddr);
801 }
802 EXPORT_SYMBOL_GPL(symbol_put_addr);
803
804 static ssize_t show_refcnt(struct module_attribute *mattr,
805                            struct module *mod, char *buffer)
806 {
807         return sprintf(buffer, "%u\n", module_refcount(mod));
808 }
809
810 static struct module_attribute refcnt = {
811         .attr = { .name = "refcnt", .mode = 0444 },
812         .show = show_refcnt,
813 };
814
815 void module_put(struct module *module)
816 {
817         if (module) {
818                 unsigned int cpu = get_cpu();
819                 local_dec(&module->ref[cpu].count);
820                 /* Maybe they're waiting for us to drop reference? */
821                 if (unlikely(!module_is_live(module)))
822                         wake_up_process(module->waiter);
823                 put_cpu();
824         }
825 }
826 EXPORT_SYMBOL(module_put);
827
828 #else /* !CONFIG_MODULE_UNLOAD */
829 static void print_unload_info(struct seq_file *m, struct module *mod)
830 {
831         /* We don't know the usage count, or what modules are using. */
832         seq_printf(m, " - -");
833 }
834
835 static inline void module_unload_free(struct module *mod)
836 {
837 }
838
839 static inline int use_module(struct module *a, struct module *b)
840 {
841         return strong_try_module_get(b) == 0;
842 }
843
844 static inline void module_unload_init(struct module *mod)
845 {
846 }
847 #endif /* CONFIG_MODULE_UNLOAD */
848
849 static ssize_t show_initstate(struct module_attribute *mattr,
850                            struct module *mod, char *buffer)
851 {
852         const char *state = "unknown";
853
854         switch (mod->state) {
855         case MODULE_STATE_LIVE:
856                 state = "live";
857                 break;
858         case MODULE_STATE_COMING:
859                 state = "coming";
860                 break;
861         case MODULE_STATE_GOING:
862                 state = "going";
863                 break;
864         }
865         return sprintf(buffer, "%s\n", state);
866 }
867
868 static struct module_attribute initstate = {
869         .attr = { .name = "initstate", .mode = 0444 },
870         .show = show_initstate,
871 };
872
873 static struct module_attribute *modinfo_attrs[] = {
874         &modinfo_version,
875         &modinfo_srcversion,
876         &initstate,
877 #ifdef CONFIG_MODULE_UNLOAD
878         &refcnt,
879 #endif
880         NULL,
881 };
882
883 static const char vermagic[] = VERMAGIC_STRING;
884
885 #ifdef CONFIG_MODVERSIONS
886 static int check_version(Elf_Shdr *sechdrs,
887                          unsigned int versindex,
888                          const char *symname,
889                          struct module *mod, 
890                          const unsigned long *crc)
891 {
892         unsigned int i, num_versions;
893         struct modversion_info *versions;
894
895         /* Exporting module didn't supply crcs?  OK, we're already tainted. */
896         if (!crc)
897                 return 1;
898
899         versions = (void *) sechdrs[versindex].sh_addr;
900         num_versions = sechdrs[versindex].sh_size
901                 / sizeof(struct modversion_info);
902
903         for (i = 0; i < num_versions; i++) {
904                 if (strcmp(versions[i].name, symname) != 0)
905                         continue;
906
907                 if (versions[i].crc == *crc)
908                         return 1;
909                 printk("%s: disagrees about version of symbol %s\n",
910                        mod->name, symname);
911                 DEBUGP("Found checksum %lX vs module %lX\n",
912                        *crc, versions[i].crc);
913                 return 0;
914         }
915         /* Not in module's version table.  OK, but that taints the kernel. */
916         if (!(tainted & TAINT_FORCED_MODULE))
917                 printk("%s: no version for \"%s\" found: kernel tainted.\n",
918                        mod->name, symname);
919         add_taint_module(mod, TAINT_FORCED_MODULE);
920         return 1;
921 }
922
923 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
924                                           unsigned int versindex,
925                                           struct module *mod)
926 {
927         const unsigned long *crc;
928         struct module *owner;
929
930         if (IS_ERR_VALUE(__find_symbol("struct_module",
931                                                 &owner, &crc, 1)))
932                 BUG();
933         return check_version(sechdrs, versindex, "struct_module", mod,
934                              crc);
935 }
936
937 /* First part is kernel version, which we ignore. */
938 static inline int same_magic(const char *amagic, const char *bmagic)
939 {
940         amagic += strcspn(amagic, " ");
941         bmagic += strcspn(bmagic, " ");
942         return strcmp(amagic, bmagic) == 0;
943 }
944 #else
945 static inline int check_version(Elf_Shdr *sechdrs,
946                                 unsigned int versindex,
947                                 const char *symname,
948                                 struct module *mod, 
949                                 const unsigned long *crc)
950 {
951         return 1;
952 }
953
954 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
955                                           unsigned int versindex,
956                                           struct module *mod)
957 {
958         return 1;
959 }
960
961 static inline int same_magic(const char *amagic, const char *bmagic)
962 {
963         return strcmp(amagic, bmagic) == 0;
964 }
965 #endif /* CONFIG_MODVERSIONS */
966
967 /* Resolve a symbol for this module.  I.e. if we find one, record usage.
968    Must be holding module_mutex. */
969 static unsigned long resolve_symbol(Elf_Shdr *sechdrs,
970                                     unsigned int versindex,
971                                     const char *name,
972                                     struct module *mod)
973 {
974         struct module *owner;
975         unsigned long ret;
976         const unsigned long *crc;
977
978         ret = __find_symbol(name, &owner, &crc,
979                         !(mod->taints & TAINT_PROPRIETARY_MODULE));
980         if (!IS_ERR_VALUE(ret)) {
981                 /* use_module can fail due to OOM,
982                    or module initialization or unloading */
983                 if (!check_version(sechdrs, versindex, name, mod, crc) ||
984                     !use_module(mod, owner))
985                         ret = -EINVAL;
986         }
987         return ret;
988 }
989
990
991 /*
992  * /sys/module/foo/sections stuff
993  * J. Corbet <corbet@lwn.net>
994  */
995 #ifdef CONFIG_KALLSYMS
996 static ssize_t module_sect_show(struct module_attribute *mattr,
997                                 struct module *mod, char *buf)
998 {
999         struct module_sect_attr *sattr =
1000                 container_of(mattr, struct module_sect_attr, mattr);
1001         return sprintf(buf, "0x%lx\n", sattr->address);
1002 }
1003
1004 static void free_sect_attrs(struct module_sect_attrs *sect_attrs)
1005 {
1006         int section;
1007
1008         for (section = 0; section < sect_attrs->nsections; section++)
1009                 kfree(sect_attrs->attrs[section].name);
1010         kfree(sect_attrs);
1011 }
1012
1013 static void add_sect_attrs(struct module *mod, unsigned int nsect,
1014                 char *secstrings, Elf_Shdr *sechdrs)
1015 {
1016         unsigned int nloaded = 0, i, size[2];
1017         struct module_sect_attrs *sect_attrs;
1018         struct module_sect_attr *sattr;
1019         struct attribute **gattr;
1020
1021         /* Count loaded sections and allocate structures */
1022         for (i = 0; i < nsect; i++)
1023                 if (sechdrs[i].sh_flags & SHF_ALLOC)
1024                         nloaded++;
1025         size[0] = ALIGN(sizeof(*sect_attrs)
1026                         + nloaded * sizeof(sect_attrs->attrs[0]),
1027                         sizeof(sect_attrs->grp.attrs[0]));
1028         size[1] = (nloaded + 1) * sizeof(sect_attrs->grp.attrs[0]);
1029         sect_attrs = kzalloc(size[0] + size[1], GFP_KERNEL);
1030         if (sect_attrs == NULL)
1031                 return;
1032
1033         /* Setup section attributes. */
1034         sect_attrs->grp.name = "sections";
1035         sect_attrs->grp.attrs = (void *)sect_attrs + size[0];
1036
1037         sect_attrs->nsections = 0;
1038         sattr = &sect_attrs->attrs[0];
1039         gattr = &sect_attrs->grp.attrs[0];
1040         for (i = 0; i < nsect; i++) {
1041                 if (! (sechdrs[i].sh_flags & SHF_ALLOC))
1042                         continue;
1043                 sattr->address = sechdrs[i].sh_addr;
1044                 sattr->name = kstrdup(secstrings + sechdrs[i].sh_name,
1045                                         GFP_KERNEL);
1046                 if (sattr->name == NULL)
1047                         goto out;
1048                 sect_attrs->nsections++;
1049                 sattr->mattr.show = module_sect_show;
1050                 sattr->mattr.store = NULL;
1051                 sattr->mattr.attr.name = sattr->name;
1052                 sattr->mattr.attr.mode = S_IRUGO;
1053                 *(gattr++) = &(sattr++)->mattr.attr;
1054         }
1055         *gattr = NULL;
1056
1057         if (sysfs_create_group(&mod->mkobj.kobj, &sect_attrs->grp))
1058                 goto out;
1059
1060         mod->sect_attrs = sect_attrs;
1061         return;
1062   out:
1063         free_sect_attrs(sect_attrs);
1064 }
1065
1066 static void remove_sect_attrs(struct module *mod)
1067 {
1068         if (mod->sect_attrs) {
1069                 sysfs_remove_group(&mod->mkobj.kobj,
1070                                    &mod->sect_attrs->grp);
1071                 /* We are positive that no one is using any sect attrs
1072                  * at this point.  Deallocate immediately. */
1073                 free_sect_attrs(mod->sect_attrs);
1074                 mod->sect_attrs = NULL;
1075         }
1076 }
1077
1078 /*
1079  * /sys/module/foo/notes/.section.name gives contents of SHT_NOTE sections.
1080  */
1081
1082 struct module_notes_attrs {
1083         struct kobject *dir;
1084         unsigned int notes;
1085         struct bin_attribute attrs[0];
1086 };
1087
1088 static ssize_t module_notes_read(struct kobject *kobj,
1089                                  struct bin_attribute *bin_attr,
1090                                  char *buf, loff_t pos, size_t count)
1091 {
1092         /*
1093          * The caller checked the pos and count against our size.
1094          */
1095         memcpy(buf, bin_attr->private + pos, count);
1096         return count;
1097 }
1098
1099 static void free_notes_attrs(struct module_notes_attrs *notes_attrs,
1100                              unsigned int i)
1101 {
1102         if (notes_attrs->dir) {
1103                 while (i-- > 0)
1104                         sysfs_remove_bin_file(notes_attrs->dir,
1105                                               &notes_attrs->attrs[i]);
1106                 kobject_del(notes_attrs->dir);
1107         }
1108         kfree(notes_attrs);
1109 }
1110
1111 static void add_notes_attrs(struct module *mod, unsigned int nsect,
1112                             char *secstrings, Elf_Shdr *sechdrs)
1113 {
1114         unsigned int notes, loaded, i;
1115         struct module_notes_attrs *notes_attrs;
1116         struct bin_attribute *nattr;
1117
1118         /* Count notes sections and allocate structures.  */
1119         notes = 0;
1120         for (i = 0; i < nsect; i++)
1121                 if ((sechdrs[i].sh_flags & SHF_ALLOC) &&
1122                     (sechdrs[i].sh_type == SHT_NOTE))
1123                         ++notes;
1124
1125         if (notes == 0)
1126                 return;
1127
1128         notes_attrs = kzalloc(sizeof(*notes_attrs)
1129                               + notes * sizeof(notes_attrs->attrs[0]),
1130                               GFP_KERNEL);
1131         if (notes_attrs == NULL)
1132                 return;
1133
1134         notes_attrs->notes = notes;
1135         nattr = &notes_attrs->attrs[0];
1136         for (loaded = i = 0; i < nsect; ++i) {
1137                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
1138                         continue;
1139                 if (sechdrs[i].sh_type == SHT_NOTE) {
1140                         nattr->attr.name = mod->sect_attrs->attrs[loaded].name;
1141                         nattr->attr.mode = S_IRUGO;
1142                         nattr->size = sechdrs[i].sh_size;
1143                         nattr->private = (void *) sechdrs[i].sh_addr;
1144                         nattr->read = module_notes_read;
1145                         ++nattr;
1146                 }
1147                 ++loaded;
1148         }
1149
1150         notes_attrs->dir = kobject_create_and_add("notes", &mod->mkobj.kobj);
1151         if (!notes_attrs->dir)
1152                 goto out;
1153
1154         for (i = 0; i < notes; ++i)
1155                 if (sysfs_create_bin_file(notes_attrs->dir,
1156                                           &notes_attrs->attrs[i]))
1157                         goto out;
1158
1159         mod->notes_attrs = notes_attrs;
1160         return;
1161
1162   out:
1163         free_notes_attrs(notes_attrs, i);
1164 }
1165
1166 static void remove_notes_attrs(struct module *mod)
1167 {
1168         if (mod->notes_attrs)
1169                 free_notes_attrs(mod->notes_attrs, mod->notes_attrs->notes);
1170 }
1171
1172 #else
1173
1174 static inline void add_sect_attrs(struct module *mod, unsigned int nsect,
1175                 char *sectstrings, Elf_Shdr *sechdrs)
1176 {
1177 }
1178
1179 static inline void remove_sect_attrs(struct module *mod)
1180 {
1181 }
1182
1183 static inline void add_notes_attrs(struct module *mod, unsigned int nsect,
1184                                    char *sectstrings, Elf_Shdr *sechdrs)
1185 {
1186 }
1187
1188 static inline void remove_notes_attrs(struct module *mod)
1189 {
1190 }
1191 #endif /* CONFIG_KALLSYMS */
1192
1193 #ifdef CONFIG_SYSFS
1194 int module_add_modinfo_attrs(struct module *mod)
1195 {
1196         struct module_attribute *attr;
1197         struct module_attribute *temp_attr;
1198         int error = 0;
1199         int i;
1200
1201         mod->modinfo_attrs = kzalloc((sizeof(struct module_attribute) *
1202                                         (ARRAY_SIZE(modinfo_attrs) + 1)),
1203                                         GFP_KERNEL);
1204         if (!mod->modinfo_attrs)
1205                 return -ENOMEM;
1206
1207         temp_attr = mod->modinfo_attrs;
1208         for (i = 0; (attr = modinfo_attrs[i]) && !error; i++) {
1209                 if (!attr->test ||
1210                     (attr->test && attr->test(mod))) {
1211                         memcpy(temp_attr, attr, sizeof(*temp_attr));
1212                         error = sysfs_create_file(&mod->mkobj.kobj,&temp_attr->attr);
1213                         ++temp_attr;
1214                 }
1215         }
1216         return error;
1217 }
1218
1219 void module_remove_modinfo_attrs(struct module *mod)
1220 {
1221         struct module_attribute *attr;
1222         int i;
1223
1224         for (i = 0; (attr = &mod->modinfo_attrs[i]); i++) {
1225                 /* pick a field to test for end of list */
1226                 if (!attr->attr.name)
1227                         break;
1228                 sysfs_remove_file(&mod->mkobj.kobj,&attr->attr);
1229                 if (attr->free)
1230                         attr->free(mod);
1231         }
1232         kfree(mod->modinfo_attrs);
1233 }
1234 #endif
1235
1236 #ifdef CONFIG_SYSFS
1237 int mod_sysfs_init(struct module *mod)
1238 {
1239         int err;
1240         struct kobject *kobj;
1241
1242         if (!module_sysfs_initialized) {
1243                 printk(KERN_ERR "%s: module sysfs not initialized\n",
1244                        mod->name);
1245                 err = -EINVAL;
1246                 goto out;
1247         }
1248
1249         kobj = kset_find_obj(module_kset, mod->name);
1250         if (kobj) {
1251                 printk(KERN_ERR "%s: module is already loaded\n", mod->name);
1252                 kobject_put(kobj);
1253                 err = -EINVAL;
1254                 goto out;
1255         }
1256
1257         mod->mkobj.mod = mod;
1258
1259         memset(&mod->mkobj.kobj, 0, sizeof(mod->mkobj.kobj));
1260         mod->mkobj.kobj.kset = module_kset;
1261         err = kobject_init_and_add(&mod->mkobj.kobj, &module_ktype, NULL,
1262                                    "%s", mod->name);
1263         if (err)
1264                 kobject_put(&mod->mkobj.kobj);
1265
1266         /* delay uevent until full sysfs population */
1267 out:
1268         return err;
1269 }
1270
1271 int mod_sysfs_setup(struct module *mod,
1272                            struct kernel_param *kparam,
1273                            unsigned int num_params)
1274 {
1275         int err;
1276
1277         mod->holders_dir = kobject_create_and_add("holders", &mod->mkobj.kobj);
1278         if (!mod->holders_dir) {
1279                 err = -ENOMEM;
1280                 goto out_unreg;
1281         }
1282
1283         err = module_param_sysfs_setup(mod, kparam, num_params);
1284         if (err)
1285                 goto out_unreg_holders;
1286
1287         err = module_add_modinfo_attrs(mod);
1288         if (err)
1289                 goto out_unreg_param;
1290
1291         kobject_uevent(&mod->mkobj.kobj, KOBJ_ADD);
1292         return 0;
1293
1294 out_unreg_param:
1295         module_param_sysfs_remove(mod);
1296 out_unreg_holders:
1297         kobject_put(mod->holders_dir);
1298 out_unreg:
1299         kobject_put(&mod->mkobj.kobj);
1300         return err;
1301 }
1302 #endif
1303
1304 static void mod_kobject_remove(struct module *mod)
1305 {
1306         module_remove_modinfo_attrs(mod);
1307         module_param_sysfs_remove(mod);
1308         kobject_put(mod->mkobj.drivers_dir);
1309         kobject_put(mod->holders_dir);
1310         kobject_put(&mod->mkobj.kobj);
1311 }
1312
1313 /*
1314  * link the module with the whole machine is stopped with interrupts off
1315  * - this defends against kallsyms not taking locks
1316  */
1317 static int __link_module(void *_mod)
1318 {
1319         struct module *mod = _mod;
1320         list_add(&mod->list, &modules);
1321         return 0;
1322 }
1323
1324 /*
1325  * unlink the module with the whole machine is stopped with interrupts off
1326  * - this defends against kallsyms not taking locks
1327  */
1328 static int __unlink_module(void *_mod)
1329 {
1330         struct module *mod = _mod;
1331         list_del(&mod->list);
1332         return 0;
1333 }
1334
1335 /* Free a module, remove from lists, etc (must hold module_mutex). */
1336 static void free_module(struct module *mod)
1337 {
1338         /* Delete from various lists */
1339         stop_machine_run(__unlink_module, mod, NR_CPUS);
1340         remove_notes_attrs(mod);
1341         remove_sect_attrs(mod);
1342         mod_kobject_remove(mod);
1343
1344         unwind_remove_table(mod->unwind_info, 0);
1345
1346         /* Arch-specific cleanup. */
1347         module_arch_cleanup(mod);
1348
1349         /* Module unload stuff */
1350         module_unload_free(mod);
1351
1352         /* This may be NULL, but that's OK */
1353         module_free(mod, mod->module_init);
1354         kfree(mod->args);
1355         if (mod->percpu)
1356                 percpu_modfree(mod->percpu);
1357
1358         /* Free lock-classes: */
1359         lockdep_free_key_range(mod->module_core, mod->core_size);
1360
1361         /* Finally, free the core (containing the module structure) */
1362         module_free(mod, mod->module_core);
1363 }
1364
1365 void *__symbol_get(const char *symbol)
1366 {
1367         struct module *owner;
1368         unsigned long value;
1369         const unsigned long *crc;
1370
1371         preempt_disable();
1372         value = __find_symbol(symbol, &owner, &crc, 1);
1373         if (IS_ERR_VALUE(value))
1374                 value = 0;
1375         else if (strong_try_module_get(owner))
1376                 value = 0;
1377         preempt_enable();
1378
1379         return (void *)value;
1380 }
1381 EXPORT_SYMBOL_GPL(__symbol_get);
1382
1383 /*
1384  * Ensure that an exported symbol [global namespace] does not already exist
1385  * in the kernel or in some other module's exported symbol table.
1386  */
1387 static int verify_export_symbols(struct module *mod)
1388 {
1389         const char *name = NULL;
1390         unsigned long i, ret = 0;
1391         struct module *owner;
1392         const unsigned long *crc;
1393
1394         for (i = 0; i < mod->num_syms; i++)
1395                 if (!IS_ERR_VALUE(__find_symbol(mod->syms[i].name,
1396                                                         &owner, &crc, 1))) {
1397                         name = mod->syms[i].name;
1398                         ret = -ENOEXEC;
1399                         goto dup;
1400                 }
1401
1402         for (i = 0; i < mod->num_gpl_syms; i++)
1403                 if (!IS_ERR_VALUE(__find_symbol(mod->gpl_syms[i].name,
1404                                                         &owner, &crc, 1))) {
1405                         name = mod->gpl_syms[i].name;
1406                         ret = -ENOEXEC;
1407                         goto dup;
1408                 }
1409
1410 dup:
1411         if (ret)
1412                 printk(KERN_ERR "%s: exports duplicate symbol %s (owned by %s)\n",
1413                         mod->name, name, module_name(owner));
1414
1415         return ret;
1416 }
1417
1418 /* Change all symbols so that st_value encodes the pointer directly. */
1419 static int simplify_symbols(Elf_Shdr *sechdrs,
1420                             unsigned int symindex,
1421                             const char *strtab,
1422                             unsigned int versindex,
1423                             unsigned int pcpuindex,
1424                             struct module *mod)
1425 {
1426         Elf_Sym *sym = (void *)sechdrs[symindex].sh_addr;
1427         unsigned long secbase;
1428         unsigned int i, n = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1429         int ret = 0;
1430
1431         for (i = 1; i < n; i++) {
1432                 switch (sym[i].st_shndx) {
1433                 case SHN_COMMON:
1434                         /* We compiled with -fno-common.  These are not
1435                            supposed to happen.  */
1436                         DEBUGP("Common symbol: %s\n", strtab + sym[i].st_name);
1437                         printk("%s: please compile with -fno-common\n",
1438                                mod->name);
1439                         ret = -ENOEXEC;
1440                         break;
1441
1442                 case SHN_ABS:
1443                         /* Don't need to do anything */
1444                         DEBUGP("Absolute symbol: 0x%08lx\n",
1445                                (long)sym[i].st_value);
1446                         break;
1447
1448                 case SHN_UNDEF:
1449                         sym[i].st_value
1450                           = resolve_symbol(sechdrs, versindex,
1451                                            strtab + sym[i].st_name, mod);
1452
1453                         /* Ok if resolved.  */
1454                         if (!IS_ERR_VALUE(sym[i].st_value))
1455                                 break;
1456                         /* Ok if weak.  */
1457                         if (ELF_ST_BIND(sym[i].st_info) == STB_WEAK)
1458                                 break;
1459
1460                         printk(KERN_WARNING "%s: Unknown symbol %s\n",
1461                                mod->name, strtab + sym[i].st_name);
1462                         ret = -ENOENT;
1463                         break;
1464
1465                 default:
1466                         /* Divert to percpu allocation if a percpu var. */
1467                         if (sym[i].st_shndx == pcpuindex)
1468                                 secbase = (unsigned long)mod->percpu;
1469                         else
1470                                 secbase = sechdrs[sym[i].st_shndx].sh_addr;
1471                         sym[i].st_value += secbase;
1472                         break;
1473                 }
1474         }
1475
1476         return ret;
1477 }
1478
1479 /* Update size with this section: return offset. */
1480 static long get_offset(unsigned long *size, Elf_Shdr *sechdr)
1481 {
1482         long ret;
1483
1484         ret = ALIGN(*size, sechdr->sh_addralign ?: 1);
1485         *size = ret + sechdr->sh_size;
1486         return ret;
1487 }
1488
1489 /* Lay out the SHF_ALLOC sections in a way not dissimilar to how ld
1490    might -- code, read-only data, read-write data, small data.  Tally
1491    sizes, and place the offsets into sh_entsize fields: high bit means it
1492    belongs in init. */
1493 static void layout_sections(struct module *mod,
1494                             const Elf_Ehdr *hdr,
1495                             Elf_Shdr *sechdrs,
1496                             const char *secstrings)
1497 {
1498         static unsigned long const masks[][2] = {
1499                 /* NOTE: all executable code must be the first section
1500                  * in this array; otherwise modify the text_size
1501                  * finder in the two loops below */
1502                 { SHF_EXECINSTR | SHF_ALLOC, ARCH_SHF_SMALL },
1503                 { SHF_ALLOC, SHF_WRITE | ARCH_SHF_SMALL },
1504                 { SHF_WRITE | SHF_ALLOC, ARCH_SHF_SMALL },
1505                 { ARCH_SHF_SMALL | SHF_ALLOC, 0 }
1506         };
1507         unsigned int m, i;
1508
1509         for (i = 0; i < hdr->e_shnum; i++)
1510                 sechdrs[i].sh_entsize = ~0UL;
1511
1512         DEBUGP("Core section allocation order:\n");
1513         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1514                 for (i = 0; i < hdr->e_shnum; ++i) {
1515                         Elf_Shdr *s = &sechdrs[i];
1516
1517                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1518                             || (s->sh_flags & masks[m][1])
1519                             || s->sh_entsize != ~0UL
1520                             || strncmp(secstrings + s->sh_name,
1521                                        ".init", 5) == 0)
1522                                 continue;
1523                         s->sh_entsize = get_offset(&mod->core_size, s);
1524                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1525                 }
1526                 if (m == 0)
1527                         mod->core_text_size = mod->core_size;
1528         }
1529
1530         DEBUGP("Init section allocation order:\n");
1531         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1532                 for (i = 0; i < hdr->e_shnum; ++i) {
1533                         Elf_Shdr *s = &sechdrs[i];
1534
1535                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1536                             || (s->sh_flags & masks[m][1])
1537                             || s->sh_entsize != ~0UL
1538                             || strncmp(secstrings + s->sh_name,
1539                                        ".init", 5) != 0)
1540                                 continue;
1541                         s->sh_entsize = (get_offset(&mod->init_size, s)
1542                                          | INIT_OFFSET_MASK);
1543                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1544                 }
1545                 if (m == 0)
1546                         mod->init_text_size = mod->init_size;
1547         }
1548 }
1549
1550 static void set_license(struct module *mod, const char *license)
1551 {
1552         if (!license)
1553                 license = "unspecified";
1554
1555         if (!license_is_gpl_compatible(license)) {
1556                 if (!(tainted & TAINT_PROPRIETARY_MODULE))
1557                         printk(KERN_WARNING "%s: module license '%s' taints "
1558                                 "kernel.\n", mod->name, license);
1559                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1560         }
1561 }
1562
1563 /* Parse tag=value strings from .modinfo section */
1564 static char *next_string(char *string, unsigned long *secsize)
1565 {
1566         /* Skip non-zero chars */
1567         while (string[0]) {
1568                 string++;
1569                 if ((*secsize)-- <= 1)
1570                         return NULL;
1571         }
1572
1573         /* Skip any zero padding. */
1574         while (!string[0]) {
1575                 string++;
1576                 if ((*secsize)-- <= 1)
1577                         return NULL;
1578         }
1579         return string;
1580 }
1581
1582 static char *get_modinfo(Elf_Shdr *sechdrs,
1583                          unsigned int info,
1584                          const char *tag)
1585 {
1586         char *p;
1587         unsigned int taglen = strlen(tag);
1588         unsigned long size = sechdrs[info].sh_size;
1589
1590         for (p = (char *)sechdrs[info].sh_addr; p; p = next_string(p, &size)) {
1591                 if (strncmp(p, tag, taglen) == 0 && p[taglen] == '=')
1592                         return p + taglen + 1;
1593         }
1594         return NULL;
1595 }
1596
1597 static void setup_modinfo(struct module *mod, Elf_Shdr *sechdrs,
1598                           unsigned int infoindex)
1599 {
1600         struct module_attribute *attr;
1601         int i;
1602
1603         for (i = 0; (attr = modinfo_attrs[i]); i++) {
1604                 if (attr->setup)
1605                         attr->setup(mod,
1606                                     get_modinfo(sechdrs,
1607                                                 infoindex,
1608                                                 attr->attr.name));
1609         }
1610 }
1611
1612 #ifdef CONFIG_KALLSYMS
1613 static int is_exported(const char *name, const struct module *mod)
1614 {
1615         if (!mod && lookup_symbol(name, __start___ksymtab, __stop___ksymtab))
1616                 return 1;
1617         else
1618                 if (mod && lookup_symbol(name, mod->syms, mod->syms + mod->num_syms))
1619                         return 1;
1620                 else
1621                         return 0;
1622 }
1623
1624 /* As per nm */
1625 static char elf_type(const Elf_Sym *sym,
1626                      Elf_Shdr *sechdrs,
1627                      const char *secstrings,
1628                      struct module *mod)
1629 {
1630         if (ELF_ST_BIND(sym->st_info) == STB_WEAK) {
1631                 if (ELF_ST_TYPE(sym->st_info) == STT_OBJECT)
1632                         return 'v';
1633                 else
1634                         return 'w';
1635         }
1636         if (sym->st_shndx == SHN_UNDEF)
1637                 return 'U';
1638         if (sym->st_shndx == SHN_ABS)
1639                 return 'a';
1640         if (sym->st_shndx >= SHN_LORESERVE)
1641                 return '?';
1642         if (sechdrs[sym->st_shndx].sh_flags & SHF_EXECINSTR)
1643                 return 't';
1644         if (sechdrs[sym->st_shndx].sh_flags & SHF_ALLOC
1645             && sechdrs[sym->st_shndx].sh_type != SHT_NOBITS) {
1646                 if (!(sechdrs[sym->st_shndx].sh_flags & SHF_WRITE))
1647                         return 'r';
1648                 else if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1649                         return 'g';
1650                 else
1651                         return 'd';
1652         }
1653         if (sechdrs[sym->st_shndx].sh_type == SHT_NOBITS) {
1654                 if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1655                         return 's';
1656                 else
1657                         return 'b';
1658         }
1659         if (strncmp(secstrings + sechdrs[sym->st_shndx].sh_name,
1660                     ".debug", strlen(".debug")) == 0)
1661                 return 'n';
1662         return '?';
1663 }
1664
1665 static void add_kallsyms(struct module *mod,
1666                          Elf_Shdr *sechdrs,
1667                          unsigned int symindex,
1668                          unsigned int strindex,
1669                          const char *secstrings)
1670 {
1671         unsigned int i;
1672
1673         mod->symtab = (void *)sechdrs[symindex].sh_addr;
1674         mod->num_symtab = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1675         mod->strtab = (void *)sechdrs[strindex].sh_addr;
1676
1677         /* Set types up while we still have access to sections. */
1678         for (i = 0; i < mod->num_symtab; i++)
1679                 mod->symtab[i].st_info
1680                         = elf_type(&mod->symtab[i], sechdrs, secstrings, mod);
1681 }
1682 #else
1683 static inline void add_kallsyms(struct module *mod,
1684                                 Elf_Shdr *sechdrs,
1685                                 unsigned int symindex,
1686                                 unsigned int strindex,
1687                                 const char *secstrings)
1688 {
1689 }
1690 #endif /* CONFIG_KALLSYMS */
1691
1692 /* Allocate and load the module: note that size of section 0 is always
1693    zero, and we rely on this for optional sections. */
1694 static struct module *load_module(void __user *umod,
1695                                   unsigned long len,
1696                                   const char __user *uargs)
1697 {
1698         Elf_Ehdr *hdr;
1699         Elf_Shdr *sechdrs;
1700         char *secstrings, *args, *modmagic, *strtab = NULL;
1701         unsigned int i;
1702         unsigned int symindex = 0;
1703         unsigned int strindex = 0;
1704         unsigned int setupindex;
1705         unsigned int exindex;
1706         unsigned int exportindex;
1707         unsigned int modindex;
1708         unsigned int obsparmindex;
1709         unsigned int infoindex;
1710         unsigned int gplindex;
1711         unsigned int crcindex;
1712         unsigned int gplcrcindex;
1713         unsigned int versindex;
1714         unsigned int pcpuindex;
1715         unsigned int gplfutureindex;
1716         unsigned int gplfuturecrcindex;
1717         unsigned int unwindex = 0;
1718         unsigned int unusedindex;
1719         unsigned int unusedcrcindex;
1720         unsigned int unusedgplindex;
1721         unsigned int unusedgplcrcindex;
1722         unsigned int markersindex;
1723         unsigned int markersstringsindex;
1724         struct module *mod;
1725         long err = 0;
1726         void *percpu = NULL, *ptr = NULL; /* Stops spurious gcc warning */
1727         struct exception_table_entry *extable;
1728         mm_segment_t old_fs;
1729
1730         DEBUGP("load_module: umod=%p, len=%lu, uargs=%p\n",
1731                umod, len, uargs);
1732         if (len < sizeof(*hdr))
1733                 return ERR_PTR(-ENOEXEC);
1734
1735         /* Suck in entire file: we'll want most of it. */
1736         /* vmalloc barfs on "unusual" numbers.  Check here */
1737         if (len > 64 * 1024 * 1024 || (hdr = vmalloc(len)) == NULL)
1738                 return ERR_PTR(-ENOMEM);
1739         if (copy_from_user(hdr, umod, len) != 0) {
1740                 err = -EFAULT;
1741                 goto free_hdr;
1742         }
1743
1744         /* Sanity checks against insmoding binaries or wrong arch,
1745            weird elf version */
1746         if (memcmp(hdr->e_ident, ELFMAG, 4) != 0
1747             || hdr->e_type != ET_REL
1748             || !elf_check_arch(hdr)
1749             || hdr->e_shentsize != sizeof(*sechdrs)) {
1750                 err = -ENOEXEC;
1751                 goto free_hdr;
1752         }
1753
1754         if (len < hdr->e_shoff + hdr->e_shnum * sizeof(Elf_Shdr))
1755                 goto truncated;
1756
1757         /* Convenience variables */
1758         sechdrs = (void *)hdr + hdr->e_shoff;
1759         secstrings = (void *)hdr + sechdrs[hdr->e_shstrndx].sh_offset;
1760         sechdrs[0].sh_addr = 0;
1761
1762         for (i = 1; i < hdr->e_shnum; i++) {
1763                 if (sechdrs[i].sh_type != SHT_NOBITS
1764                     && len < sechdrs[i].sh_offset + sechdrs[i].sh_size)
1765                         goto truncated;
1766
1767                 /* Mark all sections sh_addr with their address in the
1768                    temporary image. */
1769                 sechdrs[i].sh_addr = (size_t)hdr + sechdrs[i].sh_offset;
1770
1771                 /* Internal symbols and strings. */
1772                 if (sechdrs[i].sh_type == SHT_SYMTAB) {
1773                         symindex = i;
1774                         strindex = sechdrs[i].sh_link;
1775                         strtab = (char *)hdr + sechdrs[strindex].sh_offset;
1776                 }
1777 #ifndef CONFIG_MODULE_UNLOAD
1778                 /* Don't load .exit sections */
1779                 if (strncmp(secstrings+sechdrs[i].sh_name, ".exit", 5) == 0)
1780                         sechdrs[i].sh_flags &= ~(unsigned long)SHF_ALLOC;
1781 #endif
1782         }
1783
1784         modindex = find_sec(hdr, sechdrs, secstrings,
1785                             ".gnu.linkonce.this_module");
1786         if (!modindex) {
1787                 printk(KERN_WARNING "No module found in object\n");
1788                 err = -ENOEXEC;
1789                 goto free_hdr;
1790         }
1791         mod = (void *)sechdrs[modindex].sh_addr;
1792
1793         if (symindex == 0) {
1794                 printk(KERN_WARNING "%s: module has no symbols (stripped?)\n",
1795                        mod->name);
1796                 err = -ENOEXEC;
1797                 goto free_hdr;
1798         }
1799
1800         /* Optional sections */
1801         exportindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab");
1802         gplindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_gpl");
1803         gplfutureindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_gpl_future");
1804         unusedindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_unused");
1805         unusedgplindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_unused_gpl");
1806         crcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab");
1807         gplcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_gpl");
1808         gplfuturecrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_gpl_future");
1809         unusedcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_unused");
1810         unusedgplcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_unused_gpl");
1811         setupindex = find_sec(hdr, sechdrs, secstrings, "__param");
1812         exindex = find_sec(hdr, sechdrs, secstrings, "__ex_table");
1813         obsparmindex = find_sec(hdr, sechdrs, secstrings, "__obsparm");
1814         versindex = find_sec(hdr, sechdrs, secstrings, "__versions");
1815         infoindex = find_sec(hdr, sechdrs, secstrings, ".modinfo");
1816         pcpuindex = find_pcpusec(hdr, sechdrs, secstrings);
1817 #ifdef ARCH_UNWIND_SECTION_NAME
1818         unwindex = find_sec(hdr, sechdrs, secstrings, ARCH_UNWIND_SECTION_NAME);
1819 #endif
1820
1821         /* Don't keep modinfo section */
1822         sechdrs[infoindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1823 #ifdef CONFIG_KALLSYMS
1824         /* Keep symbol and string tables for decoding later. */
1825         sechdrs[symindex].sh_flags |= SHF_ALLOC;
1826         sechdrs[strindex].sh_flags |= SHF_ALLOC;
1827 #endif
1828         if (unwindex)
1829                 sechdrs[unwindex].sh_flags |= SHF_ALLOC;
1830
1831         /* Check module struct version now, before we try to use module. */
1832         if (!check_modstruct_version(sechdrs, versindex, mod)) {
1833                 err = -ENOEXEC;
1834                 goto free_hdr;
1835         }
1836
1837         modmagic = get_modinfo(sechdrs, infoindex, "vermagic");
1838         /* This is allowed: modprobe --force will invalidate it. */
1839         if (!modmagic) {
1840                 add_taint_module(mod, TAINT_FORCED_MODULE);
1841                 printk(KERN_WARNING "%s: no version magic, tainting kernel.\n",
1842                        mod->name);
1843         } else if (!same_magic(modmagic, vermagic)) {
1844                 printk(KERN_ERR "%s: version magic '%s' should be '%s'\n",
1845                        mod->name, modmagic, vermagic);
1846                 err = -ENOEXEC;
1847                 goto free_hdr;
1848         }
1849
1850         /* Now copy in args */
1851         args = strndup_user(uargs, ~0UL >> 1);
1852         if (IS_ERR(args)) {
1853                 err = PTR_ERR(args);
1854                 goto free_hdr;
1855         }
1856
1857         if (find_module(mod->name)) {
1858                 err = -EEXIST;
1859                 goto free_mod;
1860         }
1861
1862         mod->state = MODULE_STATE_COMING;
1863
1864         /* Allow arches to frob section contents and sizes.  */
1865         err = module_frob_arch_sections(hdr, sechdrs, secstrings, mod);
1866         if (err < 0)
1867                 goto free_mod;
1868
1869         if (pcpuindex) {
1870                 /* We have a special allocation for this section. */
1871                 percpu = percpu_modalloc(sechdrs[pcpuindex].sh_size,
1872                                          sechdrs[pcpuindex].sh_addralign,
1873                                          mod->name);
1874                 if (!percpu) {
1875                         err = -ENOMEM;
1876                         goto free_mod;
1877                 }
1878                 sechdrs[pcpuindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1879                 mod->percpu = percpu;
1880         }
1881
1882         /* Determine total sizes, and put offsets in sh_entsize.  For now
1883            this is done generically; there doesn't appear to be any
1884            special cases for the architectures. */
1885         layout_sections(mod, hdr, sechdrs, secstrings);
1886
1887         /* Do the allocs. */
1888         ptr = module_alloc(mod->core_size);
1889         if (!ptr) {
1890                 err = -ENOMEM;
1891                 goto free_percpu;
1892         }
1893         memset(ptr, 0, mod->core_size);
1894         mod->module_core = ptr;
1895
1896         ptr = module_alloc(mod->init_size);
1897         if (!ptr && mod->init_size) {
1898                 err = -ENOMEM;
1899                 goto free_core;
1900         }
1901         memset(ptr, 0, mod->init_size);
1902         mod->module_init = ptr;
1903
1904         /* Transfer each section which specifies SHF_ALLOC */
1905         DEBUGP("final section addresses:\n");
1906         for (i = 0; i < hdr->e_shnum; i++) {
1907                 void *dest;
1908
1909                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
1910                         continue;
1911
1912                 if (sechdrs[i].sh_entsize & INIT_OFFSET_MASK)
1913                         dest = mod->module_init
1914                                 + (sechdrs[i].sh_entsize & ~INIT_OFFSET_MASK);
1915                 else
1916                         dest = mod->module_core + sechdrs[i].sh_entsize;
1917
1918                 if (sechdrs[i].sh_type != SHT_NOBITS)
1919                         memcpy(dest, (void *)sechdrs[i].sh_addr,
1920                                sechdrs[i].sh_size);
1921                 /* Update sh_addr to point to copy in image. */
1922                 sechdrs[i].sh_addr = (unsigned long)dest;
1923                 DEBUGP("\t0x%lx %s\n", sechdrs[i].sh_addr, secstrings + sechdrs[i].sh_name);
1924         }
1925         /* Module has been moved. */
1926         mod = (void *)sechdrs[modindex].sh_addr;
1927
1928         /* Now we've moved module, initialize linked lists, etc. */
1929         module_unload_init(mod);
1930
1931         /* add kobject, so we can reference it. */
1932         err = mod_sysfs_init(mod);
1933         if (err)
1934                 goto free_unload;
1935
1936         /* Set up license info based on the info section */
1937         set_license(mod, get_modinfo(sechdrs, infoindex, "license"));
1938
1939         if (strcmp(mod->name, "ndiswrapper") == 0)
1940                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1941         if (strcmp(mod->name, "driverloader") == 0)
1942                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1943
1944         /* Set up MODINFO_ATTR fields */
1945         setup_modinfo(mod, sechdrs, infoindex);
1946
1947         /* Fix up syms, so that st_value is a pointer to location. */
1948         err = simplify_symbols(sechdrs, symindex, strtab, versindex, pcpuindex,
1949                                mod);
1950         if (err < 0)
1951                 goto cleanup;
1952
1953         /* Set up EXPORTed & EXPORT_GPLed symbols (section 0 is 0 length) */
1954         mod->num_syms = sechdrs[exportindex].sh_size / sizeof(*mod->syms);
1955         mod->syms = (void *)sechdrs[exportindex].sh_addr;
1956         if (crcindex)
1957                 mod->crcs = (void *)sechdrs[crcindex].sh_addr;
1958         mod->num_gpl_syms = sechdrs[gplindex].sh_size / sizeof(*mod->gpl_syms);
1959         mod->gpl_syms = (void *)sechdrs[gplindex].sh_addr;
1960         if (gplcrcindex)
1961                 mod->gpl_crcs = (void *)sechdrs[gplcrcindex].sh_addr;
1962         mod->num_gpl_future_syms = sechdrs[gplfutureindex].sh_size /
1963                                         sizeof(*mod->gpl_future_syms);
1964         mod->num_unused_syms = sechdrs[unusedindex].sh_size /
1965                                         sizeof(*mod->unused_syms);
1966         mod->num_unused_gpl_syms = sechdrs[unusedgplindex].sh_size /
1967                                         sizeof(*mod->unused_gpl_syms);
1968         mod->gpl_future_syms = (void *)sechdrs[gplfutureindex].sh_addr;
1969         if (gplfuturecrcindex)
1970                 mod->gpl_future_crcs = (void *)sechdrs[gplfuturecrcindex].sh_addr;
1971
1972         mod->unused_syms = (void *)sechdrs[unusedindex].sh_addr;
1973         if (unusedcrcindex)
1974                 mod->unused_crcs = (void *)sechdrs[unusedcrcindex].sh_addr;
1975         mod->unused_gpl_syms = (void *)sechdrs[unusedgplindex].sh_addr;
1976         if (unusedgplcrcindex)
1977                 mod->unused_crcs = (void *)sechdrs[unusedgplcrcindex].sh_addr;
1978
1979 #ifdef CONFIG_MODVERSIONS
1980         if ((mod->num_syms && !crcindex) ||
1981             (mod->num_gpl_syms && !gplcrcindex) ||
1982             (mod->num_gpl_future_syms && !gplfuturecrcindex) ||
1983             (mod->num_unused_syms && !unusedcrcindex) ||
1984             (mod->num_unused_gpl_syms && !unusedgplcrcindex)) {
1985                 printk(KERN_WARNING "%s: No versions for exported symbols."
1986                        " Tainting kernel.\n", mod->name);
1987                 add_taint_module(mod, TAINT_FORCED_MODULE);
1988         }
1989 #endif
1990         markersindex = find_sec(hdr, sechdrs, secstrings, "__markers");
1991         markersstringsindex = find_sec(hdr, sechdrs, secstrings,
1992                                         "__markers_strings");
1993
1994         /* Now do relocations. */
1995         for (i = 1; i < hdr->e_shnum; i++) {
1996                 const char *strtab = (char *)sechdrs[strindex].sh_addr;
1997                 unsigned int info = sechdrs[i].sh_info;
1998
1999                 /* Not a valid relocation section? */
2000                 if (info >= hdr->e_shnum)
2001                         continue;
2002
2003                 /* Don't bother with non-allocated sections */
2004                 if (!(sechdrs[info].sh_flags & SHF_ALLOC))
2005                         continue;
2006
2007                 if (sechdrs[i].sh_type == SHT_REL)
2008                         err = apply_relocate(sechdrs, strtab, symindex, i,mod);
2009                 else if (sechdrs[i].sh_type == SHT_RELA)
2010                         err = apply_relocate_add(sechdrs, strtab, symindex, i,
2011                                                  mod);
2012                 if (err < 0)
2013                         goto cleanup;
2014         }
2015 #ifdef CONFIG_MARKERS
2016         mod->markers = (void *)sechdrs[markersindex].sh_addr;
2017         mod->num_markers =
2018                 sechdrs[markersindex].sh_size / sizeof(*mod->markers);
2019 #endif
2020
2021         /* Find duplicate symbols */
2022         err = verify_export_symbols(mod);
2023
2024         if (err < 0)
2025                 goto cleanup;
2026
2027         /* Set up and sort exception table */
2028         mod->num_exentries = sechdrs[exindex].sh_size / sizeof(*mod->extable);
2029         mod->extable = extable = (void *)sechdrs[exindex].sh_addr;
2030         sort_extable(extable, extable + mod->num_exentries);
2031
2032         /* Finally, copy percpu area over. */
2033         percpu_modcopy(mod->percpu, (void *)sechdrs[pcpuindex].sh_addr,
2034                        sechdrs[pcpuindex].sh_size);
2035
2036         add_kallsyms(mod, sechdrs, symindex, strindex, secstrings);
2037
2038 #ifdef CONFIG_MARKERS
2039         if (!mod->taints)
2040                 marker_update_probe_range(mod->markers,
2041                         mod->markers + mod->num_markers, NULL, NULL);
2042 #endif
2043         err = module_finalize(hdr, sechdrs, mod);
2044         if (err < 0)
2045                 goto cleanup;
2046
2047         /* flush the icache in correct context */
2048         old_fs = get_fs();
2049         set_fs(KERNEL_DS);
2050
2051         /*
2052          * Flush the instruction cache, since we've played with text.
2053          * Do it before processing of module parameters, so the module
2054          * can provide parameter accessor functions of its own.
2055          */
2056         if (mod->module_init)
2057                 flush_icache_range((unsigned long)mod->module_init,
2058                                    (unsigned long)mod->module_init
2059                                    + mod->init_size);
2060         flush_icache_range((unsigned long)mod->module_core,
2061                            (unsigned long)mod->module_core + mod->core_size);
2062
2063         set_fs(old_fs);
2064
2065         mod->args = args;
2066         if (obsparmindex)
2067                 printk(KERN_WARNING "%s: Ignoring obsolete parameters\n",
2068                        mod->name);
2069
2070         /* Now sew it into the lists so we can get lockdep and oops
2071          * info during argument parsing.  Noone should access us, since
2072          * strong_try_module_get() will fail. */
2073         stop_machine_run(__link_module, mod, NR_CPUS);
2074
2075         /* Size of section 0 is 0, so this works well if no params */
2076         err = parse_args(mod->name, mod->args,
2077                          (struct kernel_param *)
2078                          sechdrs[setupindex].sh_addr,
2079                          sechdrs[setupindex].sh_size
2080                          / sizeof(struct kernel_param),
2081                          NULL);
2082         if (err < 0)
2083                 goto unlink;
2084
2085         err = mod_sysfs_setup(mod,
2086                               (struct kernel_param *)
2087                               sechdrs[setupindex].sh_addr,
2088                               sechdrs[setupindex].sh_size
2089                               / sizeof(struct kernel_param));
2090         if (err < 0)
2091                 goto unlink;
2092         add_sect_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
2093         add_notes_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
2094
2095         /* Size of section 0 is 0, so this works well if no unwind info. */
2096         mod->unwind_info = unwind_add_table(mod,
2097                                             (void *)sechdrs[unwindex].sh_addr,
2098                                             sechdrs[unwindex].sh_size);
2099
2100         /* Get rid of temporary copy */
2101         vfree(hdr);
2102
2103         /* Done! */
2104         return mod;
2105
2106  unlink:
2107         stop_machine_run(__unlink_module, mod, NR_CPUS);
2108         module_arch_cleanup(mod);
2109  cleanup:
2110         kobject_del(&mod->mkobj.kobj);
2111         kobject_put(&mod->mkobj.kobj);
2112  free_unload:
2113         module_unload_free(mod);
2114         module_free(mod, mod->module_init);
2115  free_core:
2116         module_free(mod, mod->module_core);
2117  free_percpu:
2118         if (percpu)
2119                 percpu_modfree(percpu);
2120  free_mod:
2121         kfree(args);
2122  free_hdr:
2123         vfree(hdr);
2124         return ERR_PTR(err);
2125
2126  truncated:
2127         printk(KERN_ERR "Module len %lu truncated\n", len);
2128         err = -ENOEXEC;
2129         goto free_hdr;
2130 }
2131
2132 /* This is where the real work happens */
2133 asmlinkage long
2134 sys_init_module(void __user *umod,
2135                 unsigned long len,
2136                 const char __user *uargs)
2137 {
2138         struct module *mod;
2139         int ret = 0;
2140
2141         /* Must have permission */
2142         if (!capable(CAP_SYS_MODULE))
2143                 return -EPERM;
2144
2145         /* Only one module load at a time, please */
2146         if (mutex_lock_interruptible(&module_mutex) != 0)
2147                 return -EINTR;
2148
2149         /* Do all the hard work */
2150         mod = load_module(umod, len, uargs);
2151         if (IS_ERR(mod)) {
2152                 mutex_unlock(&module_mutex);
2153                 return PTR_ERR(mod);
2154         }
2155
2156         /* Drop lock so they can recurse */
2157         mutex_unlock(&module_mutex);
2158
2159         blocking_notifier_call_chain(&module_notify_list,
2160                         MODULE_STATE_COMING, mod);
2161
2162         /* Start the module */
2163         if (mod->init != NULL)
2164                 ret = mod->init();
2165         if (ret < 0) {
2166                 /* Init routine failed: abort.  Try to protect us from
2167                    buggy refcounters. */
2168                 mod->state = MODULE_STATE_GOING;
2169                 synchronize_sched();
2170                 module_put(mod);
2171                 mutex_lock(&module_mutex);
2172                 free_module(mod);
2173                 mutex_unlock(&module_mutex);
2174                 wake_up(&module_wq);
2175                 return ret;
2176         }
2177
2178         /* Now it's a first class citizen! */
2179         mutex_lock(&module_mutex);
2180         mod->state = MODULE_STATE_LIVE;
2181         /* Drop initial reference. */
2182         module_put(mod);
2183         unwind_remove_table(mod->unwind_info, 1);
2184         module_free(mod, mod->module_init);
2185         mod->module_init = NULL;
2186         mod->init_size = 0;
2187         mod->init_text_size = 0;
2188         mutex_unlock(&module_mutex);
2189         wake_up(&module_wq);
2190
2191         return 0;
2192 }
2193
2194 static inline int within(unsigned long addr, void *start, unsigned long size)
2195 {
2196         return ((void *)addr >= start && (void *)addr < start + size);
2197 }
2198
2199 #ifdef CONFIG_KALLSYMS
2200 /*
2201  * This ignores the intensely annoying "mapping symbols" found
2202  * in ARM ELF files: $a, $t and $d.
2203  */
2204 static inline int is_arm_mapping_symbol(const char *str)
2205 {
2206         return str[0] == '$' && strchr("atd", str[1])
2207                && (str[2] == '\0' || str[2] == '.');
2208 }
2209
2210 static const char *get_ksymbol(struct module *mod,
2211                                unsigned long addr,
2212                                unsigned long *size,
2213                                unsigned long *offset)
2214 {
2215         unsigned int i, best = 0;
2216         unsigned long nextval;
2217
2218         /* At worse, next value is at end of module */
2219         if (within(addr, mod->module_init, mod->init_size))
2220                 nextval = (unsigned long)mod->module_init+mod->init_text_size;
2221         else
2222                 nextval = (unsigned long)mod->module_core+mod->core_text_size;
2223
2224         /* Scan for closest preceeding symbol, and next symbol. (ELF
2225            starts real symbols at 1). */
2226         for (i = 1; i < mod->num_symtab; i++) {
2227                 if (mod->symtab[i].st_shndx == SHN_UNDEF)
2228                         continue;
2229
2230                 /* We ignore unnamed symbols: they're uninformative
2231                  * and inserted at a whim. */
2232                 if (mod->symtab[i].st_value <= addr
2233                     && mod->symtab[i].st_value > mod->symtab[best].st_value
2234                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2235                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2236                         best = i;
2237                 if (mod->symtab[i].st_value > addr
2238                     && mod->symtab[i].st_value < nextval
2239                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2240                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2241                         nextval = mod->symtab[i].st_value;
2242         }
2243
2244         if (!best)
2245                 return NULL;
2246
2247         if (size)
2248                 *size = nextval - mod->symtab[best].st_value;
2249         if (offset)
2250                 *offset = addr - mod->symtab[best].st_value;
2251         return mod->strtab + mod->symtab[best].st_name;
2252 }
2253
2254 /* For kallsyms to ask for address resolution.  NULL means not found.  Careful
2255  * not to lock to avoid deadlock on oopses, simply disable preemption. */
2256 const char *module_address_lookup(unsigned long addr,
2257                             unsigned long *size,
2258                             unsigned long *offset,
2259                             char **modname,
2260                             char *namebuf)
2261 {
2262         struct module *mod;
2263         const char *ret = NULL;
2264
2265         preempt_disable();
2266         list_for_each_entry(mod, &modules, list) {
2267                 if (within(addr, mod->module_init, mod->init_size)
2268                     || within(addr, mod->module_core, mod->core_size)) {
2269                         if (modname)
2270                                 *modname = mod->name;
2271                         ret = get_ksymbol(mod, addr, size, offset);
2272                         break;
2273                 }
2274         }
2275         /* Make a copy in here where it's safe */
2276         if (ret) {
2277                 strncpy(namebuf, ret, KSYM_NAME_LEN - 1);
2278                 ret = namebuf;
2279         }
2280         preempt_enable();
2281         return ret;
2282 }
2283
2284 int lookup_module_symbol_name(unsigned long addr, char *symname)
2285 {
2286         struct module *mod;
2287
2288         preempt_disable();
2289         list_for_each_entry(mod, &modules, list) {
2290                 if (within(addr, mod->module_init, mod->init_size) ||
2291                     within(addr, mod->module_core, mod->core_size)) {
2292                         const char *sym;
2293
2294                         sym = get_ksymbol(mod, addr, NULL, NULL);
2295                         if (!sym)
2296                                 goto out;
2297                         strlcpy(symname, sym, KSYM_NAME_LEN);
2298                         preempt_enable();
2299                         return 0;
2300                 }
2301         }
2302 out:
2303         preempt_enable();
2304         return -ERANGE;
2305 }
2306
2307 int lookup_module_symbol_attrs(unsigned long addr, unsigned long *size,
2308                         unsigned long *offset, char *modname, char *name)
2309 {
2310         struct module *mod;
2311
2312         preempt_disable();
2313         list_for_each_entry(mod, &modules, list) {
2314                 if (within(addr, mod->module_init, mod->init_size) ||
2315                     within(addr, mod->module_core, mod->core_size)) {
2316                         const char *sym;
2317
2318                         sym = get_ksymbol(mod, addr, size, offset);
2319                         if (!sym)
2320                                 goto out;
2321                         if (modname)
2322                                 strlcpy(modname, mod->name, MODULE_NAME_LEN);
2323                         if (name)
2324                                 strlcpy(name, sym, KSYM_NAME_LEN);
2325                         preempt_enable();
2326                         return 0;
2327                 }
2328         }
2329 out:
2330         preempt_enable();
2331         return -ERANGE;
2332 }
2333
2334 int module_get_kallsym(unsigned int symnum, unsigned long *value, char *type,
2335                         char *name, char *module_name, int *exported)
2336 {
2337         struct module *mod;
2338
2339         preempt_disable();
2340         list_for_each_entry(mod, &modules, list) {
2341                 if (symnum < mod->num_symtab) {
2342                         *value = mod->symtab[symnum].st_value;
2343                         *type = mod->symtab[symnum].st_info;
2344                         strlcpy(name, mod->strtab + mod->symtab[symnum].st_name,
2345                                 KSYM_NAME_LEN);
2346                         strlcpy(module_name, mod->name, MODULE_NAME_LEN);
2347                         *exported = is_exported(name, mod);
2348                         preempt_enable();
2349                         return 0;
2350                 }
2351                 symnum -= mod->num_symtab;
2352         }
2353         preempt_enable();
2354         return -ERANGE;
2355 }
2356
2357 static unsigned long mod_find_symname(struct module *mod, const char *name)
2358 {
2359         unsigned int i;
2360
2361         for (i = 0; i < mod->num_symtab; i++)
2362                 if (strcmp(name, mod->strtab+mod->symtab[i].st_name) == 0 &&
2363                     mod->symtab[i].st_info != 'U')
2364                         return mod->symtab[i].st_value;
2365         return 0;
2366 }
2367
2368 /* Look for this name: can be of form module:name. */
2369 unsigned long module_kallsyms_lookup_name(const char *name)
2370 {
2371         struct module *mod;
2372         char *colon;
2373         unsigned long ret = 0;
2374
2375         /* Don't lock: we're in enough trouble already. */
2376         preempt_disable();
2377         if ((colon = strchr(name, ':')) != NULL) {
2378                 *colon = '\0';
2379                 if ((mod = find_module(name)) != NULL)
2380                         ret = mod_find_symname(mod, colon+1);
2381                 *colon = ':';
2382         } else {
2383                 list_for_each_entry(mod, &modules, list)
2384                         if ((ret = mod_find_symname(mod, name)) != 0)
2385                                 break;
2386         }
2387         preempt_enable();
2388         return ret;
2389 }
2390 #endif /* CONFIG_KALLSYMS */
2391
2392 /* Called by the /proc file system to return a list of modules. */
2393 static void *m_start(struct seq_file *m, loff_t *pos)
2394 {
2395         mutex_lock(&module_mutex);
2396         return seq_list_start(&modules, *pos);
2397 }
2398
2399 static void *m_next(struct seq_file *m, void *p, loff_t *pos)
2400 {
2401         return seq_list_next(p, &modules, pos);
2402 }
2403
2404 static void m_stop(struct seq_file *m, void *p)
2405 {
2406         mutex_unlock(&module_mutex);
2407 }
2408
2409 static char *module_flags(struct module *mod, char *buf)
2410 {
2411         int bx = 0;
2412
2413         if (mod->taints ||
2414             mod->state == MODULE_STATE_GOING ||
2415             mod->state == MODULE_STATE_COMING) {
2416                 buf[bx++] = '(';
2417                 if (mod->taints & TAINT_PROPRIETARY_MODULE)
2418                         buf[bx++] = 'P';
2419                 if (mod->taints & TAINT_FORCED_MODULE)
2420                         buf[bx++] = 'F';
2421                 /*
2422                  * TAINT_FORCED_RMMOD: could be added.
2423                  * TAINT_UNSAFE_SMP, TAINT_MACHINE_CHECK, TAINT_BAD_PAGE don't
2424                  * apply to modules.
2425                  */
2426
2427                 /* Show a - for module-is-being-unloaded */
2428                 if (mod->state == MODULE_STATE_GOING)
2429                         buf[bx++] = '-';
2430                 /* Show a + for module-is-being-loaded */
2431                 if (mod->state == MODULE_STATE_COMING)
2432                         buf[bx++] = '+';
2433                 buf[bx++] = ')';
2434         }
2435         buf[bx] = '\0';
2436
2437         return buf;
2438 }
2439
2440 static int m_show(struct seq_file *m, void *p)
2441 {
2442         struct module *mod = list_entry(p, struct module, list);
2443         char buf[8];
2444
2445         seq_printf(m, "%s %lu",
2446                    mod->name, mod->init_size + mod->core_size);
2447         print_unload_info(m, mod);
2448
2449         /* Informative for users. */
2450         seq_printf(m, " %s",
2451                    mod->state == MODULE_STATE_GOING ? "Unloading":
2452                    mod->state == MODULE_STATE_COMING ? "Loading":
2453                    "Live");
2454         /* Used by oprofile and other similar tools. */
2455         seq_printf(m, " 0x%p", mod->module_core);
2456
2457         /* Taints info */
2458         if (mod->taints)
2459                 seq_printf(m, " %s", module_flags(mod, buf));
2460
2461         seq_printf(m, "\n");
2462         return 0;
2463 }
2464
2465 /* Format: modulename size refcount deps address
2466
2467    Where refcount is a number or -, and deps is a comma-separated list
2468    of depends or -.
2469 */
2470 const struct seq_operations modules_op = {
2471         .start  = m_start,
2472         .next   = m_next,
2473         .stop   = m_stop,
2474         .show   = m_show
2475 };
2476
2477 /* Given an address, look for it in the module exception tables. */
2478 const struct exception_table_entry *search_module_extables(unsigned long addr)
2479 {
2480         const struct exception_table_entry *e = NULL;
2481         struct module *mod;
2482
2483         preempt_disable();
2484         list_for_each_entry(mod, &modules, list) {
2485                 if (mod->num_exentries == 0)
2486                         continue;
2487
2488                 e = search_extable(mod->extable,
2489                                    mod->extable + mod->num_exentries - 1,
2490                                    addr);
2491                 if (e)
2492                         break;
2493         }
2494         preempt_enable();
2495
2496         /* Now, if we found one, we are running inside it now, hence
2497            we cannot unload the module, hence no refcnt needed. */
2498         return e;
2499 }
2500
2501 /*
2502  * Is this a valid module address?
2503  */
2504 int is_module_address(unsigned long addr)
2505 {
2506         struct module *mod;
2507
2508         preempt_disable();
2509
2510         list_for_each_entry(mod, &modules, list) {
2511                 if (within(addr, mod->module_core, mod->core_size)) {
2512                         preempt_enable();
2513                         return 1;
2514                 }
2515         }
2516
2517         preempt_enable();
2518
2519         return 0;
2520 }
2521
2522
2523 /* Is this a valid kernel address? */
2524 struct module *__module_text_address(unsigned long addr)
2525 {
2526         struct module *mod;
2527
2528         list_for_each_entry(mod, &modules, list)
2529                 if (within(addr, mod->module_init, mod->init_text_size)
2530                     || within(addr, mod->module_core, mod->core_text_size))
2531                         return mod;
2532         return NULL;
2533 }
2534
2535 struct module *module_text_address(unsigned long addr)
2536 {
2537         struct module *mod;
2538
2539         preempt_disable();
2540         mod = __module_text_address(addr);
2541         preempt_enable();
2542
2543         return mod;
2544 }
2545
2546 /* Don't grab lock, we're oopsing. */
2547 void print_modules(void)
2548 {
2549         struct module *mod;
2550         char buf[8];
2551
2552         printk("Modules linked in:");
2553         list_for_each_entry(mod, &modules, list)
2554                 printk(" %s%s", mod->name, module_flags(mod, buf));
2555         if (last_unloaded_module[0])
2556                 printk(" [last unloaded: %s]", last_unloaded_module);
2557         printk("\n");
2558 }
2559
2560 #ifdef CONFIG_MODVERSIONS
2561 /* Generate the signature for struct module here, too, for modversions. */
2562 void struct_module(struct module *mod) { return; }
2563 EXPORT_SYMBOL(struct_module);
2564 #endif
2565
2566 #ifdef CONFIG_MARKERS
2567 void module_update_markers(struct module *probe_module, int *refcount)
2568 {
2569         struct module *mod;
2570
2571         mutex_lock(&module_mutex);
2572         list_for_each_entry(mod, &modules, list)
2573                 if (!mod->taints)
2574                         marker_update_probe_range(mod->markers,
2575                                 mod->markers + mod->num_markers,
2576                                 probe_module, refcount);
2577         mutex_unlock(&module_mutex);
2578 }
2579 #endif