net_cls_act: act_simple dont ignore realloc code
[linux-2.6] / kernel / module.c
1 /*
2    Copyright (C) 2002 Richard Henderson
3    Copyright (C) 2001 Rusty Russell, 2002 Rusty Russell IBM.
4
5     This program is free software; you can redistribute it and/or modify
6     it under the terms of the GNU General Public License as published by
7     the Free Software Foundation; either version 2 of the License, or
8     (at your option) any later version.
9
10     This program is distributed in the hope that it will be useful,
11     but WITHOUT ANY WARRANTY; without even the implied warranty of
12     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13     GNU General Public License for more details.
14
15     You should have received a copy of the GNU General Public License
16     along with this program; if not, write to the Free Software
17     Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18 */
19 #include <linux/module.h>
20 #include <linux/moduleloader.h>
21 #include <linux/init.h>
22 #include <linux/kallsyms.h>
23 #include <linux/sysfs.h>
24 #include <linux/kernel.h>
25 #include <linux/slab.h>
26 #include <linux/vmalloc.h>
27 #include <linux/elf.h>
28 #include <linux/seq_file.h>
29 #include <linux/syscalls.h>
30 #include <linux/fcntl.h>
31 #include <linux/rcupdate.h>
32 #include <linux/capability.h>
33 #include <linux/cpu.h>
34 #include <linux/moduleparam.h>
35 #include <linux/errno.h>
36 #include <linux/err.h>
37 #include <linux/vermagic.h>
38 #include <linux/notifier.h>
39 #include <linux/sched.h>
40 #include <linux/stop_machine.h>
41 #include <linux/device.h>
42 #include <linux/string.h>
43 #include <linux/mutex.h>
44 #include <linux/unwind.h>
45 #include <asm/uaccess.h>
46 #include <asm/cacheflush.h>
47 #include <linux/license.h>
48 #include <asm/sections.h>
49
50 #if 0
51 #define DEBUGP printk
52 #else
53 #define DEBUGP(fmt , a...)
54 #endif
55
56 #ifndef ARCH_SHF_SMALL
57 #define ARCH_SHF_SMALL 0
58 #endif
59
60 /* If this is set, the section belongs in the init part of the module */
61 #define INIT_OFFSET_MASK (1UL << (BITS_PER_LONG-1))
62
63 /* List of modules, protected by module_mutex or preempt_disable
64  * (add/delete uses stop_machine). */
65 static DEFINE_MUTEX(module_mutex);
66 static LIST_HEAD(modules);
67
68 /* Waiting for a module to finish initializing? */
69 static DECLARE_WAIT_QUEUE_HEAD(module_wq);
70
71 static BLOCKING_NOTIFIER_HEAD(module_notify_list);
72
73 int register_module_notifier(struct notifier_block * nb)
74 {
75         return blocking_notifier_chain_register(&module_notify_list, nb);
76 }
77 EXPORT_SYMBOL(register_module_notifier);
78
79 int unregister_module_notifier(struct notifier_block * nb)
80 {
81         return blocking_notifier_chain_unregister(&module_notify_list, nb);
82 }
83 EXPORT_SYMBOL(unregister_module_notifier);
84
85 /* We require a truly strong try_module_get(): 0 means failure due to
86    ongoing or failed initialization etc. */
87 static inline int strong_try_module_get(struct module *mod)
88 {
89         if (mod && mod->state == MODULE_STATE_COMING)
90                 return -EBUSY;
91         if (try_module_get(mod))
92                 return 0;
93         else
94                 return -ENOENT;
95 }
96
97 static inline void add_taint_module(struct module *mod, unsigned flag)
98 {
99         add_taint(flag);
100         mod->taints |= flag;
101 }
102
103 /*
104  * A thread that wants to hold a reference to a module only while it
105  * is running can call this to safely exit.  nfsd and lockd use this.
106  */
107 void __module_put_and_exit(struct module *mod, long code)
108 {
109         module_put(mod);
110         do_exit(code);
111 }
112 EXPORT_SYMBOL(__module_put_and_exit);
113
114 /* Find a module section: 0 means not found. */
115 static unsigned int find_sec(Elf_Ehdr *hdr,
116                              Elf_Shdr *sechdrs,
117                              const char *secstrings,
118                              const char *name)
119 {
120         unsigned int i;
121
122         for (i = 1; i < hdr->e_shnum; i++)
123                 /* Alloc bit cleared means "ignore it." */
124                 if ((sechdrs[i].sh_flags & SHF_ALLOC)
125                     && strcmp(secstrings+sechdrs[i].sh_name, name) == 0)
126                         return i;
127         return 0;
128 }
129
130 /* Provided by the linker */
131 extern const struct kernel_symbol __start___ksymtab[];
132 extern const struct kernel_symbol __stop___ksymtab[];
133 extern const struct kernel_symbol __start___ksymtab_gpl[];
134 extern const struct kernel_symbol __stop___ksymtab_gpl[];
135 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
136 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
137 extern const struct kernel_symbol __start___ksymtab_unused[];
138 extern const struct kernel_symbol __stop___ksymtab_unused[];
139 extern const struct kernel_symbol __start___ksymtab_unused_gpl[];
140 extern const struct kernel_symbol __stop___ksymtab_unused_gpl[];
141 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
142 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
143 extern const unsigned long __start___kcrctab[];
144 extern const unsigned long __start___kcrctab_gpl[];
145 extern const unsigned long __start___kcrctab_gpl_future[];
146 extern const unsigned long __start___kcrctab_unused[];
147 extern const unsigned long __start___kcrctab_unused_gpl[];
148
149 #ifndef CONFIG_MODVERSIONS
150 #define symversion(base, idx) NULL
151 #else
152 #define symversion(base, idx) ((base != NULL) ? ((base) + (idx)) : NULL)
153 #endif
154
155 /* lookup symbol in given range of kernel_symbols */
156 static const struct kernel_symbol *lookup_symbol(const char *name,
157         const struct kernel_symbol *start,
158         const struct kernel_symbol *stop)
159 {
160         const struct kernel_symbol *ks = start;
161         for (; ks < stop; ks++)
162                 if (strcmp(ks->name, name) == 0)
163                         return ks;
164         return NULL;
165 }
166
167 static void printk_unused_warning(const char *name)
168 {
169         printk(KERN_WARNING "Symbol %s is marked as UNUSED, "
170                 "however this module is using it.\n", name);
171         printk(KERN_WARNING "This symbol will go away in the future.\n");
172         printk(KERN_WARNING "Please evalute if this is the right api to use, "
173                 "and if it really is, submit a report the linux kernel "
174                 "mailinglist together with submitting your code for "
175                 "inclusion.\n");
176 }
177
178 /* Find a symbol, return value, crc and module which owns it */
179 static unsigned long __find_symbol(const char *name,
180                                    struct module **owner,
181                                    const unsigned long **crc,
182                                    int gplok)
183 {
184         struct module *mod;
185         const struct kernel_symbol *ks;
186
187         /* Core kernel first. */
188         *owner = NULL;
189         ks = lookup_symbol(name, __start___ksymtab, __stop___ksymtab);
190         if (ks) {
191                 *crc = symversion(__start___kcrctab, (ks - __start___ksymtab));
192                 return ks->value;
193         }
194         if (gplok) {
195                 ks = lookup_symbol(name, __start___ksymtab_gpl,
196                                          __stop___ksymtab_gpl);
197                 if (ks) {
198                         *crc = symversion(__start___kcrctab_gpl,
199                                           (ks - __start___ksymtab_gpl));
200                         return ks->value;
201                 }
202         }
203         ks = lookup_symbol(name, __start___ksymtab_gpl_future,
204                                  __stop___ksymtab_gpl_future);
205         if (ks) {
206                 if (!gplok) {
207                         printk(KERN_WARNING "Symbol %s is being used "
208                                "by a non-GPL module, which will not "
209                                "be allowed in the future\n", name);
210                         printk(KERN_WARNING "Please see the file "
211                                "Documentation/feature-removal-schedule.txt "
212                                "in the kernel source tree for more "
213                                "details.\n");
214                 }
215                 *crc = symversion(__start___kcrctab_gpl_future,
216                                   (ks - __start___ksymtab_gpl_future));
217                 return ks->value;
218         }
219
220         ks = lookup_symbol(name, __start___ksymtab_unused,
221                                  __stop___ksymtab_unused);
222         if (ks) {
223                 printk_unused_warning(name);
224                 *crc = symversion(__start___kcrctab_unused,
225                                   (ks - __start___ksymtab_unused));
226                 return ks->value;
227         }
228
229         if (gplok)
230                 ks = lookup_symbol(name, __start___ksymtab_unused_gpl,
231                                  __stop___ksymtab_unused_gpl);
232         if (ks) {
233                 printk_unused_warning(name);
234                 *crc = symversion(__start___kcrctab_unused_gpl,
235                                   (ks - __start___ksymtab_unused_gpl));
236                 return ks->value;
237         }
238
239         /* Now try modules. */
240         list_for_each_entry(mod, &modules, list) {
241                 *owner = mod;
242                 ks = lookup_symbol(name, mod->syms, mod->syms + mod->num_syms);
243                 if (ks) {
244                         *crc = symversion(mod->crcs, (ks - mod->syms));
245                         return ks->value;
246                 }
247
248                 if (gplok) {
249                         ks = lookup_symbol(name, mod->gpl_syms,
250                                            mod->gpl_syms + mod->num_gpl_syms);
251                         if (ks) {
252                                 *crc = symversion(mod->gpl_crcs,
253                                                   (ks - mod->gpl_syms));
254                                 return ks->value;
255                         }
256                 }
257                 ks = lookup_symbol(name, mod->unused_syms, mod->unused_syms + mod->num_unused_syms);
258                 if (ks) {
259                         printk_unused_warning(name);
260                         *crc = symversion(mod->unused_crcs, (ks - mod->unused_syms));
261                         return ks->value;
262                 }
263
264                 if (gplok) {
265                         ks = lookup_symbol(name, mod->unused_gpl_syms,
266                                            mod->unused_gpl_syms + mod->num_unused_gpl_syms);
267                         if (ks) {
268                                 printk_unused_warning(name);
269                                 *crc = symversion(mod->unused_gpl_crcs,
270                                                   (ks - mod->unused_gpl_syms));
271                                 return ks->value;
272                         }
273                 }
274                 ks = lookup_symbol(name, mod->gpl_future_syms,
275                                    (mod->gpl_future_syms +
276                                     mod->num_gpl_future_syms));
277                 if (ks) {
278                         if (!gplok) {
279                                 printk(KERN_WARNING "Symbol %s is being used "
280                                        "by a non-GPL module, which will not "
281                                        "be allowed in the future\n", name);
282                                 printk(KERN_WARNING "Please see the file "
283                                        "Documentation/feature-removal-schedule.txt "
284                                        "in the kernel source tree for more "
285                                        "details.\n");
286                         }
287                         *crc = symversion(mod->gpl_future_crcs,
288                                           (ks - mod->gpl_future_syms));
289                         return ks->value;
290                 }
291         }
292         DEBUGP("Failed to find symbol %s\n", name);
293         return -ENOENT;
294 }
295
296 /* Search for module by name: must hold module_mutex. */
297 static struct module *find_module(const char *name)
298 {
299         struct module *mod;
300
301         list_for_each_entry(mod, &modules, list) {
302                 if (strcmp(mod->name, name) == 0)
303                         return mod;
304         }
305         return NULL;
306 }
307
308 #ifdef CONFIG_SMP
309 /* Number of blocks used and allocated. */
310 static unsigned int pcpu_num_used, pcpu_num_allocated;
311 /* Size of each block.  -ve means used. */
312 static int *pcpu_size;
313
314 static int split_block(unsigned int i, unsigned short size)
315 {
316         /* Reallocation required? */
317         if (pcpu_num_used + 1 > pcpu_num_allocated) {
318                 int *new;
319
320                 new = krealloc(pcpu_size, sizeof(new[0])*pcpu_num_allocated*2,
321                                GFP_KERNEL);
322                 if (!new)
323                         return 0;
324
325                 pcpu_num_allocated *= 2;
326                 pcpu_size = new;
327         }
328
329         /* Insert a new subblock */
330         memmove(&pcpu_size[i+1], &pcpu_size[i],
331                 sizeof(pcpu_size[0]) * (pcpu_num_used - i));
332         pcpu_num_used++;
333
334         pcpu_size[i+1] -= size;
335         pcpu_size[i] = size;
336         return 1;
337 }
338
339 static inline unsigned int block_size(int val)
340 {
341         if (val < 0)
342                 return -val;
343         return val;
344 }
345
346 static void *percpu_modalloc(unsigned long size, unsigned long align,
347                              const char *name)
348 {
349         unsigned long extra;
350         unsigned int i;
351         void *ptr;
352
353         if (align > PAGE_SIZE) {
354                 printk(KERN_WARNING "%s: per-cpu alignment %li > %li\n",
355                        name, align, PAGE_SIZE);
356                 align = PAGE_SIZE;
357         }
358
359         ptr = __per_cpu_start;
360         for (i = 0; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
361                 /* Extra for alignment requirement. */
362                 extra = ALIGN((unsigned long)ptr, align) - (unsigned long)ptr;
363                 BUG_ON(i == 0 && extra != 0);
364
365                 if (pcpu_size[i] < 0 || pcpu_size[i] < extra + size)
366                         continue;
367
368                 /* Transfer extra to previous block. */
369                 if (pcpu_size[i-1] < 0)
370                         pcpu_size[i-1] -= extra;
371                 else
372                         pcpu_size[i-1] += extra;
373                 pcpu_size[i] -= extra;
374                 ptr += extra;
375
376                 /* Split block if warranted */
377                 if (pcpu_size[i] - size > sizeof(unsigned long))
378                         if (!split_block(i, size))
379                                 return NULL;
380
381                 /* Mark allocated */
382                 pcpu_size[i] = -pcpu_size[i];
383                 return ptr;
384         }
385
386         printk(KERN_WARNING "Could not allocate %lu bytes percpu data\n",
387                size);
388         return NULL;
389 }
390
391 static void percpu_modfree(void *freeme)
392 {
393         unsigned int i;
394         void *ptr = __per_cpu_start + block_size(pcpu_size[0]);
395
396         /* First entry is core kernel percpu data. */
397         for (i = 1; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
398                 if (ptr == freeme) {
399                         pcpu_size[i] = -pcpu_size[i];
400                         goto free;
401                 }
402         }
403         BUG();
404
405  free:
406         /* Merge with previous? */
407         if (pcpu_size[i-1] >= 0) {
408                 pcpu_size[i-1] += pcpu_size[i];
409                 pcpu_num_used--;
410                 memmove(&pcpu_size[i], &pcpu_size[i+1],
411                         (pcpu_num_used - i) * sizeof(pcpu_size[0]));
412                 i--;
413         }
414         /* Merge with next? */
415         if (i+1 < pcpu_num_used && pcpu_size[i+1] >= 0) {
416                 pcpu_size[i] += pcpu_size[i+1];
417                 pcpu_num_used--;
418                 memmove(&pcpu_size[i+1], &pcpu_size[i+2],
419                         (pcpu_num_used - (i+1)) * sizeof(pcpu_size[0]));
420         }
421 }
422
423 static unsigned int find_pcpusec(Elf_Ehdr *hdr,
424                                  Elf_Shdr *sechdrs,
425                                  const char *secstrings)
426 {
427         return find_sec(hdr, sechdrs, secstrings, ".data.percpu");
428 }
429
430 static void percpu_modcopy(void *pcpudest, const void *from, unsigned long size)
431 {
432         int cpu;
433
434         for_each_possible_cpu(cpu)
435                 memcpy(pcpudest + per_cpu_offset(cpu), from, size);
436 }
437
438 static int percpu_modinit(void)
439 {
440         pcpu_num_used = 2;
441         pcpu_num_allocated = 2;
442         pcpu_size = kmalloc(sizeof(pcpu_size[0]) * pcpu_num_allocated,
443                             GFP_KERNEL);
444         /* Static in-kernel percpu data (used). */
445         pcpu_size[0] = -(__per_cpu_end-__per_cpu_start);
446         /* Free room. */
447         pcpu_size[1] = PERCPU_ENOUGH_ROOM + pcpu_size[0];
448         if (pcpu_size[1] < 0) {
449                 printk(KERN_ERR "No per-cpu room for modules.\n");
450                 pcpu_num_used = 1;
451         }
452
453         return 0;
454 }
455 __initcall(percpu_modinit);
456 #else /* ... !CONFIG_SMP */
457 static inline void *percpu_modalloc(unsigned long size, unsigned long align,
458                                     const char *name)
459 {
460         return NULL;
461 }
462 static inline void percpu_modfree(void *pcpuptr)
463 {
464         BUG();
465 }
466 static inline unsigned int find_pcpusec(Elf_Ehdr *hdr,
467                                         Elf_Shdr *sechdrs,
468                                         const char *secstrings)
469 {
470         return 0;
471 }
472 static inline void percpu_modcopy(void *pcpudst, const void *src,
473                                   unsigned long size)
474 {
475         /* pcpusec should be 0, and size of that section should be 0. */
476         BUG_ON(size != 0);
477 }
478 #endif /* CONFIG_SMP */
479
480 #define MODINFO_ATTR(field)     \
481 static void setup_modinfo_##field(struct module *mod, const char *s)  \
482 {                                                                     \
483         mod->field = kstrdup(s, GFP_KERNEL);                          \
484 }                                                                     \
485 static ssize_t show_modinfo_##field(struct module_attribute *mattr,   \
486                         struct module *mod, char *buffer)             \
487 {                                                                     \
488         return sprintf(buffer, "%s\n", mod->field);                   \
489 }                                                                     \
490 static int modinfo_##field##_exists(struct module *mod)               \
491 {                                                                     \
492         return mod->field != NULL;                                    \
493 }                                                                     \
494 static void free_modinfo_##field(struct module *mod)                  \
495 {                                                                     \
496         kfree(mod->field);                                            \
497         mod->field = NULL;                                            \
498 }                                                                     \
499 static struct module_attribute modinfo_##field = {                    \
500         .attr = { .name = __stringify(field), .mode = 0444 },         \
501         .show = show_modinfo_##field,                                 \
502         .setup = setup_modinfo_##field,                               \
503         .test = modinfo_##field##_exists,                             \
504         .free = free_modinfo_##field,                                 \
505 };
506
507 MODINFO_ATTR(version);
508 MODINFO_ATTR(srcversion);
509
510 static char last_unloaded_module[MODULE_NAME_LEN+1];
511
512 #ifdef CONFIG_MODULE_UNLOAD
513 /* Init the unload section of the module. */
514 static void module_unload_init(struct module *mod)
515 {
516         unsigned int i;
517
518         INIT_LIST_HEAD(&mod->modules_which_use_me);
519         for (i = 0; i < NR_CPUS; i++)
520                 local_set(&mod->ref[i].count, 0);
521         /* Hold reference count during initialization. */
522         local_set(&mod->ref[raw_smp_processor_id()].count, 1);
523         /* Backwards compatibility macros put refcount during init. */
524         mod->waiter = current;
525 }
526
527 /* modules using other modules */
528 struct module_use
529 {
530         struct list_head list;
531         struct module *module_which_uses;
532 };
533
534 /* Does a already use b? */
535 static int already_uses(struct module *a, struct module *b)
536 {
537         struct module_use *use;
538
539         list_for_each_entry(use, &b->modules_which_use_me, list) {
540                 if (use->module_which_uses == a) {
541                         DEBUGP("%s uses %s!\n", a->name, b->name);
542                         return 1;
543                 }
544         }
545         DEBUGP("%s does not use %s!\n", a->name, b->name);
546         return 0;
547 }
548
549 /* Module a uses b */
550 static int use_module(struct module *a, struct module *b)
551 {
552         struct module_use *use;
553         int no_warn, err;
554
555         if (b == NULL || already_uses(a, b)) return 1;
556
557         /* If we're interrupted or time out, we fail. */
558         if (wait_event_interruptible_timeout(
559                     module_wq, (err = strong_try_module_get(b)) != -EBUSY,
560                     30 * HZ) <= 0) {
561                 printk("%s: gave up waiting for init of module %s.\n",
562                        a->name, b->name);
563                 return 0;
564         }
565
566         /* If strong_try_module_get() returned a different error, we fail. */
567         if (err)
568                 return 0;
569
570         DEBUGP("Allocating new usage for %s.\n", a->name);
571         use = kmalloc(sizeof(*use), GFP_ATOMIC);
572         if (!use) {
573                 printk("%s: out of memory loading\n", a->name);
574                 module_put(b);
575                 return 0;
576         }
577
578         use->module_which_uses = a;
579         list_add(&use->list, &b->modules_which_use_me);
580         no_warn = sysfs_create_link(b->holders_dir, &a->mkobj.kobj, a->name);
581         return 1;
582 }
583
584 /* Clear the unload stuff of the module. */
585 static void module_unload_free(struct module *mod)
586 {
587         struct module *i;
588
589         list_for_each_entry(i, &modules, list) {
590                 struct module_use *use;
591
592                 list_for_each_entry(use, &i->modules_which_use_me, list) {
593                         if (use->module_which_uses == mod) {
594                                 DEBUGP("%s unusing %s\n", mod->name, i->name);
595                                 module_put(i);
596                                 list_del(&use->list);
597                                 kfree(use);
598                                 sysfs_remove_link(i->holders_dir, mod->name);
599                                 /* There can be at most one match. */
600                                 break;
601                         }
602                 }
603         }
604 }
605
606 #ifdef CONFIG_MODULE_FORCE_UNLOAD
607 static inline int try_force_unload(unsigned int flags)
608 {
609         int ret = (flags & O_TRUNC);
610         if (ret)
611                 add_taint(TAINT_FORCED_RMMOD);
612         return ret;
613 }
614 #else
615 static inline int try_force_unload(unsigned int flags)
616 {
617         return 0;
618 }
619 #endif /* CONFIG_MODULE_FORCE_UNLOAD */
620
621 struct stopref
622 {
623         struct module *mod;
624         int flags;
625         int *forced;
626 };
627
628 /* Whole machine is stopped with interrupts off when this runs. */
629 static int __try_stop_module(void *_sref)
630 {
631         struct stopref *sref = _sref;
632
633         /* If it's not unused, quit unless we are told to block. */
634         if ((sref->flags & O_NONBLOCK) && module_refcount(sref->mod) != 0) {
635                 if (!(*sref->forced = try_force_unload(sref->flags)))
636                         return -EWOULDBLOCK;
637         }
638
639         /* Mark it as dying. */
640         sref->mod->state = MODULE_STATE_GOING;
641         return 0;
642 }
643
644 static int try_stop_module(struct module *mod, int flags, int *forced)
645 {
646         struct stopref sref = { mod, flags, forced };
647
648         return stop_machine_run(__try_stop_module, &sref, NR_CPUS);
649 }
650
651 unsigned int module_refcount(struct module *mod)
652 {
653         unsigned int i, total = 0;
654
655         for (i = 0; i < NR_CPUS; i++)
656                 total += local_read(&mod->ref[i].count);
657         return total;
658 }
659 EXPORT_SYMBOL(module_refcount);
660
661 /* This exists whether we can unload or not */
662 static void free_module(struct module *mod);
663
664 static void wait_for_zero_refcount(struct module *mod)
665 {
666         /* Since we might sleep for some time, release the mutex first */
667         mutex_unlock(&module_mutex);
668         for (;;) {
669                 DEBUGP("Looking at refcount...\n");
670                 set_current_state(TASK_UNINTERRUPTIBLE);
671                 if (module_refcount(mod) == 0)
672                         break;
673                 schedule();
674         }
675         current->state = TASK_RUNNING;
676         mutex_lock(&module_mutex);
677 }
678
679 asmlinkage long
680 sys_delete_module(const char __user *name_user, unsigned int flags)
681 {
682         struct module *mod;
683         char name[MODULE_NAME_LEN];
684         int ret, forced = 0;
685
686         if (!capable(CAP_SYS_MODULE))
687                 return -EPERM;
688
689         if (strncpy_from_user(name, name_user, MODULE_NAME_LEN-1) < 0)
690                 return -EFAULT;
691         name[MODULE_NAME_LEN-1] = '\0';
692
693         if (mutex_lock_interruptible(&module_mutex) != 0)
694                 return -EINTR;
695
696         mod = find_module(name);
697         if (!mod) {
698                 ret = -ENOENT;
699                 goto out;
700         }
701
702         if (!list_empty(&mod->modules_which_use_me)) {
703                 /* Other modules depend on us: get rid of them first. */
704                 ret = -EWOULDBLOCK;
705                 goto out;
706         }
707
708         /* Doing init or already dying? */
709         if (mod->state != MODULE_STATE_LIVE) {
710                 /* FIXME: if (force), slam module count and wake up
711                    waiter --RR */
712                 DEBUGP("%s already dying\n", mod->name);
713                 ret = -EBUSY;
714                 goto out;
715         }
716
717         /* If it has an init func, it must have an exit func to unload */
718         if (mod->init && !mod->exit) {
719                 forced = try_force_unload(flags);
720                 if (!forced) {
721                         /* This module can't be removed */
722                         ret = -EBUSY;
723                         goto out;
724                 }
725         }
726
727         /* Set this up before setting mod->state */
728         mod->waiter = current;
729
730         /* Stop the machine so refcounts can't move and disable module. */
731         ret = try_stop_module(mod, flags, &forced);
732         if (ret != 0)
733                 goto out;
734
735         /* Never wait if forced. */
736         if (!forced && module_refcount(mod) != 0)
737                 wait_for_zero_refcount(mod);
738
739         /* Final destruction now noone is using it. */
740         if (mod->exit != NULL) {
741                 mutex_unlock(&module_mutex);
742                 mod->exit();
743                 mutex_lock(&module_mutex);
744         }
745         /* Store the name of the last unloaded module for diagnostic purposes */
746         strlcpy(last_unloaded_module, mod->name, sizeof(last_unloaded_module));
747         free_module(mod);
748
749  out:
750         mutex_unlock(&module_mutex);
751         return ret;
752 }
753
754 static void print_unload_info(struct seq_file *m, struct module *mod)
755 {
756         struct module_use *use;
757         int printed_something = 0;
758
759         seq_printf(m, " %u ", module_refcount(mod));
760
761         /* Always include a trailing , so userspace can differentiate
762            between this and the old multi-field proc format. */
763         list_for_each_entry(use, &mod->modules_which_use_me, list) {
764                 printed_something = 1;
765                 seq_printf(m, "%s,", use->module_which_uses->name);
766         }
767
768         if (mod->init != NULL && mod->exit == NULL) {
769                 printed_something = 1;
770                 seq_printf(m, "[permanent],");
771         }
772
773         if (!printed_something)
774                 seq_printf(m, "-");
775 }
776
777 void __symbol_put(const char *symbol)
778 {
779         struct module *owner;
780         const unsigned long *crc;
781
782         preempt_disable();
783         if (IS_ERR_VALUE(__find_symbol(symbol, &owner, &crc, 1)))
784                 BUG();
785         module_put(owner);
786         preempt_enable();
787 }
788 EXPORT_SYMBOL(__symbol_put);
789
790 void symbol_put_addr(void *addr)
791 {
792         struct module *modaddr;
793
794         if (core_kernel_text((unsigned long)addr))
795                 return;
796
797         if (!(modaddr = module_text_address((unsigned long)addr)))
798                 BUG();
799         module_put(modaddr);
800 }
801 EXPORT_SYMBOL_GPL(symbol_put_addr);
802
803 static ssize_t show_refcnt(struct module_attribute *mattr,
804                            struct module *mod, char *buffer)
805 {
806         return sprintf(buffer, "%u\n", module_refcount(mod));
807 }
808
809 static struct module_attribute refcnt = {
810         .attr = { .name = "refcnt", .mode = 0444 },
811         .show = show_refcnt,
812 };
813
814 void module_put(struct module *module)
815 {
816         if (module) {
817                 unsigned int cpu = get_cpu();
818                 local_dec(&module->ref[cpu].count);
819                 /* Maybe they're waiting for us to drop reference? */
820                 if (unlikely(!module_is_live(module)))
821                         wake_up_process(module->waiter);
822                 put_cpu();
823         }
824 }
825 EXPORT_SYMBOL(module_put);
826
827 #else /* !CONFIG_MODULE_UNLOAD */
828 static void print_unload_info(struct seq_file *m, struct module *mod)
829 {
830         /* We don't know the usage count, or what modules are using. */
831         seq_printf(m, " - -");
832 }
833
834 static inline void module_unload_free(struct module *mod)
835 {
836 }
837
838 static inline int use_module(struct module *a, struct module *b)
839 {
840         return strong_try_module_get(b) == 0;
841 }
842
843 static inline void module_unload_init(struct module *mod)
844 {
845 }
846 #endif /* CONFIG_MODULE_UNLOAD */
847
848 static ssize_t show_initstate(struct module_attribute *mattr,
849                            struct module *mod, char *buffer)
850 {
851         const char *state = "unknown";
852
853         switch (mod->state) {
854         case MODULE_STATE_LIVE:
855                 state = "live";
856                 break;
857         case MODULE_STATE_COMING:
858                 state = "coming";
859                 break;
860         case MODULE_STATE_GOING:
861                 state = "going";
862                 break;
863         }
864         return sprintf(buffer, "%s\n", state);
865 }
866
867 static struct module_attribute initstate = {
868         .attr = { .name = "initstate", .mode = 0444 },
869         .show = show_initstate,
870 };
871
872 static struct module_attribute *modinfo_attrs[] = {
873         &modinfo_version,
874         &modinfo_srcversion,
875         &initstate,
876 #ifdef CONFIG_MODULE_UNLOAD
877         &refcnt,
878 #endif
879         NULL,
880 };
881
882 static const char vermagic[] = VERMAGIC_STRING;
883
884 #ifdef CONFIG_MODVERSIONS
885 static int check_version(Elf_Shdr *sechdrs,
886                          unsigned int versindex,
887                          const char *symname,
888                          struct module *mod, 
889                          const unsigned long *crc)
890 {
891         unsigned int i, num_versions;
892         struct modversion_info *versions;
893
894         /* Exporting module didn't supply crcs?  OK, we're already tainted. */
895         if (!crc)
896                 return 1;
897
898         versions = (void *) sechdrs[versindex].sh_addr;
899         num_versions = sechdrs[versindex].sh_size
900                 / sizeof(struct modversion_info);
901
902         for (i = 0; i < num_versions; i++) {
903                 if (strcmp(versions[i].name, symname) != 0)
904                         continue;
905
906                 if (versions[i].crc == *crc)
907                         return 1;
908                 printk("%s: disagrees about version of symbol %s\n",
909                        mod->name, symname);
910                 DEBUGP("Found checksum %lX vs module %lX\n",
911                        *crc, versions[i].crc);
912                 return 0;
913         }
914         /* Not in module's version table.  OK, but that taints the kernel. */
915         if (!(tainted & TAINT_FORCED_MODULE))
916                 printk("%s: no version for \"%s\" found: kernel tainted.\n",
917                        mod->name, symname);
918         add_taint_module(mod, TAINT_FORCED_MODULE);
919         return 1;
920 }
921
922 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
923                                           unsigned int versindex,
924                                           struct module *mod)
925 {
926         const unsigned long *crc;
927         struct module *owner;
928
929         if (IS_ERR_VALUE(__find_symbol("struct_module",
930                                                 &owner, &crc, 1)))
931                 BUG();
932         return check_version(sechdrs, versindex, "struct_module", mod,
933                              crc);
934 }
935
936 /* First part is kernel version, which we ignore. */
937 static inline int same_magic(const char *amagic, const char *bmagic)
938 {
939         amagic += strcspn(amagic, " ");
940         bmagic += strcspn(bmagic, " ");
941         return strcmp(amagic, bmagic) == 0;
942 }
943 #else
944 static inline int check_version(Elf_Shdr *sechdrs,
945                                 unsigned int versindex,
946                                 const char *symname,
947                                 struct module *mod, 
948                                 const unsigned long *crc)
949 {
950         return 1;
951 }
952
953 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
954                                           unsigned int versindex,
955                                           struct module *mod)
956 {
957         return 1;
958 }
959
960 static inline int same_magic(const char *amagic, const char *bmagic)
961 {
962         return strcmp(amagic, bmagic) == 0;
963 }
964 #endif /* CONFIG_MODVERSIONS */
965
966 /* Resolve a symbol for this module.  I.e. if we find one, record usage.
967    Must be holding module_mutex. */
968 static unsigned long resolve_symbol(Elf_Shdr *sechdrs,
969                                     unsigned int versindex,
970                                     const char *name,
971                                     struct module *mod)
972 {
973         struct module *owner;
974         unsigned long ret;
975         const unsigned long *crc;
976
977         ret = __find_symbol(name, &owner, &crc,
978                         !(mod->taints & TAINT_PROPRIETARY_MODULE));
979         if (!IS_ERR_VALUE(ret)) {
980                 /* use_module can fail due to OOM,
981                    or module initialization or unloading */
982                 if (!check_version(sechdrs, versindex, name, mod, crc) ||
983                     !use_module(mod, owner))
984                         ret = -EINVAL;
985         }
986         return ret;
987 }
988
989 /*
990  * /sys/module/foo/sections stuff
991  * J. Corbet <corbet@lwn.net>
992  */
993 #if defined(CONFIG_KALLSYMS) && defined(CONFIG_SYSFS)
994 static ssize_t module_sect_show(struct module_attribute *mattr,
995                                 struct module *mod, char *buf)
996 {
997         struct module_sect_attr *sattr =
998                 container_of(mattr, struct module_sect_attr, mattr);
999         return sprintf(buf, "0x%lx\n", sattr->address);
1000 }
1001
1002 static void free_sect_attrs(struct module_sect_attrs *sect_attrs)
1003 {
1004         int section;
1005
1006         for (section = 0; section < sect_attrs->nsections; section++)
1007                 kfree(sect_attrs->attrs[section].name);
1008         kfree(sect_attrs);
1009 }
1010
1011 static void add_sect_attrs(struct module *mod, unsigned int nsect,
1012                 char *secstrings, Elf_Shdr *sechdrs)
1013 {
1014         unsigned int nloaded = 0, i, size[2];
1015         struct module_sect_attrs *sect_attrs;
1016         struct module_sect_attr *sattr;
1017         struct attribute **gattr;
1018
1019         /* Count loaded sections and allocate structures */
1020         for (i = 0; i < nsect; i++)
1021                 if (sechdrs[i].sh_flags & SHF_ALLOC)
1022                         nloaded++;
1023         size[0] = ALIGN(sizeof(*sect_attrs)
1024                         + nloaded * sizeof(sect_attrs->attrs[0]),
1025                         sizeof(sect_attrs->grp.attrs[0]));
1026         size[1] = (nloaded + 1) * sizeof(sect_attrs->grp.attrs[0]);
1027         sect_attrs = kzalloc(size[0] + size[1], GFP_KERNEL);
1028         if (sect_attrs == NULL)
1029                 return;
1030
1031         /* Setup section attributes. */
1032         sect_attrs->grp.name = "sections";
1033         sect_attrs->grp.attrs = (void *)sect_attrs + size[0];
1034
1035         sect_attrs->nsections = 0;
1036         sattr = &sect_attrs->attrs[0];
1037         gattr = &sect_attrs->grp.attrs[0];
1038         for (i = 0; i < nsect; i++) {
1039                 if (! (sechdrs[i].sh_flags & SHF_ALLOC))
1040                         continue;
1041                 sattr->address = sechdrs[i].sh_addr;
1042                 sattr->name = kstrdup(secstrings + sechdrs[i].sh_name,
1043                                         GFP_KERNEL);
1044                 if (sattr->name == NULL)
1045                         goto out;
1046                 sect_attrs->nsections++;
1047                 sattr->mattr.show = module_sect_show;
1048                 sattr->mattr.store = NULL;
1049                 sattr->mattr.attr.name = sattr->name;
1050                 sattr->mattr.attr.mode = S_IRUGO;
1051                 *(gattr++) = &(sattr++)->mattr.attr;
1052         }
1053         *gattr = NULL;
1054
1055         if (sysfs_create_group(&mod->mkobj.kobj, &sect_attrs->grp))
1056                 goto out;
1057
1058         mod->sect_attrs = sect_attrs;
1059         return;
1060   out:
1061         free_sect_attrs(sect_attrs);
1062 }
1063
1064 static void remove_sect_attrs(struct module *mod)
1065 {
1066         if (mod->sect_attrs) {
1067                 sysfs_remove_group(&mod->mkobj.kobj,
1068                                    &mod->sect_attrs->grp);
1069                 /* We are positive that no one is using any sect attrs
1070                  * at this point.  Deallocate immediately. */
1071                 free_sect_attrs(mod->sect_attrs);
1072                 mod->sect_attrs = NULL;
1073         }
1074 }
1075
1076 /*
1077  * /sys/module/foo/notes/.section.name gives contents of SHT_NOTE sections.
1078  */
1079
1080 struct module_notes_attrs {
1081         struct kobject *dir;
1082         unsigned int notes;
1083         struct bin_attribute attrs[0];
1084 };
1085
1086 static ssize_t module_notes_read(struct kobject *kobj,
1087                                  struct bin_attribute *bin_attr,
1088                                  char *buf, loff_t pos, size_t count)
1089 {
1090         /*
1091          * The caller checked the pos and count against our size.
1092          */
1093         memcpy(buf, bin_attr->private + pos, count);
1094         return count;
1095 }
1096
1097 static void free_notes_attrs(struct module_notes_attrs *notes_attrs,
1098                              unsigned int i)
1099 {
1100         if (notes_attrs->dir) {
1101                 while (i-- > 0)
1102                         sysfs_remove_bin_file(notes_attrs->dir,
1103                                               &notes_attrs->attrs[i]);
1104                 kobject_del(notes_attrs->dir);
1105         }
1106         kfree(notes_attrs);
1107 }
1108
1109 static void add_notes_attrs(struct module *mod, unsigned int nsect,
1110                             char *secstrings, Elf_Shdr *sechdrs)
1111 {
1112         unsigned int notes, loaded, i;
1113         struct module_notes_attrs *notes_attrs;
1114         struct bin_attribute *nattr;
1115
1116         /* Count notes sections and allocate structures.  */
1117         notes = 0;
1118         for (i = 0; i < nsect; i++)
1119                 if ((sechdrs[i].sh_flags & SHF_ALLOC) &&
1120                     (sechdrs[i].sh_type == SHT_NOTE))
1121                         ++notes;
1122
1123         if (notes == 0)
1124                 return;
1125
1126         notes_attrs = kzalloc(sizeof(*notes_attrs)
1127                               + notes * sizeof(notes_attrs->attrs[0]),
1128                               GFP_KERNEL);
1129         if (notes_attrs == NULL)
1130                 return;
1131
1132         notes_attrs->notes = notes;
1133         nattr = &notes_attrs->attrs[0];
1134         for (loaded = i = 0; i < nsect; ++i) {
1135                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
1136                         continue;
1137                 if (sechdrs[i].sh_type == SHT_NOTE) {
1138                         nattr->attr.name = mod->sect_attrs->attrs[loaded].name;
1139                         nattr->attr.mode = S_IRUGO;
1140                         nattr->size = sechdrs[i].sh_size;
1141                         nattr->private = (void *) sechdrs[i].sh_addr;
1142                         nattr->read = module_notes_read;
1143                         ++nattr;
1144                 }
1145                 ++loaded;
1146         }
1147
1148         notes_attrs->dir = kobject_create_and_add("notes", &mod->mkobj.kobj);
1149         if (!notes_attrs->dir)
1150                 goto out;
1151
1152         for (i = 0; i < notes; ++i)
1153                 if (sysfs_create_bin_file(notes_attrs->dir,
1154                                           &notes_attrs->attrs[i]))
1155                         goto out;
1156
1157         mod->notes_attrs = notes_attrs;
1158         return;
1159
1160   out:
1161         free_notes_attrs(notes_attrs, i);
1162 }
1163
1164 static void remove_notes_attrs(struct module *mod)
1165 {
1166         if (mod->notes_attrs)
1167                 free_notes_attrs(mod->notes_attrs, mod->notes_attrs->notes);
1168 }
1169
1170 #else
1171
1172 static inline void add_sect_attrs(struct module *mod, unsigned int nsect,
1173                 char *sectstrings, Elf_Shdr *sechdrs)
1174 {
1175 }
1176
1177 static inline void remove_sect_attrs(struct module *mod)
1178 {
1179 }
1180
1181 static inline void add_notes_attrs(struct module *mod, unsigned int nsect,
1182                                    char *sectstrings, Elf_Shdr *sechdrs)
1183 {
1184 }
1185
1186 static inline void remove_notes_attrs(struct module *mod)
1187 {
1188 }
1189 #endif
1190
1191 #ifdef CONFIG_SYSFS
1192 int module_add_modinfo_attrs(struct module *mod)
1193 {
1194         struct module_attribute *attr;
1195         struct module_attribute *temp_attr;
1196         int error = 0;
1197         int i;
1198
1199         mod->modinfo_attrs = kzalloc((sizeof(struct module_attribute) *
1200                                         (ARRAY_SIZE(modinfo_attrs) + 1)),
1201                                         GFP_KERNEL);
1202         if (!mod->modinfo_attrs)
1203                 return -ENOMEM;
1204
1205         temp_attr = mod->modinfo_attrs;
1206         for (i = 0; (attr = modinfo_attrs[i]) && !error; i++) {
1207                 if (!attr->test ||
1208                     (attr->test && attr->test(mod))) {
1209                         memcpy(temp_attr, attr, sizeof(*temp_attr));
1210                         error = sysfs_create_file(&mod->mkobj.kobj,&temp_attr->attr);
1211                         ++temp_attr;
1212                 }
1213         }
1214         return error;
1215 }
1216
1217 void module_remove_modinfo_attrs(struct module *mod)
1218 {
1219         struct module_attribute *attr;
1220         int i;
1221
1222         for (i = 0; (attr = &mod->modinfo_attrs[i]); i++) {
1223                 /* pick a field to test for end of list */
1224                 if (!attr->attr.name)
1225                         break;
1226                 sysfs_remove_file(&mod->mkobj.kobj,&attr->attr);
1227                 if (attr->free)
1228                         attr->free(mod);
1229         }
1230         kfree(mod->modinfo_attrs);
1231 }
1232
1233 int mod_sysfs_init(struct module *mod)
1234 {
1235         int err;
1236         struct kobject *kobj;
1237
1238         if (!module_sysfs_initialized) {
1239                 printk(KERN_ERR "%s: module sysfs not initialized\n",
1240                        mod->name);
1241                 err = -EINVAL;
1242                 goto out;
1243         }
1244
1245         kobj = kset_find_obj(module_kset, mod->name);
1246         if (kobj) {
1247                 printk(KERN_ERR "%s: module is already loaded\n", mod->name);
1248                 kobject_put(kobj);
1249                 err = -EINVAL;
1250                 goto out;
1251         }
1252
1253         mod->mkobj.mod = mod;
1254
1255         memset(&mod->mkobj.kobj, 0, sizeof(mod->mkobj.kobj));
1256         mod->mkobj.kobj.kset = module_kset;
1257         err = kobject_init_and_add(&mod->mkobj.kobj, &module_ktype, NULL,
1258                                    "%s", mod->name);
1259         if (err)
1260                 kobject_put(&mod->mkobj.kobj);
1261
1262         /* delay uevent until full sysfs population */
1263 out:
1264         return err;
1265 }
1266
1267 int mod_sysfs_setup(struct module *mod,
1268                            struct kernel_param *kparam,
1269                            unsigned int num_params)
1270 {
1271         int err;
1272
1273         mod->holders_dir = kobject_create_and_add("holders", &mod->mkobj.kobj);
1274         if (!mod->holders_dir) {
1275                 err = -ENOMEM;
1276                 goto out_unreg;
1277         }
1278
1279         err = module_param_sysfs_setup(mod, kparam, num_params);
1280         if (err)
1281                 goto out_unreg_holders;
1282
1283         err = module_add_modinfo_attrs(mod);
1284         if (err)
1285                 goto out_unreg_param;
1286
1287         kobject_uevent(&mod->mkobj.kobj, KOBJ_ADD);
1288         return 0;
1289
1290 out_unreg_param:
1291         module_param_sysfs_remove(mod);
1292 out_unreg_holders:
1293         kobject_put(mod->holders_dir);
1294 out_unreg:
1295         kobject_put(&mod->mkobj.kobj);
1296         return err;
1297 }
1298 #endif
1299
1300 static void mod_kobject_remove(struct module *mod)
1301 {
1302         module_remove_modinfo_attrs(mod);
1303         module_param_sysfs_remove(mod);
1304         kobject_put(mod->mkobj.drivers_dir);
1305         kobject_put(mod->holders_dir);
1306         kobject_put(&mod->mkobj.kobj);
1307 }
1308
1309 /*
1310  * link the module with the whole machine is stopped with interrupts off
1311  * - this defends against kallsyms not taking locks
1312  */
1313 static int __link_module(void *_mod)
1314 {
1315         struct module *mod = _mod;
1316         list_add(&mod->list, &modules);
1317         return 0;
1318 }
1319
1320 /*
1321  * unlink the module with the whole machine is stopped with interrupts off
1322  * - this defends against kallsyms not taking locks
1323  */
1324 static int __unlink_module(void *_mod)
1325 {
1326         struct module *mod = _mod;
1327         list_del(&mod->list);
1328         return 0;
1329 }
1330
1331 /* Free a module, remove from lists, etc (must hold module_mutex). */
1332 static void free_module(struct module *mod)
1333 {
1334         /* Delete from various lists */
1335         stop_machine_run(__unlink_module, mod, NR_CPUS);
1336         remove_notes_attrs(mod);
1337         remove_sect_attrs(mod);
1338         mod_kobject_remove(mod);
1339
1340         unwind_remove_table(mod->unwind_info, 0);
1341
1342         /* Arch-specific cleanup. */
1343         module_arch_cleanup(mod);
1344
1345         /* Module unload stuff */
1346         module_unload_free(mod);
1347
1348         /* This may be NULL, but that's OK */
1349         module_free(mod, mod->module_init);
1350         kfree(mod->args);
1351         if (mod->percpu)
1352                 percpu_modfree(mod->percpu);
1353
1354         /* Free lock-classes: */
1355         lockdep_free_key_range(mod->module_core, mod->core_size);
1356
1357         /* Finally, free the core (containing the module structure) */
1358         module_free(mod, mod->module_core);
1359 }
1360
1361 void *__symbol_get(const char *symbol)
1362 {
1363         struct module *owner;
1364         unsigned long value;
1365         const unsigned long *crc;
1366
1367         preempt_disable();
1368         value = __find_symbol(symbol, &owner, &crc, 1);
1369         if (IS_ERR_VALUE(value))
1370                 value = 0;
1371         else if (strong_try_module_get(owner))
1372                 value = 0;
1373         preempt_enable();
1374
1375         return (void *)value;
1376 }
1377 EXPORT_SYMBOL_GPL(__symbol_get);
1378
1379 /*
1380  * Ensure that an exported symbol [global namespace] does not already exist
1381  * in the kernel or in some other module's exported symbol table.
1382  */
1383 static int verify_export_symbols(struct module *mod)
1384 {
1385         const char *name = NULL;
1386         unsigned long i, ret = 0;
1387         struct module *owner;
1388         const unsigned long *crc;
1389
1390         for (i = 0; i < mod->num_syms; i++)
1391                 if (!IS_ERR_VALUE(__find_symbol(mod->syms[i].name,
1392                                                         &owner, &crc, 1))) {
1393                         name = mod->syms[i].name;
1394                         ret = -ENOEXEC;
1395                         goto dup;
1396                 }
1397
1398         for (i = 0; i < mod->num_gpl_syms; i++)
1399                 if (!IS_ERR_VALUE(__find_symbol(mod->gpl_syms[i].name,
1400                                                         &owner, &crc, 1))) {
1401                         name = mod->gpl_syms[i].name;
1402                         ret = -ENOEXEC;
1403                         goto dup;
1404                 }
1405
1406 dup:
1407         if (ret)
1408                 printk(KERN_ERR "%s: exports duplicate symbol %s (owned by %s)\n",
1409                         mod->name, name, module_name(owner));
1410
1411         return ret;
1412 }
1413
1414 /* Change all symbols so that st_value encodes the pointer directly. */
1415 static int simplify_symbols(Elf_Shdr *sechdrs,
1416                             unsigned int symindex,
1417                             const char *strtab,
1418                             unsigned int versindex,
1419                             unsigned int pcpuindex,
1420                             struct module *mod)
1421 {
1422         Elf_Sym *sym = (void *)sechdrs[symindex].sh_addr;
1423         unsigned long secbase;
1424         unsigned int i, n = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1425         int ret = 0;
1426
1427         for (i = 1; i < n; i++) {
1428                 switch (sym[i].st_shndx) {
1429                 case SHN_COMMON:
1430                         /* We compiled with -fno-common.  These are not
1431                            supposed to happen.  */
1432                         DEBUGP("Common symbol: %s\n", strtab + sym[i].st_name);
1433                         printk("%s: please compile with -fno-common\n",
1434                                mod->name);
1435                         ret = -ENOEXEC;
1436                         break;
1437
1438                 case SHN_ABS:
1439                         /* Don't need to do anything */
1440                         DEBUGP("Absolute symbol: 0x%08lx\n",
1441                                (long)sym[i].st_value);
1442                         break;
1443
1444                 case SHN_UNDEF:
1445                         sym[i].st_value
1446                           = resolve_symbol(sechdrs, versindex,
1447                                            strtab + sym[i].st_name, mod);
1448
1449                         /* Ok if resolved.  */
1450                         if (!IS_ERR_VALUE(sym[i].st_value))
1451                                 break;
1452                         /* Ok if weak.  */
1453                         if (ELF_ST_BIND(sym[i].st_info) == STB_WEAK)
1454                                 break;
1455
1456                         printk(KERN_WARNING "%s: Unknown symbol %s\n",
1457                                mod->name, strtab + sym[i].st_name);
1458                         ret = -ENOENT;
1459                         break;
1460
1461                 default:
1462                         /* Divert to percpu allocation if a percpu var. */
1463                         if (sym[i].st_shndx == pcpuindex)
1464                                 secbase = (unsigned long)mod->percpu;
1465                         else
1466                                 secbase = sechdrs[sym[i].st_shndx].sh_addr;
1467                         sym[i].st_value += secbase;
1468                         break;
1469                 }
1470         }
1471
1472         return ret;
1473 }
1474
1475 /* Update size with this section: return offset. */
1476 static long get_offset(unsigned long *size, Elf_Shdr *sechdr)
1477 {
1478         long ret;
1479
1480         ret = ALIGN(*size, sechdr->sh_addralign ?: 1);
1481         *size = ret + sechdr->sh_size;
1482         return ret;
1483 }
1484
1485 /* Lay out the SHF_ALLOC sections in a way not dissimilar to how ld
1486    might -- code, read-only data, read-write data, small data.  Tally
1487    sizes, and place the offsets into sh_entsize fields: high bit means it
1488    belongs in init. */
1489 static void layout_sections(struct module *mod,
1490                             const Elf_Ehdr *hdr,
1491                             Elf_Shdr *sechdrs,
1492                             const char *secstrings)
1493 {
1494         static unsigned long const masks[][2] = {
1495                 /* NOTE: all executable code must be the first section
1496                  * in this array; otherwise modify the text_size
1497                  * finder in the two loops below */
1498                 { SHF_EXECINSTR | SHF_ALLOC, ARCH_SHF_SMALL },
1499                 { SHF_ALLOC, SHF_WRITE | ARCH_SHF_SMALL },
1500                 { SHF_WRITE | SHF_ALLOC, ARCH_SHF_SMALL },
1501                 { ARCH_SHF_SMALL | SHF_ALLOC, 0 }
1502         };
1503         unsigned int m, i;
1504
1505         for (i = 0; i < hdr->e_shnum; i++)
1506                 sechdrs[i].sh_entsize = ~0UL;
1507
1508         DEBUGP("Core section allocation order:\n");
1509         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1510                 for (i = 0; i < hdr->e_shnum; ++i) {
1511                         Elf_Shdr *s = &sechdrs[i];
1512
1513                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1514                             || (s->sh_flags & masks[m][1])
1515                             || s->sh_entsize != ~0UL
1516                             || strncmp(secstrings + s->sh_name,
1517                                        ".init", 5) == 0)
1518                                 continue;
1519                         s->sh_entsize = get_offset(&mod->core_size, s);
1520                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1521                 }
1522                 if (m == 0)
1523                         mod->core_text_size = mod->core_size;
1524         }
1525
1526         DEBUGP("Init section allocation order:\n");
1527         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1528                 for (i = 0; i < hdr->e_shnum; ++i) {
1529                         Elf_Shdr *s = &sechdrs[i];
1530
1531                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1532                             || (s->sh_flags & masks[m][1])
1533                             || s->sh_entsize != ~0UL
1534                             || strncmp(secstrings + s->sh_name,
1535                                        ".init", 5) != 0)
1536                                 continue;
1537                         s->sh_entsize = (get_offset(&mod->init_size, s)
1538                                          | INIT_OFFSET_MASK);
1539                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1540                 }
1541                 if (m == 0)
1542                         mod->init_text_size = mod->init_size;
1543         }
1544 }
1545
1546 static void set_license(struct module *mod, const char *license)
1547 {
1548         if (!license)
1549                 license = "unspecified";
1550
1551         if (!license_is_gpl_compatible(license)) {
1552                 if (!(tainted & TAINT_PROPRIETARY_MODULE))
1553                         printk(KERN_WARNING "%s: module license '%s' taints "
1554                                 "kernel.\n", mod->name, license);
1555                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1556         }
1557 }
1558
1559 /* Parse tag=value strings from .modinfo section */
1560 static char *next_string(char *string, unsigned long *secsize)
1561 {
1562         /* Skip non-zero chars */
1563         while (string[0]) {
1564                 string++;
1565                 if ((*secsize)-- <= 1)
1566                         return NULL;
1567         }
1568
1569         /* Skip any zero padding. */
1570         while (!string[0]) {
1571                 string++;
1572                 if ((*secsize)-- <= 1)
1573                         return NULL;
1574         }
1575         return string;
1576 }
1577
1578 static char *get_modinfo(Elf_Shdr *sechdrs,
1579                          unsigned int info,
1580                          const char *tag)
1581 {
1582         char *p;
1583         unsigned int taglen = strlen(tag);
1584         unsigned long size = sechdrs[info].sh_size;
1585
1586         for (p = (char *)sechdrs[info].sh_addr; p; p = next_string(p, &size)) {
1587                 if (strncmp(p, tag, taglen) == 0 && p[taglen] == '=')
1588                         return p + taglen + 1;
1589         }
1590         return NULL;
1591 }
1592
1593 static void setup_modinfo(struct module *mod, Elf_Shdr *sechdrs,
1594                           unsigned int infoindex)
1595 {
1596         struct module_attribute *attr;
1597         int i;
1598
1599         for (i = 0; (attr = modinfo_attrs[i]); i++) {
1600                 if (attr->setup)
1601                         attr->setup(mod,
1602                                     get_modinfo(sechdrs,
1603                                                 infoindex,
1604                                                 attr->attr.name));
1605         }
1606 }
1607
1608 #ifdef CONFIG_KALLSYMS
1609 static int is_exported(const char *name, const struct module *mod)
1610 {
1611         if (!mod && lookup_symbol(name, __start___ksymtab, __stop___ksymtab))
1612                 return 1;
1613         else
1614                 if (mod && lookup_symbol(name, mod->syms, mod->syms + mod->num_syms))
1615                         return 1;
1616                 else
1617                         return 0;
1618 }
1619
1620 /* As per nm */
1621 static char elf_type(const Elf_Sym *sym,
1622                      Elf_Shdr *sechdrs,
1623                      const char *secstrings,
1624                      struct module *mod)
1625 {
1626         if (ELF_ST_BIND(sym->st_info) == STB_WEAK) {
1627                 if (ELF_ST_TYPE(sym->st_info) == STT_OBJECT)
1628                         return 'v';
1629                 else
1630                         return 'w';
1631         }
1632         if (sym->st_shndx == SHN_UNDEF)
1633                 return 'U';
1634         if (sym->st_shndx == SHN_ABS)
1635                 return 'a';
1636         if (sym->st_shndx >= SHN_LORESERVE)
1637                 return '?';
1638         if (sechdrs[sym->st_shndx].sh_flags & SHF_EXECINSTR)
1639                 return 't';
1640         if (sechdrs[sym->st_shndx].sh_flags & SHF_ALLOC
1641             && sechdrs[sym->st_shndx].sh_type != SHT_NOBITS) {
1642                 if (!(sechdrs[sym->st_shndx].sh_flags & SHF_WRITE))
1643                         return 'r';
1644                 else if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1645                         return 'g';
1646                 else
1647                         return 'd';
1648         }
1649         if (sechdrs[sym->st_shndx].sh_type == SHT_NOBITS) {
1650                 if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1651                         return 's';
1652                 else
1653                         return 'b';
1654         }
1655         if (strncmp(secstrings + sechdrs[sym->st_shndx].sh_name,
1656                     ".debug", strlen(".debug")) == 0)
1657                 return 'n';
1658         return '?';
1659 }
1660
1661 static void add_kallsyms(struct module *mod,
1662                          Elf_Shdr *sechdrs,
1663                          unsigned int symindex,
1664                          unsigned int strindex,
1665                          const char *secstrings)
1666 {
1667         unsigned int i;
1668
1669         mod->symtab = (void *)sechdrs[symindex].sh_addr;
1670         mod->num_symtab = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1671         mod->strtab = (void *)sechdrs[strindex].sh_addr;
1672
1673         /* Set types up while we still have access to sections. */
1674         for (i = 0; i < mod->num_symtab; i++)
1675                 mod->symtab[i].st_info
1676                         = elf_type(&mod->symtab[i], sechdrs, secstrings, mod);
1677 }
1678 #else
1679 static inline void add_kallsyms(struct module *mod,
1680                                 Elf_Shdr *sechdrs,
1681                                 unsigned int symindex,
1682                                 unsigned int strindex,
1683                                 const char *secstrings)
1684 {
1685 }
1686 #endif /* CONFIG_KALLSYMS */
1687
1688 /* Allocate and load the module: note that size of section 0 is always
1689    zero, and we rely on this for optional sections. */
1690 static struct module *load_module(void __user *umod,
1691                                   unsigned long len,
1692                                   const char __user *uargs)
1693 {
1694         Elf_Ehdr *hdr;
1695         Elf_Shdr *sechdrs;
1696         char *secstrings, *args, *modmagic, *strtab = NULL;
1697         unsigned int i;
1698         unsigned int symindex = 0;
1699         unsigned int strindex = 0;
1700         unsigned int setupindex;
1701         unsigned int exindex;
1702         unsigned int exportindex;
1703         unsigned int modindex;
1704         unsigned int obsparmindex;
1705         unsigned int infoindex;
1706         unsigned int gplindex;
1707         unsigned int crcindex;
1708         unsigned int gplcrcindex;
1709         unsigned int versindex;
1710         unsigned int pcpuindex;
1711         unsigned int gplfutureindex;
1712         unsigned int gplfuturecrcindex;
1713         unsigned int unwindex = 0;
1714         unsigned int unusedindex;
1715         unsigned int unusedcrcindex;
1716         unsigned int unusedgplindex;
1717         unsigned int unusedgplcrcindex;
1718         unsigned int markersindex;
1719         unsigned int markersstringsindex;
1720         struct module *mod;
1721         long err = 0;
1722         void *percpu = NULL, *ptr = NULL; /* Stops spurious gcc warning */
1723         struct exception_table_entry *extable;
1724         mm_segment_t old_fs;
1725
1726         DEBUGP("load_module: umod=%p, len=%lu, uargs=%p\n",
1727                umod, len, uargs);
1728         if (len < sizeof(*hdr))
1729                 return ERR_PTR(-ENOEXEC);
1730
1731         /* Suck in entire file: we'll want most of it. */
1732         /* vmalloc barfs on "unusual" numbers.  Check here */
1733         if (len > 64 * 1024 * 1024 || (hdr = vmalloc(len)) == NULL)
1734                 return ERR_PTR(-ENOMEM);
1735         if (copy_from_user(hdr, umod, len) != 0) {
1736                 err = -EFAULT;
1737                 goto free_hdr;
1738         }
1739
1740         /* Sanity checks against insmoding binaries or wrong arch,
1741            weird elf version */
1742         if (memcmp(hdr->e_ident, ELFMAG, 4) != 0
1743             || hdr->e_type != ET_REL
1744             || !elf_check_arch(hdr)
1745             || hdr->e_shentsize != sizeof(*sechdrs)) {
1746                 err = -ENOEXEC;
1747                 goto free_hdr;
1748         }
1749
1750         if (len < hdr->e_shoff + hdr->e_shnum * sizeof(Elf_Shdr))
1751                 goto truncated;
1752
1753         /* Convenience variables */
1754         sechdrs = (void *)hdr + hdr->e_shoff;
1755         secstrings = (void *)hdr + sechdrs[hdr->e_shstrndx].sh_offset;
1756         sechdrs[0].sh_addr = 0;
1757
1758         for (i = 1; i < hdr->e_shnum; i++) {
1759                 if (sechdrs[i].sh_type != SHT_NOBITS
1760                     && len < sechdrs[i].sh_offset + sechdrs[i].sh_size)
1761                         goto truncated;
1762
1763                 /* Mark all sections sh_addr with their address in the
1764                    temporary image. */
1765                 sechdrs[i].sh_addr = (size_t)hdr + sechdrs[i].sh_offset;
1766
1767                 /* Internal symbols and strings. */
1768                 if (sechdrs[i].sh_type == SHT_SYMTAB) {
1769                         symindex = i;
1770                         strindex = sechdrs[i].sh_link;
1771                         strtab = (char *)hdr + sechdrs[strindex].sh_offset;
1772                 }
1773 #ifndef CONFIG_MODULE_UNLOAD
1774                 /* Don't load .exit sections */
1775                 if (strncmp(secstrings+sechdrs[i].sh_name, ".exit", 5) == 0)
1776                         sechdrs[i].sh_flags &= ~(unsigned long)SHF_ALLOC;
1777 #endif
1778         }
1779
1780         modindex = find_sec(hdr, sechdrs, secstrings,
1781                             ".gnu.linkonce.this_module");
1782         if (!modindex) {
1783                 printk(KERN_WARNING "No module found in object\n");
1784                 err = -ENOEXEC;
1785                 goto free_hdr;
1786         }
1787         mod = (void *)sechdrs[modindex].sh_addr;
1788
1789         if (symindex == 0) {
1790                 printk(KERN_WARNING "%s: module has no symbols (stripped?)\n",
1791                        mod->name);
1792                 err = -ENOEXEC;
1793                 goto free_hdr;
1794         }
1795
1796         /* Optional sections */
1797         exportindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab");
1798         gplindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_gpl");
1799         gplfutureindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_gpl_future");
1800         unusedindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_unused");
1801         unusedgplindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_unused_gpl");
1802         crcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab");
1803         gplcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_gpl");
1804         gplfuturecrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_gpl_future");
1805         unusedcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_unused");
1806         unusedgplcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_unused_gpl");
1807         setupindex = find_sec(hdr, sechdrs, secstrings, "__param");
1808         exindex = find_sec(hdr, sechdrs, secstrings, "__ex_table");
1809         obsparmindex = find_sec(hdr, sechdrs, secstrings, "__obsparm");
1810         versindex = find_sec(hdr, sechdrs, secstrings, "__versions");
1811         infoindex = find_sec(hdr, sechdrs, secstrings, ".modinfo");
1812         pcpuindex = find_pcpusec(hdr, sechdrs, secstrings);
1813 #ifdef ARCH_UNWIND_SECTION_NAME
1814         unwindex = find_sec(hdr, sechdrs, secstrings, ARCH_UNWIND_SECTION_NAME);
1815 #endif
1816
1817         /* Don't keep modinfo section */
1818         sechdrs[infoindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1819 #ifdef CONFIG_KALLSYMS
1820         /* Keep symbol and string tables for decoding later. */
1821         sechdrs[symindex].sh_flags |= SHF_ALLOC;
1822         sechdrs[strindex].sh_flags |= SHF_ALLOC;
1823 #endif
1824         if (unwindex)
1825                 sechdrs[unwindex].sh_flags |= SHF_ALLOC;
1826
1827         /* Check module struct version now, before we try to use module. */
1828         if (!check_modstruct_version(sechdrs, versindex, mod)) {
1829                 err = -ENOEXEC;
1830                 goto free_hdr;
1831         }
1832
1833         modmagic = get_modinfo(sechdrs, infoindex, "vermagic");
1834         /* This is allowed: modprobe --force will invalidate it. */
1835         if (!modmagic) {
1836                 add_taint_module(mod, TAINT_FORCED_MODULE);
1837                 printk(KERN_WARNING "%s: no version magic, tainting kernel.\n",
1838                        mod->name);
1839         } else if (!same_magic(modmagic, vermagic)) {
1840                 printk(KERN_ERR "%s: version magic '%s' should be '%s'\n",
1841                        mod->name, modmagic, vermagic);
1842                 err = -ENOEXEC;
1843                 goto free_hdr;
1844         }
1845
1846         /* Now copy in args */
1847         args = strndup_user(uargs, ~0UL >> 1);
1848         if (IS_ERR(args)) {
1849                 err = PTR_ERR(args);
1850                 goto free_hdr;
1851         }
1852
1853         if (find_module(mod->name)) {
1854                 err = -EEXIST;
1855                 goto free_mod;
1856         }
1857
1858         mod->state = MODULE_STATE_COMING;
1859
1860         /* Allow arches to frob section contents and sizes.  */
1861         err = module_frob_arch_sections(hdr, sechdrs, secstrings, mod);
1862         if (err < 0)
1863                 goto free_mod;
1864
1865         if (pcpuindex) {
1866                 /* We have a special allocation for this section. */
1867                 percpu = percpu_modalloc(sechdrs[pcpuindex].sh_size,
1868                                          sechdrs[pcpuindex].sh_addralign,
1869                                          mod->name);
1870                 if (!percpu) {
1871                         err = -ENOMEM;
1872                         goto free_mod;
1873                 }
1874                 sechdrs[pcpuindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1875                 mod->percpu = percpu;
1876         }
1877
1878         /* Determine total sizes, and put offsets in sh_entsize.  For now
1879            this is done generically; there doesn't appear to be any
1880            special cases for the architectures. */
1881         layout_sections(mod, hdr, sechdrs, secstrings);
1882
1883         /* Do the allocs. */
1884         ptr = module_alloc(mod->core_size);
1885         if (!ptr) {
1886                 err = -ENOMEM;
1887                 goto free_percpu;
1888         }
1889         memset(ptr, 0, mod->core_size);
1890         mod->module_core = ptr;
1891
1892         ptr = module_alloc(mod->init_size);
1893         if (!ptr && mod->init_size) {
1894                 err = -ENOMEM;
1895                 goto free_core;
1896         }
1897         memset(ptr, 0, mod->init_size);
1898         mod->module_init = ptr;
1899
1900         /* Transfer each section which specifies SHF_ALLOC */
1901         DEBUGP("final section addresses:\n");
1902         for (i = 0; i < hdr->e_shnum; i++) {
1903                 void *dest;
1904
1905                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
1906                         continue;
1907
1908                 if (sechdrs[i].sh_entsize & INIT_OFFSET_MASK)
1909                         dest = mod->module_init
1910                                 + (sechdrs[i].sh_entsize & ~INIT_OFFSET_MASK);
1911                 else
1912                         dest = mod->module_core + sechdrs[i].sh_entsize;
1913
1914                 if (sechdrs[i].sh_type != SHT_NOBITS)
1915                         memcpy(dest, (void *)sechdrs[i].sh_addr,
1916                                sechdrs[i].sh_size);
1917                 /* Update sh_addr to point to copy in image. */
1918                 sechdrs[i].sh_addr = (unsigned long)dest;
1919                 DEBUGP("\t0x%lx %s\n", sechdrs[i].sh_addr, secstrings + sechdrs[i].sh_name);
1920         }
1921         /* Module has been moved. */
1922         mod = (void *)sechdrs[modindex].sh_addr;
1923
1924         /* Now we've moved module, initialize linked lists, etc. */
1925         module_unload_init(mod);
1926
1927         /* add kobject, so we can reference it. */
1928         err = mod_sysfs_init(mod);
1929         if (err)
1930                 goto free_unload;
1931
1932         /* Set up license info based on the info section */
1933         set_license(mod, get_modinfo(sechdrs, infoindex, "license"));
1934
1935         /*
1936          * ndiswrapper is under GPL by itself, but loads proprietary modules.
1937          * Don't use add_taint_module(), as it would prevent ndiswrapper from
1938          * using GPL-only symbols it needs.
1939          */
1940         if (strcmp(mod->name, "ndiswrapper") == 0)
1941                 add_taint(TAINT_PROPRIETARY_MODULE);
1942
1943         /* driverloader was caught wrongly pretending to be under GPL */
1944         if (strcmp(mod->name, "driverloader") == 0)
1945                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1946
1947         /* Set up MODINFO_ATTR fields */
1948         setup_modinfo(mod, sechdrs, infoindex);
1949
1950         /* Fix up syms, so that st_value is a pointer to location. */
1951         err = simplify_symbols(sechdrs, symindex, strtab, versindex, pcpuindex,
1952                                mod);
1953         if (err < 0)
1954                 goto cleanup;
1955
1956         /* Set up EXPORTed & EXPORT_GPLed symbols (section 0 is 0 length) */
1957         mod->num_syms = sechdrs[exportindex].sh_size / sizeof(*mod->syms);
1958         mod->syms = (void *)sechdrs[exportindex].sh_addr;
1959         if (crcindex)
1960                 mod->crcs = (void *)sechdrs[crcindex].sh_addr;
1961         mod->num_gpl_syms = sechdrs[gplindex].sh_size / sizeof(*mod->gpl_syms);
1962         mod->gpl_syms = (void *)sechdrs[gplindex].sh_addr;
1963         if (gplcrcindex)
1964                 mod->gpl_crcs = (void *)sechdrs[gplcrcindex].sh_addr;
1965         mod->num_gpl_future_syms = sechdrs[gplfutureindex].sh_size /
1966                                         sizeof(*mod->gpl_future_syms);
1967         mod->num_unused_syms = sechdrs[unusedindex].sh_size /
1968                                         sizeof(*mod->unused_syms);
1969         mod->num_unused_gpl_syms = sechdrs[unusedgplindex].sh_size /
1970                                         sizeof(*mod->unused_gpl_syms);
1971         mod->gpl_future_syms = (void *)sechdrs[gplfutureindex].sh_addr;
1972         if (gplfuturecrcindex)
1973                 mod->gpl_future_crcs = (void *)sechdrs[gplfuturecrcindex].sh_addr;
1974
1975         mod->unused_syms = (void *)sechdrs[unusedindex].sh_addr;
1976         if (unusedcrcindex)
1977                 mod->unused_crcs = (void *)sechdrs[unusedcrcindex].sh_addr;
1978         mod->unused_gpl_syms = (void *)sechdrs[unusedgplindex].sh_addr;
1979         if (unusedgplcrcindex)
1980                 mod->unused_crcs = (void *)sechdrs[unusedgplcrcindex].sh_addr;
1981
1982 #ifdef CONFIG_MODVERSIONS
1983         if ((mod->num_syms && !crcindex) ||
1984             (mod->num_gpl_syms && !gplcrcindex) ||
1985             (mod->num_gpl_future_syms && !gplfuturecrcindex) ||
1986             (mod->num_unused_syms && !unusedcrcindex) ||
1987             (mod->num_unused_gpl_syms && !unusedgplcrcindex)) {
1988                 printk(KERN_WARNING "%s: No versions for exported symbols."
1989                        " Tainting kernel.\n", mod->name);
1990                 add_taint_module(mod, TAINT_FORCED_MODULE);
1991         }
1992 #endif
1993         markersindex = find_sec(hdr, sechdrs, secstrings, "__markers");
1994         markersstringsindex = find_sec(hdr, sechdrs, secstrings,
1995                                         "__markers_strings");
1996
1997         /* Now do relocations. */
1998         for (i = 1; i < hdr->e_shnum; i++) {
1999                 const char *strtab = (char *)sechdrs[strindex].sh_addr;
2000                 unsigned int info = sechdrs[i].sh_info;
2001
2002                 /* Not a valid relocation section? */
2003                 if (info >= hdr->e_shnum)
2004                         continue;
2005
2006                 /* Don't bother with non-allocated sections */
2007                 if (!(sechdrs[info].sh_flags & SHF_ALLOC))
2008                         continue;
2009
2010                 if (sechdrs[i].sh_type == SHT_REL)
2011                         err = apply_relocate(sechdrs, strtab, symindex, i,mod);
2012                 else if (sechdrs[i].sh_type == SHT_RELA)
2013                         err = apply_relocate_add(sechdrs, strtab, symindex, i,
2014                                                  mod);
2015                 if (err < 0)
2016                         goto cleanup;
2017         }
2018 #ifdef CONFIG_MARKERS
2019         mod->markers = (void *)sechdrs[markersindex].sh_addr;
2020         mod->num_markers =
2021                 sechdrs[markersindex].sh_size / sizeof(*mod->markers);
2022 #endif
2023
2024         /* Find duplicate symbols */
2025         err = verify_export_symbols(mod);
2026
2027         if (err < 0)
2028                 goto cleanup;
2029
2030         /* Set up and sort exception table */
2031         mod->num_exentries = sechdrs[exindex].sh_size / sizeof(*mod->extable);
2032         mod->extable = extable = (void *)sechdrs[exindex].sh_addr;
2033         sort_extable(extable, extable + mod->num_exentries);
2034
2035         /* Finally, copy percpu area over. */
2036         percpu_modcopy(mod->percpu, (void *)sechdrs[pcpuindex].sh_addr,
2037                        sechdrs[pcpuindex].sh_size);
2038
2039         add_kallsyms(mod, sechdrs, symindex, strindex, secstrings);
2040
2041 #ifdef CONFIG_MARKERS
2042         if (!mod->taints)
2043                 marker_update_probe_range(mod->markers,
2044                         mod->markers + mod->num_markers);
2045 #endif
2046         err = module_finalize(hdr, sechdrs, mod);
2047         if (err < 0)
2048                 goto cleanup;
2049
2050         /* flush the icache in correct context */
2051         old_fs = get_fs();
2052         set_fs(KERNEL_DS);
2053
2054         /*
2055          * Flush the instruction cache, since we've played with text.
2056          * Do it before processing of module parameters, so the module
2057          * can provide parameter accessor functions of its own.
2058          */
2059         if (mod->module_init)
2060                 flush_icache_range((unsigned long)mod->module_init,
2061                                    (unsigned long)mod->module_init
2062                                    + mod->init_size);
2063         flush_icache_range((unsigned long)mod->module_core,
2064                            (unsigned long)mod->module_core + mod->core_size);
2065
2066         set_fs(old_fs);
2067
2068         mod->args = args;
2069         if (obsparmindex)
2070                 printk(KERN_WARNING "%s: Ignoring obsolete parameters\n",
2071                        mod->name);
2072
2073         /* Now sew it into the lists so we can get lockdep and oops
2074          * info during argument parsing.  Noone should access us, since
2075          * strong_try_module_get() will fail. */
2076         stop_machine_run(__link_module, mod, NR_CPUS);
2077
2078         /* Size of section 0 is 0, so this works well if no params */
2079         err = parse_args(mod->name, mod->args,
2080                          (struct kernel_param *)
2081                          sechdrs[setupindex].sh_addr,
2082                          sechdrs[setupindex].sh_size
2083                          / sizeof(struct kernel_param),
2084                          NULL);
2085         if (err < 0)
2086                 goto unlink;
2087
2088         err = mod_sysfs_setup(mod,
2089                               (struct kernel_param *)
2090                               sechdrs[setupindex].sh_addr,
2091                               sechdrs[setupindex].sh_size
2092                               / sizeof(struct kernel_param));
2093         if (err < 0)
2094                 goto unlink;
2095         add_sect_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
2096         add_notes_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
2097
2098         /* Size of section 0 is 0, so this works well if no unwind info. */
2099         mod->unwind_info = unwind_add_table(mod,
2100                                             (void *)sechdrs[unwindex].sh_addr,
2101                                             sechdrs[unwindex].sh_size);
2102
2103         /* Get rid of temporary copy */
2104         vfree(hdr);
2105
2106         /* Done! */
2107         return mod;
2108
2109  unlink:
2110         stop_machine_run(__unlink_module, mod, NR_CPUS);
2111         module_arch_cleanup(mod);
2112  cleanup:
2113         kobject_del(&mod->mkobj.kobj);
2114         kobject_put(&mod->mkobj.kobj);
2115  free_unload:
2116         module_unload_free(mod);
2117         module_free(mod, mod->module_init);
2118  free_core:
2119         module_free(mod, mod->module_core);
2120  free_percpu:
2121         if (percpu)
2122                 percpu_modfree(percpu);
2123  free_mod:
2124         kfree(args);
2125  free_hdr:
2126         vfree(hdr);
2127         return ERR_PTR(err);
2128
2129  truncated:
2130         printk(KERN_ERR "Module len %lu truncated\n", len);
2131         err = -ENOEXEC;
2132         goto free_hdr;
2133 }
2134
2135 /* This is where the real work happens */
2136 asmlinkage long
2137 sys_init_module(void __user *umod,
2138                 unsigned long len,
2139                 const char __user *uargs)
2140 {
2141         struct module *mod;
2142         int ret = 0;
2143
2144         /* Must have permission */
2145         if (!capable(CAP_SYS_MODULE))
2146                 return -EPERM;
2147
2148         /* Only one module load at a time, please */
2149         if (mutex_lock_interruptible(&module_mutex) != 0)
2150                 return -EINTR;
2151
2152         /* Do all the hard work */
2153         mod = load_module(umod, len, uargs);
2154         if (IS_ERR(mod)) {
2155                 mutex_unlock(&module_mutex);
2156                 return PTR_ERR(mod);
2157         }
2158
2159         /* Drop lock so they can recurse */
2160         mutex_unlock(&module_mutex);
2161
2162         blocking_notifier_call_chain(&module_notify_list,
2163                         MODULE_STATE_COMING, mod);
2164
2165         /* Start the module */
2166         if (mod->init != NULL)
2167                 ret = mod->init();
2168         if (ret < 0) {
2169                 /* Init routine failed: abort.  Try to protect us from
2170                    buggy refcounters. */
2171                 mod->state = MODULE_STATE_GOING;
2172                 synchronize_sched();
2173                 module_put(mod);
2174                 mutex_lock(&module_mutex);
2175                 free_module(mod);
2176                 mutex_unlock(&module_mutex);
2177                 wake_up(&module_wq);
2178                 return ret;
2179         }
2180         if (ret > 0) {
2181                 printk(KERN_WARNING "%s: '%s'->init suspiciously returned %d, "
2182                                     "it should follow 0/-E convention\n"
2183                        KERN_WARNING "%s: loading module anyway...\n",
2184                        __func__, mod->name, ret,
2185                        __func__);
2186                 dump_stack();
2187         }
2188
2189         /* Now it's a first class citizen!  Wake up anyone waiting for it. */
2190         mod->state = MODULE_STATE_LIVE;
2191         wake_up(&module_wq);
2192
2193         mutex_lock(&module_mutex);
2194         /* Drop initial reference. */
2195         module_put(mod);
2196         unwind_remove_table(mod->unwind_info, 1);
2197         module_free(mod, mod->module_init);
2198         mod->module_init = NULL;
2199         mod->init_size = 0;
2200         mod->init_text_size = 0;
2201         mutex_unlock(&module_mutex);
2202
2203         return 0;
2204 }
2205
2206 static inline int within(unsigned long addr, void *start, unsigned long size)
2207 {
2208         return ((void *)addr >= start && (void *)addr < start + size);
2209 }
2210
2211 #ifdef CONFIG_KALLSYMS
2212 /*
2213  * This ignores the intensely annoying "mapping symbols" found
2214  * in ARM ELF files: $a, $t and $d.
2215  */
2216 static inline int is_arm_mapping_symbol(const char *str)
2217 {
2218         return str[0] == '$' && strchr("atd", str[1])
2219                && (str[2] == '\0' || str[2] == '.');
2220 }
2221
2222 static const char *get_ksymbol(struct module *mod,
2223                                unsigned long addr,
2224                                unsigned long *size,
2225                                unsigned long *offset)
2226 {
2227         unsigned int i, best = 0;
2228         unsigned long nextval;
2229
2230         /* At worse, next value is at end of module */
2231         if (within(addr, mod->module_init, mod->init_size))
2232                 nextval = (unsigned long)mod->module_init+mod->init_text_size;
2233         else
2234                 nextval = (unsigned long)mod->module_core+mod->core_text_size;
2235
2236         /* Scan for closest preceeding symbol, and next symbol. (ELF
2237            starts real symbols at 1). */
2238         for (i = 1; i < mod->num_symtab; i++) {
2239                 if (mod->symtab[i].st_shndx == SHN_UNDEF)
2240                         continue;
2241
2242                 /* We ignore unnamed symbols: they're uninformative
2243                  * and inserted at a whim. */
2244                 if (mod->symtab[i].st_value <= addr
2245                     && mod->symtab[i].st_value > mod->symtab[best].st_value
2246                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2247                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2248                         best = i;
2249                 if (mod->symtab[i].st_value > addr
2250                     && mod->symtab[i].st_value < nextval
2251                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2252                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2253                         nextval = mod->symtab[i].st_value;
2254         }
2255
2256         if (!best)
2257                 return NULL;
2258
2259         if (size)
2260                 *size = nextval - mod->symtab[best].st_value;
2261         if (offset)
2262                 *offset = addr - mod->symtab[best].st_value;
2263         return mod->strtab + mod->symtab[best].st_name;
2264 }
2265
2266 /* For kallsyms to ask for address resolution.  NULL means not found.  Careful
2267  * not to lock to avoid deadlock on oopses, simply disable preemption. */
2268 const char *module_address_lookup(unsigned long addr,
2269                             unsigned long *size,
2270                             unsigned long *offset,
2271                             char **modname,
2272                             char *namebuf)
2273 {
2274         struct module *mod;
2275         const char *ret = NULL;
2276
2277         preempt_disable();
2278         list_for_each_entry(mod, &modules, list) {
2279                 if (within(addr, mod->module_init, mod->init_size)
2280                     || within(addr, mod->module_core, mod->core_size)) {
2281                         if (modname)
2282                                 *modname = mod->name;
2283                         ret = get_ksymbol(mod, addr, size, offset);
2284                         break;
2285                 }
2286         }
2287         /* Make a copy in here where it's safe */
2288         if (ret) {
2289                 strncpy(namebuf, ret, KSYM_NAME_LEN - 1);
2290                 ret = namebuf;
2291         }
2292         preempt_enable();
2293         return ret;
2294 }
2295
2296 int lookup_module_symbol_name(unsigned long addr, char *symname)
2297 {
2298         struct module *mod;
2299
2300         preempt_disable();
2301         list_for_each_entry(mod, &modules, list) {
2302                 if (within(addr, mod->module_init, mod->init_size) ||
2303                     within(addr, mod->module_core, mod->core_size)) {
2304                         const char *sym;
2305
2306                         sym = get_ksymbol(mod, addr, NULL, NULL);
2307                         if (!sym)
2308                                 goto out;
2309                         strlcpy(symname, sym, KSYM_NAME_LEN);
2310                         preempt_enable();
2311                         return 0;
2312                 }
2313         }
2314 out:
2315         preempt_enable();
2316         return -ERANGE;
2317 }
2318
2319 int lookup_module_symbol_attrs(unsigned long addr, unsigned long *size,
2320                         unsigned long *offset, char *modname, char *name)
2321 {
2322         struct module *mod;
2323
2324         preempt_disable();
2325         list_for_each_entry(mod, &modules, list) {
2326                 if (within(addr, mod->module_init, mod->init_size) ||
2327                     within(addr, mod->module_core, mod->core_size)) {
2328                         const char *sym;
2329
2330                         sym = get_ksymbol(mod, addr, size, offset);
2331                         if (!sym)
2332                                 goto out;
2333                         if (modname)
2334                                 strlcpy(modname, mod->name, MODULE_NAME_LEN);
2335                         if (name)
2336                                 strlcpy(name, sym, KSYM_NAME_LEN);
2337                         preempt_enable();
2338                         return 0;
2339                 }
2340         }
2341 out:
2342         preempt_enable();
2343         return -ERANGE;
2344 }
2345
2346 int module_get_kallsym(unsigned int symnum, unsigned long *value, char *type,
2347                         char *name, char *module_name, int *exported)
2348 {
2349         struct module *mod;
2350
2351         preempt_disable();
2352         list_for_each_entry(mod, &modules, list) {
2353                 if (symnum < mod->num_symtab) {
2354                         *value = mod->symtab[symnum].st_value;
2355                         *type = mod->symtab[symnum].st_info;
2356                         strlcpy(name, mod->strtab + mod->symtab[symnum].st_name,
2357                                 KSYM_NAME_LEN);
2358                         strlcpy(module_name, mod->name, MODULE_NAME_LEN);
2359                         *exported = is_exported(name, mod);
2360                         preempt_enable();
2361                         return 0;
2362                 }
2363                 symnum -= mod->num_symtab;
2364         }
2365         preempt_enable();
2366         return -ERANGE;
2367 }
2368
2369 static unsigned long mod_find_symname(struct module *mod, const char *name)
2370 {
2371         unsigned int i;
2372
2373         for (i = 0; i < mod->num_symtab; i++)
2374                 if (strcmp(name, mod->strtab+mod->symtab[i].st_name) == 0 &&
2375                     mod->symtab[i].st_info != 'U')
2376                         return mod->symtab[i].st_value;
2377         return 0;
2378 }
2379
2380 /* Look for this name: can be of form module:name. */
2381 unsigned long module_kallsyms_lookup_name(const char *name)
2382 {
2383         struct module *mod;
2384         char *colon;
2385         unsigned long ret = 0;
2386
2387         /* Don't lock: we're in enough trouble already. */
2388         preempt_disable();
2389         if ((colon = strchr(name, ':')) != NULL) {
2390                 *colon = '\0';
2391                 if ((mod = find_module(name)) != NULL)
2392                         ret = mod_find_symname(mod, colon+1);
2393                 *colon = ':';
2394         } else {
2395                 list_for_each_entry(mod, &modules, list)
2396                         if ((ret = mod_find_symname(mod, name)) != 0)
2397                                 break;
2398         }
2399         preempt_enable();
2400         return ret;
2401 }
2402 #endif /* CONFIG_KALLSYMS */
2403
2404 /* Called by the /proc file system to return a list of modules. */
2405 static void *m_start(struct seq_file *m, loff_t *pos)
2406 {
2407         mutex_lock(&module_mutex);
2408         return seq_list_start(&modules, *pos);
2409 }
2410
2411 static void *m_next(struct seq_file *m, void *p, loff_t *pos)
2412 {
2413         return seq_list_next(p, &modules, pos);
2414 }
2415
2416 static void m_stop(struct seq_file *m, void *p)
2417 {
2418         mutex_unlock(&module_mutex);
2419 }
2420
2421 static char *module_flags(struct module *mod, char *buf)
2422 {
2423         int bx = 0;
2424
2425         if (mod->taints ||
2426             mod->state == MODULE_STATE_GOING ||
2427             mod->state == MODULE_STATE_COMING) {
2428                 buf[bx++] = '(';
2429                 if (mod->taints & TAINT_PROPRIETARY_MODULE)
2430                         buf[bx++] = 'P';
2431                 if (mod->taints & TAINT_FORCED_MODULE)
2432                         buf[bx++] = 'F';
2433                 /*
2434                  * TAINT_FORCED_RMMOD: could be added.
2435                  * TAINT_UNSAFE_SMP, TAINT_MACHINE_CHECK, TAINT_BAD_PAGE don't
2436                  * apply to modules.
2437                  */
2438
2439                 /* Show a - for module-is-being-unloaded */
2440                 if (mod->state == MODULE_STATE_GOING)
2441                         buf[bx++] = '-';
2442                 /* Show a + for module-is-being-loaded */
2443                 if (mod->state == MODULE_STATE_COMING)
2444                         buf[bx++] = '+';
2445                 buf[bx++] = ')';
2446         }
2447         buf[bx] = '\0';
2448
2449         return buf;
2450 }
2451
2452 static int m_show(struct seq_file *m, void *p)
2453 {
2454         struct module *mod = list_entry(p, struct module, list);
2455         char buf[8];
2456
2457         seq_printf(m, "%s %lu",
2458                    mod->name, mod->init_size + mod->core_size);
2459         print_unload_info(m, mod);
2460
2461         /* Informative for users. */
2462         seq_printf(m, " %s",
2463                    mod->state == MODULE_STATE_GOING ? "Unloading":
2464                    mod->state == MODULE_STATE_COMING ? "Loading":
2465                    "Live");
2466         /* Used by oprofile and other similar tools. */
2467         seq_printf(m, " 0x%p", mod->module_core);
2468
2469         /* Taints info */
2470         if (mod->taints)
2471                 seq_printf(m, " %s", module_flags(mod, buf));
2472
2473         seq_printf(m, "\n");
2474         return 0;
2475 }
2476
2477 /* Format: modulename size refcount deps address
2478
2479    Where refcount is a number or -, and deps is a comma-separated list
2480    of depends or -.
2481 */
2482 const struct seq_operations modules_op = {
2483         .start  = m_start,
2484         .next   = m_next,
2485         .stop   = m_stop,
2486         .show   = m_show
2487 };
2488
2489 /* Given an address, look for it in the module exception tables. */
2490 const struct exception_table_entry *search_module_extables(unsigned long addr)
2491 {
2492         const struct exception_table_entry *e = NULL;
2493         struct module *mod;
2494
2495         preempt_disable();
2496         list_for_each_entry(mod, &modules, list) {
2497                 if (mod->num_exentries == 0)
2498                         continue;
2499
2500                 e = search_extable(mod->extable,
2501                                    mod->extable + mod->num_exentries - 1,
2502                                    addr);
2503                 if (e)
2504                         break;
2505         }
2506         preempt_enable();
2507
2508         /* Now, if we found one, we are running inside it now, hence
2509            we cannot unload the module, hence no refcnt needed. */
2510         return e;
2511 }
2512
2513 /*
2514  * Is this a valid module address?
2515  */
2516 int is_module_address(unsigned long addr)
2517 {
2518         struct module *mod;
2519
2520         preempt_disable();
2521
2522         list_for_each_entry(mod, &modules, list) {
2523                 if (within(addr, mod->module_core, mod->core_size)) {
2524                         preempt_enable();
2525                         return 1;
2526                 }
2527         }
2528
2529         preempt_enable();
2530
2531         return 0;
2532 }
2533
2534
2535 /* Is this a valid kernel address? */
2536 struct module *__module_text_address(unsigned long addr)
2537 {
2538         struct module *mod;
2539
2540         list_for_each_entry(mod, &modules, list)
2541                 if (within(addr, mod->module_init, mod->init_text_size)
2542                     || within(addr, mod->module_core, mod->core_text_size))
2543                         return mod;
2544         return NULL;
2545 }
2546
2547 struct module *module_text_address(unsigned long addr)
2548 {
2549         struct module *mod;
2550
2551         preempt_disable();
2552         mod = __module_text_address(addr);
2553         preempt_enable();
2554
2555         return mod;
2556 }
2557
2558 /* Don't grab lock, we're oopsing. */
2559 void print_modules(void)
2560 {
2561         struct module *mod;
2562         char buf[8];
2563
2564         printk("Modules linked in:");
2565         list_for_each_entry(mod, &modules, list)
2566                 printk(" %s%s", mod->name, module_flags(mod, buf));
2567         if (last_unloaded_module[0])
2568                 printk(" [last unloaded: %s]", last_unloaded_module);
2569         printk("\n");
2570 }
2571
2572 #ifdef CONFIG_MODVERSIONS
2573 /* Generate the signature for struct module here, too, for modversions. */
2574 void struct_module(struct module *mod) { return; }
2575 EXPORT_SYMBOL(struct_module);
2576 #endif
2577
2578 #ifdef CONFIG_MARKERS
2579 void module_update_markers(void)
2580 {
2581         struct module *mod;
2582
2583         mutex_lock(&module_mutex);
2584         list_for_each_entry(mod, &modules, list)
2585                 if (!mod->taints)
2586                         marker_update_probe_range(mod->markers,
2587                                 mod->markers + mod->num_markers);
2588         mutex_unlock(&module_mutex);
2589 }
2590 #endif