[PATCH] ppc64: Allow world readable /proc/ppc64/lparcfg
[linux-2.6] / arch / ppc64 / kernel / setup.c
1 /*
2  * 
3  * Common boot and setup code.
4  *
5  * Copyright (C) 2001 PPC64 Team, IBM Corp
6  *
7  *      This program is free software; you can redistribute it and/or
8  *      modify it under the terms of the GNU General Public License
9  *      as published by the Free Software Foundation; either version
10  *      2 of the License, or (at your option) any later version.
11  */
12
13 #undef DEBUG
14
15 #include <linux/config.h>
16 #include <linux/module.h>
17 #include <linux/string.h>
18 #include <linux/sched.h>
19 #include <linux/init.h>
20 #include <linux/kernel.h>
21 #include <linux/reboot.h>
22 #include <linux/delay.h>
23 #include <linux/initrd.h>
24 #include <linux/ide.h>
25 #include <linux/seq_file.h>
26 #include <linux/ioport.h>
27 #include <linux/console.h>
28 #include <linux/version.h>
29 #include <linux/tty.h>
30 #include <linux/root_dev.h>
31 #include <linux/notifier.h>
32 #include <linux/cpu.h>
33 #include <linux/unistd.h>
34 #include <linux/serial.h>
35 #include <linux/serial_8250.h>
36 #include <asm/io.h>
37 #include <asm/prom.h>
38 #include <asm/processor.h>
39 #include <asm/pgtable.h>
40 #include <asm/bootinfo.h>
41 #include <asm/smp.h>
42 #include <asm/elf.h>
43 #include <asm/machdep.h>
44 #include <asm/paca.h>
45 #include <asm/ppcdebug.h>
46 #include <asm/time.h>
47 #include <asm/cputable.h>
48 #include <asm/sections.h>
49 #include <asm/btext.h>
50 #include <asm/nvram.h>
51 #include <asm/setup.h>
52 #include <asm/system.h>
53 #include <asm/rtas.h>
54 #include <asm/iommu.h>
55 #include <asm/serial.h>
56 #include <asm/cache.h>
57 #include <asm/page.h>
58 #include <asm/mmu.h>
59 #include <asm/lmb.h>
60 #include <asm/iSeries/ItLpNaca.h>
61
62 #ifdef DEBUG
63 #define DBG(fmt...) udbg_printf(fmt)
64 #else
65 #define DBG(fmt...)
66 #endif
67
68 /*
69  * Here are some early debugging facilities. You can enable one
70  * but your kernel will not boot on anything else if you do so
71  */
72
73 /* This one is for use on LPAR machines that support an HVC console
74  * on vterm 0
75  */
76 extern void udbg_init_debug_lpar(void);
77 /* This one is for use on Apple G5 machines
78  */
79 extern void udbg_init_pmac_realmode(void);
80 /* That's RTAS panel debug */
81 extern void call_rtas_display_status_delay(unsigned char c);
82 /* Here's maple real mode debug */
83 extern void udbg_init_maple_realmode(void);
84
85 #define EARLY_DEBUG_INIT() do {} while(0)
86
87 #if 0
88 #define EARLY_DEBUG_INIT() udbg_init_debug_lpar()
89 #define EARLY_DEBUG_INIT() udbg_init_maple_realmode()
90 #define EARLY_DEBUG_INIT() udbg_init_pmac_realmode()
91 #define EARLY_DEBUG_INIT()                                              \
92         do { udbg_putc = call_rtas_display_status_delay; } while(0)
93 #endif
94
95 /* extern void *stab; */
96 extern unsigned long klimit;
97
98 extern void mm_init_ppc64(void);
99 extern void stab_initialize(unsigned long stab);
100 extern void htab_initialize(void);
101 extern void early_init_devtree(void *flat_dt);
102 extern void unflatten_device_tree(void);
103
104 extern void smp_release_cpus(void);
105
106 int have_of = 1;
107 int boot_cpuid = 0;
108 int boot_cpuid_phys = 0;
109 dev_t boot_dev;
110 u64 ppc64_pft_size;
111
112 struct ppc64_caches ppc64_caches;
113 EXPORT_SYMBOL_GPL(ppc64_caches);
114
115 /*
116  * These are used in binfmt_elf.c to put aux entries on the stack
117  * for each elf executable being started.
118  */
119 int dcache_bsize;
120 int icache_bsize;
121 int ucache_bsize;
122
123 /* The main machine-dep calls structure
124  */
125 struct machdep_calls ppc_md;
126 EXPORT_SYMBOL(ppc_md);
127
128 #ifdef CONFIG_MAGIC_SYSRQ
129 unsigned long SYSRQ_KEY;
130 #endif /* CONFIG_MAGIC_SYSRQ */
131
132
133 static int ppc64_panic_event(struct notifier_block *, unsigned long, void *);
134 static struct notifier_block ppc64_panic_block = {
135         .notifier_call = ppc64_panic_event,
136         .priority = INT_MIN /* may not return; must be done last */
137 };
138
139 /*
140  * Perhaps we can put the pmac screen_info[] here
141  * on pmac as well so we don't need the ifdef's.
142  * Until we get multiple-console support in here
143  * that is.  -- Cort
144  * Maybe tie it to serial consoles, since this is really what
145  * these processors use on existing boards.  -- Dan
146  */ 
147 struct screen_info screen_info = {
148         .orig_x = 0,
149         .orig_y = 25,
150         .orig_video_cols = 80,
151         .orig_video_lines = 25,
152         .orig_video_isVGA = 1,
153         .orig_video_points = 16
154 };
155
156 #if defined(CONFIG_PPC_MULTIPLATFORM) && defined(CONFIG_SMP)
157
158 static int smt_enabled_cmdline;
159
160 /* Look for ibm,smt-enabled OF option */
161 static void check_smt_enabled(void)
162 {
163         struct device_node *dn;
164         char *smt_option;
165
166         /* Allow the command line to overrule the OF option */
167         if (smt_enabled_cmdline)
168                 return;
169
170         dn = of_find_node_by_path("/options");
171
172         if (dn) {
173                 smt_option = (char *)get_property(dn, "ibm,smt-enabled", NULL);
174
175                 if (smt_option) {
176                         if (!strcmp(smt_option, "on"))
177                                 smt_enabled_at_boot = 1;
178                         else if (!strcmp(smt_option, "off"))
179                                 smt_enabled_at_boot = 0;
180                 }
181         }
182 }
183
184 /* Look for smt-enabled= cmdline option */
185 static int __init early_smt_enabled(char *p)
186 {
187         smt_enabled_cmdline = 1;
188
189         if (!p)
190                 return 0;
191
192         if (!strcmp(p, "on") || !strcmp(p, "1"))
193                 smt_enabled_at_boot = 1;
194         else if (!strcmp(p, "off") || !strcmp(p, "0"))
195                 smt_enabled_at_boot = 0;
196
197         return 0;
198 }
199 early_param("smt-enabled", early_smt_enabled);
200
201 /**
202  * setup_cpu_maps - initialize the following cpu maps:
203  *                  cpu_possible_map
204  *                  cpu_present_map
205  *                  cpu_sibling_map
206  *
207  * Having the possible map set up early allows us to restrict allocations
208  * of things like irqstacks to num_possible_cpus() rather than NR_CPUS.
209  *
210  * We do not initialize the online map here; cpus set their own bits in
211  * cpu_online_map as they come up.
212  *
213  * This function is valid only for Open Firmware systems.  finish_device_tree
214  * must be called before using this.
215  *
216  * While we're here, we may as well set the "physical" cpu ids in the paca.
217  */
218 static void __init setup_cpu_maps(void)
219 {
220         struct device_node *dn = NULL;
221         int cpu = 0;
222         int swap_cpuid = 0;
223
224         check_smt_enabled();
225
226         while ((dn = of_find_node_by_type(dn, "cpu")) && cpu < NR_CPUS) {
227                 u32 *intserv;
228                 int j, len = sizeof(u32), nthreads;
229
230                 intserv = (u32 *)get_property(dn, "ibm,ppc-interrupt-server#s",
231                                               &len);
232                 if (!intserv)
233                         intserv = (u32 *)get_property(dn, "reg", NULL);
234
235                 nthreads = len / sizeof(u32);
236
237                 for (j = 0; j < nthreads && cpu < NR_CPUS; j++) {
238                         cpu_set(cpu, cpu_present_map);
239                         set_hard_smp_processor_id(cpu, intserv[j]);
240
241                         if (intserv[j] == boot_cpuid_phys)
242                                 swap_cpuid = cpu;
243                         cpu_set(cpu, cpu_possible_map);
244                         cpu++;
245                 }
246         }
247
248         /* Swap CPU id 0 with boot_cpuid_phys, so we can always assume that
249          * boot cpu is logical 0.
250          */
251         if (boot_cpuid_phys != get_hard_smp_processor_id(0)) {
252                 u32 tmp;
253                 tmp = get_hard_smp_processor_id(0);
254                 set_hard_smp_processor_id(0, boot_cpuid_phys);
255                 set_hard_smp_processor_id(swap_cpuid, tmp);
256         }
257
258         /*
259          * On pSeries LPAR, we need to know how many cpus
260          * could possibly be added to this partition.
261          */
262         if (systemcfg->platform == PLATFORM_PSERIES_LPAR &&
263                                 (dn = of_find_node_by_path("/rtas"))) {
264                 int num_addr_cell, num_size_cell, maxcpus;
265                 unsigned int *ireg;
266
267                 num_addr_cell = prom_n_addr_cells(dn);
268                 num_size_cell = prom_n_size_cells(dn);
269
270                 ireg = (unsigned int *)
271                         get_property(dn, "ibm,lrdr-capacity", NULL);
272
273                 if (!ireg)
274                         goto out;
275
276                 maxcpus = ireg[num_addr_cell + num_size_cell];
277
278                 /* Double maxcpus for processors which have SMT capability */
279                 if (cpu_has_feature(CPU_FTR_SMT))
280                         maxcpus *= 2;
281
282                 if (maxcpus > NR_CPUS) {
283                         printk(KERN_WARNING
284                                "Partition configured for %d cpus, "
285                                "operating system maximum is %d.\n",
286                                maxcpus, NR_CPUS);
287                         maxcpus = NR_CPUS;
288                 } else
289                         printk(KERN_INFO "Partition configured for %d cpus.\n",
290                                maxcpus);
291
292                 for (cpu = 0; cpu < maxcpus; cpu++)
293                         cpu_set(cpu, cpu_possible_map);
294         out:
295                 of_node_put(dn);
296         }
297
298         /*
299          * Do the sibling map; assume only two threads per processor.
300          */
301         for_each_cpu(cpu) {
302                 cpu_set(cpu, cpu_sibling_map[cpu]);
303                 if (cpu_has_feature(CPU_FTR_SMT))
304                         cpu_set(cpu ^ 0x1, cpu_sibling_map[cpu]);
305         }
306
307         systemcfg->processorCount = num_present_cpus();
308 }
309 #endif /* defined(CONFIG_PPC_MULTIPLATFORM) && defined(CONFIG_SMP) */
310
311
312 #ifdef CONFIG_PPC_MULTIPLATFORM
313
314 extern struct machdep_calls pSeries_md;
315 extern struct machdep_calls pmac_md;
316 extern struct machdep_calls maple_md;
317 extern struct machdep_calls bpa_md;
318
319 /* Ultimately, stuff them in an elf section like initcalls... */
320 static struct machdep_calls __initdata *machines[] = {
321 #ifdef CONFIG_PPC_PSERIES
322         &pSeries_md,
323 #endif /* CONFIG_PPC_PSERIES */
324 #ifdef CONFIG_PPC_PMAC
325         &pmac_md,
326 #endif /* CONFIG_PPC_PMAC */
327 #ifdef CONFIG_PPC_MAPLE
328         &maple_md,
329 #endif /* CONFIG_PPC_MAPLE */
330 #ifdef CONFIG_PPC_BPA
331         &bpa_md,
332 #endif
333         NULL
334 };
335
336 /*
337  * Early initialization entry point. This is called by head.S
338  * with MMU translation disabled. We rely on the "feature" of
339  * the CPU that ignores the top 2 bits of the address in real
340  * mode so we can access kernel globals normally provided we
341  * only toy with things in the RMO region. From here, we do
342  * some early parsing of the device-tree to setup out LMB
343  * data structures, and allocate & initialize the hash table
344  * and segment tables so we can start running with translation
345  * enabled.
346  *
347  * It is this function which will call the probe() callback of
348  * the various platform types and copy the matching one to the
349  * global ppc_md structure. Your platform can eventually do
350  * some very early initializations from the probe() routine, but
351  * this is not recommended, be very careful as, for example, the
352  * device-tree is not accessible via normal means at this point.
353  */
354
355 void __init early_setup(unsigned long dt_ptr)
356 {
357         struct paca_struct *lpaca = get_paca();
358         static struct machdep_calls **mach;
359
360         /*
361          * Enable early debugging if any specified (see top of
362          * this file)
363          */
364         EARLY_DEBUG_INIT();
365
366         DBG(" -> early_setup()\n");
367
368         /*
369          * Fill the default DBG level (do we want to keep
370          * that old mecanism around forever ?)
371          */
372         ppcdbg_initialize();
373
374         /*
375          * Do early initializations using the flattened device
376          * tree, like retreiving the physical memory map or
377          * calculating/retreiving the hash table size
378          */
379         early_init_devtree(__va(dt_ptr));
380
381         /*
382          * Iterate all ppc_md structures until we find the proper
383          * one for the current machine type
384          */
385         DBG("Probing machine type for platform %x...\n",
386             systemcfg->platform);
387
388         for (mach = machines; *mach; mach++) {
389                 if ((*mach)->probe(systemcfg->platform))
390                         break;
391         }
392         /* What can we do if we didn't find ? */
393         if (*mach == NULL) {
394                 DBG("No suitable machine found !\n");
395                 for (;;);
396         }
397         ppc_md = **mach;
398
399         DBG("Found, Initializing memory management...\n");
400
401         /*
402          * Initialize stab / SLB management
403          */
404         stab_initialize(lpaca->stab_real);
405
406         /*
407          * Initialize the MMU Hash table and create the linear mapping
408          * of memory
409          */
410         htab_initialize();
411
412         DBG(" <- early_setup()\n");
413 }
414
415
416 /*
417  * Initialize some remaining members of the ppc64_caches and systemcfg structures
418  * (at least until we get rid of them completely). This is mostly some
419  * cache informations about the CPU that will be used by cache flush
420  * routines and/or provided to userland
421  */
422 static void __init initialize_cache_info(void)
423 {
424         struct device_node *np;
425         unsigned long num_cpus = 0;
426
427         DBG(" -> initialize_cache_info()\n");
428
429         for (np = NULL; (np = of_find_node_by_type(np, "cpu"));) {
430                 num_cpus += 1;
431
432                 /* We're assuming *all* of the CPUs have the same
433                  * d-cache and i-cache sizes... -Peter
434                  */
435
436                 if ( num_cpus == 1 ) {
437                         u32 *sizep, *lsizep;
438                         u32 size, lsize;
439                         const char *dc, *ic;
440
441                         /* Then read cache informations */
442                         if (systemcfg->platform == PLATFORM_POWERMAC) {
443                                 dc = "d-cache-block-size";
444                                 ic = "i-cache-block-size";
445                         } else {
446                                 dc = "d-cache-line-size";
447                                 ic = "i-cache-line-size";
448                         }
449
450                         size = 0;
451                         lsize = cur_cpu_spec->dcache_bsize;
452                         sizep = (u32 *)get_property(np, "d-cache-size", NULL);
453                         if (sizep != NULL)
454                                 size = *sizep;
455                         lsizep = (u32 *) get_property(np, dc, NULL);
456                         if (lsizep != NULL)
457                                 lsize = *lsizep;
458                         if (sizep == 0 || lsizep == 0)
459                                 DBG("Argh, can't find dcache properties ! "
460                                     "sizep: %p, lsizep: %p\n", sizep, lsizep);
461
462                         systemcfg->dcache_size = ppc64_caches.dsize = size;
463                         systemcfg->dcache_line_size =
464                                 ppc64_caches.dline_size = lsize;
465                         ppc64_caches.log_dline_size = __ilog2(lsize);
466                         ppc64_caches.dlines_per_page = PAGE_SIZE / lsize;
467
468                         size = 0;
469                         lsize = cur_cpu_spec->icache_bsize;
470                         sizep = (u32 *)get_property(np, "i-cache-size", NULL);
471                         if (sizep != NULL)
472                                 size = *sizep;
473                         lsizep = (u32 *)get_property(np, ic, NULL);
474                         if (lsizep != NULL)
475                                 lsize = *lsizep;
476                         if (sizep == 0 || lsizep == 0)
477                                 DBG("Argh, can't find icache properties ! "
478                                     "sizep: %p, lsizep: %p\n", sizep, lsizep);
479
480                         systemcfg->icache_size = ppc64_caches.isize = size;
481                         systemcfg->icache_line_size =
482                                 ppc64_caches.iline_size = lsize;
483                         ppc64_caches.log_iline_size = __ilog2(lsize);
484                         ppc64_caches.ilines_per_page = PAGE_SIZE / lsize;
485                 }
486         }
487
488         /* Add an eye catcher and the systemcfg layout version number */
489         strcpy(systemcfg->eye_catcher, "SYSTEMCFG:PPC64");
490         systemcfg->version.major = SYSTEMCFG_MAJOR;
491         systemcfg->version.minor = SYSTEMCFG_MINOR;
492         systemcfg->processor = mfspr(SPRN_PVR);
493
494         DBG(" <- initialize_cache_info()\n");
495 }
496
497 static void __init check_for_initrd(void)
498 {
499 #ifdef CONFIG_BLK_DEV_INITRD
500         u64 *prop;
501
502         DBG(" -> check_for_initrd()\n");
503
504         if (of_chosen) {
505                 prop = (u64 *)get_property(of_chosen,
506                                 "linux,initrd-start", NULL);
507                 if (prop != NULL) {
508                         initrd_start = (unsigned long)__va(*prop);
509                         prop = (u64 *)get_property(of_chosen,
510                                         "linux,initrd-end", NULL);
511                         if (prop != NULL) {
512                                 initrd_end = (unsigned long)__va(*prop);
513                                 initrd_below_start_ok = 1;
514                         } else
515                                 initrd_start = 0;
516                 }
517         }
518
519         /* If we were passed an initrd, set the ROOT_DEV properly if the values
520          * look sensible. If not, clear initrd reference.
521          */
522         if (initrd_start >= KERNELBASE && initrd_end >= KERNELBASE &&
523             initrd_end > initrd_start)
524                 ROOT_DEV = Root_RAM0;
525         else
526                 initrd_start = initrd_end = 0;
527
528         if (initrd_start)
529                 printk("Found initrd at 0x%lx:0x%lx\n", initrd_start, initrd_end);
530
531         DBG(" <- check_for_initrd()\n");
532 #endif /* CONFIG_BLK_DEV_INITRD */
533 }
534
535 #endif /* CONFIG_PPC_MULTIPLATFORM */
536
537 /*
538  * Do some initial setup of the system.  The parameters are those which 
539  * were passed in from the bootloader.
540  */
541 void __init setup_system(void)
542 {
543         DBG(" -> setup_system()\n");
544
545 #ifdef CONFIG_PPC_ISERIES
546         /* pSeries systems are identified in prom.c via OF. */
547         if (itLpNaca.xLparInstalled == 1)
548                 systemcfg->platform = PLATFORM_ISERIES_LPAR;
549
550         ppc_md.init_early();
551 #else /* CONFIG_PPC_ISERIES */
552
553         /*
554          * Unflatten the device-tree passed by prom_init or kexec
555          */
556         unflatten_device_tree();
557
558         /*
559          * Fill the ppc64_caches & systemcfg structures with informations
560          * retreived from the device-tree. Need to be called before
561          * finish_device_tree() since the later requires some of the
562          * informations filled up here to properly parse the interrupt
563          * tree.
564          * It also sets up the cache line sizes which allows to call
565          * routines like flush_icache_range (used by the hash init
566          * later on).
567          */
568         initialize_cache_info();
569
570 #ifdef CONFIG_PPC_RTAS
571         /*
572          * Initialize RTAS if available
573          */
574         rtas_initialize();
575 #endif /* CONFIG_PPC_RTAS */
576
577         /*
578          * Check if we have an initrd provided via the device-tree
579          */
580         check_for_initrd();
581
582         /*
583          * Do some platform specific early initializations, that includes
584          * setting up the hash table pointers. It also sets up some interrupt-mapping
585          * related options that will be used by finish_device_tree()
586          */
587         ppc_md.init_early();
588
589         /*
590          * "Finish" the device-tree, that is do the actual parsing of
591          * some of the properties like the interrupt map
592          */
593         finish_device_tree();
594
595         /*
596          * Initialize xmon
597          */
598 #ifdef CONFIG_XMON_DEFAULT
599         xmon_init(1);
600 #endif
601         /*
602          * Register early console
603          */
604         register_early_udbg_console();
605
606         /* Save unparsed command line copy for /proc/cmdline */
607         strlcpy(saved_command_line, cmd_line, COMMAND_LINE_SIZE);
608
609         parse_early_param();
610 #endif /* !CONFIG_PPC_ISERIES */
611
612 #if defined(CONFIG_SMP) && !defined(CONFIG_PPC_ISERIES)
613         /*
614          * iSeries has already initialized the cpu maps at this point.
615          */
616         setup_cpu_maps();
617
618         /* Release secondary cpus out of their spinloops at 0x60 now that
619          * we can map physical -> logical CPU ids
620          */
621         smp_release_cpus();
622 #endif /* defined(CONFIG_SMP) && !defined(CONFIG_PPC_ISERIES) */
623
624         printk("Starting Linux PPC64 %s\n", UTS_RELEASE);
625
626         printk("-----------------------------------------------------\n");
627         printk("ppc64_pft_size                = 0x%lx\n", ppc64_pft_size);
628         printk("ppc64_debug_switch            = 0x%lx\n", ppc64_debug_switch);
629         printk("ppc64_interrupt_controller    = 0x%ld\n", ppc64_interrupt_controller);
630         printk("systemcfg                     = 0x%p\n", systemcfg);
631         printk("systemcfg->platform           = 0x%x\n", systemcfg->platform);
632         printk("systemcfg->processorCount     = 0x%lx\n", systemcfg->processorCount);
633         printk("systemcfg->physicalMemorySize = 0x%lx\n", systemcfg->physicalMemorySize);
634         printk("ppc64_caches.dcache_line_size = 0x%x\n",
635                         ppc64_caches.dline_size);
636         printk("ppc64_caches.icache_line_size = 0x%x\n",
637                         ppc64_caches.iline_size);
638         printk("htab_address                  = 0x%p\n", htab_address);
639         printk("htab_hash_mask                = 0x%lx\n", htab_hash_mask);
640         printk("-----------------------------------------------------\n");
641
642         mm_init_ppc64();
643
644         DBG(" <- setup_system()\n");
645 }
646
647 /* also used by kexec */
648 void machine_shutdown(void)
649 {
650         if (ppc_md.nvram_sync)
651                 ppc_md.nvram_sync();
652 }
653
654 void machine_restart(char *cmd)
655 {
656         machine_shutdown();
657         ppc_md.restart(cmd);
658 #ifdef CONFIG_SMP
659         smp_send_stop();
660 #endif
661         printk(KERN_EMERG "System Halted, OK to turn off power\n");
662         local_irq_disable();
663         while (1) ;
664 }
665
666 void machine_power_off(void)
667 {
668         machine_shutdown();
669         ppc_md.power_off();
670 #ifdef CONFIG_SMP
671         smp_send_stop();
672 #endif
673         printk(KERN_EMERG "System Halted, OK to turn off power\n");
674         local_irq_disable();
675         while (1) ;
676 }
677 /* Used by the G5 thermal driver */
678 EXPORT_SYMBOL_GPL(machine_power_off);
679
680 void machine_halt(void)
681 {
682         machine_shutdown();
683         ppc_md.halt();
684 #ifdef CONFIG_SMP
685         smp_send_stop();
686 #endif
687         printk(KERN_EMERG "System Halted, OK to turn off power\n");
688         local_irq_disable();
689         while (1) ;
690 }
691
692 static int ppc64_panic_event(struct notifier_block *this,
693                              unsigned long event, void *ptr)
694 {
695         ppc_md.panic((char *)ptr);  /* May not return */
696         return NOTIFY_DONE;
697 }
698
699
700 #ifdef CONFIG_SMP
701 DEFINE_PER_CPU(unsigned int, pvr);
702 #endif
703
704 static int show_cpuinfo(struct seq_file *m, void *v)
705 {
706         unsigned long cpu_id = (unsigned long)v - 1;
707         unsigned int pvr;
708         unsigned short maj;
709         unsigned short min;
710
711         if (cpu_id == NR_CPUS) {
712                 seq_printf(m, "timebase\t: %lu\n", ppc_tb_freq);
713
714                 if (ppc_md.get_cpuinfo != NULL)
715                         ppc_md.get_cpuinfo(m);
716
717                 return 0;
718         }
719
720         /* We only show online cpus: disable preempt (overzealous, I
721          * knew) to prevent cpu going down. */
722         preempt_disable();
723         if (!cpu_online(cpu_id)) {
724                 preempt_enable();
725                 return 0;
726         }
727
728 #ifdef CONFIG_SMP
729         pvr = per_cpu(pvr, cpu_id);
730 #else
731         pvr = mfspr(SPRN_PVR);
732 #endif
733         maj = (pvr >> 8) & 0xFF;
734         min = pvr & 0xFF;
735
736         seq_printf(m, "processor\t: %lu\n", cpu_id);
737         seq_printf(m, "cpu\t\t: ");
738
739         if (cur_cpu_spec->pvr_mask)
740                 seq_printf(m, "%s", cur_cpu_spec->cpu_name);
741         else
742                 seq_printf(m, "unknown (%08x)", pvr);
743
744 #ifdef CONFIG_ALTIVEC
745         if (cpu_has_feature(CPU_FTR_ALTIVEC))
746                 seq_printf(m, ", altivec supported");
747 #endif /* CONFIG_ALTIVEC */
748
749         seq_printf(m, "\n");
750
751         /*
752          * Assume here that all clock rates are the same in a
753          * smp system.  -- Cort
754          */
755         seq_printf(m, "clock\t\t: %lu.%06luMHz\n", ppc_proc_freq / 1000000,
756                    ppc_proc_freq % 1000000);
757
758         seq_printf(m, "revision\t: %hd.%hd\n\n", maj, min);
759
760         preempt_enable();
761         return 0;
762 }
763
764 static void *c_start(struct seq_file *m, loff_t *pos)
765 {
766         return *pos <= NR_CPUS ? (void *)((*pos)+1) : NULL;
767 }
768 static void *c_next(struct seq_file *m, void *v, loff_t *pos)
769 {
770         ++*pos;
771         return c_start(m, pos);
772 }
773 static void c_stop(struct seq_file *m, void *v)
774 {
775 }
776 struct seq_operations cpuinfo_op = {
777         .start =c_start,
778         .next = c_next,
779         .stop = c_stop,
780         .show = show_cpuinfo,
781 };
782
783 /*
784  * These three variables are used to save values passed to us by prom_init()
785  * via the device tree. The TCE variables are needed because with a memory_limit
786  * in force we may need to explicitly map the TCE are at the top of RAM.
787  */
788 unsigned long memory_limit;
789 unsigned long tce_alloc_start;
790 unsigned long tce_alloc_end;
791
792 #ifdef CONFIG_PPC_ISERIES
793 /*
794  * On iSeries we just parse the mem=X option from the command line.
795  * On pSeries it's a bit more complicated, see prom_init_mem()
796  */
797 static int __init early_parsemem(char *p)
798 {
799         if (!p)
800                 return 0;
801
802         memory_limit = ALIGN(memparse(p, &p), PAGE_SIZE);
803
804         return 0;
805 }
806 early_param("mem", early_parsemem);
807 #endif /* CONFIG_PPC_ISERIES */
808
809 #ifdef CONFIG_PPC_MULTIPLATFORM
810 static int __init set_preferred_console(void)
811 {
812         struct device_node *prom_stdout = NULL;
813         char *name;
814         u32 *spd;
815         int offset = 0;
816
817         DBG(" -> set_preferred_console()\n");
818
819         /* The user has requested a console so this is already set up. */
820         if (strstr(saved_command_line, "console=")) {
821                 DBG(" console was specified !\n");
822                 return -EBUSY;
823         }
824
825         if (!of_chosen) {
826                 DBG(" of_chosen is NULL !\n");
827                 return -ENODEV;
828         }
829         /* We are getting a weird phandle from OF ... */
830         /* ... So use the full path instead */
831         name = (char *)get_property(of_chosen, "linux,stdout-path", NULL);
832         if (name == NULL) {
833                 DBG(" no linux,stdout-path !\n");
834                 return -ENODEV;
835         }
836         prom_stdout = of_find_node_by_path(name);
837         if (!prom_stdout) {
838                 DBG(" can't find stdout package %s !\n", name);
839                 return -ENODEV;
840         }       
841         DBG("stdout is %s\n", prom_stdout->full_name);
842
843         name = (char *)get_property(prom_stdout, "name", NULL);
844         if (!name) {
845                 DBG(" stdout package has no name !\n");
846                 goto not_found;
847         }
848         spd = (u32 *)get_property(prom_stdout, "current-speed", NULL);
849
850         if (0)
851                 ;
852 #ifdef CONFIG_SERIAL_8250_CONSOLE
853         else if (strcmp(name, "serial") == 0) {
854                 int i;
855                 u32 *reg = (u32 *)get_property(prom_stdout, "reg", &i);
856                 if (i > 8) {
857                         switch (reg[1]) {
858                                 case 0x3f8:
859                                         offset = 0;
860                                         break;
861                                 case 0x2f8:
862                                         offset = 1;
863                                         break;
864                                 case 0x898:
865                                         offset = 2;
866                                         break;
867                                 case 0x890:
868                                         offset = 3;
869                                         break;
870                                 default:
871                                         /* We dont recognise the serial port */
872                                         goto not_found;
873                         }
874                 }
875         }
876 #endif /* CONFIG_SERIAL_8250_CONSOLE */
877 #ifdef CONFIG_PPC_PSERIES
878         else if (strcmp(name, "vty") == 0) {
879                 u32 *reg = (u32 *)get_property(prom_stdout, "reg", NULL);
880                 char *compat = (char *)get_property(prom_stdout, "compatible", NULL);
881
882                 if (reg && compat && (strcmp(compat, "hvterm-protocol") == 0)) {
883                         /* Host Virtual Serial Interface */
884                         int offset;
885                         switch (reg[0]) {
886                                 case 0x30000000:
887                                         offset = 0;
888                                         break;
889                                 case 0x30000001:
890                                         offset = 1;
891                                         break;
892                                 default:
893                                         goto not_found;
894                         }
895                         of_node_put(prom_stdout);
896                         DBG("Found hvsi console at offset %d\n", offset);
897                         return add_preferred_console("hvsi", offset, NULL);
898                 } else {
899                         /* pSeries LPAR virtual console */
900                         of_node_put(prom_stdout);
901                         DBG("Found hvc console\n");
902                         return add_preferred_console("hvc", 0, NULL);
903                 }
904         }
905 #endif /* CONFIG_PPC_PSERIES */
906 #ifdef CONFIG_SERIAL_PMACZILOG_CONSOLE
907         else if (strcmp(name, "ch-a") == 0)
908                 offset = 0;
909         else if (strcmp(name, "ch-b") == 0)
910                 offset = 1;
911 #endif /* CONFIG_SERIAL_PMACZILOG_CONSOLE */
912         else
913                 goto not_found;
914         of_node_put(prom_stdout);
915
916         DBG("Found serial console at ttyS%d\n", offset);
917
918         if (spd) {
919                 static char __initdata opt[16];
920                 sprintf(opt, "%d", *spd);
921                 return add_preferred_console("ttyS", offset, opt);
922         } else
923                 return add_preferred_console("ttyS", offset, NULL);
924
925  not_found:
926         DBG("No preferred console found !\n");
927         of_node_put(prom_stdout);
928         return -ENODEV;
929 }
930 console_initcall(set_preferred_console);
931 #endif /* CONFIG_PPC_MULTIPLATFORM */
932
933 #ifdef CONFIG_IRQSTACKS
934 static void __init irqstack_early_init(void)
935 {
936         unsigned int i;
937
938         /*
939          * interrupt stacks must be under 256MB, we cannot afford to take
940          * SLB misses on them.
941          */
942         for_each_cpu(i) {
943                 softirq_ctx[i] = (struct thread_info *)__va(lmb_alloc_base(THREAD_SIZE,
944                                         THREAD_SIZE, 0x10000000));
945                 hardirq_ctx[i] = (struct thread_info *)__va(lmb_alloc_base(THREAD_SIZE,
946                                         THREAD_SIZE, 0x10000000));
947         }
948 }
949 #else
950 #define irqstack_early_init()
951 #endif
952
953 /*
954  * Stack space used when we detect a bad kernel stack pointer, and
955  * early in SMP boots before relocation is enabled.
956  */
957 static void __init emergency_stack_init(void)
958 {
959         unsigned long limit;
960         unsigned int i;
961
962         /*
963          * Emergency stacks must be under 256MB, we cannot afford to take
964          * SLB misses on them. The ABI also requires them to be 128-byte
965          * aligned.
966          *
967          * Since we use these as temporary stacks during secondary CPU
968          * bringup, we need to get at them in real mode. This means they
969          * must also be within the RMO region.
970          */
971         limit = min(0x10000000UL, lmb.rmo_size);
972
973         for_each_cpu(i)
974                 paca[i].emergency_sp = __va(lmb_alloc_base(PAGE_SIZE, 128,
975                                                 limit)) + PAGE_SIZE;
976 }
977
978 /*
979  * Called from setup_arch to initialize the bitmap of available
980  * syscalls in the systemcfg page
981  */
982 void __init setup_syscall_map(void)
983 {
984         unsigned int i, count64 = 0, count32 = 0;
985         extern unsigned long *sys_call_table;
986         extern unsigned long *sys_call_table32;
987         extern unsigned long sys_ni_syscall;
988
989
990         for (i = 0; i < __NR_syscalls; i++) {
991                 if (sys_call_table[i] == sys_ni_syscall)
992                         continue;
993                 count64++;
994                 systemcfg->syscall_map_64[i >> 5] |= 0x80000000UL >> (i & 0x1f);
995         }
996         for (i = 0; i < __NR_syscalls; i++) {
997                 if (sys_call_table32[i] == sys_ni_syscall)
998                         continue;
999                 count32++;
1000                 systemcfg->syscall_map_32[i >> 5] |= 0x80000000UL >> (i & 0x1f);
1001         }
1002         printk(KERN_INFO "Syscall map setup, %d 32 bits and %d 64 bits syscalls\n",
1003                count32, count64);
1004 }
1005
1006 /*
1007  * Called into from start_kernel, after lock_kernel has been called.
1008  * Initializes bootmem, which is unsed to manage page allocation until
1009  * mem_init is called.
1010  */
1011 void __init setup_arch(char **cmdline_p)
1012 {
1013         extern void do_init_bootmem(void);
1014
1015         ppc64_boot_msg(0x12, "Setup Arch");
1016
1017         *cmdline_p = cmd_line;
1018
1019         /*
1020          * Set cache line size based on type of cpu as a default.
1021          * Systems with OF can look in the properties on the cpu node(s)
1022          * for a possibly more accurate value.
1023          */
1024         dcache_bsize = ppc64_caches.dline_size;
1025         icache_bsize = ppc64_caches.iline_size;
1026
1027         /* reboot on panic */
1028         panic_timeout = 180;
1029
1030         if (ppc_md.panic)
1031                 notifier_chain_register(&panic_notifier_list, &ppc64_panic_block);
1032
1033         init_mm.start_code = PAGE_OFFSET;
1034         init_mm.end_code = (unsigned long) _etext;
1035         init_mm.end_data = (unsigned long) _edata;
1036         init_mm.brk = klimit;
1037         
1038         irqstack_early_init();
1039         emergency_stack_init();
1040
1041         stabs_alloc();
1042
1043         /* set up the bootmem stuff with available memory */
1044         do_init_bootmem();
1045         sparse_init();
1046
1047         /* initialize the syscall map in systemcfg */
1048         setup_syscall_map();
1049
1050         ppc_md.setup_arch();
1051
1052         /* Use the default idle loop if the platform hasn't provided one. */
1053         if (NULL == ppc_md.idle_loop) {
1054                 ppc_md.idle_loop = default_idle;
1055                 printk(KERN_INFO "Using default idle loop\n");
1056         }
1057
1058         paging_init();
1059         ppc64_boot_msg(0x15, "Setup Done");
1060 }
1061
1062
1063 /* ToDo: do something useful if ppc_md is not yet setup. */
1064 #define PPC64_LINUX_FUNCTION 0x0f000000
1065 #define PPC64_IPL_MESSAGE 0xc0000000
1066 #define PPC64_TERM_MESSAGE 0xb0000000
1067 #define PPC64_ATTN_MESSAGE 0xa0000000
1068 #define PPC64_DUMP_MESSAGE 0xd0000000
1069
1070 static void ppc64_do_msg(unsigned int src, const char *msg)
1071 {
1072         if (ppc_md.progress) {
1073                 char buf[128];
1074
1075                 sprintf(buf, "%08X\n", src);
1076                 ppc_md.progress(buf, 0);
1077                 snprintf(buf, 128, "%s", msg);
1078                 ppc_md.progress(buf, 0);
1079         }
1080 }
1081
1082 /* Print a boot progress message. */
1083 void ppc64_boot_msg(unsigned int src, const char *msg)
1084 {
1085         ppc64_do_msg(PPC64_LINUX_FUNCTION|PPC64_IPL_MESSAGE|src, msg);
1086         printk("[boot]%04x %s\n", src, msg);
1087 }
1088
1089 /* Print a termination message (print only -- does not stop the kernel) */
1090 void ppc64_terminate_msg(unsigned int src, const char *msg)
1091 {
1092         ppc64_do_msg(PPC64_LINUX_FUNCTION|PPC64_TERM_MESSAGE|src, msg);
1093         printk("[terminate]%04x %s\n", src, msg);
1094 }
1095
1096 /* Print something that needs attention (device error, etc) */
1097 void ppc64_attention_msg(unsigned int src, const char *msg)
1098 {
1099         ppc64_do_msg(PPC64_LINUX_FUNCTION|PPC64_ATTN_MESSAGE|src, msg);
1100         printk("[attention]%04x %s\n", src, msg);
1101 }
1102
1103 /* Print a dump progress message. */
1104 void ppc64_dump_msg(unsigned int src, const char *msg)
1105 {
1106         ppc64_do_msg(PPC64_LINUX_FUNCTION|PPC64_DUMP_MESSAGE|src, msg);
1107         printk("[dump]%04x %s\n", src, msg);
1108 }
1109
1110 /* This should only be called on processor 0 during calibrate decr */
1111 void __init setup_default_decr(void)
1112 {
1113         struct paca_struct *lpaca = get_paca();
1114
1115         lpaca->default_decr = tb_ticks_per_jiffy;
1116         lpaca->next_jiffy_update_tb = get_tb() + tb_ticks_per_jiffy;
1117 }
1118
1119 #ifndef CONFIG_PPC_ISERIES
1120 /*
1121  * This function can be used by platforms to "find" legacy serial ports.
1122  * It works for "serial" nodes under an "isa" node, and will try to
1123  * respect the "ibm,aix-loc" property if any. It works with up to 8
1124  * ports.
1125  */
1126
1127 #define MAX_LEGACY_SERIAL_PORTS 8
1128 static struct plat_serial8250_port serial_ports[MAX_LEGACY_SERIAL_PORTS+1];
1129 static unsigned int old_serial_count;
1130
1131 void __init generic_find_legacy_serial_ports(u64 *physport,
1132                 unsigned int *default_speed)
1133 {
1134         struct device_node *np;
1135         u32 *sizeprop;
1136
1137         struct isa_reg_property {
1138                 u32 space;
1139                 u32 address;
1140                 u32 size;
1141         };
1142         struct pci_reg_property {
1143                 struct pci_address addr;
1144                 u32 size_hi;
1145                 u32 size_lo;
1146         };                                                                        
1147
1148         DBG(" -> generic_find_legacy_serial_port()\n");
1149
1150         *physport = 0;
1151         if (default_speed)
1152                 *default_speed = 0;
1153
1154         np = of_find_node_by_path("/");
1155         if (!np)
1156                 return;
1157
1158         /* First fill our array */
1159         for (np = NULL; (np = of_find_node_by_type(np, "serial"));) {
1160                 struct device_node *isa, *pci;
1161                 struct isa_reg_property *reg;
1162                 unsigned long phys_size, addr_size, io_base;
1163                 u32 *rangesp;
1164                 u32 *interrupts, *clk, *spd;
1165                 char *typep;
1166                 int index, rlen, rentsize;
1167
1168                 /* Ok, first check if it's under an "isa" parent */
1169                 isa = of_get_parent(np);
1170                 if (!isa || strcmp(isa->name, "isa")) {
1171                         DBG("%s: no isa parent found\n", np->full_name);
1172                         continue;
1173                 }
1174                 
1175                 /* Now look for an "ibm,aix-loc" property that gives us ordering
1176                  * if any...
1177                  */
1178                 typep = (char *)get_property(np, "ibm,aix-loc", NULL);
1179
1180                 /* Get the ISA port number */
1181                 reg = (struct isa_reg_property *)get_property(np, "reg", NULL); 
1182                 if (reg == NULL)
1183                         goto next_port;
1184                 /* We assume the interrupt number isn't translated ... */
1185                 interrupts = (u32 *)get_property(np, "interrupts", NULL);
1186                 /* get clock freq. if present */
1187                 clk = (u32 *)get_property(np, "clock-frequency", NULL);
1188                 /* get default speed if present */
1189                 spd = (u32 *)get_property(np, "current-speed", NULL);
1190                 /* Default to locate at end of array */
1191                 index = old_serial_count; /* end of the array by default */
1192
1193                 /* If we have a location index, then use it */
1194                 if (typep && *typep == 'S') {
1195                         index = simple_strtol(typep+1, NULL, 0) - 1;
1196                         /* if index is out of range, use end of array instead */
1197                         if (index >= MAX_LEGACY_SERIAL_PORTS)
1198                                 index = old_serial_count;
1199                         /* if our index is still out of range, that mean that
1200                          * array is full, we could scan for a free slot but that
1201                          * make little sense to bother, just skip the port
1202                          */
1203                         if (index >= MAX_LEGACY_SERIAL_PORTS)
1204                                 goto next_port;
1205                         if (index >= old_serial_count)
1206                                 old_serial_count = index + 1;
1207                         /* Check if there is a port who already claimed our slot */
1208                         if (serial_ports[index].iobase != 0) {
1209                                 /* if we still have some room, move it, else override */
1210                                 if (old_serial_count < MAX_LEGACY_SERIAL_PORTS) {
1211                                         DBG("Moved legacy port %d -> %d\n", index,
1212                                             old_serial_count);
1213                                         serial_ports[old_serial_count++] =
1214                                                 serial_ports[index];
1215                                 } else {
1216                                         DBG("Replacing legacy port %d\n", index);
1217                                 }
1218                         }
1219                 }
1220                 if (index >= MAX_LEGACY_SERIAL_PORTS)
1221                         goto next_port;
1222                 if (index >= old_serial_count)
1223                         old_serial_count = index + 1;
1224
1225                 /* Now fill the entry */
1226                 memset(&serial_ports[index], 0, sizeof(struct plat_serial8250_port));
1227                 serial_ports[index].uartclk = clk ? *clk : BASE_BAUD * 16;
1228                 serial_ports[index].iobase = reg->address;
1229                 serial_ports[index].irq = interrupts ? interrupts[0] : 0;
1230                 serial_ports[index].flags = ASYNC_BOOT_AUTOCONF;
1231
1232                 DBG("Added legacy port, index: %d, port: %x, irq: %d, clk: %d\n",
1233                     index,
1234                     serial_ports[index].iobase,
1235                     serial_ports[index].irq,
1236                     serial_ports[index].uartclk);
1237
1238                 /* Get phys address of IO reg for port 1 */
1239                 if (index != 0)
1240                         goto next_port;
1241
1242                 pci = of_get_parent(isa);
1243                 if (!pci) {
1244                         DBG("%s: no pci parent found\n", np->full_name);
1245                         goto next_port;
1246                 }
1247
1248                 rangesp = (u32 *)get_property(pci, "ranges", &rlen);
1249                 if (rangesp == NULL) {
1250                         of_node_put(pci);
1251                         goto next_port;
1252                 }
1253                 rlen /= 4;
1254
1255                 /* we need the #size-cells of the PCI bridge node itself */
1256                 phys_size = 1;
1257                 sizeprop = (u32 *)get_property(pci, "#size-cells", NULL);
1258                 if (sizeprop != NULL)
1259                         phys_size = *sizeprop;
1260                 /* we need the parent #addr-cells */
1261                 addr_size = prom_n_addr_cells(pci);
1262                 rentsize = 3 + addr_size + phys_size;
1263                 io_base = 0;
1264                 for (;rlen >= rentsize; rlen -= rentsize,rangesp += rentsize) {
1265                         if (((rangesp[0] >> 24) & 0x3) != 1)
1266                                 continue; /* not IO space */
1267                         io_base = rangesp[3];
1268                         if (addr_size == 2)
1269                                 io_base = (io_base << 32) | rangesp[4];
1270                 }
1271                 if (io_base != 0) {
1272                         *physport = io_base + reg->address;
1273                         if (default_speed && spd)
1274                                 *default_speed = *spd;
1275                 }
1276                 of_node_put(pci);
1277         next_port:
1278                 of_node_put(isa);
1279         }
1280
1281         DBG(" <- generic_find_legacy_serial_port()\n");
1282 }
1283
1284 static struct platform_device serial_device = {
1285         .name   = "serial8250",
1286         .id     = 0,
1287         .dev    = {
1288                 .platform_data = serial_ports,
1289         },
1290 };
1291
1292 static int __init serial_dev_init(void)
1293 {
1294         return platform_device_register(&serial_device);
1295 }
1296 arch_initcall(serial_dev_init);
1297
1298 #endif /* CONFIG_PPC_ISERIES */
1299
1300 int check_legacy_ioport(unsigned long base_port)
1301 {
1302         if (ppc_md.check_legacy_ioport == NULL)
1303                 return 0;
1304         return ppc_md.check_legacy_ioport(base_port);
1305 }
1306 EXPORT_SYMBOL(check_legacy_ioport);
1307
1308 #ifdef CONFIG_XMON
1309 static int __init early_xmon(char *p)
1310 {
1311         /* ensure xmon is enabled */
1312         if (p) {
1313                 if (strncmp(p, "on", 2) == 0)
1314                         xmon_init(1);
1315                 if (strncmp(p, "off", 3) == 0)
1316                         xmon_init(0);
1317                 if (strncmp(p, "early", 5) != 0)
1318                         return 0;
1319         }
1320         xmon_init(1);
1321         debugger(NULL);
1322
1323         return 0;
1324 }
1325 early_param("xmon", early_xmon);
1326 #endif
1327
1328 void cpu_die(void)
1329 {
1330         if (ppc_md.cpu_die)
1331                 ppc_md.cpu_die();
1332 }