Merge with rsync://rsync.kernel.org/pub/scm/linux/kernel/git/torvalds/linux-2.6.git
[linux-2.6] / arch / ppc64 / kernel / setup.c
1 /*
2  * 
3  * Common boot and setup code.
4  *
5  * Copyright (C) 2001 PPC64 Team, IBM Corp
6  *
7  *      This program is free software; you can redistribute it and/or
8  *      modify it under the terms of the GNU General Public License
9  *      as published by the Free Software Foundation; either version
10  *      2 of the License, or (at your option) any later version.
11  */
12
13 #undef DEBUG
14
15 #include <linux/config.h>
16 #include <linux/module.h>
17 #include <linux/string.h>
18 #include <linux/sched.h>
19 #include <linux/init.h>
20 #include <linux/kernel.h>
21 #include <linux/reboot.h>
22 #include <linux/delay.h>
23 #include <linux/initrd.h>
24 #include <linux/ide.h>
25 #include <linux/seq_file.h>
26 #include <linux/ioport.h>
27 #include <linux/console.h>
28 #include <linux/version.h>
29 #include <linux/tty.h>
30 #include <linux/root_dev.h>
31 #include <linux/notifier.h>
32 #include <linux/cpu.h>
33 #include <linux/unistd.h>
34 #include <linux/serial.h>
35 #include <linux/serial_8250.h>
36 #include <asm/io.h>
37 #include <asm/prom.h>
38 #include <asm/processor.h>
39 #include <asm/pgtable.h>
40 #include <asm/bootinfo.h>
41 #include <asm/smp.h>
42 #include <asm/elf.h>
43 #include <asm/machdep.h>
44 #include <asm/paca.h>
45 #include <asm/ppcdebug.h>
46 #include <asm/time.h>
47 #include <asm/cputable.h>
48 #include <asm/sections.h>
49 #include <asm/btext.h>
50 #include <asm/nvram.h>
51 #include <asm/setup.h>
52 #include <asm/system.h>
53 #include <asm/rtas.h>
54 #include <asm/iommu.h>
55 #include <asm/serial.h>
56 #include <asm/cache.h>
57 #include <asm/page.h>
58 #include <asm/mmu.h>
59 #include <asm/lmb.h>
60 #include <asm/iSeries/ItLpNaca.h>
61
62 #ifdef DEBUG
63 #define DBG(fmt...) udbg_printf(fmt)
64 #else
65 #define DBG(fmt...)
66 #endif
67
68 /*
69  * Here are some early debugging facilities. You can enable one
70  * but your kernel will not boot on anything else if you do so
71  */
72
73 /* This one is for use on LPAR machines that support an HVC console
74  * on vterm 0
75  */
76 extern void udbg_init_debug_lpar(void);
77 /* This one is for use on Apple G5 machines
78  */
79 extern void udbg_init_pmac_realmode(void);
80 /* That's RTAS panel debug */
81 extern void call_rtas_display_status_delay(unsigned char c);
82 /* Here's maple real mode debug */
83 extern void udbg_init_maple_realmode(void);
84
85 #define EARLY_DEBUG_INIT() do {} while(0)
86
87 #if 0
88 #define EARLY_DEBUG_INIT() udbg_init_debug_lpar()
89 #define EARLY_DEBUG_INIT() udbg_init_maple_realmode()
90 #define EARLY_DEBUG_INIT() udbg_init_pmac_realmode()
91 #define EARLY_DEBUG_INIT()                                              \
92         do { ppc_md.udbg_putc = call_rtas_display_status_delay; } while(0)
93 #endif
94
95 /* extern void *stab; */
96 extern unsigned long klimit;
97
98 extern void mm_init_ppc64(void);
99 extern int  idle_setup(void);
100 extern void stab_initialize(unsigned long stab);
101 extern void htab_initialize(void);
102 extern void early_init_devtree(void *flat_dt);
103 extern void unflatten_device_tree(void);
104
105 extern void smp_release_cpus(void);
106
107 int have_of = 1;
108 int boot_cpuid = 0;
109 int boot_cpuid_phys = 0;
110 dev_t boot_dev;
111 u64 ppc64_pft_size;
112 u64 ppc64_debug_switch;
113
114 struct ppc64_caches ppc64_caches;
115 EXPORT_SYMBOL_GPL(ppc64_caches);
116
117 /*
118  * These are used in binfmt_elf.c to put aux entries on the stack
119  * for each elf executable being started.
120  */
121 int dcache_bsize;
122 int icache_bsize;
123 int ucache_bsize;
124
125 /* The main machine-dep calls structure
126  */
127 struct machdep_calls ppc_md;
128 EXPORT_SYMBOL(ppc_md);
129
130 #ifdef CONFIG_MAGIC_SYSRQ
131 unsigned long SYSRQ_KEY;
132 #endif /* CONFIG_MAGIC_SYSRQ */
133
134
135 static int ppc64_panic_event(struct notifier_block *, unsigned long, void *);
136 static struct notifier_block ppc64_panic_block = {
137         .notifier_call = ppc64_panic_event,
138         .priority = INT_MIN /* may not return; must be done last */
139 };
140
141 /*
142  * Perhaps we can put the pmac screen_info[] here
143  * on pmac as well so we don't need the ifdef's.
144  * Until we get multiple-console support in here
145  * that is.  -- Cort
146  * Maybe tie it to serial consoles, since this is really what
147  * these processors use on existing boards.  -- Dan
148  */ 
149 struct screen_info screen_info = {
150         .orig_x = 0,
151         .orig_y = 25,
152         .orig_video_cols = 80,
153         .orig_video_lines = 25,
154         .orig_video_isVGA = 1,
155         .orig_video_points = 16
156 };
157
158 /*
159  * Initialize the PPCDBG state.  Called before relocation has been enabled.
160  */
161 void __init ppcdbg_initialize(void)
162 {
163         ppc64_debug_switch = PPC_DEBUG_DEFAULT; /* | PPCDBG_BUSWALK | */
164         /* PPCDBG_PHBINIT | PPCDBG_MM | PPCDBG_MMINIT | PPCDBG_TCEINIT | PPCDBG_TCE */;
165 }
166
167 /*
168  * Early boot console based on udbg
169  */
170 static struct console udbg_console = {
171         .name   = "udbg",
172         .write  = udbg_console_write,
173         .flags  = CON_PRINTBUFFER,
174         .index  = -1,
175 };
176 static int early_console_initialized;
177
178 void __init disable_early_printk(void)
179 {
180         if (!early_console_initialized)
181                 return;
182         unregister_console(&udbg_console);
183         early_console_initialized = 0;
184 }
185
186 #if defined(CONFIG_PPC_MULTIPLATFORM) && defined(CONFIG_SMP)
187
188 static int smt_enabled_cmdline;
189
190 /* Look for ibm,smt-enabled OF option */
191 static void check_smt_enabled(void)
192 {
193         struct device_node *dn;
194         char *smt_option;
195
196         /* Allow the command line to overrule the OF option */
197         if (smt_enabled_cmdline)
198                 return;
199
200         dn = of_find_node_by_path("/options");
201
202         if (dn) {
203                 smt_option = (char *)get_property(dn, "ibm,smt-enabled", NULL);
204
205                 if (smt_option) {
206                         if (!strcmp(smt_option, "on"))
207                                 smt_enabled_at_boot = 1;
208                         else if (!strcmp(smt_option, "off"))
209                                 smt_enabled_at_boot = 0;
210                 }
211         }
212 }
213
214 /* Look for smt-enabled= cmdline option */
215 static int __init early_smt_enabled(char *p)
216 {
217         smt_enabled_cmdline = 1;
218
219         if (!p)
220                 return 0;
221
222         if (!strcmp(p, "on") || !strcmp(p, "1"))
223                 smt_enabled_at_boot = 1;
224         else if (!strcmp(p, "off") || !strcmp(p, "0"))
225                 smt_enabled_at_boot = 0;
226
227         return 0;
228 }
229 early_param("smt-enabled", early_smt_enabled);
230
231 /**
232  * setup_cpu_maps - initialize the following cpu maps:
233  *                  cpu_possible_map
234  *                  cpu_present_map
235  *                  cpu_sibling_map
236  *
237  * Having the possible map set up early allows us to restrict allocations
238  * of things like irqstacks to num_possible_cpus() rather than NR_CPUS.
239  *
240  * We do not initialize the online map here; cpus set their own bits in
241  * cpu_online_map as they come up.
242  *
243  * This function is valid only for Open Firmware systems.  finish_device_tree
244  * must be called before using this.
245  *
246  * While we're here, we may as well set the "physical" cpu ids in the paca.
247  */
248 static void __init setup_cpu_maps(void)
249 {
250         struct device_node *dn = NULL;
251         int cpu = 0;
252         int swap_cpuid = 0;
253
254         check_smt_enabled();
255
256         while ((dn = of_find_node_by_type(dn, "cpu")) && cpu < NR_CPUS) {
257                 u32 *intserv;
258                 int j, len = sizeof(u32), nthreads;
259
260                 intserv = (u32 *)get_property(dn, "ibm,ppc-interrupt-server#s",
261                                               &len);
262                 if (!intserv)
263                         intserv = (u32 *)get_property(dn, "reg", NULL);
264
265                 nthreads = len / sizeof(u32);
266
267                 for (j = 0; j < nthreads && cpu < NR_CPUS; j++) {
268                         cpu_set(cpu, cpu_present_map);
269                         set_hard_smp_processor_id(cpu, intserv[j]);
270
271                         if (intserv[j] == boot_cpuid_phys)
272                                 swap_cpuid = cpu;
273                         cpu_set(cpu, cpu_possible_map);
274                         cpu++;
275                 }
276         }
277
278         /* Swap CPU id 0 with boot_cpuid_phys, so we can always assume that
279          * boot cpu is logical 0.
280          */
281         if (boot_cpuid_phys != get_hard_smp_processor_id(0)) {
282                 u32 tmp;
283                 tmp = get_hard_smp_processor_id(0);
284                 set_hard_smp_processor_id(0, boot_cpuid_phys);
285                 set_hard_smp_processor_id(swap_cpuid, tmp);
286         }
287
288         /*
289          * On pSeries LPAR, we need to know how many cpus
290          * could possibly be added to this partition.
291          */
292         if (systemcfg->platform == PLATFORM_PSERIES_LPAR &&
293                                 (dn = of_find_node_by_path("/rtas"))) {
294                 int num_addr_cell, num_size_cell, maxcpus;
295                 unsigned int *ireg;
296
297                 num_addr_cell = prom_n_addr_cells(dn);
298                 num_size_cell = prom_n_size_cells(dn);
299
300                 ireg = (unsigned int *)
301                         get_property(dn, "ibm,lrdr-capacity", NULL);
302
303                 if (!ireg)
304                         goto out;
305
306                 maxcpus = ireg[num_addr_cell + num_size_cell];
307
308                 /* Double maxcpus for processors which have SMT capability */
309                 if (cpu_has_feature(CPU_FTR_SMT))
310                         maxcpus *= 2;
311
312                 if (maxcpus > NR_CPUS) {
313                         printk(KERN_WARNING
314                                "Partition configured for %d cpus, "
315                                "operating system maximum is %d.\n",
316                                maxcpus, NR_CPUS);
317                         maxcpus = NR_CPUS;
318                 } else
319                         printk(KERN_INFO "Partition configured for %d cpus.\n",
320                                maxcpus);
321
322                 for (cpu = 0; cpu < maxcpus; cpu++)
323                         cpu_set(cpu, cpu_possible_map);
324         out:
325                 of_node_put(dn);
326         }
327
328         /*
329          * Do the sibling map; assume only two threads per processor.
330          */
331         for_each_cpu(cpu) {
332                 cpu_set(cpu, cpu_sibling_map[cpu]);
333                 if (cpu_has_feature(CPU_FTR_SMT))
334                         cpu_set(cpu ^ 0x1, cpu_sibling_map[cpu]);
335         }
336
337         systemcfg->processorCount = num_present_cpus();
338 }
339 #endif /* defined(CONFIG_PPC_MULTIPLATFORM) && defined(CONFIG_SMP) */
340
341
342 #ifdef CONFIG_PPC_MULTIPLATFORM
343
344 extern struct machdep_calls pSeries_md;
345 extern struct machdep_calls pmac_md;
346 extern struct machdep_calls maple_md;
347
348 /* Ultimately, stuff them in an elf section like initcalls... */
349 static struct machdep_calls __initdata *machines[] = {
350 #ifdef CONFIG_PPC_PSERIES
351         &pSeries_md,
352 #endif /* CONFIG_PPC_PSERIES */
353 #ifdef CONFIG_PPC_PMAC
354         &pmac_md,
355 #endif /* CONFIG_PPC_PMAC */
356 #ifdef CONFIG_PPC_MAPLE
357         &maple_md,
358 #endif /* CONFIG_PPC_MAPLE */
359         NULL
360 };
361
362 /*
363  * Early initialization entry point. This is called by head.S
364  * with MMU translation disabled. We rely on the "feature" of
365  * the CPU that ignores the top 2 bits of the address in real
366  * mode so we can access kernel globals normally provided we
367  * only toy with things in the RMO region. From here, we do
368  * some early parsing of the device-tree to setup out LMB
369  * data structures, and allocate & initialize the hash table
370  * and segment tables so we can start running with translation
371  * enabled.
372  *
373  * It is this function which will call the probe() callback of
374  * the various platform types and copy the matching one to the
375  * global ppc_md structure. Your platform can eventually do
376  * some very early initializations from the probe() routine, but
377  * this is not recommended, be very careful as, for example, the
378  * device-tree is not accessible via normal means at this point.
379  */
380
381 void __init early_setup(unsigned long dt_ptr)
382 {
383         struct paca_struct *lpaca = get_paca();
384         static struct machdep_calls **mach;
385
386         /*
387          * Enable early debugging if any specified (see top of
388          * this file)
389          */
390         EARLY_DEBUG_INIT();
391
392         DBG(" -> early_setup()\n");
393
394         /*
395          * Fill the default DBG level (do we want to keep
396          * that old mecanism around forever ?)
397          */
398         ppcdbg_initialize();
399
400         /*
401          * Do early initializations using the flattened device
402          * tree, like retreiving the physical memory map or
403          * calculating/retreiving the hash table size
404          */
405         early_init_devtree(__va(dt_ptr));
406
407         /*
408          * Iterate all ppc_md structures until we find the proper
409          * one for the current machine type
410          */
411         DBG("Probing machine type for platform %x...\n",
412             systemcfg->platform);
413
414         for (mach = machines; *mach; mach++) {
415                 if ((*mach)->probe(systemcfg->platform))
416                         break;
417         }
418         /* What can we do if we didn't find ? */
419         if (*mach == NULL) {
420                 DBG("No suitable machine found !\n");
421                 for (;;);
422         }
423         ppc_md = **mach;
424
425         /* our udbg callbacks got overriden by the above, let's put them
426          * back in. Ultimately, I want those things to be split from the
427          * main ppc_md
428          */
429         EARLY_DEBUG_INIT();
430
431         DBG("Found, Initializing memory management...\n");
432
433         /*
434          * Initialize stab / SLB management
435          */
436         stab_initialize(lpaca->stab_real);
437
438         /*
439          * Initialize the MMU Hash table and create the linear mapping
440          * of memory
441          */
442         htab_initialize();
443
444         DBG(" <- early_setup()\n");
445 }
446
447
448 /*
449  * Initialize some remaining members of the ppc64_caches and systemcfg structures
450  * (at least until we get rid of them completely). This is mostly some
451  * cache informations about the CPU that will be used by cache flush
452  * routines and/or provided to userland
453  */
454 static void __init initialize_cache_info(void)
455 {
456         struct device_node *np;
457         unsigned long num_cpus = 0;
458
459         DBG(" -> initialize_cache_info()\n");
460
461         for (np = NULL; (np = of_find_node_by_type(np, "cpu"));) {
462                 num_cpus += 1;
463
464                 /* We're assuming *all* of the CPUs have the same
465                  * d-cache and i-cache sizes... -Peter
466                  */
467
468                 if ( num_cpus == 1 ) {
469                         u32 *sizep, *lsizep;
470                         u32 size, lsize;
471                         const char *dc, *ic;
472
473                         /* Then read cache informations */
474                         if (systemcfg->platform == PLATFORM_POWERMAC) {
475                                 dc = "d-cache-block-size";
476                                 ic = "i-cache-block-size";
477                         } else {
478                                 dc = "d-cache-line-size";
479                                 ic = "i-cache-line-size";
480                         }
481
482                         size = 0;
483                         lsize = cur_cpu_spec->dcache_bsize;
484                         sizep = (u32 *)get_property(np, "d-cache-size", NULL);
485                         if (sizep != NULL)
486                                 size = *sizep;
487                         lsizep = (u32 *) get_property(np, dc, NULL);
488                         if (lsizep != NULL)
489                                 lsize = *lsizep;
490                         if (sizep == 0 || lsizep == 0)
491                                 DBG("Argh, can't find dcache properties ! "
492                                     "sizep: %p, lsizep: %p\n", sizep, lsizep);
493
494                         systemcfg->dcache_size = ppc64_caches.dsize = size;
495                         systemcfg->dcache_line_size =
496                                 ppc64_caches.dline_size = lsize;
497                         ppc64_caches.log_dline_size = __ilog2(lsize);
498                         ppc64_caches.dlines_per_page = PAGE_SIZE / lsize;
499
500                         size = 0;
501                         lsize = cur_cpu_spec->icache_bsize;
502                         sizep = (u32 *)get_property(np, "i-cache-size", NULL);
503                         if (sizep != NULL)
504                                 size = *sizep;
505                         lsizep = (u32 *)get_property(np, ic, NULL);
506                         if (lsizep != NULL)
507                                 lsize = *lsizep;
508                         if (sizep == 0 || lsizep == 0)
509                                 DBG("Argh, can't find icache properties ! "
510                                     "sizep: %p, lsizep: %p\n", sizep, lsizep);
511
512                         systemcfg->icache_size = ppc64_caches.isize = size;
513                         systemcfg->icache_line_size =
514                                 ppc64_caches.iline_size = lsize;
515                         ppc64_caches.log_iline_size = __ilog2(lsize);
516                         ppc64_caches.ilines_per_page = PAGE_SIZE / lsize;
517                 }
518         }
519
520         /* Add an eye catcher and the systemcfg layout version number */
521         strcpy(systemcfg->eye_catcher, "SYSTEMCFG:PPC64");
522         systemcfg->version.major = SYSTEMCFG_MAJOR;
523         systemcfg->version.minor = SYSTEMCFG_MINOR;
524         systemcfg->processor = mfspr(SPRN_PVR);
525
526         DBG(" <- initialize_cache_info()\n");
527 }
528
529 static void __init check_for_initrd(void)
530 {
531 #ifdef CONFIG_BLK_DEV_INITRD
532         u64 *prop;
533
534         DBG(" -> check_for_initrd()\n");
535
536         prop = (u64 *)get_property(of_chosen, "linux,initrd-start", NULL);
537         if (prop != NULL) {
538                 initrd_start = (unsigned long)__va(*prop);
539                 prop = (u64 *)get_property(of_chosen, "linux,initrd-end", NULL);
540                 if (prop != NULL) {
541                         initrd_end = (unsigned long)__va(*prop);
542                         initrd_below_start_ok = 1;
543                 } else
544                         initrd_start = 0;
545         }
546
547         /* If we were passed an initrd, set the ROOT_DEV properly if the values
548          * look sensible. If not, clear initrd reference.
549          */
550         if (initrd_start >= KERNELBASE && initrd_end >= KERNELBASE &&
551             initrd_end > initrd_start)
552                 ROOT_DEV = Root_RAM0;
553         else
554                 initrd_start = initrd_end = 0;
555
556         if (initrd_start)
557                 printk("Found initrd at 0x%lx:0x%lx\n", initrd_start, initrd_end);
558
559         DBG(" <- check_for_initrd()\n");
560 #endif /* CONFIG_BLK_DEV_INITRD */
561 }
562
563 #endif /* CONFIG_PPC_MULTIPLATFORM */
564
565 /*
566  * Do some initial setup of the system.  The parameters are those which 
567  * were passed in from the bootloader.
568  */
569 void __init setup_system(void)
570 {
571         DBG(" -> setup_system()\n");
572
573 #ifdef CONFIG_PPC_ISERIES
574         /* pSeries systems are identified in prom.c via OF. */
575         if (itLpNaca.xLparInstalled == 1)
576                 systemcfg->platform = PLATFORM_ISERIES_LPAR;
577
578         ppc_md.init_early();
579 #else /* CONFIG_PPC_ISERIES */
580
581         /*
582          * Unflatten the device-tree passed by prom_init or kexec
583          */
584         unflatten_device_tree();
585
586         /*
587          * Fill the ppc64_caches & systemcfg structures with informations
588          * retreived from the device-tree. Need to be called before
589          * finish_device_tree() since the later requires some of the
590          * informations filled up here to properly parse the interrupt
591          * tree.
592          * It also sets up the cache line sizes which allows to call
593          * routines like flush_icache_range (used by the hash init
594          * later on).
595          */
596         initialize_cache_info();
597
598 #ifdef CONFIG_PPC_RTAS
599         /*
600          * Initialize RTAS if available
601          */
602         rtas_initialize();
603 #endif /* CONFIG_PPC_RTAS */
604
605         /*
606          * Check if we have an initrd provided via the device-tree
607          */
608         check_for_initrd();
609
610         /*
611          * Do some platform specific early initializations, that includes
612          * setting up the hash table pointers. It also sets up some interrupt-mapping
613          * related options that will be used by finish_device_tree()
614          */
615         ppc_md.init_early();
616
617         /*
618          * "Finish" the device-tree, that is do the actual parsing of
619          * some of the properties like the interrupt map
620          */
621         finish_device_tree();
622
623         /*
624          * Initialize xmon
625          */
626 #ifdef CONFIG_XMON_DEFAULT
627         xmon_init();
628 #endif
629         /*
630          * Register early console
631          */
632         early_console_initialized = 1;
633         register_console(&udbg_console);
634
635         /* Save unparsed command line copy for /proc/cmdline */
636         strlcpy(saved_command_line, cmd_line, COMMAND_LINE_SIZE);
637
638         parse_early_param();
639 #endif /* !CONFIG_PPC_ISERIES */
640
641 #if defined(CONFIG_SMP) && !defined(CONFIG_PPC_ISERIES)
642         /*
643          * iSeries has already initialized the cpu maps at this point.
644          */
645         setup_cpu_maps();
646
647         /* Release secondary cpus out of their spinloops at 0x60 now that
648          * we can map physical -> logical CPU ids
649          */
650         smp_release_cpus();
651 #endif /* defined(CONFIG_SMP) && !defined(CONFIG_PPC_ISERIES) */
652
653         printk("Starting Linux PPC64 %s\n", UTS_RELEASE);
654
655         printk("-----------------------------------------------------\n");
656         printk("ppc64_pft_size                = 0x%lx\n", ppc64_pft_size);
657         printk("ppc64_debug_switch            = 0x%lx\n", ppc64_debug_switch);
658         printk("ppc64_interrupt_controller    = 0x%ld\n", ppc64_interrupt_controller);
659         printk("systemcfg                     = 0x%p\n", systemcfg);
660         printk("systemcfg->platform           = 0x%x\n", systemcfg->platform);
661         printk("systemcfg->processorCount     = 0x%lx\n", systemcfg->processorCount);
662         printk("systemcfg->physicalMemorySize = 0x%lx\n", systemcfg->physicalMemorySize);
663         printk("ppc64_caches.dcache_line_size = 0x%x\n",
664                         ppc64_caches.dline_size);
665         printk("ppc64_caches.icache_line_size = 0x%x\n",
666                         ppc64_caches.iline_size);
667         printk("htab_address                  = 0x%p\n", htab_address);
668         printk("htab_hash_mask                = 0x%lx\n", htab_hash_mask);
669         printk("-----------------------------------------------------\n");
670
671         mm_init_ppc64();
672
673         DBG(" <- setup_system()\n");
674 }
675
676
677 void machine_restart(char *cmd)
678 {
679         if (ppc_md.nvram_sync)
680                 ppc_md.nvram_sync();
681         ppc_md.restart(cmd);
682 }
683
684 EXPORT_SYMBOL(machine_restart);
685   
686 void machine_power_off(void)
687 {
688         if (ppc_md.nvram_sync)
689                 ppc_md.nvram_sync();
690         ppc_md.power_off();
691 }
692
693 EXPORT_SYMBOL(machine_power_off);
694   
695 void machine_halt(void)
696 {
697         if (ppc_md.nvram_sync)
698                 ppc_md.nvram_sync();
699         ppc_md.halt();
700 }
701
702 EXPORT_SYMBOL(machine_halt);
703
704 unsigned long ppc_proc_freq;
705 unsigned long ppc_tb_freq;
706
707 static int ppc64_panic_event(struct notifier_block *this,
708                              unsigned long event, void *ptr)
709 {
710         ppc_md.panic((char *)ptr);  /* May not return */
711         return NOTIFY_DONE;
712 }
713
714
715 #ifdef CONFIG_SMP
716 DEFINE_PER_CPU(unsigned int, pvr);
717 #endif
718
719 static int show_cpuinfo(struct seq_file *m, void *v)
720 {
721         unsigned long cpu_id = (unsigned long)v - 1;
722         unsigned int pvr;
723         unsigned short maj;
724         unsigned short min;
725
726         if (cpu_id == NR_CPUS) {
727                 seq_printf(m, "timebase\t: %lu\n", ppc_tb_freq);
728
729                 if (ppc_md.get_cpuinfo != NULL)
730                         ppc_md.get_cpuinfo(m);
731
732                 return 0;
733         }
734
735         /* We only show online cpus: disable preempt (overzealous, I
736          * knew) to prevent cpu going down. */
737         preempt_disable();
738         if (!cpu_online(cpu_id)) {
739                 preempt_enable();
740                 return 0;
741         }
742
743 #ifdef CONFIG_SMP
744         pvr = per_cpu(pvr, cpu_id);
745 #else
746         pvr = mfspr(SPRN_PVR);
747 #endif
748         maj = (pvr >> 8) & 0xFF;
749         min = pvr & 0xFF;
750
751         seq_printf(m, "processor\t: %lu\n", cpu_id);
752         seq_printf(m, "cpu\t\t: ");
753
754         if (cur_cpu_spec->pvr_mask)
755                 seq_printf(m, "%s", cur_cpu_spec->cpu_name);
756         else
757                 seq_printf(m, "unknown (%08x)", pvr);
758
759 #ifdef CONFIG_ALTIVEC
760         if (cpu_has_feature(CPU_FTR_ALTIVEC))
761                 seq_printf(m, ", altivec supported");
762 #endif /* CONFIG_ALTIVEC */
763
764         seq_printf(m, "\n");
765
766         /*
767          * Assume here that all clock rates are the same in a
768          * smp system.  -- Cort
769          */
770         seq_printf(m, "clock\t\t: %lu.%06luMHz\n", ppc_proc_freq / 1000000,
771                    ppc_proc_freq % 1000000);
772
773         seq_printf(m, "revision\t: %hd.%hd\n\n", maj, min);
774
775         preempt_enable();
776         return 0;
777 }
778
779 static void *c_start(struct seq_file *m, loff_t *pos)
780 {
781         return *pos <= NR_CPUS ? (void *)((*pos)+1) : NULL;
782 }
783 static void *c_next(struct seq_file *m, void *v, loff_t *pos)
784 {
785         ++*pos;
786         return c_start(m, pos);
787 }
788 static void c_stop(struct seq_file *m, void *v)
789 {
790 }
791 struct seq_operations cpuinfo_op = {
792         .start =c_start,
793         .next = c_next,
794         .stop = c_stop,
795         .show = show_cpuinfo,
796 };
797
798 /*
799  * These three variables are used to save values passed to us by prom_init()
800  * via the device tree. The TCE variables are needed because with a memory_limit
801  * in force we may need to explicitly map the TCE are at the top of RAM.
802  */
803 unsigned long memory_limit;
804 unsigned long tce_alloc_start;
805 unsigned long tce_alloc_end;
806
807 #ifdef CONFIG_PPC_ISERIES
808 /*
809  * On iSeries we just parse the mem=X option from the command line.
810  * On pSeries it's a bit more complicated, see prom_init_mem()
811  */
812 static int __init early_parsemem(char *p)
813 {
814         if (!p)
815                 return 0;
816
817         memory_limit = ALIGN(memparse(p, &p), PAGE_SIZE);
818
819         return 0;
820 }
821 early_param("mem", early_parsemem);
822 #endif /* CONFIG_PPC_ISERIES */
823
824 #ifdef CONFIG_PPC_MULTIPLATFORM
825 static int __init set_preferred_console(void)
826 {
827         struct device_node *prom_stdout = NULL;
828         char *name;
829         u32 *spd;
830         int offset = 0;
831
832         DBG(" -> set_preferred_console()\n");
833
834         /* The user has requested a console so this is already set up. */
835         if (strstr(saved_command_line, "console=")) {
836                 DBG(" console was specified !\n");
837                 return -EBUSY;
838         }
839
840         if (!of_chosen) {
841                 DBG(" of_chosen is NULL !\n");
842                 return -ENODEV;
843         }
844         /* We are getting a weird phandle from OF ... */
845         /* ... So use the full path instead */
846         name = (char *)get_property(of_chosen, "linux,stdout-path", NULL);
847         if (name == NULL) {
848                 DBG(" no linux,stdout-path !\n");
849                 return -ENODEV;
850         }
851         prom_stdout = of_find_node_by_path(name);
852         if (!prom_stdout) {
853                 DBG(" can't find stdout package %s !\n", name);
854                 return -ENODEV;
855         }       
856         DBG("stdout is %s\n", prom_stdout->full_name);
857
858         name = (char *)get_property(prom_stdout, "name", NULL);
859         if (!name) {
860                 DBG(" stdout package has no name !\n");
861                 goto not_found;
862         }
863         spd = (u32 *)get_property(prom_stdout, "current-speed", NULL);
864
865         if (0)
866                 ;
867 #ifdef CONFIG_SERIAL_8250_CONSOLE
868         else if (strcmp(name, "serial") == 0) {
869                 int i;
870                 u32 *reg = (u32 *)get_property(prom_stdout, "reg", &i);
871                 if (i > 8) {
872                         switch (reg[1]) {
873                                 case 0x3f8:
874                                         offset = 0;
875                                         break;
876                                 case 0x2f8:
877                                         offset = 1;
878                                         break;
879                                 case 0x898:
880                                         offset = 2;
881                                         break;
882                                 case 0x890:
883                                         offset = 3;
884                                         break;
885                                 default:
886                                         /* We dont recognise the serial port */
887                                         goto not_found;
888                         }
889                 }
890         }
891 #endif /* CONFIG_SERIAL_8250_CONSOLE */
892 #ifdef CONFIG_PPC_PSERIES
893         else if (strcmp(name, "vty") == 0) {
894                 u32 *reg = (u32 *)get_property(prom_stdout, "reg", NULL);
895                 char *compat = (char *)get_property(prom_stdout, "compatible", NULL);
896
897                 if (reg && compat && (strcmp(compat, "hvterm-protocol") == 0)) {
898                         /* Host Virtual Serial Interface */
899                         int offset;
900                         switch (reg[0]) {
901                                 case 0x30000000:
902                                         offset = 0;
903                                         break;
904                                 case 0x30000001:
905                                         offset = 1;
906                                         break;
907                                 default:
908                                         goto not_found;
909                         }
910                         of_node_put(prom_stdout);
911                         DBG("Found hvsi console at offset %d\n", offset);
912                         return add_preferred_console("hvsi", offset, NULL);
913                 } else {
914                         /* pSeries LPAR virtual console */
915                         of_node_put(prom_stdout);
916                         DBG("Found hvc console\n");
917                         return add_preferred_console("hvc", 0, NULL);
918                 }
919         }
920 #endif /* CONFIG_PPC_PSERIES */
921 #ifdef CONFIG_SERIAL_PMACZILOG_CONSOLE
922         else if (strcmp(name, "ch-a") == 0)
923                 offset = 0;
924         else if (strcmp(name, "ch-b") == 0)
925                 offset = 1;
926 #endif /* CONFIG_SERIAL_PMACZILOG_CONSOLE */
927         else
928                 goto not_found;
929         of_node_put(prom_stdout);
930
931         DBG("Found serial console at ttyS%d\n", offset);
932
933         if (spd) {
934                 static char __initdata opt[16];
935                 sprintf(opt, "%d", *spd);
936                 return add_preferred_console("ttyS", offset, opt);
937         } else
938                 return add_preferred_console("ttyS", offset, NULL);
939
940  not_found:
941         DBG("No preferred console found !\n");
942         of_node_put(prom_stdout);
943         return -ENODEV;
944 }
945 console_initcall(set_preferred_console);
946 #endif /* CONFIG_PPC_MULTIPLATFORM */
947
948 #ifdef CONFIG_IRQSTACKS
949 static void __init irqstack_early_init(void)
950 {
951         unsigned int i;
952
953         /*
954          * interrupt stacks must be under 256MB, we cannot afford to take
955          * SLB misses on them.
956          */
957         for_each_cpu(i) {
958                 softirq_ctx[i] = (struct thread_info *)__va(lmb_alloc_base(THREAD_SIZE,
959                                         THREAD_SIZE, 0x10000000));
960                 hardirq_ctx[i] = (struct thread_info *)__va(lmb_alloc_base(THREAD_SIZE,
961                                         THREAD_SIZE, 0x10000000));
962         }
963 }
964 #else
965 #define irqstack_early_init()
966 #endif
967
968 /*
969  * Stack space used when we detect a bad kernel stack pointer, and
970  * early in SMP boots before relocation is enabled.
971  */
972 static void __init emergency_stack_init(void)
973 {
974         unsigned long limit;
975         unsigned int i;
976
977         /*
978          * Emergency stacks must be under 256MB, we cannot afford to take
979          * SLB misses on them. The ABI also requires them to be 128-byte
980          * aligned.
981          *
982          * Since we use these as temporary stacks during secondary CPU
983          * bringup, we need to get at them in real mode. This means they
984          * must also be within the RMO region.
985          */
986         limit = min(0x10000000UL, lmb.rmo_size);
987
988         for_each_cpu(i)
989                 paca[i].emergency_sp = __va(lmb_alloc_base(PAGE_SIZE, 128,
990                                                 limit)) + PAGE_SIZE;
991 }
992
993 /*
994  * Called from setup_arch to initialize the bitmap of available
995  * syscalls in the systemcfg page
996  */
997 void __init setup_syscall_map(void)
998 {
999         unsigned int i, count64 = 0, count32 = 0;
1000         extern unsigned long *sys_call_table;
1001         extern unsigned long *sys_call_table32;
1002         extern unsigned long sys_ni_syscall;
1003
1004
1005         for (i = 0; i < __NR_syscalls; i++) {
1006                 if (sys_call_table[i] == sys_ni_syscall)
1007                         continue;
1008                 count64++;
1009                 systemcfg->syscall_map_64[i >> 5] |= 0x80000000UL >> (i & 0x1f);
1010         }
1011         for (i = 0; i < __NR_syscalls; i++) {
1012                 if (sys_call_table32[i] == sys_ni_syscall)
1013                         continue;
1014                 count32++;
1015                 systemcfg->syscall_map_32[i >> 5] |= 0x80000000UL >> (i & 0x1f);
1016         }
1017         printk(KERN_INFO "Syscall map setup, %d 32 bits and %d 64 bits syscalls\n",
1018                count32, count64);
1019 }
1020
1021 /*
1022  * Called into from start_kernel, after lock_kernel has been called.
1023  * Initializes bootmem, which is unsed to manage page allocation until
1024  * mem_init is called.
1025  */
1026 void __init setup_arch(char **cmdline_p)
1027 {
1028         extern void do_init_bootmem(void);
1029
1030         ppc64_boot_msg(0x12, "Setup Arch");
1031
1032         *cmdline_p = cmd_line;
1033
1034         /*
1035          * Set cache line size based on type of cpu as a default.
1036          * Systems with OF can look in the properties on the cpu node(s)
1037          * for a possibly more accurate value.
1038          */
1039         dcache_bsize = ppc64_caches.dline_size;
1040         icache_bsize = ppc64_caches.iline_size;
1041
1042         /* reboot on panic */
1043         panic_timeout = 180;
1044
1045         if (ppc_md.panic)
1046                 notifier_chain_register(&panic_notifier_list, &ppc64_panic_block);
1047
1048         init_mm.start_code = PAGE_OFFSET;
1049         init_mm.end_code = (unsigned long) _etext;
1050         init_mm.end_data = (unsigned long) _edata;
1051         init_mm.brk = klimit;
1052         
1053         irqstack_early_init();
1054         emergency_stack_init();
1055
1056         /* set up the bootmem stuff with available memory */
1057         do_init_bootmem();
1058
1059         /* initialize the syscall map in systemcfg */
1060         setup_syscall_map();
1061
1062         ppc_md.setup_arch();
1063
1064         /* Select the correct idle loop for the platform. */
1065         idle_setup();
1066
1067         paging_init();
1068         ppc64_boot_msg(0x15, "Setup Done");
1069 }
1070
1071
1072 /* ToDo: do something useful if ppc_md is not yet setup. */
1073 #define PPC64_LINUX_FUNCTION 0x0f000000
1074 #define PPC64_IPL_MESSAGE 0xc0000000
1075 #define PPC64_TERM_MESSAGE 0xb0000000
1076 #define PPC64_ATTN_MESSAGE 0xa0000000
1077 #define PPC64_DUMP_MESSAGE 0xd0000000
1078
1079 static void ppc64_do_msg(unsigned int src, const char *msg)
1080 {
1081         if (ppc_md.progress) {
1082                 char buf[32];
1083
1084                 sprintf(buf, "%08x        \n", src);
1085                 ppc_md.progress(buf, 0);
1086                 sprintf(buf, "%-16s", msg);
1087                 ppc_md.progress(buf, 0);
1088         }
1089 }
1090
1091 /* Print a boot progress message. */
1092 void ppc64_boot_msg(unsigned int src, const char *msg)
1093 {
1094         ppc64_do_msg(PPC64_LINUX_FUNCTION|PPC64_IPL_MESSAGE|src, msg);
1095         printk("[boot]%04x %s\n", src, msg);
1096 }
1097
1098 /* Print a termination message (print only -- does not stop the kernel) */
1099 void ppc64_terminate_msg(unsigned int src, const char *msg)
1100 {
1101         ppc64_do_msg(PPC64_LINUX_FUNCTION|PPC64_TERM_MESSAGE|src, msg);
1102         printk("[terminate]%04x %s\n", src, msg);
1103 }
1104
1105 /* Print something that needs attention (device error, etc) */
1106 void ppc64_attention_msg(unsigned int src, const char *msg)
1107 {
1108         ppc64_do_msg(PPC64_LINUX_FUNCTION|PPC64_ATTN_MESSAGE|src, msg);
1109         printk("[attention]%04x %s\n", src, msg);
1110 }
1111
1112 /* Print a dump progress message. */
1113 void ppc64_dump_msg(unsigned int src, const char *msg)
1114 {
1115         ppc64_do_msg(PPC64_LINUX_FUNCTION|PPC64_DUMP_MESSAGE|src, msg);
1116         printk("[dump]%04x %s\n", src, msg);
1117 }
1118
1119 /* This should only be called on processor 0 during calibrate decr */
1120 void setup_default_decr(void)
1121 {
1122         struct paca_struct *lpaca = get_paca();
1123
1124         lpaca->default_decr = tb_ticks_per_jiffy;
1125         lpaca->next_jiffy_update_tb = get_tb() + tb_ticks_per_jiffy;
1126 }
1127
1128 #ifndef CONFIG_PPC_ISERIES
1129 /*
1130  * This function can be used by platforms to "find" legacy serial ports.
1131  * It works for "serial" nodes under an "isa" node, and will try to
1132  * respect the "ibm,aix-loc" property if any. It works with up to 8
1133  * ports.
1134  */
1135
1136 #define MAX_LEGACY_SERIAL_PORTS 8
1137 static struct plat_serial8250_port serial_ports[MAX_LEGACY_SERIAL_PORTS+1];
1138 static unsigned int old_serial_count;
1139
1140 void __init generic_find_legacy_serial_ports(u64 *physport,
1141                 unsigned int *default_speed)
1142 {
1143         struct device_node *np;
1144         u32 *sizeprop;
1145
1146         struct isa_reg_property {
1147                 u32 space;
1148                 u32 address;
1149                 u32 size;
1150         };
1151         struct pci_reg_property {
1152                 struct pci_address addr;
1153                 u32 size_hi;
1154                 u32 size_lo;
1155         };                                                                        
1156
1157         DBG(" -> generic_find_legacy_serial_port()\n");
1158
1159         *physport = 0;
1160         if (default_speed)
1161                 *default_speed = 0;
1162
1163         np = of_find_node_by_path("/");
1164         if (!np)
1165                 return;
1166
1167         /* First fill our array */
1168         for (np = NULL; (np = of_find_node_by_type(np, "serial"));) {
1169                 struct device_node *isa, *pci;
1170                 struct isa_reg_property *reg;
1171                 unsigned long phys_size, addr_size, io_base;
1172                 u32 *rangesp;
1173                 u32 *interrupts, *clk, *spd;
1174                 char *typep;
1175                 int index, rlen, rentsize;
1176
1177                 /* Ok, first check if it's under an "isa" parent */
1178                 isa = of_get_parent(np);
1179                 if (!isa || strcmp(isa->name, "isa")) {
1180                         DBG("%s: no isa parent found\n", np->full_name);
1181                         continue;
1182                 }
1183                 
1184                 /* Now look for an "ibm,aix-loc" property that gives us ordering
1185                  * if any...
1186                  */
1187                 typep = (char *)get_property(np, "ibm,aix-loc", NULL);
1188
1189                 /* Get the ISA port number */
1190                 reg = (struct isa_reg_property *)get_property(np, "reg", NULL); 
1191                 if (reg == NULL)
1192                         goto next_port;
1193                 /* We assume the interrupt number isn't translated ... */
1194                 interrupts = (u32 *)get_property(np, "interrupts", NULL);
1195                 /* get clock freq. if present */
1196                 clk = (u32 *)get_property(np, "clock-frequency", NULL);
1197                 /* get default speed if present */
1198                 spd = (u32 *)get_property(np, "current-speed", NULL);
1199                 /* Default to locate at end of array */
1200                 index = old_serial_count; /* end of the array by default */
1201
1202                 /* If we have a location index, then use it */
1203                 if (typep && *typep == 'S') {
1204                         index = simple_strtol(typep+1, NULL, 0) - 1;
1205                         /* if index is out of range, use end of array instead */
1206                         if (index >= MAX_LEGACY_SERIAL_PORTS)
1207                                 index = old_serial_count;
1208                         /* if our index is still out of range, that mean that
1209                          * array is full, we could scan for a free slot but that
1210                          * make little sense to bother, just skip the port
1211                          */
1212                         if (index >= MAX_LEGACY_SERIAL_PORTS)
1213                                 goto next_port;
1214                         if (index >= old_serial_count)
1215                                 old_serial_count = index + 1;
1216                         /* Check if there is a port who already claimed our slot */
1217                         if (serial_ports[index].iobase != 0) {
1218                                 /* if we still have some room, move it, else override */
1219                                 if (old_serial_count < MAX_LEGACY_SERIAL_PORTS) {
1220                                         DBG("Moved legacy port %d -> %d\n", index,
1221                                             old_serial_count);
1222                                         serial_ports[old_serial_count++] =
1223                                                 serial_ports[index];
1224                                 } else {
1225                                         DBG("Replacing legacy port %d\n", index);
1226                                 }
1227                         }
1228                 }
1229                 if (index >= MAX_LEGACY_SERIAL_PORTS)
1230                         goto next_port;
1231                 if (index >= old_serial_count)
1232                         old_serial_count = index + 1;
1233
1234                 /* Now fill the entry */
1235                 memset(&serial_ports[index], 0, sizeof(struct plat_serial8250_port));
1236                 serial_ports[index].uartclk = clk ? *clk : BASE_BAUD * 16;
1237                 serial_ports[index].iobase = reg->address;
1238                 serial_ports[index].irq = interrupts ? interrupts[0] : 0;
1239                 serial_ports[index].flags = ASYNC_BOOT_AUTOCONF;
1240
1241                 DBG("Added legacy port, index: %d, port: %x, irq: %d, clk: %d\n",
1242                     index,
1243                     serial_ports[index].iobase,
1244                     serial_ports[index].irq,
1245                     serial_ports[index].uartclk);
1246
1247                 /* Get phys address of IO reg for port 1 */
1248                 if (index != 0)
1249                         goto next_port;
1250
1251                 pci = of_get_parent(isa);
1252                 if (!pci) {
1253                         DBG("%s: no pci parent found\n", np->full_name);
1254                         goto next_port;
1255                 }
1256
1257                 rangesp = (u32 *)get_property(pci, "ranges", &rlen);
1258                 if (rangesp == NULL) {
1259                         of_node_put(pci);
1260                         goto next_port;
1261                 }
1262                 rlen /= 4;
1263
1264                 /* we need the #size-cells of the PCI bridge node itself */
1265                 phys_size = 1;
1266                 sizeprop = (u32 *)get_property(pci, "#size-cells", NULL);
1267                 if (sizeprop != NULL)
1268                         phys_size = *sizeprop;
1269                 /* we need the parent #addr-cells */
1270                 addr_size = prom_n_addr_cells(pci);
1271                 rentsize = 3 + addr_size + phys_size;
1272                 io_base = 0;
1273                 for (;rlen >= rentsize; rlen -= rentsize,rangesp += rentsize) {
1274                         if (((rangesp[0] >> 24) & 0x3) != 1)
1275                                 continue; /* not IO space */
1276                         io_base = rangesp[3];
1277                         if (addr_size == 2)
1278                                 io_base = (io_base << 32) | rangesp[4];
1279                 }
1280                 if (io_base != 0) {
1281                         *physport = io_base + reg->address;
1282                         if (default_speed && spd)
1283                                 *default_speed = *spd;
1284                 }
1285                 of_node_put(pci);
1286         next_port:
1287                 of_node_put(isa);
1288         }
1289
1290         DBG(" <- generic_find_legacy_serial_port()\n");
1291 }
1292
1293 static struct platform_device serial_device = {
1294         .name   = "serial8250",
1295         .id     = 0,
1296         .dev    = {
1297                 .platform_data = serial_ports,
1298         },
1299 };
1300
1301 static int __init serial_dev_init(void)
1302 {
1303         return platform_device_register(&serial_device);
1304 }
1305 arch_initcall(serial_dev_init);
1306
1307 #endif /* CONFIG_PPC_ISERIES */
1308
1309 int check_legacy_ioport(unsigned long base_port)
1310 {
1311         if (ppc_md.check_legacy_ioport == NULL)
1312                 return 0;
1313         return ppc_md.check_legacy_ioport(base_port);
1314 }
1315 EXPORT_SYMBOL(check_legacy_ioport);
1316
1317 #ifdef CONFIG_XMON
1318 static int __init early_xmon(char *p)
1319 {
1320         /* ensure xmon is enabled */
1321         if (p) {
1322                 if (strncmp(p, "on", 2) == 0)
1323                         xmon_init();
1324                 if (strncmp(p, "early", 5) != 0)
1325                         return 0;
1326         }
1327         xmon_init();
1328         debugger(NULL);
1329
1330         return 0;
1331 }
1332 early_param("xmon", early_xmon);
1333 #endif
1334
1335 void cpu_die(void)
1336 {
1337         if (ppc_md.cpu_die)
1338                 ppc_md.cpu_die();
1339 }