Merge branch 'genirq-v28-for-linus' of git://git.kernel.org/pub/scm/linux/kernel...
[linux-2.6] / arch / powerpc / kernel / pci-common.c
1 /*
2  * Contains common pci routines for ALL ppc platform
3  * (based on pci_32.c and pci_64.c)
4  *
5  * Port for PPC64 David Engebretsen, IBM Corp.
6  * Contains common pci routines for ppc64 platform, pSeries and iSeries brands.
7  *
8  * Copyright (C) 2003 Anton Blanchard <anton@au.ibm.com>, IBM
9  *   Rework, based on alpha PCI code.
10  *
11  * Common pmac/prep/chrp pci routines. -- Cort
12  *
13  * This program is free software; you can redistribute it and/or
14  * modify it under the terms of the GNU General Public License
15  * as published by the Free Software Foundation; either version
16  * 2 of the License, or (at your option) any later version.
17  */
18
19 #undef DEBUG
20
21 #include <linux/kernel.h>
22 #include <linux/pci.h>
23 #include <linux/string.h>
24 #include <linux/init.h>
25 #include <linux/bootmem.h>
26 #include <linux/mm.h>
27 #include <linux/list.h>
28 #include <linux/syscalls.h>
29 #include <linux/irq.h>
30 #include <linux/vmalloc.h>
31
32 #include <asm/processor.h>
33 #include <asm/io.h>
34 #include <asm/prom.h>
35 #include <asm/pci-bridge.h>
36 #include <asm/byteorder.h>
37 #include <asm/machdep.h>
38 #include <asm/ppc-pci.h>
39 #include <asm/firmware.h>
40
41 #ifdef DEBUG
42 #include <asm/udbg.h>
43 #define DBG(fmt...) printk(fmt)
44 #else
45 #define DBG(fmt...)
46 #endif
47
48 static DEFINE_SPINLOCK(hose_spinlock);
49
50 /* XXX kill that some day ... */
51 static int global_phb_number;           /* Global phb counter */
52
53 /* ISA Memory physical address */
54 resource_size_t isa_mem_base;
55
56 /* Default PCI flags is 0 */
57 unsigned int ppc_pci_flags;
58
59 static struct dma_mapping_ops *pci_dma_ops;
60
61 void set_pci_dma_ops(struct dma_mapping_ops *dma_ops)
62 {
63         pci_dma_ops = dma_ops;
64 }
65
66 struct dma_mapping_ops *get_pci_dma_ops(void)
67 {
68         return pci_dma_ops;
69 }
70 EXPORT_SYMBOL(get_pci_dma_ops);
71
72 int pci_set_dma_mask(struct pci_dev *dev, u64 mask)
73 {
74         return dma_set_mask(&dev->dev, mask);
75 }
76
77 int pci_set_consistent_dma_mask(struct pci_dev *dev, u64 mask)
78 {
79         int rc;
80
81         rc = dma_set_mask(&dev->dev, mask);
82         dev->dev.coherent_dma_mask = dev->dma_mask;
83
84         return rc;
85 }
86
87 struct pci_controller *pcibios_alloc_controller(struct device_node *dev)
88 {
89         struct pci_controller *phb;
90
91         phb = zalloc_maybe_bootmem(sizeof(struct pci_controller), GFP_KERNEL);
92         if (phb == NULL)
93                 return NULL;
94         spin_lock(&hose_spinlock);
95         phb->global_number = global_phb_number++;
96         list_add_tail(&phb->list_node, &hose_list);
97         spin_unlock(&hose_spinlock);
98         phb->dn = dev;
99         phb->is_dynamic = mem_init_done;
100 #ifdef CONFIG_PPC64
101         if (dev) {
102                 int nid = of_node_to_nid(dev);
103
104                 if (nid < 0 || !node_online(nid))
105                         nid = -1;
106
107                 PHB_SET_NODE(phb, nid);
108         }
109 #endif
110         return phb;
111 }
112
113 void pcibios_free_controller(struct pci_controller *phb)
114 {
115         spin_lock(&hose_spinlock);
116         list_del(&phb->list_node);
117         spin_unlock(&hose_spinlock);
118
119         if (phb->is_dynamic)
120                 kfree(phb);
121 }
122
123 int pcibios_vaddr_is_ioport(void __iomem *address)
124 {
125         int ret = 0;
126         struct pci_controller *hose;
127         unsigned long size;
128
129         spin_lock(&hose_spinlock);
130         list_for_each_entry(hose, &hose_list, list_node) {
131 #ifdef CONFIG_PPC64
132                 size = hose->pci_io_size;
133 #else
134                 size = hose->io_resource.end - hose->io_resource.start + 1;
135 #endif
136                 if (address >= hose->io_base_virt &&
137                     address < (hose->io_base_virt + size)) {
138                         ret = 1;
139                         break;
140                 }
141         }
142         spin_unlock(&hose_spinlock);
143         return ret;
144 }
145
146 /*
147  * Return the domain number for this bus.
148  */
149 int pci_domain_nr(struct pci_bus *bus)
150 {
151         struct pci_controller *hose = pci_bus_to_host(bus);
152
153         return hose->global_number;
154 }
155 EXPORT_SYMBOL(pci_domain_nr);
156
157 #ifdef CONFIG_PPC_OF
158
159 /* This routine is meant to be used early during boot, when the
160  * PCI bus numbers have not yet been assigned, and you need to
161  * issue PCI config cycles to an OF device.
162  * It could also be used to "fix" RTAS config cycles if you want
163  * to set pci_assign_all_buses to 1 and still use RTAS for PCI
164  * config cycles.
165  */
166 struct pci_controller* pci_find_hose_for_OF_device(struct device_node* node)
167 {
168         if (!have_of)
169                 return NULL;
170         while(node) {
171                 struct pci_controller *hose, *tmp;
172                 list_for_each_entry_safe(hose, tmp, &hose_list, list_node)
173                         if (hose->dn == node)
174                                 return hose;
175                 node = node->parent;
176         }
177         return NULL;
178 }
179
180 static ssize_t pci_show_devspec(struct device *dev,
181                 struct device_attribute *attr, char *buf)
182 {
183         struct pci_dev *pdev;
184         struct device_node *np;
185
186         pdev = to_pci_dev (dev);
187         np = pci_device_to_OF_node(pdev);
188         if (np == NULL || np->full_name == NULL)
189                 return 0;
190         return sprintf(buf, "%s", np->full_name);
191 }
192 static DEVICE_ATTR(devspec, S_IRUGO, pci_show_devspec, NULL);
193 #endif /* CONFIG_PPC_OF */
194
195 /* Add sysfs properties */
196 int pcibios_add_platform_entries(struct pci_dev *pdev)
197 {
198 #ifdef CONFIG_PPC_OF
199         return device_create_file(&pdev->dev, &dev_attr_devspec);
200 #else
201         return 0;
202 #endif /* CONFIG_PPC_OF */
203
204 }
205
206 char __devinit *pcibios_setup(char *str)
207 {
208         return str;
209 }
210
211 void __devinit pcibios_setup_new_device(struct pci_dev *dev)
212 {
213         struct dev_archdata *sd = &dev->dev.archdata;
214
215         sd->of_node = pci_device_to_OF_node(dev);
216
217         DBG("PCI: device %s OF node: %s\n", pci_name(dev),
218             sd->of_node ? sd->of_node->full_name : "<none>");
219
220         sd->dma_ops = pci_dma_ops;
221 #ifdef CONFIG_PPC32
222         sd->dma_data = (void *)PCI_DRAM_OFFSET;
223 #endif
224         set_dev_node(&dev->dev, pcibus_to_node(dev->bus));
225
226         if (ppc_md.pci_dma_dev_setup)
227                 ppc_md.pci_dma_dev_setup(dev);
228 }
229 EXPORT_SYMBOL(pcibios_setup_new_device);
230
231 /*
232  * Reads the interrupt pin to determine if interrupt is use by card.
233  * If the interrupt is used, then gets the interrupt line from the
234  * openfirmware and sets it in the pci_dev and pci_config line.
235  */
236 int pci_read_irq_line(struct pci_dev *pci_dev)
237 {
238         struct of_irq oirq;
239         unsigned int virq;
240
241         /* The current device-tree that iSeries generates from the HV
242          * PCI informations doesn't contain proper interrupt routing,
243          * and all the fallback would do is print out crap, so we
244          * don't attempt to resolve the interrupts here at all, some
245          * iSeries specific fixup does it.
246          *
247          * In the long run, we will hopefully fix the generated device-tree
248          * instead.
249          */
250 #ifdef CONFIG_PPC_ISERIES
251         if (firmware_has_feature(FW_FEATURE_ISERIES))
252                 return -1;
253 #endif
254
255         DBG("Try to map irq for %s...\n", pci_name(pci_dev));
256
257 #ifdef DEBUG
258         memset(&oirq, 0xff, sizeof(oirq));
259 #endif
260         /* Try to get a mapping from the device-tree */
261         if (of_irq_map_pci(pci_dev, &oirq)) {
262                 u8 line, pin;
263
264                 /* If that fails, lets fallback to what is in the config
265                  * space and map that through the default controller. We
266                  * also set the type to level low since that's what PCI
267                  * interrupts are. If your platform does differently, then
268                  * either provide a proper interrupt tree or don't use this
269                  * function.
270                  */
271                 if (pci_read_config_byte(pci_dev, PCI_INTERRUPT_PIN, &pin))
272                         return -1;
273                 if (pin == 0)
274                         return -1;
275                 if (pci_read_config_byte(pci_dev, PCI_INTERRUPT_LINE, &line) ||
276                     line == 0xff || line == 0) {
277                         return -1;
278                 }
279                 DBG(" -> no map ! Using line %d (pin %d) from PCI config\n",
280                     line, pin);
281
282                 virq = irq_create_mapping(NULL, line);
283                 if (virq != NO_IRQ)
284                         set_irq_type(virq, IRQ_TYPE_LEVEL_LOW);
285         } else {
286                 DBG(" -> got one, spec %d cells (0x%08x 0x%08x...) on %s\n",
287                     oirq.size, oirq.specifier[0], oirq.specifier[1],
288                     oirq.controller->full_name);
289
290                 virq = irq_create_of_mapping(oirq.controller, oirq.specifier,
291                                              oirq.size);
292         }
293         if(virq == NO_IRQ) {
294                 DBG(" -> failed to map !\n");
295                 return -1;
296         }
297
298         DBG(" -> mapped to linux irq %d\n", virq);
299
300         pci_dev->irq = virq;
301
302         return 0;
303 }
304 EXPORT_SYMBOL(pci_read_irq_line);
305
306 /*
307  * Platform support for /proc/bus/pci/X/Y mmap()s,
308  * modelled on the sparc64 implementation by Dave Miller.
309  *  -- paulus.
310  */
311
312 /*
313  * Adjust vm_pgoff of VMA such that it is the physical page offset
314  * corresponding to the 32-bit pci bus offset for DEV requested by the user.
315  *
316  * Basically, the user finds the base address for his device which he wishes
317  * to mmap.  They read the 32-bit value from the config space base register,
318  * add whatever PAGE_SIZE multiple offset they wish, and feed this into the
319  * offset parameter of mmap on /proc/bus/pci/XXX for that device.
320  *
321  * Returns negative error code on failure, zero on success.
322  */
323 static struct resource *__pci_mmap_make_offset(struct pci_dev *dev,
324                                                resource_size_t *offset,
325                                                enum pci_mmap_state mmap_state)
326 {
327         struct pci_controller *hose = pci_bus_to_host(dev->bus);
328         unsigned long io_offset = 0;
329         int i, res_bit;
330
331         if (hose == 0)
332                 return NULL;            /* should never happen */
333
334         /* If memory, add on the PCI bridge address offset */
335         if (mmap_state == pci_mmap_mem) {
336 #if 0 /* See comment in pci_resource_to_user() for why this is disabled */
337                 *offset += hose->pci_mem_offset;
338 #endif
339                 res_bit = IORESOURCE_MEM;
340         } else {
341                 io_offset = (unsigned long)hose->io_base_virt - _IO_BASE;
342                 *offset += io_offset;
343                 res_bit = IORESOURCE_IO;
344         }
345
346         /*
347          * Check that the offset requested corresponds to one of the
348          * resources of the device.
349          */
350         for (i = 0; i <= PCI_ROM_RESOURCE; i++) {
351                 struct resource *rp = &dev->resource[i];
352                 int flags = rp->flags;
353
354                 /* treat ROM as memory (should be already) */
355                 if (i == PCI_ROM_RESOURCE)
356                         flags |= IORESOURCE_MEM;
357
358                 /* Active and same type? */
359                 if ((flags & res_bit) == 0)
360                         continue;
361
362                 /* In the range of this resource? */
363                 if (*offset < (rp->start & PAGE_MASK) || *offset > rp->end)
364                         continue;
365
366                 /* found it! construct the final physical address */
367                 if (mmap_state == pci_mmap_io)
368                         *offset += hose->io_base_phys - io_offset;
369                 return rp;
370         }
371
372         return NULL;
373 }
374
375 /*
376  * Set vm_page_prot of VMA, as appropriate for this architecture, for a pci
377  * device mapping.
378  */
379 static pgprot_t __pci_mmap_set_pgprot(struct pci_dev *dev, struct resource *rp,
380                                       pgprot_t protection,
381                                       enum pci_mmap_state mmap_state,
382                                       int write_combine)
383 {
384         unsigned long prot = pgprot_val(protection);
385
386         /* Write combine is always 0 on non-memory space mappings. On
387          * memory space, if the user didn't pass 1, we check for a
388          * "prefetchable" resource. This is a bit hackish, but we use
389          * this to workaround the inability of /sysfs to provide a write
390          * combine bit
391          */
392         if (mmap_state != pci_mmap_mem)
393                 write_combine = 0;
394         else if (write_combine == 0) {
395                 if (rp->flags & IORESOURCE_PREFETCH)
396                         write_combine = 1;
397         }
398
399         /* XXX would be nice to have a way to ask for write-through */
400         prot |= _PAGE_NO_CACHE;
401         if (write_combine)
402                 prot &= ~_PAGE_GUARDED;
403         else
404                 prot |= _PAGE_GUARDED;
405
406         return __pgprot(prot);
407 }
408
409 /*
410  * This one is used by /dev/mem and fbdev who have no clue about the
411  * PCI device, it tries to find the PCI device first and calls the
412  * above routine
413  */
414 pgprot_t pci_phys_mem_access_prot(struct file *file,
415                                   unsigned long pfn,
416                                   unsigned long size,
417                                   pgprot_t protection)
418 {
419         struct pci_dev *pdev = NULL;
420         struct resource *found = NULL;
421         unsigned long prot = pgprot_val(protection);
422         resource_size_t offset = ((resource_size_t)pfn) << PAGE_SHIFT;
423         int i;
424
425         if (page_is_ram(pfn))
426                 return __pgprot(prot);
427
428         prot |= _PAGE_NO_CACHE | _PAGE_GUARDED;
429
430         for_each_pci_dev(pdev) {
431                 for (i = 0; i <= PCI_ROM_RESOURCE; i++) {
432                         struct resource *rp = &pdev->resource[i];
433                         int flags = rp->flags;
434
435                         /* Active and same type? */
436                         if ((flags & IORESOURCE_MEM) == 0)
437                                 continue;
438                         /* In the range of this resource? */
439                         if (offset < (rp->start & PAGE_MASK) ||
440                             offset > rp->end)
441                                 continue;
442                         found = rp;
443                         break;
444                 }
445                 if (found)
446                         break;
447         }
448         if (found) {
449                 if (found->flags & IORESOURCE_PREFETCH)
450                         prot &= ~_PAGE_GUARDED;
451                 pci_dev_put(pdev);
452         }
453
454         DBG("non-PCI map for %lx, prot: %lx\n", offset, prot);
455
456         return __pgprot(prot);
457 }
458
459
460 /*
461  * Perform the actual remap of the pages for a PCI device mapping, as
462  * appropriate for this architecture.  The region in the process to map
463  * is described by vm_start and vm_end members of VMA, the base physical
464  * address is found in vm_pgoff.
465  * The pci device structure is provided so that architectures may make mapping
466  * decisions on a per-device or per-bus basis.
467  *
468  * Returns a negative error code on failure, zero on success.
469  */
470 int pci_mmap_page_range(struct pci_dev *dev, struct vm_area_struct *vma,
471                         enum pci_mmap_state mmap_state, int write_combine)
472 {
473         resource_size_t offset =
474                 ((resource_size_t)vma->vm_pgoff) << PAGE_SHIFT;
475         struct resource *rp;
476         int ret;
477
478         rp = __pci_mmap_make_offset(dev, &offset, mmap_state);
479         if (rp == NULL)
480                 return -EINVAL;
481
482         vma->vm_pgoff = offset >> PAGE_SHIFT;
483         vma->vm_page_prot = __pci_mmap_set_pgprot(dev, rp,
484                                                   vma->vm_page_prot,
485                                                   mmap_state, write_combine);
486
487         ret = remap_pfn_range(vma, vma->vm_start, vma->vm_pgoff,
488                                vma->vm_end - vma->vm_start, vma->vm_page_prot);
489
490         return ret;
491 }
492
493 void pci_resource_to_user(const struct pci_dev *dev, int bar,
494                           const struct resource *rsrc,
495                           resource_size_t *start, resource_size_t *end)
496 {
497         struct pci_controller *hose = pci_bus_to_host(dev->bus);
498         resource_size_t offset = 0;
499
500         if (hose == NULL)
501                 return;
502
503         if (rsrc->flags & IORESOURCE_IO)
504                 offset = (unsigned long)hose->io_base_virt - _IO_BASE;
505
506         /* We pass a fully fixed up address to userland for MMIO instead of
507          * a BAR value because X is lame and expects to be able to use that
508          * to pass to /dev/mem !
509          *
510          * That means that we'll have potentially 64 bits values where some
511          * userland apps only expect 32 (like X itself since it thinks only
512          * Sparc has 64 bits MMIO) but if we don't do that, we break it on
513          * 32 bits CHRPs :-(
514          *
515          * Hopefully, the sysfs insterface is immune to that gunk. Once X
516          * has been fixed (and the fix spread enough), we can re-enable the
517          * 2 lines below and pass down a BAR value to userland. In that case
518          * we'll also have to re-enable the matching code in
519          * __pci_mmap_make_offset().
520          *
521          * BenH.
522          */
523 #if 0
524         else if (rsrc->flags & IORESOURCE_MEM)
525                 offset = hose->pci_mem_offset;
526 #endif
527
528         *start = rsrc->start - offset;
529         *end = rsrc->end - offset;
530 }
531
532 /**
533  * pci_process_bridge_OF_ranges - Parse PCI bridge resources from device tree
534  * @hose: newly allocated pci_controller to be setup
535  * @dev: device node of the host bridge
536  * @primary: set if primary bus (32 bits only, soon to be deprecated)
537  *
538  * This function will parse the "ranges" property of a PCI host bridge device
539  * node and setup the resource mapping of a pci controller based on its
540  * content.
541  *
542  * Life would be boring if it wasn't for a few issues that we have to deal
543  * with here:
544  *
545  *   - We can only cope with one IO space range and up to 3 Memory space
546  *     ranges. However, some machines (thanks Apple !) tend to split their
547  *     space into lots of small contiguous ranges. So we have to coalesce.
548  *
549  *   - We can only cope with all memory ranges having the same offset
550  *     between CPU addresses and PCI addresses. Unfortunately, some bridges
551  *     are setup for a large 1:1 mapping along with a small "window" which
552  *     maps PCI address 0 to some arbitrary high address of the CPU space in
553  *     order to give access to the ISA memory hole.
554  *     The way out of here that I've chosen for now is to always set the
555  *     offset based on the first resource found, then override it if we
556  *     have a different offset and the previous was set by an ISA hole.
557  *
558  *   - Some busses have IO space not starting at 0, which causes trouble with
559  *     the way we do our IO resource renumbering. The code somewhat deals with
560  *     it for 64 bits but I would expect problems on 32 bits.
561  *
562  *   - Some 32 bits platforms such as 4xx can have physical space larger than
563  *     32 bits so we need to use 64 bits values for the parsing
564  */
565 void __devinit pci_process_bridge_OF_ranges(struct pci_controller *hose,
566                                             struct device_node *dev,
567                                             int primary)
568 {
569         const u32 *ranges;
570         int rlen;
571         int pna = of_n_addr_cells(dev);
572         int np = pna + 5;
573         int memno = 0, isa_hole = -1;
574         u32 pci_space;
575         unsigned long long pci_addr, cpu_addr, pci_next, cpu_next, size;
576         unsigned long long isa_mb = 0;
577         struct resource *res;
578
579         printk(KERN_INFO "PCI host bridge %s %s ranges:\n",
580                dev->full_name, primary ? "(primary)" : "");
581
582         /* Get ranges property */
583         ranges = of_get_property(dev, "ranges", &rlen);
584         if (ranges == NULL)
585                 return;
586
587         /* Parse it */
588         while ((rlen -= np * 4) >= 0) {
589                 /* Read next ranges element */
590                 pci_space = ranges[0];
591                 pci_addr = of_read_number(ranges + 1, 2);
592                 cpu_addr = of_translate_address(dev, ranges + 3);
593                 size = of_read_number(ranges + pna + 3, 2);
594                 ranges += np;
595                 if (cpu_addr == OF_BAD_ADDR || size == 0)
596                         continue;
597
598                 /* Now consume following elements while they are contiguous */
599                 for (; rlen >= np * sizeof(u32);
600                      ranges += np, rlen -= np * 4) {
601                         if (ranges[0] != pci_space)
602                                 break;
603                         pci_next = of_read_number(ranges + 1, 2);
604                         cpu_next = of_translate_address(dev, ranges + 3);
605                         if (pci_next != pci_addr + size ||
606                             cpu_next != cpu_addr + size)
607                                 break;
608                         size += of_read_number(ranges + pna + 3, 2);
609                 }
610
611                 /* Act based on address space type */
612                 res = NULL;
613                 switch ((pci_space >> 24) & 0x3) {
614                 case 1:         /* PCI IO space */
615                         printk(KERN_INFO
616                                "  IO 0x%016llx..0x%016llx -> 0x%016llx\n",
617                                cpu_addr, cpu_addr + size - 1, pci_addr);
618
619                         /* We support only one IO range */
620                         if (hose->pci_io_size) {
621                                 printk(KERN_INFO
622                                        " \\--> Skipped (too many) !\n");
623                                 continue;
624                         }
625 #ifdef CONFIG_PPC32
626                         /* On 32 bits, limit I/O space to 16MB */
627                         if (size > 0x01000000)
628                                 size = 0x01000000;
629
630                         /* 32 bits needs to map IOs here */
631                         hose->io_base_virt = ioremap(cpu_addr, size);
632
633                         /* Expect trouble if pci_addr is not 0 */
634                         if (primary)
635                                 isa_io_base =
636                                         (unsigned long)hose->io_base_virt;
637 #endif /* CONFIG_PPC32 */
638                         /* pci_io_size and io_base_phys always represent IO
639                          * space starting at 0 so we factor in pci_addr
640                          */
641                         hose->pci_io_size = pci_addr + size;
642                         hose->io_base_phys = cpu_addr - pci_addr;
643
644                         /* Build resource */
645                         res = &hose->io_resource;
646                         res->flags = IORESOURCE_IO;
647                         res->start = pci_addr;
648                         break;
649                 case 2:         /* PCI Memory space */
650                 case 3:         /* PCI 64 bits Memory space */
651                         printk(KERN_INFO
652                                " MEM 0x%016llx..0x%016llx -> 0x%016llx %s\n",
653                                cpu_addr, cpu_addr + size - 1, pci_addr,
654                                (pci_space & 0x40000000) ? "Prefetch" : "");
655
656                         /* We support only 3 memory ranges */
657                         if (memno >= 3) {
658                                 printk(KERN_INFO
659                                        " \\--> Skipped (too many) !\n");
660                                 continue;
661                         }
662                         /* Handles ISA memory hole space here */
663                         if (pci_addr == 0) {
664                                 isa_mb = cpu_addr;
665                                 isa_hole = memno;
666                                 if (primary || isa_mem_base == 0)
667                                         isa_mem_base = cpu_addr;
668                         }
669
670                         /* We get the PCI/Mem offset from the first range or
671                          * the, current one if the offset came from an ISA
672                          * hole. If they don't match, bugger.
673                          */
674                         if (memno == 0 ||
675                             (isa_hole >= 0 && pci_addr != 0 &&
676                              hose->pci_mem_offset == isa_mb))
677                                 hose->pci_mem_offset = cpu_addr - pci_addr;
678                         else if (pci_addr != 0 &&
679                                  hose->pci_mem_offset != cpu_addr - pci_addr) {
680                                 printk(KERN_INFO
681                                        " \\--> Skipped (offset mismatch) !\n");
682                                 continue;
683                         }
684
685                         /* Build resource */
686                         res = &hose->mem_resources[memno++];
687                         res->flags = IORESOURCE_MEM;
688                         if (pci_space & 0x40000000)
689                                 res->flags |= IORESOURCE_PREFETCH;
690                         res->start = cpu_addr;
691                         break;
692                 }
693                 if (res != NULL) {
694                         res->name = dev->full_name;
695                         res->end = res->start + size - 1;
696                         res->parent = NULL;
697                         res->sibling = NULL;
698                         res->child = NULL;
699                 }
700         }
701
702         /* If there's an ISA hole and the pci_mem_offset is -not- matching
703          * the ISA hole offset, then we need to remove the ISA hole from
704          * the resource list for that brige
705          */
706         if (isa_hole >= 0 && hose->pci_mem_offset != isa_mb) {
707                 unsigned int next = isa_hole + 1;
708                 printk(KERN_INFO " Removing ISA hole at 0x%016llx\n", isa_mb);
709                 if (next < memno)
710                         memmove(&hose->mem_resources[isa_hole],
711                                 &hose->mem_resources[next],
712                                 sizeof(struct resource) * (memno - next));
713                 hose->mem_resources[--memno].flags = 0;
714         }
715 }
716
717 /* Decide whether to display the domain number in /proc */
718 int pci_proc_domain(struct pci_bus *bus)
719 {
720         struct pci_controller *hose = pci_bus_to_host(bus);
721 #ifdef CONFIG_PPC64
722         return hose->buid != 0;
723 #else
724         if (!(ppc_pci_flags & PPC_PCI_ENABLE_PROC_DOMAINS))
725                 return 0;
726         if (ppc_pci_flags & PPC_PCI_COMPAT_DOMAIN_0)
727                 return hose->global_number != 0;
728         return 1;
729 #endif
730 }
731
732 void pcibios_resource_to_bus(struct pci_dev *dev, struct pci_bus_region *region,
733                              struct resource *res)
734 {
735         resource_size_t offset = 0, mask = (resource_size_t)-1;
736         struct pci_controller *hose = pci_bus_to_host(dev->bus);
737
738         if (!hose)
739                 return;
740         if (res->flags & IORESOURCE_IO) {
741                 offset = (unsigned long)hose->io_base_virt - _IO_BASE;
742                 mask = 0xffffffffu;
743         } else if (res->flags & IORESOURCE_MEM)
744                 offset = hose->pci_mem_offset;
745
746         region->start = (res->start - offset) & mask;
747         region->end = (res->end - offset) & mask;
748 }
749 EXPORT_SYMBOL(pcibios_resource_to_bus);
750
751 void pcibios_bus_to_resource(struct pci_dev *dev, struct resource *res,
752                              struct pci_bus_region *region)
753 {
754         resource_size_t offset = 0, mask = (resource_size_t)-1;
755         struct pci_controller *hose = pci_bus_to_host(dev->bus);
756
757         if (!hose)
758                 return;
759         if (res->flags & IORESOURCE_IO) {
760                 offset = (unsigned long)hose->io_base_virt - _IO_BASE;
761                 mask = 0xffffffffu;
762         } else if (res->flags & IORESOURCE_MEM)
763                 offset = hose->pci_mem_offset;
764         res->start = (region->start + offset) & mask;
765         res->end = (region->end + offset) & mask;
766 }
767 EXPORT_SYMBOL(pcibios_bus_to_resource);
768
769 /* Fixup a bus resource into a linux resource */
770 static void __devinit fixup_resource(struct resource *res, struct pci_dev *dev)
771 {
772         struct pci_controller *hose = pci_bus_to_host(dev->bus);
773         resource_size_t offset = 0, mask = (resource_size_t)-1;
774
775         if (res->flags & IORESOURCE_IO) {
776                 offset = (unsigned long)hose->io_base_virt - _IO_BASE;
777                 mask = 0xffffffffu;
778         } else if (res->flags & IORESOURCE_MEM)
779                 offset = hose->pci_mem_offset;
780
781         res->start = (res->start + offset) & mask;
782         res->end = (res->end + offset) & mask;
783 }
784
785
786 /* This header fixup will do the resource fixup for all devices as they are
787  * probed, but not for bridge ranges
788  */
789 static void __devinit pcibios_fixup_resources(struct pci_dev *dev)
790 {
791         struct pci_controller *hose = pci_bus_to_host(dev->bus);
792         int i;
793
794         if (!hose) {
795                 printk(KERN_ERR "No host bridge for PCI dev %s !\n",
796                        pci_name(dev));
797                 return;
798         }
799         for (i = 0; i < DEVICE_COUNT_RESOURCE; i++) {
800                 struct resource *res = dev->resource + i;
801                 if (!res->flags)
802                         continue;
803                 /* On platforms that have PPC_PCI_PROBE_ONLY set, we don't
804                  * consider 0 as an unassigned BAR value. It's technically
805                  * a valid value, but linux doesn't like it... so when we can
806                  * re-assign things, we do so, but if we can't, we keep it
807                  * around and hope for the best...
808                  */
809                 if (res->start == 0 && !(ppc_pci_flags & PPC_PCI_PROBE_ONLY)) {
810                         pr_debug("PCI:%s Resource %d %016llx-%016llx [%x] is unassigned\n",
811                                  pci_name(dev), i,
812                                  (unsigned long long)res->start,
813                                  (unsigned long long)res->end,
814                                  (unsigned int)res->flags);
815                         res->end -= res->start;
816                         res->start = 0;
817                         res->flags |= IORESOURCE_UNSET;
818                         continue;
819                 }
820
821                 pr_debug("PCI:%s Resource %d %016llx-%016llx [%x] fixup...\n",
822                          pci_name(dev), i,
823                          (unsigned long long)res->start,\
824                          (unsigned long long)res->end,
825                          (unsigned int)res->flags);
826
827                 fixup_resource(res, dev);
828
829                 pr_debug("PCI:%s            %016llx-%016llx\n",
830                          pci_name(dev),
831                          (unsigned long long)res->start,
832                          (unsigned long long)res->end);
833         }
834
835         /* Call machine specific resource fixup */
836         if (ppc_md.pcibios_fixup_resources)
837                 ppc_md.pcibios_fixup_resources(dev);
838 }
839 DECLARE_PCI_FIXUP_HEADER(PCI_ANY_ID, PCI_ANY_ID, pcibios_fixup_resources);
840
841 /* This function tries to figure out if a bridge resource has been initialized
842  * by the firmware or not. It doesn't have to be absolutely bullet proof, but
843  * things go more smoothly when it gets it right. It should covers cases such
844  * as Apple "closed" bridge resources and bare-metal pSeries unassigned bridges
845  */
846 static int __devinit pcibios_uninitialized_bridge_resource(struct pci_bus *bus,
847                                                            struct resource *res)
848 {
849         struct pci_controller *hose = pci_bus_to_host(bus);
850         struct pci_dev *dev = bus->self;
851         resource_size_t offset;
852         u16 command;
853         int i;
854
855         /* We don't do anything if PCI_PROBE_ONLY is set */
856         if (ppc_pci_flags & PPC_PCI_PROBE_ONLY)
857                 return 0;
858
859         /* Job is a bit different between memory and IO */
860         if (res->flags & IORESOURCE_MEM) {
861                 /* If the BAR is non-0 (res != pci_mem_offset) then it's probably been
862                  * initialized by somebody
863                  */
864                 if (res->start != hose->pci_mem_offset)
865                         return 0;
866
867                 /* The BAR is 0, let's check if memory decoding is enabled on
868                  * the bridge. If not, we consider it unassigned
869                  */
870                 pci_read_config_word(dev, PCI_COMMAND, &command);
871                 if ((command & PCI_COMMAND_MEMORY) == 0)
872                         return 1;
873
874                 /* Memory decoding is enabled and the BAR is 0. If any of the bridge
875                  * resources covers that starting address (0 then it's good enough for
876                  * us for memory
877                  */
878                 for (i = 0; i < 3; i++) {
879                         if ((hose->mem_resources[i].flags & IORESOURCE_MEM) &&
880                             hose->mem_resources[i].start == hose->pci_mem_offset)
881                                 return 0;
882                 }
883
884                 /* Well, it starts at 0 and we know it will collide so we may as
885                  * well consider it as unassigned. That covers the Apple case.
886                  */
887                 return 1;
888         } else {
889                 /* If the BAR is non-0, then we consider it assigned */
890                 offset = (unsigned long)hose->io_base_virt - _IO_BASE;
891                 if (((res->start - offset) & 0xfffffffful) != 0)
892                         return 0;
893
894                 /* Here, we are a bit different than memory as typically IO space
895                  * starting at low addresses -is- valid. What we do instead if that
896                  * we consider as unassigned anything that doesn't have IO enabled
897                  * in the PCI command register, and that's it.
898                  */
899                 pci_read_config_word(dev, PCI_COMMAND, &command);
900                 if (command & PCI_COMMAND_IO)
901                         return 0;
902
903                 /* It's starting at 0 and IO is disabled in the bridge, consider
904                  * it unassigned
905                  */
906                 return 1;
907         }
908 }
909
910 /* Fixup resources of a PCI<->PCI bridge */
911 static void __devinit pcibios_fixup_bridge(struct pci_bus *bus)
912 {
913         struct resource *res;
914         int i;
915
916         struct pci_dev *dev = bus->self;
917
918         for (i = 0; i < PCI_BUS_NUM_RESOURCES; ++i) {
919                 if ((res = bus->resource[i]) == NULL)
920                         continue;
921                 if (!res->flags)
922                         continue;
923                 if (i >= 3 && bus->self->transparent)
924                         continue;
925
926                 pr_debug("PCI:%s Bus rsrc %d %016llx-%016llx [%x] fixup...\n",
927                          pci_name(dev), i,
928                          (unsigned long long)res->start,\
929                          (unsigned long long)res->end,
930                          (unsigned int)res->flags);
931
932                 /* Perform fixup */
933                 fixup_resource(res, dev);
934
935                 /* Try to detect uninitialized P2P bridge resources,
936                  * and clear them out so they get re-assigned later
937                  */
938                 if (pcibios_uninitialized_bridge_resource(bus, res)) {
939                         res->flags = 0;
940                         pr_debug("PCI:%s            (unassigned)\n", pci_name(dev));
941                 } else {
942
943                         pr_debug("PCI:%s            %016llx-%016llx\n",
944                                  pci_name(dev),
945                                  (unsigned long long)res->start,
946                                  (unsigned long long)res->end);
947                 }
948         }
949 }
950
951 static void __devinit __pcibios_fixup_bus(struct pci_bus *bus)
952 {
953         struct pci_dev *dev = bus->self;
954
955         pr_debug("PCI: Fixup bus %d (%s)\n", bus->number, dev ? pci_name(dev) : "PHB");
956
957         /* Fixup PCI<->PCI bridges. Host bridges are handled separately, for
958          * now differently between 32 and 64 bits.
959          */
960         if (dev != NULL)
961                 pcibios_fixup_bridge(bus);
962
963         /* Additional setup that is different between 32 and 64 bits for now */
964         pcibios_do_bus_setup(bus);
965
966         /* Platform specific bus fixups */
967         if (ppc_md.pcibios_fixup_bus)
968                 ppc_md.pcibios_fixup_bus(bus);
969
970         /* Read default IRQs and fixup if necessary */
971         list_for_each_entry(dev, &bus->devices, bus_list) {
972                 pci_read_irq_line(dev);
973                 if (ppc_md.pci_irq_fixup)
974                         ppc_md.pci_irq_fixup(dev);
975         }
976 }
977
978 void __devinit pcibios_fixup_bus(struct pci_bus *bus)
979 {
980         /* When called from the generic PCI probe, read PCI<->PCI bridge
981          * bases before proceeding
982          */
983         if (bus->self != NULL)
984                 pci_read_bridge_bases(bus);
985         __pcibios_fixup_bus(bus);
986 }
987 EXPORT_SYMBOL(pcibios_fixup_bus);
988
989 /* When building a bus from the OF tree rather than probing, we need a
990  * slightly different version of the fixup which doesn't read the
991  * bridge bases using config space accesses
992  */
993 void __devinit pcibios_fixup_of_probed_bus(struct pci_bus *bus)
994 {
995         __pcibios_fixup_bus(bus);
996 }
997
998 static int skip_isa_ioresource_align(struct pci_dev *dev)
999 {
1000         if ((ppc_pci_flags & PPC_PCI_CAN_SKIP_ISA_ALIGN) &&
1001             !(dev->bus->bridge_ctl & PCI_BRIDGE_CTL_ISA))
1002                 return 1;
1003         return 0;
1004 }
1005
1006 /*
1007  * We need to avoid collisions with `mirrored' VGA ports
1008  * and other strange ISA hardware, so we always want the
1009  * addresses to be allocated in the 0x000-0x0ff region
1010  * modulo 0x400.
1011  *
1012  * Why? Because some silly external IO cards only decode
1013  * the low 10 bits of the IO address. The 0x00-0xff region
1014  * is reserved for motherboard devices that decode all 16
1015  * bits, so it's ok to allocate at, say, 0x2800-0x28ff,
1016  * but we want to try to avoid allocating at 0x2900-0x2bff
1017  * which might have be mirrored at 0x0100-0x03ff..
1018  */
1019 void pcibios_align_resource(void *data, struct resource *res,
1020                                 resource_size_t size, resource_size_t align)
1021 {
1022         struct pci_dev *dev = data;
1023
1024         if (res->flags & IORESOURCE_IO) {
1025                 resource_size_t start = res->start;
1026
1027                 if (skip_isa_ioresource_align(dev))
1028                         return;
1029                 if (start & 0x300) {
1030                         start = (start + 0x3ff) & ~0x3ff;
1031                         res->start = start;
1032                 }
1033         }
1034 }
1035 EXPORT_SYMBOL(pcibios_align_resource);
1036
1037 /*
1038  * Reparent resource children of pr that conflict with res
1039  * under res, and make res replace those children.
1040  */
1041 static int __init reparent_resources(struct resource *parent,
1042                                      struct resource *res)
1043 {
1044         struct resource *p, **pp;
1045         struct resource **firstpp = NULL;
1046
1047         for (pp = &parent->child; (p = *pp) != NULL; pp = &p->sibling) {
1048                 if (p->end < res->start)
1049                         continue;
1050                 if (res->end < p->start)
1051                         break;
1052                 if (p->start < res->start || p->end > res->end)
1053                         return -1;      /* not completely contained */
1054                 if (firstpp == NULL)
1055                         firstpp = pp;
1056         }
1057         if (firstpp == NULL)
1058                 return -1;      /* didn't find any conflicting entries? */
1059         res->parent = parent;
1060         res->child = *firstpp;
1061         res->sibling = *pp;
1062         *firstpp = res;
1063         *pp = NULL;
1064         for (p = res->child; p != NULL; p = p->sibling) {
1065                 p->parent = res;
1066                 DBG(KERN_INFO "PCI: reparented %s [%llx..%llx] under %s\n",
1067                     p->name,
1068                     (unsigned long long)p->start,
1069                     (unsigned long long)p->end, res->name);
1070         }
1071         return 0;
1072 }
1073
1074 /*
1075  *  Handle resources of PCI devices.  If the world were perfect, we could
1076  *  just allocate all the resource regions and do nothing more.  It isn't.
1077  *  On the other hand, we cannot just re-allocate all devices, as it would
1078  *  require us to know lots of host bridge internals.  So we attempt to
1079  *  keep as much of the original configuration as possible, but tweak it
1080  *  when it's found to be wrong.
1081  *
1082  *  Known BIOS problems we have to work around:
1083  *      - I/O or memory regions not configured
1084  *      - regions configured, but not enabled in the command register
1085  *      - bogus I/O addresses above 64K used
1086  *      - expansion ROMs left enabled (this may sound harmless, but given
1087  *        the fact the PCI specs explicitly allow address decoders to be
1088  *        shared between expansion ROMs and other resource regions, it's
1089  *        at least dangerous)
1090  *
1091  *  Our solution:
1092  *      (1) Allocate resources for all buses behind PCI-to-PCI bridges.
1093  *          This gives us fixed barriers on where we can allocate.
1094  *      (2) Allocate resources for all enabled devices.  If there is
1095  *          a collision, just mark the resource as unallocated. Also
1096  *          disable expansion ROMs during this step.
1097  *      (3) Try to allocate resources for disabled devices.  If the
1098  *          resources were assigned correctly, everything goes well,
1099  *          if they weren't, they won't disturb allocation of other
1100  *          resources.
1101  *      (4) Assign new addresses to resources which were either
1102  *          not configured at all or misconfigured.  If explicitly
1103  *          requested by the user, configure expansion ROM address
1104  *          as well.
1105  */
1106
1107 static void __init pcibios_allocate_bus_resources(struct list_head *bus_list)
1108 {
1109         struct pci_bus *bus;
1110         int i;
1111         struct resource *res, *pr;
1112
1113         /* Depth-First Search on bus tree */
1114         list_for_each_entry(bus, bus_list, node) {
1115                 for (i = 0; i < PCI_BUS_NUM_RESOURCES; ++i) {
1116                         if ((res = bus->resource[i]) == NULL || !res->flags
1117                             || res->start > res->end)
1118                                 continue;
1119                         if (bus->parent == NULL)
1120                                 pr = (res->flags & IORESOURCE_IO) ?
1121                                         &ioport_resource : &iomem_resource;
1122                         else {
1123                                 /* Don't bother with non-root busses when
1124                                  * re-assigning all resources. We clear the
1125                                  * resource flags as if they were colliding
1126                                  * and as such ensure proper re-allocation
1127                                  * later.
1128                                  */
1129                                 if (ppc_pci_flags & PPC_PCI_REASSIGN_ALL_RSRC)
1130                                         goto clear_resource;
1131                                 pr = pci_find_parent_resource(bus->self, res);
1132                                 if (pr == res) {
1133                                         /* this happens when the generic PCI
1134                                          * code (wrongly) decides that this
1135                                          * bridge is transparent  -- paulus
1136                                          */
1137                                         continue;
1138                                 }
1139                         }
1140
1141                         DBG("PCI: %s (bus %d) bridge rsrc %d: %016llx-%016llx "
1142                             "[0x%x], parent %p (%s)\n",
1143                             bus->self ? pci_name(bus->self) : "PHB",
1144                             bus->number, i,
1145                             (unsigned long long)res->start,
1146                             (unsigned long long)res->end,
1147                             (unsigned int)res->flags,
1148                             pr, (pr && pr->name) ? pr->name : "nil");
1149
1150                         if (pr && !(pr->flags & IORESOURCE_UNSET)) {
1151                                 if (request_resource(pr, res) == 0)
1152                                         continue;
1153                                 /*
1154                                  * Must be a conflict with an existing entry.
1155                                  * Move that entry (or entries) under the
1156                                  * bridge resource and try again.
1157                                  */
1158                                 if (reparent_resources(pr, res) == 0)
1159                                         continue;
1160                         }
1161                         printk(KERN_WARNING
1162                                "PCI: Cannot allocate resource region "
1163                                "%d of PCI bridge %d, will remap\n",
1164                                i, bus->number);
1165 clear_resource:
1166                         res->flags = 0;
1167                 }
1168                 pcibios_allocate_bus_resources(&bus->children);
1169         }
1170 }
1171
1172 static inline void __devinit alloc_resource(struct pci_dev *dev, int idx)
1173 {
1174         struct resource *pr, *r = &dev->resource[idx];
1175
1176         DBG("PCI: Allocating %s: Resource %d: %016llx..%016llx [%x]\n",
1177             pci_name(dev), idx,
1178             (unsigned long long)r->start,
1179             (unsigned long long)r->end,
1180             (unsigned int)r->flags);
1181
1182         pr = pci_find_parent_resource(dev, r);
1183         if (!pr || (pr->flags & IORESOURCE_UNSET) ||
1184             request_resource(pr, r) < 0) {
1185                 printk(KERN_WARNING "PCI: Cannot allocate resource region %d"
1186                        " of device %s, will remap\n", idx, pci_name(dev));
1187                 if (pr)
1188                         DBG("PCI:  parent is %p: %016llx-%016llx [%x]\n", pr,
1189                             (unsigned long long)pr->start,
1190                             (unsigned long long)pr->end,
1191                             (unsigned int)pr->flags);
1192                 /* We'll assign a new address later */
1193                 r->flags |= IORESOURCE_UNSET;
1194                 r->end -= r->start;
1195                 r->start = 0;
1196         }
1197 }
1198
1199 static void __init pcibios_allocate_resources(int pass)
1200 {
1201         struct pci_dev *dev = NULL;
1202         int idx, disabled;
1203         u16 command;
1204         struct resource *r;
1205
1206         for_each_pci_dev(dev) {
1207                 pci_read_config_word(dev, PCI_COMMAND, &command);
1208                 for (idx = 0; idx < 6; idx++) {
1209                         r = &dev->resource[idx];
1210                         if (r->parent)          /* Already allocated */
1211                                 continue;
1212                         if (!r->flags || (r->flags & IORESOURCE_UNSET))
1213                                 continue;       /* Not assigned at all */
1214                         if (r->flags & IORESOURCE_IO)
1215                                 disabled = !(command & PCI_COMMAND_IO);
1216                         else
1217                                 disabled = !(command & PCI_COMMAND_MEMORY);
1218                         if (pass == disabled)
1219                                 alloc_resource(dev, idx);
1220                 }
1221                 if (pass)
1222                         continue;
1223                 r = &dev->resource[PCI_ROM_RESOURCE];
1224                 if (r->flags & IORESOURCE_ROM_ENABLE) {
1225                         /* Turn the ROM off, leave the resource region,
1226                          * but keep it unregistered.
1227                          */
1228                         u32 reg;
1229                         DBG("PCI: Switching off ROM of %s\n", pci_name(dev));
1230                         r->flags &= ~IORESOURCE_ROM_ENABLE;
1231                         pci_read_config_dword(dev, dev->rom_base_reg, &reg);
1232                         pci_write_config_dword(dev, dev->rom_base_reg,
1233                                                reg & ~PCI_ROM_ADDRESS_ENABLE);
1234                 }
1235         }
1236 }
1237
1238 void __init pcibios_resource_survey(void)
1239 {
1240         /* Allocate and assign resources. If we re-assign everything, then
1241          * we skip the allocate phase
1242          */
1243         pcibios_allocate_bus_resources(&pci_root_buses);
1244
1245         if (!(ppc_pci_flags & PPC_PCI_REASSIGN_ALL_RSRC)) {
1246                 pcibios_allocate_resources(0);
1247                 pcibios_allocate_resources(1);
1248         }
1249
1250         if (!(ppc_pci_flags & PPC_PCI_PROBE_ONLY)) {
1251                 DBG("PCI: Assigning unassigned resouces...\n");
1252                 pci_assign_unassigned_resources();
1253         }
1254
1255         /* Call machine dependent fixup */
1256         if (ppc_md.pcibios_fixup)
1257                 ppc_md.pcibios_fixup();
1258 }
1259
1260 #ifdef CONFIG_HOTPLUG
1261 /* This is used by the pSeries hotplug driver to allocate resource
1262  * of newly plugged busses. We can try to consolidate with the
1263  * rest of the code later, for now, keep it as-is
1264  */
1265 void __devinit pcibios_claim_one_bus(struct pci_bus *bus)
1266 {
1267         struct pci_dev *dev;
1268         struct pci_bus *child_bus;
1269
1270         list_for_each_entry(dev, &bus->devices, bus_list) {
1271                 int i;
1272
1273                 for (i = 0; i < PCI_NUM_RESOURCES; i++) {
1274                         struct resource *r = &dev->resource[i];
1275
1276                         if (r->parent || !r->start || !r->flags)
1277                                 continue;
1278                         pci_claim_resource(dev, i);
1279                 }
1280         }
1281
1282         list_for_each_entry(child_bus, &bus->children, node)
1283                 pcibios_claim_one_bus(child_bus);
1284 }
1285 EXPORT_SYMBOL_GPL(pcibios_claim_one_bus);
1286 #endif /* CONFIG_HOTPLUG */
1287
1288 int pcibios_enable_device(struct pci_dev *dev, int mask)
1289 {
1290         if (ppc_md.pcibios_enable_device_hook)
1291                 if (ppc_md.pcibios_enable_device_hook(dev))
1292                         return -EINVAL;
1293
1294         return pci_enable_resources(dev, mask);
1295 }