2  * xor.c : Multiple Devices driver for Linux
 
   4  * Copyright (C) 1996, 1997, 1998, 1999, 2000,
 
   5  * Ingo Molnar, Matti Aarnio, Jakub Jelinek, Richard Henderson.
 
   7  * Dispatch optimized RAID-5 checksumming functions.
 
   9  * This program is free software; you can redistribute it and/or modify
 
  10  * it under the terms of the GNU General Public License as published by
 
  11  * the Free Software Foundation; either version 2, or (at your option)
 
  14  * You should have received a copy of the GNU General Public License
 
  15  * (for example /usr/src/linux/COPYING); if not, write to the Free
 
  16  * Software Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
 
  20 #include <linux/module.h>
 
  21 #include <linux/raid/md.h>
 
  22 #include <linux/raid/xor.h>
 
  25 /* The xor routines to use.  */
 
  26 static struct xor_block_template *active_template;
 
  29 xor_block(unsigned int count, unsigned int bytes, void **ptr)
 
  31         unsigned long *p0, *p1, *p2, *p3, *p4;
 
  33         p0 = (unsigned long *) ptr[0];
 
  34         p1 = (unsigned long *) ptr[1];
 
  36                 active_template->do_2(bytes, p0, p1);
 
  40         p2 = (unsigned long *) ptr[2];
 
  42                 active_template->do_3(bytes, p0, p1, p2);
 
  46         p3 = (unsigned long *) ptr[3];
 
  48                 active_template->do_4(bytes, p0, p1, p2, p3);
 
  52         p4 = (unsigned long *) ptr[4];
 
  53         active_template->do_5(bytes, p0, p1, p2, p3, p4);
 
  56 /* Set of all registered templates.  */
 
  57 static struct xor_block_template *template_list;
 
  59 #define BENCH_SIZE (PAGE_SIZE)
 
  62 do_xor_speed(struct xor_block_template *tmpl, void *b1, void *b2)
 
  68         tmpl->next = template_list;
 
  72          * Count the number of XORs done during a whole jiffy, and use
 
  73          * this to calculate the speed of checksumming.  We use a 2-page
 
  74          * allocation to have guaranteed color L1-cache layout.
 
  77         for (i = 0; i < 5; i++) {
 
  80                 while (jiffies == now) {
 
  82                         tmpl->do_2(BENCH_SIZE, b1, b2);
 
  91         speed = max * (HZ * BENCH_SIZE / 1024);
 
  94         printk("   %-10s: %5d.%03d MB/sec\n", tmpl->name,
 
  95                speed / 1000, speed % 1000);
 
  99 calibrate_xor_block(void)
 
 102         struct xor_block_template *f, *fastest;
 
 104         b1 = (void *) __get_free_pages(GFP_KERNEL, 2);
 
 106                 printk("raid5: Yikes!  No memory available.\n");
 
 109         b2 = b1 + 2*PAGE_SIZE + BENCH_SIZE;
 
 112          * If this arch/cpu has a short-circuited selection, don't loop through all
 
 113          * the possible functions, just test the best one
 
 118 #ifdef XOR_SELECT_TEMPLATE
 
 119                 fastest = XOR_SELECT_TEMPLATE(fastest);
 
 122 #define xor_speed(templ)        do_xor_speed((templ), b1, b2)
 
 125                 printk(KERN_INFO "raid5: automatically using best checksumming function: %s\n",
 
 129                 printk(KERN_INFO "raid5: measuring checksumming speed\n");
 
 131                 fastest = template_list;
 
 132                 for (f = fastest; f; f = f->next)
 
 133                         if (f->speed > fastest->speed)
 
 137         printk("raid5: using function: %s (%d.%03d MB/sec)\n",
 
 138                fastest->name, fastest->speed / 1000, fastest->speed % 1000);
 
 142         free_pages((unsigned long)b1, 2);
 
 144         active_template = fastest;
 
 148 static __exit void xor_exit(void) { }
 
 150 EXPORT_SYMBOL(xor_block);
 
 151 MODULE_LICENSE("GPL");
 
 153 module_init(calibrate_xor_block);
 
 154 module_exit(xor_exit);