2  * String handling functions for PowerPC.
 
   4  * Copyright (C) 1996 Paul Mackerras.
 
   6  * This program is free software; you can redistribute it and/or
 
   7  * modify it under the terms of the GNU General Public License
 
   8  * as published by the Free Software Foundation; either version
 
   9  * 2 of the License, or (at your option) any later version.
 
  11 #include <linux/config.h>
 
  12 #include <asm/processor.h>
 
  13 #include <asm/cache.h>
 
  14 #include <asm/errno.h>
 
  15 #include <asm/ppc_asm.h>
 
  17 #define COPY_16_BYTES           \
 
  27 #define COPY_16_BYTES_WITHEX(n) \
 
  45 #define COPY_16_BYTES_EXCODE(n)                 \
 
  47         addi    r5,r5,-(16 * n);                \
 
  50         addi    r5,r5,-(16 * n);                \
 
  52 .section __ex_table,"a";                        \
 
  54         .long   8 ## n ## 0b,9 ## n ## 0b;      \
 
  55         .long   8 ## n ## 1b,9 ## n ## 0b;      \
 
  56         .long   8 ## n ## 2b,9 ## n ## 0b;      \
 
  57         .long   8 ## n ## 3b,9 ## n ## 0b;      \
 
  58         .long   8 ## n ## 4b,9 ## n ## 1b;      \
 
  59         .long   8 ## n ## 5b,9 ## n ## 1b;      \
 
  60         .long   8 ## n ## 6b,9 ## n ## 1b;      \
 
  61         .long   8 ## n ## 7b,9 ## n ## 1b;      \
 
  65         .stabs  "arch/ppc/lib/",N_SO,0,0,0f
 
  66         .stabs  "string.S",N_SO,0,0,0f
 
  68 CACHELINE_BYTES = L1_CACHE_BYTES
 
  69 LG_CACHELINE_BYTES = L1_CACHE_SHIFT
 
  70 CACHELINE_MASK = (L1_CACHE_BYTES-1)
 
  81 /* This clears out any unused part of the destination buffer,
 
  82    just as the libc version does.  -- paulus */
 
  92         bdnzf   2,1b            /* dec ctr, branch if ctr != 0 && !cr0.eq */
 
  93         bnelr                   /* if we didn't hit a null char, we're done */
 
  95         cmpwi   0,r5,0          /* any space left in destination buffer? */
 
  96         beqlr                   /* we know r0 == 0 here */
 
  97 2:      stbu    r0,1(r6)        /* clear it out if so */
 
 134  * Use dcbz on the complete cache lines in the destination
 
 135  * to set them to zero.  This requires that the destination
 
 136  * area is cacheable.  -- paulus
 
 138 _GLOBAL(cacheable_memzero)
 
 149         clrlwi  r7,r6,32-LG_CACHELINE_BYTES
 
 151         srwi    r9,r8,LG_CACHELINE_BYTES
 
 152         addic.  r9,r9,-1        /* total number of complete cachelines */
 
 154         xori    r0,r7,CACHELINE_MASK & ~3
 
 162 #if !defined(CONFIG_8xx)
 
 169 #if CACHE_LINE_SIZE >= 32
 
 174 #endif /* CACHE_LINE_SIZE */
 
 176         addi    r6,r6,CACHELINE_BYTES
 
 178         clrlwi  r5,r8,32-LG_CACHELINE_BYTES
 
 220  * This version uses dcbz on the complete cache lines in the
 
 221  * destination area to reduce memory traffic.  This requires that
 
 222  * the destination area is cacheable.
 
 223  * We only use this version if the source and dest don't overlap.
 
 226 _GLOBAL(cacheable_memcpy)
 
 227         add     r7,r3,r5                /* test if the src & dst overlap */
 
 231         crand   0,0,4                   /* cr0.lt &= cr1.lt */
 
 232         blt     memcpy                  /* if regions overlap */
 
 237         andi.   r0,r0,CACHELINE_MASK    /* # bytes to start of cache line */
 
 240         cmplw   0,r5,r0                 /* is this more than total to do? */
 
 241         blt     63f                     /* if not much to do */
 
 242         andi.   r8,r0,3                 /* get it word-aligned first */
 
 246 70:     lbz     r9,4(r4)                /* do some bytes */
 
 254 72:     lwzu    r9,4(r4)                /* do some words */
 
 258 58:     srwi.   r0,r5,LG_CACHELINE_BYTES /* # complete cachelines */
 
 259         clrlwi  r5,r5,32-LG_CACHELINE_BYTES
 
 264 #if !defined(CONFIG_8xx)
 
 268 #if L1_CACHE_BYTES >= 32
 
 270 #if L1_CACHE_BYTES >= 64
 
 273 #if L1_CACHE_BYTES >= 128
 
 309         beq     2f                      /* if less than 8 bytes to do */
 
 310         andi.   r0,r6,3                 /* get dest word aligned */
 
 341         rlwinm. r7,r5,32-3,3,31
 
 346 _GLOBAL(backwards_memcpy)
 
 347         rlwinm. r7,r5,32-3,3,31         /* r0 = r5 >> 3 */
 
 377         rlwinm. r7,r5,32-3,3,31
 
 408 _GLOBAL(__copy_tofrom_user)
 
 412         andi.   r0,r0,CACHELINE_MASK    /* # bytes to start of cache line */
 
 415         cmplw   0,r5,r0                 /* is this more than total to do? */
 
 416         blt     63f                     /* if not much to do */
 
 417         andi.   r8,r0,3                 /* get it word-aligned first */
 
 420 70:     lbz     r9,4(r4)                /* do some bytes */
 
 429 72:     lwzu    r9,4(r4)                /* do some words */
 
 433         .section __ex_table,"a"
 
 441 58:     srwi.   r0,r5,LG_CACHELINE_BYTES /* # complete cachelines */
 
 442         clrlwi  r5,r5,32-LG_CACHELINE_BYTES
 
 447         /* Don't use prefetch on 8xx */
 
 450 53:     COPY_16_BYTES_WITHEX(0)
 
 453 #else /* not CONFIG_8xx */
 
 454         /* Here we decide how far ahead to prefetch the source */
 
 460 #if MAX_COPY_PREFETCH > 1
 
 461         /* Heuristically, for large transfers we prefetch
 
 462            MAX_COPY_PREFETCH cachelines ahead.  For small transfers
 
 463            we prefetch 1 cacheline ahead. */
 
 464         cmpwi   r0,MAX_COPY_PREFETCH
 
 466         li      r7,MAX_COPY_PREFETCH
 
 469         addi    r3,r3,CACHELINE_BYTES
 
 473         addi    r3,r3,CACHELINE_BYTES
 
 474 #endif /* MAX_COPY_PREFETCH > 1 */
 
 482         .section __ex_table,"a"
 
 486 /* the main body of the cacheline loop */
 
 487         COPY_16_BYTES_WITHEX(0)
 
 488 #if L1_CACHE_BYTES >= 32
 
 489         COPY_16_BYTES_WITHEX(1)
 
 490 #if L1_CACHE_BYTES >= 64
 
 491         COPY_16_BYTES_WITHEX(2)
 
 492         COPY_16_BYTES_WITHEX(3)
 
 493 #if L1_CACHE_BYTES >= 128
 
 494         COPY_16_BYTES_WITHEX(4)
 
 495         COPY_16_BYTES_WITHEX(5)
 
 496         COPY_16_BYTES_WITHEX(6)
 
 497         COPY_16_BYTES_WITHEX(7)
 
 506 #endif /* CONFIG_8xx */
 
 526 /* read fault, initial single-byte copy */
 
 529 /* write fault, initial single-byte copy */
 
 534 /* read fault, initial word copy */
 
 537 /* write fault, initial word copy */
 
 543  * this stuff handles faults in the cacheline loop and branches to either
 
 544  * 104f (if in read part) or 105f (if in write part), after updating r5
 
 546         COPY_16_BYTES_EXCODE(0)
 
 547 #if L1_CACHE_BYTES >= 32
 
 548         COPY_16_BYTES_EXCODE(1)
 
 549 #if L1_CACHE_BYTES >= 64
 
 550         COPY_16_BYTES_EXCODE(2)
 
 551         COPY_16_BYTES_EXCODE(3)
 
 552 #if L1_CACHE_BYTES >= 128
 
 553         COPY_16_BYTES_EXCODE(4)
 
 554         COPY_16_BYTES_EXCODE(5)
 
 555         COPY_16_BYTES_EXCODE(6)
 
 556         COPY_16_BYTES_EXCODE(7)
 
 561 /* read fault in cacheline loop */
 
 564 /* fault on dcbz (effectively a write fault) */
 
 565 /* or write fault in cacheline loop */
 
 567 92:     li      r3,LG_CACHELINE_BYTES
 
 571 /* read fault in final word loop */
 
 574 /* write fault in final word loop */
 
 579 /* read fault in final byte loop */
 
 582 /* write fault in final byte loop */
 
 587  * At this stage the number of bytes not copied is
 
 588  * r5 + (ctr << r3), and r9 is 0 for read or 1 for write.
 
 593         beq     120f                    /* shouldn't happen */
 
 596 /* for a read fault, first try to continue the copy one byte at a time */
 
 603 /* then clear out the destination: r3 bytes starting at 4(r6) */
 
 619         .section __ex_table,"a"
 
 631 _GLOBAL(__clear_user)
 
 637         /* clear a single word */
 
 640         /* clear word sized chunks */
 
 650         /* clear byte sized chunks */
 
 667         .section __ex_table,"a"
 
 674 _GLOBAL(__strncpy_from_user)
 
 683         bdnzf   2,1b            /* dec ctr, branch if ctr != 0 && !cr0.eq */
 
 691         .section __ex_table,"a"
 
 696 /* r3 = str, r4 = len (> 0), r5 = top (highest addr) */
 
 697 _GLOBAL(__strnlen_user)
 
 699         subf    r6,r7,r5        /* top+1 - str */
 
 703 0:      mtctr   r6              /* ctr = min(len, top - str) */
 
 704 1:      lbzu    r0,1(r7)        /* get next byte */
 
 706         bdnzf   2,1b            /* loop if --ctr != 0 && byte != 0 */
 
 708         subf    r3,r3,r7        /* number of bytes we have looked at */
 
 709         beqlr                   /* return if we found a 0 byte */
 
 710         cmpw    0,r3,r4         /* did we look at all len bytes? */
 
 711         blt     99f             /* if not, must have hit top */
 
 712         addi    r3,r4,1         /* return len + 1 to indicate no null found */
 
 714 99:     li      r3,0            /* bad address, return 0 */
 
 717         .section __ex_table,"a"