2  *  linux/arch/arm/lib/div64.S
 
   4  *  Optimized computation of 64-bit dividend / 32-bit divisor
 
   6  *  Author:     Nicolas Pitre
 
   8  *  Copyright:  Monta Vista Software, Inc.
 
  10  *  This program is free software; you can redistribute it and/or modify
 
  11  *  it under the terms of the GNU General Public License version 2 as
 
  12  *  published by the Free Software Foundation.
 
  15 #include <linux/linkage.h>
 
  30  * __do_div64: perform a division with 64-bit dividend and 32-bit divisor.
 
  32  * Note: Calling convention is totally non standard for optimal code.
 
  33  *       This is meant to be used by do_div() from include/asm/div64.h only.
 
  36  *      xh-xl   = dividend (clobbered)
 
  37  *      r4      = divisor (preserved)
 
  43  * Clobbered regs: xl, ip
 
  48         @ Test for easy paths first.
 
  50         bls     9f                      @ divisor is 0 or 1
 
  52         beq     8f                      @ divisor is power of 2
 
  54         @ See if we need to handle upper 32-bit result.
 
  59         @ Align divisor with upper part of dividend.
 
  60         @ The aligned divisor is stored in yl preserving the original.
 
  61         @ The bit position is stored in ip.
 
  63 #if __LINUX_ARM_ARCH__ >= 5
 
  76 1:      cmp     yl, #0x80000000
 
  84         @ The division loop for needed upper bit positions.
 
  85         @ Break out early if dividend reaches 0.
 
  93         @ See if we need to handle lower 32-bit result.
 
 100         @ The division loop for lower bit positions.
 
 101         @ Here we shift remainer bits leftwards rather than moving the
 
 102         @ divisor for comparisons, considering the carry-out bit as well.
 
 104 4:      movs    xl, xl, lsl #1
 
 114         @ The top part of remainder became zero.  If carry is set
 
 115         @ (the 33th bit) this is a false positive so resume the loop.
 
 116         @ Otherwise, if lower part is also null then we are done.
 
 121         @ We still have remainer bits in the low part.  Bring them up.
 
 123 #if __LINUX_ARM_ARCH__ >= 5
 
 125         clz     xh, xl                  @ we know xh is zero here so...
 
 132 7:      movs    xl, xl, lsl #1
 
 138         @ Current remainder is now 1.  It is worthless to compare with
 
 139         @ divisor at this point since divisor can not be smaller than 3 here.
 
 140         @ If possible, branch for another shift in the division loop.
 
 141         @ If no bit position left then we are done.
 
 147 8:      @ Division by a power of 2: determine what that divisor order is
 
 148         @ then simply shift values around
 
 150 #if __LINUX_ARM_ARCH__ >= 5
 
 160         movhs   yl, yl, lsr #16
 
 173         addls   ip, ip, yl, lsr #1
 
 180         orr     yl, yl, xh, lsl ip
 
 185         @ eq -> division by 1: obvious enough...
 
 195         @ as wrong as it could be...