Merge branch 'upstream-jgarzik' of git://git.kernel.org/pub/scm/linux/kernel/git...
[linux-2.6] / arch / m68k / math-emu / fp_arith.c
1 /*
2
3    fp_arith.c: floating-point math routines for the Linux-m68k
4    floating point emulator.
5
6    Copyright (c) 1998-1999 David Huggins-Daines.
7
8    Somewhat based on the AlphaLinux floating point emulator, by David
9    Mosberger-Tang.
10
11    You may copy, modify, and redistribute this file under the terms of
12    the GNU General Public License, version 2, or any later version, at
13    your convenience.
14  */
15
16 #include "fp_emu.h"
17 #include "multi_arith.h"
18 #include "fp_arith.h"
19
20 const struct fp_ext fp_QNaN =
21 {
22         .exp = 0x7fff,
23         .mant = { .m64 = ~0 }
24 };
25
26 const struct fp_ext fp_Inf =
27 {
28         .exp = 0x7fff,
29 };
30
31 /* let's start with the easy ones */
32
33 struct fp_ext *
34 fp_fabs(struct fp_ext *dest, struct fp_ext *src)
35 {
36         dprint(PINSTR, "fabs\n");
37
38         fp_monadic_check(dest, src);
39
40         dest->sign = 0;
41
42         return dest;
43 }
44
45 struct fp_ext *
46 fp_fneg(struct fp_ext *dest, struct fp_ext *src)
47 {
48         dprint(PINSTR, "fneg\n");
49
50         fp_monadic_check(dest, src);
51
52         dest->sign = !dest->sign;
53
54         return dest;
55 }
56
57 /* Now, the slightly harder ones */
58
59 /* fp_fadd: Implements the kernel of the FADD, FSADD, FDADD, FSUB,
60    FDSUB, and FCMP instructions. */
61
62 struct fp_ext *
63 fp_fadd(struct fp_ext *dest, struct fp_ext *src)
64 {
65         int diff;
66
67         dprint(PINSTR, "fadd\n");
68
69         fp_dyadic_check(dest, src);
70
71         if (IS_INF(dest)) {
72                 /* infinity - infinity == NaN */
73                 if (IS_INF(src) && (src->sign != dest->sign))
74                         fp_set_nan(dest);
75                 return dest;
76         }
77         if (IS_INF(src)) {
78                 fp_copy_ext(dest, src);
79                 return dest;
80         }
81
82         if (IS_ZERO(dest)) {
83                 if (IS_ZERO(src)) {
84                         if (src->sign != dest->sign) {
85                                 if (FPDATA->rnd == FPCR_ROUND_RM)
86                                         dest->sign = 1;
87                                 else
88                                         dest->sign = 0;
89                         }
90                 } else
91                         fp_copy_ext(dest, src);
92                 return dest;
93         }
94
95         dest->lowmant = src->lowmant = 0;
96
97         if ((diff = dest->exp - src->exp) > 0)
98                 fp_denormalize(src, diff);
99         else if ((diff = -diff) > 0)
100                 fp_denormalize(dest, diff);
101
102         if (dest->sign == src->sign) {
103                 if (fp_addmant(dest, src))
104                         if (!fp_addcarry(dest))
105                                 return dest;
106         } else {
107                 if (dest->mant.m64 < src->mant.m64) {
108                         fp_submant(dest, src, dest);
109                         dest->sign = !dest->sign;
110                 } else
111                         fp_submant(dest, dest, src);
112         }
113
114         return dest;
115 }
116
117 /* fp_fsub: Implements the kernel of the FSUB, FSSUB, and FDSUB
118    instructions.
119
120    Remember that the arguments are in assembler-syntax order! */
121
122 struct fp_ext *
123 fp_fsub(struct fp_ext *dest, struct fp_ext *src)
124 {
125         dprint(PINSTR, "fsub ");
126
127         src->sign = !src->sign;
128         return fp_fadd(dest, src);
129 }
130
131
132 struct fp_ext *
133 fp_fcmp(struct fp_ext *dest, struct fp_ext *src)
134 {
135         dprint(PINSTR, "fcmp ");
136
137         FPDATA->temp[1] = *dest;
138         src->sign = !src->sign;
139         return fp_fadd(&FPDATA->temp[1], src);
140 }
141
142 struct fp_ext *
143 fp_ftst(struct fp_ext *dest, struct fp_ext *src)
144 {
145         dprint(PINSTR, "ftst\n");
146
147         (void)dest;
148
149         return src;
150 }
151
152 struct fp_ext *
153 fp_fmul(struct fp_ext *dest, struct fp_ext *src)
154 {
155         union fp_mant128 temp;
156         int exp;
157
158         dprint(PINSTR, "fmul\n");
159
160         fp_dyadic_check(dest, src);
161
162         /* calculate the correct sign now, as it's necessary for infinities */
163         dest->sign = src->sign ^ dest->sign;
164
165         /* Handle infinities */
166         if (IS_INF(dest)) {
167                 if (IS_ZERO(src))
168                         fp_set_nan(dest);
169                 return dest;
170         }
171         if (IS_INF(src)) {
172                 if (IS_ZERO(dest))
173                         fp_set_nan(dest);
174                 else
175                         fp_copy_ext(dest, src);
176                 return dest;
177         }
178
179         /* Of course, as we all know, zero * anything = zero.  You may
180            not have known that it might be a positive or negative
181            zero... */
182         if (IS_ZERO(dest) || IS_ZERO(src)) {
183                 dest->exp = 0;
184                 dest->mant.m64 = 0;
185                 dest->lowmant = 0;
186
187                 return dest;
188         }
189
190         exp = dest->exp + src->exp - 0x3ffe;
191
192         /* shift up the mantissa for denormalized numbers,
193            so that the highest bit is set, this makes the
194            shift of the result below easier */
195         if ((long)dest->mant.m32[0] >= 0)
196                 exp -= fp_overnormalize(dest);
197         if ((long)src->mant.m32[0] >= 0)
198                 exp -= fp_overnormalize(src);
199
200         /* now, do a 64-bit multiply with expansion */
201         fp_multiplymant(&temp, dest, src);
202
203         /* normalize it back to 64 bits and stuff it back into the
204            destination struct */
205         if ((long)temp.m32[0] > 0) {
206                 exp--;
207                 fp_putmant128(dest, &temp, 1);
208         } else
209                 fp_putmant128(dest, &temp, 0);
210
211         if (exp >= 0x7fff) {
212                 fp_set_ovrflw(dest);
213                 return dest;
214         }
215         dest->exp = exp;
216         if (exp < 0) {
217                 fp_set_sr(FPSR_EXC_UNFL);
218                 fp_denormalize(dest, -exp);
219         }
220
221         return dest;
222 }
223
224 /* fp_fdiv: Implements the "kernel" of the FDIV, FSDIV, FDDIV and
225    FSGLDIV instructions.
226
227    Note that the order of the operands is counter-intuitive: instead
228    of src / dest, the result is actually dest / src. */
229
230 struct fp_ext *
231 fp_fdiv(struct fp_ext *dest, struct fp_ext *src)
232 {
233         union fp_mant128 temp;
234         int exp;
235
236         dprint(PINSTR, "fdiv\n");
237
238         fp_dyadic_check(dest, src);
239
240         /* calculate the correct sign now, as it's necessary for infinities */
241         dest->sign = src->sign ^ dest->sign;
242
243         /* Handle infinities */
244         if (IS_INF(dest)) {
245                 /* infinity / infinity = NaN (quiet, as always) */
246                 if (IS_INF(src))
247                         fp_set_nan(dest);
248                 /* infinity / anything else = infinity (with approprate sign) */
249                 return dest;
250         }
251         if (IS_INF(src)) {
252                 /* anything / infinity = zero (with appropriate sign) */
253                 dest->exp = 0;
254                 dest->mant.m64 = 0;
255                 dest->lowmant = 0;
256
257                 return dest;
258         }
259
260         /* zeroes */
261         if (IS_ZERO(dest)) {
262                 /* zero / zero = NaN */
263                 if (IS_ZERO(src))
264                         fp_set_nan(dest);
265                 /* zero / anything else = zero */
266                 return dest;
267         }
268         if (IS_ZERO(src)) {
269                 /* anything / zero = infinity (with appropriate sign) */
270                 fp_set_sr(FPSR_EXC_DZ);
271                 dest->exp = 0x7fff;
272                 dest->mant.m64 = 0;
273
274                 return dest;
275         }
276
277         exp = dest->exp - src->exp + 0x3fff;
278
279         /* shift up the mantissa for denormalized numbers,
280            so that the highest bit is set, this makes lots
281            of things below easier */
282         if ((long)dest->mant.m32[0] >= 0)
283                 exp -= fp_overnormalize(dest);
284         if ((long)src->mant.m32[0] >= 0)
285                 exp -= fp_overnormalize(src);
286
287         /* now, do the 64-bit divide */
288         fp_dividemant(&temp, dest, src);
289
290         /* normalize it back to 64 bits and stuff it back into the
291            destination struct */
292         if (!temp.m32[0]) {
293                 exp--;
294                 fp_putmant128(dest, &temp, 32);
295         } else
296                 fp_putmant128(dest, &temp, 31);
297
298         if (exp >= 0x7fff) {
299                 fp_set_ovrflw(dest);
300                 return dest;
301         }
302         dest->exp = exp;
303         if (exp < 0) {
304                 fp_set_sr(FPSR_EXC_UNFL);
305                 fp_denormalize(dest, -exp);
306         }
307
308         return dest;
309 }
310
311 struct fp_ext *
312 fp_fsglmul(struct fp_ext *dest, struct fp_ext *src)
313 {
314         int exp;
315
316         dprint(PINSTR, "fsglmul\n");
317
318         fp_dyadic_check(dest, src);
319
320         /* calculate the correct sign now, as it's necessary for infinities */
321         dest->sign = src->sign ^ dest->sign;
322
323         /* Handle infinities */
324         if (IS_INF(dest)) {
325                 if (IS_ZERO(src))
326                         fp_set_nan(dest);
327                 return dest;
328         }
329         if (IS_INF(src)) {
330                 if (IS_ZERO(dest))
331                         fp_set_nan(dest);
332                 else
333                         fp_copy_ext(dest, src);
334                 return dest;
335         }
336
337         /* Of course, as we all know, zero * anything = zero.  You may
338            not have known that it might be a positive or negative
339            zero... */
340         if (IS_ZERO(dest) || IS_ZERO(src)) {
341                 dest->exp = 0;
342                 dest->mant.m64 = 0;
343                 dest->lowmant = 0;
344
345                 return dest;
346         }
347
348         exp = dest->exp + src->exp - 0x3ffe;
349
350         /* do a 32-bit multiply */
351         fp_mul64(dest->mant.m32[0], dest->mant.m32[1],
352                  dest->mant.m32[0] & 0xffffff00,
353                  src->mant.m32[0] & 0xffffff00);
354
355         if (exp >= 0x7fff) {
356                 fp_set_ovrflw(dest);
357                 return dest;
358         }
359         dest->exp = exp;
360         if (exp < 0) {
361                 fp_set_sr(FPSR_EXC_UNFL);
362                 fp_denormalize(dest, -exp);
363         }
364
365         return dest;
366 }
367
368 struct fp_ext *
369 fp_fsgldiv(struct fp_ext *dest, struct fp_ext *src)
370 {
371         int exp;
372         unsigned long quot, rem;
373
374         dprint(PINSTR, "fsgldiv\n");
375
376         fp_dyadic_check(dest, src);
377
378         /* calculate the correct sign now, as it's necessary for infinities */
379         dest->sign = src->sign ^ dest->sign;
380
381         /* Handle infinities */
382         if (IS_INF(dest)) {
383                 /* infinity / infinity = NaN (quiet, as always) */
384                 if (IS_INF(src))
385                         fp_set_nan(dest);
386                 /* infinity / anything else = infinity (with approprate sign) */
387                 return dest;
388         }
389         if (IS_INF(src)) {
390                 /* anything / infinity = zero (with appropriate sign) */
391                 dest->exp = 0;
392                 dest->mant.m64 = 0;
393                 dest->lowmant = 0;
394
395                 return dest;
396         }
397
398         /* zeroes */
399         if (IS_ZERO(dest)) {
400                 /* zero / zero = NaN */
401                 if (IS_ZERO(src))
402                         fp_set_nan(dest);
403                 /* zero / anything else = zero */
404                 return dest;
405         }
406         if (IS_ZERO(src)) {
407                 /* anything / zero = infinity (with appropriate sign) */
408                 fp_set_sr(FPSR_EXC_DZ);
409                 dest->exp = 0x7fff;
410                 dest->mant.m64 = 0;
411
412                 return dest;
413         }
414
415         exp = dest->exp - src->exp + 0x3fff;
416
417         dest->mant.m32[0] &= 0xffffff00;
418         src->mant.m32[0] &= 0xffffff00;
419
420         /* do the 32-bit divide */
421         if (dest->mant.m32[0] >= src->mant.m32[0]) {
422                 fp_sub64(dest->mant, src->mant);
423                 fp_div64(quot, rem, dest->mant.m32[0], 0, src->mant.m32[0]);
424                 dest->mant.m32[0] = 0x80000000 | (quot >> 1);
425                 dest->mant.m32[1] = (quot & 1) | rem;   /* only for rounding */
426         } else {
427                 fp_div64(quot, rem, dest->mant.m32[0], 0, src->mant.m32[0]);
428                 dest->mant.m32[0] = quot;
429                 dest->mant.m32[1] = rem;                /* only for rounding */
430                 exp--;
431         }
432
433         if (exp >= 0x7fff) {
434                 fp_set_ovrflw(dest);
435                 return dest;
436         }
437         dest->exp = exp;
438         if (exp < 0) {
439                 fp_set_sr(FPSR_EXC_UNFL);
440                 fp_denormalize(dest, -exp);
441         }
442
443         return dest;
444 }
445
446 /* fp_roundint: Internal rounding function for use by several of these
447    emulated instructions.
448
449    This one rounds off the fractional part using the rounding mode
450    specified. */
451
452 static void fp_roundint(struct fp_ext *dest, int mode)
453 {
454         union fp_mant64 oldmant;
455         unsigned long mask;
456
457         if (!fp_normalize_ext(dest))
458                 return;
459
460         /* infinities and zeroes */
461         if (IS_INF(dest) || IS_ZERO(dest))
462                 return;
463
464         /* first truncate the lower bits */
465         oldmant = dest->mant;
466         switch (dest->exp) {
467         case 0 ... 0x3ffe:
468                 dest->mant.m64 = 0;
469                 break;
470         case 0x3fff ... 0x401e:
471                 dest->mant.m32[0] &= 0xffffffffU << (0x401e - dest->exp);
472                 dest->mant.m32[1] = 0;
473                 if (oldmant.m64 == dest->mant.m64)
474                         return;
475                 break;
476         case 0x401f ... 0x403e:
477                 dest->mant.m32[1] &= 0xffffffffU << (0x403e - dest->exp);
478                 if (oldmant.m32[1] == dest->mant.m32[1])
479                         return;
480                 break;
481         default:
482                 return;
483         }
484         fp_set_sr(FPSR_EXC_INEX2);
485
486         /* We might want to normalize upwards here... however, since
487            we know that this is only called on the output of fp_fdiv,
488            or with the input to fp_fint or fp_fintrz, and the inputs
489            to all these functions are either normal or denormalized
490            (no subnormals allowed!), there's really no need.
491
492            In the case of fp_fdiv, observe that 0x80000000 / 0xffff =
493            0xffff8000, and the same holds for 128-bit / 64-bit. (i.e. the
494            smallest possible normal dividend and the largest possible normal
495            divisor will still produce a normal quotient, therefore, (normal
496            << 64) / normal is normal in all cases) */
497
498         switch (mode) {
499         case FPCR_ROUND_RN:
500                 switch (dest->exp) {
501                 case 0 ... 0x3ffd:
502                         return;
503                 case 0x3ffe:
504                         /* As noted above, the input is always normal, so the
505                            guard bit (bit 63) is always set.  therefore, the
506                            only case in which we will NOT round to 1.0 is when
507                            the input is exactly 0.5. */
508                         if (oldmant.m64 == (1ULL << 63))
509                                 return;
510                         break;
511                 case 0x3fff ... 0x401d:
512                         mask = 1 << (0x401d - dest->exp);
513                         if (!(oldmant.m32[0] & mask))
514                                 return;
515                         if (oldmant.m32[0] & (mask << 1))
516                                 break;
517                         if (!(oldmant.m32[0] << (dest->exp - 0x3ffd)) &&
518                                         !oldmant.m32[1])
519                                 return;
520                         break;
521                 case 0x401e:
522                         if (!(oldmant.m32[1] >= 0))
523                                 return;
524                         if (oldmant.m32[0] & 1)
525                                 break;
526                         if (!(oldmant.m32[1] << 1))
527                                 return;
528                         break;
529                 case 0x401f ... 0x403d:
530                         mask = 1 << (0x403d - dest->exp);
531                         if (!(oldmant.m32[1] & mask))
532                                 return;
533                         if (oldmant.m32[1] & (mask << 1))
534                                 break;
535                         if (!(oldmant.m32[1] << (dest->exp - 0x401d)))
536                                 return;
537                         break;
538                 default:
539                         return;
540                 }
541                 break;
542         case FPCR_ROUND_RZ:
543                 return;
544         default:
545                 if (dest->sign ^ (mode - FPCR_ROUND_RM))
546                         break;
547                 return;
548         }
549
550         switch (dest->exp) {
551         case 0 ... 0x3ffe:
552                 dest->exp = 0x3fff;
553                 dest->mant.m64 = 1ULL << 63;
554                 break;
555         case 0x3fff ... 0x401e:
556                 mask = 1 << (0x401e - dest->exp);
557                 if (dest->mant.m32[0] += mask)
558                         break;
559                 dest->mant.m32[0] = 0x80000000;
560                 dest->exp++;
561                 break;
562         case 0x401f ... 0x403e:
563                 mask = 1 << (0x403e - dest->exp);
564                 if (dest->mant.m32[1] += mask)
565                         break;
566                 if (dest->mant.m32[0] += 1)
567                         break;
568                 dest->mant.m32[0] = 0x80000000;
569                 dest->exp++;
570                 break;
571         }
572 }
573
574 /* modrem_kernel: Implementation of the FREM and FMOD instructions
575    (which are exactly the same, except for the rounding used on the
576    intermediate value) */
577
578 static struct fp_ext *
579 modrem_kernel(struct fp_ext *dest, struct fp_ext *src, int mode)
580 {
581         struct fp_ext tmp;
582
583         fp_dyadic_check(dest, src);
584
585         /* Infinities and zeros */
586         if (IS_INF(dest) || IS_ZERO(src)) {
587                 fp_set_nan(dest);
588                 return dest;
589         }
590         if (IS_ZERO(dest) || IS_INF(src))
591                 return dest;
592
593         /* FIXME: there is almost certainly a smarter way to do this */
594         fp_copy_ext(&tmp, dest);
595         fp_fdiv(&tmp, src);             /* NOTE: src might be modified */
596         fp_roundint(&tmp, mode);
597         fp_fmul(&tmp, src);
598         fp_fsub(dest, &tmp);
599
600         /* set the quotient byte */
601         fp_set_quotient((dest->mant.m64 & 0x7f) | (dest->sign << 7));
602         return dest;
603 }
604
605 /* fp_fmod: Implements the kernel of the FMOD instruction.
606
607    Again, the argument order is backwards.  The result, as defined in
608    the Motorola manuals, is:
609
610    fmod(src,dest) = (dest - (src * floor(dest / src))) */
611
612 struct fp_ext *
613 fp_fmod(struct fp_ext *dest, struct fp_ext *src)
614 {
615         dprint(PINSTR, "fmod\n");
616         return modrem_kernel(dest, src, FPCR_ROUND_RZ);
617 }
618
619 /* fp_frem: Implements the kernel of the FREM instruction.
620
621    frem(src,dest) = (dest - (src * round(dest / src)))
622  */
623
624 struct fp_ext *
625 fp_frem(struct fp_ext *dest, struct fp_ext *src)
626 {
627         dprint(PINSTR, "frem\n");
628         return modrem_kernel(dest, src, FPCR_ROUND_RN);
629 }
630
631 struct fp_ext *
632 fp_fint(struct fp_ext *dest, struct fp_ext *src)
633 {
634         dprint(PINSTR, "fint\n");
635
636         fp_copy_ext(dest, src);
637
638         fp_roundint(dest, FPDATA->rnd);
639
640         return dest;
641 }
642
643 struct fp_ext *
644 fp_fintrz(struct fp_ext *dest, struct fp_ext *src)
645 {
646         dprint(PINSTR, "fintrz\n");
647
648         fp_copy_ext(dest, src);
649
650         fp_roundint(dest, FPCR_ROUND_RZ);
651
652         return dest;
653 }
654
655 struct fp_ext *
656 fp_fscale(struct fp_ext *dest, struct fp_ext *src)
657 {
658         int scale, oldround;
659
660         dprint(PINSTR, "fscale\n");
661
662         fp_dyadic_check(dest, src);
663
664         /* Infinities */
665         if (IS_INF(src)) {
666                 fp_set_nan(dest);
667                 return dest;
668         }
669         if (IS_INF(dest))
670                 return dest;
671
672         /* zeroes */
673         if (IS_ZERO(src) || IS_ZERO(dest))
674                 return dest;
675
676         /* Source exponent out of range */
677         if (src->exp >= 0x400c) {
678                 fp_set_ovrflw(dest);
679                 return dest;
680         }
681
682         /* src must be rounded with round to zero. */
683         oldround = FPDATA->rnd;
684         FPDATA->rnd = FPCR_ROUND_RZ;
685         scale = fp_conv_ext2long(src);
686         FPDATA->rnd = oldround;
687
688         /* new exponent */
689         scale += dest->exp;
690
691         if (scale >= 0x7fff) {
692                 fp_set_ovrflw(dest);
693         } else if (scale <= 0) {
694                 fp_set_sr(FPSR_EXC_UNFL);
695                 fp_denormalize(dest, -scale);
696         } else
697                 dest->exp = scale;
698
699         return dest;
700 }
701