File: ffloat.d

package info (click to toggle)
clisp 1%3A2.49-8.1
links: PTS, VCS
area: main
in suites: wheezy
size: 45,160 kB
sloc: lisp: 79,960; ansic: 48,257; xml: 26,814; sh: 12,846; fortran: 7,286; makefile: 1,456; perl: 164
file content (903 lines) | stat: -rw-r--r-- 35,573 bytes
parent folder | download | duplicates (2)
# Grundfunktionen für Single-Floats

# Entpacken eines Single-Float:
# FF_decode(obj, zero_statement, sign=,exp=,mant=);
# zerlegt ein Single-Float obj.
# Ist obj=0.0, wird zero_statement ausgeführt.
# Sonst: signean sign = Vorzeichen (0 = +, -1 = -),
#        sintWL exp = Exponent (vorzeichenbehaftet),
#        uintL mant = Mantisse (>= 2^FF_mant_len, < 2^(FF_mant_len+1))
  #define FF_uexp(x)  (((x) >> FF_mant_len) & (bit(FF_exp_len)-1))
  #define FF_decode(obj, zero_statement, sign_assignment,exp_assignment,mant_assignment)  \
    {                                                                      \
      var ffloat _x = ffloat_value(obj);                                   \
      var uintBWL uexp = FF_uexp(_x);                                      \
      if (uexp==0) {                                                       \
        zero_statement # e=0 -> Zahl 0.0                                   \
      } else {                                                             \
        exp_assignment (sintWL)((uintWL)uexp - FF_exp_mid); # Exponent     \
        unused (sign_assignment sign_of_sint32((sint32)(_x))); # Vorzeichen \
        mant_assignment (bit(FF_mant_len) | (_x & (bit(FF_mant_len)-1)));  \
      }                                                                    \
    }

# Einpacken eines Single-Float:
# encode_FF(sign,exp,mant, result=);
# liefert ein Single-Float.
# > signean sign: Vorzeichen, 0 für +, -1 für negativ.
# > sintWL exp: Exponent
# > uintL mant: Mantisse, sollte >= 2^FF_mant_len und < 2^(FF_mant_len+1) sein.
# < object result: ein Single-Float
# Der Exponent wird auf Überlauf/Unterlauf getestet.
# can trigger GC
  #define encode_FF(sign,exp,mant, res_assignment)  \
    {                                                               \
      if ((exp) < (sintWL)(FF_exp_low-FF_exp_mid)) {                \
        if (underflow_allowed()) {                                  \
          error_underflow();                                       \
        } else {                                                    \
          res_assignment FF_0;                                       \
        }                                                           \
      } else                                                        \
      if ((exp) > (sintWL)(FF_exp_high-FF_exp_mid)) {               \
        error_overflow();                                          \
      } else                                                        \
      res_assignment allocate_ffloat                                 \
        (  ((sint32)(sign) & bit(31))                  # Vorzeichen \
         | ((uint32)((exp)+FF_exp_mid) << FF_mant_len) # Exponent   \
         | ((uint32)(mant) & (bit(FF_mant_len)-1))     # Mantisse   \
        );                                                          \
    }

#ifdef FAST_FLOAT
# Auspacken eines Floats:
  #if !defined(IMMEDIATE_FFLOAT)
    #define FF_to_float(obj)  (TheFfloat(obj)->representation.machine_float)
  #else # defined(WIDE) -> eines der beiden 32-Bit-Wörter
    #ifdef GNU
      #define FF_to_float(obj)  (((ffloatjanus) { eksplicit: ffloat_value(obj) }).machine_float)
    #else
      #define FF_to_float(obj)  (*(float*)(&((uint32*)&(obj))[BIG_ENDIAN_P+(1-2*BIG_ENDIAN_P)*(oint_data_shift/32)]))
    #endif
  #endif
# Überprüfen und Einpacken eines von den 'float'-Routinen gelieferten
# IEEE-Floats.
# Klassifikation:
#   1 <= e <= 254 : normalisierte Zahl
#   e=0, m/=0: subnormale Zahl
#   e=0, m=0: vorzeichenbehaftete 0.0
#   e=255, m=0: vorzeichenbehaftete Infinity
#   e=255, m/=0: NaN
# Angabe der möglicherweise auftretenden Sonderfälle:
#   maybe_overflow: Operation läuft über, liefert IEEE-Infinity
#   maybe_subnormal: Ergebnis sehr klein, liefert IEEE-subnormale Zahl
#   maybe_underflow: Ergebnis sehr klein und /=0, liefert IEEE-Null
#   maybe_divide_0: Ergebnis unbestimmt, liefert IEEE-Infinity
#   maybe_nan: Ergebnis unbestimmt, liefert IEEE-NaN
  #define float_to_FF(expr,result_assignment,maybe_overflow,maybe_subnormal,maybe_underflow,maybe_divide_0,maybe_nan)  \
    {                                                                    \
      var ffloatjanus _erg; _erg.machine_float = (expr);                 \
      if ((_erg.eksplicit & ((uint32)bit(FF_exp_len+FF_mant_len)-bit(FF_mant_len))) == 0) { # e=0 ? \
        if ((maybe_underflow                                             \
             || (maybe_subnormal && !((_erg.eksplicit << 1) == 0))       \
            )                                                            \
            && underflow_allowed()                                       \
           ) {                                                           \
          error_underflow(); # subnormal oder noch kleiner-> Underflow  \
        } else {                                                         \
          result_assignment FF_0; # +/- 0.0 -> 0.0                      \
        }                                                                \
      } else if ((maybe_overflow || maybe_divide_0)                     \
              && (((~_erg.eksplicit) & ((uint32)bit(FF_exp_len+FF_mant_len)-bit(FF_mant_len))) == 0) # e=255 ? \
             ) {                                                         \
        if (maybe_nan && !((_erg.eksplicit << (32-FF_mant_len)) == 0)) { \
          # NaN, also Singularität -> "Division durch 0"                 \
          divide_0();                                                    \
        } else {                                                         \
          # Infinity                                                     \
          if (!maybe_overflow || maybe_divide_0)                         \
            divide_0(); # Infinity, Division durch 0                     \
          else                                                           \
            error_overflow(); # Infinity, Overflow                      \
        }                                                                \
      } else {                                                           \
        result_assignment allocate_ffloat(_erg.eksplicit);              \
      }                                                                  \
    }
#endif

# FF_zerop(x) stellt fest, ob ein Single-Float x = 0.0 ist.
  # define FF_zerop(x)  (FF_uexp(ffloat_value(x)) == 0)
  #define FF_zerop(x)  (ffloat_value(x) == 0)

# Liefert zu einem Single-Float x : (ftruncate x), ein FF.
# FF_ftruncate_FF(x)
# x wird zur 0 hin zur nächsten ganzen Zahl gerundet.
# can trigger GC
  local maygc object FF_ftruncate_FF (object x);
# Methode:
# x = 0.0 oder e<=0 -> Ergebnis 0.0
# 1<=e<=23 -> letzte (24-e) Bits der Mantisse auf 0 setzen,
#             Exponent und Vorzeichen beibehalten
# e>=24 -> Ergebnis x
  local maygc object FF_ftruncate_FF (object x)
  {
    var ffloat x_ = ffloat_value(x);
    var uintBWL uexp = FF_uexp(x_); # e + FF_exp_mid
    if (uexp <= FF_exp_mid) { # 0.0 oder e<=0 ?
      return FF_0;
    } else {
      if (uexp > FF_exp_mid+FF_mant_len) # e > 23 ?
        return x;
      else
        return allocate_ffloat
          ( x_ & # Bitmaske: Bits 23-e..0 gelöscht, alle anderen gesetzt
            ~(bit(FF_mant_len+1+FF_exp_mid-uexp)-1)
          );
    }
  }

# Liefert zu einem Single-Float x : (futruncate x), ein FF.
# FF_futruncate_FF(x)
# x wird von der 0 weg zur nächsten ganzen Zahl gerundet.
# can trigger GC
  local maygc object FF_futruncate_FF (object x);
# Methode:
# x = 0.0 -> Ergebnis 0.0
# e<=0 -> Ergebnis 1.0 oder -1.0, je nach Vorzeichen von x.
# 1<=e<=23 -> Greife die letzten (24-e) Bits von x heraus.
#             Sind sie alle =0 -> Ergebnis x.
#             Sonst setze sie alle und erhöhe dann die letzte Stelle um 1.
#             Kein Überlauf der 23 Bit -> fertig.
#             Sonst (Ergebnis eine Zweierpotenz): Mantisse := .1000...000,
#               e:=e+1. (Test auf Überlauf wegen e<=24 überflüssig)
# e>=24 -> Ergebnis x.
  local maygc object FF_futruncate_FF (object x)
  {
    var ffloat x_ = ffloat_value(x);
    var uintBWL uexp = FF_uexp(x_); # e + FF_exp_mid
    if (uexp==0) # 0.0 ?
      return x;
    if (uexp <= FF_exp_mid) { # e<=0 ?
      # Exponent auf 1, Mantisse auf .1000...000 setzen.
      return ((x_ & bit(31))==0 ? FF_1 : FF_minus1);
    } else {
      if (uexp > FF_exp_mid+FF_mant_len) { # e > 23 ?
        return x;
      } else {
        var uint32 mask = # Bitmaske: Bits 23-e..0 gesetzt, alle anderen gelöscht
          bit(FF_mant_len+1+FF_exp_mid-uexp)-1;
        if ((x_ & mask)==0) # alle diese Bits =0 ?
          return x;
        return allocate_ffloat
          ((x_ | mask) # alle diese Bits setzen
           + 1 # letzte Stelle erhöhen, dabei evtl. Exponenten incrementieren
          );
      }
    }
  }

# Liefert zu einem Single-Float x : (fround x), ein FF.
# FF_fround_FF(x)
# x wird zur nächsten ganzen Zahl gerundet.
# can trigger GC
  local maygc object FF_fround_FF (object x);
# Methode:
# x = 0.0 oder e<0 -> Ergebnis 0.0
# 0<=e<=23 -> letzte (24-e) Bits der Mantisse wegrunden,
#             Exponent und Vorzeichen beibehalten.
# e>23 -> Ergebnis x
  local maygc object FF_fround_FF (object x)
  {
    var ffloat x_ = ffloat_value(x);
    var uintBWL uexp = FF_uexp(x_); # e + FF_exp_mid
    if (uexp < FF_exp_mid) { # x = 0.0 oder e<0 ?
      return FF_0;
    } else {
      if (uexp > FF_exp_mid+FF_mant_len) { # e > 23 ?
        return x;
      } else if (uexp > FF_exp_mid+1) { # e>1 ?
        var uint32 bitmask = # Bitmaske: Bit 23-e gesetzt, alle anderen gelöscht
          bit(FF_mant_len+FF_exp_mid-uexp);
        var uint32 mask = # Bitmaske: Bits 22-e..0 gesetzt, alle anderen gelöscht
          bitmask-1;
        if ( ((x_ & bitmask) ==0) # Bit 23-e =0 -> abrunden
             || ( ((x_ & mask) ==0) # Bit 23-e =1 und Bits 22-e..0 >0 -> aufrunden
                  # round-to-even, je nach Bit 24-e :
                  && ((x_ & (bitmask<<1)) ==0)
           )    ) {
          # abrunden
          mask |= bitmask; # Bitmaske: Bits 23-e..0 gesetzt, alle anderen gelöscht
          return allocate_ffloat( x_ & ~mask );
        } else {
          # aufrunden
          return allocate_ffloat
            ((x_ | mask) # alle diese Bits 22-e..0 setzen (Bit 23-e schon gesetzt)
             + 1 # letzte Stelle erhöhen, dabei evtl. Exponenten incrementieren
            );
        }
      } else if (uexp == FF_exp_mid+1) { # e=1 ?
        # Wie bei 1 < e <= 23, nur dass Bit 24-e stets gesetzt ist.
        if ((x_ & bit(FF_mant_len-1)) ==0) # Bit 23-e =0 -> abrunden
          # abrunden
          return allocate_ffloat( x_ & ~(bit(FF_mant_len)-1) );
        else
          # aufrunden
          return allocate_ffloat
            ((x_ | (bit(FF_mant_len)-1)) # alle diese Bits 23-e..0 setzen
             + 1 # letzte Stelle erhöhen, dabei evtl. Exponenten incrementieren
            );
      } else { # e=0 ?
        # Wie bei 1 < e <= 23, nur dass Bit 23-e stets gesetzt
        # und Bit 24-e stets gelöscht ist.
        if ((x_ & (bit(FF_mant_len)-1)) ==0)
          # abrunden von +-0.5 zu 0.0
          return FF_0;
        else
          # aufrunden
          return allocate_ffloat
            ((x_ | (bit(FF_mant_len)-1)) # alle Bits 22-e..0 setzen
             + 1 # letzte Stelle erhöhen, dabei Exponenten incrementieren
            );
      }
    }
  }

# Liefert zu einem Single-Float x : (- x), ein FF.
# FF_minus_FF(x)
# can trigger GC
  local maygc object FF_minus_FF (object x);
# Methode:
# Falls x=0.0, fertig. Sonst Vorzeichenbit umdrehen.
  local maygc object FF_minus_FF (object x)
  {
    var ffloat x_ = ffloat_value(x);
    return (FF_uexp(x_) == 0
            ? x
            : allocate_ffloat( x_ ^ bit(31) )
           );
  }

# FF_FF_comp(x,y) vergleicht zwei Single-Floats x und y.
# Ergebnis: 0 falls x=y, +1 falls x>y, -1 falls x<y.
  local signean FF_FF_comp (object x, object y);
# Methode:
# x und y haben verschiedenes Vorzeichen ->
#    x < 0 -> x < y
#    x >= 0 -> x > y
# x und y haben gleiches Vorzeichen ->
#    x >=0 -> vergleiche x und y (die rechten 24 Bits)
#    x <0 -> vergleiche y und x (die rechten 24 Bits)
  local signean FF_FF_comp (object x, object y)
  {
    var uint32 x_ = ffloat_value(x);
    var uint32 y_ = ffloat_value(y);
    if ((sint32)y_ >= 0) {
      # y>=0
      if ((sint32)x_ >= 0) {
        # y>=0, x>=0
        if (x_ < y_)
          return signean_minus; # x<y
        if (x_ > y_)
          return signean_plus; # x>y
        return signean_null;
      } else {
        # y>=0, x<0
        return signean_minus; # x<y
      }
    } else {
      if ((sint32)x_ >= 0) {
        # y<0, x>=0
        return signean_plus; # x>y
      } else {
        # y<0, x<0
        if (x_ > y_)
          return signean_minus; # |x|>|y| -> x<y
        if (x_ < y_)
          return signean_plus; # |x|<|y| -> x>y
        return signean_null;
      }
    }
  }

# Liefert zu zwei Single-Float x und y : (+ x y), ein FF.
# FF_FF_plus_FF(x,y)
# can trigger GC
  local maygc object FF_FF_plus_FF (object x, object y);
# Methode (nach [Knuth, II, Seminumerical Algorithms, Abschnitt 4.2.1., S.200]):
# x1=0.0 -> Ergebnis x2.
# x2=0.0 -> Ergebnis x1.
# Falls e1<e2, vertausche x1 und x2.
# Also e1 >= e2.
# Falls e1 - e2 >= 23 + 3, Ergebnis x1.
# Schiebe beide Mantissen um 3 Bits nach links (Vorbereitung der Rundung:
#   Bei e1-e2=0,1 ist keine Rundung nötig, bei e1-e2>1 ist der Exponent des
#   Ergebnisses =e1-1, =e1 oder =e1+1. Brauche daher 1 Schutzbit und zwei
#   Rundungsbits: 00 exakt, 01 1.Hälfte, 10 exakte Mitte, 11 2.Hälfte.)
# Schiebe die Mantisse von x2 um e0-e1 Bits nach rechts. (Dabei die Rundung
# ausführen: Bit 0 ist das logische Oder der Bits 0,-1,-2,...)
# Falls x1,x2 selbes Vorzeichen haben: Addiere dieses zur Mantisse von x1.
# Falls x1,x2 verschiedenes Vorzeichen haben: Subtrahiere dieses von der
#   Mantisse von x1. <0 -> (Es war e1=e2) Vertausche die Vorzeichen, negiere.
#                    =0 -> Ergebnis 0.0
# Exponent ist e1.
# Normalisiere, fertig.
 #ifdef FAST_FLOAT
  local maygc object FF_FF_plus_FF (object x1, object x2)
  {
    float_to_FF(FF_to_float(x1) + FF_to_float(x2), return ,
                true, true, # Overflow und subnormale Zahl abfangen
                false, # kein Underflow mit Ergebnis +/- 0.0 möglich
                       # (nach Definition der subnormalen Zahlen)
                false, false # keine Singularität, kein NaN als Ergebnis möglich
               );
  }
 #else
  local maygc object FF_FF_plus_FF (object x1, object x2)
  {
    # x1,x2 entpacken:
    var signean sign1;
    var sintWL exp1;
    var uintL mant1;
    var signean sign2;
    var sintWL exp2;
    var uintL mant2;
    FF_decode(x1, { return x2; }, sign1=,exp1=,mant1=);
    FF_decode(x2, { return x1; }, sign2=,exp2=,mant2=);
    if (exp1 < exp2) {
      swap(object,  x1   ,x2   );
      swap(signean, sign1,sign2);
      swap(sintWL,  exp1 ,exp2 );
      swap(uintL,   mant1,mant2);
    }
    # Nun ist exp1>=exp2.
    var uintL expdiff = exp1 - exp2; # Exponentendifferenz
    if (expdiff >= FF_mant_len+3) # >= 23+3 ?
      return x1;
    mant1 = mant1 << 3; mant2 = mant2 << 3;
    # Nun 2^(FF_mant_len+3) <= mant1,mant2 < 2^(FF_mant_len+4).
    {
      var uintL mant2_last = mant2 & (bit(expdiff)-1); # letzte expdiff Bits von mant2
      mant2 = mant2 >> expdiff;
      if (!(mant2_last==0))
        mant2 |= bit(0);
    }
    # mant2 = um expdiff Bits nach rechts geschobene und gerundete Mantisse
    # von x2.
    if (!(sign1==sign2)) {
      # verschiedene Vorzeichen -> Mantissen subtrahieren
      if (mant1 > mant2) {
        mant1 = mant1 - mant2;
        goto norm_2;
      }
      if (mant1 == mant2) # Ergebnis 0 ?
        return FF_0;
      # negatives Subtraktionsergebnis
      mant1 = mant2 - mant1; sign1 = sign2; goto norm_2;
    } else {
      # gleiche Vorzeichen -> Mantissen addieren
      mant1 = mant1 + mant2;
    }
    # mant1 = Ergebnis-Mantisse >0, sign1 = Ergebnis-Vorzeichen,
    # exp1 = Ergebnis-Exponent.
    # Außerdem: Bei expdiff=0,1 sind die zwei letzten Bits von mant1 Null,
    # bei expdiff>=2 ist mant1 >= 2^(FF_mant_len+2).
    # Stets ist mant1 < 2^(FF_mant_len+5). (Daher werden die 2 Rundungsbits
    # nachher um höchstens eine Position nach links geschoben werden.)
    # [Knuth, S.201, leicht modifiziert:
    #   N1. m>=1 -> goto N4.
    #   N2. [Hier m<1] m>=1/2 -> goto N5.
    #       N3. m:=2*m, e:=e-1, goto N2.
    #   N4. [Hier 1<=m<2] m:=m/2, e:=e+1.
    #   N5. [Hier 1/2<=m<1] Runde m auf 24 Bits hinterm Komma.
    #       Falls hierdurch m=1 geworden, setze m:=m/2, e:=e+1.
    # ]
    # Bei uns ist m=mant1/2^(FF_mant_len+4),
    # ab Schritt N5 ist m=mant1/2^(FF_mant_len+1).
   norm_1: # [Knuth, S.201, Schritt N1]
    if (mant1 >= bit(FF_mant_len+4))
      goto norm_4;
   norm_2: # [Knuth, S.201, Schritt N2]
           # Hier ist mant1 < 2^(FF_mant_len+4)
    if (mant1 >= bit(FF_mant_len+3))
      goto norm_5;
    # [Knuth, S.201, Schritt N3]
    mant1 = mant1 << 1; exp1 = exp1-1; # Mantisse links schieben
    goto norm_2;
   norm_4: # [Knuth, S.201, Schritt N4]
           # Hier ist 2^(FF_mant_len+4) <= mant1 < 2^(FF_mant_len+5)
    exp1 = exp1+1;
    mant1 = (mant1>>1) | (mant1 & bit(0)); # Mantisse rechts schieben
   norm_5: # [Knuth, S.201, Schritt N5]
           # Hier ist 2^(FF_mant_len+3) <= mant1 < 2^(FF_mant_len+4)
    # Auf FF_mant_len echte Mantissenbits runden, d.h. rechte 3 Bits
    # wegrunden, und dabei mant1 um 3 Bits nach rechts schieben:
    {
      var uintL rounding_bits = mant1 & (bit(3)-1);
      mant1 = mant1 >> 3;
      if ( (rounding_bits < bit(2)) # 000,001,010,011 werden abgerundet
           || ( (rounding_bits == bit(2)) # 100 (genau halbzahlig)
                && ((mant1 & bit(0)) ==0) # -> round-to-even
         )    ) {
        # abrunden
      } else {
        # aufrunden
        mant1 = mant1+1;
        if (mant1 >= bit(FF_mant_len+1)) {
          # Bei Überlauf während der Rundung nochmals rechts schieben
          # (Runden ist hier überflüssig):
          mant1 = mant1>>1; exp1 = exp1+1; # Mantisse rechts schieben
        }
      }
    }
    # Runden fertig.
    encode_FF(sign1,exp1,mant1, return);
  }
 #endif

# Liefert zu zwei Single-Float x und y : (- x y), ein FF.
# FF_FF_minus_FF(x,y)
# can trigger GC
  local maygc object FF_FF_minus_FF (object x, object y);
# Methode:
# (- x1 x2) = (+ x1 (- x2))
 #ifdef FAST_FLOAT
  local maygc object FF_FF_minus_FF (object x1, object x2)
  {
    float_to_FF(FF_to_float(x1) - FF_to_float(x2), return ,
                true, true, # Overflow und subnormale Zahl abfangen
                false, # kein Underflow mit Ergebnis +/- 0.0 möglich
                       # (nach Definition der subnormalen Zahlen)
                false, false # keine Singularität, kein NaN als Ergebnis möglich
               );
  }
 #else
  local maygc object FF_FF_minus_FF (object x1, object x2)
  {
    var ffloat x2_ = ffloat_value(x2);
    if (FF_uexp(x2_) == 0) {
      return x1;
    } else {
      pushSTACK(x1);
      x2 = allocate_ffloat(x2_ ^ bit(31));
      return FF_FF_plus_FF(popSTACK(),x2);
    }
  }
 #endif

# Liefert zu zwei Single-Float x und y : (* x y), ein FF.
# FF_FF_mult_FF(x,y)
# can trigger GC
  local maygc object FF_FF_mult_FF (object x, object y);
# Methode:
# Falls x1=0.0 oder x2=0.0 -> Ergebnis 0.0
# Sonst: Ergebnis-Vorzeichen = VZ von x1 xor VZ von x2.
#        Ergebnis-Exponent = Summe der Exponenten von x1 und x2.
#        Ergebnis-Mantisse = Produkt der Mantissen von x1 und x2, gerundet:
#          2^-24 * mant1  *  2^-24 * mant2  =  2^-48 * (mant1*mant2),
#          die Klammer ist >=2^46, <=(2^24-1)^2<2^48 .
#          Falls die Klammer >=2^47 ist, um 24 Bit nach rechts schieben und
#            runden: Falls Bit 23 Null, abrunden; falls Bit 23 Eins und
#            Bits 22..0 alle Null, round-to-even; sonst aufrunden.
#          Falls die Klammer <2^47 ist, um 23 Bit nach rechts schieben und
#            runden: Falls Bit 22 Null, abrunden; falls Bit 22 Eins und
#            Bits 21..0 alle Null, round-to-even; sonst aufrunden. Nach
#            Aufrunden: Falls =2^24, um 1 Bit nach rechts schieben. Sonst
#            Exponenten um 1 erniedrigen.
 #ifdef FAST_FLOAT
  local maygc object FF_FF_mult_FF (object x1, object x2)
  {
    float_to_FF(FF_to_float(x1) * FF_to_float(x2), return ,
                true, true, # Overflow und subnormale Zahl abfangen
                !(FF_zerop(x1) || FF_zerop(x2)), # ein Ergebnis +/- 0.0
                            # ist genau dann in Wirklichkeit ein Underflow
                false, false # keine Singularität, kein NaN als Ergebnis möglich
               );
  }
 #else
  local maygc object FF_FF_mult_FF (object x1, object x2)
  {
    # x1,x2 entpacken:
    var signean sign1;
    var sintWL exp1;
    var uintL mant1;
    var signean sign2;
    var sintWL exp2;
    var uintL mant2;
    FF_decode(x1, { return x1; }, sign1=,exp1=,mant1=);
    FF_decode(x2, { return x2; }, sign2=,exp2=,mant2=);
    exp1 = exp1 + exp2; # Summe der Exponenten
    sign1 = sign1 ^ sign2; # Ergebnis-Vorzeichen
    var uintL manthi;
    var uintL mantlo;
    # Mantissen mant1 und mant2 multiplizieren:
    mulu24(mant1,mant2, manthi=,mantlo=);
    manthi = (manthi << (32-FF_mant_len)) | (mantlo >> FF_mant_len);
    mantlo = mantlo & (bit(FF_mant_len)-1);
    # Nun ist 2^FF_mant_len * manthi + mantlo = mant1 * mant2.
    if (manthi >= bit(FF_mant_len+1)) {
      # mant1*mant2 >= 2^(2*FF_mant_len+1)
      if ( ((manthi & bit(0)) ==0) # Bit FF_mant_len =0 -> abrunden
           || ( (mantlo ==0) # Bit FF_mant_len =1 und Bits FF_mant_len-1..0 >0 -> aufrunden
                # round-to-even, je nach Bit FF_mant_len+1 :
                && ((manthi & bit(1)) ==0)
         )    ) {
        # abrunden
        manthi = manthi >> 1; goto ab;
      } else {
        # aufrunden
        manthi = manthi >> 1; goto auf;
      }
    } else {
      # mant1*mant2 < 2^(2*FF_mant_len+1)
      exp1 = exp1-1; # Exponenten decrementieren
      if ( ((mantlo & bit(FF_mant_len-1)) ==0) # Bit FF_mant_len-1 =0 -> abrunden
           || ( ((mantlo & (bit(FF_mant_len-1)-1)) ==0) # Bit FF_mant_len-1 =1 und Bits FF_mant_len-2..0 >0 -> aufrunden
                # round-to-even, je nach Bit FF_mant_len :
                && ((manthi & bit(0)) ==0)
         )    )
        # abrunden
        goto ab;
      else
        # aufrunden
        goto auf;
    }
   auf:
    manthi = manthi+1;
    # Hier ist 2^FF_mant_len <= manthi <= 2^(FF_mant_len+1)
    if (manthi >= bit(FF_mant_len+1)) { # rounding overflow?
      manthi = manthi>>1; exp1 = exp1+1; # Shift nach rechts
    }
   ab:
    # Runden fertig, 2^FF_mant_len <= manthi < 2^(FF_mant_len+1)
    encode_FF(sign1,exp1,manthi, return);
  }
 #endif

# Liefert zu zwei Single-Float x und y : (/ x y), ein FF.
# FF_FF_div_FF(x,y)
# can trigger GC
  local maygc object FF_FF_div_FF (object x, object y);
# Methode:
# x2 = 0.0 -> Error
# x1 = 0.0 -> Ergebnis 0.0
# Sonst:
# Ergebnis-Vorzeichen = xor der beiden Vorzeichen von x1 und x2
# Ergebnis-Exponent = Differenz der beiden Exponenten von x1 und x2
# Ergebnis-Mantisse = Mantisse mant1 / Mantisse mant2, gerundet.
#   mant1/mant2 > 1/2, mant1/mant2 < 2;
#   nach Rundung mant1/mant2 >=1/2, <=2*mant1<2.
#   Bei mant1/mant2 >=1 brauche 23 Nachkommabits,
#   bei mant1/mant2 <1 brauche 24 Nachkommabits.
#   Fürs Runden: brauche ein Rundungsbit (Rest gibt an, ob exakt).
#   Brauche daher insgesamt 25 Nachkommabits von mant1/mant2.
#   Dividiere daher (als Unsigned Integers) 2^25*(2^24*mant1) durch (2^24*mant2).
#   Falls der Quotient >=2^25 ist, runde die letzten zwei Bits weg und
#     erhöhe den Exponenten um 1.
#   Falls der Quotient <2^25 ist, runde das letzte Bit weg. Bei rounding
#     overflow schiebe um ein weiteres Bit nach rechts, incr. Exponenten.
#if defined(FAST_FLOAT) && !defined(FLOAT_DIV0_EXCEPTION) && !defined(I80386)
  local maygc object FF_FF_div_FF (object x1, object x2)
  {
    float_to_FF(FF_to_float(x1) / FF_to_float(x2), return ,
                true, true, # Overflow und subnormale Zahl abfangen
                !FF_zerop(x1), # ein Ergebnis +/- 0.0
                            # ist genau dann in Wirklichkeit ein Underflow
                FF_zerop(x2), # Division durch Null abfangen
                false # kein NaN als Ergebnis möglich
               );
  }
 #else
  local maygc object FF_FF_div_FF (object x1, object x2)
  {
    # x1,x2 entpacken:
    var signean sign1;
    var sintWL exp1;
    var uintL mant1;
    var signean sign2;
    var sintWL exp2;
    var uintL mant2;
    FF_decode(x2, { divide_0(); }, sign2=,exp2=,mant2=);
    FF_decode(x1, { return x1; }, sign1=,exp1=,mant1=);
    exp1 = exp1 - exp2; # Differenz der Exponenten
    sign1 = sign1 ^ sign2; # Ergebnis-Vorzeichen
    # Dividiere 2^25*mant1 durch mant2 oder (äquivalent)
    # 2^i*2^25*mant1 durch 2^i*mant2 für irgendein i mit 0 <= i <= 32-24 :
    var uintL mant;
    var uintL rest;
    # wähle i = 32-(FF_mant_len+1), also i+(FF_mant_len+2) = 33.
    divu_6432_3232(mant1<<1,0, mant2<<(32-(FF_mant_len+1)), mant=,rest=);
    if (mant >= bit(FF_mant_len+2)) {
      # Quotient >=2^25 -> 2 Bits wegrunden
      var uintL rounding_bits = mant & (bit(2)-1);
      exp1 += 1; # Exponenten incrementieren
      mant = mant >> 2;
      if ( (rounding_bits < bit(1)) # 00,01 werden abgerundet
           || ( (rounding_bits == bit(1)) # 10
                && (rest == 0) # und genau halbzahlig
                && ((mant & bit(0)) ==0) # -> round-to-even
         )    ) {
        # abrunden
      } else {
        # aufrunden
        mant += 1;
      }
    } else {
      # Quotient <2^25 -> 1 Bit wegrunden
      var uintL rounding_bit = mant & bit(0);
      mant = mant >> 1;
      if ( (rounding_bit == 0) # 0 wird abgerundet
           || ( (rest == 0) # genau halbzahlig
                && ((mant & bit(0)) ==0) # -> round-to-even
         )    ) {
        # abrunden
      } else {
        # aufrunden
        mant += 1;
        if (mant >= bit(FF_mant_len+1)) { # rounding overflow?
          mant = mant>>1; exp1 = exp1+1;
        }
      }
    }
    encode_FF(sign1,exp1,mant, return);
  }
 #endif

# Liefert zu einem Single-Float x>=0 : (sqrt x), ein FF.
# FF_sqrt_FF(x)
# can trigger GC
  local maygc object FF_sqrt_FF (object x);
# Methode:
# x = 0.0 -> Ergebnis 0.0
# Ergebnis-Vorzeichen := positiv,
# Ergebnis-Exponent := ceiling(e/2),
# Ergebnis-Mantisse:
#   Bilde aus [1,m22,...,m0,(26 Nullbits)] bei geradem e,
#         aus [0,1,m22,...,m0,(25 Nullbits)] bei ungeradem e
#   die Ganzzahl-Wurzel, eine 25-Bit-Zahl mit einer führenden 1.
#   Runde das letzte Bit weg:
#     Bit 0 = 0 -> abrunden,
#     Bit 0 = 1 und Wurzel exakt -> round-to-even,
#     Bit 0 = 1 und Rest >0 -> aufrunden.
#   Dabei um ein Bit nach rechts schieben.
#   Bei Aufrundung auf 2^24 (rounding overflow) Mantisse um 1 Bit nach rechts
#     schieben und Exponent incrementieren.
  local maygc object FF_sqrt_FF (object x)
  {
    # x entpacken:
    var sintWL exp;
    var uint32 mant;
    FF_decode(x, { return x; }, _EMA_,exp=,mant=);
    # Um die 64-Bit-Ganzzahl-Wurzel ausnutzen zu können, fügen wir beim
    # Radikanden 39 bzw. 40 statt 25 bzw. 26 Nullbits an.
    if (exp & bit(0)) {
      # e ungerade
      mant = mant << (31-(FF_mant_len+1)); exp = exp+1;
    } else {
      # e gerade
      mant = mant << (32-(FF_mant_len+1));
    }
    exp = exp >> 1; # exp := exp/2
    var bool exactp;
    isqrt_64_32(mant,0, mant=,exactp=); # mant := isqrt(mant*2^32), eine 32-Bit-Zahl
    # Die hinteren 31-FF_mant_len Bits wegrunden:
    if ( ((mant & bit(30-FF_mant_len)) ==0) # Bit 7 =0 -> abrunden
         || ( ((mant & (bit(30-FF_mant_len)-1)) ==0) # Bit 7 =1 und Bits 6..0 >0 -> aufrunden
              && exactp                   # Bit 7 =1 und Bits 6..0 =0, aber Rest -> aufrunden
              # round-to-even, je nach Bit 8 :
              && ((mant & bit(31-FF_mant_len)) ==0)
       )    ) {
      # abrunden
      mant = mant >> (31-FF_mant_len);
    } else {
      # aufrunden
      mant = mant >> (31-FF_mant_len);
      mant += 1;
      if (mant >= bit(FF_mant_len+1)) { # rounding overflow?
        mant = mant>>1; exp = exp+1;
      }
    }
    encode_FF(0,exp,mant, return);
  }

# FF_to_I(x) wandelt ein Single-Float x, das eine ganze Zahl darstellt,
# in ein Integer um.
# can trigger GC
  local maygc object FF_to_I (object x);
# Methode:
# Falls x=0.0, Ergebnis 0.
# Sonst (ASH Vorzeichen*Mantisse (e-24)).
  local maygc object FF_to_I (object x)
  {
    # x entpacken:
    var signean sign;
    var sintWL exp;
    var uint32 mant;
    FF_decode(x, { return Fixnum_0; }, sign=,exp=,mant=);
    exp = exp-(FF_mant_len+1);
    return I_I_ash_I(
      # mant >0, <2^(FF_mant_len+1) in ein Fixnum umwandeln:
      #if (FF_mant_len+1 <= oint_data_len)
        (sign==0 ? posfixnum(mant) : negfixnum(-(oint)mant))
      #else
        L_to_I(sign==0 ? mant : -mant)
      #endif
      ,L_to_FN(exp)
      );
  }

/* I_to_FF(x,signal_overflow) converts an integer x to a single-float, and
 rounds thereby.
 Methode:
 x=0 -> Ergebnis 0.0
 Merke Vorzeichen von x.
 x:=(abs x)
 Exponent:=(integer-length x)
   Greife die 25 höchstwertigen Bits heraus (angeführt von einer 1).
   Runde das letzte Bit weg:
     Bit 0 = 0 -> abrunden,
     Bit 0 = 1 und Rest =0 -> round-to-even,
     Bit 0 = 1 und Rest >0 -> aufrunden.
   Dabei um ein Bit nach rechts schieben.
   Bei Aufrundung auf 2^24 (rounding overflow) Mantisse um 1 Bit nach rechts
     schieben und Exponent incrementieren.
 can trigger GC */
local maygc object I_to_FF (object x, bool signal_overflow)
{
  if (eq(x,Fixnum_0))
    return FF_0;
  var signean sign = R_sign(x); # Vorzeichen
  if (!(sign==0))
    x = I_minus_I(x); # bei x<0: x := (- x)
  var uintL exp = I_integer_length(x); # (integer-length x)
  # NDS zu x>0 bilden:
  var uintD* MSDptr;
  var uintC len;
  I_to_NDS_nocopy(x, MSDptr=,len=,);
  # MSDptr/len/LSDptr ist die NDS zu x, len>0.
  # Führende Digits holen: Brauche FF_mant_len+1 Bits, dazu intDsize
  # Bits (die NDS kann mit bis zu intDsize Nullbits anfangen).
  # Dann werden diese Bits um (exp mod intDsize) nach rechts geschoben.
  var uintD msd = *MSDptr++; # erstes Digit
  var uint32 msdd = 0; # weitere min(len-1,32/intDsize) Digits
 #define NEXT_DIGIT(i) {                                \
    if (--len == 0) goto ok;                            \
    msdd |= (uint32)(*MSDptr++) << (32-(i+1)*intDsize); \
  }
  DOCONSTTIMES(32/intDsize,NEXT_DIGIT);
 #undef NEXT_DIGIT
  --len; ok: {
    # Die NDS besteht aus msd, msdd, und len weiteren Digits.
    # Das höchste in 2^32*msd+msdd gesetzte Bit ist Bit Nummer
    # 31 + (exp mod intDsize).
    var uintL shiftcount = exp % intDsize;
    var uint32 mant = # führende 32 Bits
      (shiftcount==0
       ? msdd
       : (((uint32)msd << (32-shiftcount)) | (msdd >> shiftcount)));
    # Das höchste in mant gesetzte Bit ist Bit Nummer 31.
    if ( ((mant & bit(30-FF_mant_len)) ==0) # Bit 7 =0 -> abrunden
         || ( ((mant & (bit(30-FF_mant_len)-1)) ==0) # Bit 7 =1 und Bits 6..0 =0
              && ((msdd & (bit(shiftcount)-1)) ==0) # und weitere Bits aus msdd =0
              && (!test_loop_up(MSDptr,len)) # und alle weiteren Digits =0
              # round-to-even, je nach Bit 8 :
              && ((mant & bit(31-FF_mant_len)) ==0))) {
      # abrunden
      mant = mant >> (31-FF_mant_len);
    } else {
      # aufrunden
      mant = mant >> (31-FF_mant_len);
      mant += 1;
      if (mant >= bit(FF_mant_len+1)) { # rounding overflow?
        mant = mant>>1; exp = exp+1;
      }
    }
    #define error_overflow() \
      if (signal_overflow) (error_overflow)(); else return nullobj;
    encode_FF(sign,(sintL)exp,mant, return);
    #undef error_overflow
  }
}

# RA_to_FF(x,signal_overflow) converts a rational number x to a single-float,
# and rounds thereby.
# can trigger GC
  local maygc object RA_to_FF (object x, bool signal_overflow);
# Methode:
# x ganz -> klar.
# x = +/- a/b mit Integers a,b>0:
#   Seien n,m so gewählt, dass
#     2^(n-1) <= a < 2^n, 2^(m-1) <= b < 2^m.
#   Dann ist 2^(n-m-1) < a/b < 2^(n-m+1).
#   Berechne n=(integer-length a) und m=(integer-length b) und
#   floor(2^(-n+m+25)*a/b) :
#   Bei n-m>=25 dividiere a durch (ash b (n-m-25)),
#   bei n-m<25 dividiere (ash a (-n+m+25)) durch b.
#   Der erste Wert ist >=2^24, <2^26.
#   Falls er >=2^25 ist, runde 2 Bits weg,
#   falls er <2^25 ist, runde 1 Bit weg.
  local maygc object RA_to_FF (object x, bool signal_overflow)
  {
    if (RA_integerp(x))
      return I_to_FF(x,signal_overflow);
    # x Ratio
    #define error_overflow() \
      if (signal_overflow) (error_overflow)(); else return nullobj;
    pushSTACK(TheRatio(x)->rt_den); # b
    var signean sign = RT_sign(x); # Vorzeichen
    x = TheRatio(x)->rt_num; # +/- a
    if (!(sign==0))
      x = I_minus_I(x); # Betrag nehmen, liefert a
    pushSTACK(x);
    # Stackaufbau: b, a.
    var sintL lendiff = I_integer_length(x) # (integer-length a)
                        - I_integer_length(STACK_1); # (integer-length b)
    if (lendiff > FF_exp_high-FF_exp_mid) { # Exponent >= n-m > Obergrenze ?
      skipSTACK(2); error_overflow();       /* -> Overflow */
    }
    if (lendiff < FF_exp_low-FF_exp_mid-2) { # Exponent <= n-m+2 < Untergrenze ?
      if (underflow_allowed()) {
        error_underflow(); # -> Underflow
      } else {
        skipSTACK(2); return FF_0;
      }
    }
    var object zaehler;
    var object nenner;
    if (lendiff >= FF_mant_len+2) {
      # n-m-25>=0
      nenner = I_I_ash_I(STACK_1,fixnum((uint32)(lendiff - (FF_mant_len+2)))); # (ash b n-m-25)
      zaehler = popSTACK(); # a
      skipSTACK(1);
    } else {
      zaehler = I_I_ash_I(popSTACK(),fixnum((uint32)((FF_mant_len+2) - lendiff))); # (ash a -n+m+25)
      nenner = popSTACK(); # b
    }
    # Division zaehler/nenner durchführen:
    I_I_divide_I_I(zaehler,nenner);
    # Stackaufbau: q, r.
    # 2^24 <= q < 2^26, also ist q Fixnum oder Bignum mit bn_minlength Digits.
    var uint32 mant = ((FF_mant_len+3 <= oint_data_len)
                       ? (uint32)posfixnum_to_V(STACK_1)
                       : I_to_UL(STACK_1)
                      );
    if (mant >= bit(FF_mant_len+2)) {
      # 2^25 <= q < 2^26, schiebe um 2 Bits nach rechts
      var uintL rounding_bits = mant & (bit(2)-1);
      lendiff = lendiff+1; # Exponent := n-m+1
      mant = mant >> 2;
      if ( (rounding_bits < bit(1)) # 00,01 werden abgerundet
           || ( (rounding_bits == bit(1)) # 10
                && (eq(STACK_0,Fixnum_0)) # und genau halbzahlig (r=0)
                && ((mant & bit(0)) ==0) # -> round-to-even
         )    )
        # abrunden
        goto ab;
      else
        # aufrunden
        goto auf;
    } else {
      var uintL rounding_bit = mant & bit(0);
      mant = mant >> 1;
      if ( (rounding_bit == 0) # 0 wird abgerundet
           || ( (eq(STACK_0,Fixnum_0)) # genau halbzahlig (r=0)
                && ((mant & bit(0)) ==0) # -> round-to-even
         )    )
        # abrunden
        goto ab;
      else
        # aufrunden
        goto auf;
    }
   auf:
    mant += 1;
    if (mant >= bit(FF_mant_len+1)) { # rounding overflow?
      mant = mant>>1; lendiff = lendiff+1;
    }
   ab:
    skipSTACK(2);
    # Fertig.
    encode_FF(sign,lendiff,mant, return);
    #undef error_overflow
  }