File: TODO

package info (click to toggle)
fflas-ffpack 1.6.0-1
  • links: PTS, VCS
  • area: main
  • in suites: jessie, jessie-kfreebsd
  • size: 3,128 kB
  • ctags: 1,369
  • sloc: sh: 10,959; cpp: 7,935; makefile: 263; perl: 11; csh: 5
file content (36 lines) | stat: -rw-r--r-- 1,313 bytes parent folder | download
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
Repenser la structure de fgemm:
  * plus de template, moins de tests
  * templater DoubleDomain/FLoatDomain?
  * plus rapide avec des petites matrices
  * Meilleure strategie de calcul des parametres
  * Automatic tuning des thresholds Float/Double

LUdivine
  * Automatic tuning des thresholds gauss/LUdivine
  * Plus de localite?

TRSM/TRMM
  * Traitement automatique float/double depuis int
  * Securiser les bornes t_update: quand winograd intervient
  * remplacer BLAS-trsm par le code de reference de ATLAS

FTRTRI/FTRTRM
  * generation automatique du code
  * traitement des cas de base (seuil > 1)
 
Idee: 
1/ Pourquoi templater FFLAS?
  --> integration au sein de ATLAS (C et corps definitif)
2/ ameliorer les cas terminaux de ftrsm ftrmm: copier les ATL_reftrsm sur double et float
  --> introduire un nouveau seuil dans trsm: celui ou on fait des boucles et pas de la recursivite
2/ Conversion des le debut vers modular double/float (evite les conv multiples)
3/ Implantations non template de fgemm, trsm, .... sur double
4/ Compilation des noyaux

A discuter en fonction du besoin d'un FFLAS generique


Verifier la validite avec modular<int> (sage r�vele des det faux)

Revoir la structure des bornes dans winograd: trop de reductions
   modulaires quand il y a des etapes de wino dans le corps fini.