Numéro |
J. Phys. III France
Volume 3, Numéro 3, March 1993
|
|
---|---|---|
Page(s) | 519 - 529 | |
DOI | https://doi.org/10.1051/jp3:1993145 |
J. Phys. III France 3 (1993) 519-529
Amélioration des performances d'une implantation parallélovectorielle du gradient conjugué par extension du schéma de stockage matriciel
H. Magnin1 and J. L. Coulomb21 Framasoft + CSI, 10 rue J. Récamier, B.P. 3083, 69398 Lyon Cedex 03, France
2 Laboratoire d'Electrotechnique de Grenoble (URA 355 CNRS), ENSIEG Domaine Universitaire, B.P. 46, 38402 St Martin d'Hères Cedex, France
(Reçu le 17 mars 1992, accepté le 18 septembre 1992)
Abstract
Electromagnetic field computation with the Finite Element (FE) method implies solving
of large linear systems of equations. Performances and memory capacities of today
computers allow to achieve three-dimensional FE discretizations of electromagnetic
problems, but the number of unknowns grows high. So, to improve time to the numerical
solution of the linear system(s) thus arising, the use of parallel and/or vector
computers has to be envisaged. In this paper, the main constitutive steps of the
Pre-conditioned Conjugate Gradient algorithm (PCG) are analysed. After a short
recall of our previous work concerning their improvement by use of vector and parallel
computations, we show some speedup limitations due to the sparse row-wise matrix
storage scheme employed. Then, an extension of this matrix representation is proposed,
leading to introduce redundant storage of non-zero coefficients. In spite of
the "memory waste" thus implied, it is shown how this extension can be successfully
employed to increase the speedup due to parallelism and vectorization on the
whole algorithm, and in particular to derive a parallel preconditioner.
Résumé
La résolution par la méthode des éléments finis des équations de l'électromagnétisme
conduit à résoudre de grands systèmes d'équations linéaires. Les capacités mémoire
et les performances actuelles des systèmes informatiques permettent de traiter les
problèmes électromagnétiques par discrétisation tridimensionnelle, mais alors le nombre
d'inconnues devient très élevé. Ainsi, la résolution en un temps raisonnable des
équations linéaires associées à de telles discrétisations conduit à envisager l'emploi
d'ordinateurs à architecture parallèle. Dans cet article, les différentes étapes
constitutives de l'algorithme du gradient conjugué préconditionné (GCP) sont analysées.
Après un court rappel de nos travaux antérieurs concemant leur amélioration par
utilisation de traitements parallèles et vectoriels, nous montrons les limitations
du gain de temps dues au mode de stockage matriciel utilisé : la représentation
creuse dite "Morse". Nous proposons alors une extension de ce mode de stockage,
conduisant à l'introduction de redondance au niveau du rangement des termes
matriciels en mémoire. Malgré le "gaspillage" mémoire ainsi occasionné, il apparait
que cette extension peut être mise à profit pour augmenter sensiblement les gains par
parallélisation et vectorisation de l'ensemble de l'algorithme du gradient conjugué,
et notamment pour la réalisation d'un pré-conditionnement parallèle.
© Les Editions de Physique 1993