Suivez-nous

Prospective

Le calcul partagé

RXL

Publié le

 

Par

image 500 x 100

Aujourd’hui, je vais vous présenter une application orginale. Et d’ailleurs, pas une application, mais plusieurs, toutes fonctionnant selon le même principe : celui du calcul partagé. Vous avez très certainement déjà entendu parler de Seti@Home, cet économiseur d’écran qui vous permettra peut-être ! de débusquer un martien égaré… Peut-être également avez-vous testé le programme Dnetc, appelé encore Distributed, ou RC5-64, puisque ce petit soft cherche à “cracker” (casser) l’algorithme RC5-64 (bits) des laboratoires RSA. Le programme Décrypthon, de son côté, accélère la comparaison de 500.000 protéines, grâce aux machines des internautes.

Toutes ces applications, généralement faciles à installer, et pas lourdes du tout à télécharger, oeuvrent dans le même sens : faire à plusieurs ce qu’elles ne pourraient faire seules. Je m’explique : prenons le cas RC5-64, que je connais bien 😉 Briser cet algo représente une tâche monumentale : un Mac ou PC quelconque donnerait sa langue au chat, même au bout de 10.000 ans de calcul non-stop !… Maintenant, prenez plusieurs milliers, que dis-je, millions d’ordinateurs personnels éparpillés sur cette Terre, et additionnez leur puissance de calcul… Là, tout change, et ce qui était irréalisable devient… faisable 😉 Dans le cas du projet Décrypthon, ce sont plus de 50.000 ordinateurs qui “participent” au calcul, qui aurait pris près de 1200 ans à une machine isolée !

Et oui, c’est cela, le calcul partagé : profiter du temps processeur inutilisé de nos ordinateurs pour unir les ressources informatiques mondiales dans un but de calcul pur, dont les applications vont de la cryptographie à la recherche médicale. Lorsque vous faites tourner l’un des logiciels cités ci-dessus, celui-ci récupère via votre liaison Internet, les informations à décoder – ou calculer, ou processer, que sais-je encore ! – puis les renvoie au serveur une fois traitées.
Dans le cas de Seti, l’idée du soft est originale, car celui-ci se camouffle derrière un économiseur d’écran, vous permettant de monitorer au mieux l’usage de vos ressources processeur.
Le cas de RC5-64 est différent, puisqu’il s’agit d’une banale application qui gère les calculs de manière dynamique, en tâche de fond. Evidemment, l’activité du programme et la “part de puissance” qu’elle “prend” à votre proc’ est totalement paramétrable. Notons également que RC5 est un programme largement utilisé pour mesurer les performances des processeurs disponibles sur le marché… Vous aurez facilement deviné que le G4 pulvérise les Intel et AMD 🙂 La raison ? Tout simplement l’architecture du processeur, dont l’unité AltiVec et le fonctionnement RISC est particulièrement efficace dans ce type de calculs. J’ai personnellement installé et fait tourner une “ferme” de G4 l’année dernière sous RC5-64… Les performances de cette “render farm” étaient époustoufflantes : plus de 40 GigaFlops de puissance !

Maintenant, me direz-vous, pourquoi ne pas utiliser un supercalculateur pour effectuer ces travaux ?
Plusieurs raisons : le coût, la disponibilité de temps de calcul, les priorités… Si l’on regarde la liste de principaux calculateurs mondiaux (le fameux Top500), on remarque que les premiers sont réservés à la recherche militaire, entendez simulations nucléaires. D’autres servent à des recherches en météorologie, physique fondamentale,… Cela laisse bien peu de place pour le RC5 ou les Gremlins de Seti@Home !

Parlons enfin du titre que j’ai choisi pour vous parler du calcul distribué… L’idée d’exploiter des ressources processeur individuelles et de les mettre en commun est séduisante, mais peut-elle concurrencer les supercalculateurs traditionnels ? En fait, le principal problème du système distribué réside dans l’échange et l’actualisation des données avec le centre serveur. Car cet égange se base actuellement sur le réseau Internet. Cela constitue un réel handicap… Pas pour des applications du type RC5, Seti ou Décrypthon, ou nous sommes dans du calcul brut et pour ainsi dire, linéaire; mais les travaux effectués grâce aux Crays et autres Fujitsu VPP ne sauraient être portés sur ce mode de calcul, par la simple limitation en bande passante et les goulets d’étranglement présents en de nombreux point de ce réseau. Imaginez que pour tirer pleinement parti de la puissance phénoménale du nouveau monstre de Nec, baptisé Earth Simulator[[<*>plus de 5000 processeurs vectoriels, pour une peak performance de… 40 TeraFlops !!! Qui dit mieux ?!]], les ingénieurs ont déployés une bande passante de 256 Go/s, utilisant un réseau complexe de fibres optiques ! Alors, Internet 2 –l’Internet à haut débit, enfin !- saura peut-être combler les lacunes du système actuel. En tout cas, je l’espère, car l’idée est novatrice… et généreuse.

Différents projets de calcul partagé :

The Genome Project
Seti
RC5
Folding
Ubero

Le site du Top500 (top 500 supercomputers), par KPN/Kwest