sephirothff Posté(e) le 11 juin 2008 Posté(e) le 11 juin 2008 (modifié) la comparaison semble un peu lointaine non ? gpu et cpu c'est assez différent Modifié le 11 juin 2008 par sephirothff
baboulette Posté(e) le 11 juin 2008 Posté(e) le 11 juin 2008 (modifié) la comparaison semble un peu lointaine non ? gpu et cpu c'est assez différent Pas vraiment, car les CPU tendent à devenir trés parelleles, alors qu'ils sont tres flexibles, à la difference les GPU tres parelleles,qui tendent à devenir flexibles, et programmables. D'ailleurs les fondeurs, comptent à terme inclure GPU+CPU dans une meme puce. Modifié le 11 juin 2008 par baboulette
sephirothff Posté(e) le 11 juin 2008 Posté(e) le 11 juin 2008 oui j'avais vu , mais le fonctionnement lui meme est quand memedifferent , dans ce cas la on imagine bien que les cpu serais identique sinon , quand tu vois la difference au niveau puissance de calcul.
ouasse Posté(e) le 11 juin 2008 Auteur Posté(e) le 11 juin 2008 un ex pour la différence cpu/gpu: la nvidia 8800 comporte 128 coeurs, chaque coeur est capable de gérer 96 threads simultanément, ce qui fait qu'il faut un niveau de parallélisme de 12000 threads pour pouvoir exploiter l'architecture à fond. Bon en pratique on doit pouvoir se rapprocher de la puissance crête aux alentours de 500 threads, mais bon on est super loin du niveau de parallélisme atteignable pour les algos courants. A part pour faire des rotations/translations sur des millions de vecteurs et de l'affichage de triangles sur des petites zones d'écran, on peut difficilement paralléliser aussi finement les tâches de calcul courantes sur GPU. Dans le cas du calcul à haute performance on peut être amenés à faire des calculs au niveau de particules ou d'atomes par exemple, ce qui est relativement parallélisable, mais quand on fait des simulations sur une échelle de temps, pour calculer le temps t+1 on a besoin d'avoir fini le calcul pour le temps t, donc les deux (t et t+1) ne peuvent pas se faire en parallèle. Après pour des calculs intrinsèquement séquentiels on ne peut pas les paralléliser donc multiplier le nombre de coeurs ne sert à rien. Donc bref, les GPU sont bien pour ce qu'ils sont censés faire (graphisme et 3D), et leur utilisation peut être étendue pour des tâches hautement parallélisables. Pour du calcul itératif ils ne seront jamais efficaces. Tout dépend de ce qu'on veut faire avec
baboulette Posté(e) le 11 juin 2008 Posté(e) le 11 juin 2008 (modifié) oui j'avais vu , mais le fonctionnement lui meme est quand memedifferent , dans ce cas la on imagine bien que les cpu serais identique sinon , quand tu vois la difference au niveau puissance de calcul. Oui, oui bien sur , d'ailleurs c'est aussi pour ca que je dis qu'il faut relativiser les chiffres, car faut voir les conditions de tests, savoir quels sont les calculs utilisées etc... Evidament les CG sont plus puissantes dans certains types, en fait dans des types de calculs, qui peuvent etres identiques dans leurs traitements, à des manipulations de données graphiques. Une CG ne gerera jamais un OS par exemple, ca c'est clair. Modifié le 11 juin 2008 par baboulette
reflow Posté(e) le 17 juin 2008 Posté(e) le 17 juin 2008 post très intéressant...mais chut...je me remets au fond de la salle près du radiateur...
baboulette Posté(e) le 18 juin 2008 Posté(e) le 18 juin 2008 post très intéressant...mais chut...je me remets au fond de la salle près du radiateur... :lol: On reprends les vieilles habitudes ??
reflow Posté(e) le 18 juin 2008 Posté(e) le 18 juin 2008 post très intéressant...mais chut...je me remets au fond de la salle près du radiateur... :lol: On reprends les vieilles habitudes ?? Beh ué, kué. J'ai rien à dire mais tout à apprendre.
ouasse Posté(e) le 19 juin 2008 Auteur Posté(e) le 19 juin 2008 ca y est, le top 500 nouveau est arrivé : http://www.top500.org/list/2008/06/100 avec comme prévu le Roadrunner en première place, les deux places suivantes sont encore des IBM, le 4e est un cluster d'Opterons, et le premier à base de processeurs Intel est 7e.
baboulette Posté(e) le 19 juin 2008 Posté(e) le 19 juin 2008 (modifié) ca y est, le top 500 nouveau est arrivé : http://www.top500.org/list/2008/06/100avec comme prévu le Roadrunner en première place, les deux places suivantes sont encore des IBM, le 4e est un cluster d'Opterons, et le premier à base de processeurs Intel est 7e. Déja si tu regardes le descriptif, tu verras que les xeon quad core, et le cell du road runner sont donné pour les memes perfs .. Environ 12 gflops, sachant que les xeon ont qd même 200 mhz de moins, et le road-runner 110 000 procs en plus. Par contre un gros lol pour la RAM 28000 Go (blue gene 74000 Go) .. Modifié le 19 juin 2008 par baboulette
ouasse Posté(e) le 19 juin 2008 Auteur Posté(e) le 19 juin 2008 j'imagine que les perfs données sont par coeur et non par cpu, sinon ça colle pas. Le PowerXCell 8i fait 100 GFlops, donc effectivement 12,5 par SPE. (cf. Wikipedia) pareil pour les Xeon, les perfs sont par coeur et pas par puce (sur la page http://www.top500.org/system/performance/9227 , en divisant la puissance totale par le nombre de coeurs on a la puissance par coeur et pas pas chip).
baboulette Posté(e) le 19 juin 2008 Posté(e) le 19 juin 2008 j'imagine que les perfs données sont par coeur et non par cpu, sinon ça colle pas.Le PowerXCell 8i fait 100 GFlops, donc effectivement 12,5 par SPE. (cf. Wikipedia) pareil pour les Xeon, les perfs sont par coeur et pas par puce (sur la page http://www.top500.org/system/performance/9227 , en divisant la puissance totale par le nombre de coeurs on a la puissance par coeur et pas pas chip). Non les perfs sont bien données par CPU, il faut pas perdre a l'idée que les perfs données par les constructeurs, sont completement surealistes .. Elle sont vrai dans certains cas, avec certains algos, etudié pour. Ca me rappelle le fameux ICOMP d'intel. Par contre en situation réelle, en utilisant tout les ressources des procs, bah on voit réellement de quoi sont capables les procs. D'ailleurs il me semble qu'intel donne des perfs pour le quadcore bien superieures à 12 gflops.
baboulette Posté(e) le 19 juin 2008 Posté(e) le 19 juin 2008 j'imagine que les perfs données sont par coeur et non par cpu, sinon ça colle pas.Le PowerXCell 8i fait 100 GFlops, donc effectivement 12,5 par SPE. (cf. Wikipedia) pareil pour les Xeon, les perfs sont par coeur et pas par puce (sur la page http://www.top500.org/system/performance/9227 , en divisant la puissance totale par le nombre de coeurs on a la puissance par coeur et pas pas chip). Effectivement, c'est bien des perfs par core ..
Messages recommandés
Créer un compte ou se connecter pour commenter
Vous devez être membre afin de pouvoir déposer un commentaire
Créer un compte
Créez un compte sur notre communauté. C’est facile !
Créer un nouveau compteSe connecter
Vous avez déjà un compte ? Connectez-vous ici.
Connectez-vous maintenant