2. Exzerpt

Titel: Optimization Principles and Application Performance Evaluation
of a Multithreaded GPU Using CUDA

Quelle: Exzerpt2 (pdf, 314 KB)
Preview:
Es hat eine klare Gliederung und viele Quell-Verweise.
Tabellen und Diagramme begleiten und ergänzen den Text.

Fragen:
  1. Tiefe Einblicke in die CUDA-Architektur
  2. Was sind die Programm-Optimierungsstrategien?
  3. Welche Resultate können dank den Optimierungen erzielt werden?
Read:
    zu
  1. Artikel bietet die nötigen Einblicke und liefert Verweise auf die weitreichende Literatur. Die Eigenschaften werden deutlicher durch Vergleiche mit vorherigen und gegenwärtigen parallelen Architekturen
  2. zu
  3. Es werden die 4 grundlegende Strategien genannt und anhand vieler Beispiele erläutert.
  4. zu
  5. Durch die massive Parallelisierung könnten alle getestete Programme beschleunigt werden, Auch dann, wenn diese nicht für die CUDA-Architektur geeignet sind.
Reflect:
Der Autor ist sehr detailliert in der Beschreibung der Architektur und Optimierungsverfahren, was ermöglicht selbstständig selbige durchzuführen, bzw. ein Programms zu analysieren, um zu erwägen, ob die Optimierungen nötig sind.

Recite:
Es gibt keine universelle Optimierungsstrategie. Es hängt von dem Programm ab, was gemacht werden muss und im Grunde genommen geht es immer um einen Kompromiss.
Man soll versuchen möglichst viele Threads zu starten, damit die Hardware ausgelastet wird.
Anzahl der Threads, die gleichzeitig laufen können, hängt von der Anzahl der Register, die von den Threads benutzt werden. Wenn man aber zu wenig Register verwendet oder auf Shared-Speicher verzichtet, wo es notwendig wäre, dann würde dass Programm zu langsam, wegen zu hohen Zugriffe auf den globalen Speicher. Deswegen muss immer ein Kompromiss getroffen werden.

Review:
Das ist eine sehr gute wissenschaftliche Publikation, die mir bei der Erstellung der Ausarbeitung viel nützt. Es bietet gute Beschreibung des Themas und bietet zahlreiche verweise (25 Quellen) auf weitere Dokumente, die meisten davon sind für mich relevant.
Der Autor beleuchtet nicht nur Vorteile, sondern auch Nachteile der Thema.
Artikel ist sehr gut strukturiert. Es ist erstaunlich wie viel Informationsgehalt man in jeden Wort und Satz stecken kann.

parallele Bildverarbeitung auf Grafikkarten von Nvidia mit CUDA am Beispiel einiger Aufgaben

Dank CUDA sind die Grafikkarten von NVIDIA für bestimmte Aufgaben der Bildverarbeitung gut geeignet, und meistern diese deutlich schneller im Vergleich mit herkömmliche modernen Prozessoren.

User Status

Du bist nicht angemeldet.

Aktuelle Beiträge

Rohfassung(aktualisiert)
rohfassung (pdf, 438 KB)
sleon - 3. Nov, 00:01
vorfreude
endlich eine Aufarbeitung von CUDA in Deutsch.... freu...
Masterkey - 26. Okt, 15:23
Argumentationsprinzip
Ich habe für die Argumentationsprinzip Rhombus entschieden,...
sleon - 6. Okt, 13:49
Gliederung
1)Einleitung 2)Cuda-Archi tektur 2.1)Einleitung 2.2) Tesla-Grafikkarten 2.3)Thr ead-Hierarchie 2.4)Speiche r-Arten 2.5)Abstraktion...
sleon - 5. Okt, 23:53
Mindmap gekürzt
sleon - 5. Okt, 23:35

Links

Suche

 

Status

Online seit 5728 Tagen
Zuletzt aktualisiert: 12. Nov, 20:34

Credits


aufgabe1
aufgabe2
aufgabe3
Profil
Abmelden
Weblog abonnieren