GPUGrid: Ein Berechnunsfehler nach dem anderen...

Analyse und Vorhersage von Struktur und Faltungsweg (FAH, POEM@home, Rosetta@home, HPFP, ...)
Nachricht
Autor
Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 20387
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

GPUGrid: Ein Berechnunsfehler nach dem anderen...

#1 Ungelesener Beitrag von Michael H.W. Weber » 19.07.2016 00:55

...auf der GTX 650 des RKN-Clusters. Ich habe die Karte aus Node 02 (inzwischen reaktiviert, nachdem Ethernetcontroller des Mobos abgeschaltet und ein PCI-Ersatzkärtchen eingebaut und die HD getauscht wurde) in Node 06 (Ubuntu 16.04 LTS mit NVIDIA proprietären Treibern (tested)) verfrachtet. Dort rechnet die GraKa seit gestern testweise an Einstein@home, nachdem ich bei GPUGrid nur Fehler bekam: Jede GPUGrid-WU bricht nach wenigen Sekunden mit einem Berechnungsfehler ab. Fehlermeldung: "missing output file"...

Hat einer eine Idee, was es damit auf sich hat?

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Benutzeravatar
X1900AIW
TuX-omane
TuX-omane
Beiträge: 2773
Registriert: 05.01.2008 16:34

Re: GPUGrid: Ein Berechnunsfehler nach dem anderen...

#2 Ungelesener Beitrag von X1900AIW » 19.07.2016 14:59

Siehe FAQ - Recommended GPUs for GPUGrid crunching, Stand 15.11.2015.
Entry Level > GTX 650 (2GB only)
Kann sein, dass mit dem Fehler die Größe der Ergebnisdatei gemeint ist und weil die Hardware die Bedingungen unterschreitet ... evtl. liegt es am freien VRAM, falls die 650 auch für die Monitoransteuerung benötigt wird.
Zusammenkommen ist ein Beginn, Zusammenbleiben ist ein Fortschritt, Zusammenarbeiten ist ein Erfolg.
Henry Ford

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 20387
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: GPUGrid: Ein Berechnunsfehler nach dem anderen...

#3 Ungelesener Beitrag von Michael H.W. Weber » 19.07.2016 17:18

Aha, das hilft. Die in Cluster-Node 06 verwendete ASUS GTX 650 Ti hat nur 1 GB GDDR5 RAM. Damit ist so wohl ungeeignet, zumal das reguläre Display über dieser Karte auch noch bedient werden muss.

Die FAQ bedeutet desweiteren, dass auch die anderen Cluster GPUs (460, 465, 560 Ti und diverse AMD-Kärtchen) nicht GPUGrid-tauglich sind.

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Felix2015

Re: GPUGrid: Ein Berechnunsfehler nach dem anderen...

#4 Ungelesener Beitrag von Felix2015 » 19.07.2016 18:13

:good: Ho, nach diesem Erkenntnisgewinn kann ja der Cluster nun massiv optimiert werden, damit er auch hier auf Touren kommen kann. :wink:

Felix2015

Re: GPUGrid: Ein Berechnunsfehler nach dem anderen...

#5 Ungelesener Beitrag von Felix2015 » 10.08.2016 06:43

Der Moderator skgiven im Forum GPUGRID hat eine Tabelle zusammengestellt.

Bild

Die Performence der neuen Pascal-Karten sehen gut aus.

Allerdings möchte ich dazu zwei Anmerkungen machen:
1) Alle neue Karten: Titan - GTX1080 - GTX1070 - GTX1060 können (noch) kein GPUGRID crunchen!
Wann dieses der Fall sein wird ist noch unbekannt. Offenbar wird ein CUDA 8.0 aufgesetzt - und getestet.

2) Die aktuell schnellste produktive Graka ist die GTX 980 TI (die exotische GTX Titan lass ich mal außen vor).
Beim crunchen mit 2 WUs gleichzeitig gibt es jedoch "nur" eine Auslastung von ~ 80%.
Da von Projektseite aus eben nur diese 2 WUs gleichzeitig freigegeben wird, wird sich an der Auslastung seitens der neuen Karten nichts ändern -
eher noch weitersinken (es sei denn CUDA 8 bringt massive Änderungen in der Scalierung mit sich).
Allerdings wird es zu einer Beschleunigung / Reduzierung der Crunchzeit kommen.

Die beste Graka-Auslastung hat aktuell PrimeGrid und Poem.

Benutzeravatar
X1900AIW
TuX-omane
TuX-omane
Beiträge: 2773
Registriert: 05.01.2008 16:34

Re: GPUGrid: Ein Berechnunsfehler nach dem anderen...

#6 Ungelesener Beitrag von X1900AIW » 10.08.2016 10:23

Thema dieses Fadens war ein anderer, aus der Einschätzung von skygiven zur Pascal Titan X leiten sich m.E. wesentlich interessante Hinweise ab, die (zukünftig) bei der Fehlersuche bzw. den Performanceproblemen bedeutsam sein können:
  • "(...)GPUGrid is more similar to Folding but the app is different so it may bottleneck in different places. For that reason a performance chart will likely look similar but the choicest card(s) might be different...

    Other hardware factors. The Titan has 3MB L2 cache whereas the GTX1080 has 2MB. The Titan’s bus width (& ROPs ratio) are slightly (7%) higher, so there are less potential hardware bottlenecks. Should help it scale but it is still 24% bigger than a 1080.
    Note that the GTX1060’s (GP106) cache is only 1.5MB, which might explain the slightly poorer performance at Folding. While 1.5MB is likely to be a factor at GPUGrid too, how significant that is remains to be seen. (...)"
Das kann bei der Wahl eines günstigen Pascal Modells hilfreich sein, um dessen Sinn bereits zum erwarteten Einsatz beim Projekt fast schon zu bezweifeln, niemand kauft sich einen modernen Chip, der durch solche ´bottlenecks´ bereits beim Start eingeschränkt ist und so womöglich hinter ältere Hardware zurückfällt.

P.S. Meine Bitte: nicht in jedem Faden die Performance im Allgemeinen oder im Besonderen diskutieren. Auch mein jetziger Beitrag ist off topic, wir hatten lange einen gut gepflegten GPUgrid Faden, der Neuerungen zum Thema hat. GPUgrid und Pascal ist ein ungelegtes Ei. Daher versuche ich zumindest im Faden Pascal zu bleiben bzgl. "Eckdaten" über Projekte hinweg. skygiven hat sich auf einen FAHBench bezogen, sogar ohne Nennung der Version, WU bzw. Komplexität, Folding mag ähnliche Performance Vergleiche aufstellen lassen, doch am Ende zählt m.E. wiederum die konkretet Leistung der Hardware in der veröffentlichen Applikation, diese Unschärfe setzt sich fort, dabei haben wir - von @Felix2015 ins Leben gerufen :good: , einen Vergleichsfaden für Nvidia/AMD für diverse Projekte, als Sammelfaden gedacht.

Meine Bitte kurz gesagt: topic bleiben. Ich weiß, manche sind sicher froh, überhaupt Leben im Forum zu sehen, für die Orientierung über neue Hardware hinweg wie bei der Einschätzung älterer Hardware in den Projekten oder der Fehlersuche wie hier, bin ich persönlich froh, wenn ich on topic Infos finde.
Zusammenkommen ist ein Beginn, Zusammenbleiben ist ein Fortschritt, Zusammenarbeiten ist ein Erfolg.
Henry Ford

Antworten

Zurück zu „Protein- und Nukleinsäureforschung“