Seite 1 von 1

GPUGrid: Ein Berechnunsfehler nach dem anderen...

Verfasst: 19.07.2016 00:55
von Michael H.W. Weber
...auf der GTX 650 des RKN-Clusters. Ich habe die Karte aus Node 02 (inzwischen reaktiviert, nachdem Ethernetcontroller des Mobos abgeschaltet und ein PCI-Ersatzkärtchen eingebaut und die HD getauscht wurde) in Node 06 (Ubuntu 16.04 LTS mit NVIDIA proprietären Treibern (tested)) verfrachtet. Dort rechnet die GraKa seit gestern testweise an Einstein@home, nachdem ich bei GPUGrid nur Fehler bekam: Jede GPUGrid-WU bricht nach wenigen Sekunden mit einem Berechnungsfehler ab. Fehlermeldung: "missing output file"...

Hat einer eine Idee, was es damit auf sich hat?

Michael.

Re: GPUGrid: Ein Berechnunsfehler nach dem anderen...

Verfasst: 19.07.2016 14:59
von X1900AIW
Siehe FAQ - Recommended GPUs for GPUGrid crunching, Stand 15.11.2015.
Entry Level > GTX 650 (2GB only)
Kann sein, dass mit dem Fehler die Größe der Ergebnisdatei gemeint ist und weil die Hardware die Bedingungen unterschreitet ... evtl. liegt es am freien VRAM, falls die 650 auch für die Monitoransteuerung benötigt wird.

Re: GPUGrid: Ein Berechnunsfehler nach dem anderen...

Verfasst: 19.07.2016 17:18
von Michael H.W. Weber
Aha, das hilft. Die in Cluster-Node 06 verwendete ASUS GTX 650 Ti hat nur 1 GB GDDR5 RAM. Damit ist so wohl ungeeignet, zumal das reguläre Display über dieser Karte auch noch bedient werden muss.

Die FAQ bedeutet desweiteren, dass auch die anderen Cluster GPUs (460, 465, 560 Ti und diverse AMD-Kärtchen) nicht GPUGrid-tauglich sind.

Michael.

Re: GPUGrid: Ein Berechnunsfehler nach dem anderen...

Verfasst: 19.07.2016 18:13
von Felix2015
:good: Ho, nach diesem Erkenntnisgewinn kann ja der Cluster nun massiv optimiert werden, damit er auch hier auf Touren kommen kann. :wink:

Re: GPUGrid: Ein Berechnunsfehler nach dem anderen...

Verfasst: 10.08.2016 06:43
von Felix2015
Der Moderator skgiven im Forum GPUGRID hat eine Tabelle zusammengestellt.

Bild

Die Performence der neuen Pascal-Karten sehen gut aus.

Allerdings möchte ich dazu zwei Anmerkungen machen:
1) Alle neue Karten: Titan - GTX1080 - GTX1070 - GTX1060 können (noch) kein GPUGRID crunchen!
Wann dieses der Fall sein wird ist noch unbekannt. Offenbar wird ein CUDA 8.0 aufgesetzt - und getestet.

2) Die aktuell schnellste produktive Graka ist die GTX 980 TI (die exotische GTX Titan lass ich mal außen vor).
Beim crunchen mit 2 WUs gleichzeitig gibt es jedoch "nur" eine Auslastung von ~ 80%.
Da von Projektseite aus eben nur diese 2 WUs gleichzeitig freigegeben wird, wird sich an der Auslastung seitens der neuen Karten nichts ändern -
eher noch weitersinken (es sei denn CUDA 8 bringt massive Änderungen in der Scalierung mit sich).
Allerdings wird es zu einer Beschleunigung / Reduzierung der Crunchzeit kommen.

Die beste Graka-Auslastung hat aktuell PrimeGrid und Poem.

Re: GPUGrid: Ein Berechnunsfehler nach dem anderen...

Verfasst: 10.08.2016 10:23
von X1900AIW
Thema dieses Fadens war ein anderer, aus der Einschätzung von skygiven zur Pascal Titan X leiten sich m.E. wesentlich interessante Hinweise ab, die (zukünftig) bei der Fehlersuche bzw. den Performanceproblemen bedeutsam sein können:
  • "(...)GPUGrid is more similar to Folding but the app is different so it may bottleneck in different places. For that reason a performance chart will likely look similar but the choicest card(s) might be different...

    Other hardware factors. The Titan has 3MB L2 cache whereas the GTX1080 has 2MB. The Titan’s bus width (& ROPs ratio) are slightly (7%) higher, so there are less potential hardware bottlenecks. Should help it scale but it is still 24% bigger than a 1080.
    Note that the GTX1060’s (GP106) cache is only 1.5MB, which might explain the slightly poorer performance at Folding. While 1.5MB is likely to be a factor at GPUGrid too, how significant that is remains to be seen. (...)"
Das kann bei der Wahl eines günstigen Pascal Modells hilfreich sein, um dessen Sinn bereits zum erwarteten Einsatz beim Projekt fast schon zu bezweifeln, niemand kauft sich einen modernen Chip, der durch solche ´bottlenecks´ bereits beim Start eingeschränkt ist und so womöglich hinter ältere Hardware zurückfällt.

P.S. Meine Bitte: nicht in jedem Faden die Performance im Allgemeinen oder im Besonderen diskutieren. Auch mein jetziger Beitrag ist off topic, wir hatten lange einen gut gepflegten GPUgrid Faden, der Neuerungen zum Thema hat. GPUgrid und Pascal ist ein ungelegtes Ei. Daher versuche ich zumindest im Faden Pascal zu bleiben bzgl. "Eckdaten" über Projekte hinweg. skygiven hat sich auf einen FAHBench bezogen, sogar ohne Nennung der Version, WU bzw. Komplexität, Folding mag ähnliche Performance Vergleiche aufstellen lassen, doch am Ende zählt m.E. wiederum die konkretet Leistung der Hardware in der veröffentlichen Applikation, diese Unschärfe setzt sich fort, dabei haben wir - von @Felix2015 ins Leben gerufen :good: , einen Vergleichsfaden für Nvidia/AMD für diverse Projekte, als Sammelfaden gedacht.

Meine Bitte kurz gesagt: topic bleiben. Ich weiß, manche sind sicher froh, überhaupt Leben im Forum zu sehen, für die Orientierung über neue Hardware hinweg wie bei der Einschätzung älterer Hardware in den Projekten oder der Fehlersuche wie hier, bin ich persönlich froh, wenn ich on topic Infos finde.