Forum > GPU crunching

AstroPulse for ATI GPUs released

<< < (11/20) > >>

skildude:
On my 5850 I've noticed that the more blanked the WU is the longer it takes to complete.  I had one that had about 25% blanked and it took nearly 8 hours.
overflow WU's (30 pulses) usually finish in under 2 hour.  regular completion times are 2-4 hours. 

Raistmer:

--- Quote from: skildude on 05 Oct 2010, 11:42:03 am ---On my 5850 I've noticed that the more blanked the WU is the longer it takes to complete.  I had one that had about 25% blanked and it took nearly 8 hours.
overflow WU's (30 pulses) usually finish in under 2 hour.  regular completion times are 2-4 hours. 

--- End quote ---
Yes, it behaves just in that way.
I will attach performance vs blanking % graph soon (I did that on beta before, now it will have more points).

Raistmer:

--- Quote from: Raistmer on 04 Oct 2010, 01:52:25 pm ---
--- Quote from: SubSpace on 04 Oct 2010, 12:03:12 pm ---А это уже наверняка или может в 58хх это возможно?


--- Quote from: Raistmer on 04 Oct 2010, 10:28:48 am --- А HD58xx - это всё же не FERMI, она в параллель два разных ядра не запустит.


--- End quote ---

--- End quote ---
Насколько мне известно такая возможность только в ферми есть.

--- End quote ---

Хотя....
cl_ext_device_fission
http://www.khronos.org/registry/cl/extensions/ext/cl_ext_device_fission.txt
судя по тому, что я прочитал, это расширение позволяет использовать GPU в той же манере, что и в FERMI карточках. Так что может быть какимто образом все же можно два ядра одновременно запускать. Осталось понять что для этого конкретно требуется.



SubSpace:
Тоесть можно выделить конкретное число вычислительных единиц, под конкретную задачу? К примеру 10 из 20-и



--- Quote from: Raistmer on 05 Oct 2010, 12:46:11 pm ---
Хотя....
cl_ext_device_fission
http://www.khronos.org/registry/cl/extensions/ext/cl_ext_device_fission.txt
судя по тому, что я прочитал, это расширение позволяет использовать GPU в той же манере, что и в FERMI карточках. Так что может быть какимто образом все же можно два ядра одновременно запускать. Осталось понять что для этого конкретно требуется.


--- End quote ---

Raistmer:
Я так это понял. Вопрос в том, что будет с остальными десятью. FERMI  вроде как умеет на уровне драйвера задействовать остатки под ядро из другого процесса. Т.о. можно две задачи в параллель запустить - будет выигрыш, если есть свободные вычислительные модули. Умеет ли это АТИшная карточка - не очевидно. Можно попробовать в самой программе одновременно запускать два ядра, каждое на половине счетных модулей. _НО_ очередь для АТИшной карточки строго последовательная (in-order), поэтому для такого подхода придется использовать видимо несколько очередей выполнения, делать между ними синхронизацию... короче, существенное усложнение кода.
Посмотрим, когда-нибудь и до такого дойдем конечно, пока я попробую загрузку ГПУ повысить при вызове одного ядра все же.
[Я сейчас тестирую варианты с возможно бОльшей загрузкой ГПУ (и бОльшим потреблением памяти соответственно). Могу выложить для тестирование несколько вариантов. Желательно сначала опробовать на укороченных тестовых модулях. Я тест-кейс загружу, останется только запустить на выполнение и прислать потом результат]

Navigation

[0] Message Index

[#] Next page

[*] Previous page

Go to full version