Forum > Windows

optimized sources

<< < (137/179) > >>

_heinz:
Intel Compiler Xe2011

step1 converting project solution
Rebuild these 93 projects to ensure all intermediate files are rebuilt with the new compiler.

Detailed update log was saved at "file://C:\CUDA32SDK\C\src\IcUpdateLog.htm"

step2 compiling with Intel compiler
...
...
Compiling with CUDA Build Rule... (Microsoft VC++ Environment)
"C:\CUDA32\v3.2\\bin\nvcc.exe"  -G0  -gencode=arch=compute_10,code=\"sm_10,compute_10\" -gencode=arch=compute_20,code=\"sm_20,compute_20\"  --machine 32 -ccbin "C:\Programme\Microsoft Visual Studio 9.0\VC\bin" -D_NEXUS_DEBUG -g   -Xcompiler "/EHsc /W3 /nologo /O2 /Zi  /MT  " -I"C:\CUDA32\v3.2\/include" -I"./" -I"../../common/inc" -I"../../../shared/inc" -I"../../shared/inc/" -I"C:\CUDA32\v3.2\\include" -maxrregcount=[Value]  --compile -o "Release/bandwidthTest.cu.obj" bandwidthTest.cu
nvcc fatal   : '[Value]': expected a number
Project bandwidthTest : error: A tool returned an error code from "Compiling with CUDA Build Rule..."
Build log was saved at "file://C:\CUDA32SDK\C\src\bandwidthTest\Release\BuildLog.htm"
bandwidthTest - 1 error(s), 0 warning(s), 0 remark(s)
------ Neues Erstellen gestartet: Projekt: asyncAPI, Konfiguration: Release Win32 ------
Deleting intermediate files and output files for project 'asyncAPI', configuration 'Release|Win32'.
Compiling with CUDA Build Rule... (Microsoft VC++ Environment)
"C:\CUDA32\v3.2\\bin\nvcc.exe"  -G0  -gencode=arch=compute_10,code=\"sm_10,compute_10\" -gencode=arch=compute_20,code=\"sm_20,compute_20\"  --machine 32 -ccbin "C:\Programme\Microsoft Visual Studio 9.0\VC\bin" -D_NEXUS_DEBUG -g   -Xcompiler "/EHsc /W3 /nologo /O2 /Zi  /MT  " -I"C:\CUDA32\v3.2\/include" -I"./" -I"../../common/inc" -I"../../../shared/inc" -I"C:\CUDA32\v3.2\\include" -maxrregcount=[Value]  --compile -o "Release/asyncAPI.cu.obj" asyncAPI.cu
nvcc fatal   : '[Value]': expected a number
Project asyncAPI : error: A tool returned an error code from "Compiling with CUDA Build Rule..."
Build log was saved at "file://C:\CUDA32SDK\C\src\asyncAPI\Release\BuildLog.htm"
asyncAPI - 1 error(s), 0 warning(s), 0 remark(s)
------ Neues Erstellen gestartet: Projekt: alignedTypes, Konfiguration: Release Win32 ------
Deleting intermediate files and output files for project 'alignedTypes', configuration 'Release|Win32'.
Compiling with CUDA Build Rule... (Microsoft VC++ Environment)
"C:\CUDA32\v3.2\\bin\nvcc.exe"  -G0  -gencode=arch=compute_10,code=\"sm_10,compute_10\" -gencode=arch=compute_20,code=\"sm_20,compute_20\"  --machine 32 -ccbin "C:\Programme\Microsoft Visual Studio 9.0\VC\bin" -D_NEXUS_DEBUG -g   -Xcompiler "/EHsc /W3 /nologo /O2 /Zi  /MT  " -I"./" -I"../../common/inc" -I"../../../shared/inc" -I"C:\CUDA32\v3.2\\include" -maxrregcount=[Value]  --compile -o "Release/alignedTypes.cu.obj" alignedTypes.cu
nvcc fatal   : '[Value]': expected a number
Project alignedTypes : error: A tool returned an error code from "Compiling with CUDA Build Rule..."
Build log was saved at "file://C:\CUDA32SDK\C\src\alignedTypes\Release\BuildLog.htm"
alignedTypes - 1 error(s), 0 warning(s), 0 remark(s)
========== Alles neu erstellen: 10 erfolgreich, Fehler bei 83, 0 übersprungen ==========

hey, thats the rules file error...maxrregcount get no value...
phh, I installed latest compiler
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [IA-32]... (Intel C++ Environment)

looking up:
Intel(R) C++ Compiler XE on IA-32, version 12.0.1 Package ID: w_ccompxe_2011.1.127
got it with latest download from 04.01.2011
It's a little bit frustrating... that this known error is  in package w_ccompxe_2011.1.127 till today.  :'(

heinz

_heinz:
Hi Jason,

CUDA3.2 & INTEL's Compiler
Package ID: w_ccompxe_2011.1.127
I used the patch CompilerIDEPluginUpdate.zip to avoid the rules-file error sucessful.
The rules-file error is gone.  ;)

Projekt: MonteCarloMultiGPU and Projekt: MonteCarlo does not sucessful compile with Intel Compiler
ptxas hung up  :'(
========== Alles neu erstellen: 91 erfolgreich, Fehler bei 2, 0 übersprungen ==========

So far, we must wait for the next update.

heinz

_heinz:
Sandy Bridge is available in Germany

Intel® Core™ i5-2500K (Boxed, FC-LGA4, "Sandy Bridge") € 219,90*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Der Intel® Core™ i5-2500K Prozessor basiert auf der neuen 32nm-Sandy-Bridge-Architektur und ist eine native Quad-Core-CPU mit integriertem Grafikkern (Intel® HD 3000). Die Weiterentwicklung der bisherigen Intel® Core™ Prozessoren bringt als wichtigste Neuerung mit AVX eine überarbeitete und auf 256-Bit erweiterte Version der SSE-Befehle. Der integrierte Speichercontroller untertstützt jetzt offiziell DDR3-Speicher bis 1600 MHz und der verbesserte "Dynamic Turbomode" kann den Takt bei niedrigen Systemtemperaturen (wie nach dem Rechnerstart) kurzzeitig um bis zu 30% über den Maximalwert anheben.
Die integrierte GPU läuft mit 850 Mhz (max. 1150 mit Turbo) und teilt sich den gemeinsamen, 6 MB großen L3-Cache mit der  CPU.
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Bezeichnung: Intel® Core™ i5-2500K
Anzahl Prozessorkerne: 4
Taktfrequenz: 3300 MHz
Cache Level 1: 4x 64 kB
Level 2: 4x 256 kB
Level 3: 6144 kB
Befehlssätze: SSE 4.x, AVX, EIST, Intel 64, XD bit, Intel VT-x, Smart Cache, Clear Video, Turbo Boost, AES-NI
Speicher-Controller Speicherstandards: DDR3-1066, DDR3-1333, DDR3-1600
Speicherkanäle: 2
Prozessorkern: Sandy Bridge, 32 nm
Bemerkung Turbo-Modus: CPU bis max. 3,7 GHz; GPU-Takt: 850 / 1.100 MHz (Standard / Turbo)
max. Leistungsaufnahme: 95 Watt
Bauform: FC-LGA4
Sockel: 1155
Lüfter: Befestigung für ATX-Mainboards
Anschlüsse PWM-Lüfteranschluss
Besonderheiten: mit aktivem CPU-Kühler

Weitere Infos: Die K-Modelle der Intel® Core™ Prozessoren sind für Übertakter und Technik-Enthusiasten gedacht und bieten einen frei wählbaren Multiplikator
~~~~~~~

Intel® Core™ i7-2600K (Boxed, FC-LGA4, "Sandy Bridge") € 339,-*
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Der Intel® Core™ i7-2600K Prozessor basiert auf der neuen 32nm-Sandy-Bridge-Architektur und ist eine native Quad-Core-CPU mit integriertem Grafikkern (Intel® HD 3000). Die Weiterentwicklung der bisherigen Intel® Core™ Prozessoren bringt als wichtigste Neuerung AVX, eine überarbeitete und auf 256-Bit erweiterte Version der SSE-Befehle. Der integrierte Speichercontroller untertstützt jetzt offiziell DDR3-Speicher bis 1600 MHz und der verbesserte "Dynamic Turbomode" kann den Takt bei niedrigen Systemtemperaturen (wie nach dem Rechnerstart) kurzzeitig um bis zu 30% über den Maximalwert anheben.
Die integrierte GPU läuft mit 850 Mhz (max. 1350 mit Turbo) und teilt sich den gemeinsamen, 8 MB großen L3-Cache mit der CPU.
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Bezeichnung: Intel® Core™ i7-2600K
Anzahl Prozessorkerne: 4
Taktfrequenz: 3400 MHz
Cache Level 1: 4x 64 kB
Level 2: 4x 256 kB
Level 3: 8192 kB
Befehlssätze: SSE 4.x, AVX, EIST, Intel 64, XD bit, Intel VT-x, Smart Cache, Clear Video, Turbo Boost, HyperThreading, AES-NI
Speicher-Controller:
Speicherstandards: DDR3-1066, DDR3-1333, DDR3-1600
Speicherkanäle: 2
Prozessorkern: Sandy Bridge, 32 nm
Bemerkung Turbo-Modus: CPU bis max. 3,8 GHz; GPU-Takt: 850 / 1.350 MHz (Standard / Turbo)
max. Leistungsaufnahme: 95 Watt
Bauform: FC-LGA4
Sockel: 1155
Lüfter: Befestigung für ATX-Mainboards
Anschlüsse: PWM-Lüfteranschluss
Besonderheiten mit aktivem CPU-Kühler

Weitere Infos: Die K-Modelle der Intel® Core™ Prozessoren sind für Übertakter und Technik-Enthusiasten gedacht und bieten einen frei wählbaren Multiplikator
 
~~~~~~~~~~~~~~~~~~~~~~
astropulse AVX app is in preparation.

heinz

_heinz:
For all of you who are interested to know some more about IPP/AVX


/* Win32:
px - C-optimized for all IA-32 processors
a6 - Optimized for Pentium III processors remark:thru 5.3 only
w7 - Optimized for Pentium 4 processors (SSE + SSE2)
t7 - Optimized for Pentium 4 processors with Streaming SIMD Extensions 3 (SSE3)
v8 - New Optimizations for 32-bit applications on Intel® Core™ 2 and Intel® Xeon® 5100 Processors
p8 - New Optimizations for 32-bit applications on 45nm Intel® Core™2 Duo (Penryn,Nehalem,Westmere) family processors
s8 - New Optimizations for 32-bit applications on Intel® Atom™ family processors
e9 - Not in Win32
*/
/* Win64:
mx - C-optimized for all Intel 64-based Platforms
m7 - Optimized for Intel 64-Based Platforms for Pentium 4 processors with Streaming SIMD Extensions 3 (SSE3)
u8 - New Optimizations for 64-bit applications on Intel® CoreTM 2 and Intel® Xeon® 5100 Processors
y8 - New Optimizations for 64-bit applications on 45nm Intel® CoreTM2 Duo (Penryn,Nehalem,Westmere) family processors and

Intel® CoreTM i7 processors (Nehalem and Westmer)
n8 - New Optimizations for 64-bit applications on Intel® AtomTM family processors
e9 - AVX required,New Optimizations for 64-bit applications on Sandy Bridge µarchitecture
*/
// Description:
// introduced USE_xxx for better prefix-handling
// USE_AVX is still for 64Bit available.
// USE_AVX exclude all other
// USE_AVX and USE_ATOM exclude each other.
// USE_ATOM exclude all other
// USE_SSE42 and USE_SSE41 use the same prefixes(y8, p8)
/*
USE_IPP         Prefix
---------------------------------      
                   X64   X32
USE_AVX      e9   -(p8)
USE_ATOM   n8   s8
USE_SSE42   y8   p8
USE_SSE41   y8   p8
USE_SSSE3   u8   v8
USE_SSE3    m7   t7
USE_SSE2    m7  w7
USE_SSE      m7  w7
no order      mx   px
*/

We use macros to handle all that IPP stuff in the right way.
The PREFIX will be inserted into the different macros to generate the IPP statements.
sample: #define ippsFFTFree_C_32fc PREFIX(ippsFFTFree_C_32fc)
Further it is necessary that generated objectfile must be static. Linked as static.
64 Bit libs are necessary to link.



------ Neues Erstellen gestartet: Projekt: ap_client, Konfiguration: AP_QaxAVX_CSP x64 ------
Deleting intermediate files and output files for project 'ap_client', configuration 'AP_QaxAVX_CSP|x64'.
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
ap_schema.cpp
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
ap_fold.cpp
-----USE_AVX activ-----
-----AVX x64 e9 activ-----
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
dm_chunk_parallel.cpp
-----USE_AVX activ-----
-----AVX x64 e9 activ-----
mtrand.cpp
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
ap_timer.cpp
-----USE_AVX activ-----
-----AVX x64 e9 activ-----
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
ap_fileio.cpp
-----USE_AVX activ-----
-----AVX x64 e9 activ-----
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
ap_remove_radar.cpp
-----USE_AVX activ-----
-----AVX x64 e9 activ-----
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
ap_client_main.cpp
-----USE_AVX activ-----
-----AVX x64 e9 activ-----
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
ap_debug.cpp
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
version.cpp
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
sbtf.cpp
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
ap_gfx_main.cpp
-----USE_AVX activ-----
-----AVX x64 e9 activ-----
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
intrinsics.cpp
-----USE_AVX activ-----
-----AVX x64 e9 activ-----
Compiling with Intel(R) C++ Compiler XE 12.0.1.127 [Intel(R) 64]... (Intel C++ Environment)
ap_science.cpp
-----USE_AVX activ-----
-----AVX x64 e9 activ-----
-----USE_AVX activ-----
-----AVX x64 e9 activ-----
Linking... (Intel C++ Environment)
xilink: executing 'link'
So far we can compile, for linking we need the 64Bit libs of libboinc, libboincapi, setiboincdb

To create the 64Bit libs(libboinc, libboincapi, setiboincdb) of the project will take some time.


heinz

_heinz:
V8-Xeon
btw crunching:
precalculation says: will reach 100 Mio in 30 days..... on 20th february.
Since 20th december V8-Xeon produced constant 1Mio per day with two well clocked GTX470.
RAC is now: 1,030,867
So we hope the machine run stable next month too.
happy crunching  ;)

heinz



Navigation

[0] Message Index

[#] Next page

[*] Previous page

Go to full version