+- +-
Say hello if visiting :) by Gecko
11 Jan 2023, 07:43:05 pm

Seti is down again by Mike
09 Aug 2017, 10:02:44 am

Some considerations regarding OpenCL MultiBeam app tuning from algorithm view by Raistmer
11 Dec 2016, 06:30:56 am

Loading APU to the limit: performance considerations by Mike
05 Nov 2016, 06:49:26 am

Better sleep on Windows - new round by Raistmer
26 Aug 2016, 02:02:31 pm

Author Topic: AVX Optimized App Development  (Read 109180 times)

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #150 on: 28 May 2012, 11:58:45 am »
FX-4100@3.6
BOINC idle

=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.051682 0.00000  test    mintime= 0.051531
                   fpu_ChirpData 0.017529 0.00000  test    mintime= 0.017479
             sse1_ChirpData_ak8e 0.007230 0.00000  test    mintime= 0.007164
              sse2_ChirpData_ak8 0.004583 0.00000  test    mintime= 0.004521
              sse3_ChirpData_ak8 0.004468 0.00000  test    mintime= 0.004435
                 avx_ChirpData_a 0.003825 0.00000  test    mintime= 0.003762
                 avx_ChirpData_b 0.003839 0.00000  test    mintime= 0.003779
                 avx_ChirpData_c 0.004100 0.00000  test    mintime= 0.004079
                 avx_ChirpData_d 0.003990 0.00000  test    mintime= 0.003967
                 avx_ChirpData_e 0.003914 0.00000  test    mintime= 0.003844
                 avx_ChirpData_f 0.003695 0.00000  test    mintime= 0.003664
                 avx_ChirpData_g 0.003653 0.00000  test    mintime= 0.003586
                 avx_ChirpData_h 0.004360 0.00000  test    mintime= 0.004313
                 avx_ChirpData_i 0.003781 0.00000  test    mintime= 0.003734
            avx_fma4_ChirpData_a 0.003349 0.00000  test    mintime= 0.003328
           avx_fma4_ChirpData_d4 0.003376 0.00000  test    mintime= 0.003356
           avx_fma4_ChirpData_d6 0.003417 0.00000  test    mintime= 0.003329
           avx_fma4_ChirpData_d8 0.003378 0.00000  test    mintime= 0.003339
            avx_fma4_ChirpData_e 0.003745 0.00000  test    mintime= 0.003706
            avx_fma4_ChirpData_a 0.003349 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.006409 0.00000  test    mintime= 0.006369
                   fpu_ChirpData 0.002194 0.00000  test    mintime= 0.002161
             sse1_ChirpData_ak8e 0.000900 0.00000  test    mintime= 0.000887
              sse2_ChirpData_ak8 0.000573 0.00000  test    mintime= 0.000564
              sse3_ChirpData_ak8 0.000561 0.00000  test    mintime= 0.000549
                 avx_ChirpData_a 0.000477 0.00000  test    mintime= 0.000470
                 avx_ChirpData_b 0.000486 0.00000  test    mintime= 0.000478
                 avx_ChirpData_c 0.000513 0.00000  test    mintime= 0.000505
                 avx_ChirpData_d 0.000502 0.00000  test    mintime= 0.000492
                 avx_ChirpData_e 0.000483 0.00000  test    mintime= 0.000456
                 avx_ChirpData_f 0.000460 0.00000  test    mintime= 0.000453
                 avx_ChirpData_g 0.000450 0.00000  test    mintime= 0.000440
                 avx_ChirpData_h 0.000543 0.00000  test    mintime= 0.000531
                 avx_ChirpData_i 0.000459 0.00000  test    mintime= 0.000446
            avx_fma4_ChirpData_a 0.000417 0.00000  test    mintime= 0.000410
           avx_fma4_ChirpData_d4 0.000429 0.00000  test    mintime= 0.000415
           avx_fma4_ChirpData_d6 0.000419 0.00000  test    mintime= 0.000414
           avx_fma4_ChirpData_d8 0.000423 0.00000  test    mintime= 0.000414
            avx_fma4_ChirpData_e 0.000465 0.00000  test    mintime= 0.000456
            avx_fma4_ChirpData_a 0.000417 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001609 0.00000  test    mintime= 0.001590
                   fpu_ChirpData 0.000548 0.00000  test    mintime= 0.000537
             sse1_ChirpData_ak8e 0.000225 0.00000  test    mintime= 0.000221
              sse2_ChirpData_ak8 0.000144 0.00000  test    mintime= 0.000140
              sse3_ChirpData_ak8 0.000140 0.00000  test    mintime= 0.000137
                 avx_ChirpData_a 0.000120 0.00000  test    mintime= 0.000117
                 avx_ChirpData_b 0.000122 0.00000  test    mintime= 0.000120
                 avx_ChirpData_c 0.000129 0.00000  test    mintime= 0.000126
                 avx_ChirpData_d 0.000125 0.00000  test    mintime= 0.000123
                 avx_ChirpData_e 0.000119 0.00000  test    mintime= 0.000114
                 avx_ChirpData_f 0.000115 0.00000  test    mintime= 0.000113
                 avx_ChirpData_g 0.000112 0.00000  test    mintime= 0.000110
                 avx_ChirpData_h 0.000135 0.00000  test    mintime= 0.000132
                 avx_ChirpData_i 0.000113 0.00000  test    mintime= 0.000111
            avx_fma4_ChirpData_a 0.000104 0.00000  test    mintime= 0.000103
           avx_fma4_ChirpData_d4 0.000106 0.00000  test    mintime= 0.000104
           avx_fma4_ChirpData_d6 0.000105 0.00000  test    mintime= 0.000104
           avx_fma4_ChirpData_d8 0.000105 0.00000  test    mintime= 0.000104
            avx_fma4_ChirpData_e 0.000117 0.00000  test    mintime= 0.000114
            avx_fma4_ChirpData_a 0.000104 0.00000  choice

                   Test duration     7.34 seconds

Ftst_v7 completed successfully.

i3-2120@3.3
BOINC idle

=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.058924 0.00000  test    mintime= 0.058849
                   fpu_ChirpData 0.012426 0.00000  test    mintime= 0.012339
             sse1_ChirpData_ak8e 0.005945 0.00000  test    mintime= 0.005699
              sse2_ChirpData_ak8 0.004193 0.00000  test    mintime= 0.004164
              sse3_ChirpData_ak8 0.004016 0.00000  test    mintime= 0.003993
                 avx_ChirpData_a 0.002082 0.00000  test    mintime= 0.002074
                 avx_ChirpData_b 0.002039 0.00000  test    mintime= 0.002034
                 avx_ChirpData_c 0.002107 0.00000  test    mintime= 0.002098
                 avx_ChirpData_d 0.001936 0.00000  test    mintime= 0.001932
                 avx_ChirpData_e 0.001928 0.00000  test    mintime= 0.001918
                 avx_ChirpData_f 0.002054 0.00000  test    mintime= 0.002044
                 avx_ChirpData_g 0.002078 0.00000  test    mintime= 0.002070
                 avx_ChirpData_h 0.002735 0.00000  test    mintime= 0.002641
                 avx_ChirpData_i 0.002223 0.00000  test    mintime= 0.002212
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.001928 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.007376 0.00000  test    mintime= 0.007337
                   fpu_ChirpData 0.001547 0.00000  test    mintime= 0.001540
             sse1_ChirpData_ak8e 0.000714 0.00000  test    mintime= 0.000712
              sse2_ChirpData_ak8 0.000522 0.00000  test    mintime= 0.000520
              sse3_ChirpData_ak8 0.000500 0.00000  test    mintime= 0.000498
                 avx_ChirpData_a 0.000260 0.00000  test    mintime= 0.000258
                 avx_ChirpData_b 0.000255 0.00000  test    mintime= 0.000254
                 avx_ChirpData_c 0.000264 0.00000  test    mintime= 0.000261
                 avx_ChirpData_d 0.000242 0.00000  test    mintime= 0.000241
                 avx_ChirpData_e 0.000242 0.00000  test    mintime= 0.000239
                 avx_ChirpData_f 0.000257 0.00000  test    mintime= 0.000255
                 avx_ChirpData_g 0.000260 0.00000  test    mintime= 0.000257
                 avx_ChirpData_h 0.000329 0.00000  test    mintime= 0.000322
                 avx_ChirpData_i 0.000271 0.00000  test    mintime= 0.000267
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.000242 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001841 0.00000  test    mintime= 0.001834
                   fpu_ChirpData 0.000387 0.00000  test    mintime= 0.000385
             sse1_ChirpData_ak8e 0.000179 0.00000  test    mintime= 0.000178
              sse2_ChirpData_ak8 0.000131 0.00000  test    mintime= 0.000130
              sse3_ChirpData_ak8 0.000125 0.00000  test    mintime= 0.000124
                 avx_ChirpData_a 0.000065 0.00000  test    mintime= 0.000064
                 avx_ChirpData_b 0.000064 0.00000  test    mintime= 0.000063
                 avx_ChirpData_c 0.000066 0.00000  test    mintime= 0.000065
                 avx_ChirpData_d 0.000064 0.00000  test    mintime= 0.000060
                 avx_ChirpData_e 0.000060 0.00000  test    mintime= 0.000059
                 avx_ChirpData_f 0.000065 0.00000  test    mintime= 0.000063
                 avx_ChirpData_g 0.000065 0.00000  test    mintime= 0.000064
                 avx_ChirpData_h 0.000081 0.00000  test    mintime= 0.000079
                 avx_ChirpData_i 0.000069 0.00000  test    mintime= 0.000064
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.000060 0.00000  choice

                   Test duration     5.55 seconds

Ftst_v7 completed successfully.
« Last Edit: 28 May 2012, 12:04:25 pm by arkayn »

Offline PatrickV2

  • Knight o' The Round Table
  • ***
  • Posts: 139
Re: AVX Optimized App Development
« Reply #151 on: 28 May 2012, 12:46:11 pm »
Although there are still puzzles from the tests so far, with the attached J55 I've added another dimension to the tests. J54 and earlier have been doing full Mebisample chirping as needed before doing Gaussian, Pulse, and Triplet finding. For cases where that's not needed, AK_v8 becomes more cache friendly by subdividing. So I modified all the chirp functions to support that, and J55 does testing at 128K and 32K in addition. The timings ought to be about 1/8 and 1/32 of the full length tests.

I do appreciate the testing, and am glad the Ivy Bridge system reacted like other Intel CPUs. Whatever form of dispatch is eventually used, keeping the number of code paths low will be more efficient.
                                         Joe

I have handed over the Ivy Bridge system to my (happy) brother (who is ~150kms away from me), so I will not be able to provide more feedback in that respect.

Regards, Patrick.

Offline Claggy

  • Alpha Tester
  • Knight who says 'Ni!'
  • ***
  • Posts: 3111
    • My computers at Seti Beta
Re: AVX Optimized App Development
« Reply #152 on: 28 May 2012, 01:04:39 pm »
i7-2600K @4.7GHz (Boinc running):

=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.047452 0.00000  test    mintime= 0.046795
                   fpu_ChirpData 0.015573 0.00000  test    mintime= 0.014707
             sse1_ChirpData_ak8e 0.006271 0.00000  test    mintime= 0.006084
              sse2_ChirpData_ak8 0.004890 0.00000  test    mintime= 0.004704
              sse3_ChirpData_ak8 0.004621 0.00000  test    mintime= 0.004309
                 avx_ChirpData_a 0.003329 0.00000  test    mintime= 0.002764
                 avx_ChirpData_b 0.003110 0.00000  test    mintime= 0.002663
                 avx_ChirpData_c 0.002965 0.00000  test    mintime= 0.002510
                 avx_ChirpData_d 0.002596 0.00000  test    mintime= 0.002251
                 avx_ChirpData_e 0.002902 0.00000  test    mintime= 0.002174
                 avx_ChirpData_f 0.003209 0.00000  test    mintime= 0.002657
                 avx_ChirpData_g 0.002810 0.00000  test    mintime= 0.002484
                 avx_ChirpData_h 0.003235 0.00000  test    mintime= 0.003037
                 avx_ChirpData_i 0.002924 0.00000  test    mintime= 0.002605
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.002596 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.005896 0.00000  test    mintime= 0.005775
                   fpu_ChirpData 0.001855 0.00000  test    mintime= 0.001815
             sse1_ChirpData_ak8e 0.000724 0.00000  test    mintime= 0.000704
              sse2_ChirpData_ak8 0.000571 0.00000  test    mintime= 0.000543
              sse3_ChirpData_ak8 0.000554 0.00000  test    mintime= 0.000531
                 avx_ChirpData_a 0.000306 0.00000  test    mintime= 0.000278
                 avx_ChirpData_b 0.000340 0.00000  test    mintime= 0.000290
                 avx_ChirpData_c 0.000356 0.00000  test    mintime= 0.000288
                 avx_ChirpData_d 0.000298 0.00000  test    mintime= 0.000264
                 avx_ChirpData_e 0.000323 0.00000  test    mintime= 0.000264
                 avx_ChirpData_f 0.000318 0.00000  test    mintime= 0.000271
                 avx_ChirpData_g 0.000340 0.00000  test    mintime= 0.000283
                 avx_ChirpData_h 0.000396 0.00000  test    mintime= 0.000339
                 avx_ChirpData_i 0.000351 0.00000  test    mintime= 0.000297
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000298 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001490 0.00000  test    mintime= 0.001426
                   fpu_ChirpData 0.000490 0.00000  test    mintime= 0.000440
             sse1_ChirpData_ak8e 0.000201 0.00000  test    mintime= 0.000175
              sse2_ChirpData_ak8 0.000158 0.00000  test    mintime= 0.000137
              sse3_ChirpData_ak8 0.000160 0.00000  test    mintime= 0.000132
                 avx_ChirpData_a 0.000099 0.00000  test    mintime= 0.000064
                 avx_ChirpData_b 0.000087 0.00000  test    mintime= 0.000068
                 avx_ChirpData_c 0.000092 0.00000  test    mintime= 0.000067
                 avx_ChirpData_d 0.000096 0.00000  test    mintime= 0.000063
                 avx_ChirpData_e 0.000103 0.00000  test    mintime= 0.000071
                 avx_ChirpData_f 0.000097 0.00000  test    mintime= 0.000070
                 avx_ChirpData_g 0.000093 0.00000  test    mintime= 0.000068
                 avx_ChirpData_h 0.000097 0.00000  test    mintime= 0.000081
                 avx_ChirpData_i 0.000088 0.00000  test    mintime= 0.000068
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_b 0.000087 0.00000  choice

                   Test duration     5.56 seconds

Ftst_v7 completed successfully.
=========================================================

i7-2600K @4.7GHz (Boinc suspended):

=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.041361 0.00000  test    mintime= 0.041250
                   fpu_ChirpData 0.008720 0.00000  test    mintime= 0.008688
             sse1_ChirpData_ak8e 0.004220 0.00000  test    mintime= 0.004196
              sse2_ChirpData_ak8 0.003154 0.00000  test    mintime= 0.003142
              sse3_ChirpData_ak8 0.002983 0.00000  test    mintime= 0.002965
                 avx_ChirpData_a 0.001472 0.00000  test    mintime= 0.001470
                 avx_ChirpData_b 0.001646 0.00000  test    mintime= 0.001642
                 avx_ChirpData_c 0.001486 0.00000  test    mintime= 0.001484
                 avx_ChirpData_d 0.001385 0.00000  test    mintime= 0.001377
                 avx_ChirpData_e 0.001538 0.00000  test    mintime= 0.001532
                 avx_ChirpData_f 0.001587 0.00000  test    mintime= 0.001578
                 avx_ChirpData_g 0.001638 0.00000  test    mintime= 0.001632
                 avx_ChirpData_h 0.002020 0.00000  test    mintime= 0.002002
                 avx_ChirpData_i 0.001712 0.00000  test    mintime= 0.001708
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.001385 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.005160 0.00000  test    mintime= 0.005146
                   fpu_ChirpData 0.001093 0.00000  test    mintime= 0.001084
             sse1_ChirpData_ak8e 0.000528 0.00000  test    mintime= 0.000524
              sse2_ChirpData_ak8 0.000394 0.00000  test    mintime= 0.000393
              sse3_ChirpData_ak8 0.000373 0.00000  test    mintime= 0.000370
                 avx_ChirpData_a 0.000184 0.00000  test    mintime= 0.000183
                 avx_ChirpData_b 0.000206 0.00000  test    mintime= 0.000204
                 avx_ChirpData_c 0.000186 0.00000  test    mintime= 0.000185
                 avx_ChirpData_d 0.000173 0.00000  test    mintime= 0.000171
                 avx_ChirpData_e 0.000192 0.00000  test    mintime= 0.000191
                 avx_ChirpData_f 0.000198 0.00000  test    mintime= 0.000196
                 avx_ChirpData_g 0.000205 0.00000  test    mintime= 0.000203
                 avx_ChirpData_h 0.000250 0.00000  test    mintime= 0.000245
                 avx_ChirpData_i 0.000204 0.00000  test    mintime= 0.000201
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000173 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001291 0.00000  test    mintime= 0.001286
                   fpu_ChirpData 0.000272 0.00000  test    mintime= 0.000271
             sse1_ChirpData_ak8e 0.000132 0.00000  test    mintime= 0.000131
              sse2_ChirpData_ak8 0.000099 0.00000  test    mintime= 0.000098
              sse3_ChirpData_ak8 0.000093 0.00000  test    mintime= 0.000092
                 avx_ChirpData_a 0.000047 0.00000  test    mintime= 0.000046
                 avx_ChirpData_b 0.000052 0.00000  test    mintime= 0.000051
                 avx_ChirpData_c 0.000047 0.00000  test    mintime= 0.000046
                 avx_ChirpData_d 0.000043 0.00000  test    mintime= 0.000043
                 avx_ChirpData_e 0.000048 0.00000  test    mintime= 0.000047
                 avx_ChirpData_f 0.000050 0.00000  test    mintime= 0.000049
                 avx_ChirpData_g 0.000051 0.00000  test    mintime= 0.000051
                 avx_ChirpData_h 0.000062 0.00000  test    mintime= 0.000061
                 avx_ChirpData_i 0.000051 0.00000  test    mintime= 0.000050
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000043 0.00000  choice

                   Test duration     3.92 seconds

Ftst_v7 completed successfully.

Claggy

Offline Josef W. Segur

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 3112
Re: AVX Optimized App Development
« Reply #153 on: 05 Jun 2012, 03:10:36 pm »
The J55 test was built with GCC 4.5.1, I'm attaching J55b built with GCC 4.6.1 to see if there's any significant difference. If you have time to run both in order for the environment to be as similar as possible, that would be best. All functions may be affected, not just those targeting Bulldozer or Sandy Bridge.

One of the particular puzzles is why avx_fma4_ChirpData_a seems to be faster than avx_fma4_ChirpData_d4, the 4.5.1 build seemed not to optimize the instruction ordering of the d subvariants as well, but the CPU out of order execution capabilities ought to have been sufficient to handle it. These routines necessarily have serious dependency chain problems so there isn't a lot of room for reordering anyhow.
                                       Joe

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #154 on: 05 Jun 2012, 03:25:26 pm »
FX-4100
BOINC Idle

=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.051829 0.00000  test    mintime= 0.051639
                   fpu_ChirpData 0.017697 0.00000  test    mintime= 0.017562
             sse1_ChirpData_ak8e 0.007256 0.00000  test    mintime= 0.007218
              sse2_ChirpData_ak8 0.004547 0.00000  test    mintime= 0.004528
              sse3_ChirpData_ak8 0.004486 0.00000  test    mintime= 0.004450
                 avx_ChirpData_a 0.003830 0.00000  test    mintime= 0.003812
                 avx_ChirpData_b 0.003889 0.00000  test    mintime= 0.003792
                 avx_ChirpData_c 0.004161 0.00000  test    mintime= 0.004119
                 avx_ChirpData_d 0.004023 0.00000  test    mintime= 0.003978
                 avx_ChirpData_e 0.003911 0.00000  test    mintime= 0.003853
                 avx_ChirpData_f 0.003730 0.00000  test    mintime= 0.003684
                 avx_ChirpData_g 0.003687 0.00000  test    mintime= 0.003626
                 avx_ChirpData_h 0.004389 0.00000  test    mintime= 0.004343
                 avx_ChirpData_i 0.003824 0.00000  test    mintime= 0.003775
            avx_fma4_ChirpData_a 0.003376 0.00000  test    mintime= 0.003330
           avx_fma4_ChirpData_d4 0.003397 0.00000  test    mintime= 0.003355
           avx_fma4_ChirpData_d6 0.003379 0.00000  test    mintime= 0.003348
           avx_fma4_ChirpData_d8 0.003397 0.00000  test    mintime= 0.003363
            avx_fma4_ChirpData_e 0.003773 0.00000  test    mintime= 0.003720
            avx_fma4_ChirpData_a 0.003376 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.006456 0.00000  test    mintime= 0.006373
                   fpu_ChirpData 0.002205 0.00000  test    mintime= 0.002167
             sse1_ChirpData_ak8e 0.000905 0.00000  test    mintime= 0.000891
              sse2_ChirpData_ak8 0.000577 0.00000  test    mintime= 0.000564
              sse3_ChirpData_ak8 0.000561 0.00000  test    mintime= 0.000550
                 avx_ChirpData_a 0.000482 0.00000  test    mintime= 0.000470
                 avx_ChirpData_b 0.000488 0.00000  test    mintime= 0.000478
                 avx_ChirpData_c 0.000515 0.00000  test    mintime= 0.000505
                 avx_ChirpData_d 0.000502 0.00000  test    mintime= 0.000493
                 avx_ChirpData_e 0.000480 0.00000  test    mintime= 0.000456
                 avx_ChirpData_f 0.000461 0.00000  test    mintime= 0.000453
                 avx_ChirpData_g 0.000455 0.00000  test    mintime= 0.000441
                 avx_ChirpData_h 0.000545 0.00000  test    mintime= 0.000531
                 avx_ChirpData_i 0.000462 0.00000  test    mintime= 0.000446
            avx_fma4_ChirpData_a 0.000419 0.00000  test    mintime= 0.000411
           avx_fma4_ChirpData_d4 0.000423 0.00000  test    mintime= 0.000415
           avx_fma4_ChirpData_d6 0.000421 0.00000  test    mintime= 0.000415
           avx_fma4_ChirpData_d8 0.000422 0.00000  test    mintime= 0.000414
            avx_fma4_ChirpData_e 0.000468 0.00000  test    mintime= 0.000457
            avx_fma4_ChirpData_a 0.000419 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001632 0.00000  test    mintime= 0.001590
                   fpu_ChirpData 0.000555 0.00000  test    mintime= 0.000539
             sse1_ChirpData_ak8e 0.000227 0.00000  test    mintime= 0.000222
              sse2_ChirpData_ak8 0.000145 0.00000  test    mintime= 0.000140
              sse3_ChirpData_ak8 0.000141 0.00000  test    mintime= 0.000137
                 avx_ChirpData_a 0.000120 0.00000  test    mintime= 0.000117
                 avx_ChirpData_b 0.000119 0.00000  test    mintime= 0.000116
                 avx_ChirpData_c 0.000129 0.00000  test    mintime= 0.000126
                 avx_ChirpData_d 0.000127 0.00000  test    mintime= 0.000123
                 avx_ChirpData_e 0.000120 0.00000  test    mintime= 0.000114
                 avx_ChirpData_f 0.000117 0.00000  test    mintime= 0.000113
                 avx_ChirpData_g 0.000114 0.00000  test    mintime= 0.000110
                 avx_ChirpData_h 0.000137 0.00000  test    mintime= 0.000133
                 avx_ChirpData_i 0.000115 0.00000  test    mintime= 0.000111
            avx_fma4_ChirpData_a 0.000105 0.00000  test    mintime= 0.000103
           avx_fma4_ChirpData_d4 0.000107 0.00000  test    mintime= 0.000104
           avx_fma4_ChirpData_d6 0.000106 0.00000  test    mintime= 0.000104
           avx_fma4_ChirpData_d8 0.000106 0.00000  test    mintime= 0.000104
            avx_fma4_ChirpData_e 0.000117 0.00000  test    mintime= 0.000114
            avx_fma4_ChirpData_a 0.000105 0.00000  choice

                   Test duration     7.39 seconds

Ftst_v7 completed successfully.

=========================================================
Ftst_v7_J55b_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.052452 0.00000  test    mintime= 0.052096
                   fpu_ChirpData 0.018704 0.00000  test    mintime= 0.017854
             sse1_ChirpData_ak8e 0.007731 0.00000  test    mintime= 0.007256
              sse2_ChirpData_ak8 0.004579 0.00000  test    mintime= 0.004497
              sse3_ChirpData_ak8 0.004591 0.00000  test    mintime= 0.004549
                 avx_ChirpData_a 0.004131 0.00000  test    mintime= 0.003764
                 avx_ChirpData_b 0.004169 0.00000  test    mintime= 0.003948
                 avx_ChirpData_c 0.004434 0.00000  test    mintime= 0.003979
                 avx_ChirpData_d 0.004127 0.00000  test    mintime= 0.003956
                 avx_ChirpData_e 0.004005 0.00000  test    mintime= 0.003870
                 avx_ChirpData_f 0.003865 0.00000  test    mintime= 0.003655
                 avx_ChirpData_g 0.004126 0.00000  test    mintime= 0.003680
                 avx_ChirpData_h 0.004696 0.00000  test    mintime= 0.004399
                 avx_ChirpData_i 0.004318 0.00000  test    mintime= 0.003751
            avx_fma4_ChirpData_a 0.003619 0.00000  test    mintime= 0.003408
           avx_fma4_ChirpData_d4 0.003713 0.00000  test    mintime= 0.003264
           avx_fma4_ChirpData_d6 0.004176 0.00000  test    mintime= 0.003271
           avx_fma4_ChirpData_d8 0.003497 0.00000  test    mintime= 0.003206
            avx_fma4_ChirpData_e 0.003928 0.00000  test    mintime= 0.003882
           avx_fma4_ChirpData_d8 0.003497 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.006478 0.00000  test    mintime= 0.006380
                   fpu_ChirpData 0.002202 0.00000  test    mintime= 0.002172
             sse1_ChirpData_ak8e 0.000925 0.00000  test    mintime= 0.000902
              sse2_ChirpData_ak8 0.000579 0.00000  test    mintime= 0.000565
              sse3_ChirpData_ak8 0.000575 0.00000  test    mintime= 0.000565
                 avx_ChirpData_a 0.000478 0.00000  test    mintime= 0.000466
                 avx_ChirpData_b 0.000499 0.00000  test    mintime= 0.000487
                 avx_ChirpData_c 0.000498 0.00000  test    mintime= 0.000482
                 avx_ChirpData_d 0.000501 0.00000  test    mintime= 0.000490
                 avx_ChirpData_e 0.000482 0.00000  test    mintime= 0.000458
                 avx_ChirpData_f 0.000464 0.00000  test    mintime= 0.000453
                 avx_ChirpData_g 0.000452 0.00000  test    mintime= 0.000442
                 avx_ChirpData_h 0.000554 0.00000  test    mintime= 0.000542
                 avx_ChirpData_i 0.000459 0.00000  test    mintime= 0.000446
            avx_fma4_ChirpData_a 0.000431 0.00000  test    mintime= 0.000423
           avx_fma4_ChirpData_d4 0.000408 0.00000  test    mintime= 0.000399
           avx_fma4_ChirpData_d6 0.000406 0.00000  test    mintime= 0.000398
           avx_fma4_ChirpData_d8 0.000417 0.00000  test    mintime= 0.000398
            avx_fma4_ChirpData_e 0.000493 0.00000  test    mintime= 0.000478
           avx_fma4_ChirpData_d6 0.000406 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001623 0.00000  test    mintime= 0.001589
                   fpu_ChirpData 0.000556 0.00000  test    mintime= 0.000544
             sse1_ChirpData_ak8e 0.000228 0.00000  test    mintime= 0.000222
              sse2_ChirpData_ak8 0.000146 0.00000  test    mintime= 0.000139
              sse3_ChirpData_ak8 0.000144 0.00000  test    mintime= 0.000141
                 avx_ChirpData_a 0.000118 0.00000  test    mintime= 0.000116
                 avx_ChirpData_b 0.000126 0.00000  test    mintime= 0.000122
                 avx_ChirpData_c 0.000123 0.00000  test    mintime= 0.000121
                 avx_ChirpData_d 0.000124 0.00000  test    mintime= 0.000122
                 avx_ChirpData_e 0.000117 0.00000  test    mintime= 0.000114
                 avx_ChirpData_f 0.000115 0.00000  test    mintime= 0.000113
                 avx_ChirpData_g 0.000118 0.00000  test    mintime= 0.000110
                 avx_ChirpData_h 0.000136 0.00000  test    mintime= 0.000133
                 avx_ChirpData_i 0.000114 0.00000  test    mintime= 0.000111
            avx_fma4_ChirpData_a 0.000108 0.00000  test    mintime= 0.000106
           avx_fma4_ChirpData_d4 0.000102 0.00000  test    mintime= 0.000099
           avx_fma4_ChirpData_d6 0.000101 0.00000  test    mintime= 0.000099
           avx_fma4_ChirpData_d8 0.000101 0.00000  test    mintime= 0.000099
            avx_fma4_ChirpData_e 0.000122 0.00000  test    mintime= 0.000119
           avx_fma4_ChirpData_d6 0.000101 0.00000  choice

                   Test duration     7.50 seconds

Ftst_v7 completed successfully.

Offline Claggy

  • Alpha Tester
  • Knight who says 'Ni!'
  • ***
  • Posts: 3111
    • My computers at Seti Beta
Re: AVX Optimized App Development
« Reply #155 on: 05 Jun 2012, 03:35:10 pm »
C2D T8100 @2.1GHz (Boinc running one r558 AP task and one Gamma ray pulser search task, GPU suspended):

=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.098244 0.00000  test    mintime= 0.095730
                   fpu_ChirpData 0.028331 0.00000  test    mintime= 0.027983
             sse1_ChirpData_ak8e 0.010573 0.00000  test    mintime= 0.010517
              sse2_ChirpData_ak8 0.009111 0.00000  test    mintime= 0.008991
              sse3_ChirpData_ak8 0.008971 0.00000  test    mintime= 0.008843
                 avx_ChirpData_a not supported by system
                 avx_ChirpData_b not supported by system
                 avx_ChirpData_c not supported by system
                 avx_ChirpData_d not supported by system
                 avx_ChirpData_e not supported by system
                 avx_ChirpData_f not supported by system
                 avx_ChirpData_g not supported by system
                 avx_ChirpData_h not supported by system
                 avx_ChirpData_i not supported by system
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
              sse3_ChirpData_ak8 0.008971 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.012057 0.00000  test    mintime= 0.011873
                   fpu_ChirpData 0.003536 0.00000  test    mintime= 0.003484
             sse1_ChirpData_ak8e 0.001318 0.00000  test    mintime= 0.001299
              sse2_ChirpData_ak8 0.001131 0.00000  test    mintime= 0.001103
              sse3_ChirpData_ak8 0.001104 0.00000  test    mintime= 0.001083
                 avx_ChirpData_a not supported by system
                 avx_ChirpData_b not supported by system
                 avx_ChirpData_c not supported by system
                 avx_ChirpData_d not supported by system
                 avx_ChirpData_e not supported by system
                 avx_ChirpData_f not supported by system
                 avx_ChirpData_g not supported by system
                 avx_ChirpData_h not supported by system
                 avx_ChirpData_i not supported by system
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
              sse3_ChirpData_ak8 0.001104 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.003022 0.00000  test    mintime= 0.002962
                   fpu_ChirpData 0.000889 0.00000  test    mintime= 0.000873
             sse1_ChirpData_ak8e 0.000331 0.00000  test    mintime= 0.000326
              sse2_ChirpData_ak8 0.000284 0.00000  test    mintime= 0.000276
              sse3_ChirpData_ak8 0.000280 0.00000  test    mintime= 0.000273
                 avx_ChirpData_a not supported by system
                 avx_ChirpData_b not supported by system
                 avx_ChirpData_c not supported by system
                 avx_ChirpData_d not supported by system
                 avx_ChirpData_e not supported by system
                 avx_ChirpData_f not supported by system
                 avx_ChirpData_g not supported by system
                 avx_ChirpData_h not supported by system
                 avx_ChirpData_i not supported by system
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
              sse3_ChirpData_ak8 0.000280 0.00000  choice

                   Test duration     6.89 seconds

Ftst_v7 completed successfully.
=========================================================
Ftst_v7_J55b_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.096639 0.00000  test    mintime= 0.092699
                   fpu_ChirpData 0.029507 0.00000  test    mintime= 0.028389
             sse1_ChirpData_ak8e 0.010509 0.00000  test    mintime= 0.010354
              sse2_ChirpData_ak8 0.008984 0.00000  test    mintime= 0.008870
              sse3_ChirpData_ak8 0.009992 0.00000  test    mintime= 0.008673
                 avx_ChirpData_a not supported by system
                 avx_ChirpData_b not supported by system
                 avx_ChirpData_c not supported by system
                 avx_ChirpData_d not supported by system
                 avx_ChirpData_e not supported by system
                 avx_ChirpData_f not supported by system
                 avx_ChirpData_g not supported by system
                 avx_ChirpData_h not supported by system
                 avx_ChirpData_i not supported by system
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
              sse2_ChirpData_ak8 0.008984 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.011834 0.00000  test    mintime= 0.011402
                   fpu_ChirpData 0.003601 0.00000  test    mintime= 0.003493
             sse1_ChirpData_ak8e 0.001338 0.00000  test    mintime= 0.001299
              sse2_ChirpData_ak8 0.001167 0.00000  test    mintime= 0.001099
              sse3_ChirpData_ak8 0.001105 0.00000  test    mintime= 0.001076
                 avx_ChirpData_a not supported by system
                 avx_ChirpData_b not supported by system
                 avx_ChirpData_c not supported by system
                 avx_ChirpData_d not supported by system
                 avx_ChirpData_e not supported by system
                 avx_ChirpData_f not supported by system
                 avx_ChirpData_g not supported by system
                 avx_ChirpData_h not supported by system
                 avx_ChirpData_i not supported by system
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
              sse3_ChirpData_ak8 0.001105 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.003111 0.00000  test    mintime= 0.002848
                   fpu_ChirpData 0.000928 0.00000  test    mintime= 0.000882
             sse1_ChirpData_ak8e 0.000332 0.00000  test    mintime= 0.000325
              sse2_ChirpData_ak8 0.000290 0.00000  test    mintime= 0.000276
              sse3_ChirpData_ak8 0.000278 0.00000  test    mintime= 0.000271
                 avx_ChirpData_a not supported by system
                 avx_ChirpData_b not supported by system
                 avx_ChirpData_c not supported by system
                 avx_ChirpData_d not supported by system
                 avx_ChirpData_e not supported by system
                 avx_ChirpData_f not supported by system
                 avx_ChirpData_g not supported by system
                 avx_ChirpData_h not supported by system
                 avx_ChirpData_i not supported by system
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
              sse3_ChirpData_ak8 0.000278 0.00000  choice

                   Test duration     6.96 seconds

Ftst_v7 completed successfully.
=========================================================

C2D T8100 @2.1GHz (Boinc Suspended):

=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.096623 0.00000  test    mintime= 0.095687
                   fpu_ChirpData 0.028555 0.00000  test    mintime= 0.028089
             sse1_ChirpData_ak8e 0.010543 0.00000  test    mintime= 0.010455
              sse2_ChirpData_ak8 0.008989 0.00000  test    mintime= 0.008898
              sse3_ChirpData_ak8 0.008841 0.00000  test    mintime= 0.008742
                 avx_ChirpData_a not supported by system
                 avx_ChirpData_b not supported by system
                 avx_ChirpData_c not supported by system
                 avx_ChirpData_d not supported by system
                 avx_ChirpData_e not supported by system
                 avx_ChirpData_f not supported by system
                 avx_ChirpData_g not supported by system
                 avx_ChirpData_h not supported by system
                 avx_ChirpData_i not supported by system
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
              sse3_ChirpData_ak8 0.008841 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.012088 0.00000  test    mintime= 0.011913
                   fpu_ChirpData 0.003532 0.00000  test    mintime= 0.003492
             sse1_ChirpData_ak8e 0.001320 0.00000  test    mintime= 0.001302
              sse2_ChirpData_ak8 0.001126 0.00000  test    mintime= 0.001097
              sse3_ChirpData_ak8 0.001097 0.00000  test    mintime= 0.001085
                 avx_ChirpData_a not supported by system
                 avx_ChirpData_b not supported by system
                 avx_ChirpData_c not supported by system
                 avx_ChirpData_d not supported by system
                 avx_ChirpData_e not supported by system
                 avx_ChirpData_f not supported by system
                 avx_ChirpData_g not supported by system
                 avx_ChirpData_h not supported by system
                 avx_ChirpData_i not supported by system
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
              sse3_ChirpData_ak8 0.001097 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.003020 0.00000  test    mintime= 0.002975
                   fpu_ChirpData 0.000886 0.00000  test    mintime= 0.000874
             sse1_ChirpData_ak8e 0.000332 0.00000  test    mintime= 0.000327
              sse2_ChirpData_ak8 0.000285 0.00000  test    mintime= 0.000276
              sse3_ChirpData_ak8 0.000278 0.00000  test    mintime= 0.000273
                 avx_ChirpData_a not supported by system
                 avx_ChirpData_b not supported by system
                 avx_ChirpData_c not supported by system
                 avx_ChirpData_d not supported by system
                 avx_ChirpData_e not supported by system
                 avx_ChirpData_f not supported by system
                 avx_ChirpData_g not supported by system
                 avx_ChirpData_h not supported by system
                 avx_ChirpData_i not supported by system
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
              sse3_ChirpData_ak8 0.000278 0.00000  choice

                   Test duration     6.59 seconds

Ftst_v7 completed successfully.
=========================================================
Ftst_v7_J55b_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.092560 0.00000  test    mintime= 0.091904
                   fpu_ChirpData 0.028532 0.00000  test    mintime= 0.028326
             sse1_ChirpData_ak8e 0.010434 0.00000  test    mintime= 0.010371
              sse2_ChirpData_ak8 0.009024 0.00000  test    mintime= 0.008878
              sse3_ChirpData_ak8 0.008772 0.00000  test    mintime= 0.008631
                 avx_ChirpData_a not supported by system
                 avx_ChirpData_b not supported by system
                 avx_ChirpData_c not supported by system
                 avx_ChirpData_d not supported by system
                 avx_ChirpData_e not supported by system
                 avx_ChirpData_f not supported by system
                 avx_ChirpData_g not supported by system
                 avx_ChirpData_h not supported by system
                 avx_ChirpData_i not supported by system
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
              sse3_ChirpData_ak8 0.008772 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.011550 0.00000  test    mintime= 0.011407
                   fpu_ChirpData 0.003527 0.00000  test    mintime= 0.003495
             sse1_ChirpData_ak8e 0.001316 0.00000  test    mintime= 0.001298
              sse2_ChirpData_ak8 0.001129 0.00000  test    mintime= 0.001100
              sse3_ChirpData_ak8 0.001092 0.00000  test    mintime= 0.001077
                 avx_ChirpData_a not supported by system
                 avx_ChirpData_b not supported by system
                 avx_ChirpData_c not supported by system
                 avx_ChirpData_d not supported by system
                 avx_ChirpData_e not supported by system
                 avx_ChirpData_f not supported by system
                 avx_ChirpData_g not supported by system
                 avx_ChirpData_h not supported by system
                 avx_ChirpData_i not supported by system
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
              sse3_ChirpData_ak8 0.001092 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.002888 0.00000  test    mintime= 0.002849
                   fpu_ChirpData 0.000894 0.00000  test    mintime= 0.000883
             sse1_ChirpData_ak8e 0.000329 0.00000  test    mintime= 0.000323
              sse2_ChirpData_ak8 0.000285 0.00000  test    mintime= 0.000276
              sse3_ChirpData_ak8 0.000280 0.00000  test    mintime= 0.000271
                 avx_ChirpData_a not supported by system
                 avx_ChirpData_b not supported by system
                 avx_ChirpData_c not supported by system
                 avx_ChirpData_d not supported by system
                 avx_ChirpData_e not supported by system
                 avx_ChirpData_f not supported by system
                 avx_ChirpData_g not supported by system
                 avx_ChirpData_h not supported by system
                 avx_ChirpData_i not supported by system
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
              sse3_ChirpData_ak8 0.000280 0.00000  choice

                   Test duration     6.46 seconds

Ftst_v7 completed successfully.

Claggy

Offline KarVi

  • Alpha Tester
  • Knight Templar
  • ***
  • Posts: 252
Re: AVX Optimized App Development
« Reply #156 on: 05 Jun 2012, 03:50:20 pm »
FX8150@4,5

J55 & J55B run right after another.

J55B seems faster. At least for the function chosen.

=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.041397 0.00000  test    mintime= 0.041338
                   fpu_ChirpData 0.014045 0.00000  test    mintime= 0.014030
             sse1_ChirpData_ak8e 0.005757 0.00000  test    mintime= 0.005739
              sse2_ChirpData_ak8 0.003674 0.00000  test    mintime= 0.003653
              sse3_ChirpData_ak8 0.003617 0.00000  test    mintime= 0.003598
                 avx_ChirpData_a 0.003087 0.00000  test    mintime= 0.003052
                 avx_ChirpData_b 0.003056 0.00000  test    mintime= 0.003048
                 avx_ChirpData_c 0.003311 0.00000  test    mintime= 0.003298
                 avx_ChirpData_d 0.003241 0.00000  test    mintime= 0.003222
                 avx_ChirpData_e 0.003149 0.00000  test    mintime= 0.003139
                 avx_ChirpData_f 0.002986 0.00000  test    mintime= 0.002968
                 avx_ChirpData_g 0.002919 0.00000  test    mintime= 0.002893
                 avx_ChirpData_h 0.003529 0.00000  test    mintime= 0.003510
                 avx_ChirpData_i 0.003143 0.00000  test    mintime= 0.003078
            avx_fma4_ChirpData_a 0.002718 0.00000  test    mintime= 0.002693
           avx_fma4_ChirpData_d4 0.002741 0.00000  test    mintime= 0.002731
           avx_fma4_ChirpData_d6 0.002713 0.00000  test    mintime= 0.002688
           avx_fma4_ChirpData_d8 0.002703 0.00000  test    mintime= 0.002682
            avx_fma4_ChirpData_e 0.003032 0.00000  test    mintime= 0.003009
           avx_fma4_ChirpData_d8 0.002703 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.005124 0.00000  test    mintime= 0.005082
                   fpu_ChirpData 0.001754 0.00000  test    mintime= 0.001735
             sse1_ChirpData_ak8e 0.000720 0.00000  test    mintime= 0.000703
              sse2_ChirpData_ak8 0.000464 0.00000  test    mintime= 0.000451
              sse3_ChirpData_ak8 0.000455 0.00000  test    mintime= 0.000442
                 avx_ChirpData_a 0.000389 0.00000  test    mintime= 0.000376
                 avx_ChirpData_b 0.000385 0.00000  test    mintime= 0.000372
                 avx_ChirpData_c 0.000415 0.00000  test    mintime= 0.000404
                 avx_ChirpData_d 0.000407 0.00000  test    mintime= 0.000394
                 avx_ChirpData_e 0.000392 0.00000  test    mintime= 0.000366
                 avx_ChirpData_f 0.000376 0.00000  test    mintime= 0.000363
                 avx_ChirpData_g 0.000369 0.00000  test    mintime= 0.000353
                 avx_ChirpData_h 0.000445 0.00000  test    mintime= 0.000430
                 avx_ChirpData_i 0.000383 0.00000  test    mintime= 0.000365
            avx_fma4_ChirpData_a 0.000345 0.00000  test    mintime= 0.000332
           avx_fma4_ChirpData_d4 0.000348 0.00000  test    mintime= 0.000335
           avx_fma4_ChirpData_d6 0.000341 0.00000  test    mintime= 0.000332
           avx_fma4_ChirpData_d8 0.000339 0.00000  test    mintime= 0.000331
            avx_fma4_ChirpData_e 0.000388 0.00000  test    mintime= 0.000370
           avx_fma4_ChirpData_d8 0.000339 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001281 0.00000  test    mintime= 0.001267
                   fpu_ChirpData 0.000438 0.00000  test    mintime= 0.000428
             sse1_ChirpData_ak8e 0.000180 0.00000  test    mintime= 0.000174
              sse2_ChirpData_ak8 0.000116 0.00000  test    mintime= 0.000112
              sse3_ChirpData_ak8 0.000114 0.00000  test    mintime= 0.000110
                 avx_ChirpData_a 0.000097 0.00000  test    mintime= 0.000094
                 avx_ChirpData_b 0.000097 0.00000  test    mintime= 0.000093
                 avx_ChirpData_c 0.000104 0.00000  test    mintime= 0.000101
                 avx_ChirpData_d 0.000102 0.00000  test    mintime= 0.000098
                 avx_ChirpData_e 0.000096 0.00000  test    mintime= 0.000091
                 avx_ChirpData_f 0.000094 0.00000  test    mintime= 0.000090
                 avx_ChirpData_g 0.000092 0.00000  test    mintime= 0.000088
                 avx_ChirpData_h 0.000111 0.00000  test    mintime= 0.000107
                 avx_ChirpData_i 0.000095 0.00000  test    mintime= 0.000090
            avx_fma4_ChirpData_a 0.000086 0.00000  test    mintime= 0.000083
           avx_fma4_ChirpData_d4 0.000087 0.00000  test    mintime= 0.000083
           avx_fma4_ChirpData_d6 0.000085 0.00000  test    mintime= 0.000083
           avx_fma4_ChirpData_d8 0.000085 0.00000  test    mintime= 0.000083
            avx_fma4_ChirpData_e 0.000097 0.00000  test    mintime= 0.000092
           avx_fma4_ChirpData_d8 0.000085 0.00000  choice

                   Test duration     5.92 seconds

Ftst_v7 completed successfully.
=========================================================
Ftst_v7_J55b_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.041428 0.00000  test    mintime= 0.041376
                   fpu_ChirpData 0.014215 0.00000  test    mintime= 0.014206
             sse1_ChirpData_ak8e 0.005859 0.00000  test    mintime= 0.005808
              sse2_ChirpData_ak8 0.003686 0.00000  test    mintime= 0.003662
              sse3_ChirpData_ak8 0.003701 0.00000  test    mintime= 0.003684
                 avx_ChirpData_a 0.003048 0.00000  test    mintime= 0.003044
                 avx_ChirpData_b 0.003202 0.00000  test    mintime= 0.003189
                 avx_ChirpData_c 0.003214 0.00000  test    mintime= 0.003197
                 avx_ChirpData_d 0.003213 0.00000  test    mintime= 0.003196
                 avx_ChirpData_e 0.003146 0.00000  test    mintime= 0.003133
                 avx_ChirpData_f 0.002981 0.00000  test    mintime= 0.002969
                 avx_ChirpData_g 0.002924 0.00000  test    mintime= 0.002918
                 avx_ChirpData_h 0.003584 0.00000  test    mintime= 0.003552
                 avx_ChirpData_i 0.003092 0.00000  test    mintime= 0.003069
            avx_fma4_ChirpData_a 0.002813 0.00000  test    mintime= 0.002793
           avx_fma4_ChirpData_d4 0.002635 0.00000  test    mintime= 0.002621
           avx_fma4_ChirpData_d6 0.002613 0.00000  test    mintime= 0.002598
           avx_fma4_ChirpData_d8 0.002599 0.00000  test    mintime= 0.002583
            avx_fma4_ChirpData_e 0.003199 0.00000  test    mintime= 0.003187
           avx_fma4_ChirpData_d8 0.002599 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.005148 0.00000  test    mintime= 0.005099
                   fpu_ChirpData 0.001758 0.00000  test    mintime= 0.001728
             sse1_ChirpData_ak8e 0.000747 0.00000  test    mintime= 0.000720
              sse2_ChirpData_ak8 0.000469 0.00000  test    mintime= 0.000449
              sse3_ChirpData_ak8 0.000468 0.00000  test    mintime= 0.000454
                 avx_ChirpData_a 0.000385 0.00000  test    mintime= 0.000374
                 avx_ChirpData_b 0.000403 0.00000  test    mintime= 0.000390
                 avx_ChirpData_c 0.000404 0.00000  test    mintime= 0.000393
                 avx_ChirpData_d 0.000406 0.00000  test    mintime= 0.000393
                 avx_ChirpData_e 0.000392 0.00000  test    mintime= 0.000367
                 avx_ChirpData_f 0.000377 0.00000  test    mintime= 0.000363
                 avx_ChirpData_g 0.000370 0.00000  test    mintime= 0.000356
                 avx_ChirpData_h 0.000453 0.00000  test    mintime= 0.000440
                 avx_ChirpData_i 0.000386 0.00000  test    mintime= 0.000365
            avx_fma4_ChirpData_a 0.000354 0.00000  test    mintime= 0.000341
           avx_fma4_ChirpData_d4 0.000337 0.00000  test    mintime= 0.000324
           avx_fma4_ChirpData_d6 0.000330 0.00000  test    mintime= 0.000320
           avx_fma4_ChirpData_d8 0.000328 0.00000  test    mintime= 0.000318
            avx_fma4_ChirpData_e 0.000408 0.00000  test    mintime= 0.000394
           avx_fma4_ChirpData_d8 0.000328 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001282 0.00000  test    mintime= 0.001267
                   fpu_ChirpData 0.000445 0.00000  test    mintime= 0.000435
             sse1_ChirpData_ak8e 0.000184 0.00000  test    mintime= 0.000176
              sse2_ChirpData_ak8 0.000118 0.00000  test    mintime= 0.000111
              sse3_ChirpData_ak8 0.000117 0.00000  test    mintime= 0.000113
                 avx_ChirpData_a 0.000096 0.00000  test    mintime= 0.000093
                 avx_ChirpData_b 0.000101 0.00000  test    mintime= 0.000097
                 avx_ChirpData_c 0.000101 0.00000  test    mintime= 0.000098
                 avx_ChirpData_d 0.000101 0.00000  test    mintime= 0.000098
                 avx_ChirpData_e 0.000096 0.00000  test    mintime= 0.000091
                 avx_ChirpData_f 0.000094 0.00000  test    mintime= 0.000090
                 avx_ChirpData_g 0.000092 0.00000  test    mintime= 0.000088
                 avx_ChirpData_h 0.000111 0.00000  test    mintime= 0.000107
                 avx_ChirpData_i 0.000095 0.00000  test    mintime= 0.000090
            avx_fma4_ChirpData_a 0.000089 0.00000  test    mintime= 0.000085
           avx_fma4_ChirpData_d4 0.000084 0.00000  test    mintime= 0.000080
           avx_fma4_ChirpData_d6 0.000084 0.00000  test    mintime= 0.000079
           avx_fma4_ChirpData_d8 0.000082 0.00000  test    mintime= 0.000079
            avx_fma4_ChirpData_e 0.000102 0.00000  test    mintime= 0.000096
           avx_fma4_ChirpData_d8 0.000082 0.00000  choice

                   Test duration     5.93 seconds

Ftst_v7 completed successfully.
A smile is the shortest distance between two peoble (Victor Borge).

Offline Claggy

  • Alpha Tester
  • Knight who says 'Ni!'
  • ***
  • Posts: 3111
    • My computers at Seti Beta
Re: AVX Optimized App Development
« Reply #157 on: 05 Jun 2012, 03:50:31 pm »
i7-2600K @4.7GHz (Boinc running):

=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.047451 0.00000  test    mintime= 0.046845
                   fpu_ChirpData 0.014815 0.00000  test    mintime= 0.014451
             sse1_ChirpData_ak8e 0.005853 0.00000  test    mintime= 0.005698
              sse2_ChirpData_ak8 0.004979 0.00000  test    mintime= 0.004540
              sse3_ChirpData_ak8 0.004948 0.00000  test    mintime= 0.004414
                 avx_ChirpData_a 0.002642 0.00000  test    mintime= 0.002258
                 avx_ChirpData_b 0.002542 0.00000  test    mintime= 0.002408
                 avx_ChirpData_c 0.002515 0.00000  test    mintime= 0.002437
                 avx_ChirpData_d 0.002440 0.00000  test    mintime= 0.002135
                 avx_ChirpData_e 0.002399 0.00000  test    mintime= 0.002115
                 avx_ChirpData_f 0.002568 0.00000  test    mintime= 0.002399
                 avx_ChirpData_g 0.002511 0.00000  test    mintime= 0.002384
                 avx_ChirpData_h 0.003148 0.00000  test    mintime= 0.002999
                 avx_ChirpData_i 0.002641 0.00000  test    mintime= 0.002399
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.002399 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.005898 0.00000  test    mintime= 0.005745
                   fpu_ChirpData 0.001973 0.00000  test    mintime= 0.001775
             sse1_ChirpData_ak8e 0.000767 0.00000  test    mintime= 0.000690
              sse2_ChirpData_ak8 0.000591 0.00000  test    mintime= 0.000532
              sse3_ChirpData_ak8 0.000589 0.00000  test    mintime= 0.000555
                 avx_ChirpData_a 0.000309 0.00000  test    mintime= 0.000267
                 avx_ChirpData_b 0.000317 0.00000  test    mintime= 0.000291
                 avx_ChirpData_c 0.000309 0.00000  test    mintime= 0.000289
                 avx_ChirpData_d 0.000291 0.00000  test    mintime= 0.000267
                 avx_ChirpData_e 0.000300 0.00000  test    mintime= 0.000255
                 avx_ChirpData_f 0.000314 0.00000  test    mintime= 0.000263
                 avx_ChirpData_g 0.000300 0.00000  test    mintime= 0.000282
                 avx_ChirpData_h 0.000350 0.00000  test    mintime= 0.000330
                 avx_ChirpData_i 0.000319 0.00000  test    mintime= 0.000284
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000291 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001485 0.00000  test    mintime= 0.001413
                   fpu_ChirpData 0.000482 0.00000  test    mintime= 0.000433
             sse1_ChirpData_ak8e 0.000183 0.00000  test    mintime= 0.000161
              sse2_ChirpData_ak8 0.000140 0.00000  test    mintime= 0.000135
              sse3_ChirpData_ak8 0.000136 0.00000  test    mintime= 0.000132
                 avx_ChirpData_a 0.000074 0.00000  test    mintime= 0.000069
                 avx_ChirpData_b 0.000075 0.00000  test    mintime= 0.000070
                 avx_ChirpData_c 0.000084 0.00000  test    mintime= 0.000070
                 avx_ChirpData_d 0.000069 0.00000  test    mintime= 0.000063
                 avx_ChirpData_e 0.000077 0.00000  test    mintime= 0.000066
                 avx_ChirpData_f 0.000076 0.00000  test    mintime= 0.000069
                 avx_ChirpData_g 0.000078 0.00000  test    mintime= 0.000069
                 avx_ChirpData_h 0.000099 0.00000  test    mintime= 0.000082
                 avx_ChirpData_i 0.000090 0.00000  test    mintime= 0.000070
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000069 0.00000  choice

                   Test duration     5.19 seconds

Ftst_v7 completed successfully.
=========================================================
Ftst_v7_J55b_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.054041 0.00000  test    mintime= 0.050972
                   fpu_ChirpData 0.017203 0.00000  test    mintime= 0.015304
             sse1_ChirpData_ak8e 0.006553 0.00000  test    mintime= 0.006175
              sse2_ChirpData_ak8 0.005535 0.00000  test    mintime= 0.005051
              sse3_ChirpData_ak8 0.005919 0.00000  test    mintime= 0.004259
                 avx_ChirpData_a 0.003052 0.00000  test    mintime= 0.002384
                 avx_ChirpData_b 0.002939 0.00000  test    mintime= 0.002507
                 avx_ChirpData_c 0.002462 0.00000  test    mintime= 0.002297
                 avx_ChirpData_d 0.002531 0.00000  test    mintime= 0.002170
                 avx_ChirpData_e 0.002873 0.00000  test    mintime= 0.002117
                 avx_ChirpData_f 0.002837 0.00000  test    mintime= 0.002500
                 avx_ChirpData_g 0.003056 0.00000  test    mintime= 0.002652
                 avx_ChirpData_h 0.003771 0.00000  test    mintime= 0.002864
                 avx_ChirpData_i 0.003058 0.00000  test    mintime= 0.002548
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_c 0.002462 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.005878 0.00000  test    mintime= 0.005697
                   fpu_ChirpData 0.001889 0.00000  test    mintime= 0.001762
             sse1_ChirpData_ak8e 0.000727 0.00000  test    mintime= 0.000707
              sse2_ChirpData_ak8 0.000573 0.00000  test    mintime= 0.000549
              sse3_ChirpData_ak8 0.000579 0.00000  test    mintime= 0.000538
                 avx_ChirpData_a 0.000326 0.00000  test    mintime= 0.000280
                 avx_ChirpData_b 0.000340 0.00000  test    mintime= 0.000290
                 avx_ChirpData_c 0.000314 0.00000  test    mintime= 0.000277
                 avx_ChirpData_d 0.000323 0.00000  test    mintime= 0.000267
                 avx_ChirpData_e 0.000317 0.00000  test    mintime= 0.000265
                 avx_ChirpData_f 0.000349 0.00000  test    mintime= 0.000267
                 avx_ChirpData_g 0.000351 0.00000  test    mintime= 0.000236
                 avx_ChirpData_h 0.000391 0.00000  test    mintime= 0.000330
                 avx_ChirpData_i 0.000360 0.00000  test    mintime= 0.000286
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_c 0.000314 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001654 0.00000  test    mintime= 0.001408
                   fpu_ChirpData 0.000548 0.00000  test    mintime= 0.000434
             sse1_ChirpData_ak8e 0.000209 0.00000  test    mintime= 0.000169
              sse2_ChirpData_ak8 0.000162 0.00000  test    mintime= 0.000130
              sse3_ChirpData_ak8 0.000193 0.00000  test    mintime= 0.000129
                 avx_ChirpData_a 0.000097 0.00000  test    mintime= 0.000066
                 avx_ChirpData_b 0.000091 0.00000  test    mintime= 0.000071
                 avx_ChirpData_c 0.000087 0.00000  test    mintime= 0.000068
                 avx_ChirpData_d 0.000084 0.00000  test    mintime= 0.000064
                 avx_ChirpData_e 0.000083 0.00000  test    mintime= 0.000062
                 avx_ChirpData_f 0.000094 0.00000  test    mintime= 0.000067
                 avx_ChirpData_g 0.000084 0.00000  test    mintime= 0.000066
                 avx_ChirpData_h 0.000120 0.00000  test    mintime= 0.000081
                 avx_ChirpData_i 0.000095 0.00000  test    mintime= 0.000069
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.000083 0.00000  choice

                   Test duration     5.73 seconds

Ftst_v7 completed successfully.
=========================================================

i7-2600K @4.7GHz (Boinc suspended):

=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.041483 0.00000  test    mintime= 0.041319
                   fpu_ChirpData 0.008740 0.00000  test    mintime= 0.008688
             sse1_ChirpData_ak8e 0.004215 0.00000  test    mintime= 0.004204
              sse2_ChirpData_ak8 0.003157 0.00000  test    mintime= 0.003142
              sse3_ChirpData_ak8 0.003004 0.00000  test    mintime= 0.002970
                 avx_ChirpData_a 0.001475 0.00000  test    mintime= 0.001471
                 avx_ChirpData_b 0.001646 0.00000  test    mintime= 0.001642
                 avx_ChirpData_c 0.001488 0.00000  test    mintime= 0.001483
                 avx_ChirpData_d 0.001381 0.00000  test    mintime= 0.001378
                 avx_ChirpData_e 0.001539 0.00000  test    mintime= 0.001533
                 avx_ChirpData_f 0.001590 0.00000  test    mintime= 0.001577
                 avx_ChirpData_g 0.001634 0.00000  test    mintime= 0.001630
                 avx_ChirpData_h 0.002023 0.00000  test    mintime= 0.002003
                 avx_ChirpData_i 0.001724 0.00000  test    mintime= 0.001708
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.001381 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.005173 0.00000  test    mintime= 0.005146
                   fpu_ChirpData 0.001093 0.00000  test    mintime= 0.001082
             sse1_ChirpData_ak8e 0.000530 0.00000  test    mintime= 0.000523
              sse2_ChirpData_ak8 0.000389 0.00000  test    mintime= 0.000385
              sse3_ChirpData_ak8 0.000357 0.00000  test    mintime= 0.000354
                 avx_ChirpData_a 0.000183 0.00000  test    mintime= 0.000182
                 avx_ChirpData_b 0.000202 0.00000  test    mintime= 0.000199
                 avx_ChirpData_c 0.000186 0.00000  test    mintime= 0.000184
                 avx_ChirpData_d 0.000172 0.00000  test    mintime= 0.000171
                 avx_ChirpData_e 0.000192 0.00000  test    mintime= 0.000191
                 avx_ChirpData_f 0.000198 0.00000  test    mintime= 0.000196
                 avx_ChirpData_g 0.000204 0.00000  test    mintime= 0.000203
                 avx_ChirpData_h 0.000249 0.00000  test    mintime= 0.000244
                 avx_ChirpData_i 0.000204 0.00000  test    mintime= 0.000201
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000172 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001295 0.00000  test    mintime= 0.001286
                   fpu_ChirpData 0.000272 0.00000  test    mintime= 0.000271
             sse1_ChirpData_ak8e 0.000132 0.00000  test    mintime= 0.000131
              sse2_ChirpData_ak8 0.000100 0.00000  test    mintime= 0.000096
              sse3_ChirpData_ak8 0.000094 0.00000  test    mintime= 0.000092
                 avx_ChirpData_a 0.000046 0.00000  test    mintime= 0.000046
                 avx_ChirpData_b 0.000052 0.00000  test    mintime= 0.000051
                 avx_ChirpData_c 0.000046 0.00000  test    mintime= 0.000046
                 avx_ChirpData_d 0.000043 0.00000  test    mintime= 0.000043
                 avx_ChirpData_e 0.000048 0.00000  test    mintime= 0.000047
                 avx_ChirpData_f 0.000050 0.00000  test    mintime= 0.000049
                 avx_ChirpData_g 0.000051 0.00000  test    mintime= 0.000051
                 avx_ChirpData_h 0.000063 0.00000  test    mintime= 0.000061
                 avx_ChirpData_i 0.000051 0.00000  test    mintime= 0.000050
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000043 0.00000  choice

                   Test duration     3.91 seconds

Ftst_v7 completed successfully.
=========================================================
Ftst_v7_J55b_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.042061 0.00000  test    mintime= 0.041816
                   fpu_ChirpData 0.008672 0.00000  test    mintime= 0.008649
             sse1_ChirpData_ak8e 0.004197 0.00000  test    mintime= 0.004188
              sse2_ChirpData_ak8 0.003140 0.00000  test    mintime= 0.003130
              sse3_ChirpData_ak8 0.002954 0.00000  test    mintime= 0.002916
                 avx_ChirpData_a 0.001466 0.00000  test    mintime= 0.001461
                 avx_ChirpData_b 0.001674 0.00000  test    mintime= 0.001668
                 avx_ChirpData_c 0.001460 0.00000  test    mintime= 0.001457
                 avx_ChirpData_d 0.001384 0.00000  test    mintime= 0.001373
                 avx_ChirpData_e 0.001540 0.00000  test    mintime= 0.001528
                 avx_ChirpData_f 0.001588 0.00000  test    mintime= 0.001572
                 avx_ChirpData_g 0.001635 0.00000  test    mintime= 0.001622
                 avx_ChirpData_h 0.002014 0.00000  test    mintime= 0.002000
                 avx_ChirpData_i 0.001710 0.00000  test    mintime= 0.001707
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.001384 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.005250 0.00000  test    mintime= 0.005216
                   fpu_ChirpData 0.001084 0.00000  test    mintime= 0.001073
             sse1_ChirpData_ak8e 0.000528 0.00000  test    mintime= 0.000523
              sse2_ChirpData_ak8 0.000394 0.00000  test    mintime= 0.000390
              sse3_ChirpData_ak8 0.000369 0.00000  test    mintime= 0.000365
                 avx_ChirpData_a 0.000183 0.00000  test    mintime= 0.000182
                 avx_ChirpData_b 0.000209 0.00000  test    mintime= 0.000207
                 avx_ChirpData_c 0.000183 0.00000  test    mintime= 0.000181
                 avx_ChirpData_d 0.000172 0.00000  test    mintime= 0.000170
                 avx_ChirpData_e 0.000191 0.00000  test    mintime= 0.000189
                 avx_ChirpData_f 0.000202 0.00000  test    mintime= 0.000195
                 avx_ChirpData_g 0.000202 0.00000  test    mintime= 0.000201
                 avx_ChirpData_h 0.000251 0.00000  test    mintime= 0.000246
                 avx_ChirpData_i 0.000205 0.00000  test    mintime= 0.000201
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000172 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001308 0.00000  test    mintime= 0.001303
                   fpu_ChirpData 0.000273 0.00000  test    mintime= 0.000268
             sse1_ChirpData_ak8e 0.000131 0.00000  test    mintime= 0.000130
              sse2_ChirpData_ak8 0.000098 0.00000  test    mintime= 0.000097
              sse3_ChirpData_ak8 0.000092 0.00000  test    mintime= 0.000090
                 avx_ChirpData_a 0.000046 0.00000  test    mintime= 0.000045
                 avx_ChirpData_b 0.000052 0.00000  test    mintime= 0.000052
                 avx_ChirpData_c 0.000046 0.00000  test    mintime= 0.000045
                 avx_ChirpData_d 0.000043 0.00000  test    mintime= 0.000042
                 avx_ChirpData_e 0.000049 0.00000  test    mintime= 0.000046
                 avx_ChirpData_f 0.000049 0.00000  test    mintime= 0.000047
                 avx_ChirpData_g 0.000051 0.00000  test    mintime= 0.000050
                 avx_ChirpData_h 0.000062 0.00000  test    mintime= 0.000060
                 avx_ChirpData_i 0.000050 0.00000  test    mintime= 0.000049
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000043 0.00000  choice

                   Test duration     3.93 seconds

Ftst_v7 completed successfully.

Claggy

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #158 on: 05 Jun 2012, 04:05:14 pm »
i3-2120
BOINC Idle
=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.059010 0.00000  test    mintime= 0.058863
                   fpu_ChirpData 0.012374 0.00000  test    mintime= 0.012352
             sse1_ChirpData_ak8e 0.005708 0.00000  test    mintime= 0.005699
              sse2_ChirpData_ak8 0.004178 0.00000  test    mintime= 0.004165
              sse3_ChirpData_ak8 0.004003 0.00000  test    mintime= 0.003996
                 avx_ChirpData_a 0.002079 0.00000  test    mintime= 0.002073
                 avx_ChirpData_b 0.002033 0.00000  test    mintime= 0.002031
                 avx_ChirpData_c 0.002100 0.00000  test    mintime= 0.002097
                 avx_ChirpData_d 0.001937 0.00000  test    mintime= 0.001931
                 avx_ChirpData_e 0.001925 0.00000  test    mintime= 0.001917
                 avx_ChirpData_f 0.002049 0.00000  test    mintime= 0.002045
                 avx_ChirpData_g 0.002070 0.00000  test    mintime= 0.002067
                 avx_ChirpData_h 0.003057 0.00000  test    mintime= 0.002754
                 avx_ChirpData_i 0.002221 0.00000  test    mintime= 0.002213
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.001925 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.007356 0.00000  test    mintime= 0.007338
                   fpu_ChirpData 0.001546 0.00000  test    mintime= 0.001540
             sse1_ChirpData_ak8e 0.000999 0.00000  test    mintime= 0.000712
              sse2_ChirpData_ak8 0.000790 0.00000  test    mintime= 0.000719
              sse3_ChirpData_ak8 0.000540 0.00000  test    mintime= 0.000498
                 avx_ChirpData_a 0.000260 0.00000  test    mintime= 0.000258
                 avx_ChirpData_b 0.000257 0.00000  test    mintime= 0.000253
                 avx_ChirpData_c 0.000263 0.00000  test    mintime= 0.000262
                 avx_ChirpData_d 0.000243 0.00000  test    mintime= 0.000240
                 avx_ChirpData_e 0.000272 0.00000  test    mintime= 0.000270
                 avx_ChirpData_f 0.000279 0.00000  test    mintime= 0.000270
                 avx_ChirpData_g 0.000278 0.00000  test    mintime= 0.000258
                 avx_ChirpData_h 0.000329 0.00000  test    mintime= 0.000322
                 avx_ChirpData_i 0.000272 0.00000  test    mintime= 0.000267
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000243 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001841 0.00000  test    mintime= 0.001834
                   fpu_ChirpData 0.000568 0.00000  test    mintime= 0.000385
             sse1_ChirpData_ak8e 0.000186 0.00000  test    mintime= 0.000184
              sse2_ChirpData_ak8 0.000139 0.00000  test    mintime= 0.000130
              sse3_ChirpData_ak8 0.000125 0.00000  test    mintime= 0.000124
                 avx_ChirpData_a 0.000065 0.00000  test    mintime= 0.000064
                 avx_ChirpData_b 0.000066 0.00000  test    mintime= 0.000063
                 avx_ChirpData_c 0.000066 0.00000  test    mintime= 0.000065
                 avx_ChirpData_d 0.000061 0.00000  test    mintime= 0.000060
                 avx_ChirpData_e 0.000060 0.00000  test    mintime= 0.000059
                 avx_ChirpData_f 0.000064 0.00000  test    mintime= 0.000063
                 avx_ChirpData_g 0.000065 0.00000  test    mintime= 0.000064
                 avx_ChirpData_h 0.000081 0.00000  test    mintime= 0.000079
                 avx_ChirpData_i 0.000065 0.00000  test    mintime= 0.000064
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.000060 0.00000  choice

                   Test duration     5.71 seconds

Ftst_v7 completed successfully.

=========================================================
Ftst_v7_J55b_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.059795 0.00000  test    mintime= 0.059657
                   fpu_ChirpData 0.012305 0.00000  test    mintime= 0.012282
             sse1_ChirpData_ak8e 0.005647 0.00000  test    mintime= 0.005621
              sse2_ChirpData_ak8 0.004166 0.00000  test    mintime= 0.004149
              sse3_ChirpData_ak8 0.003970 0.00000  test    mintime= 0.003961
                 avx_ChirpData_a 0.002058 0.00000  test    mintime= 0.002057
                 avx_ChirpData_b 0.002140 0.00000  test    mintime= 0.002136
                 avx_ChirpData_c 0.002060 0.00000  test    mintime= 0.002053
                 avx_ChirpData_d 0.001930 0.00000  test    mintime= 0.001926
                 avx_ChirpData_e 0.001920 0.00000  test    mintime= 0.001914
                 avx_ChirpData_f 0.002045 0.00000  test    mintime= 0.002035
                 avx_ChirpData_g 0.002084 0.00000  test    mintime= 0.002066
                 avx_ChirpData_h 0.002646 0.00000  test    mintime= 0.002640
                 avx_ChirpData_i 0.002205 0.00000  test    mintime= 0.002198
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.001920 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.007463 0.00000  test    mintime= 0.007437
                   fpu_ChirpData 0.001579 0.00000  test    mintime= 0.001523
             sse1_ChirpData_ak8e 0.000708 0.00000  test    mintime= 0.000706
              sse2_ChirpData_ak8 0.000546 0.00000  test    mintime= 0.000518
              sse3_ChirpData_ak8 0.000496 0.00000  test    mintime= 0.000494
                 avx_ChirpData_a 0.000258 0.00000  test    mintime= 0.000256
                 avx_ChirpData_b 0.000269 0.00000  test    mintime= 0.000267
                 avx_ChirpData_c 0.000257 0.00000  test    mintime= 0.000256
                 avx_ChirpData_d 0.000242 0.00000  test    mintime= 0.000240
                 avx_ChirpData_e 0.000241 0.00000  test    mintime= 0.000240
                 avx_ChirpData_f 0.000257 0.00000  test    mintime= 0.000255
                 avx_ChirpData_g 0.000260 0.00000  test    mintime= 0.000259
                 avx_ChirpData_h 0.000329 0.00000  test    mintime= 0.000322
                 avx_ChirpData_i 0.000271 0.00000  test    mintime= 0.000267
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.000241 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001862 0.00000  test    mintime= 0.001858
                   fpu_ChirpData 0.000384 0.00000  test    mintime= 0.000383
             sse1_ChirpData_ak8e 0.000176 0.00000  test    mintime= 0.000175
              sse2_ChirpData_ak8 0.000130 0.00000  test    mintime= 0.000129
              sse3_ChirpData_ak8 0.000124 0.00000  test    mintime= 0.000123
                 avx_ChirpData_a 0.000064 0.00000  test    mintime= 0.000064
                 avx_ChirpData_b 0.000067 0.00000  test    mintime= 0.000066
                 avx_ChirpData_c 0.000064 0.00000  test    mintime= 0.000064
                 avx_ChirpData_d 0.000060 0.00000  test    mintime= 0.000060
                 avx_ChirpData_e 0.000060 0.00000  test    mintime= 0.000059
                 avx_ChirpData_f 0.000064 0.00000  test    mintime= 0.000063
                 avx_ChirpData_g 0.000065 0.00000  test    mintime= 0.000064
                 avx_ChirpData_h 0.000080 0.00000  test    mintime= 0.000079
                 avx_ChirpData_i 0.000065 0.00000  test    mintime= 0.000064
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.000060 0.00000  choice

                   Test duration     5.54 seconds

Ftst_v7 completed successfully.

Offline Richard Haselgrove

  • Messenger Pigeon
  • Knight who says 'Ni!'
  • *****
  • Posts: 2819
Re: AVX Optimized App Development
« Reply #159 on: 30 Aug 2012, 05:31:57 am »
i7-3770K, overclocked @ 4.5 GHz. BOINC busy, 7 CPU tasks running, plus GPU (one of the CPU tasks is Test4Theory running in a Vbox VM with vitualisation BIOS support enabled)


=========================================================
Ftst_v7_J52_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.005425 0.00000  test
                   fpu_ChirpData 0.015131 0.00000  test
               fpu_opt_ChirpData 0.005087 0.00000  test
             sse1_ChirpData_ak8e 0.005824 0.00000  test
              sse2_ChirpData_ak8 0.004417 0.00000  test
              sse3_ChirpData_ak8 0.004327 0.00000  test
                 avx_ChirpData_a 0.002338 0.00000  test
                 avx_ChirpData_b 0.002388 0.00000  test
                 avx_ChirpData_c 0.002360 0.00000  test
                 avx_ChirpData_d 0.002191 0.00000  test
                 avx_ChirpData_e 0.002240 0.00000  test
                 avx_ChirpData_f 0.002379 0.00000  test
                 avx_ChirpData_g 0.002397 0.00000  test
                 avx_ChirpData_h 0.002905 0.00000  test
                 avx_ChirpData_i 0.002537 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_d 0.002191 0.00000  choice

            Second run

                     v_ChirpData 0.005390 0.00000  test
                   fpu_ChirpData 0.015163 0.00000  test
               fpu_opt_ChirpData 0.005582 0.00000  test
             sse1_ChirpData_ak8e 0.005794 0.00000  test
              sse2_ChirpData_ak8 0.004409 0.00000  test
              sse3_ChirpData_ak8 0.004267 0.00000  test
                 avx_ChirpData_a 0.002343 0.00000  test
                 avx_ChirpData_b 0.002378 0.00000  test
                 avx_ChirpData_c 0.002384 0.00000  test
                 avx_ChirpData_d 0.002185 0.00000  test
                 avx_ChirpData_e 0.002244 0.00000  test
                 avx_ChirpData_f 0.002384 0.00000  test
                 avx_ChirpData_g 0.002392 0.00000  test
                 avx_ChirpData_h 0.002887 0.00000  test
                 avx_ChirpData_i 0.002537 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_d 0.002185 0.00000  choice

            Third run

                     v_ChirpData 0.005380 0.00000  test
                   fpu_ChirpData 0.015293 0.00000  test
               fpu_opt_ChirpData 0.005064 0.00000  test
             sse1_ChirpData_ak8e 0.005767 0.00000  test
              sse2_ChirpData_ak8 0.004404 0.00000  test
              sse3_ChirpData_ak8 0.004257 0.00000  test
                 avx_ChirpData_a 0.002327 0.00000  test
                 avx_ChirpData_b 0.002383 0.00000  test
                 avx_ChirpData_c 0.002373 0.00000  test
                 avx_ChirpData_d 0.002207 0.00000  test
                 avx_ChirpData_e 0.002235 0.00000  test
                 avx_ChirpData_f 0.002372 0.00000  test
                 avx_ChirpData_g 0.002390 0.00000  test
                 avx_ChirpData_h 0.002896 0.00000  test
                 avx_ChirpData_i 0.002535 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_d 0.002207 0.00000  choice

                   Test duration     6.94 seconds

Ftst_v7 completed successfully.


=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.047948 0.00000  test    mintime= 0.047722
                   fpu_ChirpData 0.014260 0.00000  test    mintime= 0.014089
             sse1_ChirpData_ak8e 0.005242 0.00000  test    mintime= 0.005155
              sse2_ChirpData_ak8 0.003972 0.00000  test    mintime= 0.003925
              sse3_ChirpData_ak8 0.003851 0.00000  test    mintime= 0.003782
                 avx_ChirpData_a 0.002135 0.00000  test    mintime= 0.002108
                 avx_ChirpData_b 0.002230 0.00000  test    mintime= 0.002208
                 avx_ChirpData_c 0.002190 0.00000  test    mintime= 0.002147
                 avx_ChirpData_d 0.002032 0.00000  test    mintime= 0.002010
                 avx_ChirpData_e 0.002447 0.00000  test    mintime= 0.002107
                 avx_ChirpData_f 0.002229 0.00000  test    mintime= 0.002205
                 avx_ChirpData_g 0.002269 0.00000  test    mintime= 0.002219
                 avx_ChirpData_h 0.002786 0.00000  test    mintime= 0.002702
                 avx_ChirpData_i 0.002398 0.00000  test    mintime= 0.002370
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.002032 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.005989 0.00000  test    mintime= 0.005882
                   fpu_ChirpData 0.001779 0.00000  test    mintime= 0.001747
             sse1_ChirpData_ak8e 0.000652 0.00000  test    mintime= 0.000634
              sse2_ChirpData_ak8 0.000498 0.00000  test    mintime= 0.000483
              sse3_ChirpData_ak8 0.000480 0.00000  test    mintime= 0.000463
                 avx_ChirpData_a 0.000267 0.00000  test    mintime= 0.000258
                 avx_ChirpData_b 0.000280 0.00000  test    mintime= 0.000269
                 avx_ChirpData_c 0.000271 0.00000  test    mintime= 0.000261
                 avx_ChirpData_d 0.000257 0.00000  test    mintime= 0.000247
                 avx_ChirpData_e 0.000265 0.00000  test    mintime= 0.000256
                 avx_ChirpData_f 0.000277 0.00000  test    mintime= 0.000269
                 avx_ChirpData_g 0.000281 0.00000  test    mintime= 0.000273
                 avx_ChirpData_h 0.000334 0.00000  test    mintime= 0.000325
                 avx_ChirpData_i 0.000290 0.00000  test    mintime= 0.000278
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000257 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001507 0.00000  test    mintime= 0.001459
                   fpu_ChirpData 0.000445 0.00000  test    mintime= 0.000426
             sse1_ChirpData_ak8e 0.000164 0.00000  test    mintime= 0.000156
              sse2_ChirpData_ak8 0.000124 0.00000  test    mintime= 0.000120
              sse3_ChirpData_ak8 0.000120 0.00000  test    mintime= 0.000113
                 avx_ChirpData_a 0.000067 0.00000  test    mintime= 0.000061
                 avx_ChirpData_b 0.000070 0.00000  test    mintime= 0.000066
                 avx_ChirpData_c 0.000068 0.00000  test    mintime= 0.000063
                 avx_ChirpData_d 0.000064 0.00000  test    mintime= 0.000060
                 avx_ChirpData_e 0.000066 0.00000  test    mintime= 0.000063
                 avx_ChirpData_f 0.000070 0.00000  test    mintime= 0.000065
                 avx_ChirpData_g 0.000070 0.00000  test    mintime= 0.000066
                 avx_ChirpData_h 0.000083 0.00000  test    mintime= 0.000079
                 avx_ChirpData_i 0.000070 0.00000  test    mintime= 0.000066
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000064 0.00000  choice

                   Test duration     4.80 seconds

Ftst_v7 completed successfully.


=========================================================
Ftst_v7_J55b_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.047290 0.00000  test    mintime= 0.047191
                   fpu_ChirpData 0.014682 0.00000  test    mintime= 0.014559
             sse1_ChirpData_ak8e 0.005332 0.00000  test    mintime= 0.005305
              sse2_ChirpData_ak8 0.004051 0.00000  test    mintime= 0.004023
              sse3_ChirpData_ak8 0.003886 0.00000  test    mintime= 0.003859
                 avx_ChirpData_a 0.002146 0.00000  test    mintime= 0.002131
                 avx_ChirpData_b 0.002359 0.00000  test    mintime= 0.002343
                 avx_ChirpData_c 0.002138 0.00000  test    mintime= 0.002112
                 avx_ChirpData_d 0.002043 0.00000  test    mintime= 0.002030
                 avx_ChirpData_e 0.002136 0.00000  test    mintime= 0.002126
                 avx_ChirpData_f 0.002251 0.00000  test    mintime= 0.002233
                 avx_ChirpData_g 0.002282 0.00000  test    mintime= 0.002265
                 avx_ChirpData_h 0.002752 0.00000  test    mintime= 0.002736
                 avx_ChirpData_i 0.002398 0.00000  test    mintime= 0.002387
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.002043 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.006023 0.00000  test    mintime= 0.005882
                   fpu_ChirpData 0.001809 0.00000  test    mintime= 0.001781
             sse1_ChirpData_ak8e 0.000665 0.00000  test    mintime= 0.000647
              sse2_ChirpData_ak8 0.000514 0.00000  test    mintime= 0.000506
              sse3_ChirpData_ak8 0.000495 0.00000  test    mintime= 0.000471
                 avx_ChirpData_a 0.000274 0.00000  test    mintime= 0.000268
                 avx_ChirpData_b 0.000296 0.00000  test    mintime= 0.000291
                 avx_ChirpData_c 0.000274 0.00000  test    mintime= 0.000267
                 avx_ChirpData_d 0.000262 0.00000  test    mintime= 0.000255
                 avx_ChirpData_e 0.000269 0.00000  test    mintime= 0.000265
                 avx_ChirpData_f 0.000281 0.00000  test    mintime= 0.000278
                 avx_ChirpData_g 0.000285 0.00000  test    mintime= 0.000281
                 avx_ChirpData_h 0.000337 0.00000  test    mintime= 0.000331
                 avx_ChirpData_i 0.000290 0.00000  test    mintime= 0.000283
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000262 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001537 0.00000  test    mintime= 0.001465
                   fpu_ChirpData 0.000451 0.00000  test    mintime= 0.000441
             sse1_ChirpData_ak8e 0.000166 0.00000  test    mintime= 0.000162
              sse2_ChirpData_ak8 0.000126 0.00000  test    mintime= 0.000122
              sse3_ChirpData_ak8 0.000158 0.00000  test    mintime= 0.000119
                 avx_ChirpData_a 0.000067 0.00000  test    mintime= 0.000066
                 avx_ChirpData_b 0.000073 0.00000  test    mintime= 0.000072
                 avx_ChirpData_c 0.000067 0.00000  test    mintime= 0.000064
                 avx_ChirpData_d 0.000063 0.00000  test    mintime= 0.000062
                 avx_ChirpData_e 0.000067 0.00000  test    mintime= 0.000064
                 avx_ChirpData_f 0.000070 0.00000  test    mintime= 0.000068
                 avx_ChirpData_g 0.000071 0.00000  test    mintime= 0.000070
                 avx_ChirpData_h 0.000090 0.00000  test    mintime= 0.000081
                 avx_ChirpData_i 0.000072 0.00000  test    mintime= 0.000068
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.000063 0.00000  choice

                   Test duration     4.81 seconds

Ftst_v7 completed successfully.

Offline Richard Haselgrove

  • Messenger Pigeon
  • Knight who says 'Ni!'
  • *****
  • Posts: 2819
Re: AVX Optimized App Development
« Reply #160 on: 31 Aug 2012, 08:58:56 am »
Same host, this time running with BOINC suspended and not much else running.


=========================================================
Ftst_v7_J52_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.003897 0.00000  test
                   fpu_ChirpData 0.008944 0.00000  test
               fpu_opt_ChirpData 0.003988 0.00000  test
             sse1_ChirpData_ak8e 0.004430 0.00000  test
              sse2_ChirpData_ak8 0.002905 0.00000  test
              sse3_ChirpData_ak8 0.002731 0.00000  test
                 avx_ChirpData_a 0.001524 0.00000  test
                 avx_ChirpData_b 0.001527 0.00000  test
                 avx_ChirpData_c 0.001551 0.00000  test
                 avx_ChirpData_d 0.001445 0.00000  test
                 avx_ChirpData_e 0.001433 0.00000  test
                 avx_ChirpData_f 0.001516 0.00000  test
                 avx_ChirpData_g 0.001537 0.00000  test
                 avx_ChirpData_h 0.002187 0.00000  test
                 avx_ChirpData_i 0.001688 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_e 0.001433 0.00000  choice

            Second run

                     v_ChirpData 0.003866 0.00000  test
                   fpu_ChirpData 0.008956 0.00000  test
               fpu_opt_ChirpData 0.003808 0.00000  test
             sse1_ChirpData_ak8e 0.003868 0.00000  test
              sse2_ChirpData_ak8 0.002854 0.00000  test
              sse3_ChirpData_ak8 0.002725 0.00000  test
                 avx_ChirpData_a 0.001527 0.00000  test
                 avx_ChirpData_b 0.001536 0.00000  test
                 avx_ChirpData_c 0.001570 0.00000  test
                 avx_ChirpData_d 0.001437 0.00000  test
                 avx_ChirpData_e 0.001440 0.00000  test
                 avx_ChirpData_f 0.001527 0.00000  test
                 avx_ChirpData_g 0.001535 0.00000  test
                 avx_ChirpData_h 0.002072 0.00000  test
                 avx_ChirpData_i 0.001684 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_d 0.001437 0.00000  choice

            Third run

                     v_ChirpData 0.003900 0.00000  test
                   fpu_ChirpData 0.009065 0.00000  test
               fpu_opt_ChirpData 0.004296 0.00000  test
             sse1_ChirpData_ak8e 0.003866 0.00000  test
              sse2_ChirpData_ak8 0.002840 0.00000  test
              sse3_ChirpData_ak8 0.002725 0.00000  test
                 avx_ChirpData_a 0.001522 0.00000  test
                 avx_ChirpData_b 0.001526 0.00000  test
                 avx_ChirpData_c 0.001547 0.00000  test
                 avx_ChirpData_d 0.001426 0.00000  test
                 avx_ChirpData_e 0.001496 0.00000  test
                 avx_ChirpData_f 0.001524 0.00000  test
                 avx_ChirpData_g 0.001569 0.00000  test
                 avx_ChirpData_h 0.002060 0.00000  test
                 avx_ChirpData_i 0.001698 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_d 0.001426 0.00000  choice

                   Test duration     5.91 seconds

Ftst_v7 completed successfully.

=========================================================
Ftst_v7_J55_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.043213 0.00000  test    mintime= 0.043077
                   fpu_ChirpData 0.009013 0.00000  test    mintime= 0.008937
             sse1_ChirpData_ak8e 0.003854 0.00000  test    mintime= 0.003842
              sse2_ChirpData_ak8 0.002833 0.00000  test    mintime= 0.002829
              sse3_ChirpData_ak8 0.002718 0.00000  test    mintime= 0.002709
                 avx_ChirpData_a 0.001519 0.00000  test    mintime= 0.001514
                 avx_ChirpData_b 0.001736 0.00000  test    mintime= 0.001728
                 avx_ChirpData_c 0.001547 0.00000  test    mintime= 0.001544
                 avx_ChirpData_d 0.001433 0.00000  test    mintime= 0.001427
                 avx_ChirpData_e 0.001430 0.00000  test    mintime= 0.001418
                 avx_ChirpData_f 0.001656 0.00000  test    mintime= 0.001649
                 avx_ChirpData_g 0.001551 0.00000  test    mintime= 0.001535
                 avx_ChirpData_h 0.002173 0.00000  test    mintime= 0.002007
                 avx_ChirpData_i 0.001685 0.00000  test    mintime= 0.001675
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.001430 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.005396 0.00000  test    mintime= 0.005375
                   fpu_ChirpData 0.001321 0.00000  test    mintime= 0.001118
             sse1_ChirpData_ak8e 0.000515 0.00000  test    mintime= 0.000481
              sse2_ChirpData_ak8 0.000357 0.00000  test    mintime= 0.000353
              sse3_ChirpData_ak8 0.000409 0.00000  test    mintime= 0.000339
                 avx_ChirpData_a 0.000191 0.00000  test    mintime= 0.000188
                 avx_ChirpData_b 0.000209 0.00000  test    mintime= 0.000185
                 avx_ChirpData_c 0.000193 0.00000  test    mintime= 0.000191
                 avx_ChirpData_d 0.000192 0.00000  test    mintime= 0.000176
                 avx_ChirpData_e 0.000188 0.00000  test    mintime= 0.000175
                 avx_ChirpData_f 0.000196 0.00000  test    mintime= 0.000187
                 avx_ChirpData_g 0.000192 0.00000  test    mintime= 0.000188
                 avx_ChirpData_h 0.000244 0.00000  test    mintime= 0.000237
                 avx_ChirpData_i 0.000197 0.00000  test    mintime= 0.000191
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.000188 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001349 0.00000  test    mintime= 0.001343
                   fpu_ChirpData 0.000291 0.00000  test    mintime= 0.000279
             sse1_ChirpData_ak8e 0.000122 0.00000  test    mintime= 0.000120
              sse2_ChirpData_ak8 0.000096 0.00000  test    mintime= 0.000088
              sse3_ChirpData_ak8 0.000093 0.00000  test    mintime= 0.000084
                 avx_ChirpData_a 0.000047 0.00000  test    mintime= 0.000046
                 avx_ChirpData_b 0.000050 0.00000  test    mintime= 0.000046
                 avx_ChirpData_c 0.000061 0.00000  test    mintime= 0.000047
                 avx_ChirpData_d 0.000045 0.00000  test    mintime= 0.000044
                 avx_ChirpData_e 0.000045 0.00000  test    mintime= 0.000044
                 avx_ChirpData_f 0.000047 0.00000  test    mintime= 0.000046
                 avx_ChirpData_g 0.000048 0.00000  test    mintime= 0.000047
                 avx_ChirpData_h 0.000062 0.00000  test    mintime= 0.000060
                 avx_ChirpData_i 0.000048 0.00000  test    mintime= 0.000046
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.000045 0.00000  choice

                   Test duration     4.09 seconds

Ftst_v7 completed successfully.

=========================================================
Ftst_v7_J55b_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------

   First run, 1048576 sample testing

                     v_ChirpData 0.043410 0.00000  test    mintime= 0.043336
                   fpu_ChirpData 0.008939 0.00000  test    mintime= 0.008902
             sse1_ChirpData_ak8e 0.003835 0.00000  test    mintime= 0.003824
              sse2_ChirpData_ak8 0.002839 0.00000  test    mintime= 0.002837
              sse3_ChirpData_ak8 0.002715 0.00000  test    mintime= 0.002710
                 avx_ChirpData_a 0.001514 0.00000  test    mintime= 0.001508
                 avx_ChirpData_b 0.001577 0.00000  test    mintime= 0.001572
                 avx_ChirpData_c 0.001517 0.00000  test    mintime= 0.001512
                 avx_ChirpData_d 0.001426 0.00000  test    mintime= 0.001421
                 avx_ChirpData_e 0.001497 0.00000  test    mintime= 0.001452
                 avx_ChirpData_f 0.001534 0.00000  test    mintime= 0.001523
                 avx_ChirpData_g 0.001708 0.00000  test    mintime= 0.001703
                 avx_ChirpData_h 0.002067 0.00000  test    mintime= 0.002009
                 avx_ChirpData_i 0.001695 0.00000  test    mintime= 0.001663
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_d 0.001426 0.00000  choice

  Second run,  131072 sample testing

                     v_ChirpData 0.005465 0.00000  test    mintime= 0.005412
                   fpu_ChirpData 0.001115 0.00000  test    mintime= 0.001107
             sse1_ChirpData_ak8e 0.000483 0.00000  test    mintime= 0.000480
              sse2_ChirpData_ak8 0.000399 0.00000  test    mintime= 0.000354
              sse3_ChirpData_ak8 0.000370 0.00000  test    mintime= 0.000338
                 avx_ChirpData_a 0.000232 0.00000  test    mintime= 0.000187
                 avx_ChirpData_b 0.000212 0.00000  test    mintime= 0.000196
                 avx_ChirpData_c 0.000192 0.00000  test    mintime= 0.000187
                 avx_ChirpData_d 0.000180 0.00000  test    mintime= 0.000177
                 avx_ChirpData_e 0.000180 0.00000  test    mintime= 0.000177
                 avx_ChirpData_f 0.000190 0.00000  test    mintime= 0.000188
                 avx_ChirpData_g 0.000193 0.00000  test    mintime= 0.000190
                 avx_ChirpData_h 0.000256 0.00000  test    mintime= 0.000248
                 avx_ChirpData_i 0.000220 0.00000  test    mintime= 0.000197
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.000180 0.00000  choice

   Third run,   32768 sample testing

                     v_ChirpData 0.001356 0.00000  test    mintime= 0.001353
                   fpu_ChirpData 0.000281 0.00000  test    mintime= 0.000278
             sse1_ChirpData_ak8e 0.000120 0.00000  test    mintime= 0.000119
              sse2_ChirpData_ak8 0.000089 0.00000  test    mintime= 0.000088
              sse3_ChirpData_ak8 0.000089 0.00000  test    mintime= 0.000084
                 avx_ChirpData_a 0.000053 0.00000  test    mintime= 0.000046
                 avx_ChirpData_b 0.000049 0.00000  test    mintime= 0.000048
                 avx_ChirpData_c 0.000047 0.00000  test    mintime= 0.000046
                 avx_ChirpData_d 0.000045 0.00000  test    mintime= 0.000043
                 avx_ChirpData_e 0.000044 0.00000  test    mintime= 0.000043
                 avx_ChirpData_f 0.000053 0.00000  test    mintime= 0.000046
                 avx_ChirpData_g 0.000053 0.00000  test    mintime= 0.000051
                 avx_ChirpData_h 0.000062 0.00000  test    mintime= 0.000058
                 avx_ChirpData_i 0.000052 0.00000  test    mintime= 0.000046
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
            avx_fma4_ChirpData_e not supported by system
                 avx_ChirpData_e 0.000044 0.00000  choice

                   Test duration     4.08 seconds

Ftst_v7 completed successfully.

 

Welcome, Guest.
Please login or register.
 
 
 
Forgot your password?
Members
Total Members: 97
Latest: ToeBee
New This Month: 0
New This Week: 0
New Today: 0
Stats
Total Posts: 59559
Total Topics: 1672
Most Online Today: 19
Most Online Ever: 983
(20 Jan 2020, 03:17:55 pm)
Users Online
Members: 0
Guests: 19
Total: 19
Powered by EzPortal