+- +-
Say hello if visiting :) by Gecko
11 Jan 2023, 07:43:05 pm

Seti is down again by Mike
09 Aug 2017, 10:02:44 am

Some considerations regarding OpenCL MultiBeam app tuning from algorithm view by Raistmer
11 Dec 2016, 06:30:56 am

Loading APU to the limit: performance considerations by Mike
05 Nov 2016, 06:49:26 am

Better sleep on Windows - new round by Raistmer
26 Aug 2016, 02:02:31 pm

Author Topic: AVX Optimized App Development  (Read 119193 times)

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #90 on: 06 May 2012, 12:41:39 am »
i3-2120

=========================================================
Ftst_v7_J46_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.004987 0.00000  test
                   fpu_ChirpData 0.012602 0.00000  test
               fpu_opt_ChirpData 0.004939 0.00000  test
               sse1_ChirpData_ak 0.007443 0.00000  test
             sse1_ChirpData_ak8e 0.005782 0.00000  test
             sse1_ChirpData_ak8h 0.006308 0.00000  test
               sse2_ChirpData_ak 0.006596 0.00000  test
              sse2_ChirpData_ak8 0.004223 0.00000  test
               sse3_ChirpData_ak 0.007248 0.00000  test
              sse3_ChirpData_ak8 0.004744 0.00000  test
                 avx_ChirpData_a 0.002522 0.00000  test
                 avx_ChirpData_b 0.002197 0.00000  test
                 avx_ChirpData_c 0.002229 0.00000  test
                 avx_ChirpData_d 0.001941 0.00000  test
                 avx_ChirpData_e 0.001927 0.00000  test
                 avx_ChirpData_f 0.002687 0.00000  test
                 avx_ChirpData_e 0.001927 0.00000  choice

            Second run

                     v_ChirpData 0.004898 0.00000  test
                   fpu_ChirpData 0.012865 0.00000  test
               fpu_opt_ChirpData 0.004803 0.00000  test
               sse1_ChirpData_ak 0.007609 0.00000  test
             sse1_ChirpData_ak8e 0.006971 0.00000  test
             sse1_ChirpData_ak8h 0.006140 0.00000  test
               sse2_ChirpData_ak 0.011364 0.00000  test
              sse2_ChirpData_ak8 0.004304 0.00000  test
               sse3_ChirpData_ak 0.006403 0.00000  test
              sse3_ChirpData_ak8 0.004099 0.00000  test
                 avx_ChirpData_a 0.002169 0.00000  test
                 avx_ChirpData_b 0.002218 0.00000  test
                 avx_ChirpData_c 0.002841 0.00000  test
                 avx_ChirpData_d 0.002072 0.00000  test
                 avx_ChirpData_e 0.002096 0.00000  test
                 avx_ChirpData_f 0.002106 0.00000  test
                 avx_ChirpData_d 0.002072 0.00000  choice

            Third run

                     v_ChirpData 0.005091 0.00000  test
                   fpu_ChirpData 0.012386 0.00000  test
               fpu_opt_ChirpData 0.005903 0.00000  test
               sse1_ChirpData_ak 0.007593 0.00000  test
             sse1_ChirpData_ak8e 0.006529 0.00000  test
             sse1_ChirpData_ak8h 0.006921 0.00000  test
               sse2_ChirpData_ak 0.007636 0.00000  test
              sse2_ChirpData_ak8 0.004701 0.00000  test
               sse3_ChirpData_ak 0.008300 0.00000  test
              sse3_ChirpData_ak8 0.004363 0.00000  test
                 avx_ChirpData_a 0.002189 0.00000  test
                 avx_ChirpData_b 0.002560 0.00000  test
                 avx_ChirpData_c 0.002874 0.00000  test
                 avx_ChirpData_d 0.001963 0.00000  test
                 avx_ChirpData_e 0.002519 0.00000  test
                 avx_ChirpData_f 0.002402 0.00000  test
                 avx_ChirpData_d 0.001963 0.00000  choice

                   Test duration     9.38 seconds

Ftst_v7 completed successfully.

Offline KarVi

  • Alpha Tester
  • Knight Templar
  • ***
  • Posts: 252
Re: AVX Optimized App Development
« Reply #91 on: 06 May 2012, 02:10:02 am »
FX-8150 @ 4.5G

=========================================================
Ftst_v7_J46_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.007729 0.00000  test
                   fpu_ChirpData 0.014011 0.00000  test
               fpu_opt_ChirpData 0.007529 0.00000  test
               sse1_ChirpData_ak 0.007005 0.00000  test
             sse1_ChirpData_ak8e 0.005742 0.00000  test
             sse1_ChirpData_ak8h 0.006084 0.00000  test
               sse2_ChirpData_ak 0.006046 0.00000  test
              sse2_ChirpData_ak8 0.003682 0.00000  test
               sse3_ChirpData_ak 0.005676 0.00000  test
              sse3_ChirpData_ak8 0.003735 0.00000  test
                 avx_ChirpData_a 0.003086 0.00000  test
                 avx_ChirpData_b 0.003053 0.00000  test
                 avx_ChirpData_c 0.003305 0.00000  test
                 avx_ChirpData_d 0.003230 0.00000  test
                 avx_ChirpData_e 0.003276 0.00000  test
                 avx_ChirpData_f 0.002984 0.00000  test
                 avx_ChirpData_f 0.002984 0.00000  choice

            Second run

                     v_ChirpData 0.007668 0.00000  test
                   fpu_ChirpData 0.014010 0.00000  test
               fpu_opt_ChirpData 0.007530 0.00000  test
               sse1_ChirpData_ak 0.007012 0.00000  test
             sse1_ChirpData_ak8e 0.005742 0.00000  test
             sse1_ChirpData_ak8h 0.006120 0.00000  test
               sse2_ChirpData_ak 0.006099 0.00000  test
              sse2_ChirpData_ak8 0.003680 0.00000  test
               sse3_ChirpData_ak 0.005676 0.00000  test
              sse3_ChirpData_ak8 0.003733 0.00000  test
                 avx_ChirpData_a 0.003084 0.00000  test
                 avx_ChirpData_b 0.003054 0.00000  test
                 avx_ChirpData_c 0.003298 0.00000  test
                 avx_ChirpData_d 0.003237 0.00000  test
                 avx_ChirpData_e 0.003160 0.00000  test
                 avx_ChirpData_f 0.002985 0.00000  test
                 avx_ChirpData_f 0.002985 0.00000  choice

            Third run

                     v_ChirpData 0.007691 0.00000  test
                   fpu_ChirpData 0.014007 0.00000  test
               fpu_opt_ChirpData 0.007550 0.00000  test
               sse1_ChirpData_ak 0.007008 0.00000  test
             sse1_ChirpData_ak8e 0.005766 0.00000  test
             sse1_ChirpData_ak8h 0.006121 0.00000  test
               sse2_ChirpData_ak 0.006102 0.00000  test
              sse2_ChirpData_ak8 0.003683 0.00000  test
               sse3_ChirpData_ak 0.005611 0.00000  test
              sse3_ChirpData_ak8 0.003735 0.00000  test
                 avx_ChirpData_a 0.003099 0.00000  test
                 avx_ChirpData_b 0.003056 0.00000  test
                 avx_ChirpData_c 0.003307 0.00000  test
                 avx_ChirpData_d 0.003235 0.00000  test
                 avx_ChirpData_e 0.003145 0.00000  test
                 avx_ChirpData_f 0.002989 0.00000  test
                 avx_ChirpData_f 0.002989 0.00000  choice

                   Test duration     7.65 seconds

Ftst_v7 completed successfully.
A smile is the shortest distance between two peoble (Victor Borge).

Offline Claggy

  • Alpha Tester
  • Knight who says 'Ni!'
  • ***
  • Posts: 3111
    • My computers at Seti Beta
Re: AVX Optimized App Development
« Reply #92 on: 06 May 2012, 06:49:57 am »
i7-2600K @4.7GHz (Boinc running):

=========================================================
Ftst_v7_J46_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.009035 0.00000  test
                   fpu_ChirpData 0.015938 0.00000  test
               fpu_opt_ChirpData 0.008348 0.00000  test
               sse1_ChirpData_ak 0.008082 0.00000  test
             sse1_ChirpData_ak8e 0.006617 0.00000  test
             sse1_ChirpData_ak8h 0.006743 0.00000  test
               sse2_ChirpData_ak 0.007306 0.00000  test
              sse2_ChirpData_ak8 0.005201 0.00000  test
               sse3_ChirpData_ak 0.007197 0.00000  test
              sse3_ChirpData_ak8 0.004754 0.00000  test
                 avx_ChirpData_a 0.003005 0.00000  test
                 avx_ChirpData_b 0.002989 0.00000  test
                 avx_ChirpData_c 0.002858 0.00000  test
                 avx_ChirpData_d 0.002757 0.00000  test
                 avx_ChirpData_e 0.002860 0.00000  test
                 avx_ChirpData_f 0.003022 0.00000  test
                 avx_ChirpData_d 0.002757 0.00000  choice

            Second run

                     v_ChirpData 0.009295 0.00000  test
                   fpu_ChirpData 0.016223 0.00000  test
               fpu_opt_ChirpData 0.009218 0.00000  test
               sse1_ChirpData_ak 0.008023 0.00000  test
             sse1_ChirpData_ak8e 0.006668 0.00000  test
             sse1_ChirpData_ak8h 0.006970 0.00000  test
               sse2_ChirpData_ak 0.007304 0.00000  test
              sse2_ChirpData_ak8 0.007223 0.00000  test
               sse3_ChirpData_ak 0.006876 0.00000  test
              sse3_ChirpData_ak8 0.005352 0.00000  test
                 avx_ChirpData_a 0.002983 0.00000  test
                 avx_ChirpData_b 0.002851 0.00000  test
                 avx_ChirpData_c 0.002793 0.00000  test
                 avx_ChirpData_d 0.002774 0.00000  test
                 avx_ChirpData_e 0.002800 0.00000  test
                 avx_ChirpData_f 0.003027 0.00000  test
                 avx_ChirpData_d 0.002774 0.00000  choice

            Third run

                     v_ChirpData 0.010111 0.00000  test
                   fpu_ChirpData 0.015180 0.00000  test
               fpu_opt_ChirpData 0.007804 0.00000  test
               sse1_ChirpData_ak 0.007392 0.00000  test
             sse1_ChirpData_ak8e 0.005719 0.00000  test
             sse1_ChirpData_ak8h 0.006324 0.00000  test
               sse2_ChirpData_ak 0.006736 0.00000  test
              sse2_ChirpData_ak8 0.004659 0.00000  test
               sse3_ChirpData_ak 0.006483 0.00000  test
              sse3_ChirpData_ak8 0.004693 0.00000  test
                 avx_ChirpData_a 0.002670 0.00000  test
                 avx_ChirpData_b 0.002547 0.00000  test
                 avx_ChirpData_c 0.002927 0.00000  test
                 avx_ChirpData_d 0.002863 0.00000  test
                 avx_ChirpData_e 0.002530 0.00000  test
                 avx_ChirpData_f 0.002889 0.00000  test
                 avx_ChirpData_e 0.002530 0.00000  choice

                   Test duration     8.81 seconds

Ftst_v7 completed successfully.

=========================================================

i7-2600K @4.7GHz (Boinc computing suspended):

=========================================================
Ftst_v7_J46_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.003774 0.00000  test
                   fpu_ChirpData 0.008655 0.00000  test
               fpu_opt_ChirpData 0.003673 0.00000  test
               sse1_ChirpData_ak 0.005044 0.00000  test
             sse1_ChirpData_ak8e 0.004149 0.00000  test
             sse1_ChirpData_ak8h 0.004295 0.00000  test
               sse2_ChirpData_ak 0.004718 0.00000  test
              sse2_ChirpData_ak8 0.003110 0.00000  test
               sse3_ChirpData_ak 0.004573 0.00000  test
              sse3_ChirpData_ak8 0.003070 0.00000  test
                 avx_ChirpData_a 0.001458 0.00000  test
                 avx_ChirpData_b 0.001635 0.00000  test
                 avx_ChirpData_c 0.001466 0.00000  test
                 avx_ChirpData_d 0.001359 0.00000  test
                 avx_ChirpData_e 0.001523 0.00000  test
                 avx_ChirpData_f 0.001567 0.00000  test
                 avx_ChirpData_d 0.001359 0.00000  choice

            Second run

                     v_ChirpData 0.003752 0.00000  test
                   fpu_ChirpData 0.008567 0.00000  test
               fpu_opt_ChirpData 0.003682 0.00000  test
               sse1_ChirpData_ak 0.005043 0.00000  test
             sse1_ChirpData_ak8e 0.004156 0.00000  test
             sse1_ChirpData_ak8h 0.004301 0.00000  test
               sse2_ChirpData_ak 0.004715 0.00000  test
              sse2_ChirpData_ak8 0.003105 0.00000  test
               sse3_ChirpData_ak 0.004566 0.00000  test
              sse3_ChirpData_ak8 0.003084 0.00000  test
                 avx_ChirpData_a 0.001450 0.00000  test
                 avx_ChirpData_b 0.001618 0.00000  test
                 avx_ChirpData_c 0.001463 0.00000  test
                 avx_ChirpData_d 0.001364 0.00000  test
                 avx_ChirpData_e 0.001512 0.00000  test
                 avx_ChirpData_f 0.001567 0.00000  test
                 avx_ChirpData_d 0.001364 0.00000  choice

            Third run

                     v_ChirpData 0.003780 0.00000  test
                   fpu_ChirpData 0.008574 0.00000  test
               fpu_opt_ChirpData 0.003678 0.00000  test
               sse1_ChirpData_ak 0.005039 0.00000  test
             sse1_ChirpData_ak8e 0.004149 0.00000  test
             sse1_ChirpData_ak8h 0.004303 0.00000  test
               sse2_ChirpData_ak 0.004717 0.00000  test
              sse2_ChirpData_ak8 0.003103 0.00000  test
               sse3_ChirpData_ak 0.004552 0.00000  test
              sse3_ChirpData_ak8 0.003074 0.00000  test
                 avx_ChirpData_a 0.001457 0.00000  test
                 avx_ChirpData_b 0.001623 0.00000  test
                 avx_ChirpData_c 0.001465 0.00000  test
                 avx_ChirpData_d 0.001358 0.00000  test
                 avx_ChirpData_e 0.001517 0.00000  test
                 avx_ChirpData_f 0.001568 0.00000  test
                 avx_ChirpData_d 0.001358 0.00000  choice

                   Test duration     6.21 seconds

Ftst_v7 completed successfully.

Claggy
« Last Edit: 06 May 2012, 07:00:59 am by Claggy »

Offline Mike

  • Alpha Tester
  • Knight who says 'Ni!'
  • ***
  • Posts: 2427
Re: AVX Optimized App Development
« Reply #93 on: 06 May 2012, 11:00:02 am »
FX 8150 @4.4 GHZ

Vista 64

Ftst_v7_J46_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.013777 0.00000  test
                   fpu_ChirpData 0.019779 0.00000  test
               fpu_opt_ChirpData 0.013983 0.00000  test
               sse1_ChirpData_ak 0.008577 0.00000  test
             sse1_ChirpData_ak8e 0.008094 0.00000  test
             sse1_ChirpData_ak8h 0.008219 0.00000  test
               sse2_ChirpData_ak 0.007457 0.00000  test
              sse2_ChirpData_ak8 0.005295 0.00000  test
               sse3_ChirpData_ak 0.007173 0.00000  test
              sse3_ChirpData_ak8 0.005586 0.00000  test
                 avx_ChirpData_a not supported on CPU
                 avx_ChirpData_b not supported on CPU
                 avx_ChirpData_c not supported on CPU
                 avx_ChirpData_d not supported on CPU
                 avx_ChirpData_e not supported on CPU
                 avx_ChirpData_f not supported on CPU
              sse2_ChirpData_ak8 0.005295 0.00000  choice

            Second run

                     v_ChirpData 0.014368 0.00000  test
                   fpu_ChirpData 0.020133 0.00000  test
               fpu_opt_ChirpData 0.014774 0.00000  test
               sse1_ChirpData_ak 0.009611 0.00000  test
             sse1_ChirpData_ak8e 0.008270 0.00000  test
             sse1_ChirpData_ak8h 0.008133 0.00000  test
               sse2_ChirpData_ak 0.007581 0.00000  test
              sse2_ChirpData_ak8 0.005770 0.00000  test
               sse3_ChirpData_ak 0.007714 0.00000  test
              sse3_ChirpData_ak8 0.005994 0.00000  test
                 avx_ChirpData_a not supported on CPU
                 avx_ChirpData_b not supported on CPU
                 avx_ChirpData_c not supported on CPU
                 avx_ChirpData_d not supported on CPU
                 avx_ChirpData_e not supported on CPU
                 avx_ChirpData_f not supported on CPU
              sse2_ChirpData_ak8 0.005770 0.00000  choice

            Third run

                     v_ChirpData 0.015319 0.00000  test
                   fpu_ChirpData 0.019830 0.00000  test
               fpu_opt_ChirpData 0.014914 0.00000  test
               sse1_ChirpData_ak 0.008400 0.00000  test
             sse1_ChirpData_ak8e 0.008292 0.00000  test
             sse1_ChirpData_ak8h 0.008653 0.00000  test
               sse2_ChirpData_ak 0.008362 0.00000  test
              sse2_ChirpData_ak8 0.006021 0.00000  test
               sse3_ChirpData_ak 0.007947 0.00000  test
              sse3_ChirpData_ak8 0.006008 0.00000  test
                 avx_ChirpData_a not supported on CPU
                 avx_ChirpData_b not supported on CPU
                 avx_ChirpData_c not supported on CPU
                 avx_ChirpData_d not supported on CPU
                 avx_ChirpData_e not supported on CPU
                 avx_ChirpData_f not supported on CPU
              sse3_ChirpData_ak8 0.006008 0.00000  choice

                   Test duration     7.70 seconds

Windows 8 CP

Ftst_v7 completed successfully.
=========================================================
Ftst_v7_J46_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.009532 0.00000  test
                   fpu_ChirpData 0.014579 0.00000  test
               fpu_opt_ChirpData 0.010973 0.00000  test
               sse1_ChirpData_ak 0.007270 0.00000  test
             sse1_ChirpData_ak8e 0.005956 0.00000  test
             sse1_ChirpData_ak8h 0.006514 0.00000  test
               sse2_ChirpData_ak 0.006356 0.00000  test
              sse2_ChirpData_ak8 0.003823 0.00000  test
               sse3_ChirpData_ak 0.005874 0.00000  test
              sse3_ChirpData_ak8 0.003933 0.00000  test
                 avx_ChirpData_a 0.003266 0.00000  test
                 avx_ChirpData_b 0.003259 0.00000  test
                 avx_ChirpData_c 0.003489 0.00000  test
                 avx_ChirpData_d 0.003396 0.00000  test
                 avx_ChirpData_e 0.003249 0.00000  test
                 avx_ChirpData_f 0.003150 0.00000  test
                 avx_ChirpData_f 0.003150 0.00000  choice

            Second run

                     v_ChirpData 0.010624 0.00000  test
                   fpu_ChirpData 0.014424 0.00000  test
               fpu_opt_ChirpData 0.010814 0.00000  test
               sse1_ChirpData_ak 0.007306 0.00000  test
             sse1_ChirpData_ak8e 0.006028 0.00000  test
             sse1_ChirpData_ak8h 0.006386 0.00000  test
               sse2_ChirpData_ak 0.006246 0.00000  test
              sse2_ChirpData_ak8 0.003924 0.00000  test
               sse3_ChirpData_ak 0.005858 0.00000  test
              sse3_ChirpData_ak8 0.003856 0.00000  test
                 avx_ChirpData_a 0.003388 0.00000  test
                 avx_ChirpData_b 0.003372 0.00000  test
                 avx_ChirpData_c 0.003444 0.00000  test
                 avx_ChirpData_d 0.003420 0.00000  test
                 avx_ChirpData_e 0.003288 0.00000  test
                 avx_ChirpData_f 0.003243 0.00000  test
                 avx_ChirpData_f 0.003243 0.00000  choice

            Third run

                     v_ChirpData 0.010755 0.00000  test
                   fpu_ChirpData 0.014522 0.00000  test
               fpu_opt_ChirpData 0.010650 0.00000  test
               sse1_ChirpData_ak 0.007303 0.00000  test
             sse1_ChirpData_ak8e 0.005991 0.00000  test
             sse1_ChirpData_ak8h 0.006305 0.00000  test
               sse2_ChirpData_ak 0.006294 0.00000  test
              sse2_ChirpData_ak8 0.003958 0.00000  test
               sse3_ChirpData_ak 0.005834 0.00000  test
              sse3_ChirpData_ak8 0.003853 0.00000  test
                 avx_ChirpData_a 0.003438 0.00000  test
                 avx_ChirpData_b 0.003351 0.00000  test
                 avx_ChirpData_c 0.003511 0.00000  test
                 avx_ChirpData_d 0.003449 0.00000  test
                 avx_ChirpData_e 0.003353 0.00000  test
                 avx_ChirpData_f 0.003294 0.00000  test
                 avx_ChirpData_f 0.003294 0.00000  choice

                   Test duration     8.25 seconds

Ftst_v7 completed successfully.

Offline Josef W. Segur

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 3112
Re: AVX Optimized App Development
« Reply #94 on: 07 May 2012, 01:45:28 pm »
Hmm, my hopes for a single best variant for both Bulldozer and Sandy Bridge are fading.

I'm still hoping to improve things further for Bulldozer, the attached J47 test has several subvariants of f with the prefetch distance varied from 2 to 6 cache lines (was 4 in J46). Possibly one will get the input data to L1 at just the right time, at least there may be some observable differences.

Edit: Attachment removed, see later post for current chirp only test.
                                                           Joe
« Last Edit: 08 May 2012, 11:48:30 pm by Josef W. Segur »

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #95 on: 07 May 2012, 02:45:52 pm »
FX-4100

=========================================================
Ftst_v7_J47_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.009631 0.00000  test
                   fpu_ChirpData 0.018620 0.00000  test
               fpu_opt_ChirpData 0.009660 0.00000  test
             sse1_ChirpData_ak8e 0.007727 0.00000  test
              sse2_ChirpData_ak8 0.004670 0.00000  test
              sse3_ChirpData_ak8 0.004718 0.00000  test
                 avx_ChirpData_a 0.005349 0.00000  test
                 avx_ChirpData_b 0.004372 0.00000  test
                 avx_ChirpData_c 0.005326 0.00000  test
                 avx_ChirpData_d 0.004810 0.00000  test
                 avx_ChirpData_e 0.004443 0.00000  test
                avx_ChirpData_f2 0.003933 0.00000  test
                avx_ChirpData_f3 0.004052 0.00000  test
                avx_ChirpData_f4 0.004437 0.00000  test
                avx_ChirpData_f5 0.004403 0.00000  test
                avx_ChirpData_f6 0.004202 0.00000  test
                avx_ChirpData_f2 0.003933 0.00000  choice

            Second run

                     v_ChirpData 0.009733 0.00000  test
                   fpu_ChirpData 0.019518 0.00000  test
               fpu_opt_ChirpData 0.009704 0.00000  test
             sse1_ChirpData_ak8e 0.007881 0.00000  test
              sse2_ChirpData_ak8 0.004756 0.00000  test
              sse3_ChirpData_ak8 0.004759 0.00000  test
                 avx_ChirpData_a 0.004677 0.00000  test
                 avx_ChirpData_b 0.004744 0.00000  test
                 avx_ChirpData_c 0.005402 0.00000  test
                 avx_ChirpData_d 0.004839 0.00000  test
                 avx_ChirpData_e 0.004657 0.00000  test
                avx_ChirpData_f2 0.004321 0.00000  test
                avx_ChirpData_f3 0.004221 0.00000  test
                avx_ChirpData_f4 0.003977 0.00000  test
                avx_ChirpData_f5 0.004067 0.00000  test
                avx_ChirpData_f6 0.004336 0.00000  test
                avx_ChirpData_f4 0.003977 0.00000  choice

            Third run

                     v_ChirpData 0.009881 0.00000  test
                   fpu_ChirpData 0.019005 0.00000  test
               fpu_opt_ChirpData 0.009598 0.00000  test
             sse1_ChirpData_ak8e 0.008132 0.00000  test
              sse2_ChirpData_ak8 0.004756 0.00000  test
              sse3_ChirpData_ak8 0.004812 0.00000  test
                 avx_ChirpData_a 0.004607 0.00000  test
                 avx_ChirpData_b 0.004537 0.00000  test
                 avx_ChirpData_c 0.004586 0.00000  test
                 avx_ChirpData_d 0.004348 0.00000  test
                 avx_ChirpData_e 0.004533 0.00000  test
                avx_ChirpData_f2 0.004246 0.00000  test
                avx_ChirpData_f3 0.004469 0.00000  test
                avx_ChirpData_f4 0.004122 0.00000  test
                avx_ChirpData_f5 0.004541 0.00000  test
                avx_ChirpData_f6 0.004264 0.00000  test
                avx_ChirpData_f4 0.004122 0.00000  choice

                   Test duration     9.89 seconds

Ftst_v7 completed successfully.

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #96 on: 07 May 2012, 02:47:29 pm »
i3-2120

=========================================================
Ftst_v7_J47_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.005192 0.00000  test
                   fpu_ChirpData 0.016616 0.00000  test
               fpu_opt_ChirpData 0.005312 0.00000  test
             sse1_ChirpData_ak8e 0.007554 0.00000  test
              sse2_ChirpData_ak8 0.004366 0.00000  test
              sse3_ChirpData_ak8 0.004680 0.00000  test
                 avx_ChirpData_a 0.002474 0.00000  test
                 avx_ChirpData_b 0.002890 0.00000  test
                 avx_ChirpData_c 0.002728 0.00000  test
                 avx_ChirpData_d 0.002087 0.00000  test
                 avx_ChirpData_e 0.002756 0.00000  test
                avx_ChirpData_f2 0.002708 0.00000  test
                avx_ChirpData_f3 0.002074 0.00000  test
                avx_ChirpData_f4 0.002303 0.00000  test
                avx_ChirpData_f5 0.002295 0.00000  test
                avx_ChirpData_f6 0.002532 0.00000  test
                avx_ChirpData_f3 0.002074 0.00000  choice

            Second run

                     v_ChirpData 0.007313 0.00000  test
                   fpu_ChirpData 0.015500 0.00000  test
               fpu_opt_ChirpData 0.005429 0.00000  test
             sse1_ChirpData_ak8e 0.006784 0.00000  test
              sse2_ChirpData_ak8 0.004199 0.00000  test
              sse3_ChirpData_ak8 0.004349 0.00000  test
                 avx_ChirpData_a 0.002453 0.00000  test
                 avx_ChirpData_b 0.002080 0.00000  test
                 avx_ChirpData_c 0.002121 0.00000  test
                 avx_ChirpData_d 0.002363 0.00000  test
                 avx_ChirpData_e 0.002128 0.00000  test
                avx_ChirpData_f2 0.002339 0.00000  test
                avx_ChirpData_f3 0.002652 0.00000  test
                avx_ChirpData_f4 0.002237 0.00000  test
                avx_ChirpData_f5 0.003082 0.00000  test
                avx_ChirpData_f6 0.002211 0.00000  test
                 avx_ChirpData_b 0.002080 0.00000  choice

            Third run

                     v_ChirpData 0.005128 0.00000  test
                   fpu_ChirpData 0.013508 0.00000  test
               fpu_opt_ChirpData 0.005062 0.00000  test
             sse1_ChirpData_ak8e 0.005944 0.00000  test
              sse2_ChirpData_ak8 0.004307 0.00000  test
              sse3_ChirpData_ak8 0.004244 0.00000  test
                 avx_ChirpData_a 0.002100 0.00000  test
                 avx_ChirpData_b 0.002253 0.00000  test
                 avx_ChirpData_c 0.002125 0.00000  test
                 avx_ChirpData_d 0.001955 0.00000  test
                 avx_ChirpData_e 0.002250 0.00000  test
                avx_ChirpData_f2 0.002177 0.00000  test
                avx_ChirpData_f3 0.002137 0.00000  test
                avx_ChirpData_f4 0.002128 0.00000  test
                avx_ChirpData_f5 0.002131 0.00000  test
                avx_ChirpData_f6 0.002574 0.00000  test
                 avx_ChirpData_d 0.001955 0.00000  choice

                   Test duration     8.86 seconds

Ftst_v7 completed successfully.

Offline Claggy

  • Alpha Tester
  • Knight who says 'Ni!'
  • ***
  • Posts: 3111
    • My computers at Seti Beta
Re: AVX Optimized App Development
« Reply #97 on: 08 May 2012, 06:25:57 am »
i7-2600K @4.7GHz (Boinc runninG):

=========================================================
Ftst_v7_J47_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.008860 0.00000&nb1p; test
              &bbsp;    fpu_ChirpData 0.016684 0.00000  test
               fpu_opt_ChirpData 0.008903 0.00000  test
          &nbB`;  sse1_ChirpData_ak8e 0.006385 0.00000  test
              sse2_ChirpData_ak8 0.006487 0.00000  test
              sse3_ChirpData_ak8 0.004559 0.00000  test
              &nb 0;  avx_ChirpData_a 0.003887 0.00000  test
                 avx_ChirpData_b 0.002730 0.00000  test
                 avx_ChirpData_c 0.002785 0.00000  test
                 avx_ChirpData_d 0.002783 0.00000  test
                 avx_ChirpData_e 0.002666 0.00000  test
                avx_ChirpData_f2 0.002879 0.00000  te{u
                avx_ChirpData_f3 0.002895 0.00000  test
                avx_ChirpData_f4 0.002793 0.00000  test
                avx_ChirpData_f5 0.002855 0.00000  test
                avx_ChirpData_f6 0.002730 0.00000  test
                 avx_ChirpData_e 0.002666 0.00000  choice

            Second run

                     v_ChirpData 0.009176 0.00000  test
                   fpu_ChirpData 0.015542 0.00000  test
               fpu_opt_ChirpData 0.008050 0.00000  test
             sse1_ChirpData_ak8e 0.006373 0.00000  test
              sse2_ChirpData_ak8 0.004997 0.00000  test
              sse3_ChirpData_ak8 0.005030 0.00000  test
              &nb 0;  avx_ChirpData_a 0.002759 0.00000  test
  &nbpp;              avx_ChirpData_b 0.002882 0.00000  test
                 avx_ChirpData_c 0.002757 0.00000  test
                 avx_ChirpData_d 0.002749 0.00000  test
                 avx_ChirpData_e 0.002624 0.00000  test
                avx_ChirpData_f2 0.002999 0.00000  test
                avx_ChirpData_f3 0.002861 0.00000  test
                avx_ChirpData_f4 0.002781 0.00000  test
                avx_ChirpData_f5 0.003006 0.00000&nb1p; test
              &fbsp; avx_ChirpData_f6 0.002831 0.00000  test
                 avx_ChirpData_e 0.002624 0.00000  choice

            Third run

                     v_ChirpData 0.009784 0.00000  test
                   fpu_ChirpData 0.015763 0.00000  test
               fpu_opt_ChirpData 0.008842 0.00000  test
    &fbsp;        sse1_ChirpData_ak8e 0.006321 0.00000  test
              sse2_ChirpData_ak8 0.004980 0.00000  test
  &nbp0;           sse3_ChirpData_ak8 0.005050 0.00000  test
                 avx_ChirpData_a 0.002750 0.00000  test
                 avx_ChirpData_b 0.004515 0.00000  test
                 avx_ChirpData_c 0.002876 0.00000  test
                 avx_ChirpData_d 0.003186 0.00000  test
                 avx_ChirpData_e 0.002674 0.00000  test
                avx_ChirpData_f2 0.002961 0&00000  test
                avx_ChirpData_f3 0.002739 0.00000  test
                avx_ChirpData_f4 0.002916 0.00000  test
                avx_ChirpData_f5 0.002791 0.00000  tĺst
                avx_ChirpData_f6 0.002862 0.00000  test
                 avx_ChirpData_e 0.002674 0.00000  choice

    &bbsp;              Test duration    8.37 seconds

Ftst_v7 completed successfully.
=========================================================

i7-2600K @4.7GHz (Boinc computing suspended):

=========================================================
Ftst_H_J47_Chirponly started.

Optimal function choices:
--------------------------------------------------------
              &fbsp;             name   timing   error
--------------------------------------------------------
            &nbp0;        v_ChirpData 0.003838 0.00000  test
                   fpu_ChirpData 0.008704 0.00000  test
               fpu_opt_ChirpData 0.003722 0.00000  test
             sse1_ChirpData_ak8e 0.004215 0.00000  test
              sse2_ChirpData_ak8 0.003153 0.00000  test
              sse3_ChirpData_ak8 0.003115 0.00000  test
                 avx_ChirpData_a 0.001477 0.00000  test
                 avx_ChirpData_b 0.001646  .00000  test
                 avx_ChirpData_c 0.001490 0.00000  test
                 avx_ChirpData_d 0.001383 0.00000  test
                 avx_ChirpData_e 0.001538 0.00000  test
                avx_ChirpData_f2 0.001624 0.00000  test
                avx_ChirpData_f3 0.001604 0.00000  test
                avx_ChirpData_f4 0.001585 0.00000  test
                avx_ChirpData_f5 0.001590 0.00000  test
&fbsp;               avx_ChirpData_f6 0.001580 0.00000  test
                 avx_ChirpData_d 0.001383 0.00000  choice

            Second run

                     v_ChirpData 0.003820 0.00000&n`pp; test
                   fpu_ChirpData 0.008700 0.00000  test
               fpu_opt_ChirpData 0.003732 0.00000  test
             sse1_ChirpData_ak8e 0.004214 0.00000  test
              sse2_ChirpData_ak8 0.003154 0.00000  test
              sse3_ChirpData_ak8 0.003121 0.00000  test
                 avx_ChirpData_a 0.001488 0.00000  test
                 avx_ChirpData_b 0.001651 0.00000  test
                 avx_ChirpData_c 0.001490 0.00000  test
                 avx_ChirpData_d 0.001422 0.00000  test
                 avx_ChirpData_e 0.001538 0.00000  test
                avx_ChirpData_f2 0.001625 0.00000  test
                avx_ChirpData_f3 0.001600 0.00000  test
                avx_ChirpData_f4 0.001548 0.00000  test
                avx_ChirpData_f5 0.001585 0.00000  test
                avx_ChirpData_f6 0.001583 0.00000  test
                 avx_ChirpData_d 0.001422 0.00000  choice

        &fbsp;   Third run

                     v_ChirpData 0.003832 0.00000  test
                   fpu_ChirpData 0.008713 0.00000  test
               fpu_opt_ChirpData 0.003722 0.00000  test
             sse1_ChirpData_ak8e 0.004213 0.00000  test
              sse2_ChirpData_ak8 0.003153 0.00000  test
              sse3_ChirpData_ak8 0.003117 0.00000  test
                 avx_ChirpData_a 0.001474 0.00000  test
                 avx_ChirpData_b 0.001645 0.00000  test
                 avx_ChirpData_c 0.001488 0.00000  test
                 avx_ChirpData_d 0.001378 0.00000  test
                 avx_ChirpData_e 0.001542 0.00000  test
                avx_ChirpData_f2 0.001623 0.00000  test
                avx_ChirpData_f3 0.001608 0.00000  test
                avx_ChirpData_f4 0.001614 0.00000  test
                avx_ChirpData_f5 0.001584 0.00000  test
                avx_ChirpData_f6 0.001582 0.00000  test
                 avx_ChirpData_d 0.001378 0.00000  choice

                   Test duration     5.96 seconds

Ftst_v7 completed successfully.

Claggy

Offline KarVi

  • Alpha Tester
  • Knight Templar
  • ***
  • Posts: 252
Re: AVX Optimized App Development
« Reply #98 on: 08 May 2012, 12:27:17 pm »
FX 8150@4.5G

Boinc paused.

=========================================================
Ftst_v7_J47_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.007717 0.00000  test
                   fpu_ChirpData 0.014005 0.00000  test
               fpu_opt_ChirpData 0.007586 0.00000  test
             sse1_ChirpData_ak8e 0.005772 0.00000  test
              sse2_ChirpData_ak8 0.003663 0.00000  test
              sse3_ChirpData_ak8 0.003739 0.00000  test
                 avx_ChirpData_a 0.003091 0.00000  test
                 avx_ChirpData_b 0.003054 0.00000  test
                 avx_ChirpData_c 0.003303 0.00000  test
                 avx_ChirpData_d 0.003233 0.00000  test
                 avx_ChirpData_e 0.003141 0.00000  test
                avx_ChirpData_f2 0.003018 0.00000  test
                avx_ChirpData_f3 0.002999 0.00000  test
                avx_ChirpData_f4 0.002985 0.00000  test
                avx_ChirpData_f5 0.002971 0.00000  test
                avx_ChirpData_f6 0.002962 0.00000  test
                avx_ChirpData_f6 0.002962 0.00000  choice

            Second run

                     v_ChirpData 0.007712 0.00000  test
                   fpu_ChirpData 0.014014 0.00000  test
               fpu_opt_ChirpData 0.007585 0.00000  test
             sse1_ChirpData_ak8e 0.005765 0.00000  test
              sse2_ChirpData_ak8 0.003664 0.00000  test
              sse3_ChirpData_ak8 0.003735 0.00000  test
                 avx_ChirpData_a 0.003087 0.00000  test
                 avx_ChirpData_b 0.003054 0.00000  test
                 avx_ChirpData_c 0.003295 0.00000  test
                 avx_ChirpData_d 0.003230 0.00000  test
                 avx_ChirpData_e 0.003139 0.00000  test
                avx_ChirpData_f2 0.003020 0.00000  test
                avx_ChirpData_f3 0.002997 0.00000  test
                avx_ChirpData_f4 0.002981 0.00000  test
                avx_ChirpData_f5 0.002968 0.00000  test
                avx_ChirpData_f6 0.002954 0.00000  test
                avx_ChirpData_f6 0.002954 0.00000  choice

            Third run

                     v_ChirpData 0.007753 0.00000  test
                   fpu_ChirpData 0.013998 0.00000  test
               fpu_opt_ChirpData 0.007643 0.00000  test
             sse1_ChirpData_ak8e 0.005730 0.00000  test
              sse2_ChirpData_ak8 0.003675 0.00000  test
              sse3_ChirpData_ak8 0.003738 0.00000  test
                 avx_ChirpData_a 0.003090 0.00000  test
                 avx_ChirpData_b 0.003052 0.00000  test
                 avx_ChirpData_c 0.003302 0.00000  test
                 avx_ChirpData_d 0.003231 0.00000  test
                 avx_ChirpData_e 0.003145 0.00000  test
                avx_ChirpData_f2 0.003019 0.00000  test
                avx_ChirpData_f3 0.002999 0.00000  test
                avx_ChirpData_f4 0.002987 0.00000  test
                avx_ChirpData_f5 0.002980 0.00000  test
                avx_ChirpData_f6 0.002960 0.00000  test
                avx_ChirpData_f6 0.002960 0.00000  choice

                   Test duration     7.27 seconds

Ftst_v7 completed successfully.

Seems my 8150 is more consistent about choosing f6 than arkayn's FX-4100... I wonder why?
A smile is the shortest distance between two peoble (Victor Borge).

Offline KarVi

  • Alpha Tester
  • Knight Templar
  • ***
  • Posts: 252
Re: AVX Optimized App Development
« Reply #99 on: 08 May 2012, 12:35:46 pm »
One more test with boinc running (7xMB + 1xAP)

Seems to still prefer f6, allthough not as clearly as before.

=========================================================
Ftst_v7_J47_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.010724 0.00000  test
                   fpu_ChirpData 0.019692 0.00000  test
               fpu_opt_ChirpData 0.010554 0.00000  test
             sse1_ChirpData_ak8e 0.007564 0.00000  test
              sse2_ChirpData_ak8 0.004928 0.00000  test
              sse3_ChirpData_ak8 0.005026 0.00000  test
                 avx_ChirpData_a 0.004259 0.00000  test
                 avx_ChirpData_b 0.003701 0.00000  test
                 avx_ChirpData_c 0.004109 0.00000  test
                 avx_ChirpData_d 0.003646 0.00000  test
                 avx_ChirpData_e 0.003763 0.00000  test
                avx_ChirpData_f2 0.004385 0.00000  test
                avx_ChirpData_f3 0.004394 0.00000  test
                avx_ChirpData_f4 0.004408 0.00000  test
                avx_ChirpData_f5 0.004409 0.00000  test
                avx_ChirpData_f6 0.004051 0.00000  test
                 avx_ChirpData_d 0.003646 0.00000  choice

            Second run

                     v_ChirpData 0.011319 0.00000  test
                   fpu_ChirpData 0.018217 0.00000  test
               fpu_opt_ChirpData 0.011744 0.00000  test
             sse1_ChirpData_ak8e 0.006820 0.00000  test
              sse2_ChirpData_ak8 0.004587 0.00000  test
              sse3_ChirpData_ak8 0.004665 0.00000  test
                 avx_ChirpData_a 0.004079 0.00000  test
                 avx_ChirpData_b 0.003883 0.00000  test
                 avx_ChirpData_c 0.004043 0.00000  test
                 avx_ChirpData_d 0.003880 0.00000  test
                 avx_ChirpData_e 0.003750 0.00000  test
                avx_ChirpData_f2 0.003807 0.00000  test
                avx_ChirpData_f3 0.003727 0.00000  test
                avx_ChirpData_f4 0.003738 0.00000  test
                avx_ChirpData_f5 0.003711 0.00000  test
                avx_ChirpData_f6 0.003696 0.00000  test
                avx_ChirpData_f6 0.003696 0.00000  choice

            Third run

                     v_ChirpData 0.012288 0.00000  test
                   fpu_ChirpData 0.017790 0.00000  test
               fpu_opt_ChirpData 0.011402 0.00000  test
             sse1_ChirpData_ak8e 0.006751 0.00000  test
              sse2_ChirpData_ak8 0.004733 0.00000  test
              sse3_ChirpData_ak8 0.004589 0.00000  test
                 avx_ChirpData_a 0.004029 0.00000  test
                 avx_ChirpData_b 0.003895 0.00000  test
                 avx_ChirpData_c 0.003974 0.00000  test
                 avx_ChirpData_d 0.003813 0.00000  test
                 avx_ChirpData_e 0.003718 0.00000  test
                avx_ChirpData_f2 0.003792 0.00000  test
                avx_ChirpData_f3 0.003801 0.00000  test
                avx_ChirpData_f4 0.003657 0.00000  test
                avx_ChirpData_f5 0.003624 0.00000  test
                avx_ChirpData_f6 0.003577 0.00000  test
                avx_ChirpData_f6 0.003577 0.00000  choice

                   Test duration     9.10 seconds

Ftst_v7 completed successfully.
A smile is the shortest distance between two peoble (Victor Borge).

Offline Josef W. Segur

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 3112
Re: AVX Optimized App Development
« Reply #100 on: 08 May 2012, 11:46:52 pm »
...
Seems my 8150 is more consistent about choosing f6 than arkayn's FX-4100... I wonder why?

Maybe a measure of how well the hardware prefetching is matched to the memory system. In the attached J48 I've added an fn with no software prefetching, perhaps your system will prefer that over f6.

I've also modified the way the test time is calculated slightly. Each test consists of ten runs and the average of all was used, now I'm dropping the slowest of the ten runs to reduce the effect of transient conditions. I expect it to still vary more with BOINC running than without, though.

Edit: Attachment removed, see later post for current test.
                                                               Joe
« Last Edit: 11 May 2012, 12:33:59 am by Josef W. Segur »

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #101 on: 09 May 2012, 12:45:22 am »
I don't know if it makes all that much difference but I am running BOINC on the GTX460 while the test is running, the CPU's are idle though.

=========================================================
Ftst_v7_J48_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.009465 0.00000  test
                   fpu_ChirpData 0.018363 0.00000  test
               fpu_opt_ChirpData 0.009566 0.00000  test
             sse1_ChirpData_ak8e 0.007725 0.00000  test
              sse2_ChirpData_ak8 0.004682 0.00000  test
              sse3_ChirpData_ak8 0.004917 0.00000  test
                 avx_ChirpData_a 0.004643 0.00000  test
                 avx_ChirpData_b 0.004889 0.00000  test
                 avx_ChirpData_c 0.004597 0.00000  test
                 avx_ChirpData_d 0.004607 0.00000  test
                 avx_ChirpData_e 0.004117 0.00000  test
                avx_ChirpData_f2 0.003935 0.00000  test
                avx_ChirpData_f3 0.004306 0.00000  test
                avx_ChirpData_f4 0.003974 0.00000  test
                avx_ChirpData_f5 0.003947 0.00000  test
                avx_ChirpData_f6 0.004002 0.00000  test
                avx_ChirpData_fn 0.004189 0.00000  test
                avx_ChirpData_f2 0.003935 0.00000  choice

            Second run

                     v_ChirpData 0.009229 0.00000  test
                   fpu_ChirpData 0.017868 0.00000  test
               fpu_opt_ChirpData 0.009018 0.00000  test
             sse1_ChirpData_ak8e 0.007519 0.00000  test
              sse2_ChirpData_ak8 0.004623 0.00000  test
              sse3_ChirpData_ak8 0.004755 0.00000  test
                 avx_ChirpData_a 0.003940 0.00000  test
                 avx_ChirpData_b 0.003992 0.00000  test
                 avx_ChirpData_c 0.004212 0.00000  test
                 avx_ChirpData_d 0.004157 0.00000  test
                 avx_ChirpData_e 0.004050 0.00000  test
                avx_ChirpData_f2 0.004179 0.00000  test
                avx_ChirpData_f3 0.004142 0.00000  test
                avx_ChirpData_f4 0.003875 0.00000  test
                avx_ChirpData_f5 0.004078 0.00000  test
                avx_ChirpData_f6 0.004131 0.00000  test
                avx_ChirpData_fn 0.004142 0.00000  test
                avx_ChirpData_f4 0.003875 0.00000  choice

            Third run

                     v_ChirpData 0.009246 0.00000  test
                   fpu_ChirpData 0.018076 0.00000  test
               fpu_opt_ChirpData 0.009144 0.00000  test
             sse1_ChirpData_ak8e 0.007887 0.00000  test
              sse2_ChirpData_ak8 0.004614 0.00000  test
              sse3_ChirpData_ak8 0.004732 0.00000  test
                 avx_ChirpData_a 0.004012 0.00000  test
                 avx_ChirpData_b 0.003975 0.00000  test
                 avx_ChirpData_c 0.004200 0.00000  test
                 avx_ChirpData_d 0.004111 0.00000  test
                 avx_ChirpData_e 0.003970 0.00000  test
                avx_ChirpData_f2 0.003894 0.00000  test
                avx_ChirpData_f3 0.003784 0.00000  test
                avx_ChirpData_f4 0.003861 0.00000  test
                avx_ChirpData_f5 0.003912 0.00000  test
                avx_ChirpData_f6 0.003801 0.00000  test
                avx_ChirpData_fn 0.003966 0.00000  test
                avx_ChirpData_f3 0.003784 0.00000  choice

                   Test duration    10.19 seconds

Ftst_v7 completed successfully.

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #102 on: 09 May 2012, 12:47:40 am »
Here is one with everything idle on the system.

=========================================================
Ftst_v7_J48_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.009247 0.00000  test
                   fpu_ChirpData 0.017567 0.00000  test
               fpu_opt_ChirpData 0.008871 0.00000  test
             sse1_ChirpData_ak8e 0.007218 0.00000  test
              sse2_ChirpData_ak8 0.004589 0.00000  test
              sse3_ChirpData_ak8 0.004675 0.00000  test
                 avx_ChirpData_a 0.003838 0.00000  test
                 avx_ChirpData_b 0.003844 0.00000  test
                 avx_ChirpData_c 0.004144 0.00000  test
                 avx_ChirpData_d 0.004042 0.00000  test
                 avx_ChirpData_e 0.003897 0.00000  test
                avx_ChirpData_f2 0.003701 0.00000  test
                avx_ChirpData_f3 0.003696 0.00000  test
                avx_ChirpData_f4 0.003701 0.00000  test
                avx_ChirpData_f5 0.003678 0.00000  test
                avx_ChirpData_f6 0.003678 0.00000  test
                avx_ChirpData_fn 0.004046 0.00000  test
                avx_ChirpData_f6 0.003678 0.00000  choice

            Second run

                     v_ChirpData 0.009537 0.00000  test
                   fpu_ChirpData 0.017549 0.00000  test
               fpu_opt_ChirpData 0.008801 0.00000  test
             sse1_ChirpData_ak8e 0.007091 0.00000  test
              sse2_ChirpData_ak8 0.004581 0.00000  test
              sse3_ChirpData_ak8 0.004691 0.00000  test
                 avx_ChirpData_a 0.003840 0.00000  test
                 avx_ChirpData_b 0.003835 0.00000  test
                 avx_ChirpData_c 0.004116 0.00000  test
                 avx_ChirpData_d 0.004036 0.00000  test
                 avx_ChirpData_e 0.003922 0.00000  test
                avx_ChirpData_f2 0.003738 0.00000  test
                avx_ChirpData_f3 0.003700 0.00000  test
                avx_ChirpData_f4 0.003722 0.00000  test
                avx_ChirpData_f5 0.003709 0.00000  test
                avx_ChirpData_f6 0.003696 0.00000  test
                avx_ChirpData_fn 0.003885 0.00000  test
                avx_ChirpData_f6 0.003696 0.00000  choice

            Third run

                     v_ChirpData 0.008990 0.00000  test
                   fpu_ChirpData 0.017410 0.00000  test
               fpu_opt_ChirpData 0.008669 0.00000  test
             sse1_ChirpData_ak8e 0.007166 0.00000  test
              sse2_ChirpData_ak8 0.004573 0.00000  test
              sse3_ChirpData_ak8 0.004653 0.00000  test
                 avx_ChirpData_a 0.003878 0.00000  test
                 avx_ChirpData_b 0.003845 0.00000  test
                 avx_ChirpData_c 0.004118 0.00000  test
                 avx_ChirpData_d 0.004046 0.00000  test
                 avx_ChirpData_e 0.003878 0.00000  test
                avx_ChirpData_f2 0.003707 0.00000  test
                avx_ChirpData_f3 0.003746 0.00000  test
                avx_ChirpData_f4 0.003841 0.00000  test
                avx_ChirpData_f5 0.003697 0.00000  test
                avx_ChirpData_f6 0.003668 0.00000  test
                avx_ChirpData_fn 0.003951 0.00000  test
                avx_ChirpData_f6 0.003668 0.00000  choice

                   Test duration     9.64 seconds

Ftst_v7 completed successfully.

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #103 on: 09 May 2012, 12:49:58 am »
i3-2120, GTX560 crunching and CPU idle

=========================================================
Ftst_v7_J47_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.005192 0.00000  test
                   fpu_ChirpData 0.016616 0.00000  test
               fpu_opt_ChirpData 0.005312 0.00000  test
             sse1_ChirpData_ak8e 0.007554 0.00000  test
              sse2_ChirpData_ak8 0.004366 0.00000  test
              sse3_ChirpData_ak8 0.004680 0.00000  test
                 avx_ChirpData_a 0.002474 0.00000  test
                 avx_ChirpData_b 0.002890 0.00000  test
                 avx_ChirpData_c 0.002728 0.00000  test
                 avx_ChirpData_d 0.002087 0.00000  test
                 avx_ChirpData_e 0.002756 0.00000  test
                avx_ChirpData_f2 0.002708 0.00000  test
                avx_ChirpData_f3 0.002074 0.00000  test
                avx_ChirpData_f4 0.002303 0.00000  test
                avx_ChirpData_f5 0.002295 0.00000  test
                avx_ChirpData_f6 0.002532 0.00000  test
                avx_ChirpData_f3 0.002074 0.00000  choice

            Second run

                     v_ChirpData 0.007313 0.00000  test
                   fpu_ChirpData 0.015500 0.00000  test
               fpu_opt_ChirpData 0.005429 0.00000  test
             sse1_ChirpData_ak8e 0.006784 0.00000  test
              sse2_ChirpData_ak8 0.004199 0.00000  test
              sse3_ChirpData_ak8 0.004349 0.00000  test
                 avx_ChirpData_a 0.002453 0.00000  test
                 avx_ChirpData_b 0.002080 0.00000  test
                 avx_ChirpData_c 0.002121 0.00000  test
                 avx_ChirpData_d 0.002363 0.00000  test
                 avx_ChirpData_e 0.002128 0.00000  test
                avx_ChirpData_f2 0.002339 0.00000  test
                avx_ChirpData_f3 0.002652 0.00000  test
                avx_ChirpData_f4 0.002237 0.00000  test
                avx_ChirpData_f5 0.003082 0.00000  test
                avx_ChirpData_f6 0.002211 0.00000  test
                 avx_ChirpData_b 0.002080 0.00000  choice

            Third run

                     v_ChirpData 0.005128 0.00000  test
                   fpu_ChirpData 0.013508 0.00000  test
               fpu_opt_ChirpData 0.005062 0.00000  test
             sse1_ChirpData_ak8e 0.005944 0.00000  test
              sse2_ChirpData_ak8 0.004307 0.00000  test
              sse3_ChirpData_ak8 0.004244 0.00000  test
                 avx_ChirpData_a 0.002100 0.00000  test
                 avx_ChirpData_b 0.002253 0.00000  test
                 avx_ChirpData_c 0.002125 0.00000  test
                 avx_ChirpData_d 0.001955 0.00000  test
                 avx_ChirpData_e 0.002250 0.00000  test
                avx_ChirpData_f2 0.002177 0.00000  test
                avx_ChirpData_f3 0.002137 0.00000  test
                avx_ChirpData_f4 0.002128 0.00000  test
                avx_ChirpData_f5 0.002131 0.00000  test
                avx_ChirpData_f6 0.002574 0.00000  test
                 avx_ChirpData_d 0.001955 0.00000  choice

                   Test duration     8.86 seconds

Ftst_v7 completed successfully.

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #104 on: 09 May 2012, 12:51:23 am »
i3-2120, idle

=========================================================
Ftst_v7_J48_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.004554 0.00000  test
                   fpu_ChirpData 0.012295 0.00000  test
               fpu_opt_ChirpData 0.004339 0.00000  test
             sse1_ChirpData_ak8e 0.006798 0.00000  test
              sse2_ChirpData_ak8 0.004179 0.00000  test
              sse3_ChirpData_ak8 0.004091 0.00000  test
                 avx_ChirpData_a 0.002076 0.00000  test
                 avx_ChirpData_b 0.002049 0.00000  test
                 avx_ChirpData_c 0.002097 0.00000  test
                 avx_ChirpData_d 0.002275 0.00000  test
                 avx_ChirpData_e 0.002107 0.00000  test
                avx_ChirpData_f2 0.002080 0.00000  test
                avx_ChirpData_f3 0.002063 0.00000  test
                avx_ChirpData_f4 0.002049 0.00000  test
                avx_ChirpData_f5 0.002050 0.00000  test
                avx_ChirpData_f6 0.002047 0.00000  test
                avx_ChirpData_fn 0.002191 0.00000  test
                avx_ChirpData_f6 0.002047 0.00000  choice

            Second run

                     v_ChirpData 0.004551 0.00000  test
                   fpu_ChirpData 0.012311 0.00000  test
               fpu_opt_ChirpData 0.004347 0.00000  test
             sse1_ChirpData_ak8e 0.005693 0.00000  test
              sse2_ChirpData_ak8 0.004187 0.00000  test
              sse3_ChirpData_ak8 0.004125 0.00000  test
                 avx_ChirpData_a 0.002071 0.00000  test
                 avx_ChirpData_b 0.002055 0.00000  test
                 avx_ChirpData_c 0.002099 0.00000  test
                 avx_ChirpData_d 0.001932 0.00000  test
                 avx_ChirpData_e 0.001932 0.00000  test
                avx_ChirpData_f2 0.002088 0.00000  test
                avx_ChirpData_f3 0.002060 0.00000  test
                avx_ChirpData_f4 0.002052 0.00000  test
                avx_ChirpData_f5 0.002050 0.00000  test
                avx_ChirpData_f6 0.002052 0.00000  test
                avx_ChirpData_fn 0.002187 0.00000  test
                 avx_ChirpData_d 0.001932 0.00000  choice

            Third run

                     v_ChirpData 0.004542 0.00000  test
                   fpu_ChirpData 0.012313 0.00000  test
               fpu_opt_ChirpData 0.004336 0.00000  test
             sse1_ChirpData_ak8e 0.005710 0.00000  test
              sse2_ChirpData_ak8 0.004181 0.00000  test
              sse3_ChirpData_ak8 0.004121 0.00000  test
                 avx_ChirpData_a 0.002073 0.00000  test
                 avx_ChirpData_b 0.002051 0.00000  test
                 avx_ChirpData_c 0.002099 0.00000  test
                 avx_ChirpData_d 0.001932 0.00000  test
                 avx_ChirpData_e 0.001932 0.00000  test
                avx_ChirpData_f2 0.002078 0.00000  test
                avx_ChirpData_f3 0.002061 0.00000  test
                avx_ChirpData_f4 0.002052 0.00000  test
                avx_ChirpData_f5 0.002053 0.00000  test
                avx_ChirpData_f6 0.002048 0.00000  test
                avx_ChirpData_fn 0.002186 0.00000  test
                 avx_ChirpData_e 0.001932 0.00000  choice

                   Test duration     8.94 seconds

Ftst_v7 completed successfully.

 

Welcome, Guest.
Please login or register.
 
 
 
Forgot your password?
Members
Total Members: 97
Latest: ToeBee
New This Month: 0
New This Week: 0
New Today: 0
Stats
Total Posts: 59559
Total Topics: 1672
Most Online Today: 226
Most Online Ever: 983
(20 Jan 2020, 03:17:55 pm)
Users Online
Members: 0
Guests: 25
Total: 25
Powered by EzPortal