+- +-
Say hello if visiting :) by Gecko
11 Jan 2023, 07:43:05 pm

Seti is down again by Mike
09 Aug 2017, 10:02:44 am

Some considerations regarding OpenCL MultiBeam app tuning from algorithm view by Raistmer
11 Dec 2016, 06:30:56 am

Loading APU to the limit: performance considerations by Mike
05 Nov 2016, 06:49:26 am

Better sleep on Windows - new round by Raistmer
26 Aug 2016, 02:02:31 pm

Author Topic: AVX Optimized App Development  (Read 119225 times)

Offline Mike

  • Alpha Tester
  • Knight who says 'Ni!'
  • ***
  • Posts: 2427
Re: AVX Optimized App Development
« Reply #105 on: 09 May 2012, 05:28:19 am »
FX 8150 @4.4 GHZ

Win 8 CP

Ftst_v7_J48_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.008454 0.00000  test
                   fpu_ChirpData 0.014305 0.00000  test
               fpu_opt_ChirpData 0.009795 0.00000  test
             sse1_ChirpData_ak8e 0.005828 0.00000  test
              sse2_ChirpData_ak8 0.003836 0.00000  test
              sse3_ChirpData_ak8 0.003835 0.00000  test
                 avx_ChirpData_a 0.003266 0.00000  test
                 avx_ChirpData_b 0.003247 0.00000  test
                 avx_ChirpData_c 0.003435 0.00000  test
                 avx_ChirpData_d 0.003360 0.00000  test
                 avx_ChirpData_e 0.003214 0.00000  test
                avx_ChirpData_f2 0.003205 0.00000  test
                avx_ChirpData_f3 0.003171 0.00000  test
                avx_ChirpData_f4 0.003129 0.00000  test
                avx_ChirpData_f5 0.003122 0.00000  test
                avx_ChirpData_f6 0.003112 0.00000  test
                avx_ChirpData_fn 0.003147 0.00000  test
                avx_ChirpData_f6 0.003112 0.00000  choice

            Second run

                     v_ChirpData 0.009746 0.00000  test
                   fpu_ChirpData 0.014194 0.00000  test
               fpu_opt_ChirpData 0.009803 0.00000  test
             sse1_ChirpData_ak8e 0.005828 0.00000  test
              sse2_ChirpData_ak8 0.003910 0.00000  test
              sse3_ChirpData_ak8 0.003845 0.00000  test
                 avx_ChirpData_a 0.003409 0.00000  test
                 avx_ChirpData_b 0.003379 0.00000  test
                 avx_ChirpData_c 0.003502 0.00000  test
                 avx_ChirpData_d 0.003457 0.00000  test
                 avx_ChirpData_e 0.003293 0.00000  test
                avx_ChirpData_f2 0.003418 0.00000  test
                avx_ChirpData_f3 0.003352 0.00000  test
                avx_ChirpData_f4 0.003270 0.00000  test
                avx_ChirpData_f5 0.003236 0.00000  test
                avx_ChirpData_f6 0.003192 0.00000  test
                avx_ChirpData_fn 0.003393 0.00000  test
                avx_ChirpData_f6 0.003192 0.00000  choice

            Third run

                     v_ChirpData 0.009865 0.00000  test
                   fpu_ChirpData 0.014297 0.00000  test
               fpu_opt_ChirpData 0.009830 0.00000  test
             sse1_ChirpData_ak8e 0.005848 0.00000  test
              sse2_ChirpData_ak8 0.003917 0.00000  test
              sse3_ChirpData_ak8 0.003848 0.00000  test
                 avx_ChirpData_a 0.003417 0.00000  test
                 avx_ChirpData_b 0.003311 0.00000  test
                 avx_ChirpData_c 0.003476 0.00000  test
                 avx_ChirpData_d 0.003420 0.00000  test
                 avx_ChirpData_e 0.003312 0.00000  test
                avx_ChirpData_f2 0.003422 0.00000  test
                avx_ChirpData_f3 0.003325 0.00000  test
                avx_ChirpData_f4 0.003279 0.00000  test
                avx_ChirpData_f5 0.003280 0.00000  test
                avx_ChirpData_f6 0.003194 0.00000  test
                avx_ChirpData_fn 0.003371 0.00000  test
                avx_ChirpData_f6 0.003194 0.00000  choice

                   Test duration     8.23 seconds

Ftst_v7 completed successfully.

Offline Claggy

  • Alpha Tester
  • Knight who says 'Ni!'
  • ***
  • Posts: 3111
    • My computers at Seti Beta
Re: AVX Optimized App Development
« Reply #106 on: 09 May 2012, 05:41:00 am »
i7-2600K @4.7GHz (Boinc running):

=========================================================
Ftst_v7_J48_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.008760 0.00000  test
                   fpu_ChirpData 0.015042 0.00000  test
               fpu_opt_ChirpData 0.008035 0.00000  test
             sse1_ChirpData_ak8e 0.006087 0.00000  test
              sse2_ChirpData_ak8 0.005136 0.00000  test
              sse3_ChirpData_ak8 0.004889 0.00000  test
                 avx_ChirpData_a 0.002961 0.00000  test
                 avx_ChirpData_b 0.002496 0.00000  test
                 avx_ChirpData_c 0.002585 0.00000  test
                 avx_ChirpData_d 0.002622 0.00000  test
                 avx_ChirpData_e 0.002608 0.00000  test
                avx_ChirpData_f2 0.002763 0.00000  test
                avx_ChirpData_f3 0.002804 0.00000  test
                avx_ChirpData_f4 0.002403 0.00000  test
                avx_ChirpData_f5 0.002581 0.00000  test
                avx_ChirpData_f6 0.002465 0.00000  test
                avx_ChirpData_fn 0.002846 0.00000  test
                avx_ChirpData_f4 0.002403 0.00000  choice

            Second run

                     v_ChirpData 0.007861 0.00000  test
                   fpu_ChirpData 0.014469 0.00000  test
               fpu_opt_ChirpData 0.006947 0.00000  test
             sse1_ChirpData_ak8e 0.006156 0.00000  test
              sse2_ChirpData_ak8 0.004994 0.00000  test
              sse3_ChirpData_ak8 0.004901 0.00000  test
                 avx_ChirpData_a 0.002895 0.00000  test
                 avx_ChirpData_b 0.002575 0.00000  test
                 avx_ChirpData_c 0.002614 0.00000  test
                 avx_ChirpData_d 0.002759 0.00000  test
                 avx_ChirpData_e 0.002340 0.00000  test
                avx_ChirpData_f2 0.002927 0.00000  test
                avx_ChirpData_f3 0.002891 0.00000  test
                avx_ChirpData_f4 0.002491 0.00000  test
                avx_ChirpData_f5 0.002660 0.00000  test
                avx_ChirpData_f6 0.002420 0.00000  test
                avx_ChirpData_fn 0.003653 0.00000  test
                 avx_ChirpData_e 0.002340 0.00000  choice

            Third run

                     v_ChirpData 0.008828 0.00000  test
                   fpu_ChirpData 0.015331 0.00000  test
               fpu_opt_ChirpData 0.006832 0.00000  test
             sse1_ChirpData_ak8e 0.006328 0.00000  test
              sse2_ChirpData_ak8 0.004866 0.00000  test
              sse3_ChirpData_ak8 0.004908 0.00000  test
                 avx_ChirpData_a 0.002686 0.00000  test
                 avx_ChirpData_b 0.002764 0.00000  test
                 avx_ChirpData_c 0.002528 0.00000  test
                 avx_ChirpData_d 0.002557 0.00000  test
                 avx_ChirpData_e 0.002444 0.00000  test
                avx_ChirpData_f2 0.002746 0.00000  test
                avx_ChirpData_f3 0.002616 0.00000  test
                avx_ChirpData_f4 0.002821 0.00000  test
                avx_ChirpData_f5 0.002443 0.00000  test
                avx_ChirpData_f6 0.002607 0.00000  test
                avx_ChirpData_fn 0.003108 0.00000  test
                avx_ChirpData_f5 0.002443 0.00000  choice

                   Test duration     8.47 seconds

Ftst_v7 completed successfully.
=========================================================

i7-2600K @4.7GHz (Boinc computing suspended):

=========================================================
Ftst_v7_J48_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.003671 0.00000  test
                   fpu_ChirpData 0.008676 0.00000  test
               fpu_opt_ChirpData 0.003585 0.00000  test
             sse1_ChirpData_ak8e 0.004212 0.00000  test
              sse2_ChirpData_ak8 0.003154 0.00000  test
              sse3_ChirpData_ak8 0.003116 0.00000  test
                 avx_ChirpData_a 0.001474 0.00000  test
                 avx_ChirpData_b 0.001635 0.00000  test
                 avx_ChirpData_c 0.001500 0.00000  test
                 avx_ChirpData_d 0.001377 0.00000  test
                 avx_ChirpData_e 0.001522 0.00000  test
                avx_ChirpData_f2 0.001630 0.00000  test
                avx_ChirpData_f3 0.001588 0.00000  test
                avx_ChirpData_f4 0.001571 0.00000  test
                avx_ChirpData_f5 0.001567 0.00000  test
                avx_ChirpData_f6 0.001563 0.00000  test
                avx_ChirpData_fn 0.001727 0.00000  test
                 avx_ChirpData_d 0.001377 0.00000  choice

            Second run

                     v_ChirpData 0.003673 0.00000  test
                   fpu_ChirpData 0.008625 0.00000  test
               fpu_opt_ChirpData 0.003589 0.00000  test
             sse1_ChirpData_ak8e 0.004206 0.00000  test
              sse2_ChirpData_ak8 0.003152 0.00000  test
              sse3_ChirpData_ak8 0.003113 0.00000  test
                 avx_ChirpData_a 0.001469 0.00000  test
                 avx_ChirpData_b 0.001639 0.00000  test
                 avx_ChirpData_c 0.001482 0.00000  test
                 avx_ChirpData_d 0.001376 0.00000  test
                 avx_ChirpData_e 0.001521 0.00000  test
                avx_ChirpData_f2 0.001610 0.00000  test
                avx_ChirpData_f3 0.001584 0.00000  test
                avx_ChirpData_f4 0.001568 0.00000  test
                avx_ChirpData_f5 0.001564 0.00000  test
                avx_ChirpData_f6 0.001559 0.00000  test
                avx_ChirpData_fn 0.001744 0.00000  test
                 avx_ChirpData_d 0.001376 0.00000  choice

            Third run

                     v_ChirpData 0.003703 0.00000  test
                   fpu_ChirpData 0.008650 0.00000  test
               fpu_opt_ChirpData 0.003566 0.00000  test
             sse1_ChirpData_ak8e 0.004206 0.00000  test
              sse2_ChirpData_ak8 0.003152 0.00000  test
              sse3_ChirpData_ak8 0.003116 0.00000  test
                 avx_ChirpData_a 0.001470 0.00000  test
                 avx_ChirpData_b 0.001635 0.00000  test
                 avx_ChirpData_c 0.001483 0.00000  test
                 avx_ChirpData_d 0.001376 0.00000  test
                 avx_ChirpData_e 0.001520 0.00000  test
                avx_ChirpData_f2 0.001614 0.00000  test
                avx_ChirpData_f3 0.001585 0.00000  test
                avx_ChirpData_f4 0.001571 0.00000  test
                avx_ChirpData_f5 0.001566 0.00000  test
                avx_ChirpData_f6 0.001567 0.00000  test
                avx_ChirpData_fn 0.001727 0.00000  test
                 avx_ChirpData_d 0.001376 0.00000  choice

                   Test duration     6.29 seconds

Ftst_v7 completed successfully.

Claggy

Offline KarVi

  • Alpha Tester
  • Knight Templar
  • ***
  • Posts: 252
Re: AVX Optimized App Development
« Reply #107 on: 09 May 2012, 02:26:59 pm »
FX8150@4.5G

Boinc suspended:

=========================================================
Ftst_v7_J48_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.007228 0.00000  test
                   fpu_ChirpData 0.013807 0.00000  test
               fpu_opt_ChirpData 0.007158 0.00000  test
             sse1_ChirpData_ak8e 0.005662 0.00000  test
              sse2_ChirpData_ak8 0.003673 0.00000  test
              sse3_ChirpData_ak8 0.003739 0.00000  test
                 avx_ChirpData_a 0.003099 0.00000  test
                 avx_ChirpData_b 0.003029 0.00000  test
                 avx_ChirpData_c 0.003297 0.00000  test
                 avx_ChirpData_d 0.003240 0.00000  test
                 avx_ChirpData_e 0.003132 0.00000  test
                avx_ChirpData_f2 0.002997 0.00000  test
                avx_ChirpData_f3 0.002977 0.00000  test
                avx_ChirpData_f4 0.002973 0.00000  test
                avx_ChirpData_f5 0.002961 0.00000  test
                avx_ChirpData_f6 0.002952 0.00000  test
                avx_ChirpData_fn 0.003013 0.00000  test
                avx_ChirpData_f6 0.002952 0.00000  choice

            Second run

                     v_ChirpData 0.007250 0.00000  test
                   fpu_ChirpData 0.013798 0.00000  test
               fpu_opt_ChirpData 0.007152 0.00000  test
             sse1_ChirpData_ak8e 0.005679 0.00000  test
              sse2_ChirpData_ak8 0.003676 0.00000  test
              sse3_ChirpData_ak8 0.003735 0.00000  test
                 avx_ChirpData_a 0.003104 0.00000  test
                 avx_ChirpData_b 0.003030 0.00000  test
                 avx_ChirpData_c 0.003297 0.00000  test
                 avx_ChirpData_d 0.003240 0.00000  test
                 avx_ChirpData_e 0.003131 0.00000  test
                avx_ChirpData_f2 0.002998 0.00000  test
                avx_ChirpData_f3 0.002988 0.00000  test
                avx_ChirpData_f4 0.002974 0.00000  test
                avx_ChirpData_f5 0.002964 0.00000  test
                avx_ChirpData_f6 0.002956 0.00000  test
                avx_ChirpData_fn 0.003188 0.00000  test
                avx_ChirpData_f6 0.002956 0.00000  choice

            Third run

                     v_ChirpData 0.007288 0.00000  test
                   fpu_ChirpData 0.013806 0.00000  test
               fpu_opt_ChirpData 0.007163 0.00000  test
             sse1_ChirpData_ak8e 0.005677 0.00000  test
              sse2_ChirpData_ak8 0.003673 0.00000  test
              sse3_ChirpData_ak8 0.003732 0.00000  test
                 avx_ChirpData_a 0.003099 0.00000  test
                 avx_ChirpData_b 0.003029 0.00000  test
                 avx_ChirpData_c 0.003300 0.00000  test
                 avx_ChirpData_d 0.003235 0.00000  test
                 avx_ChirpData_e 0.003128 0.00000  test
                avx_ChirpData_f2 0.002994 0.00000  test
                avx_ChirpData_f3 0.002987 0.00000  test
                avx_ChirpData_f4 0.002975 0.00000  test
                avx_ChirpData_f5 0.002966 0.00000  test
                avx_ChirpData_f6 0.002952 0.00000  test
                avx_ChirpData_fn 0.003193 0.00000  test
                avx_ChirpData_f6 0.002952 0.00000  choice

                   Test duration     7.66 seconds

Ftst_v7 completed successfully.

Boinc running:

=========================================================
Ftst_v7_J48_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.011337 0.00000  test
                   fpu_ChirpData 0.018720 0.00000  test
               fpu_opt_ChirpData 0.011250 0.00000  test
             sse1_ChirpData_ak8e 0.007149 0.00000  test
              sse2_ChirpData_ak8 0.004990 0.00000  test
              sse3_ChirpData_ak8 0.004983 0.00000  test
                 avx_ChirpData_a 0.004490 0.00000  test
                 avx_ChirpData_b 0.004152 0.00000  test
                 avx_ChirpData_c 0.004441 0.00000  test
                 avx_ChirpData_d 0.004297 0.00000  test
                 avx_ChirpData_e 0.003984 0.00000  test
                avx_ChirpData_f2 0.004162 0.00000  test
                avx_ChirpData_f3 0.004241 0.00000  test
                avx_ChirpData_f4 0.004012 0.00000  test
                avx_ChirpData_f5 0.003996 0.00000  test
                avx_ChirpData_f6 0.003970 0.00000  test
                avx_ChirpData_fn 0.004261 0.00000  test
                avx_ChirpData_f6 0.003970 0.00000  choice

            Second run

                     v_ChirpData 0.011270 0.00000  test
                   fpu_ChirpData 0.018830 0.00000  test
               fpu_opt_ChirpData 0.011104 0.00000  test
             sse1_ChirpData_ak8e 0.007206 0.00000  test
              sse2_ChirpData_ak8 0.005025 0.00000  test
              sse3_ChirpData_ak8 0.004941 0.00000  test
                 avx_ChirpData_a 0.004436 0.00000  test
                 avx_ChirpData_b 0.004220 0.00000  test
                 avx_ChirpData_c 0.004531 0.00000  test
                 avx_ChirpData_d 0.004233 0.00000  test
                 avx_ChirpData_e 0.004130 0.00000  test
                avx_ChirpData_f2 0.004156 0.00000  test
                avx_ChirpData_f3 0.004129 0.00000  test
                avx_ChirpData_f4 0.003999 0.00000  test
                avx_ChirpData_f5 0.003965 0.00000  test
                avx_ChirpData_f6 0.003952 0.00000  test
                avx_ChirpData_fn 0.004213 0.00000  test
                avx_ChirpData_f6 0.003952 0.00000  choice

            Third run

                     v_ChirpData 0.011792 0.00000  test
                   fpu_ChirpData 0.018834 0.00000  test
               fpu_opt_ChirpData 0.010799 0.00000  test
             sse1_ChirpData_ak8e 0.007129 0.00000  test
              sse2_ChirpData_ak8 0.004906 0.00000  test
              sse3_ChirpData_ak8 0.004977 0.00000  test
                 avx_ChirpData_a 0.004436 0.00000  test
                 avx_ChirpData_b 0.004126 0.00000  test
                 avx_ChirpData_c 0.004484 0.00000  test
                 avx_ChirpData_d 0.004129 0.00000  test
                 avx_ChirpData_e 0.004036 0.00000  test
                avx_ChirpData_f2 0.004025 0.00000  test
                avx_ChirpData_f3 0.003961 0.00000  test
                avx_ChirpData_f4 0.003982 0.00000  test
                avx_ChirpData_f5 0.003951 0.00000  test
                avx_ChirpData_f6 0.003995 0.00000  test
                avx_ChirpData_fn 0.004298 0.00000  test
                avx_ChirpData_f5 0.003951 0.00000  choice

                   Test duration    10.08 seconds

Ftst_v7 completed successfully.

Still prefers f6.
« Last Edit: 09 May 2012, 02:31:13 pm by KarVi »
A smile is the shortest distance between two peoble (Victor Borge).

Offline Josef W. Segur

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 3112
Re: AVX Optimized App Development
« Reply #108 on: 09 May 2012, 04:15:06 pm »
Well, it's clear that the software prefetching is doing some good though not clear why the more distant prefetch works slightly better on the 8 core Bulldozers even when BOINC is active. Getting those details pinned down can wait for final tuning though.

With AVX chirping times at ~80% of SSE3 chirping on Bulldozer but ~50% on Sandy Bridge, I'm looking for something with larger effects. One faint possibility is that the way the input and output test buffers are allocated in J48 and earlier might possibly cause L1 cache thrashing. I don't think that's likely, but am attaching J48a. The allocations are revised but functions being tested are unchanged.

Edit: Attachment removed, see later posts for current test.
                                                            Joe
« Last Edit: 11 May 2012, 12:29:21 am by Josef W. Segur »

Offline Claggy

  • Alpha Tester
  • Knight who says 'Ni!'
  • ***
  • Posts: 3111
    • My computers at Seti Beta
Re: AVX Optimized App Development
« Reply #109 on: 09 May 2012, 04:38:12 pm »
i7-2600K @4.7GHz (Boinc running):

=========================================================
Ftst_v7_J48a_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.009743 0.00000  test
                   fpu_ChirpData 0.015173 0.00000  test
               fpu_opt_ChirpData 0.009064 0.00000  test
             sse1_ChirpData_ak8e 0.006152 0.00000  test
              sse2_ChirpData_ak8 0.004908 0.00000  test
              sse3_ChirpData_ak8 0.004838 0.00000  test
                 avx_ChirpData_a 0.002580 0.00000  test
                 avx_ChirpData_b 0.002608 0.00000  test
                 avx_ChirpData_c 0.002615 0.00000  test
                 avx_ChirpData_d 0.002482 0.00000  test
                 avx_ChirpData_e 0.002469 0.00000  test
                avx_ChirpData_f2 0.002653 0.00000  test
                avx_ChirpData_f3 0.002615 0.00000  test
                avx_ChirpData_f4 0.002597 0.00000  test
                avx_ChirpData_f5 0.002544 0.00000  test
                avx_ChirpData_f6 0.002575 0.00000  test
                avx_ChirpData_fn 0.002803 0.00000  test
                 avx_ChirpData_e 0.002469 0.00000  choice

            Second run

                     v_ChirpData 0.008056 0.00000  test
                   fpu_ChirpData 0.015192 0.00000  test
               fpu_opt_ChirpData 0.008239 0.00000  test
             sse1_ChirpData_ak8e 0.006109 0.00000  test
              sse2_ChirpData_ak8 0.004860 0.00000  test
              sse3_ChirpData_ak8 0.004905 0.00000  test
                 avx_ChirpData_a 0.002646 0.00000  test
                 avx_ChirpData_b 0.002649 0.00000  test
                 avx_ChirpData_c 0.002640 0.00000  test
                 avx_ChirpData_d 0.002515 0.00000  test
                 avx_ChirpData_e 0.002556 0.00000  test
                avx_ChirpData_f2 0.002736 0.00000  test
                avx_ChirpData_f3 0.002701 0.00000  test
                avx_ChirpData_f4 0.002618 0.00000  test
                avx_ChirpData_f5 0.002599 0.00000  test
                avx_ChirpData_f6 0.002577 0.00000  test
                avx_ChirpData_fn 0.002919 0.00000  test
                 avx_ChirpData_d 0.002515 0.00000  choice

            Third run

                     v_ChirpData 0.008521 0.00000  test
                   fpu_ChirpData 0.015196 0.00000  test
               fpu_opt_ChirpData 0.008329 0.00000  test
             sse1_ChirpData_ak8e 0.006129 0.00000  test
              sse2_ChirpData_ak8 0.004800 0.00000  test
              sse3_ChirpData_ak8 0.004910 0.00000  test
                 avx_ChirpData_a 0.002695 0.00000  test
                 avx_ChirpData_b 0.002715 0.00000  test
                 avx_ChirpData_c 0.002653 0.00000  test
                 avx_ChirpData_d 0.002489 0.00000  test
                 avx_ChirpData_e 0.002523 0.00000  test
                avx_ChirpData_f2 0.002678 0.00000  test
                avx_ChirpData_f3 0.002662 0.00000  test
                avx_ChirpData_f4 0.002604 0.00000  test
                avx_ChirpData_f5 0.002609 0.00000  test
                avx_ChirpData_f6 0.002576 0.00000  test
                avx_ChirpData_fn 0.002865 0.00000  test
                 avx_ChirpData_d 0.002489 0.00000  choice

                   Test duration     8.53 seconds

Ftst_v7 completed successfully.
=========================================================

i7-2600K @4.7GHz (Boinc computing suspended):

=========================================================
Ftst_v7_J48a_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.003665 0.00000  test
                   fpu_ChirpData 0.008651 0.00000  test
               fpu_opt_ChirpData 0.003569 0.00000  test
             sse1_ChirpData_ak8e 0.004219 0.00000  test
              sse2_ChirpData_ak8 0.003156 0.00000  test
              sse3_ChirpData_ak8 0.003119 0.00000  test
                 avx_ChirpData_a 0.001476 0.00000  test
                 avx_ChirpData_b 0.001635 0.00000  test
                 avx_ChirpData_c 0.001493 0.00000  test
                 avx_ChirpData_d 0.001380 0.00000  test
                 avx_ChirpData_e 0.001483 0.00000  test
                avx_ChirpData_f2 0.001612 0.00000  test
                avx_ChirpData_f3 0.001585 0.00000  test
                avx_ChirpData_f4 0.001571 0.00000  test
                avx_ChirpData_f5 0.001567 0.00000  test
                avx_ChirpData_f6 0.001559 0.00000  test
                avx_ChirpData_fn 0.001726 0.00000  test
                 avx_ChirpData_d 0.001380 0.00000  choice

            Second run

                     v_ChirpData 0.003662 0.00000  test
                   fpu_ChirpData 0.008645 0.00000  test
               fpu_opt_ChirpData 0.003563 0.00000  test
             sse1_ChirpData_ak8e 0.004212 0.00000  test
              sse2_ChirpData_ak8 0.003151 0.00000  test
              sse3_ChirpData_ak8 0.003118 0.00000  test
                 avx_ChirpData_a 0.001474 0.00000  test
                 avx_ChirpData_b 0.001648 0.00000  test
                 avx_ChirpData_c 0.001484 0.00000  test
                 avx_ChirpData_d 0.001373 0.00000  test
                 avx_ChirpData_e 0.001520 0.00000  test
                avx_ChirpData_f2 0.001608 0.00000  test
                avx_ChirpData_f3 0.001584 0.00000  test
                avx_ChirpData_f4 0.001588 0.00000  test
                avx_ChirpData_f5 0.001568 0.00000  test
                avx_ChirpData_f6 0.001567 0.00000  test
                avx_ChirpData_fn 0.001727 0.00000  test
                 avx_ChirpData_d 0.001373 0.00000  choice

            Third run

                     v_ChirpData 0.003672 0.00000  test
                   fpu_ChirpData 0.008651 0.00000  test
               fpu_opt_ChirpData 0.003566 0.00000  test
             sse1_ChirpData_ak8e 0.004210 0.00000  test
              sse2_ChirpData_ak8 0.003155 0.00000  test
              sse3_ChirpData_ak8 0.003115 0.00000  test
                 avx_ChirpData_a 0.001472 0.00000  test
                 avx_ChirpData_b 0.001632 0.00000  test
                 avx_ChirpData_c 0.001483 0.00000  test
                 avx_ChirpData_d 0.001375 0.00000  test
                 avx_ChirpData_e 0.001524 0.00000  test
                avx_ChirpData_f2 0.001610 0.00000  test
                avx_ChirpData_f3 0.001585 0.00000  test
                avx_ChirpData_f4 0.001570 0.00000  test
                avx_ChirpData_f5 0.001569 0.00000  test
                avx_ChirpData_f6 0.001564 0.00000  test
                avx_ChirpData_fn 0.001726 0.00000  test
                 avx_ChirpData_d 0.001375 0.00000  choice

                   Test duration     6.29 seconds

Ftst_v7 completed successfully.

Claggy

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #110 on: 09 May 2012, 05:08:16 pm »
FX-4100
BOINC idle

=========================================================
Ftst_v7_J48a_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.008908 0.00000  test
                   fpu_ChirpData 0.017459 0.00000  test
               fpu_opt_ChirpData 0.008598 0.00000  test
             sse1_ChirpData_ak8e 0.007179 0.00000  test
              sse2_ChirpData_ak8 0.004598 0.00000  test
              sse3_ChirpData_ak8 0.004693 0.00000  test
                 avx_ChirpData_a 0.003840 0.00000  test
                 avx_ChirpData_b 0.003823 0.00000  test
                 avx_ChirpData_c 0.004082 0.00000  test
                 avx_ChirpData_d 0.004008 0.00000  test
                 avx_ChirpData_e 0.003937 0.00000  test
                avx_ChirpData_f2 0.003716 0.00000  test
                avx_ChirpData_f3 0.003702 0.00000  test
                avx_ChirpData_f4 0.003782 0.00000  test
                avx_ChirpData_f5 0.003708 0.00000  test
                avx_ChirpData_f6 0.003687 0.00000  test
                avx_ChirpData_fn 0.003996 0.00000  test
                avx_ChirpData_f6 0.003687 0.00000  choice

            Second run

                     v_ChirpData 0.008775 0.00000  test
                   fpu_ChirpData 0.017391 0.00000  test
               fpu_opt_ChirpData 0.008710 0.00000  test
             sse1_ChirpData_ak8e 0.007160 0.00000  test
              sse2_ChirpData_ak8 0.004587 0.00000  test
              sse3_ChirpData_ak8 0.004651 0.00000  test
                 avx_ChirpData_a 0.003827 0.00000  test
                 avx_ChirpData_b 0.003842 0.00000  test
                 avx_ChirpData_c 0.004111 0.00000  test
                 avx_ChirpData_d 0.004003 0.00000  test
                 avx_ChirpData_e 0.003927 0.00000  test
                avx_ChirpData_f2 0.003724 0.00000  test
                avx_ChirpData_f3 0.003698 0.00000  test
                avx_ChirpData_f4 0.003698 0.00000  test
                avx_ChirpData_f5 0.003685 0.00000  test
                avx_ChirpData_f6 0.003682 0.00000  test
                avx_ChirpData_fn 0.004034 0.00000  test
                avx_ChirpData_f6 0.003682 0.00000  choice

            Third run

                     v_ChirpData 0.008919 0.00000  test
                   fpu_ChirpData 0.017299 0.00000  test
               fpu_opt_ChirpData 0.008712 0.00000  test
             sse1_ChirpData_ak8e 0.007167 0.00000  test
              sse2_ChirpData_ak8 0.004582 0.00000  test
              sse3_ChirpData_ak8 0.004661 0.00000  test
                 avx_ChirpData_a 0.003819 0.00000  test
                 avx_ChirpData_b 0.003813 0.00000  test
                 avx_ChirpData_c 0.004114 0.00000  test
                 avx_ChirpData_d 0.003980 0.00000  test
                 avx_ChirpData_e 0.003898 0.00000  test
                avx_ChirpData_f2 0.003759 0.00000  test
                avx_ChirpData_f3 0.003696 0.00000  test
                avx_ChirpData_f4 0.003692 0.00000  test
                avx_ChirpData_f5 0.003704 0.00000  test
                avx_ChirpData_f6 0.003698 0.00000  test
                avx_ChirpData_fn 0.003895 0.00000  test
                avx_ChirpData_f4 0.003692 0.00000  choice

                   Test duration     9.58 seconds

Ftst_v7 completed successfully.



=========================================================
i3-2120
BOINC idle

=========================================================
Ftst_v7_J48a_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.004566 0.00000  test
                   fpu_ChirpData 0.012321 0.00000  test
               fpu_opt_ChirpData 0.004345 0.00000  test
             sse1_ChirpData_ak8e 0.005710 0.00000  test
              sse2_ChirpData_ak8 0.004189 0.00000  test
              sse3_ChirpData_ak8 0.004102 0.00000  test
                 avx_ChirpData_a 0.002084 0.00000  test
                 avx_ChirpData_b 0.002054 0.00000  test
                 avx_ChirpData_c 0.002103 0.00000  test
                 avx_ChirpData_d 0.001930 0.00000  test
                 avx_ChirpData_e 0.001936 0.00000  test
                avx_ChirpData_f2 0.002078 0.00000  test
                avx_ChirpData_f3 0.002079 0.00000  test
                avx_ChirpData_f4 0.002053 0.00000  test
                avx_ChirpData_f5 0.002058 0.00000  test
                avx_ChirpData_f6 0.002103 0.00000  test
                avx_ChirpData_fn 0.002185 0.00000  test
                 avx_ChirpData_d 0.001930 0.00000  choice

            Second run

                     v_ChirpData 0.004545 0.00000  test
                   fpu_ChirpData 0.012302 0.00000  test
               fpu_opt_ChirpData 0.004352 0.00000  test
             sse1_ChirpData_ak8e 0.005705 0.00000  test
              sse2_ChirpData_ak8 0.004183 0.00000  test
              sse3_ChirpData_ak8 0.004084 0.00000  test
                 avx_ChirpData_a 0.002081 0.00000  test
                 avx_ChirpData_b 0.002047 0.00000  test
                 avx_ChirpData_c 0.002099 0.00000  test
                 avx_ChirpData_d 0.001930 0.00000  test
                 avx_ChirpData_e 0.001931 0.00000  test
                avx_ChirpData_f2 0.002081 0.00000  test
                avx_ChirpData_f3 0.002056 0.00000  test
                avx_ChirpData_f4 0.002053 0.00000  test
                avx_ChirpData_f5 0.002057 0.00000  test
                avx_ChirpData_f6 0.002049 0.00000  test
                avx_ChirpData_fn 0.002185 0.00000  test
                 avx_ChirpData_d 0.001930 0.00000  choice

            Third run

                     v_ChirpData 0.004597 0.00000  test
                   fpu_ChirpData 0.012295 0.00000  test
               fpu_opt_ChirpData 0.004325 0.00000  test
             sse1_ChirpData_ak8e 0.005713 0.00000  test
              sse2_ChirpData_ak8 0.004178 0.00000  test
              sse3_ChirpData_ak8 0.004086 0.00000  test
                 avx_ChirpData_a 0.002077 0.00000  test
                 avx_ChirpData_b 0.002046 0.00000  test
                 avx_ChirpData_c 0.002098 0.00000  test
                 avx_ChirpData_d 0.001929 0.00000  test
                 avx_ChirpData_e 0.001934 0.00000  test
                avx_ChirpData_f2 0.002077 0.00000  test
                avx_ChirpData_f3 0.002056 0.00000  test
                avx_ChirpData_f4 0.002051 0.00000  test
                avx_ChirpData_f5 0.002050 0.00000  test
                avx_ChirpData_f6 0.002109 0.00000  test
                avx_ChirpData_fn 0.002182 0.00000  test
                 avx_ChirpData_d 0.001929 0.00000  choice

                   Test duration     8.87 seconds

Ftst_v7 completed successfully.
« Last Edit: 09 May 2012, 05:12:58 pm by arkayn »

Offline KarVi

  • Alpha Tester
  • Knight Templar
  • ***
  • Posts: 252
Re: AVX Optimized App Development
« Reply #111 on: 09 May 2012, 11:59:42 pm »
FX8150@4.5

=========================================================
Ftst_v7_J48a_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.007238 0.00000  test
                   fpu_ChirpData 0.013833 0.00000  test
               fpu_opt_ChirpData 0.007087 0.00000  test
             sse1_ChirpData_ak8e 0.005670 0.00000  test
              sse2_ChirpData_ak8 0.003693 0.00000  test
              sse3_ChirpData_ak8 0.003748 0.00000  test
                 avx_ChirpData_a 0.003090 0.00000  test
                 avx_ChirpData_b 0.003036 0.00000  test
                 avx_ChirpData_c 0.003295 0.00000  test
                 avx_ChirpData_d 0.003220 0.00000  test
                 avx_ChirpData_e 0.003145 0.00000  test
                avx_ChirpData_f2 0.003021 0.00000  test
                avx_ChirpData_f3 0.002997 0.00000  test
                avx_ChirpData_f4 0.002983 0.00000  test
                avx_ChirpData_f5 0.002976 0.00000  test
                avx_ChirpData_f6 0.002961 0.00000  test
                avx_ChirpData_fn 0.003203 0.00000  test
                avx_ChirpData_f6 0.002961 0.00000  choice

            Second run

                     v_ChirpData 0.007260 0.00000  test
                   fpu_ChirpData 0.013809 0.00000  test
               fpu_opt_ChirpData 0.007061 0.00000  test
             sse1_ChirpData_ak8e 0.005671 0.00000  test
              sse2_ChirpData_ak8 0.003688 0.00000  test
              sse3_ChirpData_ak8 0.003738 0.00000  test
                 avx_ChirpData_a 0.003092 0.00000  test
                 avx_ChirpData_b 0.003046 0.00000  test
                 avx_ChirpData_c 0.003294 0.00000  test
                 avx_ChirpData_d 0.003224 0.00000  test
                 avx_ChirpData_e 0.003141 0.00000  test
                avx_ChirpData_f2 0.003026 0.00000  test
                avx_ChirpData_f3 0.003007 0.00000  test
                avx_ChirpData_f4 0.002989 0.00000  test
                avx_ChirpData_f5 0.002971 0.00000  test
                avx_ChirpData_f6 0.002952 0.00000  test
                avx_ChirpData_fn 0.003204 0.00000  test
                avx_ChirpData_f6 0.002952 0.00000  choice

            Third run

                     v_ChirpData 0.007199 0.00000  test
                   fpu_ChirpData 0.013817 0.00000  test
               fpu_opt_ChirpData 0.007057 0.00000  test
             sse1_ChirpData_ak8e 0.005661 0.00000  test
              sse2_ChirpData_ak8 0.003693 0.00000  test
              sse3_ChirpData_ak8 0.003740 0.00000  test
                 avx_ChirpData_a 0.003092 0.00000  test
                 avx_ChirpData_b 0.003045 0.00000  test
                 avx_ChirpData_c 0.003293 0.00000  test
                 avx_ChirpData_d 0.003222 0.00000  test
                 avx_ChirpData_e 0.003143 0.00000  test
                avx_ChirpData_f2 0.003030 0.00000  test
                avx_ChirpData_f3 0.003001 0.00000  test
                avx_ChirpData_f4 0.002982 0.00000  test
                avx_ChirpData_f5 0.002973 0.00000  test
                avx_ChirpData_f6 0.002966 0.00000  test
                avx_ChirpData_fn 0.003040 0.00000  test
                avx_ChirpData_f6 0.002966 0.00000  choice

                   Test duration     7.68 seconds

Ftst_v7 completed successfully.
A smile is the shortest distance between two peoble (Victor Borge).

Offline Josef W. Segur

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 3112
Re: AVX Optimized App Development
« Reply #112 on: 10 May 2012, 11:36:19 am »
Thanks, it's good to be sure the test allocations weren't causing the problem.

For J49 I've collapsed the f subvariants back to a single with the same prefetch as a through e (4 cache lines ahead). Even though that may not be the best, it makes comparison easier.

Added test g, which loads data in two 128 bit chunks rather than full 256 bit chunks. That's a technique some Intel documents recommend, though it's not expected to make a large difference.

Added test h, which does TLB priming to eliminate delays crossing page boundaries, and prefetches a whole page sized block at once, like the Astropulse TWINDECHIRP. I have hopes that might make a significant difference.

The sse3_ChirpData_ak8 variant didn't have prefetch, so was often slower than sse2_ChirpData_ak8. I've put the prefetch in.

Although I've reviewed the changes to the AVX routines several times, they're significant enough there's some risk of crashing if I missed something. I hope not.
                                                                Joe

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #113 on: 10 May 2012, 02:24:17 pm »
FX-4100@3.6
BOINC idle
=========================================================
Ftst_v7_J49_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.008692 0.00000  test
                   fpu_ChirpData 0.017149 0.00000  test
               fpu_opt_ChirpData 0.008383 0.00000  test
             sse1_ChirpData_ak8e 0.007095 0.00000  test
              sse2_ChirpData_ak8 0.004506 0.00000  test
              sse3_ChirpData_ak8 0.004396 0.00000  test
                 avx_ChirpData_a 0.003789 0.00000  test
                 avx_ChirpData_b 0.003719 0.00000  test
                 avx_ChirpData_c 0.004055 0.00000  test
                 avx_ChirpData_d 0.003989 0.00000  test
                 avx_ChirpData_e 0.003886 0.00000  test
                 avx_ChirpData_f 0.003646 0.00000  test
                 avx_ChirpData_g 0.003612 0.00000  test
                 avx_ChirpData_h 0.004376 0.00000  test
                 avx_ChirpData_g 0.003612 0.00000  choice

            Second run

                     v_ChirpData 0.008600 0.00000  test
                   fpu_ChirpData 0.017273 0.00000  test
               fpu_opt_ChirpData 0.008386 0.00000  test
             sse1_ChirpData_ak8e 0.007135 0.00000  test
              sse2_ChirpData_ak8 0.004525 0.00000  test
              sse3_ChirpData_ak8 0.004410 0.00000  test
                 avx_ChirpData_a 0.003801 0.00000  test
                 avx_ChirpData_b 0.003851 0.00000  test
                 avx_ChirpData_c 0.004085 0.00000  test
                 avx_ChirpData_d 0.003954 0.00000  test
                 avx_ChirpData_e 0.003857 0.00000  test
                 avx_ChirpData_f 0.003661 0.00000  test
                 avx_ChirpData_g 0.003586 0.00000  test
                 avx_ChirpData_h 0.004445 0.00000  test
                 avx_ChirpData_g 0.003586 0.00000  choice

            Third run

                     v_ChirpData 0.008727 0.00000  test
                   fpu_ChirpData 0.017132 0.00000  test
               fpu_opt_ChirpData 0.008475 0.00000  test
             sse1_ChirpData_ak8e 0.007107 0.00000  test
              sse2_ChirpData_ak8 0.004575 0.00000  test
              sse3_ChirpData_ak8 0.004390 0.00000  test
                 avx_ChirpData_a 0.003800 0.00000  test
                 avx_ChirpData_b 0.003817 0.00000  test
                 avx_ChirpData_c 0.004079 0.00000  test
                 avx_ChirpData_d 0.003987 0.00000  test
                 avx_ChirpData_e 0.003887 0.00000  test
                 avx_ChirpData_f 0.003646 0.00000  test
                 avx_ChirpData_g 0.003586 0.00000  test
                 avx_ChirpData_h 0.004411 0.00000  test
                 avx_ChirpData_g 0.003586 0.00000  choice

                   Test duration     7.99 seconds

Ftst_v7 completed successfully.


i3-2120@3.3
=========================================================
Ftst_v7_J49_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.004536 0.00000  test
                   fpu_ChirpData 0.012313 0.00000  test
               fpu_opt_ChirpData 0.004323 0.00000  test
             sse1_ChirpData_ak8e 0.005770 0.00000  test
              sse2_ChirpData_ak8 0.004188 0.00000  test
              sse3_ChirpData_ak8 0.004051 0.00000  test
                 avx_ChirpData_a 0.002107 0.00000  test
                 avx_ChirpData_b 0.002045 0.00000  test
                 avx_ChirpData_c 0.002098 0.00000  test
                 avx_ChirpData_d 0.001930 0.00000  test
                 avx_ChirpData_e 0.001941 0.00000  test
                 avx_ChirpData_f 0.002060 0.00000  test
                 avx_ChirpData_g 0.002071 0.00000  test
                 avx_ChirpData_h 0.002659 0.00000  test
                 avx_ChirpData_d 0.001930 0.00000  choice

            Second run

                     v_ChirpData 0.004538 0.00000  test
                   fpu_ChirpData 0.012747 0.00000  test
               fpu_opt_ChirpData 0.004351 0.00000  test
             sse1_ChirpData_ak8e 0.005769 0.00000  test
              sse2_ChirpData_ak8 0.004441 0.00000  test
              sse3_ChirpData_ak8 0.004123 0.00000  test
                 avx_ChirpData_a 0.002079 0.00000  test
                 avx_ChirpData_b 0.002045 0.00000  test
                 avx_ChirpData_c 0.002101 0.00000  test
                 avx_ChirpData_d 0.001932 0.00000  test
                 avx_ChirpData_e 0.001932 0.00000  test
                 avx_ChirpData_f 0.002049 0.00000  test
                 avx_ChirpData_g 0.002067 0.00000  test
                 avx_ChirpData_h 0.002657 0.00000  test
                 avx_ChirpData_d 0.001932 0.00000  choice

            Third run

                     v_ChirpData 0.004533 0.00000  test
                   fpu_ChirpData 0.012322 0.00000  test
               fpu_opt_ChirpData 0.004320 0.00000  test
             sse1_ChirpData_ak8e 0.005764 0.00000  test
              sse2_ChirpData_ak8 0.004190 0.00000  test
              sse3_ChirpData_ak8 0.004021 0.00000  test
                 avx_ChirpData_a 0.002085 0.00000  test
                 avx_ChirpData_b 0.002050 0.00000  test
                 avx_ChirpData_c 0.002098 0.00000  test
                 avx_ChirpData_d 0.001937 0.00000  test
                 avx_ChirpData_e 0.001938 0.00000  test
                 avx_ChirpData_f 0.002049 0.00000  test
                 avx_ChirpData_g 0.002071 0.00000  test
                 avx_ChirpData_h 0.002658 0.00000  test
                 avx_ChirpData_d 0.001937 0.00000  choice

                   Test duration     7.45 seconds

Ftst_v7 completed successfully.
« Last Edit: 10 May 2012, 02:28:05 pm by arkayn »

Offline KarVi

  • Alpha Tester
  • Knight Templar
  • ***
  • Posts: 252
Re: AVX Optimized App Development
« Reply #114 on: 10 May 2012, 04:19:07 pm »
FX8150@4.5

=========================================================
Ftst_v7_J49_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.007393 0.00000  test
                   fpu_ChirpData 0.013810 0.00000  test
               fpu_opt_ChirpData 0.007195 0.00000  test
             sse1_ChirpData_ak8e 0.005659 0.00000  test
              sse2_ChirpData_ak8 0.003708 0.00000  test
              sse3_ChirpData_ak8 0.003581 0.00000  test
                 avx_ChirpData_a 0.003086 0.00000  test
                 avx_ChirpData_b 0.003037 0.00000  test
                 avx_ChirpData_c 0.003292 0.00000  test
                 avx_ChirpData_d 0.003217 0.00000  test
                 avx_ChirpData_e 0.003131 0.00000  test
                 avx_ChirpData_f 0.002977 0.00000  test
                 avx_ChirpData_g 0.003055 0.00000  test
                 avx_ChirpData_h 0.003575 0.00000  test
                 avx_ChirpData_f 0.002977 0.00000  choice

            Second run

                     v_ChirpData 0.007355 0.00000  test
                   fpu_ChirpData 0.013808 0.00000  test
               fpu_opt_ChirpData 0.007272 0.00000  test
             sse1_ChirpData_ak8e 0.005665 0.00000  test
              sse2_ChirpData_ak8 0.003700 0.00000  test
              sse3_ChirpData_ak8 0.003645 0.00000  test
                 avx_ChirpData_a 0.003090 0.00000  test
                 avx_ChirpData_b 0.003037 0.00000  test
                 avx_ChirpData_c 0.003290 0.00000  test
                 avx_ChirpData_d 0.003215 0.00000  test
                 avx_ChirpData_e 0.003135 0.00000  test
                 avx_ChirpData_f 0.002972 0.00000  test
                 avx_ChirpData_g 0.003060 0.00000  test
                 avx_ChirpData_h 0.003573 0.00000  test
                 avx_ChirpData_f 0.002972 0.00000  choice

            Third run

                     v_ChirpData 0.007349 0.00000  test
                   fpu_ChirpData 0.013834 0.00000  test
               fpu_opt_ChirpData 0.007261 0.00000  test
             sse1_ChirpData_ak8e 0.005659 0.00000  test
              sse2_ChirpData_ak8 0.003695 0.00000  test
              sse3_ChirpData_ak8 0.003576 0.00000  test
                 avx_ChirpData_a 0.003093 0.00000  test
                 avx_ChirpData_b 0.003040 0.00000  test
                 avx_ChirpData_c 0.003294 0.00000  test
                 avx_ChirpData_d 0.003216 0.00000  test
                 avx_ChirpData_e 0.003132 0.00000  test
                 avx_ChirpData_f 0.002972 0.00000  test
                 avx_ChirpData_g 0.003054 0.00000  test
                 avx_ChirpData_h 0.003583 0.00000  test
                 avx_ChirpData_f 0.002972 0.00000  choice

                   Test duration     6.49 seconds

Ftst_v7 completed successfully.

Mine seems to like f, where arkayns prefers g. Not very conclusive :)
A smile is the shortest distance between two peoble (Victor Borge).

Offline Claggy

  • Alpha Tester
  • Knight who says 'Ni!'
  • ***
  • Posts: 3111
    • My computers at Seti Beta
Re: AVX Optimized App Development
« Reply #115 on: 10 May 2012, 04:31:01 pm »
i7-2600K @4.7GHz (Boinc running):

=========================================================
Ftst_v7_J49_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.007968 0.00000  test
                   fpu_ChirpData 0.015811 0.00000  test
               fpu_opt_ChirpData 0.007296 0.00000  test
             sse1_ChirpData_ak8e 0.006359 0.00000  test
              sse2_ChirpData_ak8 0.004849 0.00000  test
              sse3_ChirpData_ak8 0.004496 0.00000  test
                 avx_ChirpData_a 0.002711 0.00000  test
                 avx_ChirpData_b 0.002826 0.00000  test
                 avx_ChirpData_c 0.002719 0.00000  test
                 avx_ChirpData_d 0.002606 0.00000  test
                 avx_ChirpData_e 0.002469 0.00000  test
                 avx_ChirpData_f 0.002662 0.00000  test
                 avx_ChirpData_g 0.002796 0.00000  test
                 avx_ChirpData_h 0.003208 0.00000  test
                 avx_ChirpData_e 0.002469 0.00000  choice

            Second run

                     v_ChirpData 0.007533 0.00000  test
                   fpu_ChirpData 0.015415 0.00000  test
               fpu_opt_ChirpData 0.006911 0.00000  test
             sse1_ChirpData_ak8e 0.006322 0.00000  test
              sse2_ChirpData_ak8 0.004869 0.00000  test
              sse3_ChirpData_ak8 0.004669 0.00000  test
                 avx_ChirpData_a 0.002702 0.00000  test
                 avx_ChirpData_b 0.002879 0.00000  test
                 avx_ChirpData_c 0.002848 0.00000  test
                 avx_ChirpData_d 0.002208 0.00000  test
                 avx_ChirpData_e 0.002697 0.00000  test
                 avx_ChirpData_f 0.002966 0.00000  test
                 avx_ChirpData_g 0.002573 0.00000  test
                 avx_ChirpData_h 0.003257 0.00000  test
                 avx_ChirpData_d 0.002208 0.00000  choice

            Third run

                     v_ChirpData 0.007272 0.00000  test
                   fpu_ChirpData 0.016058 0.00000  test
               fpu_opt_ChirpData 0.007339 0.00000  test
             sse1_ChirpData_ak8e 0.006160 0.00000  test
              sse2_ChirpData_ak8 0.004753 0.00000  test
              sse3_ChirpData_ak8 0.004710 0.00000  test
                 avx_ChirpData_a 0.002605 0.00000  test
                 avx_ChirpData_b 0.002734 0.00000  test
                 avx_ChirpData_c 0.002658 0.00000  test
                 avx_ChirpData_d 0.002396 0.00000  test
                 avx_ChirpData_e 0.002445 0.00000  test
                 avx_ChirpData_f 0.002504 0.00000  test
                 avx_ChirpData_g 0.002488 0.00000  test
                 avx_ChirpData_h 0.003208 0.00000  test
                 avx_ChirpData_d 0.002396 0.00000  choice

                   Test duration     7.16 seconds

Ftst_v7 completed successfully.
=========================================================

i7-2600K @4.7GHz (Boinc computing suspended):

=========================================================

Ftst_v7_J49_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.003652 0.00000  test
                   fpu_ChirpData 0.008646 0.00000  test
               fpu_opt_ChirpData 0.003595 0.00000  test
             sse1_ChirpData_ak8e 0.004217 0.00000  test
              sse2_ChirpData_ak8 0.003150 0.00000  test
              sse3_ChirpData_ak8 0.002981 0.00000  test
                 avx_ChirpData_a 0.001477 0.00000  test
                 avx_ChirpData_b 0.001635 0.00000  test
                 avx_ChirpData_c 0.001485 0.00000  test
                 avx_ChirpData_d 0.001377 0.00000  test
                 avx_ChirpData_e 0.001524 0.00000  test
                 avx_ChirpData_f 0.001588 0.00000  test
                 avx_ChirpData_g 0.001619 0.00000  test
                 avx_ChirpData_h 0.002023 0.00000  test
                 avx_ChirpData_d 0.001377 0.00000  choice

            Second run

                     v_ChirpData 0.003666 0.00000  test
                   fpu_ChirpData 0.008667 0.00000  test
               fpu_opt_ChirpData 0.003789 0.00000  test
             sse1_ChirpData_ak8e 0.004202 0.00000  test
              sse2_ChirpData_ak8 0.003154 0.00000  test
              sse3_ChirpData_ak8 0.002986 0.00000  test
                 avx_ChirpData_a 0.001475 0.00000  test
                 avx_ChirpData_b 0.001635 0.00000  test
                 avx_ChirpData_c 0.001483 0.00000  test
                 avx_ChirpData_d 0.001376 0.00000  test
                 avx_ChirpData_e 0.001531 0.00000  test
                 avx_ChirpData_f 0.001571 0.00000  test
                 avx_ChirpData_g 0.001618 0.00000  test
                 avx_ChirpData_h 0.002019 0.00000  test
                 avx_ChirpData_d 0.001376 0.00000  choice

            Third run

                     v_ChirpData 0.003673 0.00000  test
                   fpu_ChirpData 0.008651 0.00000  test
               fpu_opt_ChirpData 0.003576 0.00000  test
             sse1_ChirpData_ak8e 0.004199 0.00000  test
              sse2_ChirpData_ak8 0.003150 0.00000  test
              sse3_ChirpData_ak8 0.002981 0.00000  test
                 avx_ChirpData_a 0.001474 0.00000  test
                 avx_ChirpData_b 0.001644 0.00000  test
                 avx_ChirpData_c 0.001483 0.00000  test
                 avx_ChirpData_d 0.001379 0.00000  test
                 avx_ChirpData_e 0.001525 0.00000  test
                 avx_ChirpData_f 0.001572 0.00000  test
                 avx_ChirpData_g 0.001617 0.00000  test
                 avx_ChirpData_h 0.002022 0.00000  test
                 avx_ChirpData_d 0.001379 0.00000  choice

                   Test duration     5.28 seconds

Ftst_v7 completed successfully.

Claggy

Offline Josef W. Segur

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 3112
Re: AVX Optimized App Development
« Reply #116 on: 11 May 2012, 05:39:43 pm »
...
Mine seems to like f, where arkayns prefers g. Not very conclusive :)

Indeed not, and these ~2% differences simply prove I haven't yet found what I'm looking for. Having the h test go the wrong way may be more revealing if I can correlate it with BD features.
                                                             Joe

Offline Josef W. Segur

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 3112
Re: AVX Optimized App Development
« Reply #117 on: 14 May 2012, 04:25:56 pm »
Trying to find the strengths of Bulldozer, I've added a chirp variant using both AVX and FMA4 in J50. It does reduce the number of instructions in the loop by 8 or more so should have some measurable effect, though it still has to load and save just as much data. Other than the FMA4 changes, it's like the g AVX version.

If I have everything right, it ought to show as unsupported on Sandy Bridge and run on Bulldozer. If not, anything might happen.  :P
                                                                     Joe

Offline arkayn

  • Janitor o' the Board
  • Knight who says 'Ni!'
  • *****
  • Posts: 1230
  • Aaaarrrrgggghhhh
    • My Little Place On The Internet
Re: AVX Optimized App Development
« Reply #118 on: 14 May 2012, 04:33:11 pm »
FX-4100
BOINC running on GTX460

=========================================================
Ftst_v7_J50_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.009627 0.00000  test
                   fpu_ChirpData 0.019200 0.00000  test
               fpu_opt_ChirpData 0.008951 0.00000  test
             sse1_ChirpData_ak8e 0.007910 0.00000  test
              sse2_ChirpData_ak8 0.005040 0.00000  test
              sse3_ChirpData_ak8 0.004927 0.00000  test
                 avx_ChirpData_a 0.004119 0.00000  test
                 avx_ChirpData_b 0.004149 0.00000  test
                 avx_ChirpData_c 0.004650 0.00000  test
                 avx_ChirpData_d 0.004221 0.00000  test
                 avx_ChirpData_e 0.004187 0.00000  test
                 avx_ChirpData_f 0.004013 0.00000  test
                 avx_ChirpData_g 0.004171 0.00000  test
                 avx_ChirpData_h 0.005179 0.00000  test
            avx_fma4_ChirpData_a 0.003669 0.00000  test
            avx_fma4_ChirpData_a 0.003669 0.00000  choice

            Second run

                     v_ChirpData 0.009635 0.00000  test
                   fpu_ChirpData 0.018249 0.00000  test
               fpu_opt_ChirpData 0.009154 0.00000  test
             sse1_ChirpData_ak8e 0.007586 0.00000  test
              sse2_ChirpData_ak8 0.004708 0.00000  test
              sse3_ChirpData_ak8 0.004546 0.00000  test
                 avx_ChirpData_a 0.004097 0.00000  test
                 avx_ChirpData_b 0.004024 0.00000  test
                 avx_ChirpData_c 0.004339 0.00000  test
                 avx_ChirpData_d 0.004329 0.00000  test
                 avx_ChirpData_e 0.004205 0.00000  test
                 avx_ChirpData_f 0.003973 0.00000  test
                 avx_ChirpData_g 0.003893 0.00000  test
                 avx_ChirpData_h 0.004708 0.00000  test
            avx_fma4_ChirpData_a 0.003704 0.00000  test
            avx_fma4_ChirpData_a 0.003704 0.00000  choice

            Third run

                     v_ChirpData 0.009304 0.00000  test
                   fpu_ChirpData 0.019267 0.00000  test
               fpu_opt_ChirpData 0.008838 0.00000  test
             sse1_ChirpData_ak8e 0.007273 0.00000  test
              sse2_ChirpData_ak8 0.004618 0.00000  test
              sse3_ChirpData_ak8 0.004530 0.00000  test
                 avx_ChirpData_a 0.004216 0.00000  test
                 avx_ChirpData_b 0.004080 0.00000  test
                 avx_ChirpData_c 0.004223 0.00000  test
                 avx_ChirpData_d 0.004374 0.00000  test
                 avx_ChirpData_e 0.004065 0.00000  test
                 avx_ChirpData_f 0.003829 0.00000  test
                 avx_ChirpData_g 0.004143 0.00000  test
                 avx_ChirpData_h 0.004819 0.00000  test
            avx_fma4_ChirpData_a 0.003452 0.00000  test
            avx_fma4_ChirpData_a 0.003452 0.00000  choice

                   Test duration     9.33 seconds

Ftst_v7 completed successfully.


i3-2120
BOINC running on GTX560

=========================================================
Ftst_v7_J50_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.004834 0.00000  test
                   fpu_ChirpData 0.012480 0.00000  test
               fpu_opt_ChirpData 0.004621 0.00000  test
             sse1_ChirpData_ak8e 0.005919 0.00000  test
              sse2_ChirpData_ak8 0.004306 0.00000  test
              sse3_ChirpData_ak8 0.004118 0.00000  test
                 avx_ChirpData_a 0.002149 0.00000  test
                 avx_ChirpData_b 0.002130 0.00000  test
                 avx_ChirpData_c 0.002282 0.00000  test
                 avx_ChirpData_d 0.002143 0.00000  test
                 avx_ChirpData_e 0.002010 0.00000  test
                 avx_ChirpData_f 0.002116 0.00000  test
                 avx_ChirpData_g 0.002156 0.00000  test
                 avx_ChirpData_h 0.002744 0.00000  test
            avx_fma4_ChirpData_a not supported by system
                 avx_ChirpData_e 0.002010 0.00000  choice

            Second run

                     v_ChirpData 0.004538 0.00000  test
                   fpu_ChirpData 0.012324 0.00000  test
               fpu_opt_ChirpData 0.004330 0.00000  test
             sse1_ChirpData_ak8e 0.005758 0.00000  test
              sse2_ChirpData_ak8 0.004179 0.00000  test
              sse3_ChirpData_ak8 0.004003 0.00000  test
                 avx_ChirpData_a 0.002143 0.00000  test
                 avx_ChirpData_b 0.002585 0.00000  test
                 avx_ChirpData_c 0.002312 0.00000  test
                 avx_ChirpData_d 0.001930 0.00000  test
                 avx_ChirpData_e 0.002107 0.00000  test
                 avx_ChirpData_f 0.002309 0.00000  test
                 avx_ChirpData_g 0.002067 0.00000  test
                 avx_ChirpData_h 0.002657 0.00000  test
            avx_fma4_ChirpData_a not supported by system
                 avx_ChirpData_d 0.001930 0.00000  choice

            Third run

                     v_ChirpData 0.005770 0.00000  test
                   fpu_ChirpData 0.012279 0.00000  test
               fpu_opt_ChirpData 0.004469 0.00000  test
             sse1_ChirpData_ak8e 0.006027 0.00000  test
              sse2_ChirpData_ak8 0.004288 0.00000  test
              sse3_ChirpData_ak8 0.004026 0.00000  test
                 avx_ChirpData_a 0.002081 0.00000  test
                 avx_ChirpData_b 0.002052 0.00000  test
                 avx_ChirpData_c 0.002536 0.00000  test
                 avx_ChirpData_d 0.001946 0.00000  test
                 avx_ChirpData_e 0.001987 0.00000  test
                 avx_ChirpData_f 0.002057 0.00000  test
                 avx_ChirpData_g 0.002298 0.00000  test
                 avx_ChirpData_h 0.002790 0.00000  test
            avx_fma4_ChirpData_a not supported by system
                 avx_ChirpData_d 0.001946 0.00000  choice

                   Test duration     7.68 seconds

Ftst_v7 completed successfully.
« Last Edit: 14 May 2012, 04:35:38 pm by arkayn »

Offline Mike

  • Alpha Tester
  • Knight who says 'Ni!'
  • ***
  • Posts: 2427
Re: AVX Optimized App Development
« Reply #119 on: 14 May 2012, 04:57:00 pm »
FX 8150 @4.4 GHZ Win 8 CP

Ftst_v7_J50_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.008360 0.00000  test
                   fpu_ChirpData 0.013990 0.00000  test
               fpu_opt_ChirpData 0.009692 0.00000  test
             sse1_ChirpData_ak8e 0.005746 0.00000  test
              sse2_ChirpData_ak8 0.003786 0.00000  test
              sse3_ChirpData_ak8 0.003776 0.00000  test
                 avx_ChirpData_a 0.003227 0.00000  test
                 avx_ChirpData_b 0.003268 0.00000  test
                 avx_ChirpData_c 0.003384 0.00000  test
                 avx_ChirpData_d 0.003312 0.00000  test
                 avx_ChirpData_e 0.003169 0.00000  test
                 avx_ChirpData_f 0.003059 0.00000  test
                 avx_ChirpData_g 0.003046 0.00000  test
                 avx_ChirpData_h 0.003847 0.00000  test
            avx_fma4_ChirpData_a 0.002927 0.00000  test
            avx_fma4_ChirpData_a 0.002927 0.00000  choice

            Second run

                     v_ChirpData 0.009693 0.00000  test
                   fpu_ChirpData 0.013975 0.00000  test
               fpu_opt_ChirpData 0.009653 0.00000  test
             sse1_ChirpData_ak8e 0.005742 0.00000  test
              sse2_ChirpData_ak8 0.003836 0.00000  test
              sse3_ChirpData_ak8 0.003730 0.00000  test
                 avx_ChirpData_a 0.003346 0.00000  test
                 avx_ChirpData_b 0.003312 0.00000  test
                 avx_ChirpData_c 0.003432 0.00000  test
                 avx_ChirpData_d 0.003368 0.00000  test
                 avx_ChirpData_e 0.003222 0.00000  test
                 avx_ChirpData_f 0.003203 0.00000  test
                 avx_ChirpData_g 0.003240 0.00000  test
                 avx_ChirpData_h 0.003889 0.00000  test
            avx_fma4_ChirpData_a 0.003078 0.00000  test
            avx_fma4_ChirpData_a 0.003078 0.00000  choice

            Third run

                     v_ChirpData 0.009655 0.00000  test
                   fpu_ChirpData 0.013997 0.00000  test
               fpu_opt_ChirpData 0.009633 0.00000  test
             sse1_ChirpData_ak8e 0.005748 0.00000  test
              sse2_ChirpData_ak8 0.003857 0.00000  test
              sse3_ChirpData_ak8 0.003740 0.00000  test
                 avx_ChirpData_a 0.003364 0.00000  test
                 avx_ChirpData_b 0.003325 0.00000  test
                 avx_ChirpData_c 0.003434 0.00000  test
                 avx_ChirpData_d 0.003386 0.00000  test
                 avx_ChirpData_e 0.003235 0.00000  test
                 avx_ChirpData_f 0.003228 0.00000  test
                 avx_ChirpData_g 0.003249 0.00000  test
                 avx_ChirpData_h 0.003882 0.00000  test
            avx_fma4_ChirpData_a 0.003090 0.00000  test
            avx_fma4_ChirpData_a 0.003090 0.00000  choice

                   Test duration     7.26 seconds

Ftst_v7 completed successfully.

 

Welcome, Guest.
Please login or register.
 
 
 
Forgot your password?
Members
Total Members: 97
Latest: ToeBee
New This Month: 0
New This Week: 0
New Today: 0
Stats
Total Posts: 59559
Total Topics: 1672
Most Online Today: 226
Most Online Ever: 983
(20 Jan 2020, 03:17:55 pm)
Users Online
Members: 0
Guests: 25
Total: 25
Powered by EzPortal