Forum > Discussion Forum

AVX Optimized App Development

<< < (26/33) > >>

Claggy:
i7-2600K @4.7GHz (Boinc running):

=========================================================
Ftst_v7_J51_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.011312 0.00000  test
                   fpu_ChirpData 0.015995 0.00000  test
               fpu_opt_ChirpData 0.012151 0.00000  test
             sse1_ChirpData_ak8e 0.006951 0.00000  test
              sse2_ChirpData_ak8 0.005494 0.00000  test
              sse3_ChirpData_ak8 0.005626 0.00000  test
                 avx_ChirpData_a 0.003442 0.00000  test
                 avx_ChirpData_b 0.003206 0.00000  test
                 avx_ChirpData_c 0.003540 0.00000  test
                 avx_ChirpData_d 0.003456 0.00000  test
                 avx_ChirpData_e 0.003055 0.00000  test
                 avx_ChirpData_f 0.003544 0.00000  test
                 avx_ChirpData_g 0.003209 0.00000  test
                 avx_ChirpData_h 0.004235 0.00000  test
                 avx_ChirpData_i 0.003265 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_e 0.003055 0.00000  choice

            Second run

                     v_ChirpData 0.009754 0.00000  test
                   fpu_ChirpData 0.016226 0.00000  test
               fpu_opt_ChirpData 0.010134 0.00000  test
             sse1_ChirpData_ak8e 0.006801 0.00000  test
              sse2_ChirpData_ak8 0.005874 0.00000  test
              sse3_ChirpData_ak8 0.005385 0.00000  test
                 avx_ChirpData_a 0.003425 0.00000  test
                 avx_ChirpData_b 0.003101 0.00000  test
                 avx_ChirpData_c 0.003570 0.00000  test
                 avx_ChirpData_d 0.003430 0.00000  test
                 avx_ChirpData_e 0.003382 0.00000  test
                 avx_ChirpData_f 0.003381 0.00000  test
                 avx_ChirpData_g 0.003525 0.00000  test
                 avx_ChirpData_h 0.004078 0.00000  test
                 avx_ChirpData_i 0.003777 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_b 0.003101 0.00000  choice

            Third run

                     v_ChirpData 0.011256 0.00000  test
                   fpu_ChirpData 0.016422 0.00000  test
               fpu_opt_ChirpData 0.010467 0.00000  test
             sse1_ChirpData_ak8e 0.006613 0.00000  test
              sse2_ChirpData_ak8 0.005293 0.00000  test
              sse3_ChirpData_ak8 0.005231 0.00000  test
                 avx_ChirpData_a 0.003160 0.00000  test
                 avx_ChirpData_b 0.003300 0.00000  test
                 avx_ChirpData_c 0.003491 0.00000  test
                 avx_ChirpData_d 0.003294 0.00000  test
                 avx_ChirpData_e 0.002963 0.00000  test
                 avx_ChirpData_f 0.003788 0.00000  test
                 avx_ChirpData_g 0.003262 0.00000  test
                 avx_ChirpData_h 0.004430 0.00000  test
                 avx_ChirpData_i 0.003728 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_e 0.002963 0.00000  choice

                   Test duration     8.92 seconds

Ftst_v7 completed successfully.
=========================================================

i7-2600K @4.7GHz (Boinc suspended):

=========================================================
Ftst_v7_J51_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.003675 0.00000  test
                   fpu_ChirpData 0.008690 0.00000  test
               fpu_opt_ChirpData 0.003575 0.00000  test
             sse1_ChirpData_ak8e 0.004212 0.00000  test
              sse2_ChirpData_ak8 0.003155 0.00000  test
              sse3_ChirpData_ak8 0.002982 0.00000  test
                 avx_ChirpData_a 0.001475 0.00000  test
                 avx_ChirpData_b 0.001642 0.00000  test
                 avx_ChirpData_c 0.001487 0.00000  test
                 avx_ChirpData_d 0.001379 0.00000  test
                 avx_ChirpData_e 0.001522 0.00000  test
                 avx_ChirpData_f 0.001572 0.00000  test
                 avx_ChirpData_g 0.001623 0.00000  test
                 avx_ChirpData_h 0.002022 0.00000  test
                 avx_ChirpData_i 0.001737 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_d 0.001379 0.00000  choice

            Second run

                     v_ChirpData 0.003690 0.00000  test
                   fpu_ChirpData 0.008665 0.00000  test
               fpu_opt_ChirpData 0.003559 0.00000  test
             sse1_ChirpData_ak8e 0.004219 0.00000  test
              sse2_ChirpData_ak8 0.003156 0.00000  test
              sse3_ChirpData_ak8 0.002984 0.00000  test
                 avx_ChirpData_a 0.001472 0.00000  test
                 avx_ChirpData_b 0.001641 0.00000  test
                 avx_ChirpData_c 0.001482 0.00000  test
                 avx_ChirpData_d 0.001375 0.00000  test
                 avx_ChirpData_e 0.001520 0.00000  test
                 avx_ChirpData_f 0.001567 0.00000  test
                 avx_ChirpData_g 0.001618 0.00000  test
                 avx_ChirpData_h 0.002019 0.00000  test
                 avx_ChirpData_i 0.001722 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_d 0.001375 0.00000  choice

            Third run

                     v_ChirpData 0.003747 0.00000  test
                   fpu_ChirpData 0.008661 0.00000  test
               fpu_opt_ChirpData 0.003566 0.00000  test
             sse1_ChirpData_ak8e 0.004212 0.00000  test
              sse2_ChirpData_ak8 0.003154 0.00000  test
              sse3_ChirpData_ak8 0.002978 0.00000  test
                 avx_ChirpData_a 0.001474 0.00000  test
                 avx_ChirpData_b 0.001640 0.00000  test
                 avx_ChirpData_c 0.001482 0.00000  test
                 avx_ChirpData_d 0.001377 0.00000  test
                 avx_ChirpData_e 0.001521 0.00000  test
                 avx_ChirpData_f 0.001568 0.00000  test
                 avx_ChirpData_g 0.001617 0.00000  test
                 avx_ChirpData_h 0.002012 0.00000  test
                 avx_ChirpData_i 0.001728 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_d 0.001377 0.00000  choice

                   Test duration     5.62 seconds

Ftst_v7 completed successfully.

Claggy

PatrickV2:

--- Quote from: Josef W. Segur on 15 May 2012, 11:07:29 pm ---Yes, please! The broader the range of systems tested the better. If you'd run both the J45 test attached to message 37870 and whatever the latest Chirponly version is at that time, it would be a help.
                                                                Joe

--- End quote ---

OK, no promises, since it's not my machine (but a custom-built rig I configured for my younger brother), but I will try to run the relevant tools. I'm planning to use Seti as a way to do a burn-in test on the machine; with a GTX560Ti 2GB it should be able to do quite some crunching. ;)

I expect the machine to arrive somewhere in the course of next week...

Regards, Patrick.

Mike:
FX 8150 @4.4 GHZ Win 8 CP

Ftst_v7_J51_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.008439 0.00000  test
                   fpu_ChirpData 0.015252 0.00000  test
               fpu_opt_ChirpData 0.009783 0.00000  test
             sse1_ChirpData_ak8e 0.005848 0.00000  test
              sse2_ChirpData_ak8 0.003852 0.00000  test
              sse3_ChirpData_ak8 0.003749 0.00000  test
                 avx_ChirpData_a 0.003289 0.00000  test
                 avx_ChirpData_b 0.003285 0.00000  test
                 avx_ChirpData_c 0.003449 0.00000  test
                 avx_ChirpData_d 0.003366 0.00000  test
                 avx_ChirpData_e 0.003237 0.00000  test
                 avx_ChirpData_f 0.003163 0.00000  test
                 avx_ChirpData_g 0.003121 0.00000  test
                 avx_ChirpData_h 0.003925 0.00000  test
                 avx_ChirpData_i 0.003333 0.00000  test
            avx_fma4_ChirpData_a 0.002981 0.00000  test
            avx_fma4_ChirpData_b 0.048056 0.50095  test
            avx_fma4_ChirpData_a 0.002981 0.00000  choice

            Second run

                     v_ChirpData 0.009848 0.00000  test
                   fpu_ChirpData 0.014183 0.00000  test
               fpu_opt_ChirpData 0.009766 0.00000  test
             sse1_ChirpData_ak8e 0.005836 0.00000  test
              sse2_ChirpData_ak8 0.003959 0.00000  test
              sse3_ChirpData_ak8 0.003815 0.00000  test
                 avx_ChirpData_a 0.003388 0.00000  test
                 avx_ChirpData_b 0.003360 0.00000  test
                 avx_ChirpData_c 0.003465 0.00000  test
                 avx_ChirpData_d 0.003398 0.00000  test
                 avx_ChirpData_e 0.003272 0.00000  test
                 avx_ChirpData_f 0.003264 0.00000  test
                 avx_ChirpData_g 0.003274 0.00000  test
                 avx_ChirpData_h 0.003943 0.00000  test
                 avx_ChirpData_i 0.003511 0.00000  test
            avx_fma4_ChirpData_a 0.003121 0.00000  test
            avx_fma4_ChirpData_b 0.048360 0.50095  test
            avx_fma4_ChirpData_a 0.003121 0.00000  choice

            Third run

                     v_ChirpData 0.009818 0.00000  test
                   fpu_ChirpData 0.014177 0.00000  test
               fpu_opt_ChirpData 0.009767 0.00000  test
             sse1_ChirpData_ak8e 0.005836 0.00000  test
              sse2_ChirpData_ak8 0.003961 0.00000  test
              sse3_ChirpData_ak8 0.003790 0.00000  test
                 avx_ChirpData_a 0.003392 0.00000  test
                 avx_ChirpData_b 0.003364 0.00000  test
                 avx_ChirpData_c 0.003471 0.00000  test
                 avx_ChirpData_d 0.003407 0.00000  test
                 avx_ChirpData_e 0.003273 0.00000  test
                 avx_ChirpData_f 0.003261 0.00000  test
                 avx_ChirpData_g 0.003282 0.00000  test
                 avx_ChirpData_h 0.003940 0.00000  test
                 avx_ChirpData_i 0.003517 0.00000  test
            avx_fma4_ChirpData_a 0.003135 0.00000  test
            avx_fma4_ChirpData_b 0.048371 0.50095  test
            avx_fma4_ChirpData_a 0.003135 0.00000  choice

                   Test duration     9.65 seconds

Ftst_v7 completed successfully.

Josef W. Segur:
Another new Chirponly test, J52, is attached.

Fixed (I hope) the problem which made the avx_fma4 b variant so slow and inaccurate, added a c variant with a different approach to TLB priming.
                                   Joe

arkayn:
FX-4100
BOINC Running on 460

=========================================================
Ftst_v7_J52_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.008840 0.00000  test
                   fpu_ChirpData 0.018138 0.00000  test
               fpu_opt_ChirpData 0.009096 0.00000  test
             sse1_ChirpData_ak8e 0.007134 0.00000  test
              sse2_ChirpData_ak8 0.004616 0.00000  test
              sse3_ChirpData_ak8 0.004581 0.00000  test
                 avx_ChirpData_a 0.004071 0.00000  test
                 avx_ChirpData_b 0.003964 0.00000  test
                 avx_ChirpData_c 0.004295 0.00000  test
                 avx_ChirpData_d 0.004130 0.00000  test
                 avx_ChirpData_e 0.003982 0.00000  test
                 avx_ChirpData_f 0.003781 0.00000  test
                 avx_ChirpData_g 0.003714 0.00000  test
                 avx_ChirpData_h 0.004528 0.00000  test
                 avx_ChirpData_i 0.003994 0.00000  test
            avx_fma4_ChirpData_a 0.003473 0.00000  test
            avx_fma4_ChirpData_b 0.003617 0.00000  test
            avx_fma4_ChirpData_c 0.003739 0.00000  test
            avx_fma4_ChirpData_a 0.003473 0.00000  choice

            Second run

                     v_ChirpData 0.009005 0.00000  test
                   fpu_ChirpData 0.017681 0.00000  test
               fpu_opt_ChirpData 0.008559 0.00000  test
             sse1_ChirpData_ak8e 0.007305 0.00000  test
              sse2_ChirpData_ak8 0.004635 0.00000  test
              sse3_ChirpData_ak8 0.004459 0.00000  test
                 avx_ChirpData_a 0.003960 0.00000  test
                 avx_ChirpData_b 0.003880 0.00000  test
                 avx_ChirpData_c 0.004260 0.00000  test
                 avx_ChirpData_d 0.004184 0.00000  test
                 avx_ChirpData_e 0.004021 0.00000  test
                 avx_ChirpData_f 0.003816 0.00000  test
                 avx_ChirpData_g 0.003791 0.00000  test
                 avx_ChirpData_h 0.004508 0.00000  test
                 avx_ChirpData_i 0.003953 0.00000  test
            avx_fma4_ChirpData_a 0.003404 0.00000  test
            avx_fma4_ChirpData_b 0.003597 0.00000  test
            avx_fma4_ChirpData_c 0.003738 0.00000  test
            avx_fma4_ChirpData_a 0.003404 0.00000  choice

            Third run

                     v_ChirpData 0.008951 0.00000  test
                   fpu_ChirpData 0.017233 0.00000  test
               fpu_opt_ChirpData 0.008535 0.00000  test
             sse1_ChirpData_ak8e 0.007110 0.00000  test
              sse2_ChirpData_ak8 0.004573 0.00000  test
              sse3_ChirpData_ak8 0.004376 0.00000  test
                 avx_ChirpData_a 0.003833 0.00000  test
                 avx_ChirpData_b 0.003780 0.00000  test
                 avx_ChirpData_c 0.004112 0.00000  test
                 avx_ChirpData_d 0.004140 0.00000  test
                 avx_ChirpData_e 0.003956 0.00000  test
                 avx_ChirpData_f 0.003741 0.00000  test
                 avx_ChirpData_g 0.003686 0.00000  test
                 avx_ChirpData_h 0.004516 0.00000  test
                 avx_ChirpData_i 0.003902 0.00000  test
            avx_fma4_ChirpData_a 0.003376 0.00000  test
            avx_fma4_ChirpData_b 0.003804 0.00000  test
            avx_fma4_ChirpData_c 0.003685 0.00000  test
            avx_fma4_ChirpData_a 0.003376 0.00000  choice

                   Test duration    10.54 seconds

Ftst_v7 completed successfully.

i3-2120
BOINC Running on 560

=========================================================
Ftst_v7_J52_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.005332 0.00000  test
                   fpu_ChirpData 0.012461 0.00000  test
               fpu_opt_ChirpData 0.004724 0.00000  test
             sse1_ChirpData_ak8e 0.005928 0.00000  test
              sse2_ChirpData_ak8 0.004362 0.00000  test
              sse3_ChirpData_ak8 0.004210 0.00000  test
                 avx_ChirpData_a 0.002198 0.00000  test
                 avx_ChirpData_b 0.002080 0.00000  test
                 avx_ChirpData_c 0.002259 0.00000  test
                 avx_ChirpData_d 0.002050 0.00000  test
                 avx_ChirpData_e 0.002061 0.00000  test
                 avx_ChirpData_f 0.002186 0.00000  test
                 avx_ChirpData_g 0.002199 0.00000  test
                 avx_ChirpData_h 0.002787 0.00000  test
                 avx_ChirpData_i 0.002355 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_d 0.002050 0.00000  choice

            Second run

                     v_ChirpData 0.004999 0.00000  test
                   fpu_ChirpData 0.012899 0.00000  test
               fpu_opt_ChirpData 0.004722 0.00000  test
             sse1_ChirpData_ak8e 0.005912 0.00000  test
              sse2_ChirpData_ak8 0.004414 0.00000  test
              sse3_ChirpData_ak8 0.004065 0.00000  test
                 avx_ChirpData_a 0.002204 0.00000  test
                 avx_ChirpData_b 0.002195 0.00000  test
                 avx_ChirpData_c 0.002226 0.00000  test
                 avx_ChirpData_d 0.002059 0.00000  test
                 avx_ChirpData_e 0.002055 0.00000  test
                 avx_ChirpData_f 0.002176 0.00000  test
                 avx_ChirpData_g 0.002093 0.00000  test
                 avx_ChirpData_h 0.002694 0.00000  test
                 avx_ChirpData_i 0.002245 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_e 0.002055 0.00000  choice

            Third run

                     v_ChirpData 0.004695 0.00000  test
                   fpu_ChirpData 0.012390 0.00000  test
               fpu_opt_ChirpData 0.004516 0.00000  test
             sse1_ChirpData_ak8e 0.005742 0.00000  test
              sse2_ChirpData_ak8 0.004219 0.00000  test
              sse3_ChirpData_ak8 0.004038 0.00000  test
                 avx_ChirpData_a 0.002096 0.00000  test
                 avx_ChirpData_b 0.002074 0.00000  test
                 avx_ChirpData_c 0.002121 0.00000  test
                 avx_ChirpData_d 0.001955 0.00000  test
                 avx_ChirpData_e 0.001953 0.00000  test
                 avx_ChirpData_f 0.002074 0.00000  test
                 avx_ChirpData_g 0.002091 0.00000  test
                 avx_ChirpData_h 0.002691 0.00000  test
                 avx_ChirpData_i 0.002248 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_e 0.001953 0.00000  choice

                   Test duration     8.12 seconds

Ftst_v7 completed successfully.

Navigation

[0] Message Index

[#] Next page

[*] Previous page

Go to full version