cudaBeliefProp/html/_evaluate_imp_results_8cpp_source.html

 /*

 Copyright (C) 2024 Scott Grauer-Gray


 This program is free software; you can redistribute it and/or modify

 it under the terms of the GNU General Public License as published by

 the Free Software Foundation; either version 2 of the License, or

 (at your option) any later version.


 This program is distributed in the hope that it will be useful,

 but WITHOUT ANY WARRANTY; without even the implied warranty of

 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the

 GNU General Public License for more details.


 You should have received a copy of the GNU General Public License

 along with this program; if not, write to the Free Software

 Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA

 */


 #include <sstream>

 #include <numeric>

 #include <fstream>

 #include <algorithm>

 #include "EvaluateAcrossRuns.h"

 #include "RunResultsSpeedups.h"

 #include "EvaluateImpResults.h"


 //evaluate results for implementation runs on multiple inputs with all the runs

 //having the same data type and acceleration method

 //return run data with speedup from evaluation of implementation runs using

 //multiple inputs with runs having the same data type and acceleration method

 std::pair<MultRunData, std::vector<RunSpeedupAvgMedian>>

 EvaluateImpResults::EvalResultsSingDataTypeAcc(

   const MultRunData& run_results,

   const run_environment::RunImpSettings& run_imp_settings,

   size_t data_size) const

 {

   //store whether or not parallel parameters optimized in run

   const bool p_params_optimized{

     (!(run_imp_settings.p_params_default_alt_options.second.empty()))};


   //initialize and add speedup results over baseline data if available for

   //current input

   auto run_imp_opt_results = run_results;

   const auto speedup_over_baseline =

     GetSpeedupOverBaseline(

       run_imp_settings,

       run_imp_opt_results,

       data_size);

   const auto speedup_over_baseline_subsets =

     GetSpeedupOverBaselineSubsets(

       run_imp_settings,

       run_imp_opt_results,

       data_size);


   //initialize implementation run speedups

   std::vector<RunSpeedupAvgMedian> run_imp_speedups;

   run_imp_speedups.insert(run_imp_speedups.cend(),

                           speedup_over_baseline.cbegin(),

                           speedup_over_baseline.cend());

   run_imp_speedups.insert(run_imp_speedups.cend(),

                           speedup_over_baseline_subsets.cbegin(),

                           speedup_over_baseline_subsets.cend());


   //compute and add speedup info for using optimized parallel parameters

   //compared to default parallel parameters

   if (p_params_optimized) {

     const std::string speedup_header_optimized_p_params =

       std::string(run_eval::kSpeedupOptParParamsHeader) + " - " +

       std::string(run_environment::kDataSizeToNameMap.at(data_size));

     const auto opt_p_params_speedups =

       GetAvgMedSpeedupOptPParams(

         run_imp_opt_results,

         speedup_header_optimized_p_params,

         run_imp_settings.subset_desc_input_sig);

     run_imp_speedups.insert(

       run_imp_speedups.end(),

       opt_p_params_speedups.begin(),

       opt_p_params_speedups.end());

   }


   //compute and add speedup info for using templated loop iteration counts

   //compared to loop iteration counts not being known at compile time

   if (run_imp_settings.templated_iters_setting ==

       run_environment::TemplatedItersSetting::kRunTemplatedAndNotTemplated)

   {

     const std::string speedup_header_loop_iters_templated =

       std::string(run_eval::kSpeedupLoopItersCountTemplate) + " - " +

       std::string(run_environment::kDataSizeToNameMap.at(data_size));

     const auto speedups_templated_iters = GetAvgMedSpeedupLoopItersInTemplate(

       run_imp_opt_results, speedup_header_loop_iters_templated,

       run_imp_settings);

     run_imp_speedups.insert(

       run_imp_speedups.end(),

       speedups_templated_iters.begin(),

       speedups_templated_iters.end());

   }


   //return run data with speedup from evaluation of implementation runs using

   //multiple inputs with runs having the same data type and acceleration method

   return {run_imp_opt_results, run_imp_speedups};

 }


 //get speedups across all runs

 std::vector<RunSpeedupAvgMedian> EvaluateImpResults::SpeedupsAllRuns(

   MultRunData& run_results,

   const run_environment::RunImpSettings& run_imp_settings) const

 {

   //store whether or not parallel parameters optimized in run

   const bool p_params_optimized{

     (!(run_imp_settings.p_params_default_alt_options.second.empty()))};


   //initialize vector for speedups across all runs

   std::vector<RunSpeedupAvgMedian> speedups_all_runs;


   //get and add speedups over baseline runtimes for all runs

   if (run_imp_settings.baseline_runtimes_path_desc)

   {

     const auto speedup_over_baseline = GetAvgMedSpeedupOverBaseline(

       run_results, run_eval::kAllRunsStr,

       *run_imp_settings.baseline_runtimes_path_desc);

     speedups_all_runs.insert(

       speedups_all_runs.cend(),

       speedup_over_baseline.cbegin(),

       speedup_over_baseline.cend());

   }


   //get and add speedup for using optimized parallel parameters

   //compared to default for all runs

   if (p_params_optimized) {

     const auto opt_p_params_speedups =

       GetAvgMedSpeedupOptPParams(

         run_results,

         std::string(run_eval::kSpeedupOptParParamsHeader) + " - " +

           std::string(run_eval::kAllRunsStr),

           run_imp_settings.subset_desc_input_sig);

     speedups_all_runs.insert(

       speedups_all_runs.end(),

       opt_p_params_speedups.begin(),

       opt_p_params_speedups.end());

   }


   //get and add speedup when using templated loop iteration count

   //where loop iteration count is known at compile time for all runs

   if (run_imp_settings.templated_iters_setting ==

       run_environment::TemplatedItersSetting::kRunTemplatedAndNotTemplated)

   {

     const auto speedups_templated_iters =  GetAvgMedSpeedupLoopItersInTemplate(

       run_results,

       std::string(run_eval::kSpeedupLoopItersCountTemplate) + " - " +

         std::string(run_eval::kAllRunsStr),

       run_imp_settings);

     speedups_all_runs.insert(

       speedups_all_runs.end(),

       speedups_templated_iters.begin(),

       speedups_templated_iters.end());

   }


   //return speedups across all runs

   return speedups_all_runs;

 }


 //evaluate results for all implementation runs on multiple inputs with the runs

 //potentially having different data types and acceleration methods and

 //write run result and speedup outputs to files

 void EvaluateImpResults::EvalAllResultsWriteOutput(

   const std::unordered_map<size_t, MultRunDataWSpeedupByAcc>&

     run_results_mult_runs,

   const run_environment::RunImpSettings& run_imp_settings,

   run_environment::AccSetting opt_imp_acc) const

 {

   //initialize optimized multi-run results from input run result

   //run results must be writable since speedup results get added to runs and

   //optimized run results may be adjusted if faster runs found in alternative

   //implementations compared to expected fastest implementation

   std::unordered_map<size_t, MultRunDataWSpeedupByAcc> run_result_mult_runs_opt =

     run_results_mult_runs;


   //write run results with each acceleration

   for (const auto& [acc, run_results_w_speedups] : run_result_mult_runs_opt.begin()->second) {

     //generate combined run results for each acceleration across data types

     MultRunData run_results_acc;

     for (const auto& [data_size, run_results_w_speedups_by_acc] : run_results_mult_runs) {

       run_results_acc.insert(

         run_results_w_speedups_by_acc.at(acc).first.begin(),

         run_results_w_speedups_by_acc.at(acc).first.end());

     }


     //write run results for acceleration

     WriteRunResultsForAcc(

       run_results_acc,

       acc,

       run_imp_settings);

   }


   //check if setting is to run alternate optimized implementations and run and

   //evaluate alternate optimized implementations if that's the case

   std::unordered_map<size_t, std::vector<RunSpeedupAvgMedian>> alt_imp_speedup;

   if (run_imp_settings.run_alt_optimized_imps) {

     //get speedup/slowdown using alternate accelerations and update optimized

     //run result for input with result using alternate acceleration if it is

     //faster than result with "optimal" acceleration for specific input

     for (const size_t data_size : run_imp_settings.datatypes_eval_sizes)

     {

       //get alternate acceleration speedups and optimized run results where

       //fastest acceleration run results are replaced with alternate

       //acceleration if it is faster

       const auto [alt_acc_speedup, opt_run_results] = GetAltAccelSpeedups(

         run_result_mult_runs_opt.at(data_size),

         run_imp_settings, data_size,

         opt_imp_acc);


       //if speedup output for alternate acceleration is generated,

       //add alternate acceleration speedups for current data size and

       //update optimized acceleration run results with results from alternate

       //accelerations evaluation where run data for each input is set to

       //fastest of all evaluated accelerations

       if (!(alt_acc_speedup.empty())) {

         //add alternate acceleration speedups for current data size

         alt_imp_speedup.insert({data_size, alt_acc_speedup});


         //update optimized acceleration run results

         run_result_mult_runs_opt.at(data_size).at(opt_imp_acc).first =

           opt_run_results;

       }

     }

   }


   //get speedup/slowdown using alternate datatype (double or half) compared

   //with float

   //needs to be run after alternate acceleration since run results can be

   //updated with faster runs from alternate accelerations

   std::vector<RunSpeedupAvgMedian> speedups_alt_datatypes;

   for (const size_t data_size : run_imp_settings.datatypes_eval_sizes)

   {

     if ((data_size != sizeof(float)) &&

         (run_result_mult_runs_opt.contains(sizeof(float))))

     {

       //get speedup or slowdown using alternate data type (double or half)

       //compared with float and add to run speedups

       const auto alt_datatype_speedups = GetAvgMedSpeedupBaseVsTarget(

           run_result_mult_runs_opt.at(sizeof(float)).at(opt_imp_acc).first,

           run_result_mult_runs_opt.at(data_size).at(opt_imp_acc).first,

           (data_size > sizeof(float)) ?

           run_eval::kSpeedupDoubleHeader :

           run_eval::kSpeedupHalfHeader,

           BaseTargetDiff::kDiffDatatype,

           run_imp_settings.subset_desc_input_sig);

       speedups_alt_datatypes.insert(

         speedups_alt_datatypes.begin(),

         alt_datatype_speedups.begin(),

         alt_datatype_speedups.end());

     }

   }


   //initialize overall results to first data size results using fastest

   //acceleration and add results using alternate datatypes to it

   const size_t first_datatype_size =

     run_imp_settings.datatypes_eval_sizes.front();

   auto [run_results, run_speedups] =

     run_result_mult_runs_opt.at(first_datatype_size).at(opt_imp_acc);


   //go through each datatype and add speedups to overall speedup results

   for (const auto run_datatype_size : run_imp_settings.datatypes_eval_sizes) {

     //add speedup data from alternate acceleration runs and speedup results from

     //double and half precision runs to speedup results

     if (run_datatype_size == first_datatype_size) {

       if (alt_imp_speedup.contains(run_datatype_size)) {

         run_speedups.insert(run_speedups.cend(),

           alt_imp_speedup.at(run_datatype_size).cbegin(),

           alt_imp_speedup.at(run_datatype_size).cend());

       }

     }

     else {

       run_speedups.insert(run_speedups.cend(),

         run_result_mult_runs_opt.at(run_datatype_size).at(opt_imp_acc).second.cbegin(),

         run_result_mult_runs_opt.at(run_datatype_size).at(opt_imp_acc).second.cend());

       if (alt_imp_speedup.contains(run_datatype_size)) {

         run_speedups.insert(run_speedups.cend(),

           alt_imp_speedup.at(run_datatype_size).cbegin(),

           alt_imp_speedup.at(run_datatype_size).cend());

       }

     }

   }


   //go through alternate datatypes and add run results for datatype to overall

   //run results

   for (const auto run_datatype_size : run_imp_settings.datatypes_eval_sizes) {

     if (run_datatype_size != first_datatype_size) {

       run_results.insert(

         run_result_mult_runs_opt.at(run_datatype_size).at(opt_imp_acc).first.cbegin(),

         run_result_mult_runs_opt.at(run_datatype_size).at(opt_imp_acc).first.cend());

     }

   }


   //compute and add speedups for all runs across all data types

   const auto speedups_all_runs =

     SpeedupsAllRuns(run_results, run_imp_settings);

   run_speedups.insert(

     run_speedups.cend(),

     speedups_all_runs.cbegin(),

     speedups_all_runs.cend());


   //speedups for alternate data types added at end of to overall speedups so

   //they are final speedups displayed in speedups list

   run_speedups.insert(

     run_speedups.cend(),

     speedups_alt_datatypes.cbegin(),

     speedups_alt_datatypes.cend());


   //write output corresponding to results and run_speedups for all data types

   WriteRunOutput({run_results, run_speedups}, run_imp_settings, opt_imp_acc);

 }


 //Write run results corresponding to runs using a specific acceleration to a

 //file with the acceleration setting as part of the file name

 void EvaluateImpResults::WriteRunResultsForAcc(

   const MultRunData& run_results,

   run_environment::AccSetting acceleration_setting,

   const run_environment::RunImpSettings& run_imp_settings) const

 {

   //get run implementation results file path

   const auto imp_results_fp = GetImpResultsPath();


   //generate directory for results if not already created

   if (!(std::filesystem::is_directory(

     imp_results_fp / run_eval::kImpResultsRunDataAccFolderName)))

   {

     std::filesystem::create_directory(

       imp_results_fp / run_eval::kImpResultsRunDataAccFolderName);

   }


   //get file path for results with fastest acceleration

   const auto path_acc_results =

     imp_results_fp /

     run_eval::kImpResultsRunDataAccFolderName /

     std::filesystem::path(run_imp_settings.run_name +

     std::string(run_eval::kRunResultsDescFileName) + "_" +

     std::string(run_environment::AccelerationString(acceleration_setting)) +

     std::string(run_eval::kCsvFileExtension));


   //initialize output file stream for results

   std::ofstream out_results_str(path_acc_results);


   //get iterator to first run with success

   //run_result corresponds to a std::optional object that contains run data if

   //run successful and returns false if no data (indicating run not successful)

   const auto first_success_run_iter =

     std::ranges::find_if(run_results,

       [](const auto& run_result) { return run_result.second.has_value(); } );


   //get headers from first successful run and write headers to top of output

   //files

   auto headers_in_order = first_success_run_iter->second->at(

     run_environment::ParallelParamsSetting::kOptimized).HeadersInOrder();


   //go through remaining runs and add headers that aren't already there

   for (const auto& [_, run_sig_data] : run_results) {

     if (run_sig_data) {

       for (const auto& curr_header : run_sig_data->at(

              run_environment::ParallelParamsSetting::kOptimized).HeadersInOrder())

       {

         if (auto header_iter = std::ranges::find(headers_in_order,

                                                  curr_header);

             header_iter == headers_in_order.cend())

         {

           headers_in_order.push_back(curr_header);

         }

       }

     }

   }


   //write each results header in order in first row of results string

   //for each results set and then write newline to go to next line

   for (const auto& curr_header : headers_in_order) {

     out_results_str << curr_header << ',';

   }

   out_results_str << std::endl;


   //write output for run on each input with each data type

   //write data for optimized parallel parameters

   for (const auto& [_, run_sig_data] : run_results) {

     //if run not successful only have single set of output data from run

     //don't write data if no data for run

     if (run_sig_data) {

       for (const auto& curr_header : headers_in_order) {

         if (run_sig_data->at(run_environment::ParallelParamsSetting::kOptimized).IsData(curr_header))

         {

           out_results_str <<

             run_sig_data->at(run_environment::ParallelParamsSetting::kOptimized).GetDataAsStr(curr_header);

         }

         out_results_str << ',';

       }

       out_results_str << std::endl;

     }

   }


   std::cout << "Run results for using "

             << run_environment::AccelerationString(acceleration_setting)

             << " acceleration written to " << path_acc_results << std::endl;


   //close output file stream

   out_results_str.close();

 }


 //write current run results and speedup data to files

 //that can be read to evaluate results across runs

 void EvaluateImpResults::WriteRunOutput(

   const std::pair<MultRunData, std::vector<RunSpeedupAvgMedian>>&

     run_results_w_speedups,

   const run_environment::RunImpSettings& run_imp_settings,

   run_environment::AccSetting acceleration_setting) const

 {

   //get references to run results and speedups

   const auto& [run_results, speedup_headers_w_data] = run_results_w_speedups;


   //store whether or not parallel parameters optimized in run

   const bool p_params_optimized{

     (!(run_imp_settings.p_params_default_alt_options.second.empty()))};


   //get iterator to first run with success

   //run_result corresponds to a std::optional object that contains run data if

   //run successful and returns false if no data (indicating run not successful)

   const auto first_success_run_iter =

     std::ranges::find_if(run_results,

       [](const auto& run_result) { return run_result.second.has_value(); } );


   //check if there was at least one successful run

   if (first_success_run_iter != run_results.cend())

   {

     //initialize parallel params setting enum and set of parallel params

     //settings that are enabled in run

     const auto& parallel_param_settings =

       p_params_optimized ?

       std::set<run_environment::ParallelParamsSetting>{

         run_environment::ParallelParamsSetting::kDefault,

         run_environment::ParallelParamsSetting::kOptimized} :

       std::set<run_environment::ParallelParamsSetting>{

         run_environment::ParallelParamsSetting::kDefault};


     //get headers from first successful run and write headers to top of output

     //files

     auto headers_in_order = first_success_run_iter->second->at(

       run_environment::ParallelParamsSetting::kOptimized).HeadersInOrder();


     //get vector of speedup headers to use for evaluation across runs

     //and also for run results

     std::vector<std::string> speedup_headers;

     for (const auto& [speedup_header, _] : speedup_headers_w_data) {

       speedup_headers.push_back(speedup_header);

     }


     //delete any speedup headers already in headers_in_order

     //since they will be added in order to end of vector

     for (const auto& speedup_header : speedup_headers) {

       if (auto speedup_header_iter = std::ranges::find(headers_in_order,

                                                        speedup_header);

           speedup_header_iter != headers_in_order.cend())

       {

         headers_in_order.erase(speedup_header_iter);

       }

     }


     //add speedup headers to the end of headers in order

     headers_in_order.insert(

       headers_in_order.cend(),

       speedup_headers.cbegin(),

       speedup_headers.cend());


     //initialize map of ostringstreams for run data using default and

     //optimized parallel parameters

     std::map<run_environment::ParallelParamsSetting, std::ostringstream>

       run_data_sstr;

     for (const auto& p_param_setting : parallel_param_settings) {

       run_data_sstr.insert({p_param_setting, std::ostringstream()});

     }


     //write each results header in order in first row of results string

     //for each results set and then write newline to go to next line

     for (const auto& curr_header : headers_in_order) {

       for (const auto& p_param_setting : parallel_param_settings) {

         run_data_sstr.at(p_param_setting) << curr_header << ',';

       }

     }

     for (const auto& p_param_setting : parallel_param_settings) {

       run_data_sstr.at(p_param_setting) << std::endl;

     }


     //write output for run on each input with each data type

     //write data for default parallel parameters and for optimized parallel

     //parameters

     for (const auto& p_param_setting : parallel_param_settings) {

       for (const auto& [_, run_sig_data] : run_results) {

         //if run not successful only have single set of output data from run

         //don't write data if no data for run

         if (run_sig_data) {

           for (const auto& curr_header : headers_in_order) {

             if (run_sig_data->at(p_param_setting).IsData(curr_header))

             {

               run_data_sstr.at(p_param_setting) <<

                 run_sig_data->at(p_param_setting).GetDataAsStr(curr_header);

             }

             run_data_sstr.at(p_param_setting) << ',';

           }

           run_data_sstr.at(p_param_setting) << std::endl;

         }

       }

     }


     //write run results strings to output streams corresponding to results files

     //two results files contain run results (with and without optimized

     //parallel parameters), one results file contains speedup results, and another

     //contains run results followed by speedups


     //get run implementation results file path

     const auto imp_results_fp = GetImpResultsPath();


     //initialize mapping from output results type to file path where each

     //results type is saved

     std::map<run_eval::OutResults, const std::filesystem::path> output_file_paths;


     //create any results directories if needed

     //and generate file paths for each output results type

     for (const auto& [out_results_type, file_info] : run_eval::kOutResultsFileInfo) {

       if (!(std::filesystem::is_directory(imp_results_fp / file_info.dir_path))) {

         std::filesystem::create_directory(imp_results_fp / file_info.dir_path);

       }

       output_file_paths.insert(

         {out_results_type,

          imp_results_fp / file_info.dir_path /

            std::filesystem::path(run_imp_settings.run_name + "_" +

            std::string(file_info.desc_file_name) +

            std::string(run_eval::kCsvFileExtension))});

     }


     //write run results with and without optimized parallel parameters to files

     //if run without optimized parallel parameters then results with default

     //parallel parameters also written to optimized parallel parameters file

     std::map<run_eval::OutResults, std::ofstream> results_stream;

     for (const auto& [out_results_type, file_path] : output_file_paths) {

       results_stream.insert(

         {out_results_type,

          std::ofstream(file_path)});

     }


     //write run results file with default parallel params

     results_stream.at(run_eval::OutResults::kDefaultPParams) <<

       run_data_sstr.at(run_environment::ParallelParamsSetting::kDefault).str();

     if (p_params_optimized) {

       //write run results with optimized parallel params to optimized

       //run results file stream

       results_stream.at(run_eval::OutResults::kOptPParams) <<

         run_data_sstr.at(

           run_environment::ParallelParamsSetting::kOptimized).str();

       //write optimized run results to ostringstream for output containing run

       //results and speedups

       results_stream.at(run_eval::OutResults::kOptWSpeedups) <<

         run_data_sstr.at(

           run_environment::ParallelParamsSetting::kOptimized).str();

     }

     else {

       //write results with default parallel parameters to optimized results

       //file stream if parallel parameters not optimized in run

       results_stream.at(run_eval::OutResults::kOptPParams) <<

         run_data_sstr.at(

           run_environment::ParallelParamsSetting::kDefault).str();

       results_stream.at(run_eval::OutResults::kOptWSpeedups) <<

         run_data_sstr.at(

           run_environment::ParallelParamsSetting::kDefault).str();

     }


     //generate speedup results with headers on top row and write to

     //"speedup" results stream

     results_stream.at(run_eval::OutResults::kSpeedups) << ',';

     //speedup headers for each computed speedup in top row

     for (const auto& [speedup_header, _] : speedup_headers_w_data) {

       results_stream.at(run_eval::OutResults::kSpeedups) << speedup_header

                                                          << ',';

     }

     //average and median speedup results corresponding to speedup headers in

     //next two rows

     for (const auto& [middle_val_desc, middle_val_enum] :

       {std::pair<std::string_view, run_eval::MiddleValData>{

         "Average Speedup", run_eval::MiddleValData::kAverage},

        std::pair<std::string_view, run_eval::MiddleValData>{

         "Median Speedup", run_eval::MiddleValData::kMedian}})

     {

       results_stream.at(run_eval::OutResults::kSpeedups) << std::endl <<

         middle_val_desc << ',';

       for (const auto& [_, speedup_data] : speedup_headers_w_data) {

         if (speedup_data.contains(middle_val_enum)) {

           results_stream.at(run_eval::OutResults::kSpeedups) <<

             speedup_data.at(middle_val_enum) << ',';

         }

         else {

           results_stream.at(run_eval::OutResults::kSpeedups) << ',';

         }

       }

     }


     //generate speedup results with headers on left side

     //and add to results stream for run results with speedups

     results_stream.at(run_eval::OutResults::kOptWSpeedups) << std::endl <<

       "Speedup Results,Average Speedup,Median Speedup" << std::endl;

     for (const auto& [speedup_header, speedup_data] : speedup_headers_w_data) {

       results_stream.at(run_eval::OutResults::kOptWSpeedups) << speedup_header;

       if ((speedup_data.contains(run_eval::MiddleValData::kAverage)) &&

           (speedup_data.at(run_eval::MiddleValData::kAverage) > 0)) {

         results_stream.at(run_eval::OutResults::kOptWSpeedups) << ',' <<

           speedup_data.at(run_eval::MiddleValData::kAverage) << ',' <<

           speedup_data.at(run_eval::MiddleValData::kMedian);

       }

       else {

         results_stream.at(run_eval::OutResults::kOptWSpeedups) << ",,";

       }

       results_stream.at(run_eval::OutResults::kOptWSpeedups) << std::endl;

     }


     //close streams for writing to results files since file writing is done

     for (auto& [_, curr_results_stream] : results_stream) {

       curr_results_stream.close();

     }


     //print location of output evaluation files to standard output

     for (const auto& [out_results_type, out_results_desc_str] :

          run_eval::kOutResultsDesc)

     {

       std::cout << out_results_desc_str << " in " <<

         output_file_paths.at(out_results_type) << std::endl;

     }


     //run evaluation across current and previous runs across architectures

     //using run results and speedups saved from previous runs along with

     //current run results

     EvaluateAcrossRuns().operator()(

       imp_results_fp,

       GetCombResultsTopText(),

       GetInputParamsShow());

   }

   else {

     std::cout << "Error, no runs completed successfully" << std::endl;

   }

 }


 //process results for runs with alternate acceleration from optimal

 //acceleration and get speedup for each run and overall when using optimal

 //acceleration compared to alternate accelerations as well as optimized run

 //results where fastest acceleration result is replaced by alternate

 //acceleration result if it is faster

 std::pair<std::vector<RunSpeedupAvgMedian>, MultRunData>

 EvaluateImpResults::GetAltAccelSpeedups(

   MultRunDataWSpeedupByAcc& run_imp_results_by_acc_setting,

   const run_environment::RunImpSettings& run_imp_settings,

   size_t data_type_size,

   run_environment::AccSetting fastest_acc) const

 {

   if (run_imp_results_by_acc_setting.size() == 1) {

     //no alternate run results

     //return empty vector for speedup results

     //return run implementation results that are the same as input

     return {{}, run_imp_results_by_acc_setting.at(fastest_acc).first};

   }

   else {

     //initialize optimized run results to "fastest" acceleration results

     //results get replaced by alternate acceleration result if alternate

     //acceleration is faster

     auto run_imp_opt_results =

       run_imp_results_by_acc_setting.at(fastest_acc).first;


     //initialize speedup/slowdown using alternate acceleration

     std::vector<RunSpeedupAvgMedian> alt_acc_speedups;

     for (auto& [acc_setting, acc_results] : run_imp_results_by_acc_setting) {

       if (acc_setting != fastest_acc) {

         //get speedup/slowdown using alternate acceleration compared to

         //"fastest" acceleration and store in speedup results

         alt_acc_speedups.push_back(

           GetAvgMedSpeedupBaseVsTarget(

             acc_results.first,

             run_imp_results_by_acc_setting.at(fastest_acc).first,

             std::string(run_eval::kAltAccToSpeedupDesc.at(acc_setting)) +

               " - " + std::string(run_environment::kDataSizeToNameMap.at(

                                   data_type_size)),

             BaseTargetDiff::kDiffAcceleration).front());


         //process optimized results using alternate acceleration

         //go through each result and replace optimized run data with alternate

         //implementation run data if alternate implementation run is faster

         for (auto& [run_input_sig, opt_sig_run_results] : run_imp_opt_results)

         {

           if (opt_sig_run_results && acc_results.first.at(run_input_sig))

           {

             //get runtime of current optimized run and alternate acceleration

             //run

             //if alternate acceleration run is faster, replace the optimized

             //result for run with alternate acceleration run

             const double opt_result_time =

               *opt_sig_run_results->at(

                 run_environment::ParallelParamsSetting::kOptimized).

                   GetDataAsDouble(run_eval::kOptimizedRuntimeHeader);

             const double alt_acc_result_time =

               *acc_results.first.at(run_input_sig)->at(

                 run_environment::ParallelParamsSetting::kOptimized).

                   GetDataAsDouble(run_eval::kOptimizedRuntimeHeader);

             if (alt_acc_result_time < opt_result_time) {

               //set optimized run results to alternate acceleration results if

               //it is faster

               opt_sig_run_results = acc_results.first.at(run_input_sig);

             }

           }

         }

       }

     }

     return {alt_acc_speedups, run_imp_opt_results};

   }

 }


 //get speedup over baseline data if data available

 std::vector<RunSpeedupAvgMedian> EvaluateImpResults::GetSpeedupOverBaseline(

   const run_environment::RunImpSettings& run_imp_settings,

   MultRunData& run_data_all_runs,

   size_t data_type_size) const

 {

   //initialize speedup results

   std::vector<RunSpeedupAvgMedian> speedup_results;


   //get speedup over baseline runtimes if available

   if (run_imp_settings.baseline_runtimes_path_desc)

   {

     const auto speedup_over_baseline = GetAvgMedSpeedupOverBaseline(

       run_data_all_runs,

       run_environment::kDataSizeToNameMap.at(data_type_size),

       *run_imp_settings.baseline_runtimes_path_desc);

     speedup_results.insert(

       speedup_results.cend(),

       speedup_over_baseline.cbegin(),

       speedup_over_baseline.cend());

   }


   return speedup_results;

 }


 //get speedup over baseline run for subsets of smallest and largest sets

 //if data available

 std::vector<RunSpeedupAvgMedian>

 EvaluateImpResults::GetSpeedupOverBaselineSubsets(

   const run_environment::RunImpSettings& run_imp_settings,

   MultRunData& run_data_all_runs,

   size_t data_type_size) const

 {

   if (run_imp_settings.baseline_runtimes_path_desc)

   {

     return GetAvgMedSpeedupOverBaselineSubsets(

       run_data_all_runs,

       run_environment::kDataSizeToNameMap.at(data_type_size),

       *run_imp_settings.baseline_runtimes_path_desc,

       run_imp_settings.subset_desc_input_sig);

   }

   //return empty vector if doesn't match settings to get speedup over baseline

   //for subsets

   return std::vector<RunSpeedupAvgMedian>();

 }


 //get baseline runtime data (assumed to be available)

 //key for runtime data in results is different to retrieve optimized runtime

 //compared to single thread runtime for baseline run

 std::pair<std::string, std::map<InputSignature, std::string>>

 EvaluateImpResults::GetBaselineRuntimeData(

   const std::array<std::string_view, 2>& baseline_runtimes_path_desc,

   std::string_view key_runtime_data) const

 {

   RunResultsSpeedups baseline_run_results(baseline_runtimes_path_desc.at(0));

   return std::pair<std::string, std::map<InputSignature, std::string>>{

     std::string(baseline_runtimes_path_desc.at(1)),

     baseline_run_results.InputsToKeyVal(key_runtime_data)};

 }


 //get average and median speedup from vector of speedup values

 RunSpeedupAvgMedian::second_type EvaluateImpResults::GetAvgMedSpeedup(

   const std::vector<double>& speedups_vect) const

 {

   const double average_speedup =

     std::accumulate(

       speedups_vect.cbegin(),

       speedups_vect.cend(),

       0.0) /

     (double)speedups_vect.size();

   auto speedups_vect_sorted = speedups_vect;

   std::ranges::sort(speedups_vect_sorted);

   const double median_speedup =

     ((speedups_vect_sorted.size() % 2) == 0) ?

       ((speedups_vect_sorted.at((speedups_vect_sorted.size() / 2) - 1) +

         speedups_vect_sorted.at(speedups_vect_sorted.size() / 2)) / 2.0) :

       speedups_vect_sorted.at(speedups_vect_sorted.size() / 2);

   return {{run_eval::MiddleValData::kAverage, average_speedup},

           {run_eval::MiddleValData::kMedian, median_speedup}};

 }


 //get average and median speedup of specified subset(s) of runs compared to

 //baseline data from file

 std::vector<RunSpeedupAvgMedian>

 EvaluateImpResults::GetAvgMedSpeedupOverBaselineSubsets(

   MultRunData& run_results,

   std::string_view data_type_str,

   const std::array<std::string_view, 2>& baseline_runtimes_path_desc,

   const std::vector<std::pair<

     std::string, std::vector<InputSignature>>>& subset_desc_input_sig) const

 {

   //get speedup over baseline for specified subsets of optimized runs

   std::vector<RunSpeedupAvgMedian> speedup_data;


   //get baseline name and mapping of runtimes to input signatures

   //auto baseline_runtime_data =

   const auto [baseline_name, baseline_runtimes_to_sig] =

     GetBaselineRuntimeData(

       baseline_runtimes_path_desc,

       run_eval::kOptimizedRuntimeHeader);


   //retrieve speedup data for subsets of optimized runs over corresponding

   //run in baseline data

   //go through each specified subset of runs and compute average and median

   //speedup compared to baseline for each subset

   for (const auto& [subset_desc, subset_inputs] : subset_desc_input_sig)

   {

     //speedup vector is empty at start of processing of each subset

     std::vector<double> speedups_vect;


     //get header corresponding to current subset

     const std::string speedup_header = "Speedup relative to " +

       std::string(baseline_name) + " - " + std::string(data_type_str) +

       " on " + std::string(subset_desc);


     //go through each input signature of current subset

     for (const auto& subset_input_signature : subset_inputs)

     {

       //go through each run output and compute speedup for each run that

       //matches subset input signature

       for (auto& [run_sig, run_sig_results] : run_results)

       {

         //check if results present for current run signature

         if (run_sig_results)

         {

           //check if run signature corresponds to subset signature and retrieve

           //and process speedup compared to baseline if that's the case

           if (run_sig.EqualsUsingAny(subset_input_signature)) {

             speedups_vect.push_back(

               std::stod(baseline_runtimes_to_sig.at(run_sig)) /

               *run_sig_results->at(

                 run_environment::ParallelParamsSetting::kOptimized).

                   GetDataAsDouble(run_eval::kOptimizedRuntimeHeader));

             for (auto& [_, run_data] : *run_sig_results) {

               run_data.AddDataWHeader(

                 std::string(speedup_header),

                 speedups_vect.back());

             }

           }

         }

       }

     }

     if (!(speedups_vect.empty())) {

       speedup_data.push_back(

         {speedup_header, GetAvgMedSpeedup(speedups_vect)});

     }

   }


   //return vector of average and median speedups for specified subsets of runs

   //compared to baseline

   return speedup_data;

 }


 //get average and median speedup of current runs compared to baseline data from file

 std::vector<RunSpeedupAvgMedian> EvaluateImpResults::GetAvgMedSpeedupOverBaseline(

   MultRunData& run_results,

   std::string_view data_type_str,

   const std::array<std::string_view, 2>& baseline_runtimes_path_desc) const

 {

   //define the start of the speedup info and runtime header in run data

   //that is being compared for optimized and single thread implementations

   const std::array<std::string_view, 2> baseline_opt_start_info_runtime_header{

     "Speedup relative to",

     run_eval::kOptimizedRuntimeHeader};

   const std::array<std::string_view, 2> baseline_s_thread_start_info_runtime_header{

     "Single-Thread (Orig Imp) speedup relative to",

     run_eval::kSingleThreadRuntimeHeader};


   //vector for speedup data over baseline for optimized and single thread

   //implementations

   std::vector<RunSpeedupAvgMedian> speedup_data;


   //get speedup of current run compared to baseline optimized and

   //single thread implementations where first iteration is baseline optimized

   //and second iteration is baseline single thread

   for (const auto& start_info_runtime_header :

        {baseline_opt_start_info_runtime_header,

         baseline_s_thread_start_info_runtime_header})

   {

     //get baseline run data for runs according to current runtime header

     const auto [baseline_name, baseline_runtimes_to_sig] =

       GetBaselineRuntimeData(

         baseline_runtimes_path_desc,

         start_info_runtime_header.at(1));

     const std::string speedup_header =

       std::string(start_info_runtime_header.at(0)) +

         " " + baseline_name + " - " + std::string(data_type_str);

     std::vector<double> speedups_vect;

     for (auto& [run_sig, run_sig_results] : run_results)

     {

       //compute speedup for each run compared to baseline runtime and add

       //to vector of speedups as well as to run data

       if (run_sig_results && (baseline_runtimes_to_sig.contains(run_sig)))

       {

         //get current run runtime for input signature

         const auto runtime_input_sig = *run_sig_results->at(

           run_environment::ParallelParamsSetting::kOptimized).GetDataAsDouble(

             start_info_runtime_header.at(1));


         //get runtime of baseline run for input signature

         const auto baseline_runtime =

           std::stod(baseline_runtimes_to_sig.at(run_sig));


         //compute speedup of current run and add to vector of speedups

         //and also to run data for current run using input signature

         speedups_vect.push_back(baseline_runtime / runtime_input_sig);

         for (auto& [_, run_data] : *run_sig_results) {

           run_data.AddDataWHeader(speedup_header, speedups_vect.back());

         }

       }

     }

     if (!(speedups_vect.empty())) {

       //get average and median speedups across all runs compared to

       //baseline runtimes

       speedup_data.push_back(

         {speedup_header, GetAvgMedSpeedup(speedups_vect)});

     }

   }


   return speedup_data;

 }


 //get average and median speedup using optimized parallel parameters compared to default parallel parameters

 //and also add speedup for each run using optimized parallel parameters compared to each run with default

 //parallel parameters

 std::vector<RunSpeedupAvgMedian> EvaluateImpResults::GetAvgMedSpeedupOptPParams(

   MultRunData& run_results, std::string_view speedup_header,

   const std::optional<std::vector<std::pair<std::string, std::vector<InputSignature>>>>& eval_subsets) const

 {

   //initialize speedup evaluations

   std::vector<RunSpeedupAvgMedian> speedups_base_v_target;


   //initialize evaluation sets to evaluate to set of all runs

   std::vector<std::pair<std::string, std::vector<InputSignature>>> eval_sets

     {std::make_pair(

       std::string(), std::vector<InputSignature>{InputSignature({}, {}, {})})};


   //add subsets specified in input parameter to subsets to evaluate

   if (eval_subsets) {

     eval_sets.insert(

       eval_sets.end(), eval_subsets->begin(), eval_subsets->end());

   }


   //go through each specified subset of runs and compute average and median

   //speedup compared to baseline for each subset

   for (const auto& [subset_desc, subset_inputs] : eval_sets)

   {

     //initialize vector of speedups across runs

     std::vector<double> speedups_vect;


     //get header corresponding to current subset

     const std::string speedup_header_set =

       (subset_desc.size() == 0) ?

       std::string(speedup_header) :

       std::string(speedup_header) + " on " + std::string(subset_desc);


     for (auto& [input_sig, sig_run_results] : run_results)

     {

       //check if any subset input signature matches current input signature

       //and there are valid results for input signature

       if (std::ranges::any_of(

             subset_inputs,

             [&input_sig](const auto& subset_sig) {

               return input_sig.EqualsUsingAny(subset_sig);}) &&

           sig_run_results)

       {

         //compute speedup of run using optimized parallel parameters compared to

         //default parallel parameters and add to vector of speedups for all runs

         speedups_vect.push_back(

           (*(sig_run_results->at(

             run_environment::ParallelParamsSetting::kDefault).GetDataAsDouble(

               run_eval::kOptimizedRuntimeHeader))) /

           (*(sig_run_results->at(

             run_environment::ParallelParamsSetting::kOptimized).GetDataAsDouble(

               run_eval::kOptimizedRuntimeHeader))));


         //add speedup for run to data for run in run results

         sig_run_results->at(

           run_environment::ParallelParamsSetting::kDefault).AddDataWHeader(

             std::string(speedup_header), speedups_vect.back());

         sig_run_results->at(

           run_environment::ParallelParamsSetting::kOptimized).AddDataWHeader(

             std::string(speedup_header), speedups_vect.back());

       }

     }

     if (!(speedups_vect.empty())) {

       //compute average and median speedup when using parallel parameters

       //across runs from vector containing speedups of every run

       speedups_base_v_target.push_back({RunSpeedupAvgMedian::first_type(speedup_header_set), GetAvgMedSpeedup(speedups_vect)});

       speedups_vect.clear();

     }

   }


   return speedups_base_v_target;

 }


 //get average and median speedup between base and target runtime data and also add

 //speedup for each target runtime data run as compared to corresponding base run

 //across all runs and also on selected subsets if specified

 std::vector<RunSpeedupAvgMedian> EvaluateImpResults::GetAvgMedSpeedupBaseVsTarget(

   MultRunData& run_results_base,

   MultRunData& run_results_target,

   std::string_view speedup_header,

   BaseTargetDiff base_target_diff,

   const std::optional<std::vector<std::pair<std::string, std::vector<InputSignature>>>>& eval_subsets) const

 {

   //initialize speedup evaluations

   std::vector<RunSpeedupAvgMedian> speedups_base_v_target;


   //initialize evaluation sets to evaluate to set of all runs

   std::vector<std::pair<std::string, std::vector<InputSignature>>> eval_sets

     {std::make_pair(

       std::string(), std::vector<InputSignature>{InputSignature({}, {}, {})})};


   //add subsets specified in input parameter to subsets to evaluate

   if (eval_subsets) {

     eval_sets.insert(

       eval_sets.end(), eval_subsets->begin(), eval_subsets->end());

   }


   //go through each specified subset of runs and compute average and median

   //speedup compared to baseline for each subset

   for (const auto& [subset_desc, subset_inputs] : eval_sets)

   {

     //initialize empty vector where speedups will be added

     //for evaluation subset

     std::vector<double> speedups_vect;


     //get header corresponding to current subset

     const std::string speedup_header_set =

       (subset_desc.size() == 0) ?

       std::string(speedup_header) :

       std::string(speedup_header) + " on " + std::string(subset_desc);


     //go through all base runtime data and compute speedups

     for (auto& [input_sig_base, sig_run_results_base] : run_results_base)

     {

       //check if any subset input signature matches current input signature in

       //base runtime data

       if (std::ranges::any_of(

             subset_inputs,

             [&input_sig_base](const auto& subset_sig) {

               return input_sig_base.EqualsUsingAny(subset_sig);

           }))

       {

         InputSignature base_in_sig_adjusted(input_sig_base);

         //go through all target runtime data and find speedup for data

         //that corresponds with current base runtime data

         for (auto& [input_sig_target, sig_run_results_target] : run_results_target)

         {

           InputSignature target_in_sig_adjusted(input_sig_target);

           if (base_target_diff == BaseTargetDiff::kDiffDatatype) {

             //remove datatype from input signature if different datatype

             //between base and target output

             base_in_sig_adjusted.RemoveDatatypeSetting();

             target_in_sig_adjusted.RemoveDatatypeSetting();

           }

           else if (base_target_diff == BaseTargetDiff::kDiffTemplatedSetting) {

             //remove templated setting from input signature if different template

             //setting between base and target output

             base_in_sig_adjusted.RemoveTemplatedLoopIterSetting();

             target_in_sig_adjusted.RemoveTemplatedLoopIterSetting();

           }

           if (base_in_sig_adjusted == target_in_sig_adjusted) {

             //compute speedup between corresponding base and target data and

             //add it to vector of speedups across all data

             if (sig_run_results_base &&

                 sig_run_results_target)

             {

               speedups_vect.push_back(

                 *sig_run_results_base->at(

                   run_environment::ParallelParamsSetting::kOptimized).GetDataAsDouble(

                     run_eval::kOptimizedRuntimeHeader) /

                 *sig_run_results_target->at(

                   run_environment::ParallelParamsSetting::kOptimized).GetDataAsDouble(

                     run_eval::kOptimizedRuntimeHeader));


               //add speedup data to corresponding base and target data

               sig_run_results_base->at(

                 run_environment::ParallelParamsSetting::kOptimized).AddDataWHeader(

                   std::string(speedup_header), speedups_vect.back());

               sig_run_results_target->at(

                 run_environment::ParallelParamsSetting::kOptimized).AddDataWHeader(

                   std::string(speedup_header), speedups_vect.back());

             }

           }

         }

       }

     }

     if (!(speedups_vect.empty())) {

       //get average and median speedup from speedup vector with all speedup

       //data and add to subset speedups

       speedups_base_v_target.push_back(

         {RunSpeedupAvgMedian::first_type(speedup_header_set), GetAvgMedSpeedup(speedups_vect)});

       speedups_vect.clear();

     }

   }


   return speedups_base_v_target;

 }


 //get average and median speedup when loop iterations are given at compile time as template value

 //and also add speedup for each run with templated loop iterations as compared to same run without

 //templated loop iterations

 std::vector<RunSpeedupAvgMedian> EvaluateImpResults::GetAvgMedSpeedupLoopItersInTemplate(

   MultRunData& run_results,

   std::string_view speedup_header,

   const run_environment::RunImpSettings& run_imp_settings) const

 {

   //get all data entries corresponding to templated loop iterations and not templated loop iterations

   //in separate structures

   std::array<MultRunData, 2> templated_non_templated_loops_data;

   for (const auto data_index : {0, 1}) {

     std::ranges::copy_if(run_results,

       std::inserter(templated_non_templated_loops_data[data_index],

                     templated_non_templated_loops_data[data_index].end()),

         [data_index](const auto& input_sig_run_results) {

           if (input_sig_run_results.first.TemplatedLoopIters()) {

             //data index 0 -> return true if templated loop iters

             //data index 1 -> return true if not templated loop iters

             if (data_index == 0) {

               return *input_sig_run_results.first.TemplatedLoopIters();

             }

             if (data_index == 1) {

               return (!(*input_sig_run_results.first.TemplatedLoopIters()));

             }

             else {

               return false;

             }

           }

           else {

             return false;

           }

       });

   }


   //get specific subset to evaluate in addition to evaluation across all runs

   //remove any subsets with templated loop iteration count specified since that's

   //what's being evaluated here

   auto subsets_eval = run_imp_settings.subset_desc_input_sig;

   std::erase_if(subsets_eval, [](const auto& subset_desc_sigs)

   {

     return std::ranges::any_of(

       subset_desc_sigs.second, [](const auto& input_sig)

       {

         return input_sig.TemplatedLoopIters().has_value();

       });

   });


   //get speedup using templated loop iteration counts with non-templated loop

   //iters being base data and templated loop iterations counts being target data

   const std::vector<RunSpeedupAvgMedian> speedups_header_data =

     GetAvgMedSpeedupBaseVsTarget(

       templated_non_templated_loops_data[1],

       templated_non_templated_loops_data[0],

       speedup_header,

       BaseTargetDiff::kDiffTemplatedSetting,

       subsets_eval);


   //update run output data with templated and non templated data results

   //after processing for speedup

   //reason is that speedup data added to each data entry showing speedup

   //compared to corresponding data with or without templated loops

   for (const auto& run_data_updated : templated_non_templated_loops_data) {

     for (const auto& curr_run_data : run_data_updated) {

       run_results.at(curr_run_data.first) = curr_run_data.second;

     }

   }


   //return speedup data with header

   return speedups_header_data;

 }

EvaluateAcrossRuns.h
Declares class with operator function to evaluate implementation runs across multiple architectures....

MultRunDataWSpeedupByAcc
std::unordered_map< run_environment::AccSetting, std::pair< MultRunData, std::vector< RunSpeedupAvgMedian > >> MultRunDataWSpeedupByAcc
Mapping of acceleration setting to run and speedup data.
Definition: EvaluateImpAliases.h:57

MultRunData
std::map< InputSignature, std::optional< std::map< run_environment::ParallelParamsSetting, RunData > >> MultRunData
Alias mapping input signature to run data for each parallel parameters setting  Run data is null if r...
Definition: EvaluateImpAliases.h:47

EvaluateImpResults.h
Declares class with operator function to evaluate implementations of the same algorithm across differ...

BaseTargetDiff
BaseTargetDiff
Enum to define difference between "base" and "target" result sets when evaluating speedup.
Definition: EvaluateImpResults.h:50

BaseTargetDiff::kDiffTemplatedSetting
@ kDiffTemplatedSetting

BaseTargetDiff::kDiffAcceleration
@ kDiffAcceleration

BaseTargetDiff::kDiffDatatype
@ kDiffDatatype

RunResultsSpeedups.h
Declares class to load and store run results data including speedups from evaluation.

EvaluateAcrossRuns
Class with operator function to evaluate implementation runs across multiple architectures....
Definition: EvaluateAcrossRuns.h:54

EvaluateImpResults::EvalAllResultsWriteOutput
void EvalAllResultsWriteOutput(const std::unordered_map< size_t, MultRunDataWSpeedupByAcc > &run_results_mult_runs, const run_environment::RunImpSettings &run_imp_settings, run_environment::AccSetting opt_imp_acc) const
Evaluate results for all implementation runs on multiple inputs with the runs potentially having diff...
Definition: EvaluateImpResults.cpp:173

EvaluateImpResults::EvalResultsSingDataTypeAcc
std::pair< MultRunData, std::vector< RunSpeedupAvgMedian > > EvalResultsSingDataTypeAcc(const MultRunData &run_results, const run_environment::RunImpSettings &run_imp_settings, size_t data_size) const
Evaluate results for implementation runs on multiple inputs with all the runs having the same data ty...
Definition: EvaluateImpResults.cpp:40

InputSignature
Class defines input signature for evaluation run that contains evaluation set number,...
Definition: InputSignature.h:44

RunResultsSpeedups
Class to load and store run results data including speedups from evaluation.
Definition: RunResultsSpeedups.h:42

run_environment::AccelerationString
constexpr std::string_view AccelerationString()
Get string corresponding to acceleration method at compile time.
Definition: RunSettingsConstsEnums.h:70

run_environment::ParallelParamsSetting::kOptimized
@ kOptimized

run_environment::ParallelParamsSetting::kDefault
@ kDefault

run_environment::AccSetting
AccSetting
Enum for acceleration setting.
Definition: RunSettingsConstsEnums.h:59

run_environment::kDataSizeToNameMap
const std::map< std::size_t, std::string_view > kDataSizeToNameMap
Mapping from data size to data type string.
Definition: RunSettingsConstsEnums.h:97

run_environment::TemplatedItersSetting::kRunTemplatedAndNotTemplated
@ kRunTemplatedAndNotTemplated

run_eval::kAltAccToSpeedupDesc
const std::map< run_environment::AccSetting, const std::string_view > kAltAccToSpeedupDesc
Definition: RunEvalConstsEnums.h:127

run_eval::kImpResultsRunDataAccFolderName
constexpr std::string_view kImpResultsRunDataAccFolderName
Definition: RunEvalConstsEnums.h:144

run_eval::kSingleThreadRuntimeHeader
constexpr std::string_view kSingleThreadRuntimeHeader
Definition: RunEvalConstsEnums.h:103

run_eval::kOutResultsDesc
const std::map< OutResults, const std::string_view > kOutResultsDesc
Definition: RunEvalConstsEnums.h:183

run_eval::kAllRunsStr
constexpr std::string_view kAllRunsStr
Constant for "all runs" string.
Definition: RunEvalConstsEnums.h:92

run_eval::kCsvFileExtension
constexpr std::string_view kCsvFileExtension
Definition: RunEvalConstsEnums.h:101

run_eval::kSpeedupDoubleHeader
constexpr std::string_view kSpeedupDoubleHeader
Definition: RunEvalConstsEnums.h:109

run_eval::kRunResultsDescFileName
constexpr std::string_view kRunResultsDescFileName
Definition: RunEvalConstsEnums.h:95

run_eval::OutResults::kDefaultPParams
@ kDefaultPParams

run_eval::OutResults::kSpeedups
@ kSpeedups

run_eval::OutResults::kOptPParams
@ kOptPParams

run_eval::OutResults::kOptWSpeedups
@ kOptWSpeedups

run_eval::kOptimizedRuntimeHeader
constexpr std::string_view kOptimizedRuntimeHeader
Definition: RunEvalConstsEnums.h:102

run_eval::kOutResultsFileInfo
const std::map< OutResults, const OutFileInfo > kOutResultsFileInfo
Definition: RunEvalConstsEnums.h:167

run_eval::kSpeedupHalfHeader
constexpr std::string_view kSpeedupHalfHeader
Definition: RunEvalConstsEnums.h:110

run_eval::kSpeedupOptParParamsHeader
constexpr std::string_view kSpeedupOptParParamsHeader
Definition: RunEvalConstsEnums.h:106

run_eval::kSpeedupLoopItersCountTemplate
constexpr std::string_view kSpeedupLoopItersCountTemplate
Definition: RunEvalConstsEnums.h:115

run_eval::MiddleValData::kAverage
@ kAverage

run_eval::MiddleValData::kMedian
@ kMedian

run_environment::RunImpSettings
Structure that stores settings for current implementation run.
Definition: RunSettings.h:84

run_environment::RunImpSettings::templated_iters_setting
TemplatedItersSetting templated_iters_setting
Definition: RunSettings.h:86

run_environment::RunImpSettings::baseline_runtimes_path_desc
std::optional< std::array< std::string_view, 2 > > baseline_runtimes_path_desc
Definition: RunSettings.h:93

run_environment::RunImpSettings::datatypes_eval_sizes
std::vector< unsigned int > datatypes_eval_sizes
Definition: RunSettings.h:85

run_environment::RunImpSettings::run_name
std::string run_name
Definition: RunSettings.h:90

run_environment::RunImpSettings::p_params_default_alt_options
std::pair< std::array< unsigned int, 2 >, std::set< std::array< unsigned int, 2 > > > p_params_default_alt_options
Definition: RunSettings.h:89

run_environment::RunImpSettings::subset_desc_input_sig
std::vector< std::pair< std::string, std::vector< InputSignature > > > subset_desc_input_sig
Definition: RunSettings.h:95

run_environment::RunImpSettings::run_alt_optimized_imps
bool run_alt_optimized_imps
Definition: RunSettings.h:96