doc/v614/CrossValidation_8cxx_source.html

 // @(#)root/tmva $Id$
 // Author: Omar Zapata, Thomas James Stevenson and Pourya Vakilipourtakalou
 // Modified: Kim Albertsson 2017

 /*************************************************************************
  * Copyright (C) 2018, Rene Brun and Fons Rademakers.                    *
  * All rights reserved.                                                  *
  *                                                                       *
  * For the licensing terms see $ROOTSYS/LICENSE.                         *
  * For the list of contributors see $ROOTSYS/README/CREDITS.             *
  *************************************************************************/

 #include "TMVA/CrossValidation.h"

 #include "TMVA/ClassifierFactory.h"
 #include "TMVA/Config.h"
 #include "TMVA/CvSplit.h"
 #include "TMVA/DataSet.h"
 #include "TMVA/Event.h"
 #include "TMVA/MethodBase.h"
 #include "TMVA/MethodCrossValidation.h"
 #include "TMVA/MsgLogger.h"
 #include "TMVA/ResultsClassification.h"
 #include "TMVA/ResultsMulticlass.h"
 #include "TMVA/ROCCurve.h"
 #include "TMVA/tmvaglob.h"
 #include "TMVA/Types.h"

 #include "TSystem.h"
 #include "TAxis.h"
 #include "TCanvas.h"
 #include "TGraph.h"
 #include "TMath.h"

 #include <iostream>
 #include <memory>

 //_______________________________________________________________________
 TMVA::CrossValidationResult::CrossValidationResult(UInt_t numFolds)
 :fROCCurves(new TMultiGraph())
 {
    fSigs.resize(numFolds);
    fSeps.resize(numFolds);
    fEff01s.resize(numFolds);
    fEff10s.resize(numFolds);
    fEff30s.resize(numFolds);
    fEffAreas.resize(numFolds);
    fTrainEff01s.resize(numFolds);
    fTrainEff10s.resize(numFolds);
    fTrainEff30s.resize(numFolds);
 }

 //_______________________________________________________________________
 TMVA::CrossValidationResult::CrossValidationResult(const CrossValidationResult &obj)
 {
    fROCs=obj.fROCs;
    fROCCurves = obj.fROCCurves;

    fSigs = obj.fSigs;
    fSeps = obj.fSeps;
    fEff01s = obj.fEff01s;
    fEff10s = obj.fEff10s;
    fEff30s = obj.fEff30s;
    fEffAreas = obj.fEffAreas;
    fTrainEff01s = obj.fTrainEff01s;
    fTrainEff10s = obj.fTrainEff10s;
    fTrainEff30s = obj.fTrainEff30s;
 }

 //_______________________________________________________________________
 void TMVA::CrossValidationResult::Fill(CrossValidationFoldResult const & fr)
 {
    UInt_t iFold = fr.fFold;

    fROCs[iFold] = fr.fROCIntegral;
    fROCCurves->Add(static_cast<TGraph *>(fr.fROC.Clone()));

    fSigs[iFold] = fr.fSig;
    fSeps[iFold] = fr.fSep;
    fEff01s[iFold] = fr.fEff01;
    fEff10s[iFold] = fr.fEff10;
    fEff30s[iFold] = fr.fEff30;
    fEffAreas[iFold] = fr.fEffArea;
    fTrainEff01s[iFold] = fr.fTrainEff01;
    fTrainEff10s[iFold] = fr.fTrainEff10;
    fTrainEff30s[iFold] = fr.fTrainEff30;
 }

 //_______________________________________________________________________
 TMultiGraph *TMVA::CrossValidationResult::GetROCCurves(Bool_t /*fLegend*/)
 {
    return fROCCurves.get();
 }

 //_______________________________________________________________________
 Float_t TMVA::CrossValidationResult::GetROCAverage() const
 {
    Float_t avg=0;
    for(auto &roc:fROCs) avg+=roc.second;
    return avg/fROCs.size();
 }

 //_______________________________________________________________________
 Float_t TMVA::CrossValidationResult::GetROCStandardDeviation() const
 {
    // NOTE: We are using here the unbiased estimation of the standard deviation.
    Float_t std=0;
    Float_t avg=GetROCAverage();
    for(auto &roc:fROCs) std+=TMath::Power(roc.second-avg, 2);
    return TMath::Sqrt(std/float(fROCs.size()-1.0));
 }

 //_______________________________________________________________________
 void TMVA::CrossValidationResult::Print() const
 {
    TMVA::MsgLogger::EnableOutput();
    TMVA::gConfig().SetSilent(kFALSE);

    MsgLogger fLogger("CrossValidation");
    fLogger << kHEADER << " ==== Results ====" << Endl;
    for(auto &item:fROCs)
       fLogger << kINFO << Form("Fold  %i ROC-Int : %.4f",item.first,item.second) << std::endl;

    fLogger << kINFO << "------------------------" << Endl;
    fLogger << kINFO << Form("Average ROC-Int : %.4f",GetROCAverage()) << Endl;
    fLogger << kINFO << Form("Std-Dev ROC-Int : %.4f",GetROCStandardDeviation()) << Endl;

    TMVA::gConfig().SetSilent(kTRUE);
 }

 //_______________________________________________________________________
 TCanvas* TMVA::CrossValidationResult::Draw(const TString name) const
 {
    TCanvas *c=new TCanvas(name.Data());
    fROCCurves->Draw("AL");
    fROCCurves->GetXaxis()->SetTitle(" Signal Efficiency ");
    fROCCurves->GetYaxis()->SetTitle(" Background Rejection ");
    Float_t adjust=1+fROCs.size()*0.01;
    c->BuildLegend(0.15,0.15,0.4*adjust,0.5*adjust);
    c->SetTitle("Cross Validation ROC Curves");
    c->Draw();
    return c;
 }

 /**
 * \class TMVA::CrossValidation
 * \ingroup TMVA
 * \brief

 Use html for explicit line breaking<br>
 Markdown links? [class reference](#reference)?


 ~~~{.cpp}
 ce->BookMethod(dataloader, options);
 ce->Evaluate();
 ~~~

 Cross-evaluation will generate a new training and a test set dynamically from
 from `K` folds. These `K` folds are generated by splitting the input training
 set. The input test set is currently ignored.

 This means that when you specify your DataSet you should include all events
 in your training set. One way of doing this would be the following:

 ~~~{.cpp}
 dataloader->AddTree( signalTree, "cls1" );
 dataloader->AddTree( background, "cls2" );
 dataloader->PrepareTrainingAndTestTree( "", "", "nTest_cls1=1:nTest_cls2=1" );
 ~~~

 ## Split Expression
 See CVSplit documentation?

 */

 ////////////////////////////////////////////////////////////////////////////////
 ///

 TMVA::CrossValidation::CrossValidation(TString jobName, TMVA::DataLoader *dataloader, TFile *outputFile,
                                        TString options)
    : TMVA::Envelope(jobName, dataloader, nullptr, options),
      fAnalysisType(Types::kMaxAnalysisType),
      fAnalysisTypeStr("auto"),
      fCorrelations(kFALSE),
      fCvFactoryOptions(""),
      fDrawProgressBar(kFALSE),
      fFoldFileOutput(kFALSE),
      fFoldStatus(kFALSE),
      fJobName(jobName),
      fNumFolds(2),
      fNumWorkerProcs(1),
      fOutputFactoryOptions(""),
      fOutputFile(outputFile),
      fSilent(kFALSE),
      fSplitExprString(""),
      fROC(kTRUE),
      fTransformations(""),
      fVerbose(kFALSE),
      fVerboseLevel(kINFO)
 {
    InitOptions();
    ParseOptions();
    CheckForUnusedOptions();
 }

 ////////////////////////////////////////////////////////////////////////////////
 ///

 TMVA::CrossValidation::CrossValidation(TString jobName, TMVA::DataLoader *dataloader, TString options)
    : CrossValidation(jobName, dataloader, nullptr, options)
 {
 }

 ////////////////////////////////////////////////////////////////////////////////
 ///

 TMVA::CrossValidation::~CrossValidation() {}

 ////////////////////////////////////////////////////////////////////////////////
 ///

 void TMVA::CrossValidation::InitOptions()
 {
    // Forwarding of Factory options
    DeclareOptionRef(fSilent, "Silent",
                     "Batch mode: boolean silent flag inhibiting any output from TMVA after the creation of the factory "
                     "class object (default: False)");
    DeclareOptionRef(fVerbose, "V", "Verbose flag");
    DeclareOptionRef(fVerboseLevel = TString("Info"), "VerboseLevel", "VerboseLevel (Debug/Verbose/Info)");
    AddPreDefVal(TString("Debug"));
    AddPreDefVal(TString("Verbose"));
    AddPreDefVal(TString("Info"));

    DeclareOptionRef(fTransformations, "Transformations",
                     "List of transformations to test; formatting example: \"Transformations=I;D;P;U;G,D\", for "
                     "identity, decorrelation, PCA, Uniform and Gaussianisation followed by decorrelation "
                     "transformations");

    DeclareOptionRef(fDrawProgressBar, "DrawProgressBar", "Boolean to show draw progress bar");
    DeclareOptionRef(fCorrelations, "Correlations", "Boolean to show correlation in output");
    DeclareOptionRef(fROC, "ROC", "Boolean to show ROC in output");

    TString analysisType("Auto");
    DeclareOptionRef(fAnalysisTypeStr, "AnalysisType",
                     "Set the analysis type (Classification, Regression, Multiclass, Auto) (default: Auto)");
    AddPreDefVal(TString("Classification"));
    AddPreDefVal(TString("Regression"));
    AddPreDefVal(TString("Multiclass"));
    AddPreDefVal(TString("Auto"));

    // Options specific to CE
    DeclareOptionRef(fSplitExprString, "SplitExpr", "The expression used to assign events to folds");
    DeclareOptionRef(fNumFolds, "NumFolds", "Number of folds to generate");
    DeclareOptionRef(fNumWorkerProcs, "NumWorkerProcs",
       "Determines how many processes to use for evaluation. 1 means no"
       " parallelisation. 2 means use 2 processes. 0 means figure out the"
       " number automatically based on the number of cpus available. Default"
       " 1.");

    DeclareOptionRef(fFoldFileOutput, "FoldFileOutput",
                     "If given a TMVA output file will be generated for each fold. Filename will be the same as "
                     "specifed for the combined output with a _foldX suffix. (default: false)");

    DeclareOptionRef(fOutputEnsembling = TString("None"), "OutputEnsembling",
                     "Combines output from contained methods. If None, no combination is performed. (default None)");
    AddPreDefVal(TString("None"));
    AddPreDefVal(TString("Avg"));
 }

 ////////////////////////////////////////////////////////////////////////////////
 ///

 void TMVA::CrossValidation::ParseOptions()
 {
    this->Envelope::ParseOptions();

    // Factory options
    fAnalysisTypeStr.ToLower();
    if (fAnalysisTypeStr == "classification")
       fAnalysisType = Types::kClassification;
    else if (fAnalysisTypeStr == "regression")
       fAnalysisType = Types::kRegression;
    else if (fAnalysisTypeStr == "multiclass")
       fAnalysisType = Types::kMulticlass;
    else if (fAnalysisTypeStr == "auto")
       fAnalysisType = Types::kNoAnalysisType;

    if (fVerbose) {
       fCvFactoryOptions += "V:";
       fOutputFactoryOptions += "V:";
    } else {
       fCvFactoryOptions += "!V:";
       fOutputFactoryOptions += "!V:";
    }

    fCvFactoryOptions += Form("VerboseLevel=%s:", fVerboseLevel.Data());
    fOutputFactoryOptions += Form("VerboseLevel=%s:", fVerboseLevel.Data());

    fCvFactoryOptions += Form("AnalysisType=%s:", fAnalysisTypeStr.Data());
    fOutputFactoryOptions += Form("AnalysisType=%s:", fAnalysisTypeStr.Data());

    if (not fDrawProgressBar) {
       fOutputFactoryOptions += "!DrawProgressBar:";
    }

    if (fTransformations != "") {
       fCvFactoryOptions += Form("Transformations=%s:", fTransformations.Data());
       fOutputFactoryOptions += Form("Transformations=%s:", fTransformations.Data());
    }

    if (fCorrelations) {
       // fCvFactoryOptions += "Correlations:";
       fOutputFactoryOptions += "Correlations:";
    } else {
       // fCvFactoryOptions += "!Correlations:";
       fOutputFactoryOptions += "!Correlations:";
    }

    if (fROC) {
       // fCvFactoryOptions += "ROC:";
       fOutputFactoryOptions += "ROC:";
    } else {
       // fCvFactoryOptions += "!ROC:";
       fOutputFactoryOptions += "!ROC:";
    }

    if (fSilent) {
       // fCvFactoryOptions += Form("Silent:");
       fOutputFactoryOptions += Form("Silent:");
    }

    fCvFactoryOptions += "!Correlations:!ROC:!Color:!DrawProgressBar:Silent";

    // CE specific options
    if (fFoldFileOutput and fOutputFile == nullptr) {
       Log() << kFATAL << "No output file given, cannot generate per fold output." << Endl;
    }

    // Initialisations

    fFoldFactory = std::unique_ptr<TMVA::Factory>(new TMVA::Factory(fJobName, fCvFactoryOptions));

    // The fOutputFactory should always have !ModelPersistence set since we use a custom code path for this.
    //    In this case we create a special method (MethodCrossValidation) that can only be used by
    //    CrossValidation and the Reader.
    if (fOutputFile == nullptr) {
       fFactory = std::unique_ptr<TMVA::Factory>(new TMVA::Factory(fJobName, fOutputFactoryOptions));
    } else {
       fFactory = std::unique_ptr<TMVA::Factory>(new TMVA::Factory(fJobName, fOutputFile, fOutputFactoryOptions));
    }

    fSplit = std::unique_ptr<CvSplitKFolds>(new CvSplitKFolds(fNumFolds, fSplitExprString));
 }

 //_______________________________________________________________________
 void TMVA::CrossValidation::SetNumFolds(UInt_t i)
 {
    if (i != fNumFolds) {
       fNumFolds = i;
       fSplit = std::unique_ptr<CvSplitKFolds>(new CvSplitKFolds(fNumFolds, fSplitExprString));
       fDataLoader->MakeKFoldDataSet(*fSplit.get());
       fFoldStatus = kTRUE;
    }
 }

 ////////////////////////////////////////////////////////////////////////////////
 ///

 void TMVA::CrossValidation::SetSplitExpr(TString splitExpr)
 {
    if (splitExpr != fSplitExprString) {
       fSplitExprString = splitExpr;
       fSplit = std::unique_ptr<CvSplitKFolds>(new CvSplitKFolds(fNumFolds, fSplitExprString));
       fDataLoader->MakeKFoldDataSet(*fSplit.get());
       fFoldStatus = kTRUE;
    }
 }

 ////////////////////////////////////////////////////////////////////////////////
 /// Evaluates each fold in turn.
 ///   - Prepares train and test data sets
 ///   - Trains method
 ///   - Evalutes on test set
 ///   - Stores the evaluation internally
 ///
 /// @param iFold fold to evaluate
 ///

 TMVA::CrossValidationFoldResult TMVA::CrossValidation::ProcessFold(UInt_t iFold, UInt_t iMethod)
 {
    TString methodName = fMethods[iMethod].GetValue<TString>("MethodName");
    TString methodTitle = fMethods[iMethod].GetValue<TString>("MethodTitle");
    TString methodOptions = fMethods[iMethod].GetValue<TString>("MethodOptions");

    Log() << kDEBUG << "Fold (" << methodTitle << "): " << iFold << Endl;

    // Get specific fold of dataset and setup method
    TString foldTitle = methodTitle;
    foldTitle += "_fold";
    foldTitle += iFold + 1;

    // Only used if fFoldOutputFile == true
    TFile *foldOutputFile = nullptr;

    if (fFoldFileOutput and fOutputFile != nullptr) {
       TString path = std::string("") + gSystem->DirName(fOutputFile->GetName()) + "/" + foldTitle + ".root";
       std::cout << "PATH: " << path << std::endl;
       foldOutputFile = TFile::Open(path, "RECREATE");
       fFoldFactory = std::unique_ptr<TMVA::Factory>(new TMVA::Factory(fJobName, foldOutputFile, fCvFactoryOptions));
    }

    fDataLoader->PrepareFoldDataSet(*fSplit.get(), iFold, TMVA::Types::kTraining);
    MethodBase *smethod = fFoldFactory->BookMethod(fDataLoader.get(), methodName, foldTitle, methodOptions);

    // Train method (train method and eval train set)
    Event::SetIsTraining(kTRUE);
    smethod->TrainMethod();
    Event::SetIsTraining(kFALSE);

    fFoldFactory->TestAllMethods();
    fFoldFactory->EvaluateAllMethods();

    TMVA::CrossValidationFoldResult result(iFold);

    // Results for aggregation (ROC integral, efficiencies etc.)
    if (fAnalysisType == Types::kClassification or fAnalysisType == Types::kMulticlass) {
       result.fROCIntegral = fFoldFactory->GetROCIntegral(fDataLoader->GetName(), foldTitle);

       TGraph *gr = fFoldFactory->GetROCCurve(fDataLoader->GetName(), foldTitle, true);
       gr->SetLineColor(iFold + 1);
       gr->SetLineWidth(2);
       gr->SetTitle(foldTitle.Data());
       result.fROC = *gr;

       result.fSig = smethod->GetSignificance();
       result.fSep = smethod->GetSeparation();

       if (fAnalysisType == Types::kClassification) {
          Double_t err;
          result.fEff01 = smethod->GetEfficiency("Efficiency:0.01", Types::kTesting, err);
          result.fEff10 = smethod->GetEfficiency("Efficiency:0.10", Types::kTesting, err);
          result.fEff30 = smethod->GetEfficiency("Efficiency:0.30", Types::kTesting, err);
          result.fEffArea = smethod->GetEfficiency("", Types::kTesting, err);
          result.fTrainEff01 = smethod->GetTrainingEfficiency("Efficiency:0.01");
          result.fTrainEff10 = smethod->GetTrainingEfficiency("Efficiency:0.10");
          result.fTrainEff30 = smethod->GetTrainingEfficiency("Efficiency:0.30");
       } else if (fAnalysisType == Types::kMulticlass) {
          // Nothing here for now
       }
    }

    // Per-fold file output
    if (fFoldFileOutput) {
       foldOutputFile->Close();
    }

    // Clean-up for this fold
    {
       smethod->Data()->DeleteAllResults(Types::kTraining, smethod->GetAnalysisType());
       smethod->Data()->DeleteAllResults(Types::kTesting, smethod->GetAnalysisType());
    }

    fFoldFactory->DeleteAllMethods();
    fFoldFactory->fMethodsMap.clear();

    return result;
 }

 ////////////////////////////////////////////////////////////////////////////////
 /// Does training, test set evaluation and performance evaluation of using
 /// cross-evalution.
 ///

 void TMVA::CrossValidation::Evaluate()
 {
    // Generate K folds on given dataset
    if (!fFoldStatus) {
       fDataLoader->MakeKFoldDataSet(*fSplit.get());
       fFoldStatus = kTRUE;
    }

    fResults.reserve(fMethods.size());
    for (UInt_t iMethod = 0; iMethod < fMethods.size(); iMethod++) {
       CrossValidationResult result{fNumFolds};

       TString methodTypeName = fMethods[iMethod].GetValue<TString>("MethodName");
       TString methodTitle = fMethods[iMethod].GetValue<TString>("MethodTitle");

       if (methodTypeName == "") {
          Log() << kFATAL << "No method booked for cross-validation" << Endl;
       }

       TMVA::MsgLogger::EnableOutput();
       Log() << kINFO << "Evaluate method: " << methodTitle << Endl;

       // Process K folds
       auto nWorkers = fNumWorkerProcs;
       if (nWorkers == 1) {
          // Fall back to global config
          nWorkers = TMVA::gConfig().GetNumWorkers();
       }
       if (nWorkers == 1) {
          for (UInt_t iFold = 0; iFold < fNumFolds; ++iFold) {
             auto fold_result = ProcessFold(iFold, iMethod);
             result.Fill(fold_result);
          }
       } else {
          ROOT::TProcessExecutor workers(nWorkers);
          std::vector<CrossValidationFoldResult> result_vector;

          auto workItem = [this, iMethod](UInt_t iFold) {
             return ProcessFold(iFold, iMethod);
          };

          result_vector = workers.Map(workItem, ROOT::TSeqI(fNumFolds));

          for (auto && fold_result : result_vector) {
             result.Fill(fold_result);
          }
       }

       fResults.push_back(result);

       // Serialise the cross evaluated method
       TString options =
          Form("SplitExpr=%s:NumFolds=%i"
               ":EncapsulatedMethodName=%s"
               ":EncapsulatedMethodTypeName=%s"
               ":OutputEnsembling=%s",
               fSplitExprString.Data(), fNumFolds, methodTitle.Data(), methodTypeName.Data(), fOutputEnsembling.Data());

       fFactory->BookMethod(fDataLoader.get(), Types::kCrossValidation, methodTitle, options);

       // Feed EventToFold mapping used when random fold assignments are used
       // (when splitExpr="").
       IMethod *method_interface = fFactory->GetMethod(fDataLoader.get()->GetName(), methodTitle);
       MethodCrossValidation *method = dynamic_cast<MethodCrossValidation *>(method_interface);

       method->fEventToFoldMapping = fSplit.get()->fEventToFoldMapping;
    }

    // Recombination of data (making sure there is data in training and testing trees).
    fDataLoader->RecombineKFoldDataSet(*fSplit.get());

    // "Eval" on training set
    for (UInt_t iMethod = 0; iMethod < fMethods.size(); iMethod++) {
       TString methodTypeName = fMethods[iMethod].GetValue<TString>("MethodName");
       TString methodTitle = fMethods[iMethod].GetValue<TString>("MethodTitle");

       IMethod *method_interface = fFactory->GetMethod(fDataLoader.get()->GetName(), methodTitle);
       MethodCrossValidation *method = dynamic_cast<MethodCrossValidation *>(method_interface);

       if (fOutputFile) {
          fFactory->WriteDataInformation(method->fDataSetInfo);
       }

       Event::SetIsTraining(kTRUE);
       method->TrainMethod();
       Event::SetIsTraining(kFALSE);
    }

    // Eval on Testing set
    fFactory->TestAllMethods();

    // Calc statistics
    fFactory->EvaluateAllMethods();

    Log() << kINFO << "Evaluation done." << Endl;
 }

 //_______________________________________________________________________
 const std::vector<TMVA::CrossValidationResult> &TMVA::CrossValidation::GetResults() const
 {
    if (fResults.size() == 0)
       Log() << kFATAL << "No cross-validation results available" << Endl;
    return fResults;
 }
TMVA::CrossValidationFoldResult::fSig
Double_t fSig
Definition: CrossValidation.h:63

TMVA::CrossValidationFoldResult::fTrainEff01
Double_t fTrainEff01
Definition: CrossValidation.h:69

TMVA::CrossValidationResult::fSigs
std::vector< Double_t > fSigs
Definition: CrossValidation.h:83

TNamed::GetName
virtual const char * GetName() const
Returns name of object.
Definition: TNamed.h:47

TMVA::CrossValidationResult::GetROCAverage
Float_t GetROCAverage() const
Definition: CrossValidation.cxx:96

CvSplit.h

TAttLine::SetLineWidth
virtual void SetLineWidth(Width_t lwidth)
Set the line width.
Definition: TAttLine.h:43

ResultsMulticlass.h

TMVA::CrossValidation::fOutputFile
TFile * fOutputFile
How to combine output of individual folds.
Definition: CrossValidation.h:158

TMVA::Endl
MsgLogger & Endl(MsgLogger &ml)
Definition: MsgLogger.h:158

TMVA::CrossValidation::~CrossValidation
~CrossValidation()
Definition: CrossValidation.cxx:218

TMVA::Types
Singleton class for Global types used by TMVA.
Definition: Types.h:73

TMVA::CrossValidation::fFoldStatus
Bool_t fFoldStatus
If true: generate output file for each fold.
Definition: CrossValidation.h:151

TMVA::CrossValidation::fSplit
std::unique_ptr< CvSplitKFolds > fSplit
Definition: CrossValidation.h:169

TMVA::CrossValidation::fROC
Bool_t fROC
Definition: CrossValidation.h:162

Float_t
float Float_t
Definition: RtypesCore.h:53

TCanvas::SetTitle
void SetTitle(const char *title="")
Set canvas title.
Definition: TCanvas.cxx:1956

TMVA::CrossValidation::fVerbose
Bool_t fVerbose
Definition: CrossValidation.h:164

CrossValidation.h

TMVA::CrossValidationResult::fROCs
std::map< UInt_t, Float_t > fROCs
Definition: CrossValidation.h:80

ResultsClassification.h

TMVA::DataLoader
Definition: DataLoader.h:58

TMVA::gConfig
Config & gConfig()

TMVA::Configurable::Log
MsgLogger & Log() const
Definition: Configurable.h:122

TMVA::Configurable::DeclareOptionRef
OptionBase * DeclareOptionRef(T &ref, const TString &name, const TString &desc="")

TMVA::CrossValidationFoldResult
Definition: CrossValidation.h:51

TFile
A ROOT file is a suite of consecutive data records (TKey instances) with a well defined format...
Definition: TFile.h:47

TMultiGraph
A TMultiGraph is a collection of TGraph (or derived) objects.
Definition: TMultiGraph.h:35

TMVA::MethodBase
Virtual base Class for all MVA method.
Definition: MethodBase.h:109

TMVA::CrossValidationFoldResult::fTrainEff10
Double_t fTrainEff10
Definition: CrossValidation.h:70

TMVA::Types::kMulticlass
Definition: Types.h:130

TMVA::CrossValidationResult
Class to save the results of cross validation, the metric for the classification ins ROC and you can ...
Definition: CrossValidation.h:76

TString
Basic string class.
Definition: TString.h:131

TString::ToLower
void ToLower()
Change string to lower-case.
Definition: TString.cxx:1100

TMVA::Types::kTesting
Definition: Types.h:145

TMVA::Types::kNoAnalysisType
Definition: Types.h:131

TSystem::DirName
virtual const char * DirName(const char *pathname)
Return the directory name in pathname.
Definition: TSystem.cxx:1004

Bool_t
bool Bool_t
Definition: RtypesCore.h:59

TGraph::SetTitle
virtual void SetTitle(const char *title="")
Set graph title.
Definition: TGraph.cxx:2216

std
STL namespace.

TMVA::CrossValidation::fAnalysisType
Types::EAnalysisType fAnalysisType
Definition: CrossValidation.h:145

TMVA::CrossValidation::fOutputEnsembling
TString fOutputEnsembling
Definition: CrossValidation.h:157

TMVA::Config::GetNumWorkers
UInt_t GetNumWorkers() const
Definition: Config.h:78

TMVA::CrossValidationResult::fEff10s
std::vector< Double_t > fEff10s
Definition: CrossValidation.h:86

TMVA::CrossValidationFoldResult::fEff01
Double_t fEff01
Definition: CrossValidation.h:65

Config.h

TMath::Power
LongDouble_t Power(LongDouble_t x, LongDouble_t y)
Definition: TMath.h:734

TFile::Open
static TFile * Open(const char *name, Option_t *option="", const char *ftitle="", Int_t compress=1, Int_t netopt=0)
Create / open a file.
Definition: TFile.cxx:3976

TMVA::CrossValidation::fCorrelations
Bool_t fCorrelations
Definition: CrossValidation.h:147

TMVA::Event::SetIsTraining
static void SetIsTraining(Bool_t)
when this static function is called, it sets the flag whether events with negative event weight shoul...
Definition: Event.cxx:392

TMVA::CrossValidation::fSplitExprString
TString fSplitExprString
Definition: CrossValidation.h:160

TMVA::CrossValidation::fFoldFileOutput
Bool_t fFoldFileOutput
Definition: CrossValidation.h:150

TMVA::CrossValidation::fResults
std::vector< CrossValidationResult > fResults
Definition: CrossValidation.h:161

TMVA::MethodBase::Data
DataSet * Data() const
Definition: MethodBase.h:400

ROCCurve.h

TMVA::CrossValidation::SetNumFolds
void SetNumFolds(UInt_t i)
Definition: CrossValidation.cxx:357

TSystem.h

TMVA::CrossValidation::fNumFolds
UInt_t fNumFolds
Definition: CrossValidation.h:153

TMVA::CrossValidation::fVerboseLevel
TString fVerboseLevel
Definition: CrossValidation.h:165

TMVA::Types::kCrossValidation
Definition: Types.h:110

TMVA::Envelope
Abstract base class for all high level ml algorithms, you can book ml methods like BDT...
Definition: Envelope.h:43

TMVA::CrossValidationResult::fTrainEff01s
std::vector< Double_t > fTrainEff01s
Definition: CrossValidation.h:89

TCanvas.h

TMVA::CrossValidation::fNumWorkerProcs
UInt_t fNumWorkerProcs
Number of folds to prepare.
Definition: CrossValidation.h:154

TMVA::CrossValidationResult::fTrainEff10s
std::vector< Double_t > fTrainEff10s
Definition: CrossValidation.h:90

DataSet.h

TMVA::MethodBase::GetEfficiency
virtual Double_t GetEfficiency(const TString &, Types::ETreeType, Double_t &err)
fill background efficiency (resp.
Definition: MethodBase.cxx:2280

TMVA::CrossValidation::fCvFactoryOptions
TString fCvFactoryOptions
Definition: CrossValidation.h:148

TMVA::CrossValidationResult::Fill
void Fill(CrossValidationFoldResult const &fr)
Definition: CrossValidation.cxx:71

Types.h

TMVA::Types::kRegression
Definition: Types.h:129

ClassificationKeras.dataloader
dataloader
Definition: ClassificationKeras.py:28

TMVA::CvSplitKFolds
Definition: CvSplit.h:90

TAttLine::SetLineColor
virtual void SetLineColor(Color_t lcolor)
Set the line color.
Definition: TAttLine.h:40

TMVA::CrossValidationFoldResult::fSep
Double_t fSep
Definition: CrossValidation.h:64

TMVA::Envelope::ParseOptions
virtual void ParseOptions()
Method to parse the internal option string.
Definition: Envelope.cxx:187

ROOT::TProcessExecutor
This class provides a simple interface to execute the same task multiple times in parallel...
Definition: TProcessExecutor.hxx:35

tmvaglob.h

gSystem
R__EXTERN TSystem * gSystem
Definition: TSystem.h:540

TMVA::CrossValidationResult::fEff01s
std::vector< Double_t > fEff01s
Definition: CrossValidation.h:85

UInt_t
unsigned int UInt_t
Definition: RtypesCore.h:42

Form
char * Form(const char *fmt,...)

TMVA::Types::kClassification
Definition: Types.h:128

TMVA::CrossValidationResult::GetROCStandardDeviation
Float_t GetROCStandardDeviation() const
Definition: CrossValidation.cxx:104

MsgLogger.h

TMVA::CrossValidation::fSilent
Bool_t fSilent
Definition: CrossValidation.h:159

TMVA::CrossValidation::GetResults
const std::vector< CrossValidationResult > & GetResults() const
Definition: CrossValidation.cxx:573

TMVA::Factory
This is the main MVA steering class.
Definition: Factory.h:81

TMVA::CrossValidationResult::fTrainEff30s
std::vector< Double_t > fTrainEff30s
Definition: CrossValidation.h:91

TMVA::MethodBase::GetSignificance
virtual Double_t GetSignificance() const
compute significance of mean difference
Definition: MethodBase.cxx:2754

TMVA::CrossValidationFoldResult::fEff30
Double_t fEff30
Definition: CrossValidation.h:67

TMVA::MethodCrossValidation
Definition: MethodCrossValidation.h:36

TGraph.h

gr
TGraphErrors * gr
Definition: legend1.C:25

TMVA::CrossValidation::Evaluate
void Evaluate()
Does training, test set evaluation and performance evaluation of using cross-evalution.
Definition: CrossValidation.cxx:475

TMVA::DataSet::DeleteAllResults
void DeleteAllResults(Types::ETreeType type, Types::EAnalysisType analysistype)
Deletes all results currently in the dataset.
Definition: DataSet.cxx:343

TMVA::CrossValidationResult::Print
void Print() const
Definition: CrossValidation.cxx:114

kFALSE
const Bool_t kFALSE
Definition: RtypesCore.h:88

TMVA::CrossValidation::ParseOptions
void ParseOptions()
Method to parse the internal option string.
Definition: CrossValidation.cxx:274

TMVA::CrossValidation::fFoldFactory
std::unique_ptr< Factory > fFoldFactory
Definition: CrossValidation.h:167

TMVA::CrossValidationFoldResult::fFold
UInt_t fFold
Definition: CrossValidation.h:58

TCanvas
The Canvas class.
Definition: TCanvas.h:31

Double_t
double Double_t
Definition: RtypesCore.h:55

TMVA::CrossValidation::InitOptions
void InitOptions()
Definition: CrossValidation.cxx:223

TMVA::MethodBase::GetSeparation
virtual Double_t GetSeparation(TH1 *, TH1 *) const
compute "separation" defined as
Definition: MethodBase.cxx:2767

ROOT::TSeq
A pseudo container class which is a generator of indices.
Definition: TSeq.hxx:66

TMVA::CrossValidation
Class to perform cross validation, splitting the dataloader into folds.
Definition: CrossValidation.h:120

TMVA::CrossValidation::ProcessFold
CrossValidationFoldResult ProcessFold(UInt_t iFold, UInt_t iMethod)
Evaluates each fold in turn.
Definition: CrossValidation.cxx:390

TMVA::CrossValidation::fFactory
std::unique_ptr< Factory > fFactory
Definition: CrossValidation.h:168

TMVA::Envelope::fDataLoader
std::shared_ptr< DataLoader > fDataLoader
Booked method information.
Definition: Envelope.h:47

TAxis.h

Event.h

TMVA::CrossValidation::fAnalysisTypeStr
TString fAnalysisTypeStr
Definition: CrossValidation.h:146

TMVA::Configurable::AddPreDefVal
void AddPreDefVal(const T &)
Definition: Configurable.h:168

TMVA::CrossValidationResult::GetROCCurves
TMultiGraph * GetROCCurves(Bool_t fLegend=kTRUE)
Definition: CrossValidation.cxx:90

TMVA::MsgLogger
ostringstream derivative to redirect and format output
Definition: MsgLogger.h:59

TMVA::CrossValidationFoldResult::fROCIntegral
Float_t fROCIntegral
Definition: CrossValidation.h:60

TMVA::CrossValidation::SetSplitExpr
void SetSplitExpr(TString splitExpr)
Definition: CrossValidation.cxx:370

TNamed::Clone
virtual TObject * Clone(const char *newname="") const
Make a clone of an object using the Streamer facility.
Definition: TNamed.cxx:74

TMVA::IMethod
Interface for all concrete MVA method implementations.
Definition: IMethod.h:54

TMVA::CrossValidationResult::fEffAreas
std::vector< Double_t > fEffAreas
Definition: CrossValidation.h:88

TCanvas::Draw
virtual void Draw(Option_t *option="")
Draw a canvas.
Definition: TCanvas.cxx:826

TMVA::CrossValidation::fTransformations
TString fTransformations
Definition: CrossValidation.h:163

TMVA::CrossValidationResult::CrossValidationResult
CrossValidationResult(UInt_t numFolds)
Definition: CrossValidation.cxx:39

TMVA::CrossValidationFoldResult::fEff10
Double_t fEff10
Definition: CrossValidation.h:66

TMVA::CrossValidationResult::fSeps
std::vector< Double_t > fSeps
Definition: CrossValidation.h:84

TMVA
Abstract ClassifierFactory template that handles arbitrary types.
Definition: GeneticMinimizer.h:21

TMVA::Types::kTraining
Definition: Types.h:144

TPad::BuildLegend
virtual TLegend * BuildLegend(Double_t x1=0.3, Double_t y1=0.21, Double_t x2=0.3, Double_t y2=0.21, const char *title="", Option_t *option="")
Build a legend from the graphical objects in the pad.
Definition: TPad.cxx:494

TMVA::MethodBase::TrainMethod
void TrainMethod()
Definition: MethodBase.cxx:655

ROOT::TProcessExecutor::Map
auto Map(F func, unsigned nTimes) -> std::vector< typename std::result_of< F()>::type >
Execute func (with no arguments) nTimes in parallel.
Definition: TProcessExecutor.hxx:98

TMVA::CrossValidation::fDrawProgressBar
Bool_t fDrawProgressBar
Definition: CrossValidation.h:149

TMVA::CrossValidationFoldResult::fEffArea
Double_t fEffArea
Definition: CrossValidation.h:68

TMVA::CrossValidationFoldResult::fROC
TGraph fROC
Definition: CrossValidation.h:61

TMVA::Config::SetSilent
void SetSilent(Bool_t s)
Definition: Config.h:69

TGraph
A Graph is a graphics object made of two arrays X and Y with npoints each.
Definition: TGraph.h:41

TMVA::CrossValidationResult::Draw
TCanvas * Draw(const TString name="CrossValidation") const
Definition: CrossValidation.cxx:132

TMVA::CrossValidationResult::fEff30s
std::vector< Double_t > fEff30s
Definition: CrossValidation.h:87

TMVA::MethodBase::GetTrainingEfficiency
virtual Double_t GetTrainingEfficiency(const TString &)
Definition: MethodBase.cxx:2506

c
#define c(i)
Definition: RSha256.hxx:101

TString::TString
TString()
TString default ctor.
Definition: TString.cxx:87

TMVA::CrossValidationFoldResult::fTrainEff30
Double_t fTrainEff30
Definition: CrossValidation.h:71

TMVA::MethodBase::GetAnalysisType
Types::EAnalysisType GetAnalysisType() const
Definition: MethodBase.h:428

TMath::Sqrt
Double_t Sqrt(Double_t x)
Definition: TMath.h:690

TMVA::MsgLogger::EnableOutput
static void EnableOutput()
Definition: MsgLogger.cxx:75

TMath.h

MethodBase.h

TMVA::MethodCrossValidation::fEventToFoldMapping
std::map< const TMVA::Event *, UInt_t > fEventToFoldMapping
Definition: MethodCrossValidation.h:115

ClassifierFactory.h

kTRUE
const Bool_t kTRUE
Definition: RtypesCore.h:87

TMVA::Configurable::CheckForUnusedOptions
void CheckForUnusedOptions() const
checks for unused options in option string
Definition: Configurable.cxx:274

TMVA::CrossValidation::CrossValidation
CrossValidation(TString jobName, TMVA::DataLoader *dataloader, TString options)
Definition: CrossValidation.cxx:210

MethodCrossValidation.h

TMVA::CrossValidationResult::fROCCurves
std::shared_ptr< TMultiGraph > fROCCurves
Definition: CrossValidation.h:81

TMVA::Envelope::fMethods
std::vector< OptionMap > fMethods
Definition: Envelope.h:46

name
char name[80]
Definition: TGX11.cxx:109

TMVA::CrossValidation::fJobName
TString fJobName
If true: dataset is prepared.
Definition: CrossValidation.h:152

TMVA::CrossValidation::fOutputFactoryOptions
TString fOutputFactoryOptions
Number of processes to use for fold evaluation.
Definition: CrossValidation.h:156

TFile::Close
virtual void Close(Option_t *option="")
Close a file.
Definition: TFile.cxx:917

TString::Data
const char * Data() const
Definition: TString.h:364