root/html608/tmva_2tmva_2inc_2TMVA_2DNN_2Functions_8h_source.html

 // @(#)root/tmva/tmva/dnn:$Id$
 // Author: Simon Pfreundschuh 20/06/16

 /*************************************************************************
  * Copyright (C) 2016, Simon Pfreundschuh                                *
  * All rights reserved.                                                  *
  *                                                                       *
  * For the licensing terms see $ROOTSYS/LICENSE.                         *
  * For the list of contributors see $ROOTSYS/README/CREDITS.             *
  *************************************************************************/

 /////////////////////////////////////////////////////////////////////
 // Contains function enums for activation and output functions, as //
 // well as generic evaluation functions, that delegate the call to //
 // the corresponding evaluation kernel.                            //
 /////////////////////////////////////////////////////////////////////

 #ifndef TMVA_DNN_FUNCTIONS
 #define TMVA_DNN_FUNCTIONS

 namespace TMVA
 {
 namespace DNN
 {
 //______________________________________________________________________________
 //
 //  Enum Definitions
 //______________________________________________________________________________

 /*! Enum that represents layer activation functions. */
 enum class EActivationFunction
 {
    kIdentity = 0,
    kRelu     = 1,
    kSigmoid  = 2,
    kTanh     = 3,
    kSymmRelu = 4,
    kSoftSign = 5,
    kGauss    = 6
 };

 /*! Enum that represents output functions */
 enum class EOutputFunction
 {
    kIdentity = 'I',
    kSigmoid  = 'S'
 };

 /*! Enum that represents objective functions for the net, i.e. functions
 *  that take the output from the last layer in the net together with the
 *  truths and return the objective function values that is to be minimized
 *  in the training process. */
 enum class ELossFunction
 {
     kCrossEntropy     = 'C',
     kMeanSquaredError = 'R'
 };

 /*! Enum representing the regularization type applied for a given layer */
 enum class ERegularization
 {
     kNone = '0',
     kL1   = '1',
     kL2   = '2'
     };

 /* Enum represnting the initialization method used for this layer. */
 enum class EInitialization {
     kGauss    = 'G',
     kUniform  = 'U',
     kIdentity = 'I',
     kZero = 'Z'
 };

 //______________________________________________________________________________
 //
 //  Activation Functions
 //______________________________________________________________________________

 /*! Apply the given activation function to each value in the given
 *  matrix A. */
 template<typename Architecture_t>
 inline void evaluate(typename Architecture_t::Matrix_t &A,
                     EActivationFunction f)
 {
     switch(f)
     {
     case EActivationFunction::kIdentity : break;
     case EActivationFunction::kRelu :     Architecture_t::Relu(A);
         break;
     case EActivationFunction::kSigmoid  :  Architecture_t::Sigmoid(A);
         break;
     case EActivationFunction::kTanh     :  Architecture_t::Tanh(A);
         break;
     case EActivationFunction::kSymmRelu :  Architecture_t::SymmetricRelu(A);
         break;
     case EActivationFunction::kSoftSign :  Architecture_t::SoftSign(A);
         break;
     case EActivationFunction::kGauss    :  Architecture_t::Gauss(A);
         break;
     }
 }


 /*! Compute the first partial derivative of the activation function for
 *  the values given in matrix A and write the results into B. */
 //______________________________________________________________________________
 template<typename Architecture_t>
 inline void evaluateDerivative(typename Architecture_t::Matrix_t & B,
                                 EActivationFunction f,
                                 const typename Architecture_t::Matrix_t & A)
 {
     switch(f)
     {
     case EActivationFunction::kIdentity : Architecture_t::IdentityDerivative(B, A);
         break;
     case EActivationFunction::kRelu     : Architecture_t::ReluDerivative(B, A);
         break;
     case EActivationFunction::kSigmoid  : Architecture_t::SigmoidDerivative(B, A);
         break;
     case EActivationFunction::kTanh     : Architecture_t::TanhDerivative(B, A);
         break;
     case EActivationFunction::kSymmRelu : Architecture_t::SymmetricReluDerivative(B, A);
         break;
     case EActivationFunction::kSoftSign : Architecture_t::SoftSignDerivative(B, A);
         break;
     case EActivationFunction::kGauss    : Architecture_t::GaussDerivative(B, A);
         break;
     }
 }

 //______________________________________________________________________________
 //
 //  Output Functions
 //______________________________________________________________________________

 /*! Apply the given output function to each value in the given
 *  matrix A. */
 template<typename Architecture_t>
 inline void evaluate(typename Architecture_t::Matrix_t &A,
                     EOutputFunction f,
                     const typename Architecture_t::Matrix_t &X)
 {
     switch(f)
     {
     case EOutputFunction::kIdentity : Architecture_t::Copy(A, X);
                                       break;
     case EOutputFunction::kSigmoid  : Architecture_t::Sigmoid(A, X);
                                       break;
     }
 }

 //______________________________________________________________________________
 //
 //  Loss Functions
 //______________________________________________________________________________

 /*! Compute the value of the objective function f for given activations
 *  of the ouput layer and the truth Y. */
 template<typename Architecture_t>
 inline auto evaluate(ELossFunction f,
                     const typename Architecture_t::Matrix_t & Y,
                     const typename Architecture_t::Matrix_t & output)
 -> decltype(Architecture_t::CrossEntropy(Y,output))
 {
     switch(f)
     {
     case ELossFunction::kCrossEntropy :
         return Architecture_t::CrossEntropy(Y, output);
     case ELossFunction::kMeanSquaredError :
         return Architecture_t::MeanSquaredError(Y, output);
     }
     return 0.0;
 }

 /*! Compute the gradient of the given output function f for given activations
 *  output of the output layer and truth Y and write the results into dY. */
 //______________________________________________________________________________
 template<typename Architecture_t>
 inline void evaluateGradients(typename Architecture_t::Matrix_t & dY,
                                 ELossFunction f,
                                 const typename Architecture_t::Matrix_t &Y,
                                 const typename Architecture_t::Matrix_t &output)
 {
     switch(f)
     {
     case ELossFunction::kCrossEntropy :
         Architecture_t::CrossEntropyGradients(dY, Y, output);
         break;
     case ELossFunction::kMeanSquaredError :
         Architecture_t::MeanSquaredErrorGradients(dY, Y, output);
         break;
     }
 }


 //______________________________________________________________________________
 //
 // Regularization
 //______________________________________________________________________________

 /*! Evaluate the regularization functional for a given weight matrix. */
 template<typename Architecture_t>
 inline auto regularization(const typename Architecture_t::Matrix_t &A,
                     ERegularization R)
 -> decltype(Architecture_t::L1Regularization(A))
 {
     switch(R)
     {
     case ERegularization::kNone :
         return 0.0;
     case ERegularization::kL1 :
         return Architecture_t::L1Regularization(A);
     case ERegularization::kL2 :
         return Architecture_t::L2Regularization(A);
     }
     return 0.0;
 }

 /*! Add the regularization gradient corresponding to weight matrix W, to
 *  the matrix A. */
 //______________________________________________________________________________
 template<typename Architecture_t>
 inline void addRegularizationGradients(typename Architecture_t::Matrix_t &A,
                                        const typename Architecture_t::Matrix_t &W,
                                        typename Architecture_t::Scalar_t weightDecay,
                                        ERegularization R)
 {
     switch(R)
     {
     case ERegularization::kNone :
         break;
     case ERegularization::kL1 :
         Architecture_t::AddL1RegularizationGradients(A, W, weightDecay);
         break;
     case ERegularization::kL2 :
         Architecture_t::AddL2RegularizationGradients(A, W, weightDecay);
         break;
     }
 }

 //______________________________________________________________________________
 //
 // Initialization
 //______________________________________________________________________________

 template<typename Architecture_t>
 inline void initialize(typename Architecture_t::Matrix_t & A,
                        EInitialization m)
 {
    switch(m) {
    case EInitialization::kGauss    : Architecture_t::InitializeGauss(A);
        break;
    case EInitialization::kUniform  : Architecture_t::InitializeUniform(A);
        break;
    case EInitialization::kIdentity : Architecture_t::InitializeIdentity(A);
        break;
    case EInitialization::kZero     : Architecture_t::InitializeZero(A);
        break;
    }
 }

 } // namespace DNN
 } // namespace TMVA

 #endif
ROOT::Math::Cephes::B
static double B[]
Definition: SpecFuncCephes.cxx:178

TMVA::DNN::evaluateDerivative
void evaluateDerivative(typename Architecture_t::Matrix_t &B, EActivationFunction f, const typename Architecture_t::Matrix_t &A)
Compute the first partial derivative of the activation function for the values given in matrix A and ...
Definition: Functions.h:109

TMVA::DNN::Tanh
static std::shared_ptr< std::function< double(double)> > Tanh
Definition: NeuralNet.icc:50

TMVA::DNN::EInitialization::kIdentity

TMVA::DNN::ELossFunction::kCrossEntropy

TMVA::DNN::EInitialization::kUniform

TMVA::DNN::ELossFunction::kMeanSquaredError

TMVA::DNN::ERegularization::kL1

TMVA::DNN::ERegularization::kNone

ROOT::Math::Cephes::A
static double A[]
Definition: SpecFuncCephes.cxx:170

TMVA::DNN::evaluate
void evaluate(typename Architecture_t::Matrix_t &A, EActivationFunction f)
Apply the given activation function to each value in the given matrix A.
Definition: Functions.h:83

TMVA::DNN::EInitialization
EInitialization
Definition: Functions.h:68

TMVA::DNN::Sigmoid
static std::shared_ptr< std::function< double(double)> > Sigmoid
Definition: NeuralNet.icc:47

Y
Definition: rotationApplication.cxx:230

TMVA::DNN::evaluateGradients
void evaluateGradients(typename Architecture_t::Matrix_t &dY, ELossFunction f, const typename Architecture_t::Matrix_t &Y, const typename Architecture_t::Matrix_t &output)
Compute the gradient of the given output function f for given activations output of the output layer ...
Definition: Functions.h:180

TMVA::DNN::weightDecay
double weightDecay(double error, ItWeight itWeight, ItWeight itWeightEnd, double factorWeightDecay, EnumRegularization eRegularization)
compute the weight decay for regularization (L1 or L2)
Definition: NeuralNet.icc:491

X
Definition: rotationApplication.cxx:230

TMVA::DNN::EInitialization::kGauss

TMVA::DNN::EActivationFunction::kSymmRelu

TMVA::DNN::EActivationFunction::kRelu

TMVA::DNN::EOutputFunction::kSigmoid

TMVA::DNN::ERegularization::kL2

TMVA::DNN::EActivationFunction::kSoftSign

m
TMarker * m
Definition: textangle.C:8

TMVA::DNN::regularization
auto regularization(const typename Architecture_t::Matrix_t &A, ERegularization R) -> decltype(Architecture_t::L1Regularization(A))
Evaluate the regularization functional for a given weight matrix.
Definition: Functions.h:204

TMVA::DNN::SoftSign
static std::shared_ptr< std::function< double(double)> > SoftSign
Definition: NeuralNet.icc:68

TMVA::DNN::EActivationFunction::kGauss

TMVA::DNN::EActivationFunction::kTanh

ROOT::Math::GSLSimAn::Copy
void Copy(void *source, void *dest)
Definition: GSLSimAnnealing.cxx:149

TMVA::DNN::addRegularizationGradients
void addRegularizationGradients(typename Architecture_t::Matrix_t &A, const typename Architecture_t::Matrix_t &W, typename Architecture_t::Scalar_t weightDecay, ERegularization R)
Add the regularization gradient corresponding to weight matrix W, to the matrix A.
Definition: Functions.h:224

f
double f(double x)
Definition: testIntegration.cxx:12

TMVA::DNN::EInitialization::kZero

TMVA::DNN::EOutputFunction
EOutputFunction
Enum that represents output functions.
Definition: Functions.h:43

TMVA::DNN::ELossFunction
ELossFunction
Enum that represents objective functions for the net, i.e.
Definition: Functions.h:53

TMVA::DNN::Gauss
static std::shared_ptr< std::function< double(double)> > Gauss
Definition: NeuralNet.icc:71

TMVA
Abstract ClassifierFactory template that handles arbitrary types.
Definition: GeneticMinimizer.h:21

TMVA::DNN::EActivationFunction::kSigmoid

TMVA::DNN::ERegularization
ERegularization
Enum representing the regularization type applied for a given layer.
Definition: Functions.h:60

TMVA::DNN::EActivationFunction
EActivationFunction
Enum that represents layer activation functions.
Definition: Functions.h:31

output
static void output(int code)
Definition: gifencode.c:226

TMVA::DNN::initialize
void initialize(typename Architecture_t::Matrix_t &A, EInitialization m)
Definition: Functions.h:248

TMVA::DNN::EOutputFunction::kIdentity

R
TRandom3 R
a TMatrixD.
Definition: testIO.cxx:28

TMVA::DNN::EActivationFunction::kIdentity