doc/v614/RNNLayer_8h_source.html

 // @(#)root/tmva/tmva/dnn/rnn:$Id$
 // Author: Saurav Shekhar 19/07/17

 /**********************************************************************************
  * Project: TMVA - a Root-integrated toolkit for multivariate data analysis       *
  * Package: TMVA                                                                  *
  * Class : BasicRNNLayer                                                          *
  *                                                                                *
  * Description:                                                                   *
  *       NeuralNetwork                                                            *
  *                                                                                *
  * Authors (alphabetical):                                                        *
  *       Saurav Shekhar    <sauravshekhar01@gmail.com> - ETH Zurich, Switzerland  *
  *                                                                                *
  * Copyright (c) 2005-2015:                                                       *
  * All rights reserved.                                                           *
  *       CERN, Switzerland                                                        *
  *                                                                                *
  * For the licensing terms see $ROOTSYS/LICENSE.                                  *
  * For the list of contributors see $ROOTSYS/README/CREDITS.                      *
  **********************************************************************************/

 //#pragma once

 //////////////////////////////////////////////////////////////////////
 // <Description> //
 //////////////////////////////////////////////////////////////////////

 #ifndef TMVA_DNN_RNN_LAYER
 #define TMVA_DNN_RNN_LAYER

 #include <cmath>
 #include <iostream>
 #include <vector>

 #include "TMatrix.h"
 #include "TMVA/DNN/Functions.h"

 namespace TMVA
 {
 namespace DNN
 {
 namespace RNN
 {

 //______________________________________________________________________________
 //
 // Basic RNN Layer
 //______________________________________________________________________________

 /** \class BasicRNNLayer
       Generic implementation
 */
 template<typename Architecture_t>
       class TBasicRNNLayer : public VGeneralLayer<Architecture_t>
 {

 public:

    using Matrix_t = typename Architecture_t::Matrix_t;
    using Scalar_t = typename Architecture_t::Scalar_t;
    using Tensor_t = std::vector<Matrix_t>;

 private:

    size_t fTimeSteps;              ///< Timesteps for RNN
    size_t fStateSize;              ///< Hidden state size of RNN
    bool   fRememberState;          ///< Remember state in next pass

    DNN::EActivationFunction fF;  ///< Activation function of the hidden state

    Matrix_t fState;                ///< Hidden State
    Matrix_t &fWeightsInput;         ///< Input weights, fWeights[0]
    Matrix_t &fWeightsState;         ///< Prev state weights, fWeights[1]
    Matrix_t &fBiases;               ///< Biases

    std::vector<Matrix_t> fDerivatives; ///< First fDerivatives of the activations
    Matrix_t &fWeightInputGradients; ///< Gradients w.r.t. the input weights
    Matrix_t &fWeightStateGradients; ///< Gradients w.r.t. the recurring weights
    Matrix_t &fBiasGradients;        ///< Gradients w.r.t. the bias values

 public:

    /** Constructor */
    TBasicRNNLayer(size_t batchSize, size_t stateSize, size_t inputSize,
                   size_t timeSteps, bool rememberState = false,
                   DNN::EActivationFunction f = DNN::EActivationFunction::kTanh,
                   bool training = true, DNN::EInitialization fA = DNN::EInitialization::kZero);

    /** Copy Constructor */
    TBasicRNNLayer(const TBasicRNNLayer &);

    /*! Initialize the weights according to the given initialization
     **  method. */
    //void Initialize(DNN::EInitialization m);

    /*! Initialize the state
     **  method. */
    void InitState(DNN::EInitialization m = DNN::EInitialization::kZero);

    /*! Compute and return the next state with given input
    *  matrix */
    void Forward(Tensor_t &input, bool isTraining = true);

    /*! Forward for a single cell (time unit) */
    void CellForward(const Matrix_t &input, Matrix_t & dF);

    /*! Backpropagates the error. Must only be called directly at the corresponding
     *  call to Forward(...). */
    void Backward(Tensor_t &gradients_backward,
                  const Tensor_t &activations_backward,
                  std::vector<Matrix_t> &inp1,
                  std::vector<Matrix_t> &inp2);

    /* Updates weights and biases, given the learning rate */
    void Update(const Scalar_t learningRate);

    /*! Backward for a single time unit
     * a the corresponding call to Forward(...). */
    inline Matrix_t & CellBackward(Matrix_t & state_gradients_backward,
                               const Matrix_t & precStateActivations,
                               const Matrix_t & input, Matrix_t & input_gradient, Matrix_t &dF);

    /** Prints the info about the layer */
    void Print() const;

    /*! Writes the information and the weights about the layer in an XML node. */
    virtual void AddWeightsXMLTo(void *parent);

    /*! Read the information and the weights about the layer from XML node. */
    virtual void ReadWeightsFromXML(void *parent);


    /** Getters */
    size_t GetTimeSteps() const { return fTimeSteps; }
    size_t GetStateSize() const { return fStateSize; }
    size_t GetInputSize() const { return this->GetInputWidth(); }
    inline bool IsRememberState()  const {return fRememberState;}
    inline DNN::EActivationFunction GetActivationFunction()  const {return fF;}
    Matrix_t        & GetState()            {return fState;}
    const Matrix_t & GetState()       const  {return fState;}
    Matrix_t        & GetWeightsInput()        {return fWeightsInput;}
    const Matrix_t & GetWeightsInput()   const {return fWeightsInput;}
    Matrix_t        & GetWeightsState()        {return fWeightsState;}
    const Matrix_t & GetWeightsState()   const {return fWeightsState;}
    std::vector<Matrix_t>       & GetDerivatives()        {return fDerivatives;}
    const std::vector<Matrix_t> & GetDerivatives()   const {return fDerivatives;}
    Matrix_t &GetDerivativesAt(size_t i) { return fDerivatives[i]; }
    const Matrix_t &GetDerivativesAt(size_t i) const { return fDerivatives[i]; }
    Matrix_t        & GetBiasesState()              {return fBiases;}
    const Matrix_t & GetBiasesState()         const {return fBiases;}
    Matrix_t        & GetBiasStateGradients()            {return fBiasGradients;}
    const Matrix_t & GetBiasStateGradients() const {return fBiasGradients;}
    Matrix_t        & GetWeightInputGradients()         {return fWeightInputGradients;}
    const Matrix_t & GetWeightInputGradients()    const {return fWeightInputGradients;}
    Matrix_t        & GetWeightStateGradients()         {return fWeightStateGradients;}
    const Matrix_t & GetWeightStateGradients()    const {return fWeightStateGradients;}
 };

 //______________________________________________________________________________
 //
 // BasicRNNLayer Implementation
 //______________________________________________________________________________
 template <typename Architecture_t>
 TBasicRNNLayer<Architecture_t>::TBasicRNNLayer(size_t batchSize, size_t stateSize, size_t inputSize, size_t timeSteps,
                                                bool rememberState, DNN::EActivationFunction f, bool /*training*/,
                                                DNN::EInitialization fA)
    // TODO inputDepth and outputDepth changed to batchSize??
    : VGeneralLayer<Architecture_t>(batchSize, 1, timeSteps, inputSize, 1, timeSteps, stateSize, 2,
                                    {stateSize, stateSize}, {inputSize, stateSize}, 1, {stateSize}, {1}, batchSize,
                                    timeSteps, stateSize, fA),
      fTimeSteps(timeSteps),
      fStateSize(stateSize),
      fRememberState(rememberState),
      fF(f),
      fState(batchSize, stateSize),
      fWeightsInput(this->GetWeightsAt(0)),
      fWeightsState(this->GetWeightsAt(1)),
      fBiases(this->GetBiasesAt(0)),
      fWeightInputGradients(this->GetWeightGradientsAt(0)),
      fWeightStateGradients(this->GetWeightGradientsAt(1)),
      fBiasGradients(this->GetBiasGradientsAt(0))
 {
   for (size_t i = 0; i < timeSteps; ++i) {
      fDerivatives.emplace_back(batchSize, stateSize);
   }
    // Nothing
 }

 //______________________________________________________________________________
 template <typename Architecture_t>
 TBasicRNNLayer<Architecture_t>::TBasicRNNLayer(const TBasicRNNLayer &layer)
    : VGeneralLayer<Architecture_t>(layer), fTimeSteps(layer.fTimeSteps), fStateSize(layer.fStateSize),
      fRememberState(layer.fRememberState), fF(layer.GetActivationFunction()),
      fState(layer.GetBatchSize(), layer.GetStateSize()), fWeightsInput(this->GetWeightsAt(0)),
      fWeightsState(this->GetWeightsAt(1)), fBiases(this->GetBiasesAt(0)),
      fDerivatives(), fWeightInputGradients(this->GetWeightGradientsAt(0)),
      fWeightStateGradients(this->GetWeightGradientsAt(1)), fBiasGradients(this->GetBiasGradientsAt(0))
 {
    for (size_t i = 0; i < fTimeSteps; ++i) {
      fDerivatives.emplace_back(layer.GetBatchSize(), layer.GetStateSize());
      Architecture_t::Copy(fDerivatives[i], layer.GetDerivativesAt(i));
    }
    // Gradient matrices not copied
    Architecture_t::Copy(fState, layer.GetState());
 }

 //______________________________________________________________________________
 //template<typename Architecture_t>
 //auto TBasicRNNLayer<Architecture_t>::Initialize(DNN::EInitialization m)
 //-> void
 //{
 //   DNN::initialize<Architecture_t>(fWeightsInput, m);
 //   DNN::initialize<Architecture_t>(fWeightsState, m);
 //   DNN::initialize<Architecture_t>(fBiases,  DNN::EInitialization::kZero);
 //}

 //______________________________________________________________________________
 template <typename Architecture_t>
 auto TBasicRNNLayer<Architecture_t>::InitState(DNN::EInitialization /*m*/) -> void
 {
    DNN::initialize<Architecture_t>(this->GetState(),  DNN::EInitialization::kZero);
 }

 //______________________________________________________________________________
 template<typename Architecture_t>
 auto TBasicRNNLayer<Architecture_t>::Print() const
 -> void
 {
    std::cout << " RECURRENT Layer: \t ";
    std::cout << " (NInput = " << this->GetInputSize();  // input size
    std::cout << ", NState = " << this->GetStateSize();  // hidden state size
    std::cout << ", NTime  = " << this->GetTimeSteps() << " )";  // time size
    std::cout << "\tOutput = ( " << this->GetOutput().size() << " , " << this->GetOutput()[0].GetNrows() << " , " << this->GetOutput()[0].GetNcols() << " )\n";
 }

 template <typename Architecture_t>
 auto debugMatrix(const typename Architecture_t::Matrix_t &A, const std::string name = "matrix")
 -> void
 {
   std::cout << name << "\n";
   for (size_t i = 0; i < A.GetNrows(); ++i) {
     for (size_t j = 0; j < A.GetNcols(); ++j) {
         std::cout << A(i, j) << " ";
     }
     std::cout << "\n";
   }
   std::cout << "********\n";
 }


 //______________________________________________________________________________
 template <typename Architecture_t>
 auto inline TBasicRNNLayer<Architecture_t>::Forward(Tensor_t &input, bool /*isTraining*/) // B x T x D
    -> void
 {
    // D : input size
    // H : state size
    // T : time size
    // B : batch size

    Tensor_t arrInput;
    for (size_t t = 0; t < fTimeSteps; ++t) arrInput.emplace_back(this->GetBatchSize(), this->GetInputWidth()); // T x B x D
    Architecture_t::Rearrange(arrInput, input);
    Tensor_t arrOutput;
    for (size_t t = 0; t < fTimeSteps;++t) arrOutput.emplace_back(this->GetBatchSize(), fStateSize); // T x B x H

    if (!this->fRememberState) InitState(DNN::EInitialization::kZero);
    for (size_t t = 0; t < fTimeSteps; ++t) {
       CellForward(arrInput[t], fDerivatives[t]);
       Architecture_t::Copy(arrOutput[t], fState);
    }
    Architecture_t::Rearrange(this->GetOutput(), arrOutput);  // B x T x D
 }

 //______________________________________________________________________________
 template <typename Architecture_t>
 auto inline TBasicRNNLayer<Architecture_t>::CellForward(const Matrix_t &input, Matrix_t &dF)
 -> void
 {
    // State = act(W_input . input + W_state . state + bias)
    const DNN::EActivationFunction fAF = this->GetActivationFunction();
    Matrix_t tmpState(fState.GetNrows(), fState.GetNcols());
    Architecture_t::MultiplyTranspose(tmpState, fState, fWeightsState);
    Architecture_t::MultiplyTranspose(fState, input, fWeightsInput);
    Architecture_t::ScaleAdd(fState, tmpState);
    Architecture_t::AddRowWise(fState, fBiases);
    DNN::evaluateDerivative<Architecture_t>(dF, fAF, fState);
    DNN::evaluate<Architecture_t>(fState, fAF);
 }

 //____________________________________________________________________________
 template <typename Architecture_t>
 auto inline TBasicRNNLayer<Architecture_t>::Backward(Tensor_t &gradients_backward,         // B x T x D
                                                      const Tensor_t &activations_backward, // B x T x D
                                                      std::vector<Matrix_t> & /*inp1*/, std::vector<Matrix_t> &
                                                      /*inp2*/) -> void
 {
    // activations backward is input
    // gradients_backward is activationGradients of layer before it, which is input layer
    // currently gradient_backward is for input(x) and not for state
    // TODO use this to change initial state??


   bool dummy = false;
   if (gradients_backward.size() == 0 || gradients_backward[0].GetNrows() == 0 || gradients_backward[0].GetNcols() == 0) {
      dummy = true;
   }
   Tensor_t arr_gradients_backward;
   for (size_t t = 0; t < fTimeSteps; ++t) arr_gradients_backward.emplace_back(this->GetBatchSize(), this->GetInputSize()); // T x B x D

   if (!dummy) {
       // TODO gradients_backward will be written back on the matrix
      //Architecture_t::Rearrange(arr_gradients_backward, gradients_backward);
   }
   Tensor_t arr_activations_backward;
   for (size_t t = 0; t < fTimeSteps; ++t) arr_activations_backward.emplace_back(this->GetBatchSize(), this->GetInputSize());  // T x B x D
   Architecture_t::Rearrange(arr_activations_backward, activations_backward);

    Matrix_t state_gradients_backward(this->GetBatchSize(), fStateSize);  // B x H
    DNN::initialize<Architecture_t>(state_gradients_backward,  DNN::EInitialization::kZero);

    Matrix_t initState(this->GetBatchSize(), fStateSize);  // B x H
    DNN::initialize<Architecture_t>(initState,   DNN::EInitialization::kZero);

    Tensor_t arr_output;
    for (size_t t = 0; t < fTimeSteps; ++t) arr_output.emplace_back(this->GetBatchSize(), fStateSize);
    Architecture_t::Rearrange(arr_output, this->GetOutput());

    Tensor_t arr_actgradients;
    for (size_t t = 0; t < fTimeSteps; ++t) arr_actgradients.emplace_back(this->GetBatchSize(), fStateSize);
    Architecture_t::Rearrange(arr_actgradients, this->GetActivationGradients());

    // reinitialize weights and biases gradients to 0
    fWeightInputGradients.Zero();
    fWeightStateGradients.Zero();
    fBiasGradients.Zero();

    for (size_t t = fTimeSteps; t > 0; t--) {
       //const Matrix_t & currStateActivations = arr_output[t - 1];
       Architecture_t::ScaleAdd(state_gradients_backward, arr_actgradients[t - 1]);
       if (t > 1) {
          const Matrix_t & precStateActivations = arr_output[t - 2];
          CellBackward(state_gradients_backward, precStateActivations, arr_activations_backward[t - 1],
                arr_gradients_backward[t - 1], fDerivatives[t - 1]);
       } else {
          const Matrix_t & precStateActivations = initState;
          CellBackward(state_gradients_backward, precStateActivations, arr_activations_backward[t - 1],
                arr_gradients_backward[t - 1], fDerivatives[t - 1]);
       }
    }
    if (!dummy) {
       Architecture_t::Rearrange(gradients_backward, arr_gradients_backward );
    }
    //Architecture_t::Rearrange(arr_activations_backward, activations_backward);
 }

 //______________________________________________________________________________
 template <typename Architecture_t>
 auto inline TBasicRNNLayer<Architecture_t>::CellBackward(Matrix_t & state_gradients_backward,
                                                      const Matrix_t & precStateActivations,
                                                      const Matrix_t & input, Matrix_t & input_gradient, Matrix_t &dF)
 -> Matrix_t &
 {
    return Architecture_t::RecurrentLayerBackward(state_gradients_backward, fWeightInputGradients, fWeightStateGradients,
                                                  fBiasGradients, dF, precStateActivations, fWeightsInput,
                                                  fWeightsState, input, input_gradient);
 }

 //______________________________________________________________________________
 template <typename Architecture_t>
 void TBasicRNNLayer<Architecture_t>::AddWeightsXMLTo(void *parent)
 {
    auto layerxml = gTools().xmlengine().NewChild(parent, 0, "RNNLayer");

    // write All other info like stateSize, inputSize, timeSteps,rememberState
    gTools().xmlengine().NewAttr(layerxml, 0, "StateSize", gTools().StringFromInt(this->GetStateSize()));
    gTools().xmlengine().NewAttr(layerxml, 0, "InputSize", gTools().StringFromInt(this->GetInputSize()));
    gTools().xmlengine().NewAttr(layerxml, 0, "TimeSteps", gTools().StringFromInt(this->GetTimeSteps()));
    gTools().xmlengine().NewAttr(layerxml, 0, "RememberState", gTools().StringFromInt(this->IsRememberState()));

    // write weights and bias matrices
    this->WriteMatrixToXML(layerxml, "InputWeights", this -> GetWeightsAt(0));
    this->WriteMatrixToXML(layerxml, "StateWeights", this -> GetWeightsAt(1));
    this->WriteMatrixToXML(layerxml, "Biases",  this -> GetBiasesAt(0));


 }

 //______________________________________________________________________________
 template <typename Architecture_t>
 void TBasicRNNLayer<Architecture_t>::ReadWeightsFromXML(void *parent)
 {
    // Read weights and biases
    this->ReadMatrixXML(parent,"InputWeights", this -> GetWeightsAt(0));
    this->ReadMatrixXML(parent,"StateWeights", this -> GetWeightsAt(1));
    this->ReadMatrixXML(parent,"Biases", this -> GetBiasesAt(0));

 }


 } // namespace RNN
 } // namespace DNN
 } // namespace TMVA

 #endif
TMVA::DNN::VGeneralLayer::GetInputWidth
size_t GetInputWidth() const
Definition: GeneralLayer.h:143

TMVA::DNN::VGeneralLayer
Generic General Layer class.
Definition: GeneralLayer.h:45

TMVA::Tools::xmlengine
TXMLEngine & xmlengine()
Definition: Tools.h:270

TMVA::DNN::RNN::TBasicRNNLayer::fBiases
Matrix_t & fBiases
Biases.
Definition: RNNLayer.h:75

m
auto * m
Definition: textangle.C:8

TMVA::DNN::VGeneralLayer::ReadMatrixXML
void ReadMatrixXML(void *node, const char *name, Matrix_t &matrix)
Definition: GeneralLayer.h:502

TMVA::DNN::VGeneralLayer::GetBiasesAt
const Matrix_t & GetBiasesAt(size_t i) const
Definition: GeneralLayer.h:158

TMVA::DNN::RNN::TBasicRNNLayer::GetWeightsState
Matrix_t & GetWeightsState()
Definition: RNNLayer.h:144

TMVA::DNN::RNN::TBasicRNNLayer::fBiasGradients
Matrix_t & fBiasGradients
Gradients w.r.t. the bias values.
Definition: RNNLayer.h:80

TMVA::DNN::RNN::TBasicRNNLayer::GetState
Matrix_t & GetState()
Definition: RNNLayer.h:140

TMVA::DNN::RNN::TBasicRNNLayer::GetDerivatives
std::vector< Matrix_t > & GetDerivatives()
Definition: RNNLayer.h:146

TMVA::DNN::RNN::TBasicRNNLayer::IsRememberState
bool IsRememberState() const
Definition: RNNLayer.h:138

TMVA::DNN::RNN::TBasicRNNLayer::GetBiasesState
Matrix_t & GetBiasesState()
Definition: RNNLayer.h:150

f
#define f(i)
Definition: RSha256.hxx:104

Functions.h

TMVA::DNN::RNN::TBasicRNNLayer::GetState
const Matrix_t & GetState() const
Definition: RNNLayer.h:141

TMVA::DNN::RNN::TBasicRNNLayer
Definition: RNNLayer.h:55

TMVA::DNN::RNN::TBasicRNNLayer::fWeightsState
Matrix_t & fWeightsState
Prev state weights, fWeights[1].
Definition: RNNLayer.h:74

ROOT::Math::Cephes::A
static double A[]
Definition: SpecFuncCephes.cxx:170

TMVA::DNN::RNN::TBasicRNNLayer::fDerivatives
std::vector< Matrix_t > fDerivatives
First fDerivatives of the activations.
Definition: RNNLayer.h:77

TMVA::DNN::EInitialization
EInitialization
Definition: Functions.h:70

TMVA::DNN::RNN::TBasicRNNLayer::Backward
void Backward(Tensor_t &gradients_backward, const Tensor_t &activations_backward, std::vector< Matrix_t > &inp1, std::vector< Matrix_t > &inp2)
Backpropagates the error.
Definition: RNNLayer.h:294

TMVA::DNN::VGeneralLayer::GetBatchSize
size_t GetBatchSize() const
Getters.
Definition: GeneralLayer.h:140

TMVA::DNN::RNN::TBasicRNNLayer::fRememberState
bool fRememberState
Remember state in next pass.
Definition: RNNLayer.h:68

TMVA::DNN::RNN::TBasicRNNLayer::GetWeightsInput
Matrix_t & GetWeightsInput()
Definition: RNNLayer.h:142

TMVA::DNN::VGeneralLayer::GetActivationGradients
const std::vector< Matrix_t > & GetActivationGradients() const
Definition: GeneralLayer.h:176

TMVA::DNN::RNN::TBasicRNNLayer::Forward
void Forward(Tensor_t &input, bool isTraining=true)
Compute and return the next state with given input matrix.
Definition: RNNLayer.h:254

TMVA::DNN::RNN::TBasicRNNLayer::GetBiasStateGradients
Matrix_t & GetBiasStateGradients()
Definition: RNNLayer.h:152

TMVA::DNN::RNN::TBasicRNNLayer::GetWeightsState
const Matrix_t & GetWeightsState() const
Definition: RNNLayer.h:145

TMVA::DNN::RNN::TBasicRNNLayer::Update
void Update(const Scalar_t learningRate)

TMVA::DNN::RNN::TBasicRNNLayer::InitState
void InitState(DNN::EInitialization m=DNN::EInitialization::kZero)
Initialize the weights according to the given initialization method.
Definition: RNNLayer.h:220

TMVA::DNN::VGeneralLayer::GetBiasGradientsAt
const Matrix_t & GetBiasGradientsAt(size_t i) const
Definition: GeneralLayer.h:170

TMVA::DNN::RNN::TBasicRNNLayer::GetBiasStateGradients
const Matrix_t & GetBiasStateGradients() const
Definition: RNNLayer.h:153

TMVA::DNN::RNN::TBasicRNNLayer::GetWeightsInput
const Matrix_t & GetWeightsInput() const
Definition: RNNLayer.h:143

TMVA::DNN::RNN::TBasicRNNLayer::fWeightStateGradients
Matrix_t & fWeightStateGradients
Gradients w.r.t. the recurring weights.
Definition: RNNLayer.h:79

TMVA::DNN::RNN::TBasicRNNLayer::Print
void Print() const
Prints the info about the layer.
Definition: RNNLayer.h:227

TMVA::gTools
Tools & gTools()

TMVA::DNN::RNN::TBasicRNNLayer::GetTimeSteps
size_t GetTimeSteps() const
Getters.
Definition: RNNLayer.h:135

TMVA::DNN::RNN::TBasicRNNLayer::fWeightInputGradients
Matrix_t & fWeightInputGradients
Gradients w.r.t. the input weights.
Definition: RNNLayer.h:78

TMVA::DNN::VGeneralLayer::GetWeightsAt
const Matrix_t & GetWeightsAt(size_t i) const
Definition: GeneralLayer.h:152

TMVA::DNN::EActivationFunction::kTanh

TXMLEngine::NewAttr
XMLAttrPointer_t NewAttr(XMLNodePointer_t xmlnode, XMLNsPointer_t, const char *name, const char *value)
creates new attribute for xmlnode, namespaces are not supported for attributes
Definition: TXMLEngine.cxx:578

ROOT::Math::GSLSimAn::Copy
void Copy(void *source, void *dest)
Definition: GSLSimAnnealing.cxx:149

TMVA::DNN::EInitialization::kZero

TMVA::DNN::RNN::TBasicRNNLayer::TBasicRNNLayer
TBasicRNNLayer(size_t batchSize, size_t stateSize, size_t inputSize, size_t timeSteps, bool rememberState=false, DNN::EActivationFunction f=DNN::EActivationFunction::kTanh, bool training=true, DNN::EInitialization fA=DNN::EInitialization::kZero)
Constructor.
Definition: RNNLayer.h:165

TMVA::DNN::RNN::TBasicRNNLayer::GetInputSize
size_t GetInputSize() const
Definition: RNNLayer.h:137

TMVA::DNN::RNN::TBasicRNNLayer::CellForward
void CellForward(const Matrix_t &input, Matrix_t &dF)
Forward for a single cell (time unit)
Definition: RNNLayer.h:278

dummy
static RooMathCoreReg dummy
Definition: RooMathCoreReg.cxx:27

TMVA::DNN::RNN::TBasicRNNLayer::GetBiasesState
const Matrix_t & GetBiasesState() const
Definition: RNNLayer.h:151

TMVA::DNN::RNN::debugMatrix
auto debugMatrix(const typename Architecture_t::Matrix_t &A, const std::string name="matrix") -> void
Definition: RNNLayer.h:238

TMVA::DNN::RNN::TBasicRNNLayer::GetWeightInputGradients
const Matrix_t & GetWeightInputGradients() const
Definition: RNNLayer.h:155

TMVA::DNN::RNN::TBasicRNNLayer::GetStateSize
size_t GetStateSize() const
Definition: RNNLayer.h:136

TMVA::DNN::RNN::TBasicRNNLayer::GetWeightStateGradients
Matrix_t & GetWeightStateGradients()
Definition: RNNLayer.h:156

TMVA
Abstract ClassifierFactory template that handles arbitrary types.
Definition: GeneticMinimizer.h:21

TMVA::DNN::RNN::TBasicRNNLayer::GetWeightStateGradients
const Matrix_t & GetWeightStateGradients() const
Definition: RNNLayer.h:157

TMVA::DNN::VGeneralLayer::GetWeightGradientsAt
const Matrix_t & GetWeightGradientsAt(size_t i) const
Definition: GeneralLayer.h:164

TMVA::DNN::RNN::TBasicRNNLayer::GetDerivativesAt
Matrix_t & GetDerivativesAt(size_t i)
Definition: RNNLayer.h:148

TMVA::DNN::RNN::TBasicRNNLayer::CellBackward
Matrix_t & CellBackward(Matrix_t &state_gradients_backward, const Matrix_t &precStateActivations, const Matrix_t &input, Matrix_t &input_gradient, Matrix_t &dF)
Backward for a single time unit a the corresponding call to Forward(...).
Definition: RNNLayer.h:360

TMVA::DNN::RNN::TBasicRNNLayer::GetDerivatives
const std::vector< Matrix_t > & GetDerivatives() const
Definition: RNNLayer.h:147

TXMLEngine::NewChild
XMLNodePointer_t NewChild(XMLNodePointer_t parent, XMLNsPointer_t ns, const char *name, const char *content=0)
create new child element for parent node
Definition: TXMLEngine.cxx:707

TMVA::DNN::RNN::TBasicRNNLayer::GetWeightInputGradients
Matrix_t & GetWeightInputGradients()
Definition: RNNLayer.h:154

TMVA::DNN::RNN::TBasicRNNLayer::Tensor_t
std::vector< Matrix_t > Tensor_t
Definition: RNNLayer.h:62

TMatrix.h

TMVA::DNN::VGeneralLayer::WriteMatrixToXML
void WriteMatrixToXML(void *node, const char *name, const Matrix_t &matrix)
Definition: GeneralLayer.h:479

TMVA::DNN::RNN::TBasicRNNLayer::GetActivationFunction
DNN::EActivationFunction GetActivationFunction() const
Definition: RNNLayer.h:139

TMVA::DNN::VGeneralLayer::Scalar_t
typename Architecture_t::Scalar_t Scalar_t
Definition: GeneralLayer.h:47

TMVA::DNN::EActivationFunction
EActivationFunction
Enum that represents layer activation functions.
Definition: Functions.h:31

TMVA::DNN::VGeneralLayer::GetOutput
const std::vector< Matrix_t > & GetOutput() const
Definition: GeneralLayer.h:173

TMVA::DNN::RNN::TBasicRNNLayer::fF
DNN::EActivationFunction fF
Activation function of the hidden state.
Definition: RNNLayer.h:70

TMVA::DNN::RNN::TBasicRNNLayer::fWeightsInput
Matrix_t & fWeightsInput
Input weights, fWeights[0].
Definition: RNNLayer.h:73

TMVA::DNN::RNN::TBasicRNNLayer::fStateSize
size_t fStateSize
Hidden state size of RNN.
Definition: RNNLayer.h:67

TMVA::DNN::RNN::TBasicRNNLayer::fTimeSteps
size_t fTimeSteps
Timesteps for RNN.
Definition: RNNLayer.h:66

TMVA::DNN::RNN::TBasicRNNLayer::GetDerivativesAt
const Matrix_t & GetDerivativesAt(size_t i) const
Definition: RNNLayer.h:149

name
char name[80]
Definition: TGX11.cxx:109

TMVA::DNN::RNN::TBasicRNNLayer::ReadWeightsFromXML
virtual void ReadWeightsFromXML(void *parent)
Read the information and the weights about the layer from XML node.
Definition: RNNLayer.h:392

TMVA::DNN::RNN::TBasicRNNLayer::fState
Matrix_t fState
Hidden State.
Definition: RNNLayer.h:72

TMVA::DNN::RNN::TBasicRNNLayer::AddWeightsXMLTo
virtual void AddWeightsXMLTo(void *parent)
Writes the information and the weights about the layer in an XML node.
Definition: RNNLayer.h:372

TMVA::DNN::RNN::TBasicRNNLayer::Matrix_t
typename Architecture_t::Matrix_t Matrix_t
Definition: RNNLayer.h:60