doc/v614/Cpu_2RecurrentPropagation_8cxx_source.html

 // @(#)root/tmva/tmva/dnn:$Id$
 // Author: Saurav Shekhar 23/06/17

 /*************************************************************************
  * Copyright (C) 2017, Saurav Shekhar                                    *
  * All rights reserved.                                                  *
  *                                                                       *
  * For the licensing terms see $ROOTSYS/LICENSE.                         *
  * For the list of contributors see $ROOTSYS/README/CREDITS.             *
  *************************************************************************/

 /////////////////////////////////////////////////////////////////////
 // Implementation of the functions required for the forward and    //
 // backward propagation of activations through a recurrent neural  //
 // network in the TCpu architecture                                //
 /////////////////////////////////////////////////////////////////////


 #include "TMVA/DNN/Architectures/Cpu.h"
 #include "TMVA/DNN/Architectures/Cpu/Blas.h"

 namespace TMVA
 {
 namespace DNN
 {

 template<typename AFloat>
 auto TCpu<AFloat>::RecurrentLayerBackward(TCpuMatrix<AFloat> & state_gradients_backward, // BxH
                                           TCpuMatrix<AFloat> & input_weight_gradients,
                                           TCpuMatrix<AFloat> & state_weight_gradients,
                                           TCpuMatrix<AFloat> & bias_gradients,
                                           TCpuMatrix<AFloat> & df, //BxH
                                           const TCpuMatrix<AFloat> & state, // BxH
                                           const TCpuMatrix<AFloat> & weights_input, // HxD
                                           const TCpuMatrix<AFloat> & weights_state, // HxH
                                           const TCpuMatrix<AFloat> & input,  // BxD
                                           TCpuMatrix<AFloat> & input_gradient)
 -> TCpuMatrix<AFloat> &
 {

    // std::cout << "Recurrent Propo" << std::endl;
    // PrintMatrix(df,"DF");
    // PrintMatrix(state_gradients_backward,"State grad");
    // PrintMatrix(input_weight_gradients,"input w grad");
    // PrintMatrix(state,"state");
    // PrintMatrix(input,"input");

    // Compute element-wise product.
    Hadamard(df, state_gradients_backward);  // B x H

    // Input gradients.
    if (input_gradient.GetNElements() > 0) Multiply(input_gradient, df, weights_input);

    // State gradients.
    if (state_gradients_backward.GetNElements() > 0) Multiply(state_gradients_backward, df, weights_state);

    // compute the gradients
    // Perform the operation in place by readding the result on the same gradient matrix
    // e.g. W += D * X

    // Weights gradients
    if (input_weight_gradients.GetNElements() > 0) {
       TransposeMultiply(input_weight_gradients, df, input, 1. , 1.); // H x B . B x D
    }
    if (state_weight_gradients.GetNElements() > 0) {
       TransposeMultiply(state_weight_gradients, df, state, 1. , 1. ); // H x B . B x H
    }

    // Bias gradients.
    if (bias_gradients.GetNElements() > 0) {
       SumColumns(bias_gradients, df, 1., 1.);  // could be probably do all here
    }

    //std::cout << "RecurrentPropo: end " << std::endl;

    // PrintMatrix(state_gradients_backward,"State grad");
    // PrintMatrix(input_weight_gradients,"input w grad");
    // PrintMatrix(bias_gradients,"bias grad");
    // PrintMatrix(input_gradient,"input grad");

    return input_gradient;
 }

 } // namespace DNN
 } // namespace TMVA
TMVA::DNN::TCpuMatrix
The TCpuMatrix class.
Definition: CpuMatrix.h:72

Cpu.h

TMVA::DNN::TCpu::RecurrentLayerBackward
static Matrix_t & RecurrentLayerBackward(TCpuMatrix< Scalar_t > &state_gradients_backward, TCpuMatrix< Scalar_t > &input_weight_gradients, TCpuMatrix< Scalar_t > &state_weight_gradients, TCpuMatrix< Scalar_t > &bias_gradients, TCpuMatrix< Scalar_t > &df, const TCpuMatrix< Scalar_t > &state, const TCpuMatrix< Scalar_t > &weights_input, const TCpuMatrix< Scalar_t > &weights_state, const TCpuMatrix< Scalar_t > &input, TCpuMatrix< Scalar_t > &input_gradient)
Backward pass for Recurrent Networks.
Definition: RecurrentPropagation.cxx:28

Blas.h

TMVA
Abstract ClassifierFactory template that handles arbitrary types.
Definition: GeneticMinimizer.h:21