doc/master/ROperator__BatchNormalization_8hxx_source.html

#ifndef TMVA_SOFIE_ROPERATOR_BatchNormalization

#define TMVA_SOFIE_ROPERATOR_BatchNormalization


#include "SOFIE_common.hxx"

#include "ROperator.hxx"

#include "RModel.hxx"


#include <cmath>

#include <sstream>


namespace TMVA{

namespace Experimental{

namespace SOFIE{


template <typename T>

class ROperator_BatchNormalization final : public ROperator

{


private:


   /* Attributes */

   float fepsilon = 1e-05;

   float fmomentum = 0.9;

   std::size_t ftraining_mode = 0;


   std::string fNX;

   std::string fNScale;

   std::string fNB;

   std::string fNMean;

   std::string fNVar;

   std::string fNY;


   std::vector<size_t> fShapeX;

   std::vector<size_t> fShapeScale;

   std::vector<size_t> fShapeB;

   std::vector<size_t> fShapeMean;

   std::vector<size_t> fShapeVar;

   std::vector<size_t> fShapeY;


   std::string fType;


public:

   ROperator_BatchNormalization() = delete;


   /* Constructor */

   ROperator_BatchNormalization( float epsilon, float momentum, std::size_t training_mode,

   std::string nameX, std::string nameScale, std::string nameB,

   std::string nameMean, std::string nameVar, std::string nameY):

   fepsilon(epsilon), fmomentum(momentum), ftraining_mode(training_mode),

   fNX(UTILITY::Clean_name(nameX)), fNScale(UTILITY::Clean_name(nameScale)),

   fNB(UTILITY::Clean_name(nameB)), fNMean(UTILITY::Clean_name(nameMean)),

   fNVar(UTILITY::Clean_name(nameVar)), fNY(UTILITY::Clean_name(nameY))

   {

      if(std::is_same<T, float>::value){

      fType = "float";

      }

      else{

         throw

            std::runtime_error("TMVA SOFIE Encountered unsupported type parsing a BatchNormalization operator");

      }

   }


   std::vector<ETensorType> TypeInference(std::vector<ETensorType> input) {

      ETensorType out = input[0];

      return {out};

   }


   std::vector<std::vector<size_t>> ShapeInference(std::vector<std::vector<size_t>> input) {

      if (input.size() != 5 ) {

         throw

         std::runtime_error("TMVA SOFIE BatchNormalization Op Shape inference need 5 input tensors");

      }

      for(size_t i = 0; i < input.size(); i++) {

         if (input[i].size() != 4) {

            throw

            std::runtime_error("TMVA SOFIE BatchNormalization Op Shape inference only accept tensor with 4 dimensions");

         }

      }


      auto ret = input;

      return ret;

   }


   void Initialize(RModel& model){

      if (!model.CheckIfTensorAlreadyExist(fNX)) {

         throw

            std::runtime_error("TMVA SOFIE BatchNormalization op Input Tensor " + fNX + " fnx is not found in model");

      }

      if (!model.CheckIfTensorAlreadyExist(fNScale)) {

        throw

            std::runtime_error("TMVA SOFIE BatchNormalization op Input Tensor " + fNScale + " fns is not found in model");

      }

     if (!model.CheckIfTensorAlreadyExist(fNB)) {

         throw

            std::runtime_error("TMVA SOFIE BatchNormalization op Input Tensor " + fNB + " fnb is not found in model");

      }

      if (!model.CheckIfTensorAlreadyExist(fNMean)) {

         throw

            std::runtime_error("TMVA SOFIE BatchNormalization op Input Tensor " + fNMean + " fnm is not found in model");

      }

      if (!model.CheckIfTensorAlreadyExist(fNVar)) {

         throw

            std::runtime_error("TMVA SOFIE BatchNormalization op Input Tensor " + fNVar + " fnv is not found in model");

      }


      fShapeX = model.GetTensorShape(fNX);


      if (fShapeX.size() <  2 || fShapeX.size() > 4) {

         throw

            std::runtime_error("TMVA SOFIE BatchNormalization Op input tensor " + fNX + " fnx has wrong shape : " + ConvertShapeToString(fShapeX));

      }


      fShapeScale = model.GetTensorShape(fNScale);

      fShapeB = model.GetTensorShape(fNB);

      fShapeMean = model.GetTensorShape(fNMean);

      fShapeVar = model.GetTensorShape(fNVar);

      fShapeY = fShapeX;

      model.AddIntermediateTensor(fNY, model.GetTensorType(fNX), fShapeY);


      if (fShapeB.size() == 1) {

         // Broadcast scale, bias, input_mean and input_var to shape_X

         auto original_B = model.GetInitializedTensorData(fNB);

         auto original_S = model.GetInitializedTensorData(fNScale);

         auto original_M = model.GetInitializedTensorData(fNMean);

         auto original_V = model.GetInitializedTensorData(fNVar);

         size_t batchSize = fShapeX[0];

         size_t channels = fShapeX[1];

         size_t height = (fShapeX.size() > 2) ? fShapeX[2] : 1;

         size_t width = (fShapeX.size() > 3) ? fShapeX[3] : 1;

         size_t n = batchSize * channels * height * width;

         if (fType == "float") {

            float *original_bias = static_cast<float *>(original_B.get());

            float *original_scale = static_cast<float *>(original_S.get());

            float *original_mean = static_cast<float *>(original_M.get());

            float *original_var = static_cast<float *>(original_V.get());

            float *new_bias = new float[n];

            float *new_scale = new float[n];

            float *new_mean = new float[n];

            float *new_var = new float[n];

            size_t bs = 0, ch = 0, h = 0, w = 0;

            for (ch = 0; ch < channels; ch++) {

               for (h = 0; h < height; h++) {

                  for (w = 0; w < width; w++) {

                     new_bias[bs * channels * height * width + ch * height * width + h * width + w] = original_bias[ch];

                     new_scale[bs * channels * height * width + ch * height * width + h * width + w] =

                        original_scale[ch];

                     new_mean[bs * channels * height * width + ch * height * width + h * width + w] = original_mean[ch];

                     new_var[bs * channels * height * width + ch * height * width + h * width + w] = original_var[ch];

                  }

               }

            }

            size_t Batchoffset = channels * height * width;

            for (bs = 1; bs < batchSize; bs++) {

               std::copy(new_bias, new_bias + Batchoffset, new_bias + (bs * Batchoffset));

               std::copy(new_scale, new_scale + Batchoffset, new_scale + (bs * Batchoffset));

               std::copy(new_mean, new_mean + Batchoffset, new_mean + (bs * Batchoffset));

               std::copy(new_var, new_var + Batchoffset, new_var + (bs * Batchoffset));

            }

            //// new_var =1. / sqrt(input_var + fepsilon)

            for (size_t i = 0; i < n; i++) {

               new_var[i] = 1. / sqrt(new_var[i] + fepsilon);

               new_scale[i] *= new_var[i]; // include var in new scale

            }

            std::vector<size_t> new_bias_shape = {batchSize, channels, height, width};

            std::shared_ptr<void> new_bias_ptr(new_bias, std::default_delete<float[]>());

            std::shared_ptr<void> new_scale_ptr(new_scale, std::default_delete<float[]>());

            std::shared_ptr<void> new_mean_ptr(new_mean, std::default_delete<float[]>());

            std::shared_ptr<void> new_var_ptr(new_var, std::default_delete<float[]>());

            model.UpdateInitializedTensor(fNB, model.GetTensorType(fNB), new_bias_shape, new_bias_ptr);

            model.UpdateInitializedTensor(fNScale, model.GetTensorType(fNScale), new_bias_shape, new_scale_ptr);

            model.UpdateInitializedTensor(fNMean, model.GetTensorType(fNMean), new_bias_shape, new_mean_ptr);

            model.UpdateInitializedTensor(fNVar, model.GetTensorType(fNVar), new_bias_shape, new_var_ptr);

            fShapeB = model.GetTensorShape(fNB);

            fShapeScale = model.GetTensorShape(fNScale);

            fShapeMean = model.GetTensorShape(fNMean);

            fShapeVar = model.GetTensorShape(fNVar);

         }

      }

   }


   std::string Generate(std::string OpName){

      OpName = "op_" + OpName;

      if (fShapeX.empty()){

         throw std::runtime_error("TMVA SOFIE Batch Normalization called to Generate without being initialized first");

      }


      std::stringstream out;

      //// Batch Norm op

      size_t batchSize = fShapeX[0];

      size_t channels = fShapeX[1];

      size_t height = (fShapeX.size() > 2) ? fShapeX[2] : 1;

      size_t width = (fShapeX.size() > 3) ? fShapeX[3] : 1;

      size_t n = batchSize * channels * height * width;


      //// copy X into Y

      out << SP << "constexpr int " << OpName << "_N =" << batchSize * channels * height * width << ";\n";

      out << SP << "constexpr int "<<OpName<< "_incx = 1;\n";

      out << SP << "constexpr int "<<OpName<< "_incy = 1;\n";

      out << SP << "BLAS::scopy_(&" << OpName << "_N, " << "tensor_" << fNX << ", &" << OpName << "_incx," << "tensor_" << fNY << ", &" << OpName << "_incy);\n\n";


      //// blas saxpy (Y = -Bmean + Y)

      out << SP << "float "<<OpName<< "_alpha = -1;\n";

      out << SP << "BLAS::saxpy_(&" << OpName << "_N, &" << OpName << "_alpha, " << "tensor_" << fNMean << ", &" << OpName << "_incx,"

         << "tensor_" << fNY <<", &" << OpName << "_incy);\n\n ";


      //// Y *= scale*var

      out << SP << "for (size_t i = 0; i < " << n << "; i++) {\n";

      // scale tensor contains already the var

      out << SP << SP << "tensor_" << fNY << "[i] *= tensor_" << fNScale << "[i]; \n";

      out << SP << "}\n";


      //// blas saxpy (Y = Bbias + Y)

      out << SP <<OpName<< "_alpha = 1;\n";

      out << SP << "BLAS::saxpy_(&" << OpName << "_N, &" << OpName << "_alpha, " << "tensor_" << fNB << ", &" << OpName << "_incx, "

         << "tensor_" << fNY << ", &" << OpName << "_incy);\n\n";


      return out.str();

   }


   std::vector<std::string> GetBlasRoutines() { return { std::string("Copy"), std::string("Axpy") }; }

};


}//SOFIE

}//Experimental

}//TMVA


#endif //TMVA_SOFIE_ROPERATOR_BatchNormalization

RModel.hxx

ROperator.hxx

h
#define h(i)
Definition RSha256.hxx:106

e
#define e(i)
Definition RSha256.hxx:103

size
size_t size(const MatrixT &matrix)
retrieve the size of a square matrix

SOFIE_common.hxx

w
winID w
Definition TGWin32VirtualGLProxy.cxx:39

input
Option_t Option_t TPoint TPoint const char GetTextMagnitude GetFillStyle GetLineColor GetLineWidth GetMarkerStyle GetTextAlign GetTextColor GetTextSize void input
Definition TGWin32VirtualXProxy.cxx:142

width
Option_t Option_t width
Definition TGWin32VirtualXProxy.cxx:56

height
Option_t Option_t TPoint TPoint const char GetTextMagnitude GetFillStyle GetLineColor GetLineWidth GetMarkerStyle GetTextAlign GetTextColor GetTextSize void char Point_t Rectangle_t height
Definition TGWin32VirtualXProxy.cxx:164

TMVA::Experimental::SOFIE::RModel
Definition RModel.hxx:12

TMVA::Experimental::SOFIE::RModel::GetTensorType
const ETensorType & GetTensorType(std::string name)
Definition RModel.cxx:94

TMVA::Experimental::SOFIE::RModel::AddIntermediateTensor
void AddIntermediateTensor(std::string tensor_name, ETensorType type, std::vector< Dim > dim_shape)
Definition RModel.cxx:203

TMVA::Experimental::SOFIE::RModel::CheckIfTensorAlreadyExist
bool CheckIfTensorAlreadyExist(std::string tensor_name)
Definition RModel.cxx:122

TMVA::Experimental::SOFIE::RModel::GetTensorShape
const std::vector< size_t > & GetTensorShape(std::string name)
Definition RModel.cxx:56

TMVA::Experimental::SOFIE::RModel::GetInitializedTensorData
std::shared_ptr< void > GetInitializedTensorData(std::string tensor_name)
Definition RModel.cxx:264

TMVA::Experimental::SOFIE::RModel::UpdateInitializedTensor
void UpdateInitializedTensor(std::string tensor_name, ETensorType type, std::vector< std::size_t > shape, std::shared_ptr< void > data)
Definition RModel.cxx:255

TMVA::Experimental::SOFIE::ROperator_BatchNormalization
Definition ROperator_BatchNormalization.hxx:18

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fShapeScale
std::vector< size_t > fShapeScale
Definition ROperator_BatchNormalization.hxx:35

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fNB
std::string fNB
Definition ROperator_BatchNormalization.hxx:29

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::ROperator_BatchNormalization
ROperator_BatchNormalization()=delete

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::GetBlasRoutines
std::vector< std::string > GetBlasRoutines()
Definition ROperator_BatchNormalization.hxx:222

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fShapeY
std::vector< size_t > fShapeY
Definition ROperator_BatchNormalization.hxx:39

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::Generate
std::string Generate(std::string OpName)
Definition ROperator_BatchNormalization.hxx:183

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fNScale
std::string fNScale
Definition ROperator_BatchNormalization.hxx:28

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::Initialize
void Initialize(RModel &model)
Definition ROperator_BatchNormalization.hxx:86

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fType
std::string fType
Definition ROperator_BatchNormalization.hxx:41

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fShapeX
std::vector< size_t > fShapeX
Definition ROperator_BatchNormalization.hxx:34

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::ShapeInference
std::vector< std::vector< size_t > > ShapeInference(std::vector< std::vector< size_t > > input)
Definition ROperator_BatchNormalization.hxx:70

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fNMean
std::string fNMean
Definition ROperator_BatchNormalization.hxx:30

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fNY
std::string fNY
Definition ROperator_BatchNormalization.hxx:32

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fNX
std::string fNX
Definition ROperator_BatchNormalization.hxx:27

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fShapeB
std::vector< size_t > fShapeB
Definition ROperator_BatchNormalization.hxx:36

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fShapeMean
std::vector< size_t > fShapeMean
Definition ROperator_BatchNormalization.hxx:37

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fepsilon
float fepsilon
Definition ROperator_BatchNormalization.hxx:23

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::ftraining_mode
std::size_t ftraining_mode
Definition ROperator_BatchNormalization.hxx:25

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fNVar
std::string fNVar
Definition ROperator_BatchNormalization.hxx:31

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::TypeInference
std::vector< ETensorType > TypeInference(std::vector< ETensorType > input)
Definition ROperator_BatchNormalization.hxx:65

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fShapeVar
std::vector< size_t > fShapeVar
Definition ROperator_BatchNormalization.hxx:38

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::fmomentum
float fmomentum
Definition ROperator_BatchNormalization.hxx:24

TMVA::Experimental::SOFIE::ROperator_BatchNormalization::ROperator_BatchNormalization
ROperator_BatchNormalization(float epsilon, float momentum, std::size_t training_mode, std::string nameX, std::string nameScale, std::string nameB, std::string nameMean, std::string nameVar, std::string nameY)
Definition ROperator_BatchNormalization.hxx:47

TMVA::Experimental::SOFIE::ROperator
Definition ROperator.hxx:18

TMVA::Experimental::SOFIE::ROperator::SP
const std::string SP
space used to correctly indent the generated C++ code
Definition ROperator.hxx:41

n
const Int_t n
Definition legend1.C:16

TMVA::Experimental::SOFIE::ETensorType
ETensorType
Definition SOFIE_common.hxx:25

TMVA::Experimental::SOFIE::ConvertShapeToString
std::string ConvertShapeToString(std::vector< size_t > shape)
Definition SOFIE_common.cxx:110

TMVA
create variable transformations
Definition GeneticMinimizer.h:22