xmippDoc/html/xmipp__gpu__correlation_8cpp_source.html

 /***************************************************************************
  *
  * Authors:    Amaya Jimenez      ajimenez@cnb.csic.es (2017)
  *
  * Unidad de  Bioinformatica of Centro Nacional de Biotecnologia , CSIC
  *
  * This program is free software; you can redistribute it and/or modify
  * it under the terms of the GNU General Public License as published by
  * the Free Software Foundation; either version 2 of the License, or
  * (at your option) any later version.
  *
  * This program is distributed in the hope that it will be useful,
  * but WITHOUT ANY WARRANTY; without even the implied warranty of
  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  * GNU General Public License for more details.
  *
  * You should have received a copy of the GNU General Public License
  * along with this program; if not, write to the Free Software
  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA
  * 02111-1307  USA
  *
  *  All comments concerning this program package may be sent to the
  *  e-mail address 'xmipp@cnb.csic.es'
  ***************************************************************************/

 #include "xmipp_gpu_correlation.h"

 #include <core/xmipp_image.h>
 #include <data/mask.h>
 #include <core/xmipp_fftw.h>
 #include <core/transformations.h>
 #include <core/metadata_extension.h>
 #include <data/filters.h>
 #include <core/xmipp_funcs.h>
 //#include <core/xmipp_threads.h>

 #include "xmipp_gpu_utils.h"
 #include <reconstruction_cuda/cuda_gpu_correlation.h>

 #include <algorithm>
 #include <math.h>
 #include <time.h>
 #include <sys/time.h>


 // A function to print all prime factors of a given number n
 void primeFactors(int n, int *out)
 {
     int n_orig = n;
     // Print the number of 2s that divide n
     while (n%2 == 0)
     {
         //printf("%d ", 2);
         out[0]++;
         n = n/2;
     }

     // n must be odd at this point. So we can skip
     // one element (Note i = i +2)
     for (int i = 3; i <= sqrt(n_orig); i = i+2)
     {
         // While i divides n, print i and divide n
         while (n%i == 0)
         {
             //printf("%d ", i);
             if (i==3)
                 out[1]++;
             else if (i==5)
                 out[2]++;
             else if (i==7)
                 out[3]++;
             else if(i>7)
                 out[4]++;

             n = n/i;
         }
     }

     // This condition is to handle the case when n
     // is a prime number greater than 2
     if (n > 2){
         //printf ("%d ", n);
         out[4]++;
     }
 }


 void preprocess_images_reference(MetaDataVec &SF, int firstIdx, int numImages, Mask &mask, GpuCorrelationAux &d_correlationAux,
         mycufftHandle &myhandlePadded, mycufftHandle &myhandleMask, mycufftHandle &myhandlePolar,
         StructuresAux &myStructureAux, MetaDataVec::id_iterator iter, myStreamHandle myStream)
 {
     size_t Xdim, Ydim, Zdim, Ndim;
     getImageSize(SF,Xdim,Ydim,Zdim,Ndim);
     size_t pad_Xdim=d_correlationAux.Xdim;
     size_t pad_Ydim=d_correlationAux.Ydim;

     FileName fnImg;
     Image<float> Iref;
     size_t radius = d_correlationAux.YdimPolar;
     size_t angles = d_correlationAux.XdimPolar;

     GpuMultidimArrayAtCpu<float> original_image_stack_ref(Xdim,Ydim,1,numImages);

     size_t n=0;
     for(int i=firstIdx; i<firstIdx+numImages; i++){

         SF.getValue(MDL_IMAGE,fnImg,*iter);
         //std::cerr << iter->objId << ". Image: " << fnImg << std::endl;
         Iref.read(fnImg);
         original_image_stack_ref.fillImage(n,Iref()/8);

         if(iter != SF.ids().end())
             ++iter;

         n++;
     }

     GpuMultidimArrayAtGpu<float> image_stack_gpu(Xdim,Ydim,1,numImages);
     original_image_stack_ref.copyToGpu(image_stack_gpu, myStream);

     MultidimArray<int> maskArray = mask.get_binary_mask();
     MultidimArray<float> dMask;
     typeCast(maskArray, dMask);
     d_correlationAux.d_mask.resize(Xdim, Ydim, Zdim, 1);
     float *mask_aux;
     cpuMalloc((void**)&mask_aux, sizeof(float)*Xdim*Ydim*Zdim);
     memcpy(mask_aux, MULTIDIM_ARRAY(dMask), sizeof(float)*Xdim*Ydim*Zdim);
     d_correlationAux.d_mask.copyToGpuStream(mask_aux, myStream);

     padding_masking(image_stack_gpu, d_correlationAux.d_mask, myStructureAux.padded_image_gpu, myStructureAux.padded_image2_gpu,
             myStructureAux.padded_mask_gpu, false, myStream);

     GpuMultidimArrayAtGpu< std::complex<float> > dull;

     myStructureAux.padded_image_gpu.fftStream(d_correlationAux.d_projFFT, myhandlePadded, myStream, false, dull);

     myStructureAux.padded_image2_gpu.fftStream(d_correlationAux.d_projSquaredFFT, myhandlePadded, myStream, false, dull);
     myStructureAux.padded_mask_gpu.fftStream(d_correlationAux.d_maskFFT, myhandleMask, myStream, false, dull);

     //Polar transform of the projected images
     cuda_cart2polar(image_stack_gpu, myStructureAux.polar_gpu, myStructureAux.polar2_gpu, false, myStream);

     myStructureAux.polar_gpu.fftStream(d_correlationAux.d_projPolarFFT, myhandlePolar, myStream, false, dull);

     myStructureAux.polar2_gpu.fftStream(d_correlationAux.d_projPolarSquaredFFT, myhandlePolar, myStream, false, dull);
 }


 void preprocess_images_experimental(MetaDataVec &SF, FileName &fnImg, int numImagesRef, GpuMultidimArrayAtGpu<float> &mask,
         GpuMultidimArrayAtGpu< std::complex<float> > &d_maskFFT, GpuCorrelationAux &d_correlationAux, bool rotation,
         int firstStep, bool mirror, mycufftHandle &myhandlePadded, mycufftHandle &myhandlePolar,
         StructuresAux &myStructureAux, myStreamHandle myStream)
 {
     size_t Xdim, Ydim, Zdim, Ndim;
     getImageSize(SF,Xdim,Ydim,Zdim,Ndim);
     size_t pad_Xdim=d_correlationAux.Xdim;
     size_t pad_Ydim=d_correlationAux.Ydim;
     size_t radius=d_correlationAux.YdimPolar;
     size_t angles = d_correlationAux.XdimPolar;

     GpuMultidimArrayAtCpu<float> original_image_stack(Xdim,Ydim,1,numImagesRef);

     GpuMultidimArrayAtGpu< std::complex<float> > dull;

     if(firstStep==0){

         Image<float> Iref;

         Iref.read(fnImg);

         //AJ mirror of the image
         if(mirror)
             Iref().selfReverseX();
         //END AJ mirror

         for(size_t i=0; i<numImagesRef; i++)
             original_image_stack.fillImage(i,Iref()/8);

     }

         original_image_stack.copyToGpu(d_correlationAux.d_original_image, myStream);

     if(!rotation){
         padding_masking(d_correlationAux.d_original_image, mask, myStructureAux.padded_image_gpu, myStructureAux.padded_image2_gpu,
                 myStructureAux.padded_mask_gpu, true, myStream);

         myStructureAux.padded_image_gpu.fftStream(d_correlationAux.d_projFFT, myhandlePadded, myStream, false, dull);

         myStructureAux.padded_image2_gpu.fftStream(d_correlationAux.d_projSquaredFFT, myhandlePadded, myStream, false, dull);
         d_maskFFT.copyGpuToGpuStream(d_correlationAux.d_maskFFT, myStream);

     }

     if(rotation){
         cuda_cart2polar(d_correlationAux.d_original_image, myStructureAux.polar_gpu, myStructureAux.polar2_gpu, true, myStream);
         myStructureAux.polar_gpu.fftStream(d_correlationAux.d_projPolarFFT, myhandlePolar, myStream, false, dull);
         myStructureAux.polar2_gpu.fftStream(d_correlationAux.d_projPolarSquaredFFT, myhandlePolar, myStream, false, dull);
     }

 }


 void preprocess_images_experimental_two(MetaDataVec &SF, FileName &fnImg, int numImagesRef, GpuMultidimArrayAtGpu<float> &mask,
         GpuMultidimArrayAtGpu< std::complex<float> > &d_maskFFT,
         GpuCorrelationAux &d_correlationAuxTR, GpuCorrelationAux &d_correlationAuxRT,
         int firstStep, bool mirror,
         mycufftHandle &myhandlePaddedTR, mycufftHandle &myhandleMaskTR,
         mycufftHandle &myhandlePolarRT,
         StructuresAux &myStructureAuxTR, StructuresAux &myStructureAuxRT,
         myStreamHandle &myStreamTR, myStreamHandle &myStreamRT,
         GpuMultidimArrayAtCpu<float> &original_image_stack)
 {


     size_t Xdim, Ydim, Zdim, Ndim;
     getImageSize(SF,Xdim,Ydim,Zdim,Ndim);
     size_t pad_Xdim=d_correlationAuxTR.Xdim;
     size_t pad_Ydim=d_correlationAuxTR.Ydim;
     size_t radius=d_correlationAuxTR.YdimPolar;
     size_t angles = d_correlationAuxTR.XdimPolar;

     original_image_stack.resize(Xdim,Ydim,1,numImagesRef);

     if(firstStep==0){

         Image<float> Iref;

         Iref.read(fnImg);

         //AJ mirror of the image
         if(mirror)
             Iref().selfReverseX();
         //END AJ mirror

         for(size_t i=0; i<numImagesRef; i++)
             original_image_stack.fillImage(i,Iref()/8);

     }

         d_correlationAuxTR.d_original_image.resize(Xdim,Ydim,1,numImagesRef);
         d_correlationAuxRT.d_original_image.resize(Xdim,Ydim,1,numImagesRef);
         d_correlationAuxTR.d_projFFT.resize((pad_Xdim/2)+1, pad_Ydim, 1, numImagesRef);
         d_correlationAuxTR.d_projSquaredFFT.resize((pad_Xdim/2)+1, pad_Ydim, 1, numImagesRef);
         d_correlationAuxRT.d_projPolarFFT.resize((angles/2)+1, radius, 1, numImagesRef);
         d_correlationAuxRT.d_projPolarSquaredFFT.resize((angles/2)+1, radius, 1, numImagesRef);
         d_correlationAuxTR.d_maskFFT.resize(d_maskFFT);

         original_image_stack.copyToGpu(d_correlationAuxTR.d_original_image, myStreamTR);

         padding_masking(d_correlationAuxTR.d_original_image, mask, myStructureAuxTR.padded_image_gpu, myStructureAuxTR.padded_image2_gpu,
                 myStructureAuxTR.padded_mask_gpu, true, myStreamTR);

         original_image_stack.copyToGpu(d_correlationAuxRT.d_original_image, myStreamRT);

         cuda_cart2polar(d_correlationAuxRT.d_original_image, myStructureAuxRT.polar_gpu, myStructureAuxRT.polar2_gpu, true, myStreamRT);


         GpuMultidimArrayAtGpu< std::complex<float> > dull;

         myStructureAuxTR.padded_image_gpu.fftStream(d_correlationAuxTR.d_projFFT, myhandlePaddedTR, myStreamTR, false, dull);

         myStructureAuxTR.padded_image2_gpu.fftStream(d_correlationAuxTR.d_projSquaredFFT, myhandlePaddedTR, myStreamTR, false, dull);
         d_maskFFT.copyGpuToGpuStream(d_correlationAuxTR.d_maskFFT, myStreamTR);

         myStructureAuxRT.polar_gpu.fftStream(d_correlationAuxRT.d_projPolarFFT, myhandlePolarRT, myStreamRT, false, dull);
         myStructureAuxRT.polar2_gpu.fftStream(d_correlationAuxRT.d_projPolarSquaredFFT, myhandlePolarRT, myStreamRT, false, dull);

 }


 void preprocess_images_experimental_transform_two(MetaDataVec &SF, FileName &fnImg, int numImagesRef, GpuMultidimArrayAtGpu<float> &mask,
         GpuMultidimArrayAtGpu< std::complex<float> > &d_maskFFT,
         GpuCorrelationAux &d_correlationAuxOne, GpuCorrelationAux &d_correlationAuxTwo,
         mycufftHandle &myhandlePaddedOne,
         mycufftHandle &myhandlePolarTwo,
         StructuresAux &myStructureAuxOne, StructuresAux &myStructureAuxTwo,
         myStreamHandle &myStreamOne, myStreamHandle &myStreamTwo, int step)
 {

     size_t Xdim = d_correlationAuxOne.d_transform_image.Xdim;
     size_t Ydim = d_correlationAuxOne.d_transform_image.Ydim;
     size_t Zdim = d_correlationAuxOne.d_transform_image.Zdim;
     size_t Ndim = d_correlationAuxOne.d_transform_image.Ndim;
     size_t pad_Xdim=d_correlationAuxOne.Xdim;
     size_t pad_Ydim=d_correlationAuxOne.Ydim;
     size_t radius=d_correlationAuxOne.YdimPolar;
     size_t angles = d_correlationAuxOne.XdimPolar;

     d_correlationAuxOne.d_projFFT.resize((pad_Xdim/2)+1, pad_Ydim, 1, numImagesRef);
     d_correlationAuxOne.d_projSquaredFFT.resize((pad_Xdim/2)+1, pad_Ydim, 1, numImagesRef);
     d_correlationAuxTwo.d_projPolarFFT.resize((angles/2)+1, radius, 1, numImagesRef);
     d_correlationAuxTwo.d_projPolarSquaredFFT.resize((angles/2)+1, radius, 1, numImagesRef);
     d_correlationAuxOne.d_maskFFT.resize(d_maskFFT);


     padding_masking(d_correlationAuxOne.d_transform_image, mask, myStructureAuxOne.padded_image_gpu, myStructureAuxOne.padded_image2_gpu,
             myStructureAuxOne.padded_mask_gpu, true, myStreamOne);

     cuda_cart2polar(d_correlationAuxTwo.d_transform_image, myStructureAuxTwo.polar_gpu, myStructureAuxTwo.polar2_gpu, true, myStreamTwo);

     GpuMultidimArrayAtGpu< std::complex<float> > dull;
     myStructureAuxOne.padded_image_gpu.fftStream(d_correlationAuxOne.d_projFFT, myhandlePaddedOne, myStreamOne, false, dull);
     myStructureAuxOne.padded_image2_gpu.fftStream(d_correlationAuxOne.d_projSquaredFFT, myhandlePaddedOne, myStreamOne, false, dull);
     d_maskFFT.copyGpuToGpuStream(d_correlationAuxOne.d_maskFFT, myStreamOne);

     myStructureAuxTwo.polar_gpu.fftStream(d_correlationAuxTwo.d_projPolarFFT, myhandlePolarTwo, myStreamTwo, false, dull);
     myStructureAuxTwo.polar2_gpu.fftStream(d_correlationAuxTwo.d_projPolarSquaredFFT, myhandlePolarTwo, myStreamTwo, false, dull);

 }


 void preprocess_images_experimental_transform(GpuCorrelationAux &d_correlationAux, GpuMultidimArrayAtGpu<float> &mask,
         GpuMultidimArrayAtGpu< std::complex<float> > &d_maskFFT, bool rotation, mycufftHandle &myhandlePadded,
         mycufftHandle &myhandlePolar, StructuresAux &myStructureAux, myStreamHandle myStream)
 {

     size_t Xdim = d_correlationAux.d_transform_image.Xdim;
     size_t Ydim = d_correlationAux.d_transform_image.Ydim;
     size_t Zdim = d_correlationAux.d_transform_image.Zdim;
     size_t Ndim = d_correlationAux.d_transform_image.Ndim;
     size_t pad_Xdim=d_correlationAux.Xdim;
     size_t pad_Ydim=d_correlationAux.Ydim;
     size_t radius=d_correlationAux.YdimPolar;
     size_t angles = d_correlationAux.XdimPolar;

     GpuMultidimArrayAtGpu< std::complex<float> > dull;

     if(!rotation){
         padding_masking(d_correlationAux.d_transform_image, mask, myStructureAux.padded_image_gpu, myStructureAux.padded_image2_gpu,
                 myStructureAux.padded_mask_gpu, true, myStream);

         myStructureAux.padded_image_gpu.fftStream(d_correlationAux.d_projFFT, myhandlePadded, myStream, false, dull);

         myStructureAux.padded_image2_gpu.fftStream(d_correlationAux.d_projSquaredFFT, myhandlePadded, myStream, false, dull);
         d_maskFFT.copyGpuToGpuStream(d_correlationAux.d_maskFFT, myStream);

     }

     //Polar transform of the projected images
     if(rotation){
         cuda_cart2polar(d_correlationAux.d_transform_image, myStructureAux.polar_gpu, myStructureAux.polar2_gpu, true, myStream);
         myStructureAux.polar_gpu.fftStream(d_correlationAux.d_projPolarFFT, myhandlePolar, myStream, false, dull);
         myStructureAux.polar2_gpu.fftStream(d_correlationAux.d_projPolarSquaredFFT, myhandlePolar, myStream, false, dull);

     }


 }

 void align_experimental_image(FileName &fnImgExp, GpuCorrelationAux &d_referenceAux,
         GpuCorrelationAux &d_experimentalAuxTR, GpuCorrelationAux &d_experimentalAuxRT,
         TransformMatrix<float> &transMat_tr, TransformMatrix<float> &transMat_rt, float *max_vector_tr, float *max_vector_rt,
         MetaDataVec &SFexp, int available_images_proj, bool mirror, int maxShift,
         mycufftHandle &myhandlePadded_tr, mycufftHandle &myhandleMask_tr, mycufftHandle &myhandlePolar_tr,
         mycufftHandle &myhandlePaddedB_tr, mycufftHandle &myhandleMaskB_tr, mycufftHandle &myhandlePolarB_tr,
         mycufftHandle &myhandlePadded_rt, mycufftHandle &myhandleMask_rt, mycufftHandle &myhandlePolar_rt,
         mycufftHandle &myhandlePaddedB_rt, mycufftHandle &myhandleMaskB_rt, mycufftHandle &myhandlePolarB_rt,
         StructuresAux &myStructureAux_tr, StructuresAux &myStructureAux_rt,
         myStreamHandle &myStreamTR, myStreamHandle &myStreamRT,
         TransformMatrix<float> &resultTR, TransformMatrix<float> &resultRT,
         GpuMultidimArrayAtCpu<float> &original_image_stack, mycufftHandle &ifftcb)
 {

     bool rotation;

     //FIRST PART FOR TRTRTRT

     int max_step;
     rotation = false;
     //max_vector = max_vector_tr;
     max_step=7;


     preprocess_images_experimental_two(SFexp, fnImgExp, available_images_proj, d_referenceAux.d_mask,
             d_referenceAux.d_maskFFT, d_experimentalAuxTR, d_experimentalAuxRT,  0, mirror,
                     myhandlePadded_tr,
                     myhandleMask_rt, myhandlePolar_rt,
                     myStructureAux_tr, myStructureAux_rt, myStreamTR, myStreamRT, original_image_stack);

     d_experimentalAuxTR.maskCount=d_referenceAux.maskCount;
     d_experimentalAuxTR.produceSideInfo(myhandlePaddedB_tr, myhandleMaskB_tr, myStructureAux_tr,
             d_referenceAux.maskAutocorrelation, myStreamTR);

     d_experimentalAuxTR.d_transform_image.resize(d_experimentalAuxTR.d_original_image);
     d_experimentalAuxRT.d_transform_image.resize(d_experimentalAuxRT.d_original_image);

     //transMat = &transMat_tr;

     for(int step=0; step<6; step++){

         bool saveMaxVector = false;
         if(step==5)
             saveMaxVector = true;

         if(step%2==0){

             //FIRST TRANSLATION AND SECOND ROTATION
             //CORRELATION PART
             //TRANSFORMATION MATRIX CALCULATION
             cuda_calculate_correlation_two(d_referenceAux, d_experimentalAuxTR,
                     transMat_tr, max_vector_tr, maxShift,
                     myhandlePaddedB_tr, mirror, myStructureAux_tr,
                     myStreamTR,
                     d_experimentalAuxRT, transMat_rt,
                     max_vector_rt, myhandlePolarB_rt,
                     myStructureAux_rt, myStreamRT,
                     resultTR, resultRT, ifftcb, saveMaxVector);

             //APPLY TRANSFORMATION
             apply_transform(d_experimentalAuxTR.d_original_image, d_experimentalAuxTR.d_transform_image, transMat_tr, myStreamTR);

             apply_transform(d_experimentalAuxRT.d_original_image, d_experimentalAuxRT.d_transform_image, transMat_rt, myStreamRT);

             //PREPROCESS TO PREPARE DATA TO THE NEXT STEP
             preprocess_images_experimental_transform_two(SFexp, fnImgExp, available_images_proj, d_referenceAux.d_mask,
                     d_referenceAux.d_maskFFT, d_experimentalAuxRT, d_experimentalAuxTR,
                     myhandlePadded_rt,
                     myhandlePolar_tr,
                     myStructureAux_rt, myStructureAux_tr, myStreamRT, myStreamTR, 1);

             d_experimentalAuxRT.maskCount=d_referenceAux.maskCount;
             d_experimentalAuxRT.produceSideInfo(myhandlePaddedB_rt, myhandleMaskB_rt, myStructureAux_rt,
                     d_referenceAux.maskAutocorrelation, myStreamRT);

         }
         else{

             //FIRST ROTATION AND SECOND TRANSLATION
             //CORRELATION PART
             //TRANSFORMATION MATRIX CALCULATION
             cuda_calculate_correlation_two(d_referenceAux, d_experimentalAuxRT,
                     transMat_rt, max_vector_rt, maxShift,
                     myhandlePaddedB_rt, mirror, myStructureAux_rt,
                     myStreamRT,
                     d_experimentalAuxTR, transMat_tr,
                     max_vector_tr, myhandlePolarB_tr,
                     myStructureAux_tr, myStreamTR,
                     resultRT, resultTR, ifftcb, saveMaxVector);


             if(step < 5){

                 //APPLY TRANSFORMATION
                 apply_transform(d_experimentalAuxRT.d_original_image, d_experimentalAuxRT.d_transform_image, transMat_rt, myStreamRT);

                 apply_transform(d_experimentalAuxTR.d_original_image, d_experimentalAuxTR.d_transform_image, transMat_tr, myStreamTR);

                 //PREPROCESS TO PREPARE DATA TO THE NEXT STEP
                 preprocess_images_experimental_transform_two(SFexp, fnImgExp, available_images_proj, d_referenceAux.d_mask,
                         d_referenceAux.d_maskFFT, d_experimentalAuxTR, d_experimentalAuxRT,
                         myhandlePadded_tr,
                         myhandlePolar_rt,
                         myStructureAux_tr, myStructureAux_rt, myStreamTR, myStreamRT, 2);

                 d_experimentalAuxTR.maskCount=d_referenceAux.maskCount;
                 d_experimentalAuxTR.produceSideInfo(myhandlePaddedB_tr, myhandleMaskB_tr, myStructureAux_tr,
                         d_referenceAux.maskAutocorrelation, myStreamTR);

             }else if(step==5){

                 //APPLY TRANSFORMATION
                 d_experimentalAuxTR.d_transform_image.resize(d_experimentalAuxTR.d_original_image);
                 apply_transform(d_experimentalAuxTR.d_original_image, d_experimentalAuxTR.d_transform_image, transMat_tr, myStreamTR);

                 //PREPROCESS TO PREPARE DATA TO THE NEXT STEP
                 preprocess_images_experimental_transform(d_experimentalAuxTR, d_referenceAux.d_mask, d_referenceAux.d_maskFFT, false,
                             myhandlePadded_tr, myhandlePolar_tr, myStructureAux_tr, myStreamTR);
                 d_experimentalAuxTR.maskCount=d_referenceAux.maskCount;
                 d_experimentalAuxTR.produceSideInfo(myhandlePaddedB_tr, myhandleMaskB_tr, myStructureAux_tr,
                         d_referenceAux.maskAutocorrelation, myStreamTR);

                 //CORRELATION PART
                 //TRANSFORMATION MATRIX CALCULATION
                 cuda_calculate_correlation(d_referenceAux, d_experimentalAuxTR, transMat_tr, max_vector_tr, maxShift, myhandlePaddedB_tr,
                             mirror, myStructureAux_tr, myStreamTR, resultTR, saveMaxVector);

             }

         }

     }

 }


 // Read arguments ==========================================================
 void ProgGpuCorrelation::readParams()
 {

     fn_ref = getParam("-i_ref");
     fn_exp = getParam("-i_exp");
     fn_out = getParam("-o");
     generate_out = checkParam("--classify");
     fn_classes_out = getParam("--classify");
     significance = checkParam("--significance");
     simplifiedMd = checkParam("--simplifiedMd");
     if(significance){
         alpha=getDoubleParam("--significance");
         keepN=false;
     }
     if(checkParam("--keep_best") && !significance){
         keepN=true;
         n_keep=getIntParam("--keep_best");
     }
     if(!keepN && !significance){
         keepN=true;
         n_keep=getIntParam("--keep_best");
     }
     fnDir = getParam("--odir");
     maxShift = getIntParam("--maxShift");
     sizePad = getIntParam("--sizePad");
     int device = getIntParam("--device");
     gpu = GPU(device);

 }

 // Show ====================================================================

 void ProgGpuCorrelation::show()
 {
     std::cout
     << "Input projected:                " << fn_ref    << std::endl
     << "Input experimental:             " << fn_exp    << std::endl
     << "Generate output images (y/n):   " << generate_out    << std::endl
     ;
 }

 // usage ===================================================================
 void ProgGpuCorrelation::defineParams()
 {

     addParamsLine("   -i_ref  <md_ref_file>                : Metadata file with input reference images");
     addParamsLine("   -i_exp  <md_exp_file>                : Metadata file with input experimental images");
     addParamsLine("   -o      <md_out>                     : Output metadata file");
     addParamsLine("   [--classify <md_classes_out=\"output_classes.xmd\">]         : To generate the aligned output images and write the associated metadata");
     addParamsLine("   [--keep_best <N=2>]                  : To keep N aligned images with the highest correlation");
     addParamsLine("   [--significance <alpha=0.2>]         : To use significance with the indicated value");
     addParamsLine("   [--odir <outputDir=\".\">]           : Output directory to save the aligned images");
     addParamsLine("   [--maxShift <s=10>]                  : Maximum shift allowed (+-this amount)");
     addParamsLine("   [--simplifiedMd <b=false>]           : To generate a simplified metadata with only the maximum weight image stores");
     addParamsLine("   [--sizePad <pad=100>]    ");
     addParamsLine("   [--device <dev=0>]                   : GPU device to use. 0th by default");
     addUsageLine("Computes the correlation between a set of experimental images with respect "
                  "to a set of reference images with CUDA in GPU");

 }

 int check_gpu_memory(size_t Xdim, size_t Ydim, int percent){
     float data[3]={0, 0, 0};
     cuda_check_gpu_memory(data);
     int bytes = 8*(2*((2*Xdim)-1)*((2*Ydim)-1) + 2*(360*(Xdim/2)));
     return (int)((data[1]*percent/100)/bytes);
 }


 void calculate_weights(MultidimArray<float> &matrixCorrCpu, MultidimArray<float> &matrixCorrCpu_mirror, MultidimArray<float> &corrTotalRow,
         MultidimArray<float> &weights, int Nref, size_t mdExpSize, size_t mdInSize, MultidimArray<float> &weightsMax, bool simplifiedMd,
         MultidimArray<float> *matrixTransCpu, MultidimArray<float> *matrixTransCpu_mirror, int maxShift){

     MultidimArray<float> colAux;
     for(int i=0; i<2*mdInSize; i++){
         if(i<mdInSize){
             matrixCorrCpu.getRow(i,colAux); //col
             corrTotalRow.setCol(i, colAux);
         }else{
             matrixCorrCpu_mirror.getRow(i-mdInSize,colAux); //col
             corrTotalRow.setCol(i, colAux);
         }
     }
     MultidimArray<float> corrTotalCol(1,1,2*mdExpSize, mdInSize);
     MultidimArray<float> rowAux;
     for(int i=0; i<2*mdExpSize; i++){
         if(i<mdExpSize){
             matrixCorrCpu.getCol(i,rowAux); //row
             corrTotalCol.setRow(i, rowAux);
         }else{
             matrixCorrCpu_mirror.getCol(i-mdExpSize,rowAux); //row
             corrTotalCol.setRow(i, rowAux);
         }
     }

     //Order the correlation matrix by rows and columns
     MultidimArray<float> rowCorr;
     MultidimArray<int> rowIndexOrder;
     MultidimArray<int> corrOrderByRowIndex(1,1,mdExpSize, 2*mdInSize);

     MultidimArray<float> colCorr;
     MultidimArray<int> colIndexOrder;
     MultidimArray<int> corrOrderByColIndex(1,1,2*mdExpSize, mdInSize);

     for (size_t i=0; i<mdExpSize; i++){
         corrTotalRow.getRow(i, rowCorr);
         rowCorr.indexSort(rowIndexOrder);
         corrOrderByRowIndex.setRow(i, rowIndexOrder);
     }
     for (size_t i=0; i<mdInSize; i++){
         corrTotalCol.getCol(i, colCorr);
         colCorr.indexSort(colIndexOrder);
         corrOrderByColIndex.setCol(i, colIndexOrder);
     }
     corrOrderByRowIndex.selfReverseX();
     corrOrderByColIndex.selfReverseY();


     //AJ To calculate the weights of every image
     MultidimArray<float> weights1(1,1,mdExpSize,2*mdInSize);
     MultidimArray<float> weights2(1,1,mdExpSize,2*mdInSize);

     for(int i=0; i<mdExpSize; i++){
         int idxMax = DIRECT_A2D_ELEM(corrOrderByRowIndex,i,0)-1;
         for(int j=0; j<2*mdInSize; j++){
             int idx = DIRECT_A2D_ELEM(corrOrderByRowIndex,i,j)-1;
             float weight;
             if(DIRECT_A2D_ELEM(corrTotalRow,i,idx)<0)
                 weight=0.0;
             else
                 weight = 1.0 - (j/(float)corrOrderByRowIndex.xdim);
             weight *= DIRECT_A2D_ELEM(corrTotalRow,i,idx) / DIRECT_A2D_ELEM(corrTotalRow,i,idxMax);
             DIRECT_A2D_ELEM(weights1, i, idx) = weight;
         }
     }
     for(int i=0; i<mdInSize; i++){
         int idxMax = DIRECT_A2D_ELEM(corrOrderByColIndex,0,i)-1;
         for(int j=0; j<2*mdExpSize; j++){
             int idx = DIRECT_A2D_ELEM(corrOrderByColIndex,j,i)-1;
             float weight;
             if(DIRECT_A2D_ELEM(corrTotalCol,idx,i)<0)
                 weight=0.0;
             else
                 weight = 1.0 - (j/(float)corrOrderByColIndex.ydim);
             weight *= DIRECT_A2D_ELEM(corrTotalCol,idx,i) / DIRECT_A2D_ELEM(corrTotalCol,idxMax,i);
             if(idx<mdExpSize){
                 DIRECT_A2D_ELEM(weights2, idx, i) = weight;
             }else{
                 DIRECT_A2D_ELEM(weights2, idx-mdExpSize, i+mdInSize) = weight;
             }
         }
     }
     weights=weights1*weights2;


     //AJ
     MultidimArray<float> rowWeights;
     MultidimArray<int> rowIndexOrderWeights;
     MultidimArray<int> weightsOrderByRowIndex(1,1,mdExpSize, 2*mdInSize);
     int howManyInMd=0;
     bool flip;
     double maxShift2 = maxShift*maxShift;
     Matrix2D<double> bestM(3,3);
     MultidimArray<float> out2(3,3);

     for (size_t i=0; i<mdExpSize; i++){
         weights.getRow(i, rowWeights);
         rowWeights.indexSort(rowIndexOrderWeights);
         weightsOrderByRowIndex.setRow(i, rowIndexOrderWeights);
     }
     weightsOrderByRowIndex.selfReverseX();
     for(int i=0; i<mdExpSize; i++){
         howManyInMd=0;

         for(int j=0; j<2*mdInSize; j++){
             int idx = DIRECT_A2D_ELEM(weightsOrderByRowIndex,i,j)-1;

             if(simplifiedMd && howManyInMd==1){
                 DIRECT_A2D_ELEM(weights, i, idx) = 0;
                 continue;
             }

             if(!simplifiedMd && howManyInMd==Nref){
                 DIRECT_A2D_ELEM(weights, i, idx) = 0;
                 continue;
             }

             if(idx<mdInSize){
                 flip = false;
                 matrixTransCpu[idx].getSlice(i, out2);
             }else{
                 flip = true;
                 matrixTransCpu_mirror[idx-mdInSize].getSlice(i, out2);
             }
             MAT_ELEM(bestM,0,0) = DIRECT_A2D_ELEM(out2,0,0);
             MAT_ELEM(bestM,0,1)=DIRECT_A2D_ELEM(out2,0,1);
             MAT_ELEM(bestM,0,2)=DIRECT_A2D_ELEM(out2,0,2);

             MAT_ELEM(bestM,1,0)=DIRECT_A2D_ELEM(out2,1,0);
             MAT_ELEM(bestM,1,1)=DIRECT_A2D_ELEM(out2,1,1);
             MAT_ELEM(bestM,1,2)=DIRECT_A2D_ELEM(out2,1,2);

             MAT_ELEM(bestM,2,0)=0.0;
             MAT_ELEM(bestM,2,1)=0.0;
             MAT_ELEM(bestM,2,2)=1.0;
             bestM = bestM.inv();

             double shiftX = MAT_ELEM(bestM,0,2);
             double shiftY = MAT_ELEM(bestM,1,2);
             if (shiftX*shiftX + shiftY*shiftY > maxShift2){
                 DIRECT_A2D_ELEM(weights, i, idx) = 0;
             }
             else{
                 howManyInMd++;
             }

         }
     }
     //END AJ


     /*/AJ new to store the maximum weight for every exp image
     if(simplifiedMd && Nref>1){
         weightsMax.resize(mdExpSize);
         for(int i=0; i<mdInSize; i++){
             for(int j=0; j<mdExpSize; j++){
                 if(DIRECT_A2D_ELEM(weights,j,i)!=0){
                     if(DIRECT_A2D_ELEM(weights,j,i)>DIRECT_A1D_ELEM(weightsMax,j))
                         DIRECT_A1D_ELEM(weightsMax,j) = DIRECT_A2D_ELEM(weights,j,i);
                 }
                 if(DIRECT_A2D_ELEM(weights,j,i+mdInSize)!=0){
                     if(DIRECT_A2D_ELEM(weights,j,i+mdInSize)>DIRECT_A1D_ELEM(weightsMax,j))
                         DIRECT_A1D_ELEM(weightsMax,j) = DIRECT_A2D_ELEM(weights,j,i+mdInSize);
                 }
             }
         }
     }
     //END AJ/*/

 }


 void generate_metadata(MetaDataVec SF, MetaDataVec SFexp, FileName fnDir, FileName fn_out, size_t mdExpSize, size_t mdInSize, MultidimArray<float> &weights,
         MultidimArray<float> &corrTotalRow, MultidimArray<float> *matrixTransCpu, MultidimArray<float> *matrixTransCpu_mirror, int maxShift,
         MultidimArray<float> &weightsMax, bool simplifiedMd, int Nref){

     double maxShift2 = maxShift*maxShift;
     Matrix2D<double> bestM(3,3);
     MultidimArray<float> out2(3,3);
     Matrix2D<double>out2Matrix(3,3);
     MetaDataVec mdOut;
     String nameImg, nameRef;
     bool flip;
     double rot, tilt, psi;
     int idxJ;
     size_t refNum;

     auto iterExp = SFexp.begin();

     for(int i=0; i<mdExpSize; i++){
         auto iter = SF.begin();

         for(int j=0; j<2*mdInSize; j++){
             if(j%mdInSize==0)
                 iter = SF.begin();

             if(DIRECT_A2D_ELEM(weights,i,j)!=0){

                 /*/AJ new to store the maximum weight for every exp image
                 if(simplifiedMd && Nref>1){
                     if(DIRECT_A2D_ELEM(weights,i,j)!=DIRECT_A1D_ELEM(weightsMax,i)){
                         if(iter->hasNext())
                             iter->moveNext();
                         continue;
                     }
                 }
                 //END AJ*/

                 size_t itemId;
                 //*iterExp.getValue(MDL_IMAGE, nameImg);
                 //*iterExp.getValue(MDL_ITEM_ID, itemId);
                 //*iterOut
                 //*iterExp.setValue(MDL_ITEM_ID, itemId);
                 //*iterExp.setValue(MDL_IMAGE,nameImg);
                 (*iterExp).setValue(MDL_WEIGHT, (double)DIRECT_A2D_ELEM(weights, i, j));
                 (*iterExp).setValue(MDL_MAXCC, (double)DIRECT_A2D_ELEM(corrTotalRow, i, j));
                 if(j<mdInSize){
                     flip = false;
                     matrixTransCpu[j].getSlice(i, out2); //matrixTransCpu[i].getSlice(j, out2);
                     idxJ = j;
                 }else{
                     flip = true;
                     matrixTransCpu_mirror[j-mdInSize].getSlice(i, out2); //matrixTransCpu_mirror[i].getSlice(j-mdInSize, out2);
                     idxJ = j-mdInSize;
                 }

                 //AJ NEW
                 MAT_ELEM(bestM,0,0) = DIRECT_A2D_ELEM(out2,0,0);
                 MAT_ELEM(bestM,0,1)=DIRECT_A2D_ELEM(out2,0,1);
                 MAT_ELEM(bestM,0,2)=DIRECT_A2D_ELEM(out2,0,2);

                 MAT_ELEM(bestM,1,0)=DIRECT_A2D_ELEM(out2,1,0);
                 MAT_ELEM(bestM,1,1)=DIRECT_A2D_ELEM(out2,1,1);
                 MAT_ELEM(bestM,1,2)=DIRECT_A2D_ELEM(out2,1,2);

                 MAT_ELEM(bestM,2,0)=0.0;
                 MAT_ELEM(bestM,2,1)=0.0;
                 MAT_ELEM(bestM,2,2)=1.0;
                 bestM = bestM.inv();
                 //FIN AJ NEW

                 double shiftX = MAT_ELEM(bestM,0,2);//(double)DIRECT_A2D_ELEM(out2,0,2);
                 double shiftY = MAT_ELEM(bestM,1,2);//(double)DIRECT_A2D_ELEM(out2,1,2);
                 if (shiftX*shiftX + shiftY*shiftY > maxShift2){
                     if(iter != SF.end())
                         ++iter;
                     continue;
                 }

                 (*iterExp).setValue(MDL_FLIP, flip);

                 double scale;
                 /*MAT_ELEM(bestM,0,0)=MAT_ELEM(out2Matrix,0,0);//DIRECT_A2D_ELEM(out2,0,0);
                 MAT_ELEM(bestM,0,1)=MAT_ELEM(out2Matrix,0,1);//DIRECT_A2D_ELEM(out2,0,1);
                 MAT_ELEM(bestM,0,2)=MAT_ELEM(out2Matrix,0,2);//DIRECT_A2D_ELEM(out2,0,2);
                 MAT_ELEM(bestM,1,0)=MAT_ELEM(out2Matrix,1,0);//DIRECT_A2D_ELEM(out2,1,0);
                 MAT_ELEM(bestM,1,1)=MAT_ELEM(out2Matrix,1,1);//DIRECT_A2D_ELEM(out2,1,1);
                 MAT_ELEM(bestM,1,2)=MAT_ELEM(out2Matrix,1,2);//DIRECT_A2D_ELEM(out2,1,2);
                 */

                 MAT_ELEM(bestM,2,0)=0.0;
                 MAT_ELEM(bestM,2,1)=0.0;
                 MAT_ELEM(bestM,2,2)=1.0;
                 if(flip){
                     MAT_ELEM(bestM,0,0)*=-1; //bestM
                     MAT_ELEM(bestM,1,0)*=-1; //bestM
                 }
                 bestM=bestM.inv(); //bestM

                 transformationMatrix2Parameters2D(bestM,flip,scale,shiftX,shiftY,psi); //bestM
                 if (flip)
                     shiftX*=-1;

                 //AJ NEW
                 if(flip){
                     shiftX*=-1;
                     //shiftY*=-1;
                     psi*=-1;
                 }
                 //FIN AJ NEW

                 (*iterExp).setValue(MDL_SHIFT_X, -shiftX);
                 (*iterExp).setValue(MDL_SHIFT_Y, -shiftY);
                 //(*iterExp).setValue(MDL_SHIFT_Z, 0.0);
                 (*iter).getValue(MDL_ANGLE_ROT, rot);
                 (*iterExp).setValue(MDL_ANGLE_ROT, rot);
                 (*iter).getValue(MDL_ANGLE_TILT, tilt);
                 (*iterExp).setValue(MDL_ANGLE_TILT, tilt);
                 (*iterExp).setValue(MDL_ANGLE_PSI, psi);
                 if((*iter).containsLabel(MDL_ITEM_ID))
                     (*iter).getValue(MDL_ITEM_ID, refNum);
                 else
                     refNum = idxJ+1;
                 (*iterExp).setValue(MDL_REF, (int)refNum);
                 mdOut.addRow(dynamic_cast<MDRowVec&>(*iterExp));
             }
             if(iter != SF.end())
                 ++iter;
         }
         if(iterExp != SFexp.end())
             ++iterExp;
     }
     String fnFinal=formatString("%s/%s",fnDir.c_str(),fn_out.c_str());
     mdOut.write(fnFinal);
 }


 void generate_output_classes(MetaDataVec SF, MetaDataVec SFexp, FileName fnDir, size_t mdExpSize, size_t mdInSize,
         MultidimArray<float> &weights, MultidimArray<float> *matrixTransCpu, MultidimArray<float> *matrixTransCpu_mirror,
         int maxShift, FileName fn_classes_out, MultidimArray<float> &weightsMax, bool simplifiedMd, int Nref){

     double maxShift2 = maxShift*maxShift;
     MultidimArray<float> out2(3,3);
     Matrix2D<double> out2Matrix(3,3);
     double rot, tilt, psi;
     int *NexpVector;

     size_t xAux, yAux, zAux, nAux;
     getImageSize(SF,xAux,yAux,zAux,nAux);
     FileName fnImgNew, fnExpNew, fnRoot, fnStackOut, fnOut, fnStackMD, fnClass;
     Image<double> Inew, Iexp_aux, Inew2, Iexp_out;
     Matrix2D<double> E(3,3);
     MultidimArray<float> auxtr(3,3);
     Matrix2D<double> auxtrMatrix(3,3);
     MultidimArray<double> refSum(1, 1, yAux, xAux);
     bool firstTime=true;
     size_t refNum;
     MultidimArray<double> zeros(1, 1, yAux, xAux);

     // Generate mask
     Mask mask;
     mask.type = BINARY_CIRCULAR_MASK;
     mask.mode = INNER_MASK;
     auto rad = (size_t)std::min(xAux*0.5, yAux*0.5);
     mask.R1 = rad;
     mask.resize(yAux,xAux);
     mask.get_binary_mask().setXmippOrigin();
     mask.generate_mask();

     CorrelationAux auxCenter;
     RotationalCorrelationAux auxCenter2;

     auto iterSF = SF.begin();

     bool read = false;
     int countingClasses=1;
     bool skip_image;
     NexpVector = new int[mdInSize];
     for(int i=0; i<mdInSize; i++){
         NexpVector[i]=0;
         bool change=false;
         double normWeight=0;

         MDRow& rowSF = *iterSF;
         if(rowSF.containsLabel(MDL_ITEM_ID))
             rowSF.getValue(MDL_ITEM_ID, refNum);
         else
             refNum=countingClasses;

         auto iterSFexp = SFexp.begin();

         refSum.initZeros();

         fnRoot=fn_classes_out.withoutExtension();
         fnStackOut=formatString("%s/%s.stk",fnDir.c_str(),fnRoot.c_str());
         if(fnStackOut.exists() && firstTime)
             fnStackOut.deleteFile();

         firstTime=false;
         for(int j=0; j<mdExpSize; j++){

             read = false;
             skip_image=false;

             long int pointer1=i*xAux*yAux;
             long int pointer2=i*xAux*yAux;

             if(DIRECT_A2D_ELEM(weights,j,i)!=0){

                 /*/AJ new to store the maximum weight for every exp image
                 if(simplifiedMd && Nref>1){
                     if(DIRECT_A2D_ELEM(weights,j,i)!=DIRECT_A1D_ELEM(weightsMax,j))
                         skip_image=true;
                 }
                 //END AJ/*/

                 if(!skip_image){
                     matrixTransCpu[i].getSlice(j, auxtr); //matrixTransCpu[j].getSlice(i, auxtr);
                     //AJ NEW
                     MAT_ELEM(E,0,0)=DIRECT_A2D_ELEM(auxtr,0,0);
                     MAT_ELEM(E,0,1)=DIRECT_A2D_ELEM(auxtr,0,1);
                     MAT_ELEM(E,0,2)=DIRECT_A2D_ELEM(auxtr,0,2);

                     MAT_ELEM(E,1,0)=DIRECT_A2D_ELEM(auxtr,1,0);
                     MAT_ELEM(E,1,1)=DIRECT_A2D_ELEM(auxtr,1,1);
                     MAT_ELEM(E,1,2)=DIRECT_A2D_ELEM(auxtr,1,2);

                     MAT_ELEM(E,2,0)=0.0;
                     MAT_ELEM(E,2,1)=0.0;
                     MAT_ELEM(E,2,2)=1.0;
                     E = E.inv();
                     //FIN AJ NEW

                     double shiftX = MAT_ELEM(E,0,2);//(double)DIRECT_A2D_ELEM(auxtr,0,2);
                     double shiftY = MAT_ELEM(E,1,2);//(double)DIRECT_A2D_ELEM(auxtr,1,2);
                     if (shiftX*shiftX + shiftY*shiftY > maxShift2)
                         skip_image=true;
                 }

                 if(!skip_image){

                     if(!read){
                         (*iterSFexp).getValue(MDL_IMAGE, fnExpNew);
                         Iexp_aux.read(fnExpNew);
                         read = true;
                     }

                     NexpVector[i]++;

                     /*MAT_ELEM(E,0,0)=MAT_ELEM(auxtrMatrix,0,0);//DIRECT_A2D_ELEM(auxtr,0,0);
                     MAT_ELEM(E,0,1)=MAT_ELEM(auxtrMatrix,0,1);//DIRECT_A2D_ELEM(auxtr,0,1);
                     MAT_ELEM(E,0,2)=MAT_ELEM(auxtrMatrix,0,2);//DIRECT_A2D_ELEM(auxtr,0,2);
                     MAT_ELEM(E,1,0)=MAT_ELEM(auxtrMatrix,1,0);//DIRECT_A2D_ELEM(auxtr,1,0);
                     MAT_ELEM(E,1,1)=MAT_ELEM(auxtrMatrix,1,1);//DIRECT_A2D_ELEM(auxtr,1,1);
                     MAT_ELEM(E,1,2)=MAT_ELEM(auxtrMatrix,1,2);//DIRECT_A2D_ELEM(auxtr,1,2);
                     */

                     MAT_ELEM(E,2,0)=0.0;
                     MAT_ELEM(E,2,1)=0.0;
                     MAT_ELEM(E,2,2)=1.0;

                     selfApplyGeometry(xmipp_transformation::LINEAR,Iexp_aux(),E,xmipp_transformation::IS_NOT_INV,xmipp_transformation::DONT_WRAP,0.0); //E
                     //applyGeometry(LINEAR,Iexp_out(),Iexp_aux(),auxtrMatrix,IS_NOT_INV,DONT_WRAP,0.0);

                     Iexp_aux().resetOrigin();

                     refSum += Iexp_aux()*DIRECT_A2D_ELEM(weights,j,i);
                     change=true;
                     normWeight+=DIRECT_A2D_ELEM(weights,j,i);
                 }
             }
             skip_image=false;
             if(DIRECT_A2D_ELEM(weights,j,i+mdInSize)!=0){

                 /*/AJ new to store the maximum weight for every exp image
                 if(simplifiedMd && Nref>1){
                     if(DIRECT_A2D_ELEM(weights,j,i+mdInSize)!=DIRECT_A1D_ELEM(weightsMax,j))
                         skip_image=true;
                 }
                 //END AJ/*/

                 if(!skip_image){
                     matrixTransCpu_mirror[i].getSlice(j, auxtr); //matrixTransCpu_mirror[j].getSlice(i, auxtr);
                     //AJ NEW
                     MAT_ELEM(E,0,0)=DIRECT_A2D_ELEM(auxtr,0,0);
                     MAT_ELEM(E,0,1)=DIRECT_A2D_ELEM(auxtr,0,1);
                     MAT_ELEM(E,0,2)=DIRECT_A2D_ELEM(auxtr,0,2);

                     MAT_ELEM(E,1,0)=DIRECT_A2D_ELEM(auxtr,1,0);
                     MAT_ELEM(E,1,1)=DIRECT_A2D_ELEM(auxtr,1,1);
                     MAT_ELEM(E,1,2)=DIRECT_A2D_ELEM(auxtr,1,2);

                     MAT_ELEM(E,2,0)=0.0;
                     MAT_ELEM(E,2,1)=0.0;
                     MAT_ELEM(E,2,2)=1.0;
                     E = E.inv();
                     //FIN AJ NEW

                     double shiftX = MAT_ELEM(E,0,2);//(double)DIRECT_A2D_ELEM(auxtr,0,2);
                     double shiftY = MAT_ELEM(E,1,2);//(double)DIRECT_A2D_ELEM(auxtr,1,2);
                     if (shiftX*shiftX + shiftY*shiftY > maxShift2)
                         skip_image=true;
                 }

                 if(!skip_image){

                     if(!read){
                         (*iterSFexp).getValue(MDL_IMAGE, fnExpNew);
                         Iexp_aux.read(fnExpNew);
                         read = true;
                     }

                     NexpVector[i]++;
                     Iexp_aux().selfReverseX();

                     /*MAT_ELEM(E,0,0)=MAT_ELEM(auxtrMatrix,0,0);//DIRECT_A2D_ELEM(auxtr,0,0);
                     MAT_ELEM(E,0,1)=MAT_ELEM(auxtrMatrix,0,1);//DIRECT_A2D_ELEM(auxtr,0,1);
                     MAT_ELEM(E,0,2)=MAT_ELEM(auxtrMatrix,0,2);//DIRECT_A2D_ELEM(auxtr,0,2);
                     MAT_ELEM(E,1,0)=MAT_ELEM(auxtrMatrix,1,0);//DIRECT_A2D_ELEM(auxtr,1,0);
                     MAT_ELEM(E,1,1)=MAT_ELEM(auxtrMatrix,1,1);//DIRECT_A2D_ELEM(auxtr,1,1);
                     MAT_ELEM(E,1,2)=MAT_ELEM(auxtrMatrix,1,2);//DIRECT_A2D_ELEM(auxtr,1,2);
                     */

                     MAT_ELEM(E,2,0)=0.0;
                     MAT_ELEM(E,2,1)=0.0;
                     MAT_ELEM(E,2,2)=1.0;

                     //AJ NEW
                     MAT_ELEM(E,0,2)*=-1; //E
                     MAT_ELEM(E,0,1)*=-1; //E
                     MAT_ELEM(E,1,0)*=-1; //E
                     //FIN AJ NEW//

                     selfApplyGeometry(xmipp_transformation::LINEAR,Iexp_aux(),E,xmipp_transformation::IS_NOT_INV,xmipp_transformation::DONT_WRAP,0.0); //E

                     Iexp_aux().resetOrigin();

                     refSum += Iexp_aux()*DIRECT_A2D_ELEM(weights,j,i+mdInSize);
                     change=true;
                     normWeight+=DIRECT_A2D_ELEM(weights,j,i+mdInSize);
                 }
             }
             if(iterSFexp != SFexp.end())
                 ++iterSFexp;
         }

         FileName fnStackNo;
         fnStackNo.compose(countingClasses, fnStackOut);
         if(change){
             refSum/=normWeight;
             Inew()=refSum;
             centerImage(Inew(), auxCenter, auxCenter2);
             //masking to avoid wrapping in the edges of the image
             mask.apply_mask(Inew(), Inew2());
             Inew2().resetOrigin();
             Inew2.write(fnStackNo,i,true,WRITE_APPEND);
         }else{
             Inew2() = zeros;
             Inew2.write(fnStackNo,i,true,WRITE_APPEND);
         }

         if(iterSF != SF.end())
             ++iterSF;

         countingClasses++;
     }


     iterSF = SF.begin();

     countingClasses=1;
     Matrix2D<double> bestM(3,3);
     MetaDataVec SFout;
     firstTime=true;
     skip_image=false;
     for(int i=0; i<mdInSize; i++){

         MDRow& rowSF = *iterSF;
         if(rowSF.containsLabel(MDL_ITEM_ID))
             rowSF.getValue(MDL_ITEM_ID, refNum);
         else
             refNum = countingClasses;

         fnRoot=fn_classes_out.withoutExtension();
         fnStackMD=formatString("%s/%s.xmd", fnDir.c_str(), fnRoot.c_str());
         fnClass.compose(countingClasses, fnStackOut);

         if(fnStackMD.exists() && firstTime)
             fnStackMD.deleteFile();

         firstTime=false;
         size_t id = SFout.addObject();
         SFout.setValue(MDL_REF, (int)refNum, id);
         SFout.setValue(MDL_IMAGE, fnClass, id);
         SFout.setValue(MDL_CLASS_COUNT,(size_t)NexpVector[i], id);

         if(iterSF != SF.end())
             ++iterSF;

         countingClasses++;
     }
     SFout.write("classes@"+fnStackMD, MD_APPEND);

     iterSF = SF.begin();
     FileName fnExpIm;
     for(int i=0; i<mdInSize; i++){
         skip_image=false;
         MDRow& rowSF = *iterSF;
         if (rowSF.containsLabel(MDL_ITEM_ID))
             rowSF.getValue(MDL_ITEM_ID, refNum);
         else
             refNum=i+1;

         auto iterSFexp = SFexp.begin();
         MetaDataVec SFq;
         MDRowVec rowSFexp;

         for(int j=0; j<mdExpSize; j++){
             read = false;
             skip_image=false;
             //SFexp.getRow(rowSFexp, iterSFexp->objId);
             //rowSFexp.getValue(MDL_IMAGE, fnExpIm);

             if(DIRECT_A2D_ELEM(weights,j,i)!=0){

                 /*/AJ new to store the maximum weight for every exp image
                 if(simplifiedMd && Nref>1){
                     if(DIRECT_A2D_ELEM(weights,j,i)!=DIRECT_A1D_ELEM(weightsMax,j))
                         skip_image=true;
                 }
                 //END AJ/*/

                 if(!skip_image){
                     matrixTransCpu[i].getSlice(j, out2); //matrixTransCpu[j].getSlice(i, out2);
                     //AJ NEW
                     MAT_ELEM(bestM,0,0)=DIRECT_A2D_ELEM(out2,0,0);
                     MAT_ELEM(bestM,0,1)=DIRECT_A2D_ELEM(out2,0,1);
                     MAT_ELEM(bestM,0,2)=DIRECT_A2D_ELEM(out2,0,2);

                     MAT_ELEM(bestM,1,0)=DIRECT_A2D_ELEM(out2,1,0);
                     MAT_ELEM(bestM,1,1)=DIRECT_A2D_ELEM(out2,1,1);
                     MAT_ELEM(bestM,1,2)=DIRECT_A2D_ELEM(out2,1,2);

                     MAT_ELEM(bestM,2,0)=0.0;
                     MAT_ELEM(bestM,2,1)=0.0;
                     MAT_ELEM(bestM,2,2)=1.0;
                     bestM = bestM.inv();
                     //FIN AJ NEW

                     double sx = MAT_ELEM(bestM,0,2); //(double)DIRECT_A2D_ELEM(out2,0,2);
                     double sy = MAT_ELEM(bestM,1,2); //(double)DIRECT_A2D_ELEM(out2,1,2);
                     if (sx*sx + sy*sy > maxShift2)
                         skip_image=true;
                 }

                 if(!skip_image){

                     size_t itemId;
                     if(!read){
                         rowSFexp = dynamic_cast<MDRowVec&>(*iterSFexp);
                         //rowSFexp.getValue(MDL_IMAGE, fnExpIm);
                         //rowSFexp.getValue(MDL_ITEM_ID, itemId);
                         read = true;
                     }
                     //row
                     //row.setValue(MDL_ITEM_ID, itemId);
                     //row.setValue(MDL_IMAGE, fnExpIm);
                     rowSFexp.setValue(MDL_WEIGHT, (double)DIRECT_A2D_ELEM(weights, j, i));
                     rowSFexp.setValue(MDL_FLIP, false);

                     double scale, shiftX, shiftY, psi;
                     bool flip;
                     /*MAT_ELEM(bestM,0,0)=MAT_ELEM(out2Matrix,0,0);//DIRECT_A2D_ELEM(out2,0,0);
                     MAT_ELEM(bestM,0,1)=MAT_ELEM(out2Matrix,0,1);//DIRECT_A2D_ELEM(out2,0,1);
                     MAT_ELEM(bestM,0,2)=MAT_ELEM(out2Matrix,0,2);//DIRECT_A2D_ELEM(out2,0,2);
                     MAT_ELEM(bestM,1,0)=MAT_ELEM(out2Matrix,1,0);//DIRECT_A2D_ELEM(out2,1,0);
                     MAT_ELEM(bestM,1,1)=MAT_ELEM(out2Matrix,1,1);//DIRECT_A2D_ELEM(out2,1,1);
                     MAT_ELEM(bestM,1,2)=MAT_ELEM(out2Matrix,1,2);//DIRECT_A2D_ELEM(out2,1,2);
                     */

                     MAT_ELEM(bestM,2,0)=0.0;
                     MAT_ELEM(bestM,2,1)=0.0;
                     MAT_ELEM(bestM,2,2)=1.0;
                     bestM=bestM.inv(); //bestM

                     transformationMatrix2Parameters2D(bestM,flip,scale,shiftX,shiftY,psi); //bestM

                     //row
                     rowSFexp.setValue(MDL_SHIFT_X, -shiftX);
                     rowSFexp.setValue(MDL_SHIFT_Y, -shiftY);
                     //rowSFexp.setValue(MDL_SHIFT_Z, 0.0);
                     rowSF.getValue(MDL_ANGLE_ROT, rot);
                     rowSFexp.setValue(MDL_ANGLE_ROT, rot);
                     rowSF.getValue(MDL_ANGLE_TILT, tilt);
                     rowSFexp.setValue(MDL_ANGLE_TILT, tilt);
                     rowSFexp.setValue(MDL_ANGLE_PSI, psi);
                     rowSFexp.setValue(MDL_REF,(int)refNum);
                     SFq.addRow(rowSFexp);
                 }
             }

             skip_image=false;
             if(DIRECT_A2D_ELEM(weights,j,i+mdInSize)!=0){

                 /*/AJ new to store the maximum weight for every exp image
                 if(simplifiedMd && Nref>1){
                     if(DIRECT_A2D_ELEM(weights,j,i+mdInSize)!=DIRECT_A1D_ELEM(weightsMax,j))
                         skip_image=true;
                 }
                 //END AJ/*/

                 if(!skip_image){
                     matrixTransCpu_mirror[i].getSlice(j, out2); //matrixTransCpu_mirror[j].getSlice(i, out2);
                     //AJ NEW
                     MAT_ELEM(bestM,0,0)=DIRECT_A2D_ELEM(out2,0,0);
                     MAT_ELEM(bestM,0,1)=DIRECT_A2D_ELEM(out2,0,1);
                     MAT_ELEM(bestM,0,2)=DIRECT_A2D_ELEM(out2,0,2);

                     MAT_ELEM(bestM,1,0)=DIRECT_A2D_ELEM(out2,1,0);
                     MAT_ELEM(bestM,1,1)=DIRECT_A2D_ELEM(out2,1,1);
                     MAT_ELEM(bestM,1,2)=DIRECT_A2D_ELEM(out2,1,2);

                     MAT_ELEM(bestM,2,0)=0.0;
                     MAT_ELEM(bestM,2,1)=0.0;
                     MAT_ELEM(bestM,2,2)=1.0;
                     bestM = bestM.inv();
                     //FIN AJ NEW

                     double sx = MAT_ELEM(bestM,0,2); //(double)DIRECT_A2D_ELEM(out2,0,2);
                     double sy = MAT_ELEM(bestM,1,2); //(double)DIRECT_A2D_ELEM(out2,1,2);
                     if (sx*sx + sy*sy > maxShift2)
                         skip_image=true;
                 }

                 if(!skip_image){

                     size_t itemId;
                     if(!read){
                         rowSFexp = dynamic_cast<MDRowVec&>(*iterSFexp);
                         //rowSFexp.getValue(MDL_IMAGE, fnExpIm);
                         //rowSFexp.getValue(MDL_ITEM_ID, itemId);
                         read = true;
                     }
                     //row
                     //row.setValue(MDL_ITEM_ID, itemId);
                     //row.setValue(MDL_IMAGE, fnExpIm);
                     rowSFexp.setValue(MDL_WEIGHT, (double)DIRECT_A2D_ELEM(weights, j, i+mdInSize));
                     rowSFexp.setValue(MDL_FLIP, true);

                     double scale, shiftX, shiftY, psi;
                     bool flip;
                     /*MAT_ELEM(bestM,0,0)=MAT_ELEM(out2Matrix,0,0);//DIRECT_A2D_ELEM(out2,0,0);
                     MAT_ELEM(bestM,0,1)=MAT_ELEM(out2Matrix,0,1);//DIRECT_A2D_ELEM(out2,0,1);
                     MAT_ELEM(bestM,0,2)=MAT_ELEM(out2Matrix,0,2);//DIRECT_A2D_ELEM(out2,0,2);
                     MAT_ELEM(bestM,1,0)=MAT_ELEM(out2Matrix,1,0);//DIRECT_A2D_ELEM(out2,1,0);
                     MAT_ELEM(bestM,1,1)=MAT_ELEM(out2Matrix,1,1);//DIRECT_A2D_ELEM(out2,1,1);
                     MAT_ELEM(bestM,1,2)=MAT_ELEM(out2Matrix,1,2);//DIRECT_A2D_ELEM(out2,1,2);
                     */

                     MAT_ELEM(bestM,2,0)=0.0;
                     MAT_ELEM(bestM,2,1)=0.0;
                     MAT_ELEM(bestM,2,2)=1.0;

                     MAT_ELEM(bestM,0,0)*=-1; //bestM
                     MAT_ELEM(bestM,1,0)*=-1; //bestM
                     bestM=bestM.inv(); //bestM

                     transformationMatrix2Parameters2D(bestM,flip,scale,shiftX,shiftY,psi); //bestM

                     //AJ NEW
                     shiftX*=-1;
                     psi*=-1;
                     //FIN AJ NEW

                     shiftX*=-1;
                     //row
                     rowSFexp.setValue(MDL_SHIFT_X, -shiftX);
                     rowSFexp.setValue(MDL_SHIFT_Y, -shiftY);
                     //rowSFexp.setValue(MDL_SHIFT_Z, 0.0);
                     rowSF.getValue(MDL_ANGLE_ROT, rot);
                     rowSFexp.setValue(MDL_ANGLE_ROT, rot);
                     rowSF.getValue(MDL_ANGLE_TILT, tilt);
                     rowSFexp.setValue(MDL_ANGLE_TILT, tilt);
                     rowSFexp.setValue(MDL_ANGLE_PSI, psi);
                     rowSFexp.setValue(MDL_REF,(int)refNum);
                     SFq.addRow(rowSFexp);
                 }
             }
             if(iterSFexp != SFexp.end())
                 ++iterSFexp;
         }
         MetaDataVec SFq_sorted;
         SFq_sorted.sort(SFq, MDL_IMAGE);
         SFq_sorted.write(formatString("class%06d_images@%s",refNum,fnStackMD.c_str()),MD_APPEND);

         if(iterSF != SF.end())
             ++iterSF;
     }

     delete []NexpVector;
 }

 // Compute correlation --------------------------------------------------------
 void ProgGpuCorrelation::run()
 {

     //Setting the cuda device to use
     gpu.set();

     //PROJECTION IMAGES
     size_t Xdim, Ydim, Zdim, Ndim;
     SF.read(fn_ref,NULL);
     size_t mdInSize = SF.size();
     getImageSize(SF, Xdim, Ydim, Zdim, Ndim);


     //EXPERIMENTAL IMAGES
     SFexp.read(fn_exp,NULL);
     size_t mdExpSize = SFexp.size();

     // Generate mask
     Mask mask;
     mask.type = BINARY_CIRCULAR_MASK;
     mask.mode = INNER_MASK;
     auto rad = (size_t)std::min(Xdim*0.48, Ydim*0.48);

     int number = rad;
     auto *out = new int[5];

     while(true){
         if (number%2!=0){
             number--;
             continue;
         }
         for (int z=0; z<5; z++)
             out[z]=0;
         primeFactors(number, out);
         if ((out[0]!=0 || out[1]!=0 || out[2]!=0 || out[3]!=0) && out[4]==0){
             rad = number;
             break;
         }
         else
             number--;
     }

     mask.R1 = rad;
     mask.resize(Ydim,Xdim);
     mask.get_binary_mask().setXmippOrigin();
     mask.generate_mask();
     int maskCount = mask.get_binary_mask().sum();

     //AJ check the size of the data to avoid exceed the GPU memory
     float memory[3]={0, 0, 0}; //total, free, used
     cuda_check_gpu_memory(memory);

     int maxGridSize[3];
     cuda_check_gpu_properties(maxGridSize);


     //AJ check_gpu_memory to know how many images we can copy in the gpu memory
     float limit=0.4; //0.877; 1.3;
     int available_images_proj = mdExpSize; //mdInSize
     int available1 = mdExpSize;
     int available2 = mdExpSize;
     if(Xdim*Ydim*mdExpSize*4*100/memory[1]>limit){ //mdInSize
         available1 = floor(memory[1]*(limit/100)/(Xdim*Ydim*4));
     }
     if(Xdim*2*Ydim*2*mdExpSize>maxGridSize[0]){ //mdInSize
         available2 = floor((round(maxGridSize[0]*0.9))/(Xdim*Ydim*2*2));
     }
     if (available1<available2)
         available_images_proj = available1;
     else
         available_images_proj = available2;


     //matrix with all the best transformations in CPU
     auto *matrixTransCpu = new MultidimArray<float> [mdInSize]; //mdExpSize
     for(int i=0; i<mdInSize; i++) //mdExpSize
         matrixTransCpu[i].coreAllocate(1, mdExpSize, 3, 3); //mdInSize
     auto *matrixTransCpu_mirror = new MultidimArray<float> [mdInSize]; //mdExpSize
     for(int i=0; i<mdInSize; i++) //mdExpSize
         matrixTransCpu_mirror[i].coreAllocate(1, mdExpSize, 3, 3); //mdInSize

     //correlation matrix
     MultidimArray<float> matrixCorrCpu(1, 1, mdInSize, mdExpSize); //mdExpSize, mdInSize
     MultidimArray<float> matrixCorrCpu_mirror(1, 1, mdInSize, mdExpSize); //mdExpSize, mdInSize

     //Aux vectors with maximum values of correlation in RT and TR steps
     float *max_vector_rt;
     float *max_vector_tr;
     float *max_vector_rt_mirror;
     float *max_vector_tr_mirror;

     //Transformation matrix in GPU and CPU
     TransformMatrix<float> transMat_tr;
     TransformMatrix<float> transMat_rt;
     TransformMatrix<float> transMat_tr_mirror;
     TransformMatrix<float> transMat_rt_mirror;

     TransformMatrix<float> resultTR;
     TransformMatrix<float> resultRT;

     int firstIdx=0;
     bool finish=false;

     mycufftHandle myhandlePadded_tr, myhandleMask_tr, myhandlePolar_tr, myhandleAux_tr, myhandlePaddedB_tr, myhandleMaskB_tr, myhandlePolarB_tr, myhandleAuxB_tr;
     mycufftHandle myhandlePadded_rt, myhandleMask_rt, myhandlePolar_rt, myhandleAux_rt, myhandlePaddedB_rt, myhandleMaskB_rt, myhandlePolarB_rt, myhandleAuxB_rt;
     mycufftHandle ifftcb;

     myStreamHandle myStreamTR, myStreamRT;
     myStreamCreate(myStreamTR);
     myStreamCreate(myStreamRT);


     GpuCorrelationAux d_referenceAux;

     size_t pad_Xdim=2*Xdim-1;
     size_t pad_Ydim=2*Ydim-1;

     number = pad_Xdim;
     while(true){
         if (number%2!=0){
             number++;
             continue;
         }
         for (int z=0; z<5; z++)
             out[z]=0;
         primeFactors(number, out);
         if ((out[0]!=0 || out[1]!=0 || out[2]!=0 || out[3]!=0) && out[4]==0){
             pad_Xdim = number;
             break;
         }
         else
             number++;
     }

     pad_Ydim = pad_Xdim;
     d_referenceAux.XdimOrig=Xdim;
     d_referenceAux.YdimOrig=Ydim;
     d_referenceAux.Xdim=pad_Xdim;
     d_referenceAux.Ydim=pad_Ydim;
     d_referenceAux.XdimPolar=360;
     d_referenceAux.YdimPolar=(size_t)mask.R1;


     StructuresAux myStructureAux_tr, myStructureAux_rt;

     auto iter = SFexp.ids().begin();

     GpuMultidimArrayAtCpu<float> original_image_stack;

     //Loop over the reference images
     size_t totalWork=mdInSize*mdExpSize;
     size_t workDone=0;
     init_progress_bar(totalWork);
     size_t lastProgressShown=0;
     while(!finish){

         original_image_stack.resize(Xdim,Ydim,1,available_images_proj);

         //Aux vectors with maximum values of correlation in RT and TR steps
         cpuMalloc((void**)&max_vector_tr, sizeof(float)*available_images_proj);
         cpuMalloc((void**)&max_vector_rt, sizeof(float)*available_images_proj);
         cpuMalloc((void**)&max_vector_tr_mirror, sizeof(float)*available_images_proj);
         cpuMalloc((void**)&max_vector_rt_mirror, sizeof(float)*available_images_proj);


         //Transformation matrix in GPU and CPU
         transMat_tr.resize(myStreamTR, available_images_proj);
         transMat_rt.resize(myStreamRT, available_images_proj);
         transMat_tr_mirror.resize(myStreamTR, available_images_proj);
         transMat_rt_mirror.resize(myStreamRT, available_images_proj);

         resultTR.resize(myStreamTR, available_images_proj);
         resultRT.resize(myStreamRT, available_images_proj);

         //TODO allocate memory with care
         myStructureAux_tr.padded_image_gpu.resize(pad_Xdim, pad_Ydim, 1, available_images_proj);
         myStructureAux_tr.padded_image2_gpu.resize(pad_Xdim, pad_Ydim, 1, available_images_proj);
         myStructureAux_tr.padded_mask_gpu.resize(pad_Xdim, pad_Ydim, 1, 1);
         myStructureAux_tr.polar_gpu.resize(d_referenceAux.XdimPolar,d_referenceAux.YdimPolar,1,available_images_proj);
         myStructureAux_tr.polar2_gpu.resize(d_referenceAux.XdimPolar,d_referenceAux.YdimPolar,1,available_images_proj);

         myStructureAux_rt.padded_image_gpu.resize(pad_Xdim, pad_Ydim, 1, available_images_proj);
         myStructureAux_rt.padded_image2_gpu.resize(pad_Xdim, pad_Ydim, 1, available_images_proj);
         myStructureAux_rt.padded_mask_gpu.resize(pad_Xdim, pad_Ydim, 1, 1);
         myStructureAux_rt.polar_gpu.resize(d_referenceAux.XdimPolar,d_referenceAux.YdimPolar,1,available_images_proj);
         myStructureAux_rt.polar2_gpu.resize(d_referenceAux.XdimPolar,d_referenceAux.YdimPolar,1,available_images_proj);

         //SF
         preprocess_images_reference(SFexp, firstIdx, available_images_proj, mask, d_referenceAux,
                 myhandlePadded_tr, myhandleMask_tr, myhandlePolar_tr,  myStructureAux_tr, iter, myStreamTR);

         d_referenceAux.maskCount=maskCount;
         d_referenceAux.produceSideInfo(myhandlePaddedB_tr, myhandleMaskB_tr, myStructureAux_tr, myStreamTR);

         //AJ calling a cudaDeviceSyncrhonize to be sure that these images are loaded in gpu memory
         // and available for all the streams
         waitGpu(myStreamTR, true);

         //EXPERIMENTAL IMAGES PART
         size_t expIndex = 0;
         FileName fnImgExp;
         auto iterExp = SF.begin();

         GpuCorrelationAux d_experimentalAuxTR, d_experimentalAuxRT;
         d_experimentalAuxTR.XdimOrig=d_referenceAux.XdimOrig;
         d_experimentalAuxTR.YdimOrig=d_referenceAux.YdimOrig;
         d_experimentalAuxTR.Xdim=d_referenceAux.Xdim;
         d_experimentalAuxTR.Ydim=d_referenceAux.Ydim;
         d_experimentalAuxTR.XdimPolar=d_referenceAux.XdimPolar;
         d_experimentalAuxTR.YdimPolar=d_referenceAux.YdimPolar;

         d_experimentalAuxRT.XdimOrig=d_referenceAux.XdimOrig;
         d_experimentalAuxRT.YdimOrig=d_referenceAux.YdimOrig;
         d_experimentalAuxRT.Xdim=d_referenceAux.Xdim;
         d_experimentalAuxRT.Ydim=d_referenceAux.Ydim;
         d_experimentalAuxRT.XdimPolar=d_referenceAux.XdimPolar;
         d_experimentalAuxRT.YdimPolar=d_referenceAux.YdimPolar;

         //TODO: here we can use threads to carry out the alignment of different images in different threads
         size_t n=0;
         int available_images_exp = mdInSize; //mdExpSize
         while(available_images_exp && (*iterExp).id()!=0){

             transMat_tr.initialize(myStreamTR);
             transMat_rt.initialize(myStreamRT);
             transMat_tr_mirror.initialize(myStreamTR);
             transMat_rt_mirror.initialize(myStreamRT);

             for(int i=0; i<available_images_proj; i++){
                 max_vector_tr[i]=-1;
                 max_vector_rt[i]=-1;
                 max_vector_tr_mirror[i]=-1;
                 max_vector_rt_mirror[i]=-1;
             }

             available_images_exp--;

             MDRow& rowExp = *iterExp;
             rowExp.getValue(MDL_IMAGE, fnImgExp);
             //std::cerr << expIndex << ". Image: " << fnImgExp << std::endl;

             //AJ calling the function to align the images
             bool mirror=false;
             //SFexp
             align_experimental_image(fnImgExp, d_referenceAux, d_experimentalAuxTR, d_experimentalAuxRT, transMat_tr, transMat_rt,
                     max_vector_tr, max_vector_rt, SF, available_images_proj, mirror, maxShift,
                     myhandlePadded_tr, myhandleMask_tr, myhandlePolar_tr, myhandlePaddedB_tr, myhandleMaskB_tr, myhandlePolarB_tr,
                     myhandlePadded_rt, myhandleMask_rt, myhandlePolar_rt, myhandlePaddedB_rt, myhandleMaskB_rt, myhandlePolarB_rt,
                     myStructureAux_tr, myStructureAux_rt, myStreamTR, myStreamRT,
                     resultTR, resultRT, original_image_stack, ifftcb);


             mirror=true;
             //SFexp
             align_experimental_image(fnImgExp, d_referenceAux, d_experimentalAuxTR, d_experimentalAuxRT, transMat_tr_mirror, transMat_rt_mirror,
                             max_vector_tr_mirror, max_vector_rt_mirror, SF, available_images_proj, mirror, maxShift,
                             myhandlePadded_tr, myhandleMask_tr, myhandlePolar_tr, myhandlePaddedB_tr, myhandleMaskB_tr, myhandlePolarB_tr,
                             myhandlePadded_rt, myhandleMask_rt, myhandlePolar_rt, myhandlePaddedB_rt, myhandleMaskB_rt, myhandlePolarB_rt,
                             myStructureAux_tr, myStructureAux_rt, myStreamTR, myStreamRT,
                             resultTR, resultRT, original_image_stack, ifftcb);

             //AJ to check the best transformation among all the evaluated
             transMat_tr.copyMatrixToCpu(myStreamTR);
             transMat_tr_mirror.copyMatrixToCpu(myStreamRT);
             transMat_rt.copyMatrixToCpu(myStreamTR);
             transMat_rt_mirror.copyMatrixToCpu(myStreamRT);

             waitGpu(myStreamTR, false);
             waitGpu(myStreamRT, false);

             MultidimArray<float> out2(3,3);
             for(int i=0; i<available_images_proj; i++){
                 if(max_vector_tr[i]>max_vector_rt[i]){
                     memcpy(MULTIDIM_ARRAY(out2), &transMat_tr.h_data[i*9], 9*sizeof(float));
                     matrixTransCpu[n].setSlice(firstIdx+i, out2);
                     A2D_ELEM(matrixCorrCpu, n, firstIdx+i) = max_vector_tr[i];
                 }else{
                     memcpy(MULTIDIM_ARRAY(out2), &transMat_rt.h_data[i*9], 9*sizeof(float));
                     matrixTransCpu[n].setSlice(firstIdx+i, out2);
                     A2D_ELEM(matrixCorrCpu, n, firstIdx+i) = max_vector_rt[i];
                 }
                 //mirror image
                 if(max_vector_tr_mirror[i]>max_vector_rt_mirror[i]){
                     memcpy(MULTIDIM_ARRAY(out2), &transMat_tr_mirror.h_data[i*9], 9*sizeof(float));
                     matrixTransCpu_mirror[n].setSlice(firstIdx+i, out2);
                     A2D_ELEM(matrixCorrCpu_mirror, n, firstIdx+i) = max_vector_tr_mirror[i];
                 }else{
                     memcpy(MULTIDIM_ARRAY(out2), &transMat_rt_mirror.h_data[i*9], 9*sizeof(float));
                     matrixTransCpu_mirror[n].setSlice(firstIdx+i, out2);
                     A2D_ELEM(matrixCorrCpu_mirror, n, firstIdx+i) = max_vector_rt_mirror[i];
                 }
             }

             if(iterExp != SF.end())
                 ++iterExp;

             n++;
             workDone+=available_images_proj;
             if (size_t(workDone/100)>lastProgressShown)
             {
                 progress_bar(workDone);
                 lastProgressShown=size_t(workDone/100);
             }
         }//end while experimental images

         firstIdx +=available_images_proj;
         int aux;
         aux=available_images_proj;
         if(firstIdx+available_images_proj > mdExpSize){ //mdInSize
             aux=available_images_proj;
             available_images_proj=mdExpSize-firstIdx; //mdInSize
         }
         if(firstIdx==mdExpSize){ //mdInSize
             finish=true;
         }
         if(aux!=available_images_proj){
             myhandlePadded_tr.clear();
             myhandleMask_tr.clear();
             myhandlePolar_tr.clear();
             myhandlePaddedB_tr.clear();
             myhandleMaskB_tr.clear();
             myhandlePolarB_tr.clear();

             myhandlePadded_rt.clear();
             myhandleMask_rt.clear();
             myhandlePolar_rt.clear();
             myhandlePaddedB_rt.clear();
             myhandleMaskB_rt.clear();
             myhandlePolarB_rt.clear();
         }


     }//End loop over the reference images while(!finish)
     progress_bar(totalWork);

     myhandlePadded_tr.clear();
     myhandleMask_tr.clear();
     myhandlePolar_tr.clear();
     myhandlePaddedB_tr.clear();
     myhandleMaskB_tr.clear();
     myhandlePolarB_tr.clear();

     myhandlePadded_rt.clear();
     myhandleMask_rt.clear();
     myhandlePolar_rt.clear();
     myhandlePaddedB_rt.clear();
     myhandleMaskB_rt.clear();
     myhandlePolarB_rt.clear();

     MultidimArray<float> weights(1,1,mdExpSize,2*mdInSize);
     MultidimArray<float> weightsMax;
     MultidimArray<float> corrTotalRow(1,1,mdExpSize, 2*mdInSize);
     int Nref;
     if(keepN){
         Nref=n_keep;
     }else if(significance){
         Nref=round(corrTotalRow.xdim*alpha);
         if(Nref==0)
             Nref=1;
     }


     calculate_weights(matrixCorrCpu, matrixCorrCpu_mirror, corrTotalRow, weights, Nref, mdExpSize, mdInSize, weightsMax, simplifiedMd,
             matrixTransCpu, matrixTransCpu_mirror, maxShift);

     std::cerr << "Creating output metadatas..." << std::endl;

     generate_metadata(SF, SFexp, fnDir, fn_out, mdExpSize, mdInSize, weights, corrTotalRow, matrixTransCpu,
             matrixTransCpu_mirror, maxShift, weightsMax, simplifiedMd, Nref);

     if(generate_out)
         generate_output_classes(SF, SFexp, fnDir, mdExpSize, mdInSize, weights, matrixTransCpu,
                 matrixTransCpu_mirror, maxShift, fn_classes_out, weightsMax, simplifiedMd, Nref);

     //Free memory in CPU
     for(int i=0; i<mdInSize; i++) //mdExpSize
         matrixTransCpu[i].coreDeallocate();
     delete []matrixTransCpu;
     for(int i=0; i<mdInSize; i++) //mdExpSize
         matrixTransCpu_mirror[i].coreDeallocate();
     delete []matrixTransCpu_mirror;

     cpuFree(max_vector_tr);
     cpuFree(max_vector_rt);
     cpuFree(max_vector_tr_mirror);
     cpuFree(max_vector_rt_mirror);


 }
selfApplyGeometry
void selfApplyGeometry(int Splinedegree, MultidimArray< std::complex< double > > &V1, const Matrix2D< double > &A, bool inv, bool wrap, std::complex< double > outside)
Definition: transformations.cpp:704

cuda_calculate_correlation
void cuda_calculate_correlation(GpuCorrelationAux &referenceAux, GpuCorrelationAux &experimentalAux, TransformMatrix< float > &transMat, float *max_vector, int maxShift, mycufftHandle &myhandlePadded, bool mirror, StructuresAux &myStructureAux, myStreamHandle &myStream, TransformMatrix< float > &resultTR, bool saveMaxVector)
Definition: cuda_gpu_correlation.cpp:1205

init_progress_bar
void init_progress_bar(long total)
Definition: xmipp_funcs.cpp:782

GpuMultidimArrayAtGpu::Ydim
size_t Ydim
Definition: cuda_xmipp_utils.h:184

MDL_ANGLE_ROT
Rotation angle of an image (double,degrees)
Definition: metadata_label.h:55

min
void min(Image< double > &op1, const Image< double > &op2)
Definition: image_operate.cpp:118

A2D_ELEM
#define A2D_ELEM(v, i, j)
Definition: multidim_array_base.h:354

GpuMultidimArrayAtGpu::resize
void resize(const GpuMultidimArrayAtGpu< T1 > &array)
Definition: cuda_xmipp_utils.h:207

StructuresAux::polar2_gpu
GpuMultidimArrayAtGpu< float > polar2_gpu
Definition: cuda_gpu_correlation.h:20

ProgGpuCorrelation::defineParams
void defineParams()
Define parameters.
Definition: xmipp_gpu_correlation.cpp:536

MetaDataVec::sort
void sort(const MetaDataVec &MDin, const MDLabel sortLabel, bool asc=true, int limit=-1, int offset=0)
Definition: metadata_vec.cpp:791

XmippProgram::getDoubleParam
double getDoubleParam(const char *param, int arg=0)
Definition: xmipp_program.cpp:341

XmippProgram::read
virtual void read(int argc, const char **argv, bool reportErrors=true)
Definition: xmipp_program.cpp:191

floor
__host__ __device__ float2 floor(const float2 v)
Definition: cuda_basic_math.h:175

MultidimArray< int >

GpuCorrelationAux::XdimOrig
size_t XdimOrig
Definition: cuda_gpu_correlation.h:43

MetaDataVec::read
void read(const FileName &inFile, const std::vector< MDLabel > *desiredLabels=nullptr, bool decomposeStack=true) override
Definition: metadata_vec.cpp:120

MetaDataVec::begin
iterator begin() override
Definition: metadata_vec.h:501

MultidimArray::getSlice
void getSlice(int k, MultidimArray< T1 > &M, char axis='Z', bool reverse=false, size_t n=0) const
Definition: multidim_array.h:921

transformationMatrix2Parameters2D
void transformationMatrix2Parameters2D(const Matrix2D< T > &A, bool &flip, T &scale, T &shiftX, T &shiftY, T &psi)
Definition: transformations.cpp:272

MetaDataVec::end
iterator end() override
Definition: metadata_vec.h:504

generate_output_classes
void generate_output_classes(MetaDataVec SF, MetaDataVec SFexp, FileName fnDir, size_t mdExpSize, size_t mdInSize, MultidimArray< float > &weights, MultidimArray< float > *matrixTransCpu, MultidimArray< float > *matrixTransCpu_mirror, int maxShift, FileName fn_classes_out, MultidimArray< float > &weightsMax, bool simplifiedMd, int Nref)
Definition: xmipp_gpu_correlation.cpp:871

WRITE_APPEND
Definition: xmipp_image_base.h:79

padding_masking
void padding_masking(GpuMultidimArrayAtGpu< float > &d_orig_image, GpuMultidimArrayAtGpu< float > &mask, GpuMultidimArrayAtGpu< float > &padded_image_gpu, GpuMultidimArrayAtGpu< float > &padded_image2_gpu, GpuMultidimArrayAtGpu< float > &padded_mask_gpu, bool experimental, myStreamHandle &myStream)
Definition: cuda_gpu_correlation.cpp:942

preprocess_images_experimental
void preprocess_images_experimental(MetaDataVec &SF, FileName &fnImg, int numImagesRef, GpuMultidimArrayAtGpu< float > &mask, GpuMultidimArrayAtGpu< std::complex< float > > &d_maskFFT, GpuCorrelationAux &d_correlationAux, bool rotation, int firstStep, bool mirror, mycufftHandle &myhandlePadded, mycufftHandle &myhandlePolar, StructuresAux &myStructureAux, myStreamHandle myStream)
Definition: xmipp_gpu_correlation.cpp:152

GpuCorrelationAux::YdimPolar
size_t YdimPolar
Definition: cuda_gpu_correlation.h:43

MultidimArray::selfReverseY
void selfReverseY()
Definition: multidim_array.h:3531

apply_transform
void apply_transform(GpuMultidimArrayAtGpu< float > &d_original_image, GpuMultidimArrayAtGpu< float > &d_transform_image, TransformMatrix< float > &transMat, myStreamHandle &myStream)
Definition: cuda_gpu_correlation.cpp:1447

GpuCorrelationAux::d_projPolarSquaredFFT
GpuMultidimArrayAtGpu< std::complex< float > > d_projPolarSquaredFFT
Definition: cuda_gpu_correlation.h:39

GpuMultidimArrayAtCpu::copyToGpu
void copyToGpu(GpuMultidimArrayAtGpu< T > &gpuArray, myStreamHandle &myStream)
Definition: xmipp_gpu_utils.h:90

GpuCorrelationAux::Ydim
size_t Ydim
Definition: cuda_gpu_correlation.h:43

MD_APPEND
Definition: metadata_writemode.h:34

Mask
Definition: mask.h:360

xmipp_funcs.h

ProgGpuCorrelation::show
void show()
Show.
Definition: xmipp_gpu_correlation.cpp:526

sqrt
void sqrt(Image< double > &op)
Definition: image_operate.cpp:210

MDL_ANGLE_TILT
Tilting angle of an image (double,degrees)
Definition: metadata_label.h:59

preprocess_images_experimental_transform
void preprocess_images_experimental_transform(GpuCorrelationAux &d_correlationAux, GpuMultidimArrayAtGpu< float > &mask, GpuMultidimArrayAtGpu< std::complex< float > > &d_maskFFT, bool rotation, mycufftHandle &myhandlePadded, mycufftHandle &myhandlePolar, StructuresAux &myStructureAux, myStreamHandle myStream)
Definition: xmipp_gpu_correlation.cpp:317

xmipp_transformation::LINEAR
Definition: transformations_defines.h:32

mask.h

MDRowVec::setValue
void setValue(const MDObject &object) override
Definition: metadata_row_vec.cpp:199

MDL_SHIFT_X
Shift for the image in the X axis (double)
Definition: metadata_label.h:431

DIRECT_A2D_ELEM
#define DIRECT_A2D_ELEM(v, i, j)
Definition: multidim_array_base.h:341

getImageSize
void getImageSize(const MetaData &md, size_t &Xdim, size_t &Ydim, size_t &Zdim, size_t &Ndim, MDLabel image_label)
Definition: metadata_extension.cpp:273

preprocess_images_reference
void preprocess_images_reference(MetaDataVec &SF, int firstIdx, int numImages, Mask &mask, GpuCorrelationAux &d_correlationAux, mycufftHandle &myhandlePadded, mycufftHandle &myhandleMask, mycufftHandle &myhandlePolar, StructuresAux &myStructureAux, MetaDataVec::id_iterator iter, myStreamHandle myStream)
Definition: xmipp_gpu_correlation.cpp:90

MULTIDIM_ARRAY
#define MULTIDIM_ARRAY(v)
Definition: multidim_array_base.h:126

Mask::resize
void resize(size_t Xdim)
Definition: mask.cpp:654

GpuMultidimArrayAtCpu::fillImage
void fillImage(int n, const MultidimArray< T > &from)
Definition: xmipp_gpu_utils.h:79

FileName::compose
void compose(const String &str, const size_t no, const String &ext="")
Definition: xmipp_filename.cpp:52

Matrix2D::inv
void inv(Matrix2D< T > &result) const
Definition: matrix2d.cpp:663

MDL_ANGLE_PSI
Special label to be used when gathering MDs in MpiMetadataPrograms.
Definition: metadata_label.h:51

MetaDataVec::write
void write(const FileName &outFile, WriteModeMetaData mode=MD_OVERWRITE) const
Definition: metadata_vec.cpp:140

calculate_weights
void calculate_weights(MultidimArray< float > &matrixCorrCpu, MultidimArray< float > &matrixCorrCpu_mirror, MultidimArray< float > &corrTotalRow, MultidimArray< float > &weights, int Nref, size_t mdExpSize, size_t mdInSize, MultidimArray< float > &weightsMax, bool simplifiedMd, MultidimArray< float > *matrixTransCpu, MultidimArray< float > *matrixTransCpu_mirror, int maxShift)
Definition: xmipp_gpu_correlation.cpp:563

preprocess_images_experimental_transform_two
void preprocess_images_experimental_transform_two(MetaDataVec &SF, FileName &fnImg, int numImagesRef, GpuMultidimArrayAtGpu< float > &mask, GpuMultidimArrayAtGpu< std::complex< float > > &d_maskFFT, GpuCorrelationAux &d_correlationAuxOne, GpuCorrelationAux &d_correlationAuxTwo, mycufftHandle &myhandlePaddedOne, mycufftHandle &myhandlePolarTwo, StructuresAux &myStructureAuxOne, StructuresAux &myStructureAuxTwo, myStreamHandle &myStreamOne, myStreamHandle &myStreamTwo, int step)
Definition: xmipp_gpu_correlation.cpp:276

MultidimArrayBase::ydim
size_t ydim
Definition: multidim_array_base.h:628

MultidimArray::getCol
void getCol(size_t j, MultidimArray< T > &v) const
Definition: multidim_array.h:1126

TransformMatrix::resize
void resize(const TransformMatrix< T1 > &array, myStreamHandle &myStream)
Definition: cuda_xmipp_utils.h:119

iter
glob_prnt iter
Definition: numerical_recipes.cpp:4698

ProgGpuCorrelation::SF
MetaDataVec SF
Definition: xmipp_gpu_correlation.h:53

MetaData::ids
virtual IdIteratorProxy< false > ids()
Definition: metadata_base.h:754

cuda_gpu_correlation.h

ProgGpuCorrelation::SFexp
MetaDataVec SFexp
Definition: xmipp_gpu_correlation.h:53

ProgGpuCorrelation::readParams
void readParams()
Read argument from command line.
Definition: xmipp_gpu_correlation.cpp:494

MultidimArray::selfReverseX
void selfReverseX()
Definition: multidim_array.h:3501

FileName
Definition: xmipp_filename.h:65

StructuresAux::padded_mask_gpu
GpuMultidimArrayAtGpu< float > padded_mask_gpu
Definition: cuda_gpu_correlation.h:18

MetaDataVec::size
size_t size() const override
Definition: metadata_vec.cpp:393

i
#define i
Definition: numerical_recipes.cpp:2493

StructuresAux::padded_image2_gpu
GpuMultidimArrayAtGpu< float > padded_image2_gpu
Definition: cuda_gpu_correlation.h:17

MetaDataVec::addRow
size_t addRow(const MDRow &row) override
Definition: metadata_vec.cpp:225

MDL_ITEM_ID
Unique identifier for items inside a list or set (std::size_t)
Definition: metadata_label.h:261

align_experimental_image
void align_experimental_image(FileName &fnImgExp, GpuCorrelationAux &d_referenceAux, GpuCorrelationAux &d_experimentalAuxTR, GpuCorrelationAux &d_experimentalAuxRT, TransformMatrix< float > &transMat_tr, TransformMatrix< float > &transMat_rt, float *max_vector_tr, float *max_vector_rt, MetaDataVec &SFexp, int available_images_proj, bool mirror, int maxShift, mycufftHandle &myhandlePadded_tr, mycufftHandle &myhandleMask_tr, mycufftHandle &myhandlePolar_tr, mycufftHandle &myhandlePaddedB_tr, mycufftHandle &myhandleMaskB_tr, mycufftHandle &myhandlePolarB_tr, mycufftHandle &myhandlePadded_rt, mycufftHandle &myhandleMask_rt, mycufftHandle &myhandlePolar_rt, mycufftHandle &myhandlePaddedB_rt, mycufftHandle &myhandleMaskB_rt, mycufftHandle &myhandlePolarB_rt, StructuresAux &myStructureAux_tr, StructuresAux &myStructureAux_rt, myStreamHandle &myStreamTR, myStreamHandle &myStreamRT, TransformMatrix< float > &resultTR, TransformMatrix< float > &resultRT, GpuMultidimArrayAtCpu< float > &original_image_stack, mycufftHandle &ifftcb)
Definition: xmipp_gpu_correlation.cpp:355

MultidimArrayBase::setXmippOrigin
void setXmippOrigin()
Definition: multidim_array_base.cpp:200

StructuresAux::polar_gpu
GpuMultidimArrayAtGpu< float > polar_gpu
Definition: cuda_gpu_correlation.h:19

centerImage
Matrix2D< double > centerImage(MultidimArray< double > &I, CorrelationAux &aux, RotationalCorrelationAux &aux2, int Niter, bool limitShift)
Definition: filters.cpp:3277

GpuCorrelationAux::maskAutocorrelation
GpuMultidimArrayAtGpu< float > maskAutocorrelation
Definition: cuda_gpu_correlation.h:41

MAT_ELEM
#define MAT_ELEM(m, i, j)
Definition: matrix2d.h:116

GpuCorrelationAux::d_projFFT
GpuMultidimArrayAtGpu< std::complex< float > > d_projFFT
Definition: cuda_gpu_correlation.h:36

MetaDataVec
Definition: metadata_vec.h:46

ProgGpuCorrelation::run
void run()
Definition: xmipp_gpu_correlation.cpp:1337

Matrix2D< double >

xmipp_image.h

MultidimArrayBase::xdim
size_t xdim
Definition: multidim_array_base.h:631

MDRowVec
Definition: metadata_row_vec.h:46

MDRow::getValue
T & getValue(MDLabel label)
Definition: metadata_row_base.h:97

GpuCorrelationAux::d_transform_image
GpuMultidimArrayAtGpu< float > d_transform_image
Definition: cuda_gpu_correlation.h:35

XmippProgram::getParam
const char * getParam(const char *param, int arg=0)
Definition: xmipp_program.cpp:321

cuda_calculate_correlation_two
void cuda_calculate_correlation_two(GpuCorrelationAux &referenceAux, GpuCorrelationAux &experimentalAuxTR, TransformMatrix< float > &transMatTR, float *max_vectorTR, int maxShift, mycufftHandle &myhandlePaddedTR, bool mirror, StructuresAux &myStructureAuxTR, myStreamHandle &myStreamTR, GpuCorrelationAux &experimentalAuxRT, TransformMatrix< float > &transMatRT, float *max_vectorRT, mycufftHandle &myhandlePaddedRT, StructuresAux &myStructureAuxRT, myStreamHandle &myStreamRT, TransformMatrix< float > &resultTR, TransformMatrix< float > &resultRT, mycufftHandle &ifftcb, bool saveMaxVector)
Definition: cuda_gpu_correlation.cpp:1288

cuda_check_gpu_memory
void cuda_check_gpu_memory(float *data)
Definition: cuda_xmipp_utils.cpp:323

transformations.h

StructuresAux
Definition: cuda_gpu_correlation.h:14

GpuCorrelationAux::d_projPolarFFT
GpuMultidimArrayAtGpu< std::complex< float > > d_projPolarFFT
Definition: cuda_gpu_correlation.h:38

MetaDataVec::setValue
bool setValue(const MDObject &mdValueIn, size_t id)
Definition: metadata_vec.cpp:282

MetaDataVec::addObject
size_t addObject() override
Definition: metadata_vec.cpp:435

TransformMatrix::copyMatrixToCpu
void copyMatrixToCpu(myStreamHandle &myStream)
Definition: cuda_xmipp_utils.h:166

fnOut
FileName fnOut
Definition: image_operate.cpp:268

GpuMultidimArrayAtCpu::resize
void resize(int _Xdim, int _Ydim=1, int _Zdim=1, int _Ndim=1)
Definition: xmipp_gpu_utils.h:55

Mask::R1
double R1
Definition: mask.h:413

MDL_FLIP
Flip the image? (bool)
Definition: metadata_label.h:236

MultidimArray::setCol
void setCol(size_t j, const MultidimArray< T > &v)
Definition: multidim_array.h:1151

GpuCorrelationAux::d_original_image
GpuMultidimArrayAtGpu< float > d_original_image
Definition: cuda_gpu_correlation.h:34

GpuCorrelationAux::maskCount
int maskCount
Definition: cuda_gpu_correlation.h:42

progress_bar
void progress_bar(long rlen)
Definition: xmipp_funcs.cpp:791

TransformMatrix
Definition: cuda_xmipp_utils.h:96

Mask::type
int type
Definition: mask.h:402

CorrelationAux
Definition: xmipp_fftw.h:551

GpuMultidimArrayAtGpu::copyToGpuStream
void copyToGpuStream(T *data, myStreamHandle &myStream)
Definition: cuda_xmipp_utils.h:245

xmipp_fftw.h

z
double z
Definition: numerical_recipes.cpp:8490

myStreamCreate
void myStreamCreate(myStreamHandle &myStream)
Definition: cuda_xmipp_utils.cpp:63

cuda_cart2polar
void cuda_cart2polar(GpuMultidimArrayAtGpu< float > &image, GpuMultidimArrayAtGpu< float > &polar_image, GpuMultidimArrayAtGpu< float > &polar2_image, bool rotate, myStreamHandle &myStream)
Definition: cuda_gpu_correlation.cpp:1478

MDL_MAXCC
Maximum cross-correlation for the image (double)
Definition: metadata_label.h:280

cpuFree
void cpuFree(void *h_data)
Definition: cuda_xmipp_utils.cpp:211

check_gpu_memory
int check_gpu_memory(size_t Xdim, size_t Ydim, int percent)
Definition: xmipp_gpu_correlation.cpp:555

GpuMultidimArrayAtGpu::Zdim
size_t Zdim
Definition: cuda_xmipp_utils.h:184

mycufftHandle::clear
void clear()
Definition: cuda_xmipp_utils.h:47

FileName::exists
bool exists() const
Definition: xmipp_filename.cpp:665

GpuCorrelationAux
Definition: cuda_gpu_correlation.h:32

generate_metadata
void generate_metadata(MetaDataVec SF, MetaDataVec SFexp, FileName fnDir, FileName fn_out, size_t mdExpSize, size_t mdInSize, MultidimArray< float > &weights, MultidimArray< float > &corrTotalRow, MultidimArray< float > *matrixTransCpu, MultidimArray< float > *matrixTransCpu_mirror, int maxShift, MultidimArray< float > &weightsMax, bool simplifiedMd, int Nref)
Definition: xmipp_gpu_correlation.cpp:736

TransformMatrix::h_data
T * h_data
Definition: cuda_xmipp_utils.h:101

GPU::set
void set()
Definition: gpu.cpp:50

GpuMultidimArrayAtGpu::Ndim
size_t Ndim
Definition: cuda_xmipp_utils.h:184

TransformMatrix::initialize
void initialize(myStreamHandle &myStream)
Definition: cuda_xmipp_utils.h:139

GpuCorrelationAux::d_projSquaredFFT
GpuMultidimArrayAtGpu< std::complex< float > > d_projSquaredFFT
Definition: cuda_gpu_correlation.h:37

GpuMultidimArrayAtCpu
Definition: xmipp_gpu_utils.h:36

j
#define j
Definition: numerical_recipes.cpp:2493

GpuMultidimArrayAtGpu< float >

FileName::deleteFile
void deleteFile() const
Definition: xmipp_filename.cpp:670

MultidimArray::getRow
void getRow(size_t i, MultidimArray< T > &v) const
Definition: multidim_array.h:1178

GPU
#define GPU
Definition: movie_optical_alignment_gpu.cpp:1

filters.h

GpuCorrelationAux::produceSideInfo
void produceSideInfo(mycufftHandle &myhandlePadded, mycufftHandle &myhandleMask, StructuresAux &myStructureAux, myStreamHandle &myStream)
Definition: cuda_gpu_correlation.cpp:1042

MetaDataVec::getValue
bool getValue(MDObject &mdValueOut, size_t id) const override
Definition: metadata_vec.cpp:293

GpuMultidimArrayAtGpu::Xdim
size_t Xdim
Definition: cuda_xmipp_utils.h:184

MDL_REF
Class to which the image belongs (int)
Definition: metadata_label.h:377

GpuMultidimArrayAtGpu::fftStream
void fftStream(GpuMultidimArrayAtGpu< std::complex< float >> &fourierTransform, mycufftHandle &myhandle, myStreamHandle &myStream, bool useCallback, GpuMultidimArrayAtGpu< std::complex< float >> &dataRef)

Mask::generate_mask
void generate_mask(bool apply_geo=false)
Definition: mask.cpp:1577

alglib::round
int round(double x)
Definition: ap.cpp:7245

MDL_CLASS_COUNT
Number of images assigned to the same class as this image.
Definition: metadata_label.h:81

MDRow::containsLabel
virtual bool containsLabel(MDLabel label) const =0

FileName::withoutExtension
FileName withoutExtension() const
Definition: xmipp_filename.cpp:345

typeCast
void typeCast(const Matrix1D< T1 > &v1, Matrix1D< T2 > &v2)
Definition: matrix1d.h:1227

BINARY_CIRCULAR_MASK
#define BINARY_CIRCULAR_MASK
Definition: mask.h:365

Image< float >

String
std::string String
Definition: xmipp_strings.h:34

alglib::psi
double psi(const double x)
Definition: specialfunctions.cpp:2492

cuda_check_gpu_properties
void cuda_check_gpu_properties(int *grid)
Definition: cuda_xmipp_utils.cpp:337

RotationalCorrelationAux
Definition: polar.h:791

preprocess_images_experimental_two
void preprocess_images_experimental_two(MetaDataVec &SF, FileName &fnImg, int numImagesRef, GpuMultidimArrayAtGpu< float > &mask, GpuMultidimArrayAtGpu< std::complex< float > > &d_maskFFT, GpuCorrelationAux &d_correlationAuxTR, GpuCorrelationAux &d_correlationAuxRT, int firstStep, bool mirror, mycufftHandle &myhandlePaddedTR, mycufftHandle &myhandleMaskTR, mycufftHandle &myhandlePolarRT, StructuresAux &myStructureAuxTR, StructuresAux &myStructureAuxRT, myStreamHandle &myStreamTR, myStreamHandle &myStreamRT, GpuMultidimArrayAtCpu< float > &original_image_stack)
Definition: xmipp_gpu_correlation.cpp:207

formatString
String formatString(const char *format,...)
Definition: xmipp_strings.cpp:602

cpuMalloc
void cpuMalloc(void **h_data, size_t Nbytes)
Definition: cuda_xmipp_utils.cpp:206

myStreamHandle
Definition: cuda_xmipp_utils.h:57

XmippProgram::checkParam
bool checkParam(const char *param)
Definition: xmipp_program.cpp:379

MDRow
Definition: metadata_row_base.h:53

ImageBase::read
int read(const FileName &name, DataMode datamode=DATA, size_t select_img=ALL_IMAGES, bool mapData=false, int mode=WRITE_READONLY)
Definition: xmipp_image_base.cpp:119

primeFactors
void primeFactors(int n, int *out)
Definition: xmipp_gpu_correlation.cpp:49

GpuCorrelationAux::Xdim
size_t Xdim
Definition: cuda_gpu_correlation.h:43

MDL_SHIFT_Y
Shift for the image in the Y axis (double)
Definition: metadata_label.h:435

XmippProgram::addUsageLine
void addUsageLine(const char *line, bool verbatim=false)
Definition: xmipp_program.cpp:282

MultidimArray::initZeros
void initZeros(const MultidimArray< T1 > &op)
Definition: multidim_array.h:2723

Mask::get_binary_mask
const MultidimArray< int > & get_binary_mask() const
Definition: mask.h:707

XmippProgram::getIntParam
int getIntParam(const char *param, int arg=0)
Definition: xmipp_program.cpp:331

xmipp_gpu_correlation.h

MetaData::idIterator
Definition: metadata_base.h:716

metadata_extension.h

GpuCorrelationAux::d_maskFFT
GpuMultidimArrayAtGpu< std::complex< float > > d_maskFFT
Definition: cuda_gpu_correlation.h:40

GpuCorrelationAux::d_mask
GpuMultidimArrayAtGpu< float > d_mask
Definition: cuda_gpu_correlation.h:49

n
int * n
Definition: numerical_recipes.cpp:2229

GpuCorrelationAux::XdimPolar
size_t XdimPolar
Definition: cuda_gpu_correlation.h:43

MDL_IMAGE
Name of an image (std::string)
Definition: metadata_label.h:246

MultidimArray::sum
double sum() const
Definition: multidim_array.h:3405

GpuCorrelationAux::YdimOrig
size_t YdimOrig
Definition: cuda_gpu_correlation.h:43

xmipp_gpu_utils.h

MultidimArray::setRow
void setRow(int i, const MultidimArray< T > &v)
Definition: multidim_array.h:1201

MultidimArray::indexSort
void indexSort(MultidimArray< int > &indx) const
Definition: multidim_array.cpp:882

XmippProgram::addParamsLine
void addParamsLine(const String &line)
Definition: xmipp_program.cpp:305

Mask::mode
int mode
Definition: mask.h:407

StructuresAux::padded_image_gpu
GpuMultidimArrayAtGpu< float > padded_image_gpu
Definition: cuda_gpu_correlation.h:16

MDL_WEIGHT
< Score 4 for volumes
Definition: metadata_label.h:480

waitGpu
void waitGpu(myStreamHandle &myStream, bool allStreams)
Definition: cuda_gpu_correlation.cpp:1497

mycufftHandle
Definition: cuda_xmipp_utils.h:37

INNER_MASK
constexpr int INNER_MASK
Definition: mask.h:47