make-ifort-AMD

#
.SUFFIXES:
.SUFFIXES: .f .F .for .cpp .F90 .cu .o 

#FC=ifort -xHost -ip -fpp
FC = mpiifort -march=core-avx2 -ip -fpp
FREE = -free

# use this flag for debugging and coding up
SAFE = #-g -traceback -check all #-fstack-protector -assume protect_parens -implicitnone -warn all 

FFLAGS1 = -O3 -align 
FFLAGS2 = -O2 -align -qopenmp -parallel -no-wrap-margin $(FREE) $(SAFE)

LDFLAGS = -static-intel

CXX = icpc -std=c++11
SAFE_CXX = #-g -traceback
CFLAGS = -O2 -align -xHost -ip -qopenmp -fno-exceptions -restrict $(SAFE_CXX)

# MKLROOT  = If MKLROOT is not defined in your environment, edit and uncomment this line
LIB_BLAS   = -lmkl_blas95_lp64
LIB_LAPACK = -lmkl_lapack95_lp64 -lmkl_intel_lp64 -lmkl_intel_thread -lmkl_core
LIB_OMP    = -liomp5 -lpthread
INCS_MKL   = -I$(MKLROOT)/include/intel64/lp64 -I$(MKLROOT)/include/fftw

# Uncomment the lines below when compiling for GPUs
# GPU_DEFS options:
#   -DGPU_TIMING       : Print timings (CPU/GPU)
#   -DUSE_GPU          : Compile with GPU support
#   -DGPU_DEBUG        : Print some debug messages
#   -DGPU_SYGVDM_VER   : Use multi-gpu version of SYGVD (faster than single-gpu even with 1 gpu)
#   -DGPU_SYGVD2S_VER  : Use two stage version of SYGVD (faster, but needs more memory)
#   -DGPU_DONT_PIN_MEM : Don't use pinned memory for faster transfers (in Fortran code)
#   -DGPU_PIN_MEM_WORK : Use pinned memory for work spaces (in C code)
#GPU_DEFS  = -DUSE_GPU
#
ifneq (,$(findstring USE_GPU,$(GPU_DEFS)))
# CUDA compiler
NVCC = nvcc
# compute capality (depends on your GPU, check!)
SM = 35
#SAFE_NVCC = -g -lineinfo
NVCCFLAGS = -O3 -gencode arch=compute_${SM},code=sm_${SM} -Xcompiler "-fno-strict-aliasing -march=native -fno-exceptions" $(SAFE_NVCC)
# -fno-strict-aliasing
#
# CUDA and MAGMA paths:
CUDADIR   = /usr/local/cuda
MAGMADIR  = /opt/magma
#
# CUDA and MAGMA libs:
# dynamic linking:
#LIB_CUDA  = -L$(CUDADIR)/lib64 -lcublas -lcusparse -lcudart
# static linking:
LIB_CUDA  = -L$(CUDADIR)/lib64 -lcublas_static -lcusparse_static -lculibos -lcudart_static -ldl
LIB_MAGMA = $(MAGMADIR)/lib/libmagma.a
#
LIB_GPU   = $(LIB_MAGMA) $(LIB_CUDA) -lstdc++
INCS_GPU  = -I$(CUDADIR)/include -I$(MAGMADIR)/include
endif

LIB  = $(LIB_GPU) $(LIB_BLAS) $(LIB_LAPACK) $(LIB_OMP) -lrt
INCS = $(INCS_MKL)

#-----------------------------------------------------------------------
# general rules
#-----------------------------------------------------------------------

#INCS1   = comun.inc integcoul.inc m2cdat.inc $(INCS)

SOURCE1 = integ-Coul.o \
		  Coul0sim.o \
		  m2caux3-Coul.o \
		  abcpes-Coul.o \
		  ckplm-Coul.o \
		  util-Coul.o

SOURCE2 = constants_m.o \
		  Matrix_math.o \
		  exec_time.o \
		  types_EHT.o \
		  types_MM.o \
          parms_var_module.o \
		  util.o \
          read_card.o \
		  parameters.o \
          MPI_topologies.o \
		  OPT_parent.o \
		  parameters_MM.o \
		  allocation_m.o \
		  EHT_input.o \
		  tuning.o \
          IdentifyNonBonded.o \
		  babel_routines.o \
		  babel.o \
		  structure.o \
		  checklist.o \
		  gmx2mdflex.o \
          namd2mdflex.o \
		  md_read.o	\
		  md_setup.o \
		  md_output.o \
		  pbc.o \
		  overlap_D.o \
		  STO.o \
		  multip_routines.o \
		  LCMO_Builder.o \
		  Coulomb.o \
		  DP_main.o \
		  td_dp.o \
		  DP_FMO.o \
		  dipole_phi.o \
          EnvField.o \
		  polarizability.o \
		  hamiltonians.o \
          CSDM_master.o \
          decoherence.o \
		  QCModel_Huckel.o \
		  diabatic-Ehren.o \
		  HuckelForces.o \
		  Ehrenfest.o \
		  FMO.o \
          CSDM_workers.o \
          FSSH.o \
		  CoulInt_QMMM.o \
		  data_output.o \
		  f_intra.o \
		  f_inter.o \
		  electron_hole_DP.o \
		  AlphaPolar.o \
          backup_MM.o \
		  Berendsen.o \
		  NoseHoover.o \
		  NoseHoover_Reversible.o \
          NVE.o \
		  VDOS_m.o \
		  MM_dynamics.o \
		  MM_driver.o \
		  film_STO.o \
		  DOS_m.o \
		  oscillator.o \
		  ga_QCModel.o \
		  cost_tuning_EH.o \
		  cost_tuning_MM.o \
		  nonlinearCG.o \
		  CG_class.o \
		  MM_ERG_class.o \
		  nonlinear-sidekick.o \
		  FF_OPT_class.o \
		  CG_EH_driver.o \
		  ga_routines.o \
		  CG_MM_driver.o \
		  vibes_driver.o \
		  solvated_M.o \
		  DOS_tool.o \
		  backup.o \
		  auto_correlation.o \
		  ElHl_schroedinger.o \
		  diagnostic.o \
		  qdynamics.o \
          Taylor.o \
		  ElHl_Chebyshev.o \
          ElHl_Chebyshev_GPU.o \
		  TDSE_adiabatic.o \
          CSDM_adiabatic.o \
		  Chebyshev_driver.o \
		  eigen_driver.o \
		  ga_driver.o \
		  avrg_confgs.o \
 		  main.o

SOURCE_GPU = GPU_Interface.o \
             Taylor_gpu.o
#             Chebyshev_gpu.o

ifneq (,$(findstring USE_GPU,$(GPU_DEFS)))
SOURCE_CUDA= Chebyshev_gpu_kernels.o \
             dzgemv_kernels.o
endif

#########
# RULES #
#########
                                                                                                                                                                                                                
# Compiles dynemol and manipulate 
all: dynemol Manipulate

dynemol: $(SOURCE1) $(SOURCE2) $(SOURCE_GPU) $(SOURCE_CUDA)
	rm -f dynemol
	$(FC) $(INCS) $(LDFLAGS) -o dynemol $(SOURCE1) $(SOURCE2) $(SOURCE_GPU) $(SOURCE_CUDA) $(LIB) 

Manipulate: 
	$(MAKE) -C ./manipulate 

.F.o:
	$(FC) $(FFLAGS1) $(INCS) -c $<

.f.o:
	$(FC) $(FFLAGS2) $(INCS) $(GPU_DEFS) -c $<

.F90.o:
	$(FC) $(FFLAGS1) $(INCS) $(GPU_DEFS) -c $<

.cpp.o:
	$(CXX) $(CFLAGS) $(INCS_GPU) $(GPU_DEFS) -c $<

.cu.o:
	$(NVCC) $(NVCCFLAGS) $(INCS_GPU) $(GPU_DEFS) -c $<


clean: 
	-rm -f dynemol *.o *.mod; touch *.f

depend:
	@echo -en "Searching module dependencies..."
	@chmod +x ./makedepend.bsh
	@./makedepend.bsh > dependencies.txt
	@echo -en " done.\n"


## Dependency list:
-include dependencies.txt