Mam istniejącą aplikację, która używa klasy C++, opakowania C++ i kodu FORTRAN dla intensywnie obliczeniowych części aplikacji. Chciałbym zaimplementować części FORTRAN w CUDA, aby skorzystać z równoległości, ale nadal chciałbym uzyskać dostęp do niektórych podprogramów, więc muszę połączyć kod CUDA, C++ i FORTRAN.Integracja CUDA z aplikacją C++ w celu użycia istniejącej klasy C++
Mam trzy pytania: 1. W jaki sposób poprawnie połączyć wszystkie pliki obiektów za pomocą terminala linuksowego i pliku Makefile (dołączonego poniżej)? 2. Jaki jest właściwy sposób odwoływania się do funkcji CUDA w nagłówku klasy, nie myląc rozpoznawania przez kompilator urządzenia i kodu hosta? 3. Czy przekazywanie klasy do CUDA jest podobne do przekazywania klasy innym zewnętrznym kodom C?
Uwaga: Nie zawierałem pełnego kodu (niektóre są dość długie) z wyjątkiem pliku Makefile. Jeśli potrzebuję dodać więcej, proszę dać mi znać.
.h plików
#ifndef _DGCPM_H_
#define _DGCPM_H_
extern "C"{
#include <string.h>
#include <zlib.h>
#include <math.h>
}
/* Prototypes of Fortran subroutines */
extern "C" {
void initialize_(float *2Darray);
void advance_(float *2Darray);
//Want "advance" to be implemented in CUDA
}
/* Proper prototype of CUDA call? */
//extern "C" void cudaadvance(float *2Darray);
class DGCPM{
public:
DGCPM(); /* Initialized with defaults setup */
~DGCPM(); /* Free memory */
void advance(float dT); /* Advance model dT seconds */
private:
float **2Darray;
void initialize(float **2Darray);
};
#endif
.C wrapper
#include "../include/DGCPM.h"
DGCPM::DGCPM(){
initialize();
}
void DGCPM::advance(float dT){
advance_(2Darray[0]);
}
plik main.c
#include <stdlib.h>
#include <stdio.h>
#include <zlib.h>
#include "../include/DGCPM.h"
int main(){
class DGCPM *model;
model=new class DGCPM();
//Write data to class from a file, then
for(int i=0;i<200;i++){
printf("%d\n",i);
model->advance(3600);
//write model state to file;
}
//Close file
return 0;
}
Makefile (uwaga: "PBO" oznacza kod FORTRAN)
INSTALLDIR=../../lib/
FLAGS=-Wall -g -I ../../amj/include
CFLAGS=$(FLAGS)
CPPFLAGS=$(FLAGS)
FFLAGS=$(FLAGS)
CPP=g++
CC=gcc
FC=g77
PBO_PATH=../ober/for/
VPATH=$(PBO_PATH)
DGCPM_OBJ=DGCPM.o pbo.o
TESTDGCPM_OBJ=testDGCPM.o DGCPM.o pbo.o
ALL_OBJ=$(TESTDGCPM_OBJ)
install: all
mkdir -p $(INSTALLDIR)
cp libDGCPM.a $(INSTALLDIR)
all: libDGCPM.a testDGCPM
libDGCPM.a: $(DGCPM_OBJ)
ar rc [email protected] $^
testDGCPM: $(TESTDGCPM_OBJ)
$(CPP) -o [email protected] $^ -L ../../amj/lib -lamjMemory -lg2c -lz
clean:
- rm $(ALL_OBJ)
- rm $(INSTALLDIR)/libDGCPM.a
Odnośnie trzeciego pytania, miałem starsze kodu napisane w C++ i przy użyciu klas. Udało mi się przenieść kod do 'CUDA', zmieniając wszystkie operacje procesora (wykonania, ruchy pamięci itp.) Na operacje GPU (jądra,' cudaMemcpy's itp.). – JackOLantern