W tej chwili najlepszą zewnętrzną metodą jest kompilacja z profilerem CPU/GPU, ale należy to zrobić ręcznie, zmieniając opcje w plikach BUILD
i tensorflow.bzl
(nie wiesz gdzie).
Można wówczas uzyskać profil informacji, o których funkcje biorą najwięcej czasu, itd To do ciebie, można uruchomić za pomocą gperftools i wizualizacji przez pprof
Ponieważ kod TensorFlow jest połączone poprzez swig
, i” nie jestem w 100% pewny, jak łatwo będzie uzyskać symbole podczas czytania profilu przez pprof
. Być może uda ci się wskazać plik, który został zbudowany.
Spróbuj i daj nam znać, czy to działa dla Ciebie!
Prawdopodobny duplikat: http://stackoverflow.com/questions/34293714/tensorflow-can-i-measure-the-execution-time-of-individual-operations – user3559888