회사에서 한 작업을 바탕으로 테크블로그를 작성했습니다. 해당 테크블로그에서 제가 작성한 파트는 다음 4가지입니다.
- 상황에 따라 gc가 병목일 수 있다. 이런 경우 gc 발동 조건을 튜닝할 수 있다.
고성능 ML 백엔드를 위한 10가지 Python 성능 최적화 팁
다량의 데이터를 사용하는 ML 워크로드에 특화된 최적화 기법들과, ML 백엔드에서 자주 사용되는 third-party 라이브러리를 효과적으로 사용하는 방법들을 실제 하이퍼커넥트의 사례와 함께 공유합니다.
hyperconnect.github.io
- Pytorch를 multiprocess 환경에서 쓴다면 num_threads를 조정하자.
고성능 ML 백엔드를 위한 10가지 Python 성능 최적화 팁
다량의 데이터를 사용하는 ML 워크로드에 특화된 최적화 기법들과, ML 백엔드에서 자주 사용되는 third-party 라이브러리를 효과적으로 사용하는 방법들을 실제 하이퍼커넥트의 사례와 함께 공유합니다.
hyperconnect.github.io
- Pandas DataFrame은 생성에 많은 시간이 걸리므로, 유의해서 사용해야 한다.
고성능 ML 백엔드를 위한 10가지 Python 성능 최적화 팁
다량의 데이터를 사용하는 ML 워크로드에 특화된 최적화 기법들과, ML 백엔드에서 자주 사용되는 third-party 라이브러리를 효과적으로 사용하는 방법들을 실제 하이퍼커넥트의 사례와 함께 공유합니다.
hyperconnect.github.io
- (보너스) line profiler 사용법
고성능 ML 백엔드를 위한 10가지 Python 성능 최적화 팁
다량의 데이터를 사용하는 ML 워크로드에 특화된 최적화 기법들과, ML 백엔드에서 자주 사용되는 third-party 라이브러리를 효과적으로 사용하는 방법들을 실제 하이퍼커넥트의 사례와 함께 공유합니다.
hyperconnect.github.io