직무 소개
모레에서는 대규모 인공신경망 모델, 클러스터 시스템, 클라우드 인프라를 위한 AI 소프트웨어 스택을 함께 개발할 엔지니어를 모집하고 있습니다.
모레의 시스템 소프트웨어 엔지니어는 AI 애플리케이션을 병렬화/최적화하고 클러스터에서 분산 실행하는 데 필요한 소프트웨어 구성 요소들을 개발합니다.
주요 업무
- AI 애플리케이션의 의미를 실행 시간에 그래프 꼴의 IR로 표현하는 on-the-fly IR constructor 개발
- 계산 작업을 클러스터의 여러 노드에서 분산 실행하고 계산 자원(GPU/NPU)을 가상화하기 위한 런타임 시스템 개발
- AI 애플리케이션과 GPU 간의 고속 통신 기술(RDMA, RoCE 등) 및 저수준 라이브러리(Verbs, UCX 등)를 분산 런타임 시스템에 통합하고 최적화
- 기존 AI 애플리케이션들을 위한 PyTorch, TensorFlow, Triton Inference Server 호환 레이어 개발
- AI 애플리케이션의 실제 연산과 무관한 오버헤드를 줄이기 위한 전체 소프트웨어 스택의 최적화
자격 요건
- 컴퓨터공학 혹은 관련 전공 학부 졸업, 혹은 이와 동등한 경력이 있으신 분
- C++ 및 Python 개발 가능하신 분
- 컴퓨터 시스템에 대한 이해가 있으신 분
우대 사항
- 전문연구요원 전직 지원 우대
- 컴퓨터 시스템, 분산 컴퓨팅 혹은 관련 분야 석/박사 졸업
- GPU/NPU를 위한 시스템 소프트웨어를 개발한 1년 이상의 경력
- PyTorch, TensorFlow, Triton Inference Server 사용 경험, 나아가 이들의 내부 구조에 대한 지식
- 인공신경망 모델을 직접 구현해 본 경험