Budete převádět modely LLM (Large Language Model), TTS (Text to Speech) a ASR (Automatic Speech Recognition) z výzkumu do produkce, tak aby splňovaly požadavky na škálovatelnost, nízké latence a dostupnost. Pokud vás baví Python, Linux, Kubernetes a práce s LLM, TTS a ASR technologiemi, připojte se k nám a využijte stovky GPU karet pro inovativní projekty!
Co můžete očekávat
- Možnost pracovat s unikátními daty a stovkami GPU karet (H100 a L4) pro inovativní projekty.
- Samoorganizovaný tým s přátelskou atmosférou a týmovým duchem.
- Prostor pro seberealizaci a profesní růst, včetně sdílení nápadů a inspirace mezi kolegy.
- Práci s moderními technologiemi jako vLLM a Triton (TensorRT-LLM, ONNX).
- Spolupráci s výzkumníky na implementaci nových LLM, TTS a ASR funkcionalit.
Co očekáváme od vás
- Zkušenosti s vývojem v Pythonu nejlépe 2 až 3 roky a alespoň základní zkušenosti s Linuxovým prostředím.
- Znalost Kubernetes, Dockeru a cloudových technologií (SCIF).
- Zkušenosti s optimalizací inference serverů a monitoringem nasazených modelů.
- Znalost technologií jako KServe, S3, MLflow, FastAPI a dalších.
- Zájem o LLM, TTS a ASR technologie a ochota se v nich dále vzdělávat.
- Schopnost automatizovat a optimalizovat procesy, budovat spolehlivou infrastrukturu.
Jak probíhá výběrko:
- Po zaslání životopisu se vám ozveme do 3 pracovních dní.
- Následně vás čeká praktický úkol – řešení problému, který jsme museli implementovat do naší service (časová náročnost 2–8 hodin).
- Poté se setkáte s hiring managerem Markem Šimůnkem na osobním setkání.
- Pokud vše ladí, následuje nabídka a vítejte na palubě!