MLflow je open source platforma pro správu celého životního cyklu strojového učení, od experimentování až po produkční nasazení. MLflow je součástí open source projektové rodiny Apache Software Foundation a je vytvořen a udržován společností Databricks. Nabízí centralizovaný systém pro sledování a reprodukci experimentů, sdílení projektů mezi datovými vědci a nasazení modelů do výroby.
MLflow umožňuje podnikům snadno definovat, sledovat a nasazovat modely strojového učení. Umožňuje uživatelům experimentovat a zkoušet různé techniky s různými parametry, aby našli nejlepší model pro svůj projekt. Zároveň poskytuje jednotnou platformu, kterou lze škálovat tak, aby zvládla složité pracovní postupy a orchestraci, s jediným sjednoceným rozhraním.
Platforma MLflow se skládá ze tří složek: sledování, projekty a modely. Sledovací komponenta je systém, který zaznamenává metadata o experimentech prováděných uživatelem. To zahrnuje hardwarové konfigurace, hyperparametry používané pro školení a výsledky a metriky, stejně jako cesty k souborům ke skutečným vytvořeným artefaktům, jako jsou trénované modely a protokoly. Složka projektů je systém balení a orchestrace pro vývoj, testování a nasazení projektů ML. Modely jsou nasazené modely, které lze použít pro predikci ve výrobě.
MLflow také poskytuje open source balíček Python a R, který pomáhá datovým vědcům vytvářet, protokolovat a nasazovat projekty ML. Podporuje oblíbené knihovny ML, jako jsou TensorFlow, PyTorch a XGBoost, a pomáhá se správou modelů. Integruje se také s oblíbenými platformami pro monitorování prostředků, jako jsou Kubernetes a Azure ML.
MLflow si rychle získává na popularitě v komunitě datové vědy a je považován za klíčový nástroj pro podporu organizací, aby získaly hodnotu ze svých investic do strojového učení. Díky své jednotné platformě a automatizovanému pracovnímu postupu MLflow usnadňuje implementaci a správu modelů strojového učení ve výrobě.