Lineární regrese je typ statistické analýzy používaný k identifikaci lineárních vztahů mezi závislou proměnnou (výsledkem) a jednou nebo více nezávislými proměnnými (faktory, které by mohly výsledek ovlivnit). Je to forma strojového učení pod dohledem, což znamená, že se při předpovědích spoléhá na data z označené tréninkové sady.
Lineární regrese se používá k předpovídání budoucích trendů a rozhodování na základě dat. Lze jej použít k odhadu budoucí hodnoty dané proměnné, jako jsou tržby, příjmy nebo účinnost reklamy, na základě známých výsledků a faktorů. Používá se také v analýze rizik a prognózách k odhadu pravděpodobnosti výskytu určitých událostí.
Lineární regrese funguje tak, že se nakreslí přímka, která nejlépe odpovídá datovým bodům. Tato přímka se nazývá regresní přímka a lze ji použít k předpovědím na základě dat. Obvykle se používá s korelačním koeficientem, který měří sílu vztahu mezi nezávislými a závislými proměnnými.
Algoritmus lineární regrese se běžně používá v mnoha oblastech, včetně financí, ekonomie, marketingu a datové vědy. Algoritmus lze použít pro prediktivní analytiku, prognózování a regresní analýzu. Používá se také například ve zdravotnictví k identifikaci trendů ve zdravotních stavech a léčbě.
Lineární regrese je jednou z nejstarších a nejpoužívanějších statistických metod. Je to mocný nástroj pro analýzu dat a vytváření předpovědí, ale neměl by být používán jako náhrada za pochopení základních vzorců v datech.