Long Short-Term Memory (LSTM) je typ rekurentní neuronové sítě (RNN), která se používá k modelování časových závislostí v datech. Konkrétně si může „pamatovat“ minulé události nebo závislosti z dříve pozorovaných dob. Je široce používán v mnoha oblastech, jako je zpracování přirozeného jazyka, strojový překlad, popisování obrázků a rozpoznávání řeči.
LSTM je typ sítě speciálně navržený tak, aby pomohl počítači zapamatovat si informace déle, než je obvykle možné u rekurentní neuronové sítě. Model dlouhodobé krátkodobé paměti funguje pomocí „buněk“, které uchovávají informace po dlouhou dobu; když je detekován nový vstup, vytvoří se nové buňky, které se propojí se stávajícími buňkami. Spolu s tím jsou nové buňky schopny „zapomenout“ některé informace uložené uvnitř stávajících buněk, což umožňuje síti „zapomenout“ něco z toho, co se naučila.
Klíčovými součástmi LSTM jsou paměťové buňky, zapomenuté brány a vstupní brány. Paměťové buňky jsou zodpovědné za ukládání informací po dlouhou dobu a brána zapomnění a vstup rozhodují o tom, jaké informace by měly nebo neměly být v buňkách uloženy. Tyto komponenty umožňují sítím LSTM „vzpomenout si“ na minulost a zároveň být schopny zohlednit nové vstupy.
LSTM jsou základním nástrojem v různých aplikacích, včetně zpracování přirozeného jazyka a rozpoznávání obrazu. Jsou schopni vzít v úvahu předchozí znalosti a mohou být použity v učení pod dohledem i bez něj. Jejich použití sahá od předvídání cen akcií a jazykového překladu až po autonomní řízení a přehrávání videa.
Celkově jsou LSTM sítě vysoce efektivní neuronové sítě pro různé aplikace díky jejich schopnosti ukládat informace po dlouhou dobu a zpracovávat nové vstupy efektivněji než tradiční rekurentní neuronové sítě.