Redukcja wymiarowości to proces wyodrębniania ważnych cech ze zbioru danych o wysokiej wymiarowości w celu zmniejszenia jego złożoności, uproszczenia analizy i poprawy wydajności obliczeniowej. Techniki redukcji wymiarowości pomagają wizualizować dane poprzez zmniejszenie liczby elementów składających się na dane. Jest ona wykorzystywana w wielu dziedzinach intensywnie wykorzystujących dane, takich jak uczenie maszynowe, statystyczna kontrola procesu, wizja komputerowa, rozpoznawanie wzorców i przetwarzanie języka naturalnego.
Redukcja wymiarowości może być wykorzystana do zmniejszenia ilości danych do przetworzenia, na przykład w zapytaniu do bazy danych lub w algorytmach uczenia maszynowego. Może to drastycznie skrócić czas przetwarzania potrzebny do obliczeń. Redukcja wymiarowości może również pomóc w interpretacji relacji między cechami i zmniejszyć ryzyko nadmiernego dopasowania podczas uczenia modeli uczenia maszynowego. Zmniejszając liczbę cech potrzebnych do zrozumienia lub reprezentowania danych, można osiągnąć pożądane wyniki przy mniejszej ilości zasobów.
Podstawowym celem redukcji wymiarowości jest skrócenie czasu obliczeń, poprawa dokładności i optymalizacja przechowywania danych. W tym celu opracowano szereg technik, w tym analizę głównych składowych, dekompozycję wartości osobliwych, liniową analizę dyskryminacyjną, analizę niezależnych składowych, nieujemną faktoryzację macierzy i probabilistyczną analizę głównych składowych. Każda z tych technik może zmniejszyć liczbę cech i potencjalnie zachować istotne informacje, które są ważne dla analizy.
Redukcja wymiarowości pomaga poprawić wydajność obliczeniową zadań wymagających dużej ilości danych, jednocześnie zmniejszając złożoność i rozmiar zbiorów danych. Jest to ważne narzędzie dla naukowców zajmujących się danymi, umożliwiające im wizualizację złożonych relacji między zmiennymi oraz pomoc w interpretacji i zrozumieniu danych.