Procesy gaussowskie (GP) to klasa probabilistycznych modeli uczenia się dla nadzorowanego i nienadzorowanego uczenia maszynowego, które działają poprzez kwantyfikację relacji między obserwowanymi zestawami danych. Są one skonstruowane w taki sposób, aby automatycznie określać ich poziom złożoności i znajdować strukturę w danych. W rezultacie GP są potężnym narzędziem do analizy predykcyjnej i mogą być wykorzystywane do analizy danych i zadań modelowania predykcyjnego, takich jak regresja i klasyfikacja.
GP są podzbiorem prawdopodobieństwa bayesowskiego i są nieparametryczne, co oznacza, że nie przyjmują żadnych założeń dotyczących podstawowego rozkładu danych, dzięki czemu GP mogą dostosowywać się do obserwowanych danych. Dodatkowo, GP pozwalają na dowolną liczbę zmiennych, które mogą być wykorzystane w procesie analizy danych, w przeciwieństwie do innych modeli, które wymagają określenia stałej liczby zmiennych.
Podczas korzystania z GP korelacje między punktami danych są przechwytywane za pomocą funkcji wielozmiennej znanej jako "jądro". Jądro służy do ilościowego określenia podobieństwa między punktami danych, które jest następnie wykorzystywane do przewidywania prawdopodobieństwa kolejnych punktów danych. Jądro można dostosować, aby dostosować zachowanie GP do różnych zestawów danych.
Oprócz analizy predykcyjnej, GP były również wykorzystywane do analizy dużych zbiorów danych w zadaniach przetwarzania języka naturalnego, takich jak analiza nastrojów, tłumaczenie maszynowe i podsumowywanie tekstu.
GP stają się coraz bardziej popularne w dziedzinie wizji komputerowej, robotyki i badań operacyjnych, gdzie są wykorzystywane do analizy i przewidywania zachowania systemów autonomicznych. Wynika to z ich zdolności do ekstrapolacji logiki predykcyjnej z dużych i złożonych zbiorów danych. Podobnie, GP są również wykorzystywane w klasteryzacji danych i wykrywaniu anomalii w celu klasyfikacji i identyfikacji wartości odstających w zbiorze danych.
Ogólnie rzecz biorąc, procesy gaussowskie są potężnym narzędziem do wielu zadań w uczeniu maszynowym ze względu na ich elastyczność w radzeniu sobie z wieloma zestawami zmiennych i ich zdolność do modelowania złożoności obserwowanych w zestawach danych. W związku z tym GP stają się coraz bardziej popularne w analityce predykcyjnej, wizji komputerowej i robotyce, grupowaniu danych, przetwarzaniu języka naturalnego i innych zadaniach.