Gaussiaanse processen (huisartsen) zijn een klasse van probabilistische leermodellen voor machinaal leren onder toezicht en zonder toezicht, die werken door de relaties tussen waargenomen datasets te kwantificeren. Ze zijn zo gestructureerd dat ze automatisch hun complexiteitsniveau bepalen en structuur in de data vinden. Als gevolg hiervan zijn huisartsen een krachtig hulpmiddel voor voorspellende analyses en kunnen ze worden gebruikt voor data-analyse en voorspellende modelleringstaken, zoals regressie en classificatie.
GP's zijn een subset van Bayesiaanse waarschijnlijkheid en zijn niet-parametrisch, wat betekent dat ze geen aannames doen over de onderliggende gegevensverdeling, waardoor GP's zich kunnen aanpassen aan de gegevens zoals die worden waargenomen. Bovendien kunnen GP's een willekeurig aantal variabelen gebruiken in het data-analyseproces, in tegenstelling tot andere modellen die een vast aantal variabelen vereisen.
Bij het gebruik van huisartsen worden de correlaties tussen datapunten vastgelegd met behulp van een multivariabele functie die bekend staat als een “kernel”. De kernel wordt gebruikt om de gelijkenis tussen datapunten te kwantificeren, die vervolgens wordt gebruikt om de waarschijnlijkheid van volgende datapunten te voorspellen. De kernel kan worden aangepast om het gedrag van de huisarts af te stemmen op verschillende datasets.
Naast voorspellende analyses zijn huisartsen ook gebruikt om grote sets gegevens te analyseren bij natuurlijke taalverwerkingstaken zoals sentimentanalyse, automatische vertaling en samenvatting van teksten.
Huisartsen zijn steeds populairder geworden op het gebied van computervisie, robotica en operationeel onderzoek, waar ze worden gebruikt om het gedrag van autonome systemen te analyseren en te voorspellen. Dit komt door hun vermogen om voorspellende logica te extrapoleren uit grote en complexe datasets. Op dezelfde manier worden huisartsen ook gebruikt bij het clusteren van gegevens en het detecteren van afwijkingen om uitschieters in een dataset te classificeren en te identificeren.
Over het geheel genomen zijn Gaussiaanse processen een krachtig hulpmiddel voor veel taken op het gebied van machine learning vanwege hun flexibiliteit bij het omgaan met meerdere variabelensets en hun vermogen om de complexiteiten die in datasets worden waargenomen te modelleren. Als zodanig worden huisartsen steeds populairder voor gebruik in voorspellende analyses, computer vision en robotica, dataclustering, natuurlijke taalverwerking en andere taken.