Feature engineering is een procedure in machine learning en datamining om gegevens voor te bereiden in een vorm die geschikt is voor machine learning-algoritmen. Het wordt ook wel kenmerkvectorisatie, datatransformatie of kenmerkconstructie genoemd. Het doel van feature engineering is om belangrijke features uit ruwe data te selecteren en deze vervolgens te manipuleren in een vorm die geschikt is voor machine learning of voorspellende modellering.

Het feature-engineeringproces omvat het transformeren van gegevens in numerieke representaties, zoals het kwantificeren van kwalitatieve kenmerken of het standaardiseren van numerieke kenmerken. Er wordt vaak een verscheidenheid aan technieken gebruikt, waaronder discretisatie, normalisatie, aggregatie, selectie, groepering en transformatie.

Discretisatie omvat het opsplitsen van continue kenmerken in discrete waarden, doorgaans bekend als bins. Dit verkleint de kans op overfitting en vereenvoudigt functierelaties.

Normalisatie is het proces waarbij functies worden geschaald naar een bereik dat geschikt is voor het specifieke gebruikte algoritme.

Aggregatie voert wiskundige bewerkingen uit zoals sommatie, gemiddelden, minimum- of maximumwaarden over relevante exemplaren van een kenmerk.

Selectie houdt doorgaans in dat de lijst met interessante kenmerken wordt teruggebracht tot een kleinere subset.

Groeperen is een vergelijkbare techniek, maar omvat het combineren van vergelijkbare kenmerken en het vervolgens toepassen van aggregatie.

Transformeren omvat het creëren van nieuwe functies op basis van bestaande functies, die mogelijk niet kenmerkend zijn voor het machine learning-vermogen, maar wel een betekenisvol inzicht in de gegevens bieden.

Feature engineering is een belangrijk onderdeel van het proces bij veel machine learning-taken, omdat dit tot verbeterde nauwkeurigheid kan leiden. Het proces van feature-engineering vereist inzicht in machine learning-algoritmen en de gegevens, en het vermogen om functies te selecteren en te transformeren op een manier die de prestaties verbetert. Omdat het succes van een machine learning-algoritme vaak sterk afhankelijk is van het feature-engineeringproces, is het een onmisbaar onderdeel geworden bij veel machine learning-taken.

Proxy kiezen en kopen

Datacenter Proxies

Roterende volmachten

UDP-proxy's

Vertrouwd door meer dan 10.000 klanten wereldwijd

Proxy-klant
Proxy-klant
Proxyklant flowch.ai
Proxy-klant
Proxy-klant
Proxy-klant