La ingeniería de características es un procedimiento en el aprendizaje automático y la minería de datos para preparar los datos en una forma adecuada para los algoritmos de aprendizaje automático. También se describe como vectorización de características, transformación de datos o construcción de características. El propósito de la ingeniería de características es seleccionar características significativas a partir de datos brutos y, a continuación, manipularlos para darles una forma adecuada para el aprendizaje automático o el modelado predictivo.

El proceso de ingeniería de características implica la transformación de los datos en una representación numérica, como la cuantificación de atributos cualitativos o la normalización de características numéricas. Se suelen utilizar diversas técnicas, como la discretización, la normalización, la agregación, la selección, la agrupación y la transformación.

La discretización consiste en dividir las características continuas en valores discretos, normalmente conocidos como intervalos. Así se reduce la probabilidad de sobreajuste y se simplifican las relaciones entre las características.

La normalización es el proceso de escalar las características a un rango apropiado para el algoritmo concreto utilizado.

La agregación realiza operaciones matemáticas como sumas, promedios, valores mínimos o máximos sobre instancias relevantes de una característica.

La selección suele consistir en reducir la lista de características de interés a un subconjunto más pequeño.

La agrupación es una técnica similar, pero consiste en combinar características similares y luego aplicar la agregación.

La transformación implica la creación de nuevas características a partir de las existentes, que pueden no ser características para la capacidad de aprendizaje automático, pero proporcionan una visión significativa de los datos.

La ingeniería de características es una parte importante del proceso en muchas tareas de aprendizaje automático, ya que puede mejorar la precisión. El proceso de ingeniería de características requiere una comprensión de los algoritmos de aprendizaje automático y de los datos, así como la capacidad de seleccionar y transformar características de forma que se mejore el rendimiento. Como el éxito de un algoritmo de aprendizaje automático suele depender en gran medida del proceso de ingeniería de características, se ha convertido en una parte indispensable de muchas tareas de aprendizaje automático.

Elegir y comprar proxy

Proxies de centros de datos

Rotación de proxies

Proxies UDP

Con la confianza de más de 10.000 clientes en todo el mundo

Cliente apoderado
Cliente apoderado
Cliente proxy flowch.ai
Cliente apoderado
Cliente apoderado
Cliente apoderado