SMOTE - Técnica de sobremuestreo sintético de minorías

SMOTE (Synthetic Minority Oversampling Technique) es un algoritmo utilizado en el aprendizaje supervisado para resolver problemas de desequilibrio de clases en conjuntos de datos. El desequilibrio de clases se produce cuando el conjunto de datos contiene más o menos instancias de una clase que de otra. SMOTE funciona generando instancias sintéticas (inexistentes) a lo largo de la dirección de la línea que une dos instancias existentes, de los datos de la clase minoritaria en el conjunto de datos.

Es una técnica utilizada para reducir la probabilidad de que un clasificador prediga una clase incorrectamente. SMOTE es beneficiosa porque permite un muestreo ascendente artificial de la clase minoritaria, lo que resulta útil cuando los datos de la clase son escasos. La técnica funciona tomando una muestra aleatoria de la clase minoritaria (vecinos cercanos) y creando después puntos de datos sintéticos que se añaden a la clase minoritaria con características aleatorias que se sintetizan a lo largo de la dirección del vector desde la clase minoritaria hasta los vecinos más cercanos de la clase mayoritaria.

El método ha demostrado su eficacia cuando se trata de conjuntos de problemas extremadamente desequilibrados o que tienen un límite de decisión no lineal. SMOTE es especialmente útil cuando hay muchas muestras de la clase mayoritaria, pero no suficientes muestras de la clase minoritaria. Puede mejorar la precisión y reducir el sesgo de los clasificadores, así como reducir el coste de los errores de falsos positivos.

Gracias a su eficacia, SMOTE se ha generalizado en diversos campos, como la visión por ordenador, las finanzas y la ecotoxicología. También se utiliza ampliamente en casos de uso de aprendizaje automático y análisis predictivo en los campos de la programación informática y la ciberseguridad.

Elegir y comprar proxy

Proxies de centros de datos

Rotación de proxies

Proxies UDP

Con la confianza de más de 10.000 clientes en todo el mundo

Cliente apoderado
Cliente apoderado
Cliente proxy flowch.ai
Cliente apoderado
Cliente apoderado
Cliente apoderado