SMOTE - Kỹ thuật lấy mẫu thiểu số tổng hợp

SMOTE (Kỹ thuật lấy mẫu quá mức thiểu số tổng hợp) là một thuật toán được sử dụng trong học tập có giám sát để giải quyết các vấn đề mất cân bằng lớp trong bộ dữ liệu. Mất cân bằng lớp xảy ra khi tập dữ liệu chứa nhiều hoặc ít phiên bản của lớp này hơn lớp khác. SMOTE hoạt động bằng cách tạo ra các phiên bản tổng hợp (không tồn tại) dọc theo hướng nối hai phiên bản hiện có của dữ liệu lớp thiểu số trong tập dữ liệu.

Đó là một kỹ thuật được sử dụng để giảm khả năng bộ phân loại dự đoán một lớp không chính xác. SMOTE có lợi ở chỗ nó cho phép lấy mẫu lại lớp thiểu số nhân tạo, điều này rất hữu ích khi dữ liệu lớp khan hiếm. Kỹ thuật này hoạt động bằng cách lấy một mẫu ngẫu nhiên từ lớp thiểu số (hàng xóm lân cận) và sau đó tạo các điểm dữ liệu tổng hợp được thêm vào lớp thiểu số với các đặc điểm ngẫu nhiên được tổng hợp theo hướng của vectơ từ lớp thiểu số đến lớp lân cận gần nhất trong lớp đa số.

Phương pháp này đã được chứng minh là có hiệu quả khi giải quyết các tập hợp vấn đề cực kỳ mất cân bằng hoặc những tập hợp có ranh giới quyết định phi tuyến tính. SMOTE đặc biệt hữu ích khi có nhiều mẫu thuộc lớp đa số nhưng không đủ mẫu thuộc lớp thiểu số. Nó có thể cải thiện độ chính xác và giảm độ lệch của các bộ phân loại, cũng như giảm chi phí cho các lỗi dương tính giả.

Do tính hiệu quả của nó, SMOTE đã được sử dụng rộng rãi trong nhiều lĩnh vực khác nhau như thị giác máy tính, tài chính và độc chất sinh thái. Nó cũng được sử dụng rộng rãi trong các trường hợp sử dụng máy học và phân tích dự đoán trong lĩnh vực lập trình máy tính và an ninh mạng.

Chọn và mua proxy

Proxy trung tâm dữ liệu

Proxy luân phiên

Proxy UDP

Được tin cậy bởi hơn 10000 khách hàng trên toàn thế giới

Khách hàng ủy quyền
Khách hàng ủy quyền
Khách hàng proxy flowch.ai
Khách hàng ủy quyền
Khách hàng ủy quyền
Khách hàng ủy quyền