Học bán giám sát là một lĩnh vực con của học máy sử dụng cả dữ liệu được dán nhãn và không được gắn nhãn để huấn luyện một thuật toán. Mục đích của học bán giám sát là sử dụng dữ liệu chưa được dán nhãn để bổ sung cho dữ liệu đã được dán nhãn. Điều này cho phép quá trình đào tạo có thêm thông tin để đào tạo trong khi vẫn chỉ sử dụng một phần nhỏ lượng dữ liệu được dán nhãn. Học bán giám sát là một hình thức học có giám sát vì nó sử dụng một số dữ liệu được dán nhãn, nhưng khác ở chỗ nó cũng tận dụng dữ liệu không được gắn nhãn.

Ý tưởng cơ bản của học bán giám sát là việc nhận ra các quy tắc của dữ liệu không được gắn nhãn thường dễ dàng hơn các quy tắc của dữ liệu được dán nhãn. Nó cũng thường được sử dụng khi chỉ có sẵn một lượng nhỏ dữ liệu được dán nhãn. Vì điều này, nó đã trở thành một cách tiếp cận phổ biến trong lĩnh vực học máy.

Có nhiều loại thuật toán học bán giám sát. Các thuật toán này thường thuộc một trong hai loại: mô hình tổng quát hoặc mô hình phân biệt đối xử. Các mô hình tổng quát là các thuật toán cố gắng mô hình hóa việc phân phối dữ liệu, trong khi các mô hình phân biệt đối xử là các thuật toán cố gắng mô hình hóa sự khác biệt giữa các lớp được cung cấp dữ liệu. Dưới đây là một số ví dụ về thuật toán bán giám sát:

• Mạng đối thủ sáng tạo (GAN): GAN là một loại mô hình tổng quát sử dụng hai mạng thần kinh (bộ tạo và bộ phân biệt đối xử) để tạo ra dữ liệu mới theo phân phối của tập dữ liệu gốc. GAN có thể được sử dụng cho việc học bán giám sát vì chúng có thể tạo dữ liệu từ tập dữ liệu gốc để tăng cường dữ liệu cho việc đào tạo.

• Tự đào tạo: Tự đào tạo là một loại kỹ thuật học bán giám sát, trong đó thuật toán được huấn luyện trên tập dữ liệu đã được dán nhãn và sau đó được sử dụng để xuất nhãn cho dữ liệu chưa được gắn nhãn tương ứng. Sau đó, các nhãn đầu ra được sử dụng như một phần của dữ liệu được gắn nhãn để mô hình huấn luyện.

• Lan truyền nhãn: Lan truyền nhãn là một loại kỹ thuật học bán giám sát cụ thể trong đó các nhãn được truyền từ dữ liệu được dán nhãn sang dữ liệu không được gắn nhãn xung quanh. Các nhãn được truyền bá dựa trên sự giống nhau của dữ liệu và dữ liệu được dán nhãn.

Nhìn chung, học bán giám sát là một kỹ thuật mạnh mẽ cho học máy vì nó cho phép sử dụng cả dữ liệu được dán nhãn và không được gắn nhãn để huấn luyện một thuật toán. Điều này cho phép thuật toán tận dụng cả hai nguồn dữ liệu và do đó có thể tạo ra kết quả chính xác hơn.

Chọn và mua proxy

Proxy trung tâm dữ liệu

Proxy luân phiên

Proxy UDP

Được tin cậy bởi hơn 10000 khách hàng trên toàn thế giới

Khách hàng ủy quyền
Khách hàng ủy quyền
Khách hàng proxy flowch.ai
Khách hàng ủy quyền
Khách hàng ủy quyền
Khách hàng ủy quyền