One-hot encoding, znane również jako one-of-K lub dummy encoding, to forma transformacji danych stosowana w wielu obszarach programowania komputerowego i cyberbezpieczeństwa. Służy do reprezentowania informacji za pomocą tablicy wartości binarnych. W kodowaniu danych "gorąca" wartość jest reprezentowana przez "1", a "zimne" wartości są reprezentowane przez "0". Jest często używany w technikach analizy danych, takich jak uczenie maszynowe, jako sposób na tworzenie zmiennych dyskretnych z zestawu danych.
Kodowanie one-hot jest szczególnie przydatne w przypadku danych zawierających wartości kategorialne, dla których wartość porządkowa nie ma sensu. Konwertując wartości na wartości binarne, zmienną kategorialną można przedstawić za pomocą zer i jedynek. Jest to również pomocne w wykrywaniu wzorców w danych o określonych cechach i ich ocenie.
Na przykład zbiór danych może zawierać wiele wartości kategorycznych, takich jak płeć lub region, które nie mają sensu, jeśli otrzymają wartości liczbowe. Dzięki zastosowaniu kodowania one-hot, każdej wartości przypisywana jest unikalna wartość binarna, co pozwala na analizę zbiorów danych w sensowny sposób.
Proces kodowania one-hot odbywa się zazwyczaj poprzez utworzenie tablicy binarnej o długości równej liczbie kategorii danych. Tablica binarna składa się ze wszystkich zer i pojedynczej jedynki, która odpowiada prawidłowej kategorii. Zestaw tablic binarnych dla każdej kategorii w zbiorze danych tworzy zakodowaną tablicę.
Kodowanie one-hot jest powszechnie stosowane w aplikacjach uczenia maszynowego, ponieważ pozwala na reprezentowanie danych w bardziej znaczący sposób. Pomaga algorytmom lepiej wykrywać wzorce, a także poprawia dokładność i wydajność. Co więcej, kodowanie one-hot pomaga zapobiegać uczeniu się przez sieci neuronowe niewłaściwych korelacji i efektów.
W cyberbezpieczeństwie kodowanie one-hot służy do przekształcania danych w celu lepszego wykrywania nieprawidłowej aktywności w systemach i sieciach. Pomaga również badać zachowanie sieci i wykrywać złośliwe działania, takie jak złośliwe oprogramowanie.