Walidacja krzyżowa to metoda, w której pojedynczy zbiór danych jest dzielony na podzbiory i wykorzystywany do walidacji dokładności modelu. Ogólnie rzecz biorąc, obejmuje to podział danych na zestaw treningowy i testowy. Model jest dopasowywany przy użyciu zestawu treningowego, a następnie oceniany przy użyciu zestawu testowego.
Walidacja krzyżowa jest ważnym narzędziem do pomiaru dokładności i niezawodności modelu. Pomaga ograniczyć nadmierne dopasowanie, które występuje, gdy model jest zbyt złożony i zbyt ściśle pasuje do danych użytych do jego wytrenowania. Utrudnia to modelowi dokonywanie dokładnych prognoz dla danych, których wcześniej nie widział. Cross-Validation zapewnia, że model jest wystarczająco elastyczny, aby uogólnić go na różne dane bez nadmiernego dopasowania.
Najprostszą formą walidacji krzyżowej jest k-krotna walidacja krzyżowa. Technika ta polega na podzieleniu zbioru danych na k podzbiorów, gdzie k to liczba krotności. Każda fałda jest używana do jednokrotnej oceny modelu. Model jest oceniany poprzez obliczenie średniego błędu. Liczba krotności może się różnić w zależności od rozmiaru zbioru danych i liczby przykładów szkoleniowych.
Walidacja krzyżowa jest ważną techniką oceny dokładności modelu i poprawy wiarygodności prognoz. Technika ta jest stosowana w różnych dziedzinach, w tym w uczeniu maszynowym, nauce o danych i cyberbezpieczeństwie. Dzieląc zbiór danych i stosując systematyczny schemat walidacji, badacze mogą zweryfikować, czy model jest dokładny i nie został nadmiernie dopasowany do danych wykorzystanych do jego wytrenowania.