Náhodný vzorek (také nazývaný náhodná podmnožina) je podmnožina souboru dat nebo populace, ve které je každý člen podmnožiny vybrán náhodou. Ve statistice je náhodný výběr podmnožinou dat odebraných z větší populace, která přesně reprezentuje charakteristiky celé populace. Náhodným výběrem členů populace bez zaujatosti mohou výzkumníci vyvodit užitečné závěry o populaci jako celku.
Například náhodný vzorek věku uživatelů počítačů lze použít k určení průměrného věkového rozmezí uživatelů počítačů v určité oblasti. Namísto vytváření jedné statistiky z jednoho datového bodu může náhodný vzorek přinést smysluplné výsledky tím, že bude čerpat z většího počtu jednotlivců.
Náhodný vzorek je užitečná technika v mnoha oblastech informatiky, programování a kybernetické bezpečnosti. Analytici síťového zabezpečení často používají techniky náhodného vzorkování k určení prevalence malwaru v síti. Výběr náhodných vzorků souborů a spouštění internetových bezpečnostních skenů na nich může být užitečným nástrojem pro určení celkové bezpečnosti systému a identifikaci potenciálních zranitelných míst.
V počítačovém programování se náhodný vzorek často používá pro ladění a testování kvality. Výběr náhodného vzorku datových bodů nebo provedení náhodného vzorku testovacích případů může pomoci zvýšit pokrytí dané testovací sady a zajistit kompletnější testování.
Náhodné vzorkování lze také použít jako nástroj pro kompresi dat. Odebráním vzorku z větší sady datových bodů, jako je soubor obrázku, lze soubor efektivněji komprimovat odstraněním nadbytečných datových bodů, přičemž se zachová celkový tvar a obsah originálu.
Náhodné vzorkování je výkonný a všestranný nástroj důležitý pro mnoho oblastí informatiky, programování a kybernetické bezpečnosti. Výběrem podmnožiny dat, která přesně reprezentuje větší populaci, mohou výzkumníci a programátoři vyvodit smysluplné a přesné závěry o charakteristikách většího souboru dat.