CapsNet (Capsule Network) to sztuczna sieć neuronowa, która została zaproponowana w 2017 roku jako alternatywa dla konwolucyjnych sieci neuronowych (CNN). Główną cechą CapsNets jest to, że wykorzystują one sieć warstw "kapsułek", które są analogiczne do neuronów w sieci neuronowej. Kapsuły te składają się z liniowej kombinacji neuronów lub "wektora", który koduje atrybuty obiektu na obrazie. Wymagając mniejszej liczby parametrów niż tradycyjne CNN, CapsNets są bardziej wydajne i mogą osiągać konkurencyjne wyniki przy mniejszej liczbie parametrów.
Podstawowa struktura sieci CapsNet składa się z dwóch odrębnych części, warstwy kodującej i warstwy dekodującej. Pierwsza z nich koduje atrybuty obiektu na obrazie (jego orientację, kolor itp.) do wektora. Wektor ten jest następnie przekazywany do warstwy dekodującej, gdzie informacje są wykorzystywane do rekonstrukcji obrazu z jego komponentów. Proces ten naśladuje sposób, w jaki ludzki mózg przetwarza dane wizualne i może być wykorzystywany do różnych zadań, takich jak segmentacja obrazu, wykrywanie obiektów i klasyfikacja obrazu.
Oprócz tego, że są bardziej wydajne, CapsNets są również bardziej niezawodne w identyfikowaniu i rozpoznawaniu obiektów na obrazie. Ponieważ wektory są niezależne od pozycji na obrazie, mogą być używane do rozpoznawania obiektów w wielu pozycjach, orientacjach lub skalach. To sprawia, że CapsNets są bardziej niezawodne niż CNN w obliczu różnych warunków środowiskowych.
Pomimo tych zalet, CapsNets są nadal dalekie od wykorzystania w przemyśle ze względu na ich złożoność i potrzebę dalszych badań i rozwoju. Niemniej jednak, CapsNets są postrzegane jako obiecująca alternatywa dla CNN i oczekuje się, że odegrają większą rolę w dziedzinie sztucznej inteligencji w ciągu najbliższych kilku lat.