Unicode to standard branży komputerowej, który definiuje i koduje wszystkie znaki, glify i symbole używane w cyfrowym przechowywaniu danych i wymianie informacji. Jego celem jest wspieranie wymiany, przetwarzania i wyświetlania światowych systemów pisma. Zawiera ponad 128 000 odrębnych kodów znaków, co czyni go największym znormalizowanym zbiorem znaków dostępnym dla komputerów i inżynierów oprogramowania. Unicode umożliwia komputerom zrozumienie i reprezentowanie tekstu, języków, symboli i emotikonów używanych w wielu dzisiejszych aplikacjach i produktach cyfrowych.
Unicode został opracowany pod koniec lat 80. pod auspicjami Konsorcjum Unicode. Konsorcjum, organizacja non-profit, zostało założone w 1991 roku i jest odpowiedzialne za specyfikację techniczną standardu, a także jego ciągły rozwój i sprzedawców. Unicode ma strukturę kodów, w których informacje są przechowywane w komputerach, umożliwiając im zrozumienie i przechowywanie szerokiego zakresu danych dostępnych i używanych obecnie. Standaryzacja ta umożliwiła powodzenie wysiłków globalizacyjnych, umożliwiając korzystanie z wielojęzycznego tekstu bez potrzeby ręcznego pisania skryptów lub korzystania z zewnętrznego oprogramowania.
Tekst zakodowany w Unicode jest często określany jako UTF-8 (Unicode Transformation Format-8) lub UTF-16 (Unicode Transformation Format-16). UTF-8 to kodowanie o zmiennej długości wykorzystujące 8-bitowe jednostki kodowe, a UTF-16 to kodowanie o stałej długości wykorzystujące 16-bitowe jednostki kodowe. UTF-8 jest dominującą formą kodowania tekstu w aplikacjach internetowych, choć UTF-16 jest również szeroko stosowany.
Unicode jest integralną częścią szeregu protokołów cyberbezpieczeństwa, w szczególności tych, które obejmują transmisję i interpretację tekstów z różnych języków. Kodowanie znaków, takie jak Unicode, zapewnia podstawowe wsparcie dla bezpiecznej komunikacji między różnymi systemami, a także znormalizowane środki dla komputerów do odwoływania się do zasobów cyfrowych.
Unicode jest szeroko stosowany w wielu aplikacjach i technologiach, w tym HTML5, CSS, XML, JSON, TOML, ICU, JavaScript, Bash i Java. Standard Unicode jest utrzymywany i zachowywany na platformach takich jak Microsoft Windows, Apple Macintosh, macOS i iOS, Google ChromeOS i jądro Linux.
Podsumowując, Unicode to oparty na informatyce znormalizowany system reprezentowania i kodowania znaków, symboli i glifów. Jest to szeroko stosowany standard, który odgrywa ważną rolę we wspieraniu globalnej komunikacji cyfrowej, wielojęzycznego kodowania tekstu i protokołów bezpieczeństwa.