Selentia 2005

Добро пожаловать в Селентия

Что такое Unicode?

Unicode - это уникальный код для любого символа,
независимо от платформы,
независимо от программы,
независимо от языка.

По своей природе компьютеры могут работать лишь с числами. И для того, чтобы они могли хранить в памяти буквы или другие символы, каждому такому символу должно быть поставлено в соответствие число. До того, как появился Unicode, в мире имели хождение сотни различных схем подобного кодирования символов. Но ни одна из этих схем не была столь универсальной, чтобы описать все необходимые символы: например, только для кодирования букв, входящих в алфавиты языков Европейского Сообщества, необходимо было использовать несколько различных кодировок. По большому счёту даже и для отдельного языка, скажем, английского, не существовало единой системы кодирования, включавшей в себя все обычно используемые буквы, знаки пунктуации и технические символы.

Более того, все эти схемы кодирования часто даже не были совместимы друг с другом. К примеру, две разные кодировки могли использовать один и тот же код для представления двух разных символов или присваивать разные коды одной и той же букве. В этой ситуации для любого компьютера, а особенно сервера, приходилось поддерживать несколько разных кодировок, которые могли понадобиться, но даже и тогда при передаче данных на другую платформу или при их преобразовании в другую кодировку всегда оставался риск, что эти данные окажутся повреждёнными.

Unicode изменяет такое положение вещей!

Система Unicode присваивает уникальный код любому символу, независимо от платформы, независимо от программы, независимо от языка. Unicode был принят как стандарт такими лидерами компьютерной индустрии, как Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys да и многими другими. Именно эта схема кодирования используется такими современными технологиями и стандартами, как например XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML и так далее. Именно Unicode является официальной схемой реализации ISO/IEC 10646. Наконец, эта кодировка поддерживается во множестве операционных систем, во всех современных браузерах Интернет и в большом количестве других программ. Повсеместное распространение стандарта Unicode ровно как и доступность поддерживающих его средств в настоящее время являются одними из наиболее важных направлений развития индустрии программного обеспечения.

Использование Unicode в многоуровневых приложениях или программных комплексах, построенных в рамках архитектуры клиент-сервер, а также при представлении данных в сети Интернет, приводит к значительному снижению расходов на поддержку этих продуктов или сервисов по сравнению со случаем использования старых схем кодирования. Действительно, Unicode позволяет создавать единый программный продукт или сайт Интернет для множества платформ, языков и стран без каких-либо переделок. А его использование при передаче данных между различными системами предохраняет эти данные от повреждения.

Что такое Unicode Consortium?

Unicode Consortium  - это некоммерческая организация, основанная для разработки и развития стандарта Unicode, определяющего представление текстовой информации в современных программных продуктах и стандартах, и для содействия его широкому распространению и использованию. Членами Консорциума является большое количество корпораций и организаций, работающих в областях обработки информации и компьютерной индустрии. Финансовая поддержка Консорциума осуществляется исключительно за счёт членских взносов его участников. Членство в Unicode Consortium открыто для любых организаций или частных лиц, поддерживающих стандарт Unicode и желающих помогать его распространению и реализации.

Чтобы получить дальнейшую информацию, смотри словарь терминов, примеры продуктов, поддерживающих Unicode, введение в технику стандарта или коллекцию полезных ресурсов.

Russian translation by Antony Upensky