Unicode и ASCII обратная совместимость

630
Stribor

Если первые 127 символов совпадают, то почему мы все еще используем ASCII и существует ли проблема обратной совместимости при использовании Unicode вместо ASCII?

-1
Принятый ответ для [ANSI на UTF-8 в Notepad ++] (http://superuser.com/questions/762473/ansi-to-utf-8-in-notepad/762475#762475) будет полезным чтением. Thomas Dickey 8 лет назад 1

1 ответ на вопрос

-2
DrMoishe Pippik

ASCII, позже названный ANSI, имеет отношение 1: 1 между байтом и символом. Системы многобайтовых символов, в том числе Unicode, имеют преимущество в отображении дополнительных символов за счет необходимости дополнительного хранилища . Кроме того, существует много реализаций многобайтовых символьных систем; в некоторых порядок байтов определяется спецификацией . Интерпретация UTF-8, UTF-16 и UTF-32 дает разные значения для одной и той же строки байтов. Кроме того, существуют разные стандарты ISO для разных алфавитов, такие как скандинавская реализация с A-minuscule-o, как на «Аландских островах».

Таким образом, для простых целей базы данных или для использования с очень ограниченным хранилищем, например, ANSI имеет преимущества в пространстве и не может быть неправильно истолкован. Если нужно отобразить полный набор символов из многих алфавитов, тем не менее, многобайтовые наборы полезны.

Я понимаю, что в ASCII и Unicode есть разные хранилища, но говорят, что символ "a" будет иметь Stribor 8 лет назад 0
Одна и та же кодировка, только разные отступы? Это точно? Stribor 8 лет назад 0
A в ANSI - это байт (65), dec или * 41 *, hex. A в UTF-8 имеет значение * 0041 *, шестнадцатеричное или * 4100 * с обратной спецификацией. Мало того, что есть отступы, но это могут быть отступы влево или вправо. DrMoishe Pippik 8 лет назад 0
ISO / IEC 8859-x - это * однобайтовые * наборы символов. Я не видел ни одного осведомленного источника, ссылающегося на US-ASCII как «ANSI». Thomas Dickey 8 лет назад 1
Извините, ANSI был слишком неправ. Извините мою опечатку :( Stribor 8 лет назад 0
@ThomasDickey В мире Windows «ANSI» использовался для обозначения 8-битной кодовой страницы GUI по умолчанию. Будь уместен или (скорее) нет, но он все еще широко используется. См., Например, https://msdn.microsoft.com/en-us/library/windows/desktop/dd317752.aspx `Кодовые страницы Windows, обычно называемые« кодовыми страницами ANSI »`. dxiv 8 лет назад 0
И в правильном контексте (кроме Windows) ANSI означает * организацию * http://www.ansi.org, которая разработала или приняла стандарты для многих тысяч вещей, помимо ASCII, от магнитных лент до шифрования, фотопленки, станков и защитные очки и рабочие ботинки. dave_thompson_085 8 лет назад 2