Частные последовательности UTF-8
266
Tom Melly
У меня есть несколько 3-байтовых восьмеричных UTF-8-последовательностей в частных диапазонах, и я не могу найти подходящих ресурсов, чтобы помочь мне расшифровать то, что они могут представлять.
До сих пор в Perl я добавлял такой код: $ line = ~ s / \ 342 \ 211 \ 244 /> = / g; # utf> = to ascii> =
Но я немного озадачен следующим:
356 201 211 -? 356 205 222 -? 356 201 212 -? 356 200 210 -?
Какие-нибудь предложения относительно ресурса, который мог бы помочь расшифровать их, или подход, чтобы взять? Я предполагал, что они могут быть из Word, но на самом деле Word тоже не знает, что с ними делать ...
* ["В Юникоде частная область использования (PUA) - это диапазон кодовых точек, которым по определению Консорциум Unicode не будет назначать символы. (...) Кодовые точки в этих областях не могут рассматриваться как стандартизированные символы в самом Юникоде. "] (https://en.wikipedia.org/wiki/Private_Use_Areas) *. Таким образом, вы в основном должны угадать или спросить, кто бы ни дал вам это.
gronostaj 6 лет назад
0
0 ответов на вопрос
Похожие вопросы
-
6
Unicode, Unicode Big Endian или UTF-8? В чем разница? Какой формат лучше?
-
1
Как я могу преобразовать несколько файлов в кодировку UTF-8 с помощью инструментов командной строки...
-
2
Как использовать UTF-8 в vim на Mac OS X?
-
-
2
Как мне подключиться от клиента utf-8 к серверу latin1 через ssh?
-
3
Приложение для преобразования из ANSI в UTF8 на Windows
-
6
Dreamweaver возвращается к западному кодированию после его изменения на UTF8
-
3
Пакетное изменение кодировки ASCII-файлов с UTF-8 на ISO-8859-1
-
2
Невозможно преобразовать файл в UTF-8
-
3
Firefox искаженный текст
-
1
Бесплатный конвертер ANSI в UTF8 Multiple Files