utf-8

Частные последовательности UTF-8

266

Tom Melly 2018-05-21 в 11:30

У меня есть несколько 3-байтовых восьмеричных UTF-8-последовательностей в частных диапазонах, и я не могу найти подходящих ресурсов, чтобы помочь мне расшифровать то, что они могут представлять.

До сих пор в Perl я добавлял такой код: $ line = ~ s / \ 342 \ 211 \ 244 /> = / g; # utf> = to ascii> =

Но я немного озадачен следующим:

356 201 211 -? 356 205 222 -? 356 201 212 -? 356 200 210 -?

Какие-нибудь предложения относительно ресурса, который мог бы помочь расшифровать их, или подход, чтобы взять? Я предполагал, что они могут быть из Word, но на самом деле Word тоже не знает, что с ними делать ...

* ["В Юникоде частная область использования (PUA) - это диапазон кодовых точек, которым по определению Консорциум Unicode не будет назначать символы. (...) Кодовые точки в этих областях не могут рассматриваться как стандартизированные символы в самом Юникоде. "] (https://en.wikipedia.org/wiki/Private_Use_Areas) *. Таким образом, вы в основном должны угадать или спросить, кто бы ни дал вам это. gronostaj 6 лет назад 0

Частные последовательности UTF-8

0 ответов на вопрос

Похожие вопросы