Чешские символы превратились в бред

471
Alorain

У меня странная проблема с Windows 10 Home edition. Когда я открываю какой-то основной текстовый файл .srtили, .txtнапример, он имеет другую кодировку. Я думаю, это из-за разной кодировки, так как я чех, мне нужны чешские символы:

š, š, č, ř, ť, ž, ň и так далее,

это означает Unicode, Windows-1250 или ISO Latin 2.

Я пытался сменить язык ОС - не помогло.
Просматривать опции в Chrome тоже было бесполезно - у меня нет проблем при просмотре. Загрузка текстовых файлов с помощью IE, Opera или Firefox принесла те же результаты.
Я загружаю их вручную с сайта, посвященного суб-фильмам и сериалам.

  • Когда я загружал текстовый файл на другой компьютер, чешские символы были в порядке.
  • Отправка скачанного файла через почту Facebook
  • или передача его через флеш-диск изменила чешский символ на тарабарщину.
    Например, «ě» было сохранено в файле как «?», «Č» было «è» и т. Д. Даже сжатый текстовый файл был изменен, когда я открыл его.
-1
Windows не может угадать кодировку текстового файла, потому что эта информация не хранится в файле, поэтому она должна использовать текущую кодовую страницу. Лучше используйте Notepad ++, выберите кодировку вручную и конвертируйте в Unicode. Если у вас есть MS Word, он может довольно эффективно угадать кодировку phuclv 6 лет назад 2

2 ответа на вопрос

0
Tetsujin

Windows 10, в отличие от более ранних версий Windows, не имеет большой языковой поддержки.

Вы должны получить языковые пакеты, которые вам нужны, индивидуально из панели управления языками.

См. Https://support.microsoft.com/help/14236/language-packs для получения подробной информации о каждом языковом источнике.

Я уже скачал пакет на чешском языке и установил его по умолчанию, но проблема все еще сохраняется. Я совершенно невежественен в этой ситуации. Alorain 6 лет назад 0
@Alorain, вы также должны перейти на чешский язык или Windows будет использовать кодовую страницу по умолчанию phuclv 6 лет назад 0
0
Ross

Если он отображает неправильный символ, то это либо не UTF-8, но интерпретируется как UTF-8 или UTF-8, но не отображается как уни-код.

Unicode назначает уникальную кодовую точку всем символам, если у вас есть кодировка UTF-8, и это приводит к кодовой точке, для которой у меня нет глифа, тогда мои окна 10 отображают этот глиф. missingglyph Если кодовая точка недопустима, тогда мои окна 10 дисплеев неизвестный.

Поскольку вы получаете неправильные символы, а не неизвестные, я думаю, что кодировка не интерпретируется должным образом. Поэтому я считаю, что все файлы имеют формат UTF-8, и что обе машины обрабатывают файлы как UTF-8.

UTF-8 - это кодировка Unicode, однако Windows-1250 или ISO Latin 2 - это кодовые страницы, которые интерпретируют одну и ту же последовательность байтов как разные символы.