Вы можете использовать любой набор символов и любую кодировку, чтобы создать файл и просмотреть его.
Вы просто должны быть уверены, что при просмотре используете тот же набор и кодировку, которые использовались для записи файла.
Большинство наборов символов на самом деле имеют большое перекрытие. Например, большинство наборов символов (исключая EBCDIC и другие) имеют набор символов ASCII в тех же позициях (то есть с теми же кодовыми точками), что и в ASCII. Поэтому вы могли бы написать файл в наборе символов Unicode с кодировкой UTF-8 и, если файл содержал только символы в ASCII, вы могли просматривать этот файл, используя кодировку Windows Latin-1.
Примечание. Microsoft очень небрежно относится к таким терминам, как «ANSI» и «Unicode».
Обновить:
Во-первых, вы должны обратить внимание на ответ Юкки, так как Юкка является экспертом в этой области .
Что касается вашего Á, посмотрите эту выдержку здесь
Dec Hex ASC PC 437 850 Win Lat1 Uni 192 00C0 └ └ └ À À À 193 00C1 ┴ ┴ ┴ Á Á Á 194 00C2 ┬ ┬ ┬ Â Â Â 195 00C3 ├ ├ ├ Ã Ã Ã 196 00C4 ─ ─ ─ Ä Ä Ä 197 00C5 ┼ ┼ ┼ Å Å Å
Обратите внимание, что Á находится в кодовой точке 194 (0xC1) в Windows Latin-1, в ISO 8859-1 Latin 1 и в Unicode / ISO 10646. Если вы написали Á в Windows Latin-1, вы можете просмотреть его как ISO 8859-1.
У вас будут проблемы, если вы попытаетесь прочитать его как Unicode, так как кодировки Unicode используют несколько байтов для представления этого символа,
# echo $LANG en_US.UTF-8 # cat t TEST Á # hexdump -C t 00000000 54 45 53 54 20 c3 81 0a |TEST ...| 00000008
Обратите внимание, что Á (кодовая точка Unicode 00C1) кодируется в UTF-8 как c3 81