Есть ли команда Linux, чтобы узнать, является ли файл UTF-8?

21137
Edward

.iniФайлы Joomla должны быть сохранены как UTF-8.

После редактирования я не уверен, являются ли файлы UTF-8 или нет.

Есть ли какая- fileнибудь команда Linux или несколько команд, которые бы указывали, является ли файл действительно UTF-8 или нет?

9
Вы не можете сказать кодировку файла. Вы можете только сделать умное предположение. Вы можете в основном угадать правильно, но иногда догадки не удаются. `file` - пример программы, которая делает умные догадки. Marco 10 лет назад 1
@Marco: Однако можно проверить, действительно ли это UTF-8 или нет. Существуют * некоторые * кодировки, которые могут ошибочно считаться действительными UTF-8, но это почти никогда не происходит с кодировками / кодировками ISO-8859- или Windows-125. grawity 10 лет назад 1

2 ответа на вопрос

24
Rik

You can determine the file encoding with the following command:

file -bi filename 
Этот ответ должен быть принят. Объяснение параметров -bi находится в [man file] (http://linuxcommand.org/man_pages/file1.html). Jérôme 8 лет назад 0
он должен работать и на макос? Я получаю `обычный файл` для файла, который я, хотя и был utf8 nicolas 8 лет назад 0
@nicolas Для MacOS вы можете попробовать `file -I filename` (-I это заглавная буква i). Rik 8 лет назад 2
@ Рик я могу подтвердить nicolas 8 лет назад 0
Это читает весь файл? ctrl-alt-delor 6 лет назад 0
@ ctrl-alt-delor Что значит чтение всего файла? Это не должно произойти, поскольку кодировка файла, вероятно, помещена в заголовок файла. kojow7 6 лет назад 0
У @ kojow7 utf-8 нет заголовка. Чистый ASCII (только 7-битный) неотличим от utf-8 (вот в чем смысл, заголовок будет вызывать всевозможные проблемы). Таким образом, если у вас есть файл ASCII для первого МБ, то он имеет один символ UTF-8, тогда вы не узнаете, если не прочитаете весь файл. ctrl-alt-delor 6 лет назад 0
3
Pablo Olmos de Aguilera C.

Есть, используйте isutf8команду из пакета moreutils .

Источник: Как вы можете определить, является ли файл в кодировке UTF-8 или нет?


@ davidpostill Мне любопытно, плохая практика - ссылаться на автора в ссылке? Pablo Olmos de Aguilera C. 7 лет назад 0

Похожие вопросы