В моем xml-файле была неправильная вьющаяся цитата.
Проблема с документом: неверный байт 3 из 3-байтовой последовательности UTF-8
Я пытаюсь использовать документ XML, но сталкиваюсь с этой ошибкой:
Invalid byte 3 of 3-byte UTF-8 sequence
Мой документ выглядит примерно так ниже, но с большим количеством тегов и контента. Пожалуйста, не сосредотачивайтесь на документе ниже, хотя. Я использую несколько документов с этим форматом. Я считаю, что это символ в моем документе, который является недействительным, но я просто не знаю, как найти его, потому что он очень большой.
Любые идеи или инструменты, которые я мог бы использовать? Благодарю.
Спасибо!
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE map PUBLIC "-//OASIS//DTD DITA Map//EN" "file:C:/Documentum/Viewed/map.dtd"> <map xmlns:dctm="http://www.documentum.com" dctm:obj_status="Read-Only" dctm:obj_id="09002af8800af696" dctm:version_label="CURRENT" xmlns:ditaarch="http://dita.oasis-open.org/architecture/2005/"> <title>Overview of the Commercial General Liability (CGL) Insurance Coverages </title><moreTagsHere><!-- more tags here... --></moreTagsHere> </map>
6 ответов на вопрос
- Популярные
- Новые
- С комментариями
- Активные
Я бы попробовал XMLStarlet :
[...] XMLStarlet - это набор утилит командной строки (инструментов), которые можно использовать для преобразования, запроса, проверки и редактирования документов и файлов XML с использованием простого набора команд оболочки аналогично тому, как это делается для простых текстовых файлов с использованием UNIX-команды grep, sed, awk, diff, patch, join и т. Д. [...]
[ Акцент мой ]
У меня есть подозрение, что вы можете использовать инструмент от Microsoft.
По моему опыту, Expression Web использовал для размещения информации заголовка в текстовых файлах, чтобы идентифицировать их в том формате, в котором они когда-либо были - ничто иное не распознало их, и они отображались как случайные символы. Это было особенно проблема с PHP, поскольку он сломал включает.
Вы, вероятно, использовали редактор, который добавляет метку порядка байтов (BOM) в файл. Многие / большинство редакторов XML / редакторов веб-сайтов позволяет сохранять документ с / без BOM. Проверьте параметры сохранения в любом редакторе, который вы использовали.
Вы, вероятно, должны удалить спецификацию, чтобы избежать ошибки.
Если ваш редактор не поддерживает эту опцию, я могу порекомендовать отличный Notepad ++
Забудьте тот факт, что это XML, вам нужно проверить UTF-8. Может быть, просто открыть в Firefox и найти символ?? В противном случае смотрите проверку UTF-8 на переполнение стека.
If you're using tomcat you proably need to set up the encoding, I am using tomcat as a service in Windows and in the configuration options the following commmand did the trick for me:
Dfile.encoding=UTF-8
Hope it helps.
Похожие вопросы
-
8
Отображение XML в браузере Chrome
-
4
Как я могу просмотреть неформатированный RSS XML в браузере?
-
5
Grep инструмент для XML
-
-
3
Как сохранить документ XML в Mac OS X?
-
2
Инструмент для заполнения XML-файла на основе XSD
-
3
Заставьте emacs не удалять спецификацию из файлов XML
-
2
Преобразовать DTD в схему XSD
-
1
Чтение сводной таблицы Excel из xml
-
5
Преимущества формата DOCX перед DOC
-
5
Как я могу преобразовать файлы данных SAS в нечто простое, например, данные CSV?