Можно ли сказать, что символы спецификации также являются контрольными символами, такими как LF или CR?
Нет, это больше похоже на подпись:
Q: Что такое спецификация?
A: Метка порядка байтов (BOM) состоит из кода символа U + FEFF в начале потока данных, где его можно использовать в качестве сигнатуры, определяющей порядок байтов и форму кодирования, в основном из немаркированных файлов открытого текста. В некоторых протоколах более высокого уровня использование спецификации может быть обязательным (или запрещенным) в потоке данных Unicode, определенном в этом протоколе.
Источник FAQ - UTF-8, UTF-16, UTF-32 и спецификация
В своем вопросе вы заявляете:
Управляющие символы (символы, используемые для анализа того, как документально анализируется роботом или программой), такие как Line FInish (LF) или Carriage Return (CR).
Это выше неверно.
LF
обозначает перевод строки, а не перевод строки.Управляющие символы не имеют никакого отношения к тому, как анализируется документ:
Управляющий символ или непечатный символ - это кодовая точка (число) в наборе символов, которая не представляет письменный символ. Они используются в качестве внутриполосной сигнализации, чтобы вызвать эффекты, отличные от добавления символа к тексту.
Персонаж управления источником