Последовательность символов «½», вставляемая в сообщения Outlook 2007

2602
fixer1234

Сообщения электронной почты между моей женой и мной недавно начали повреждаться при вставке последовательности символов «½» в сообщения. Похоже, это проблема кодировки.

Этот вопрос о SO идентифицирует строку как UTF-8 для символа « ». Различные дискуссии, найденные Googling, показывают, что люди испытывали множество других символов (например, апостроф и многоточие), заменяемых этой строкой в ​​электронной почте и при просмотре веб-сайтов. Кажется, что этот символ UTF-8 используется в качестве общей замены для множества неперерисовываемых символов.

В этом случае я использую Thunderbird (V52.5.0) в Linux, а моя жена использует Outlook (2007) в Windows 7 (оба форматируют сообщения как HTML).

Thunderbird вставляет некоторые невидимые маркеры форматирования, которые заменяются этой строкой в ​​Outlook. Строка появляется в двух типах местоположений:

  • замена первого из двух пробелов между точкой в ​​конце предложения и следующим предложением
  • возврат каретки используется для создания пустых строк между абзацами.

Подстановка происходит в Outlook и применяется ко всему потоку сообщений, отображенному в Thunderbird. Это включает в себя старые сообщения, которые были отправлены в Outlook, но были частью потока, отображаемого в Thunderbird перед ответом обратно в Outlook.

Это замена персонажа, а не проблема рендеринга. После замены строки повреждение сохраняется при последующем просмотре сообщения в любой из систем.

Это очень недавняя проблема, поэтому я предполагаю, что обновление программного обеспечения или ОС на одной из систем является ответственным.

Я посмотрел на настройки кодирования в Thunderbird и Outlook и, действительно, они были пестрой смесью; какой-то UTF-8, какой-то западноевропейский (понятия не имею, откуда это могло появиться) и что-то еще, я думаю, западный ISO 8859). Я установил все на UTF-8. Вот что я нашел и изменил:

  • Thunderbird: Preferences | Display | Formating | Fonts Advanced | Text Encoding
  • Outlook: Tools | Options | Mail Format | International Options
    также:Tools | Options | Other | General | Advanced Options | Use Unicode message format when saving messages

Я также проверил, что настройки локали все еще корректны в обеих системах (США, американский английский и т. Д.).

К сожалению, симптом не изменился. Есть ли настройки кодирования, скрытые в различных и разных местах в Thunderbird или Outlook, которые я мог пропустить (или какая-то другая проблема)?

4
Так что это должен быть знак фунта ([£] (https://www.alt-codes.net/pound_alt_code.php))? Похоже, ответ [связан с настройками UTF-8 в Outlook] (https://forums.slipstick.com/threads/50137-pound-symbol-in-emails-show-as-i-black-diamond-with- белый знак вопроса-в-офисно-2010 /). JakeGould 6 лет назад 0
@JakeGould, Outlook заменяет один или несколько маркеров форматирования (не символ фунта). По какой-то причине этот символ UTF-8 обычно используется в качестве универсальной замены для множества неперерисовываемых символов. Я перепроверил языковые настройки на обеих машинах, и они все еще верны (американский, американский английский и т. Д.). fixer1234 6 лет назад 1
Хороший вопрос, независимо! JakeGould 6 лет назад 0

2 ответа на вопрос

3
fixer1234

Похоже, что проблема была в кодировке. Я проводил повторное тестирование со старыми сообщениями, которые, по моему мнению, не были повреждены. На самом деле, похоже, что они уже были испорчены. Предложение Саида Сепера провести тестирование с помощью веб-почты привело к созданию свежих сообщений и ответов в обоих направлениях, которые не имели симптомов.

Так что установка всей кодировки UTF-8 в обеих системах была тем, что решило проблему. И теперь это проверено.

Я обнаружил, что другой пользователь Thunderbird опубликовал аналогичный вопрос на форуме поддержки Mozilla в начале декабря. Люди, которые столкнулись с проблемой, имели кодировку Western (ISO-8859-1). Установка его в UTF-8 была, по крайней мере, частью решения.

Дополнительная рекомендация, которая, похоже, помогла некоторым пользователям (или, по крайней мере, не повредила):

Edit | Preferences | Display | Formatting | Fonts Advanced | Text Encoding | 

Установите флажок для When possible, use the default text encoding in replies. Предупреждение: делайте это только в сочетании с настройкой кодировки в UTF-8. Выполнение этого с кодировкой Western (ISO-8859-1) усугубит проблему.

Обратите внимание, что пути меню немного изменились в разных версиях, поэтому вам может понадобиться найти настройки, упомянутые здесь и в вопросе, в зависимости от вашей версии Thunderbird.

2
Saeed Sepehr

Похоже, вы отправляете электронные письма в формате HTML, но исходное программное обеспечение вставляет символы BOM (метка порядка байтов) в текст сообщения. Возможно, вы не можете их видеть, потому что это в основном происходит для неанглийских типов ввода из-за разной длины битов для каждого символа.

Я не использую Thunderbird, но вы можете проверить, есть ли какая-либо опция, помеченная как "без спецификации" в представлении кодирования, поэтому проверьте ее.

Другой вариант, который, я думаю, работает, - это использование UTF-16 в клиенте отправителя (Thunderbird) и то же самое в представлении кодирования в месте назначения (Outlook).

Это почти наверняка ответ dgo 6 лет назад 0
Спасибо за ваш ответ. Похоже, спецификация была проблемой несколько лет назад. Проблема, казалось, возникла, когда спецификация была удалена. Я не смог найти ни одной опции, связанной с спецификацией ни в одной из систем. На самом деле, рекомендации были на самом деле перейти на UTF-8 в качестве решения. Я немного обеспокоен переходом на UTF-16, чтобы решить эту проблему для одной пары, поскольку это может создать проблемы с другими получателями. Кажется, проблема возникает в Outlook 2007 на этой машине. Я сделаю некоторые эксперименты и исследования и вернусь к вам. fixer1234 6 лет назад 0
Версия Outlook может быть главной проблемой. Почему бы вам не обновить его? Кстати, вы когда-нибудь пробовали версию веб-почты на принимающей стороне ?! Если вы проверите и не видите проблем, таких как Outlook, конечно, отправитель не имеет проблем. Также о UTF-16, просто попробуйте! Не взорвется;) Saeed Sepehr 6 лет назад 0
@SaeedSepehr, тестирование с помощью веб-почты было отличной идеей. Это помогло определить, что происходит. Я замкну цикл с ответом. Ваш ответ не был решением в этом случае, но он и ваши комментарии привели к интересному обучению и решению (фактически выявив, что предыдущие усилия решили проблему), так что +1. fixer1234 6 лет назад 1