Проблема, описанная в вопросе, возникает, когда для пустого / нового документа установлено значение «ANSI», и в него вставляются символы Unicode .
При использовании с пустым / новым документом автоопределение отсутствует, по крайней мере, в той версии Notepad ++, на которой я его тестировал. «ANSI» является значением по умолчанию в Notepad ++ для нового документа, если оно не задано в меню « Настройки» -> « Настройки» -> вкладка « Новый документ» / «Открыть каталог». .
Решение
Решение состоит в том, чтобы установить кодировку в UTF-8 перед вставкой, меню Формат -> Кодировать в UTF-8 :
пример
Я скопировал некоторый текст в новый документ Notepad ++, русский (русский язык, русский язык), из Firefox, показывающий страницу Википедии на русском языке .
Если кодировка не изменилась с «ANSI», это результат:
Если кодирование будет изменено это результат:
Как видно на рисунке ниже ( выделена часть кириллицы ), Notepad ++ фактически преобразует символы Unicode в ASCII 63 (hex 3F), вопросительные знаки. Вот почему символы Unicode теряются (в режиме «ANSI» ) при копировании текста через буфер обмена (это не проблема шрифта - информация теряется).
Проверено на: Notepad ++ v5.4.5 (UNICODE).