Поддержание порядка слов при копировании иврита с сайта SE и в MS Word

4245
Isaac Moses

Когда я пытаюсь скопировать текст из Mi Yodeya (сайт Judaism SE, который я обычно рисую в Chrome) в документ MS Word (с использованием Word 2007 в Windows 7), например, этот, я обнаруживаю, что текст на иврите встречается со словами в обратном порядке. Есть ли удобный способ сделать текст в правильном порядке? Я открыт для техник в MS Word, техник редактирования постов в SE или всего, что между ними.

По предложению and31415 я следовал процедурам, приведенным в этой ссылке, чтобы добавить ивритскую клавиатуру, включить ее и добавить кнопки RTL и LTR в Word. Текст по-прежнему вставляется со словами в обратном порядке, и если я выделю его и нажму кнопку RTL, все еще перевернутое предложение просто переместится вправо на страницу.

6
Вы должны указать операционную систему, которую вы установили, браузер, который вы используете, и версию Microsoft Word. and31415 10 лет назад 0
@ and31415 Спасибо. Я добавил браузер. Два других уже были там. Isaac Moses 10 лет назад 1
Вы уже пытались [включить направление справа налево] (http://symbolcodes.tlt.psu.edu/keyboards/winrtl.html) в Word уже? and31415 10 лет назад 0
@ and31415 Спасибо. Я просто следовал инструкциям в вашей ссылке, чтобы добавить ивритскую клавиатуру, включить ее и добавить кнопки RTL и LTR в Word. Текст по-прежнему вставляется со словами в обратном порядке, и если я выберу его и нажму кнопку RTL, все еще перевернутое предложение просто переместится вправо на страницу. Я добавляю эту информацию в вопрос. Isaac Moses 10 лет назад 2
У меня не совсем такая комбинация (Word2007 + Vista + Chrome), но все работает нормально. Я постараюсь увидеть, что на самом деле в буфере обмена. Если вы вставляете в Блокнот, затем выбираете, повторно копируете и вставляете в Word, это что-то меняет. 10 лет назад 0
@bibadia, когда я вставляю в Блокнот, порядок правильный. Когда я копирую из Блокнота и вставляю в Word, порядок неверный. Isaac Moses 10 лет назад 0
@ Исаак Моисей: все еще не могу воспроизвести здесь. Я иногда видел частичное обращение при копировании из IE (вероятно, из-за того, как закодирован "()"). Глядя на буфер обмена здесь, вы обнаруживаете, что по крайней мере один из форматов, которые Chrome помещает в буфер обмена («OEM Text»), _probbly_ полностью изменен, но ничего, что я здесь делаю, кажется, не вставляет эту версию. Есть несколько предложений на http://stackoverflow.com/questions/9613613/why-words-are-shuffled-when-i-insert-english-words-in-any-arabic-urdu-persian-te, которые вы можете попробовать но я подозреваю, что есть еще один фактор. 10 лет назад 1
Если вы можете сохранить образец в формате .docx сразу после редактирования и поместить его где-нибудь для загрузки, я посмотрю, что на самом деле находится в файле, и посмотрю, смогу ли я найти способ изменить последовательность. 10 лет назад 1
@bibadia, спасибо! [Вот] (https://drive.google.com/file/d/0B0TqzcduQYHTOFVIX3FHeW5ZMUU/edit?usp=sharing) файл .docx. (Хорошо. Когда GDocs отображает его, слова располагаются в правильном порядке. Когда я загружаю файл и открываю в Word, я получаю неправильный порядок.) Я обдумываю поиск / создание сценария VBA для повторного обращения слов как возможное последнее средство. Isaac Moses 10 лет назад 0
Не намного дальше, но можем ли мы перейти к «чату» суперпользователя? Я никогда не использовал это, но я верю, что это то, что мы должны делать. 10 лет назад 0

3 ответа на вопрос

0
einpoklum

Is there a convenient way to make the text end up in the right order?

Yes, change the paragraph direction from Left-to-Right to Right-to-Left, and the word order will be corrected. This works for me with MS Word 2010.

I'm not sure exactly why we see the words in reverse order. I suspected the reason for this weird behavior was embedded Unicode control characters in that text, but that's not the case (To make sure of this claim, copy the text into a text file, take a hex dump of it, and put it in here as 'Hexadecimal' to get a UTF-8 analysis.)

Разве вы не находите, что изменение направления абзаца недостаточно, если, например, текст содержит (), как в примере файла? Проблема в том, что я не думаю, что Word применяет двунаправленный алгоритм Unicode в этом случае, и текст перестраивается только частично. По крайней мере, так и происходит. 10 лет назад 0
Ну нет. (За исключением того, что закрывающая скобка неверна даже после того, как я изменил направление абзаца.) einpoklum 10 лет назад 0
Да, это просто брекеты, не так ли? 10 лет назад 0
Это отличается от использования кнопки RTL, как описано в вопросе? Я попробовал это, и это не сработало. Isaac Moses 10 лет назад 0
@IsaacMoses: Я не совсем уверен, к каким кнопкам относится вопрос ... если это кнопки направления абзаца, тогда да, а затем мой ответ «Работает для меня (TM)». einpoklum 10 лет назад 0
0
Crystal

Просто решил это для себя, читая комментарии.

Это должно быть в кодировке.

Когда я копирую текст на иврите из браузера, если я сначала вставляю его в «WordPad», а не в Word Docx, а затем копирую из «WordPad» в Word Docx, буквы не меняются. Почти как дополнительное кодирование «теряется» после публикации в WordPad, вероятно, потому что это «простая» программа.

Надеюсь это поможет ;-)

Интересно. Вы пробовали Блокнот? Scott 6 лет назад 0
-1
Yonasan

возможно, вы не загрузили пакет корректуры на иврите от Microsoft. У меня была та же самая проблема, и когда я загрузил это, проблема прояснилась.

ответ не может быть основан на предположениях, и он будет отвечать на основе фактов и ссылок h0ch5tr4355 8 лет назад 0

Похожие вопросы