Конвертировать между UTF-8 и 1255 онлайн и локально?

2528
barlop

У меня есть этот HTML-файл

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <HTML DIR="RTL" LANG="HE"> <HEAD> <META http-equiv="Content-Type" content="text/html; charset=Windows-1255"> </HEAD> <BODY> <H1>úåøä</H1> <H1>úåøä ðáéàéí åëúåáéí</H1> </BODY> </HTML> 

Это сохраняется как ANSI в блокноте. И когда он открывается в браузере, он отлично отображает некоторые еврейские символы.

Обратите внимание, что Chrome также может работать с UTF-8 и может быть скопирован в Ms Word 2010.

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <HTML DIR="RTL" LANG="HE"> <HEAD> <meta http-equiv="content-type" content="text/html;charset=UTF-8"> </HEAD> <BODY> <H1>תורה נביאים וכתובים</H1> </BODY> </HTML> 

Но следующее обсуждение включает в себя копирование / вставку из Windows-1255.

Копировать в буфер обмена в Chrome
Конвертировать между UTF-8 и 1255 онлайн и локально?

Вставка в мс слово 2010
сохранить исходное форматирование рис

Я могу использовать свой веб-браузер, чтобы конвертировать эту Windows-1255 в Unicode (например, как UTF-8).

Например, с этим HTML. Хром преобразует

úåøä ---> תורה
úåøä ðáéàéí åëúåáééí -> תורה נביאים וכתובים

Но как я могу конвертировать в другую сторону?

Например, предположим, у меня есть файл, который я пишу в блокноте

Она имеет

תורה  תורה נביאים וכתובים 

Я мог бы сохранить его как UTF-8 или нет вообще. Я мог бы оставить это в файле без названия.

Как я могу преобразовать это в

úåøä  úåøä ðáéàéí åëúåáéí  

Если я нахожу веб-страницу с надписью на иврите и вижу исходный текст в chrome, я вижу его на иврите и сохраняю его, и он появляется в Windows-1255. Как это происходит с http://www.mechon-mamre.org/i/t/t0.htm. Это потому, что сам файл хранится в Windows-1255, и если его сохранить и открыть в блокноте, он увидит это.

Если бы я скопировал ивритские символы в файл и сохранил его как utf-8, он отобразился бы в Chrome, но я не вижу, как преобразовать его в windows-1255.

Я не вижу, как даже получить блокнот для сохранения еврейских символов как Windows-1255

2

1 ответ на вопрос

0
barlop

For online I don't know. I only know latin->hebrew, by making an HTML page!

Locally one can go both ways in a good text editor quite easily.

For locally, dump notepad for this task, as while it supports UTF-8 and unicode characters including hebrew ones, it doesn't encode in Windows-1255(Hebrew) so when you try to save unicode as "ascii" it's not using windows 1255(hebrew). just 1252 or iso 8859-1 and it would not do it properly as the hebrew characters don't exist in 1252.

The funny characters-latin ones, you see is 1255(Hebrew) misread as 1252 - you can do that, but you can't save hebrew as 1252 'cos notepad wouldn't know or doesn't calculate which latin characters to use. It just says you'll lose some characters and if you try to save them it won't and when you read them after it hasn't saved correctly, you'll get question marks or squares. So forget notepad for saving hebrew characters

Use a text editor that supports Windows-1255(hebrew ascii). It works in editpad pro(not free). But notepad++ or babelpad probably do it just as easily too (though none of those programs are so good at the moment for pasting from them into ms word. epp you copy hebrew it pastes latin characters, notepad++ and babelpad you paste into word and don't get the "keep source formatting" option) but you can put the hebrew into an html page(like the utf-8 one in the question), and then copy it from chrome into ms word.

open editpad pro, click convert..text encoding.. windows 1255

copy/paste the hebrew characters from notepad into editpad pro.

save the file.

And you can go both ways.

úåøä ----convert to windows 1255 (should also open as 1255) get the hebrew. And convert back to 1252 (should also open as 1252) (western european)