Не удается скопировать текст из зашифрованного документа в Интернете

1347
Rafael

Я не могу распечатать страницу или скопировать текст, потому что это по какой-то причине зашифрованная загрузка не вариант!

Если я скопирую следующее:

She is unapproachable 

Я получаю это при вставке в любую программу / приложение:

Zdn az ~gfppbfjdf`hn 

Онлайн PDF .

Подобные вопросы, такие как, Не могу скопировать текст из файла PDF, не вписываются в описание моего вопроса, и я искал в течение 1 часа.

Кто-нибудь может указать мне правильное направление?

1
Вам нужно будет расшифровать файл PDF, чтобы скопировать содержимое PDF. Ramhound 11 лет назад 0
@Ramhound Не совсем; см. мой ответ ниже. Aaron Miller 11 лет назад 0
Дело в том, что я не могу скачать файл. PDF застрял на веб-сайте, даже не в браузере. как вы можете увидеть по ссылке «онлайн PDF» Rafael 11 лет назад 0
Возможный дубликат / связанный с [PDF имеет искаженный текст при вставке копии] (http://superuser.com/questions/137824/pdf-has-garbled-text-when-copy-pasting), http://superuser.com / questions / 481493, http://superuser.com/questions/119393, http://superuser.com/questions/165073 ... Karan 11 лет назад 0
@ Каран, если вы прочитаете мой вопрос еще раз, вам будет понятнее понять, почему он связан, а не является дубликатом. Rafael 11 лет назад 0
PDF-файлы поддерживают пароли пользователей и владельцев, и как только вы их предоставите, вы сможете свободно просматривать и копировать текст. То, что вы описываете, т.е. показанный простой текст, но скопированный искаженный текст, не является результатом шифрования, но, скорее всего, является результатом нестандартного кодирования символов (см. Третий вопрос, связанный выше, например, 119393). PDF-файлы не могут магически зашифровать обычный текст, когда вы копируете его в буфер обмена. Karan 11 лет назад 0
Это на самом деле не PDF. Веб-страница использует шифр замещения и соответствующий шрифт, который отображает правильные символы. На самом деле это довольно интересная техника. daxlerod 11 лет назад 0
@AaronMiller - Вы предложили, чтобы он расшифровал содержимое, я предложил, он расшифровал файл. Мы в основном предложили то же самое. Он не упомянул, что у него нет физической копии PDF, и при этом он не был ее автором. Ramhound 11 лет назад 0

1 ответ на вопрос

4
Aaron Miller

I don't have a solution for the question you're actually asking, that is, how to copy text and have it come out readable.

However! It looks from your example like the "encryption" here is a simple character substitution. This being the case, it wouldn't be too hard to pass the copied text through a filter to decrypt it and produce a readable result. For example, assume the following script called decrypt.pl:

#!/usr/bin/perl use strict; use utf8; binmode STDIN, ':utf8'; my %map = ( # from => to 'z' => 's', 'd' => 'h', 'n' => 'e', 'a' => 'i', '~' => 'u', 'g' => 'n', 'f' => 'a', 'p' => 'p', '' => 'r', 'b' => 'o', 'j' => 'c', 'd' => 'h', '`' => 'b', 'h' => 'l', # other substitutions here ); while (my $line = <STDIN>) { foreach my $char (split(//, $line)) { my $upcase = (lc($char) eq $char ? 0 : 1); my $found = $map; if (!$found) { die "No substitution found for character '$char'\n"; }; $found = uc($found) if $upcase; print $found; }; }; 

If you copy whatever text you want from the PDF into a file called e.g. source, then execute cat source | perl decrypt.pl > destination, then the file destination will contain the decrypted content:

[user@host tmp]$ echo 'Zdn az ~gfppbfjdf`hn' > source [user@host tmp]$ cat source | perl decrypt.pl > destination [user@host tmp]$ cat destination She is unapproachable [user@host tmp]$ 
Вы указали мне правильное направление, я сделал для него расшифровщик, который сработал + просмотр кэшированной версии (благодаря базе данных Google) также был отличной идеей для копирования текста. Rafael 11 лет назад 0