Как я могу сделать старый файл легко читаемым?

377
A. Petit

У меня есть этот старый файл .dat ( в середине 90 - ых), по- видимому, закодированном в ANSI, 4000 строк, состоящий в основном из элементов управления, как NUL, SOH, ETX, STX..., что я хотел бы читать.

Я пытался преобразовать его в UTF-8 с помощью Notepad ++, некоторые элементы управления, например, NULудаляются, но многое еще осталось.
Я также попытался найти и заменить эти элементы управления, но они не попадают под действие функции поиска.

Как мне сделать этот файл понятным для человека?

РЕДАКТИРОВАТЬ для более подробной информации:
Этот файл взят из программного обеспечения, написанного на Borland C / C ++ 2.0, разработанного кем-то в компании, в которой я работаю (в качестве стажера). Этого человека здесь больше нет, и программное обеспечение работает с 1996 года на очень старом компьютере под управлением MS-DOS и играет чрезвычайно важную роль для бизнеса компании.
Я отвечаю за переделку этого программного обеспечения с использованием технологий .NET, баз данных ... что уже сделано, но теперь мне нужен этот файл, называемый STOCK.DATстарым программным обеспечением, который используется для записи / чтения всех исходных данных.

Используя шестнадцатеричный редактор, первые байты 30 35 30 00 20 33 35соответствуют 050. 35файлу, за которым следуют только 00до начала текста.

0
Наличие непечатных байтов в файле почти всегда указывает на то, что это * не * текстовый файл, даже если он может содержать текстовые данные. Вам нужно взглянуть на оригинальный исходный код. Daniel B 5 лет назад 0
Это файл "_binary_", и вы не сможете понять его с помощью текстового редактора. Если бы вы могли использовать шестнадцатеричный редактор (например, HxD), чтобы поделиться с нами первыми ~ 32 байтами, мы могли бы помочь определить, к какому типу файла это относится, и предложить способы его просмотра ... но это, скорее всего, сделанный на заказ формат, с которым мы не сможем помочь - проверьте исходный код. Attie 5 лет назад 0

1 ответ на вопрос

0
harrymc

Это звучит как бинарный файл или создается неясным продуктом редактора. Постфикс .datобычно используется для двоичных файлов или для вложений электронной почты.

Если вы хотите проверить читаемые строки внутри файла, вы можете использовать бесплатные строки Sysinternals .

Тип файла иногда может быть проанализирован из первых нескольких байтов. Если вы хотите, чтобы мы посмотрели, добавьте сюда шестнадцатеричный дамп начала этого файла.

Спасибо за `Strings`, он сделал файл действительно читабельным. Это также выглядит так, как будто неправильно интерпретирует некоторые вещи, так как некоторые части (числа) кажутся удаленными. Я также отредактировал оригинальный пост на случай, если это поможет. A. Petit 5 лет назад 0
Так что это действительно бинарный файл. Числа возможно в двоичной форме. harrymc 5 лет назад 0