Вы можете сделать это с помощью R-cran, если у вас есть xpt
файлы SAS . Используйте foreign
и hmisc
пакеты.
xpt = sasxport.get("xpt/DEMO.xpt") write.csv(xpt, file="demo.csv")
На этом сайте CDC есть файлы с правительственными данными, но они в странном формате SAS.
Как я могу преобразовать их в XML / CSV, то есть что-то гораздо более простое, что может быть прочитано скриптами и т. Д.?
Вы можете сделать это с помощью R-cran, если у вас есть xpt
файлы SAS . Используйте foreign
и hmisc
пакеты.
xpt = sasxport.get("xpt/DEMO.xpt") write.csv(xpt, file="demo.csv")
SAS Institute (компания, которая производит SAS) создает программу просмотра для наборов данных SAS .
Обратите внимание, что программные файлы SAS обычно имеют расширение .sas
, тогда как сами файлы данных обычно имеют расширение .sas7bdat
.
StatTransfer преобразует файлы SAS в различные форматы и включает в себя параметры фильтрации переменных или наблюдений, настройки разделителя и изменения форматов хранения переменных во время передачи.
AM также будет скрывать данные, но он менее мощный / гибкий. AM бесплатна и написана для Windows.
Вы можете извлечь данные из файлов .SAS7BDAT, используя dsread из Oceanview Consultancy, см.
Он обрабатывает файлы с большинства платформ, хотя для некоторых платформ может потребоваться регистрация. Это быстрая и простая в использовании программа для командной строки Windows, которая также работает под Wine на Linux. Установка не требуется, просто запустите .exe.
Я понимаю, что это старый вопрос, но он обнаруживается в соответствующих веб-поисках, поэтому включение этого ответа поможет всем, кто хочет извлечь данные из проприетарного формата SAS7BDAT.
Отказ от ответственности: я разработчик dsread.
Если вы говорите о файлах SAS XPT, вы можете использовать xport
модуль Python.
import xport with open('example.xpt', 'rb') as f: for row in xport.Reader(f): print row