На этом веб-сайте CDC доступны файлы правительственных данных, но они имеют странный формат SAS.
Как я могу преобразовать их в XML/CSV, то есть что-то гораздо более простое, что может быть прочитано скриптами и т.д.?
На этом веб-сайте CDC доступны файлы правительственных данных, но они имеют странный формат SAS.
Как я могу преобразовать их в XML/CSV, то есть что-то гораздо более простое, что может быть прочитано скриптами и т.д.?
Вы можете сделать это с помощью R-cran, если у вас есть файлы SAS xpt
. Используйте foreign
и hmisc
пакеты.
xpt = sasxport.get("xpt/DEMO.xpt")
write.csv(xpt, file="demo.csv")
SAS Institute (компания, которая производит SAS) создает программу просмотра для наборов данных SAS.
Обратите внимание, что программные файлы SAS обычно имеют расширение .sas
, тогда как сами файлы данных обычно имеют расширение .sas7bdat
.
StatTransfer преобразует файлы SAS в различные форматы и включает в себя параметры фильтрации переменных или наблюдений, настройки разделителя и изменения форматов хранения переменных во время передачи.
AM также будет скрывать данные, но он менее мощный / гибкий. AM бесплатна и написана для Windows.
Вы можете извлечь данные из.Файлы SAS7BDAT, использующие dsread из Oceanview Consultancy, см.
Он обрабатывает файлы с большинства платформ, хотя для некоторых платформ может потребоваться регистрация. Это быстрая и простая в использовании программа для командной строки Windows, которая также работает под Wine на Linux. Установка не требуется, просто запустите .exe.
Я понимаю, что это старый вопрос, но он обнаруживается в соответствующих веб-поисках, поэтому включение этого ответа поможет всем, кто хочет извлечь данные из проприетарного формата SAS7BDAT.
Отказ от ответственности: я разработчик dsread.
Если вы говорите о файлах SAS XPT, вы можете использовать модуль xport
Python.
import xport
with open('example.xpt', 'rb') as f:
for row in xport.Reader(f):
print row