.SAV вариант №
Файл SAV представляет собой файл данных, созданный Статистическим пакетом для социальных наук (SPSS), который представляет собой приложение, широко используемое исследователями рынка, исследователями в области здравоохранения, исследовательскими компаниями, правительством, исследователями в области образования, маркетинговыми организациями, сборщиками данных для статистического анализа. SAV сохраняется в проприетарном двоичном формате и состоит из набора данных, а также словаря, который представляет набор данных, сохраняет данные в строках и столбцах.
Формат файла SAV
Формат файла SAV стал относительно стабильным, но нельзя сказать, что он статичен. Обратная и прямая совместимость доступна при необходимости, но не поддерживается должным образом. Данные в файле SAV подразделяются на следующие разделы:
Заголовок файла
Он состоит из 176 байт. Первые 4 байта указывают строку $FL2 или $FL3 в кодировке символов, используемой для файла. Последние три байта означают, что данные в файле сжаты с использованием ZLIB. Следующая 60-байтовая строка начинается с @(#) ФАЙЛ ДАННЫХ SPSS и также определяет операционную систему и версию SPSS, в которой был создан файл. Затем заголовок продолжается шестизначными полями, содержащими количество переменных на наблюдение и цифровой код для сжатия, и заканчивается символьными данными, указывающими дату и время создания, и меткой файла.
Записи дескрипторов переменных
Запись содержит фиксированную последовательность полей, классифицирующих тип и имя переменной вместе с информацией о форматировании, используемой SPSS. Каждая запись переменной может дополнительно содержать метку переменной длиной до 120 символов и до трех спецификаций отсутствующих значений.
Метки значений
Метки значений являются необязательными и хранятся в парах записей с целочисленными тегами 3 и 4. Первая запись с тегом 3 содержит последовательность пар полей, каждая пара содержит значение и связанную с ним метку значения. Вторая запись, тэг 4, представляет, к каким переменным применяется набор значений/меток.
Документы
Одна или несколько записей с целочисленным тегом 6. Дополнительная документация. содержит 80-символьные строки.
Записи расширения
Одна или несколько записей с целочисленным тегом 7. Записи расширения предоставляют информацию, которую можно безопасно игнорировать, но ее сохранение во многих ситуациях позволяет файлам, написанным более новым программным обеспечением, сохранять обратную совместимость. Записи расширения имеют целочисленные теги подтипа.
Терминатор словаря
Только запись с целочисленным тегом 999. Он отделяет словарь от наблюдений за данными.
Наблюдения за данными
Считается, что данные расположены в порядке наблюдения, например, все значения переменных для первого наблюдения, за которыми следуют все значения для второго наблюдения и т. д. Формат записи данных зависит от кода сжатия в записи заголовка файла. Часть данных файла .sav можно распаковать:
- код 0: сжато байт-кодом
- код 1: сжато с использованием сжатия ZLIB