.SAV 파일이란?
SAV 파일은 SPSS(Statistical Package for Social Sciences)에서 생성한 데이터 파일로, 시장 연구원, 건강 연구원, 조사 회사, 정부, 교육 연구원, 마케팅 기관, 데이터 마이너가 통계 분석을 위해 널리 사용하는 응용 프로그램입니다. 독점 바이너리 형식으로 저장되는 SAV는 데이터 세트와 데이터 세트를 나타내는 사전으로 구성되며 데이터를 행과 열에 저장합니다.
SAV 파일 형식
SAV 파일 형식은 비교적 안정적이 되었지만 정적으로 말할 수는 없습니다. 필요한 경우 역방향 및 순방향 호환성을 선택적으로 사용할 수 있지만 제대로 유지되지 않습니다. SAV 파일의 데이터는 다음 섹션으로 분류됩니다.
파일 헤더
176바이트로 구성되어 있습니다. 처음 4바이트는 파일에 사용된 문자 인코딩의 $FL2 또는 $FL3 문자열을 나타냅니다. 마지막 3바이트는 파일의 데이터가 ZLIB를 사용하여 압축되었음을 나타냅니다. 다음 60바이트 문자열은 @(#) SPSS DATA FILE로 시작하며 파일을 생성한 운영 체제 및 SPSS 버전도 확인합니다. 그런 다음 헤더는 관찰당 변수 수와 압축을 위한 숫자 코드를 포함하는 6자리 필드로 계속되고 생성 날짜 및 시간과 파일 레이블을 나타내는 문자 데이터로 끝납니다.
변수 설명자 레코드
레코드에는 SPSS에서 사용하는 형식 지정 정보와 함께 변수의 유형 및 이름을 분류하는 고정된 필드 시퀀스가 포함됩니다. 각 변수 레코드는 선택적으로 최대 120자의 변수 레이블과 최대 3개의 결측값 사양을 포함할 수 있습니다.
값 레이블
값 레이블은 선택 사항이며 정수 태그 3 및 4가 있는 레코드 쌍에 저장됩니다. 태그 3인 첫 번째 레코드에는 일련의 필드 쌍이 있으며 각 쌍에는 값 및 연관된 값 레이블이 포함됩니다. 태그 4인 두 번째 레코드는 값/레이블 세트가 적용되는 변수를 나타냅니다.
문서
정수 태그 6이 있는 단일 또는 다중 레코드. 선택적 문서. 80자 라인을 포함합니다.
확장 레코드
정수 태그 7이 있는 단일 또는 다중 레코드. 확장 레코드는 안전하게 무시할 수 있는 정보를 제공하지만 많은 상황에서 보존되어 최신 소프트웨어로 작성된 파일이 이전 버전과의 호환성을 유지할 수 있습니다. 확장 레코드에는 정수 하위 유형 태그가 있습니다.
사전 종결자
정수 태그가 999인 레코드만 기록합니다. 데이터 관찰에서 사전을 분리합니다.
데이터 관찰
데이터는 관찰 순서대로 간주됩니다(예: 첫 번째 관찰에 대한 모든 변수 값, 두 번째 관찰에 대한 모든 값 뒤에 오는 등). 데이터 레코드의 형식은 파일 헤더 레코드의 압축 코드에 따라 다릅니다. .sav 파일의 데이터 부분을 압축 해제할 수 있습니다.
- 코드 0: 바이트코드로 압축
- 코드 1: ZLIB 압축을 사용하여 압축