[통계패키지] SAS 시스템 개요
- 통계패키지: 각 통계처리에 적합하도록 미리 작성된 프로그램에 자료를 입력시키고 요구하는 자료처리방법을 지정하면 통계분석결과를 출력하는 프로그램집
- SAS 시스템: 자료의 입력과 저장 수정 검색, 파일편집, 단순기술통계분석, 보고서작성 등의 필수기능을 제공하는 기본 SAS 소프트웨어
- SAS 작업공간: SAS 시스템에 연관된 모든 작업을 하는 그래픽스 공간
- SAS 기본화면: 세조각으로 되어 있는데 위로부터 확장편집기, 로그화면, 탐색기화면, 출력화면으로 구성
프록스텝
: 데이터분석을 하기 위한 절차를 정의데이터스텝
: 자료의 입력과 구조변경 저장 등을 수행
통계패키지란
컴퓨터의 통계적 활용
- 자료의 수집
- 자료의 처리 (컴퓨터 활용으로 빠르게, 정확하게 처리)
- 자료의 관찰 (Simulation, 가상적 자료를 얻는다.)
- 자료의 분석 및 요약
통계패키지 (Statistical Package)
다양한
원자료
를표준형식으로 저장
한 후 각종 통계분석방법들을 명령하는 keyword나 지정내용을 선택하여 통계분석 결과를 얻는 프로그램집
자료 입력 → 통계분석방법 명령어
지정 → 통계분석결과 자동 출력
SAS (Strategic Application Software)
1966년 미국의 North Corolina 주립대학에서 연구개발을 출발로 종합정보처리 시스템
으로 발전
장점
- 데이터의 구조변경이 용이하다.
- 공인된 거의 모든 통계분석을 포함한다.
- 보고서 작성, 그래픽에 강하다
- Excel, Oracle 등 다양한 데이터베이스 포맷의 저장 데이터를 직접 입력할 수 있다.
SAS 시스템의 구성요소
baseSAS
- 분석
- 시각화 및 검색
- 비즈니스 솔루션
- web 사용 가능
- 응용프로그램 개발
- 클라이언트 응용프로그램
- 데이터 액세스 및 관리
- 리포팅 및 그래픽
데이터 엑세스 → 관리 (변형) → 분석 및 프리젠테이션
SAS 시스템
SAS 작업공간
SAS 시스템을 가동하면 로고화면과 함께 SAS 응용작업공간(AWS: Application Work Space)이 나타난다.
SAS 기본화면은 확장편집기, 로그화면, 출력화면으로 구성된다.
확장편집기
- 필요한 작어블 SAS문으로 작성
- 완성된 프로그램을 시스템에 접수하여 실행(submit)
로그화면
- 수행된 SAS 프로그램에 관한 메시지 출력
- 오류메시지(error message), 경고메시지 출력
출력화면
- SAS 프로그램의 수행결과 출력
- 텍스트 파일이나 web용
HTML로 저장가능
- HTML 파일: 도구 → 옵션 → 설정 → 결과
온라인 설명서
버전별 온라인 설명서 : http://support.sas.com/documentation/index.html
SAS 9.3.1 온라인 설명서: http://support.sas.com/onlinedoc/913/
SAS 프로그램 편집과 실행
- 자료와 원하는 통계분석의 프로그램을 지정하여 자료파일을 만든다.
- SAS 안에서 프로그램을 컴파일하고 이것을 수행하여 여기서 생긴 수행 가능 프로그램에 오류가 발생하면 수정하여 프로그램을 완성한다.
- 원자료를 넣어 출력결과를 얻게 된다.
- 출력결과를 해석한다.
자료 및 프로그램 입력 → (프로그램 컴파일
) → 수행 → 수행가능 프로그램 → (원자료
) → 출력 결과 (Report/File)
SAS 프로그램 수행
실제 컴퓨터에 입력된 SAS source 프로그램은 전체적으로 두개의 큰 덩어리로 데이터스텝
과 프록스텝
으로 나누어진다.
DATA Step(s)
- 자료의 입력
- 입력된 자료의 구조 변경
- 기존변수 변호나 및 새변수 생성
- 자료의 저장
- SAS DATA Set 생성
DATA;
...
RUN;
PROC Step(s)
- 데이터 분석을 하기 위한 절차 정의
- 여러종류의 수행을 각각의 PROC 스텝으로 수행할 수 있다.
SAS 데이터 셋 → PROC Step → Output
SAS 프로그램
실제로 하나의 데이터파일에 하나의 프록스텝이 구성될 수도 있고 여러개의 프록스텝이 구성될 수도 있다.
SAS 프로그램 수행
데이터스텝과 프록스텝에 수행명령어 등이 결합되면 그 출력결과를 얻게 되는 것이다. 이 과정을 SAS 윈도우에서 제시되는 메뉴들 중 적합한 명령키워드 항목을 클릭함으로써 짧은 시간 내에 효율적으로 수행할 수 있다.
PROC PRINT 수행
일반적인 형태의 프린트 수행은 다음의 문장으로 수행된다.
PROC PRINT DATA = SAS_data_set_name;
...
RUN;
'Blog > MOOC' 카테고리의 다른 글
[데이터 시각화] 탐색적 자료분석(EDA) 시각화 Ⅰ (0) | 2017.03.26 |
---|---|
[통계패키지] SAS 문장 사용법 (0) | 2017.03.20 |
[금융데이터의 이해] 생활속의 금융데이터 - 3 (0) | 2017.03.15 |
[금융데이터의 이해] 생활속의 금융데이터 - 2 (0) | 2017.03.14 |
[금융데이터의 이해] 생활속의 금융데이터 - 1 (0) | 2017.03.14 |
댓글