본문 바로가기
Blog/MOOC

[통계패키지] SAS 시스템 개요

by NAMP 2017. 3. 15.

[통계패키지] SAS 시스템 개요

  • 통계패키지: 각 통계처리에 적합하도록 미리 작성된 프로그램에 자료를 입력시키고 요구하는 자료처리방법을 지정하면 통계분석결과를 출력하는 프로그램집
  • SAS 시스템: 자료의 입력과 저장 수정 검색, 파일편집, 단순기술통계분석, 보고서작성 등의 필수기능을 제공하는 기본 SAS 소프트웨어
  • SAS 작업공간: SAS 시스템에 연관된 모든 작업을 하는 그래픽스 공간
  • SAS 기본화면: 세조각으로 되어 있는데 위로부터 확장편집기, 로그화면, 탐색기화면, 출력화면으로 구성
  • 프록스텝: 데이터분석을 하기 위한 절차를 정의
  • 데이터스텝: 자료의 입력과 구조변경 저장 등을 수행

통계패키지란

컴퓨터의 통계적 활용

  1. 자료의 수집
  2. 자료의 처리 (컴퓨터 활용으로 빠르게, 정확하게 처리)
  3. 자료의 관찰 (Simulation, 가상적 자료를 얻는다.)
  4. 자료의 분석 및 요약

통계패키지 (Statistical Package)

다양한 원자료표준형식으로 저장한 후 각종 통계분석방법들을 명령하는 keyword나 지정내용을 선택하여 통계분석 결과를 얻는 프로그램집

자료 입력 → 통계분석방법 명령어 지정 → 통계분석결과 자동 출력

SAS (Strategic Application Software)

1966년 미국의 North Corolina 주립대학에서 연구개발을 출발로 종합정보처리 시스템으로 발전

장점

  1. 데이터의 구조변경이 용이하다.
  2. 공인된 거의 모든 통계분석을 포함한다.
  3. 보고서 작성, 그래픽에 강하다
  4. Excel, Oracle 등 다양한 데이터베이스 포맷의 저장 데이터를 직접 입력할 수 있다.

SAS 시스템의 구성요소

baseSAS

  • 분석
  • 시각화 및 검색
  • 비즈니스 솔루션
  • web 사용 가능
  • 응용프로그램 개발
  • 클라이언트 응용프로그램
  • 데이터 액세스 및 관리
  • 리포팅 및 그래픽

데이터 엑세스 → 관리 (변형) → 분석 및 프리젠테이션

SAS 시스템

SAS 작업공간

SAS 시스템을 가동하면 로고화면과 함께 SAS 응용작업공간(AWS: Application Work Space)이 나타난다.

SAS 기본화면은 확장편집기, 로그화면, 출력화면으로 구성된다.

확장편집기

  • 필요한 작어블 SAS문으로 작성
  • 완성된 프로그램을 시스템에 접수하여 실행(submit)

로그화면

  • 수행된 SAS 프로그램에 관한 메시지 출력
  • 오류메시지(error message), 경고메시지 출력

출력화면

  • SAS 프로그램의 수행결과 출력
  • 텍스트 파일이나 web용 HTML로 저장가능
  • HTML 파일: 도구 → 옵션 → 설정 → 결과

온라인 설명서

버전별 온라인 설명서 : http://support.sas.com/documentation/index.html

SAS 9.3.1 온라인 설명서: http://support.sas.com/onlinedoc/913/

SAS 프로그램 편집과 실행

  1. 자료와 원하는 통계분석의 프로그램을 지정하여 자료파일을 만든다.
  2. SAS 안에서 프로그램을 컴파일하고 이것을 수행하여 여기서 생긴 수행 가능 프로그램에 오류가 발생하면 수정하여 프로그램을 완성한다.
  3. 원자료를 넣어 출력결과를 얻게 된다.
  4. 출력결과를 해석한다.

자료 및 프로그램 입력 → (프로그램 컴파일) → 수행 → 수행가능 프로그램 → (원자료) → 출력 결과 (Report/File)

SAS 프로그램 수행

실제 컴퓨터에 입력된 SAS source 프로그램은 전체적으로 두개의 큰 덩어리로 데이터스텝프록스텝으로 나누어진다.

DATA Step(s)

  • 자료의 입력
  • 입력된 자료의 구조 변경
  • 기존변수 변호나 및 새변수 생성
  • 자료의 저장
  • SAS DATA Set 생성
DATA;
...
RUN;

PROC Step(s)

  • 데이터 분석을 하기 위한 절차 정의
  • 여러종류의 수행을 각각의 PROC 스텝으로 수행할 수 있다.

SAS 데이터 셋 → PROC Step → Output

SAS 프로그램

실제로 하나의 데이터파일에 하나의 프록스텝이 구성될 수도 있고 여러개의 프록스텝이 구성될 수도 있다.

SAS 프로그램 수행

데이터스텝과 프록스텝에 수행명령어 등이 결합되면 그 출력결과를 얻게 되는 것이다. 이 과정을 SAS 윈도우에서 제시되는 메뉴들 중 적합한 명령키워드 항목을 클릭함으로써 짧은 시간 내에 효율적으로 수행할 수 있다.

PROC PRINT 수행

일반적인 형태의 프린트 수행은 다음의 문장으로 수행된다.

PROC PRINT DATA = SAS_data_set_name;
...
RUN;

댓글