본문 바로가기
Blog/MOOC

[데이터 시각화] 데이터 시각화란 무엇인가

by NAMP 2017. 3. 5.

[데이터 시각화] 데이터 시각화란 무엇인가

  1. 데이터 시각화의 개념과 배경을 이해
  2. 데이터의 숨은 의미를 발견하여 의사결정에 도움
  3. 데이터를 바탕으로 효율적인 소통 도모
  4. R에 의한 시각화 구현

최적의 그래프 선택

TED: The beauty of data visualization

시각화는 왜?

시각화의 목표 : 통계적 정보를 효과적인 그림으로...

  • 데이터 : 가공되지 않은 원재료
  • 정보 : 데이터로부터 추출되는 가치 있는 것
  • 시각화 : 정보의 인지

시각화는 어떻게

1단계: 데이터의 이해

  • 개체의 수집 범위와 방법, 그리고 개체 수의 파악
  • 변수의 측정(기록), 그리고 수준(명목형, 순서형, 수치형)
  • 예: 병원 A의 내원환자들에 대한 지료 기록(수집범위, 방법), 000명(개체 수), 성별(명목형), 나이대(순서형), 질병의 지속일(수치형)

2단계: 목표 설정

  • 무엇을 알고 싶은가
  • 이 데이터가 답해 줄 수 있는가
  • 배경지식의 습득
  • 예: 질병의 지속이은 대체로 어느 정도인가? 성별로 차이가 있는가?

3단계: 그래프 선정

  • 어떤 그래프가 좋을까?

4단계: 소프트웨어의 활용 R

  • 오픈소스의 데이터분석 도구, 시각화에 강점

5단계: 스토리텔링

  • 핵심적 의미를 일반인에 전달

용어

  1. 데이터 시각화 : 데이터에 내재된 통계적 정보를 그림의 형태로 드러내는 것
  2. R : 오픈소스의 통계계산 소프트웨어로서 시각화에 강점이 있음
  3. (R, G, B) 컬러 : 'red', 'green', 'blue' 의 조합으로 모든 컬러가 표현됨
  4. 점, 선, 사각형(다각형) : 그래프의 기본 요소

시각화 도구 R

R 이란

  • 오픈소스, 사용자의 자발적 기여
  • 개별적 needs에 맞추는 변형과 창작이 가능
  • 그래프가 멋짐, R 그래픽스 팩키지를 활용
    • lattice
    • ggplot2
    • rgl
    • RColorBrewer

R 스크립트의 실행

R 팩키지의 설치

  • R Gui의 Packages 메뉴에서 Install package(s)
    • CRAN mirror를 선택
    • R 팩키지를 선택

R 시각화 사례

조선의 임금님들은 몇 년이나 재위하였나

R 스크립트

kings <- read.table("chosun kings.txt", header=T) str(kings) ...

R의 컬러 체계

RGB 시스템

Chart of R Colors

http://research.stowers-institute.org/efg/R/Color/Chart/

정리

  • 시각황: 데이터에 담긴 통계적 정보를 그림의 형태로 드러내는 것

  • 데이터 시각화의 과정

    • 데이터의 이해 → 목표 설정 → 그래프 선정 → 그래프 구현 → 스토리텔링
  • R은 오픈소스의 통계 소프트웨어, 시각화에 강점

  • R의 컬러체계: (R, G, B) 시스템, 2자리의 헥사코드

  • 스토리텔링은 그림의 핵심적 의미를 일반인에게 전달하는 커뮤니케이션

파이 차트

pie(rep(1,12), col=rainbow(12), border="white", clockwise=TRUE, labels="") par(new=T) pie(rep(1,1), col="white", radius=0.5, border="white", labels="")


댓글