[데이터 시각화] 데이터 시각화란 무엇인가
- 데이터 시각화의 개념과 배경을 이해
- 데이터의 숨은 의미를 발견하여 의사결정에 도움
- 데이터를 바탕으로 효율적인 소통 도모
- R에 의한 시각화 구현
최적의 그래프 선택
TED: The beauty of data visualization
시각화는 왜?
시각화의 목표 : 통계적 정보를 효과적인 그림으로...
- 데이터 : 가공되지 않은 원재료
- 정보 : 데이터로부터 추출되는 가치 있는 것
- 시각화 : 정보의 인지
시각화는 어떻게
1단계: 데이터의 이해
- 개체의 수집 범위와 방법, 그리고 개체 수의 파악
- 변수의 측정(기록), 그리고 수준(명목형, 순서형, 수치형)
- 예: 병원 A의 내원환자들에 대한 지료 기록(수집범위, 방법), 000명(개체 수), 성별(명목형), 나이대(순서형), 질병의 지속일(수치형)
2단계: 목표 설정
- 무엇을 알고 싶은가
- 이 데이터가 답해 줄 수 있는가
- 배경지식의 습득
- 예: 질병의 지속이은 대체로 어느 정도인가? 성별로 차이가 있는가?
3단계: 그래프 선정
- 어떤 그래프가 좋을까?
4단계: 소프트웨어의 활용 R
- 오픈소스의 데이터분석 도구, 시각화에 강점
5단계: 스토리텔링
- 핵심적 의미를 일반인에 전달
용어
- 데이터 시각화 : 데이터에 내재된 통계적 정보를 그림의 형태로 드러내는 것
- R : 오픈소스의 통계계산 소프트웨어로서 시각화에 강점이 있음
- (R, G, B) 컬러 : 'red', 'green', 'blue' 의 조합으로 모든 컬러가 표현됨
- 점, 선, 사각형(다각형) : 그래프의 기본 요소
시각화 도구 R
R 이란
- 오픈소스, 사용자의 자발적 기여
- 개별적 needs에 맞추는 변형과 창작이 가능
- 그래프가 멋짐, R 그래픽스 팩키지를 활용
- lattice
- ggplot2
- rgl
- RColorBrewer
R 스크립트의 실행
R 팩키지의 설치
- R Gui의 Packages 메뉴에서 Install package(s)
- CRAN mirror를 선택
- R 팩키지를 선택
R 시각화 사례
조선의 임금님들은 몇 년이나 재위하였나
R 스크립트
kings <- read.table("chosun kings.txt", header=T)
str(kings)
...
R의 컬러 체계
RGB 시스템
Chart of R Colors
http://research.stowers-institute.org/efg/R/Color/Chart/
정리
-
시각황: 데이터에 담긴 통계적 정보를 그림의 형태로 드러내는 것
-
데이터 시각화의 과정
- 데이터의 이해 → 목표 설정 → 그래프 선정 → 그래프 구현 → 스토리텔링
-
R은 오픈소스의 통계 소프트웨어, 시각화에 강점
-
R의 컬러체계: (R, G, B) 시스템, 2자리의 헥사코드
-
스토리텔링은 그림의 핵심적 의미를 일반인에게 전달하는 커뮤니케이션
파이 차트
pie(rep(1,12), col=rainbow(12), border="white", clockwise=TRUE, labels="")
par(new=T)
pie(rep(1,1), col="white", radius=0.5, border="white", labels="")
'Blog > MOOC' 카테고리의 다른 글
[6시그마경영] 6시그마 개론 (0) | 2017.03.12 |
---|---|
[통계조사방법론] 사회현상과 과학적 연구방법 (0) | 2017.03.06 |
[통계학 개론] 데이터의 그래프에 의한 요약 (0) | 2017.03.02 |
[통계학 개론] 데이터와 통계학 (0) | 2017.03.01 |
정보통계학과 3학년 1학기 강의 내용 (0) | 2017.02.27 |
댓글