본문 바로가기

데이터시각화2

[데이터시각화] 이변량 자료의 시각화 Ⅰ [데이터시각화] 이변량 자료의 시각화 Ⅰ 산점도(scatterplot): 연속형 자료에 대한 시각화 기법으로 두 변수 각 상관회귀 관계를 살펴보는데 매우 효과적 이변량 밀도 추정: 이변량 자료로부터 모분포의 밀도를 추정하기 위해서 커널 함수를 사용. 등고선을 덧붙여 시각화 효과를 높임 육각형 칸에 넣기(hexagonal binning): 관측 개체를 육각형 칸에 넣어 얻은 돗수(count)를 칸 별로 색의 농담으로 나타낸 일종의 산점도 회귀적 관계: 이변량 자료로부터 추정된 회귀함수 y=f(x)를 산점도에 넣어 두 변수 간 관계를 시각화함. 회귀 함수 형태는 직선과 곡선이 있음. 산점도 (scatterplot) 이변량 연속형 자료점들을 2차원 평면에 넣은 그래프 회귀적 관계 (X → Y) : X를 수평 .. 2017. 4. 6.
[데이터 시각화] 탐색적 자료분석(EDA) 시각화 Ⅱ [데이터 시각화] 탐색적 자료분석(EDA) 시각화 Ⅱ 히스토그램(Histogram): 연속형 관찰값의 구간별 도수를 상대적인 막대의 길이로 나타낸 그래프상자그림(Boxplot): 사분위수와 중앙값으로 상자를 만들고 최대 최소에 선을 연결한 그래프줄기 잎 그림(Stem-leaf plot): 수치로 된 자료를 줄기와 잎으로 분류하여 자료의 분포개형을 파악하는 그림 히스토그램 연속형 관찰값의 구간별 도수를 상대적인 막대의 길이로 나타낸 그래프 분포의 개형을 파악하는데 도움 히스토그램의 검토요령 자료의 중심위치 자료의 산포 봉우리의 갯수 이상치의 점검 (outlier) hist() # 히스토그램 작성 임의의 수 생성에 의한 히스토그램 작성 # 포아송분포로부터의 임의수 생성 rpois(n, lamda) # 포아송.. 2017. 3. 26.