AI & Data를 활용하는 기술경영자

시간 데이터 유형에 따라서 여러 시각화 유형들 파악하기 본문

Data_Visualization

시간 데이터 유형에 따라서 여러 시각화 유형들 파악하기

Data_Lover 2022. 11. 2. 17:52
728x90

데이터가 시간 데이터인데 어떻게 시각화 하지..?

뉴스 혹은 기사에서 시간 데이터는 주로 어떤 그래프였을까요? 아마도, 아래의 그림처럼 라인 차트였을 것입니다.

그렇습니다.!! 기본은 라인 차트이고 라인 차트에 이중축이 포함되는 경우도 있습니다.

 

 

그러나, "시간 데이터"라고 무조건 라인이랑 이중축이 효과적이진 않습니다. 기본일 뿐 상황에 따라서 시각적으로 인지적으로 좋은 그래프가 있고 그것에 대한 이야기를 지금 해보려고 합니다.

구성비 경향
영역 차트
누적 영역 차트
100% 누적 영역 차트 슬로프 차트
스파크 라인

 

이중축 차트

정의

이중축은 2개의 측정값 각각의 축을 의미하고, 차트의 왼쪽 및 오른쪽에 존재하고, 각 분기 항목에 2개의 측정값 bar를 겹쳐서 표현하곤 합니다.

 

예시로 Sample-Superstore 데이터셋 Product n테이블의 Category 필드 항목별 Sales합계와 Profit합계 그리고 Order date 년도를 이중축으로 하는 차트를 시각화합니다.

 

참고로, 이중축을 만드는 방법은 두 가지가 있는데 첫 번째는 두 번째 측정값을 화면 오른쪽 점선이 보일 때까지 끌거나 측정값 우클릭하여 이중축을 선택하는 방법이다

 

/

 

이중 축을 하다보면, 한 가지 문제를 발견하게 되는데 "Sales축과 Profit축의 스케일이 다른데 bar 크기가 비슷하여 언뜻 동일한 금액인 것처럼 보입니다."

 

해결은 이중축의 스케일을 동기화 하는 방식(Profit 측 우클릭 -> 축 동기화 선택)을 취하면 되는 것입니다. (단, 측정값의 분포 차이가 작아야 축 동기화가 이점을 갖습니다.)

 

 

100% 누적 영역 차트(100% Stacked Area Chart)

영역 차트는 기본적으로는 꺾은 선형 차트이므로 추세 및 일부 비교에 적합하고 선 아래 영역을 채우기 때문에 가장 적합한 용도는 품목 재고, 직원 수 혹은 저축과 같은 누적 가치 변화를 표현할 때아고, 주가와 같은 변동성이 큰 값을 표시할 땐 영역 차트를 사용하지 않습니다.

 

누적 영역 차트는 시간 경과에 따른 구성 변화를 표시하는데 가장 적합하고, 일정 기간 동안의 담당자 혹은 기업의 시장 점유율 혹은 제품 라인 별 매출 점유율의 변화를 보여줄 때 좋습니다.

 

 

 

보시는 것처럼 누적 영역 차트는 다양하고 다채로운 색과 기능을 통해서 구성의 변화 재미있게 표현할 수 있습니다.

 

그러나, 그만큼 쉽게 가독성과 인지력을 떨어뜨릴 수 있기에 주의가 필요합니다.

 

고로, 권장드리는 것은 정확한 비교가 필요하면서 3~ 5개 이상의 범주를 함께 쌓지 않는 것입니다.

 

 

 

 

 

경사 차트(Slope chart)

 

경사 차트는 직관적으로 각도를 통해서 변화의 정도를 알 수 있고, 시각화를 이해하는데 많은 시간을 쓰지 않고 전달 내용에 집중할 수 있고, 아래의 그림처럼 추이 변화 분석을 할 때 효과적이다라고 생각할 수 있습니다.

https://news.jtbc.co.kr/article/article.aspx?news_id=NB12041358

 

스파크 라인 차트(Spark Line chart)

테이블 혹은 행렬에 의미를 추가하는 좋은 방법은 스파크 라인을 추가하는 것인데 그 이유는 추세를 빠르게 보면서 비교를 할 수 있기 때문입니다.

그러한 이유로, 주로 계절성 증가 감소 혹은 주가와 같은 일련의 값에 추세를 표시하거나 최댓값과 최솟값을 강조 표시할 수 있습니다.

 

728x90

'Data_Visualization' 카테고리의 다른 글

좋은 워크시트란 무엇인가 말이냐!  (0) 2022.11.01
Tableau시작  (0) 2022.10.31
데이터 시각화는 어떻게 하는 거야!!  (0) 2022.10.24