본문 바로가기

카테고리 없음

[패스트캠퍼스] 데이터시각화 강의 2주차 학습일지(2)

>> 분명 국비지원 패캠강의는 3분짜리인데 따라하고 하다가 막혀서 해결하다보면 30분 걸릴 때가 있다... 답답하지만 그냥 넘어가는 것보다는 나으니까 차근차근 :) 이번에도 강의를 따라하면서 내 태블로 작업 내용을 스크린샷 하였다. 

 

<시간에 따른 시각화>

- 라인 차트

1. 이중축 차트

 

축에 통화 표시 넣을 떄 Sales> 우클릭> default properties>number format을 통해 수정 가능 

2. 100% 누적 영역 차트 : 라인차트의 선이 너무 많을 때 , 다만 값이 쌓이기 때문에 개별적인 것을 보기에는 어려움

 

3. 슬로프 차트 : 두 지점의 값을 비교하는 데 용이한 차트

- order date를 필터로 옮기고 필터 필드에서 년을 선택(2개년만 선택했음)

 

- 두번째 행에 있는 세일에서 우클릭해서 이중축으로 바꾼뒤 원으로 바꾸면 이중축 생성, 그 상태에서 하나의 축을 우클릭해서 축 동기화

-년을 색상으로 넣고, 세일즈를 레이블에 넣어서 가장 최근으로 설정

- 레이블 마크에서 우클릭> 퀵테이블 계산> 이전 년도에 비한 증감 비율 알 수 있음

- 원 테두리 색상에서추가 가능

4. 스파크라인: 여러가지 라인을 트렌드만 볼 수 있도록

- 옵션키를 누르고 드래그해야 order date 를 열 선반에 둘때 연속형으로 가능, 스파크 라인의 변화를 잘 보기 위해 좁은 면적에 표현, 축 편집에서 0포함 해제, 머리글 해제(축 옆에 value부분 없애는데 그 위에 우클릭해서 머리글 해제/사진생략)

-워크 시트에 우클릭> format> 격자선 없애면 안에 격자선도 사라짐

.

5. 캘린더 차트: 달력형태로 어떤 날에 가장 매출이 높았는지 

-  order date를 filter로 가져갈 때 년도/월로 선택한 다음, 특정 연월 선택

- 마크선반 텍스트에 일로 넣어주어야 몇일인지 알 수 있음. 

- 필드 레이블(행,열)도 숨기고, 앞의 머리글 표시(show header)도 없앰

- 마크를 사각형으로 바꾸고, sales를 색상에 넣어줌 

-빈공간에 우클릭>필터>연월 선택하면 우측 창에 필터 뜨는데 세모 클릭해서 단일값(슬라이더)를 하고, 필터를 드래그해서 위치도 왼쪽으로 변경 가능, 매출이 높을수록 진해지는 

- 전체보기 선택 후 레이블에서 날짜를 우측 오른쪽에 정렬했을 떄 너무 박스 모서리에 가 있다면 텍스트에서 한칸 띄어주면 됨. 

6. 간트차트: 기간을 시각화할 때 효과적

- 계산된 필드 : DATEDIFF( 날짜부분, 시작날짜, 끝날짜)- 끝날짜에서 시작날짜를 뺀 두 날짜의 사이의 차이 

- Order date 필터에 넣어서 기준 날짜로 설정

-좌측 빈공간에 우클릭해서 필터 만들고, 필터 위에 우클릭해서 필터 형식(드롭다운 등) 조정 가능

 

- 대시보드에 옮겨서 빨간 박스에서 우클릭해서 필요한 필드 사용할 수있고 , Objects 에서 텍스트를 드래그해서 제목 수정 가능 

<속성별 비교를 위한 시각화>

1. KPI(Key Performance Indicator) 카드

- 열선반 더블클릭>  MIN(0)>com  누르고 드래그해서 복사>4개 만들기

- 투명이미지를 my reposite>shape>'transparent'폴더 생성해서 넣기. 투명이미지를 넣는 이유는 배경을 생성했을 ㄸㅒ 같이 ㅎㅏ이라이트가 되지 않도록 하기 위해서

- 마크 모양 선택>추가 모양> 모양 다시 로드> transparent

- 축에서 우클릭> 축 편집> 범위(고정 -1~1) 

- 각각의 마크를 열어서 측정값을 텍스트에 넣어주면 되고, 레이블 안에서 제목이랑 위치 조정

- 워크시트 우클릭 후 서식>라인 서식> 시트 0 기전선 , 열 격자선 없음, 머리글 ㅎㅐ제

- 필터에 order date 끌고 와서 원하는 기간의 KPI만 볼 수도 있음

- 대시보드 끌고와서 필터 쓸수 있고 필터의 형식을 여러가지로도 바꿀  수 있음

2. 하이라이트 테이블

- 필터에 년도를 넣으면 년도별로 어떤 판매율이 높았는지 알 수 있음

3. 불렛차트

- 만약에  order date가 2020년이라면 Sales 데이터를 반환하라는 계산식 생성(if로 시작하면 항상 end로 끝내줘야함)

- 계산식을 복제해서  쓸 수 있어서 2019년 것도 생성, 새부내역 마크에 넣고 참조선 추가를 해서 

<분포 파악을 위한 시각화>

1. 스캐터 플랏: 상관관계

- 참조축 만들기: x축 우클릭>참조선

2. 박스 플랏: 데이터의 분포와 이상치 확인

- y축에 참조선 추가>박스 플랏

- 빠르게 그리는방법: 표현방법(show me)에서 박스 플랏 선택하면 1개 이상의 차원을 사용하거나 집계 해제하라고 나와 있음, Sales 클릭하고 커멘드 누른 상태로 order date 클릭한 후 박스플랏 누르면 생성, sub-category 차원을 보여주면 위와 똑같이 그리는 거 가능

3. 히스토그램: 연속형 변수의 빈도수를 나타냄, 데이터 전체의 경향을 나타냄

- 표현방식에서 측정값 하나:  quantity 클릭하고 히스토그램 누르면 자동으로 생성, 열에 구간차원(bin)이 생기는데,

구간차원을 만들면 측정값을 집계(합계, 평균 등)을 하는게 아니라 측정값을 구간으로 나눠서(0-10,10-20,20-30) 측정값을 차원인 것처럼 기준으로 활용할 수 있다. 보통 레코드 카운트와 함께 히스토그램 그릴 때 많이 그린다. x축 편집을 통해 구간도 조정 가능

- 혹시라도 축에 소수점을 들어간다면 편집에 들어가서 편집

 

<구성 비율 시각화 실습>

1. 도넛 차트(목표 달성 수치)

-매개변수(parameter) 만들기> 이름(Sales Goal), 데이터 유형(실수 Float)

: 매개변수는 사용자가 지정해서 워크시트에 영향을 줌, 매개변수 자체로만은 동작이 되지 않고, 매개변수를 계산된 필드에 넣은 뒤에 이 계산된 필드를 워크시트에 넣어야 동작이 됨. 

- 계산된 필드 만들기(Sales Goal- 실제 Sales)

-파이 만들기: 색상에 측정값 이름/각도에 측정값 드래그

>필요한 측정값만 남기고 행선반에 min(0) 두개 만들어주기, 두번째 min에 우클릭해서 이중축만들고, 축에 우클릭해서 머리글도 해제

>두번째 파이에서 측정값 이름과 측정값 삭제 후 크게 줄이고 흰색으로 변경

- 첫번째 파이: Sales는 색, 남은 부분 흰색&테투리(근데 흰색 안보여서 회색으로 함), 

-두번째 파이: 흰색색상&테두리

- 목표 대비 달성률 계산 : % to Goal 계산된 필드 만들기 , 이 필드는 %이기 떄문에 백분율로 기본 속성 변경해야함

- 두번째 파이에 % to Goal을 레이블로 추가, 가운데 생긴 선은 워크시트 우클릭 후 라인 서식에서 삭제 가능

 

2. 구성 비율을 나타내는 도넛 차트

: 파이차트> 색상에 category>각도에 측정값> 축 두개 만들고 이중축으로 변경> 두번째 원 배경색으로 변경

3. 트리맵: 속성이 많은 것을 비교할때

- 한개 이상의 차원과 1~2개의 측정값이 필요, Sales와 State 동시 클릭 후 트리맵 표현방식에서 만들기

- sales가 크기로 색상은 profit ratio에 따라서 레이블에 각 값 넣어서 주마다 내용 알 수 있음

 

4. 누적 바 차트: 각 항목에 대한 구성비를 확인할 때

- 구성비 중심으로 시각화를 한다면 행선반의   sales에서 우클릭을 해서 테이블 계산 편집> 계산유형: 구성비율, 테이블(아래로): 테이블 방향이 아래로 /옆으로 갔을 때 백퍼센트인지 설정해줄 수 있는데, 각 세그먼트별로 구성비율을 보고 싶기 때문에 테이블(아래로)설정해준다. 

 

< 순위 변화 파악을 위한 시각화 >

1. 범프 차트: 시간의 변화에 따라 순위의 변화를 보여주는 차트

- sales rank 계산식 만들어주기

- sales rank를 행선반에 분기별 order date를 열선반에 넣으면 되고, y축이 순위, 순위가 맞게 들어갔는지 확인하기 위해 sales  합계를 열선반에 이중축으로 추가하여 보면 판매량이 가장 높은 분기에 순위가 1위인것을 확인할 수 있음

- segment를 색상에 넣어 segment별로 볼 수 있게, sales rank를 우클릭> compute using>segment

 edit for calculation을 선택하면 세그먼트를 기준으로 된 그래프가 어떤 의미인지 알 수 있음.

- 순위가 반전 되어 있기 때문에 y축을 클릭해서 편집> 눈금에 반전을 선택

- 행선반에 sales rank 복사해서 하나 더 만들어 이중축 설정해주고 원으로 표시, 우측 축에도 축 동기화

- sales를 두 번째 원 레이블 마크에 넣어주고 , 우클릭을 해서  'edit table calculation'> percent of total(구성비율)>table(down): 테이블을 아래로 해야지 수직선을 하나 기준으로 아래로 합해져(51+29+18) 백퍼센트로 기록됨 

- 원의 크기를 키워주고, 레이블에 위치를 조정해주고, 양쪽의 머리글을 해제해주고, 소수점 조절(sales 우측 클릭해서>format>axis>numbers>percentage) 

 

- 마크에 우클릭 주석추가> 세그먼트만 남기고 날리기> 주석 움직일 수 있고, 우클릭해서 format에 들어가서 서식 수정가능

 

2. 덤벨 차트 : 두 포인트 사이에서 변화를 파악하기 좋음

 

- 필터 선반에 Order Date 불연속형 년> 2020, 2021년 선택, 필터와 색상마크에 order date 넣기

- 열선반에 sales 복사해서 이중축, 첫번째 sales 마크카드의 타입을 라인으로 바꾸고,  orderdate(year) path에 넣어주기

 

 

<맵 시각화>

1. 맵 서식 변경

 

- state 더블 클릭하면 지도 뜨고, 열선반에 경도가 행선반에 위도가 자동으로 생성되면서 데이터 패널에 이탤릭체로 뜸

- 맵을 변경하기 위하여 맵계층에 들어가고, 바다 색을 보라색으로 만든다고 가정> 기본도(Base)와 토지피복도(Land Cover) 해제, 해안선(coastline)만 클릭, 나머지도 필요한것만 남기기

- 지도 위 빈공간 우클릭> 서식>음영서식에서 조정 가능, 앱 계층에 있는 '데이터 계층'에서도 1인당 소득 등 내장되어 있는 정보를 알 수 있음. 

- 대한민국은 위경도 정보 없이도 태블로가 자동으로 인식하는 범위가 시도/시군구 단위까지라 읍면동은 직접 shp파일 불러와서 추가해줘야함. 

 

2.mapbox: 지도 커스터마이징

 

- 가령 seoul을 한글로 쓰고 싶다고 할때 텍스트 누르고 오버라이드 눌러서  name_en을 없애고, 아래의 insert 에 name_kr을 넣으면 됨

- style>share>third party>tableau> url copy> 다시 태블로로 돌아가 맵 링크 복사한거 붙여놓고 맵계층에서도 자유롭게 조금 더 수정 가능

- 커스터마이징한 맵을 저장하고 싶다면, 맵관리에 들어가서 맵내보내기 하면, 태블로 내 레포지토리에 맵원본 폴더에 저장됨> 그러면 태블로에서 사용 가능

- 태블로 퍼블릭 갤러리에 맵들이 모아져있는데, 다운받아서 맵관리에 들어가서 내보내기 가능

 

3. Symbol map, filled map, dual-axis map

- city를 더블클릭

-Symbol map

- filled map: 단점: 매출이 높은 지역이라 할지라도 면적이 작으면 작게 느껴져서, hexmap 사용하기도 함(태블로 퍼블릭에 있음)

-dual-axis map: state 더블클릭