본문 바로가기

스터디

[13주차] 태블로 입문2

Day1

차트 시각화

 

표현 방식 활용

: 사용할 값들을 ctrl을 통해 전부 선택

: 표현 방식에서 사용하고자 하는 표현 방식 선택

 

통합서식을 활용한 눈금선 지우기

 

선 그래프에서 마지막 숫자만 보이게 하기

: 레이블 마크에서 '가장 최근' 설정

: 필요한 방식대로 레이블 마크에서 수정

 

스캐터플롯

: 상관관계를 시각화하는 그래프

 

박스플롯

: IQR*1.5의 범위 바깥에 있는 수치 - 이상치

: 이상치 - 평균이나 중앙값과 비교했을 때 너무 높거나/낮은 값

: 박스플롯은 이상치를 판단하기에 좋은 시각화

 

히스토그램

: 이상치를 포함해 전체적인 분포를 확인할 수 있음

 

 

 

 

 

Day2

기본 차트 그리기

 

에어리어 차트

: 누적형 차트

 

트리맵

: 사각형의 형태로 컬럼별 비율을 시각화하는 데 유용한 차트

 

박스 플랏과 이상치

: 값 분포 현황, 중앙값, 사분위, IQR(Inter Quarter Range, Q3-Q1), IQR*1.5의 범위(정상 분포의 범위), 이상치 등을 파악하기 좋은 차트

 

하이라이트 테이블

: 여러 숫자를 한 번에 빠르게 비교하려 할 때 용이한 차트

 

기타

: 버블 차트

 

 

 

태블로 필수 기능

 

UNION

: 파일 내 여러 시트를 한 번에 사용하고자 할 때 이용하는 기능

: 여러 시트가 있는 파일을 연 뒤 메인 시트에 나머지 시트를 끌어와 유니온

: 혹은 하나의 파일을 연 뒤 그 시트를 유니온으로 변환 - 와일드카드(자동)으로 필요한 파일을 찾은 뒤 유니온

: 들어간 값은 같지만 필드명이 달라진 시트들을 가진 파일을 유니온하고자 할 때는

파일을 연 뒤 특정(수동) 유니온 - 불일치 필드 병합 - 필드명 수정

 

JOIN

: 특정 필드를 기준으로 다른 필드 및 값을 가진 테이블을 묶고자 할 때 이용하는 기능

: 기준 파일을 열고 파일을 추가한 뒤 연결, join할 필드값을 설정(다중 설정 가능)

: join의 방향(inner, left, right, outer 등) 설정

: 느슨한 형태의 결합

 

블렌딩

: 화면에서의 ad-hoc 결합

: 각각의 파일을 시작화면에서 다 따로 불러옴

: primary로 사용할 차트를 하나 만들고, 함께 사용하려는 데이터셋을 secondary 셋으로 취급(자동 설정됨)

: 장점 - 서로 다른 종류의 데이터를 결합해 분석하고자 할 때 유용

 

 

 

 

 

Day3

차트 시각화2

 

하이라이트

: 테이블을 직관적으로 표현 가능

: 여러 개의 측정값을 활용할 경우 '별도의 범례 사용' 필수

 

차트 실습_월별 수익 분포

: 인덱스 함수(행 더블 클릭 후 INDEX() 입력) 활용하여 제작

  - 인덱스 함수 → 테이블 계산 편집 → 특정 차원 → Order Date의 월 기준으로 계산

 

데이터 전처리

: 데이터를 연 후 데이터 해석기, 피벗, 데이터 타입 변환 등 다양한 방법을 사용해 전처리

 

여러 데이터 활용하기

: 두 데이터를 연결한 후 공통 값을 가진 컬럼들 join하기(여러개 가능)

 

 

 

 

 

Day4

태블로 필수 기능2

 

필터

: 중요한 이유

  - 다양한 스토리텔링을 가능케 하는 요소

  - 태블로의 작동 및 시각화 순서(Order of Operations)를 파악하기에 용이

: 추출 필터

  - 구글 Big Query와 연결 후 데이터 로드, 라이브 상태의 데이터 연결을 추출로 바꾸고 필요한 필드만 필터링

: 데이터 원본 필터

  - 데이터 원본 필드에서 로드한 데이터 중 필요한 값만 필터 추가

  - 추출한 데이터에서 시트 창으로 넘어가는 과정에서 필터링 됨

: 차원 필터

  - 시각화한 데이터에서 필터 추가

: 측정값 필터

  - 시각화하여 나온 측정값 중 특정 범위의 값만 볼 수 있도록 필터 추가

 

이중축

: 행에 측정하고자 하는 두 개의 값 중 첫번쩨 값을 넣고 이중축 추가, 이후 다른 값을 추가한 뒤 마찬가지로 이중축 추가

: 축 동기화를 통해(필요시) 시각화를 명료하게 함

: 각각의 그래프를 데이터에 알맞는 차트로 변경

: 이중축의 의미

  - 비교하는 맥락을 만들어주는데 유용

 

분석 패널

: 상수라인 및 평균라인

  - 임의의 기준선을 그어줌

  - 특정값, 평균, 중앙값 등 다양한 라인을 그을 수 있음

  - 편집에 들어가 레이블 - 사용자 지정을 통해 라인이 무엇을 의미하는지 명명 가능

  - 가로선, 세로선 구분 없이 가능하고, 상수값이 아니라 날짜값 등 다양한 값이 가능함

: 총계

  - 열과 행의 값의 총계를 나타냄

 

 

 

 

 

Day5

데이터 이어 붙이기

 

유니온

: 세로 형태의 결합

 

조인, 관계, 블렌딩

: 가로 형태의 결합

: 조인

  - 두 개의 테이블이 가장 강력한 형태의 물리적 결합을 통해 하나의 테이블이 됨

  - 키 필드, 결합 방향 사전 정의

: 관계

  - 유연한 형태의 결합을 통해 각각의 테이블이 존재하지만 함께 사용 가능

  - 키 필드 사전 정의, 결합 방향은 정의x

: 블렌딩

  - 필요에 따라 하는 임시적인 결합

  - 타 결합(데이터 원본 창에서 결합)과 다르게 시트 창에서 결합

  - [혼합 관계 편집]으로 블렌딩 조건 설정

 

 

 

필터링

 

필터

: 데이터 원본 필터

  - 분석 데이터의 범위를 조정

  - 데이터를 준비하고 작업으로 넘어가기 전에 거는 필터링

: 차원 필터

  - 시트 내에서 실시간으로 적용하는 필터

  - 여러 개의 필터 적용 가능

  - 각각의 필터는 독립적으로 작동

: 측정값 필터

  - 특정 값의 범위 내로 필터링

 

컨텍스트 필터

: 측정값 필터보다 먼저 적용되는 필터로 특정 조건 하에 다른 조건을 실행하고 싶을 때 활용

 

숨기기

: 타 필터 및 계산이 마무리된 이후 실행되는 필터의 종류 중 하나

: 단점 - 업데이트된 데이터는 반영이 되지 않음

 

테이블 계산 필터

: 계산된 필드를 추가한 후 이를 필터 적용

예) 가장 최근 월/직전월/작년도 동월의 값을 비교하고자 할 때

  - 계산된 필드 추가 후 적용

    - Last()=0 OR Last()=1 OR Last()=12

 

 

 

이중축

 

이중축

: 하나의 가로축에 두 개의 측정값을 동시에 표현

: 사용하고자 하는 바를 축에 넣은 후 이중축 적용

: 비교 맥락을 만들기 좋음

 

 

 

 

 

 

 

 

반응형

'스터디' 카테고리의 다른 글

[12주차] 생성형 AI, 태블로 입문  (0) 2024.07.12
[10-11주차] SQL 프로젝트  (0) 2024.07.04
[9주차] SQL 입문2  (0) 2024.06.21
[8주차] SQL 입문2  (0) 2024.06.14
[7주차]SQL 입문  (0) 2024.06.07