✔ Tableau란?
Tableau는 세계적으로 널리 사용되는 데이터 시각화 도구로 사용자가 쉽고 빠르게 데이터를 탐색하고 인사이트를 도출할 수 있도록 지원한다.
별도의 코딩 작업 없이 Drag & Drop 방식만으로 시각화와 분석이 가능하며 이를 통해 데이터 기반의 신속한 의사결정을 돕는다.
Tableau의 주요 특징은 다음과 같다.
- 직관적인 사용 편의성
- 빠른 처리 속도
- 다양한 시각화 기능
- 활성화된 교육 및 커뮤니티
- 폭넓은 데이터 소스 지원
또한 Tableau는 단순한 시각화 툴을 넘어, 데이터 연결 → 분석 → 공유 → 협업까지 아우르는 엔드투엔드(End-to-End) 데이터 분석 플랫폼으로 자리 잡고 있다.
✔ Tableau 제품군
- Tableau Desktop: 개인이 데이터 분석·시각화를 만드는 도구
- Tableau Server / Tableau Online: 조직 내 공유,협업용 플랫폼
- Tableau Public: 무료, 하지만 만든 시각화가 모두 공개됨
✔ 연결
Tableau에서는 다양한 데이터 원본을 손쉽게 연결할 수 있다.
데이터 원본을 불러오면 위와 같은 화면이 나타나며 연결된 데이터의 기본 구조를 확인할 수 있다.
‘데이터 보기’ 버튼을 클릭하면 실제 데이터가 테이블 형태로 표시되며 데이터의 값과 구조를 세부적으로 확인할 수 있다.
이를 통해 시각화를 시작하기 전에 데이터의 특성과 품질을 미리 파악할 수 있어 분석 방향을 잡는 데 도움이 된다.
데이터 원본을 선택한 뒤에는 드래그 앤 드롭 방식으로 손쉽게 작업 영역에 배치할 수 있다.
예를 들어 Orders를 드래그 앤 드롭하면 아래와 같이 필드 목록이 자동으로 생성된다.
이 화면에서는 데이터의 각 컬럼들이 Tableau의 필드로 변환되어 표시된다. 즉, 엑셀에서 “열”이라 부르는 개념이 Tableau에서는 “필드”로 불리며, 이후 시각화 과정에서 측정값/차원으로 활용된다.
✔ 라이브 추출
1. 라이브
-Tableau가 데이터 원본에 직접 연결하는 방식이다.
-데이터 원본에서 값이 변경되면 Tableau 시각화 화면에서도 즉시 반영된다.
-실시간성이 보장되지만 데이터 양이 많거나 네트워크가 느릴 경우 성능 저하가 발생할 수 있다.
2. 추출
-현재 시점의 데이터를 Hyper 포맷으로 로컬에 저장하는 방식이다.
-원본과의 연결 없이도 빠른 분석이 가능하여 대규모 데이터 처리나 반복 조회에 유리하다.
-단, 원본 데이터가 바뀌더라도 자동 반영되지 않고 새로 추출(Refresh) 해야 최신 상태가 유지된다.
✔ 데이터 유형
✔ 데이터 결합
Tableau에서는 하나의 데이터 원본만으로는 충분하지 않을 때, 여러 데이터 소스를 결합하여 분석할 수 있다.
대표적인 결합 방식으로는 관계(Relationship), 조인(Join), 혼합(Blend), 유니온(Union) 네 가지가 있다.
1. 관계
관계는 두 테이블이 공통된 필드를 기준으로 연결되는 방식이다.
-두 테이블을 연결하기 위해서는 결합 필드의 데이터 유형이 동일해야 한다. (필드 값이 고유하지 않으면 중복 데이터가 발생할 수 있으므로 주의가 필요하다.)
-예를 들어 사진과 같이 Order ID를 기준으로 연결하면 주문 단위별로 두 테이블의 정보가 결합된다.
-성능 옵션에서 일대일(1:1), 다대다(N:N) 등의 관계 설정이나 참조 무결성 옵션을 지정할 수 있다.
-> 관계를 사용하면 원래 테이블의 세부 수준을 그대로 유지한 채 데이터를 더 유연하게 활용할 수 있으며 단일 테이블로 강제 결합하지 않고 각 테이블을 독립적으로 유지하면서 분석할 수 있기 때문에 Tableau에서는 관계 기반 결합을 권장한다.
2. 조인
조인은 두 테이블의 공통 필드를 기준으로 데이터를 하나의 테이블로 물리적으로 결합하는 방식으로 테이블의 세부 수준을 그대로 유지하는 관계와 달리 결합 시점에 단일 테이블로 병합되면서 중복이나 누락이 발생할 수 있다.
-조인 필드 역시 데이터 유형이 동일해야 결합 가능하다.
-Tableau에서는 Inner Join, Left Join, Right Join, Full Outer Join 등 다양한 조인 방식을 지원한다.
-의도적으로 데이터의 일부를 필터링하거나 중복을 허용하면서 분석하고자 할 때 조인을 사용할 수 있다.
3. 혼합
혼합은 각 원본 데이터를 개별적으로 집계한 후 시트 상에서 하나의 뷰에 결합해 보여주는 방식이다.
사용 방법은 다음과 같다.
첫 번째 데이터 원본을 업로드하고 원하는 테이블을 선택한 뒤 시트에서 데이터 → 데이터 원본 추가를 통해 두 번째 원본을 불러온다.
이후 두 데이터 원본의 필드를 시각화에 함께 드래그하여 사용하면 Tableau가 뷰에서 자동으로 혼합 결합을 수행한다.
Tableau가 최근에는 관계 기반 결합을 지원하기 때문에 특별한 상황이 아니라면 혼합보다는 관계 방식을 사용하는 것이 권장된다.
3. 유니온
관계, 조인, 혼합이 모두 열을 기준으로 데이터를 확장하는 방식이라면 유니온은 행을 기준으로 데이터를 합치는 방식이다. 즉, 구조가 동일한 두 개 이상의 테이블을 이어 붙이는 개념이다.
유니온을 하려면 테이블 구조(필드 수, 필드명, 데이터 유형)가 동일해야 한다. 예를 들어 여러 달별 판매 데이터를 하나의 테이블로 합치고 싶을 때 유용하다.
Tableau에서는 유니온할 테이블을 드래그하여 기존 테이블 아래에 놓으면 자동으로 결합된다.
동일한 구조를 가진 여러 파일을 한 번에 유니온하려면 와일드카드 유니온 기능을 사용할 수도 있다.
✔ 필터와 데이터 형식 Tableau에서는 원하는 데이터만 걸러내기 위해 필터를 사용할 수 있다. 필터를 적용하면 특정 조건에 맞는 값만 시각화에 반영되며 숫자,문자,날짜 등 다양한 데이터 형식에 맞춰 세부적으로 설정할 수 있다.
✔ 차원과 측정값 Tableau의 필드는 크게 차원과 측정값으로 나뉜다.
차원: 범주형 데이터 (예: 고객명, 지역, 제품 카테고리) → 데이터를 분류하거나 그룹화하는 기준
측정값: 수치형 데이터 (예: 매출, 수량, 이익) → 집계되어 분석되는 값
시트 화면에서는 위쪽 영역이 차원, 아래쪽 영역이 측정값으로 구분되어 표시된다.