블로그 이미지
정홍주
Azure에 대한 내용뿐만 아니라 새로운 트렌드로 빅데이터, BI, SharePoint, 앱 등의 내용을 다룹니다.

calendar

        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

Notice

'Dataflow'에 해당되는 글 2

  1. 2019.02.20 데이터 흐름 만들기 및 사용
  2. 2019.02.15 데이터 흐름 소개
2019.02.20 07:00 Power BI

데이터 흐름 만들기 및 사용

 

데이터 흐름에 대해서 간략히 소개(https://redju.tistory.com/665)를 하였는데 데이터 흐름(미리 보기)를 생성하고 Power BI Desktop에서 사용해보겠습니다.

 

데이터 흐름(미리 보기)는 내 작업 영역에서는 생성할 수 없으며, 앱 작업 영역이나 새 앱 작업 영역에서 생성할 수 있습니다.

1. 작업 영역을 클릭하게 되면 [데이터 흐름(미리 보기)] 탭을 확인할 수 있으며 [만들기] 메뉴에서 [데이터 흐름]을 선택합니다.

 

2. 엔터티를 추가하여 데이터 흐름 작성 시작 화면에서 [새 엔터티 추가] 화면을 클릭하여 작성을 시작합니다.

 

3. [데이터 원본 선택] 화면에서 적절한 데이터 원본을 선택합니다. 상단에서 파워 쿼리를 확인할 수 있습니다.

 

4. [데이터 원본에 연결]에서는 데이터 원본에 필요한 정보를 입력하면 되며 온-프레미스 환경에 대해서는 게이트웨이가 미리 구성합니다.

 

5. [데이터 선택] 화면에서는 적절한 데이터 테이블을 선택합니다.

 

6. [쿼리 편집] 에서는 Power BI Desktop의 쿼리 편집에서와 동일한 메뉴를 통해서 쿼리를 편집할 수 있습니다. 파워 쿼리 온라인을 이해할 수 있는 화면입니다.

 

7. 쿼리 편집을 완료하여 엔터티 목록을 확인할 수 있습니다. 다시 쿼리 편집으로 돌아가서 엔터티를 편집하거나 엔터티를 추가할 수 있습니다.

 

8. [저장]을 클릭하여 데이터 흐름을 저장합니다.

 

데이터 흐름은 생성되었지만 아직 데이터가 저장되지는 않았으므로 [지금 새로 고침] 아이콘을 클릭하여 데이터를 저장소에 저장합니다.

필요하다면 [새로 고침 예약]를 통해 새로 고침 일정을 설정할 수 있습니다.

9. 필요하다면 다른 데이터 흐름을 동일한 방식으로 생성합니다.  여기서는 Products 데이터 흐름을 생성하였습니다.

10. Power BI Desktop에서 데이터 흐름을 연결할 수 있습니다. [데이터 가져오기]에서 [Power BI 데이터 흐름]을 선택하고 [연결]을 클릭합니다.

 

11. 2개의 데이터 흐름에서 필요한 적절한 테이블을 선택할 수 있습니다.

[로드]를 클릭하고 필요하다면 쿼리 편집, 관계 설정, DAX를 이용하여 측정값을 생성하고 보고서를 작성합니다.

데이터 흐름에서 파워 쿼리 온라인과 새로 고침이 설정되어 있다면 하나의 파워 쿼리 온라인으로 여러 보고서에서는 데이터 흐름을 연결하여 시각화에 집중할 수도 있습니다.

 

간략히 데이터 흐름을 생성하여 Power BI Desktop에서 연결하는 내용을 살펴보았습니다.

다음에서는 엔터티를 연결하는 등 데이터 흐름에 대한 추가적인 내용을 확인해보겠습니다.

 

 

'Power BI' 카테고리의 다른 글

Power BI 서비스에서 Python 지원  (0) 2019.03.12
보고서 내보내기 업데이트  (0) 2019.03.12
데이터 흐름 만들기 및 사용  (0) 2019.02.20
Power BI Desktop 2019년 2월 Update  (0) 2019.02.18
2019 Gartner Magic Quadrant  (0) 2019.02.16
데이터 흐름 소개  (0) 2019.02.15
posted by 정홍주
2019.02.15 12:00 Power BI

 

데이터 흐름 소개

 

 

201811월 버전부터 데이터 흐름(Dataflow)가 미리 보기로 소개되고 있습니다.

데이터 흐름은 보고서와 독립적으로 클라우드에서 운용되는 파워 쿼리 프로세스로 간단히 정의할 수 있고 여러 원본의 데이터를 통합하고 모델링을 위해 준비하는데 도움이 되며 데이터 원본 연결, ETL 논리, 새로 고침 일정 등을 정의하여 빅 데이터를 수집, 변환, 통합 및 강화하는데 사용됩니다.

사실 데이터 분석 사용자는 본인의 로컬 PC에서 데이터를 연결, 통합하고 데이터를 준비, 모델링하여, 시각화하여 보고서를 게시하고 새로 고침을 설정하는 작업을 이미 하고 있습니다.

데이터 흐름도 동일한 작업이지만 보고서와는 독립적으로 동작되며 클라우드에서 운영된다는 것이 가장 큰 차이점입니다. 보고서와 독립적으로 동작되어 파워 쿼리 프로세스는 결과를 클라우드에 저장합니다.

 

데이터 흐름을 사용하는데 이점을 간략히 살펴보도록 하겠습니다.

l  하나의 데이터 흐름을 여러 보고서에서 사용

데이터 흐름을 생성하게 되면 Power BI Desktop에서 데이터 흐름을 연결하여 여러 보고서에서 사용하며 하나의 파워 쿼리 작업으로 여러 보고서에 적용이 가능합니다. 로컬에서 작업은 보고서당 파워 쿼리 작업 하나가 연결되게 됩니다.

l  여러 데이터 흐름에서 각각 다른 새로 고침 일정 적용

데이터 흐름별로 각각 여러 데이터 원본을 연결할 수 있는데 데이터 흐름별로 다른 새로 고침 일정을 적용할 수 있습니다. 한 데이터 흐름의 매출 테이블은 매일 새로 고침을 적용하고, 다른 데이터 흐름의 제품 테이블은 한달에 한번 새로 고침을 적용하고, 지역 테이블은 일년에 한번 새로 고침을 적용할 수 있습니다. 두 데이터 흐름을 연결하여 각각 다른 새로 고침을 적용받을 수 있습니다. 로컬에서 여러 데이터 원본을 연결한 pbix의 경우 하나의 새로 고침만 적용되므로 매월 말일에 새로 고침 해도 되는데 매일 새로 고침에 참가해야 합니다.

l  파워 쿼리 온라인을 통해 데이터 통합

파워 쿼리 온라인으로 여러 데이터 원본을 연결하여 데이터를 추출, 데이터를 변환, 데이터를 적재할 수 있습니다. 프리미엄 작업 환경에서는 증분 새로 고침을 통해서 지속적으로 데이터를 적재할 수 있어 중앙화된 클라우드 Datawarehouse로 운용할 수 있습니다.

l  공통 데이터 모델(CDM)으로 표준화

공통 데이터 모델을 이용하여 표준 엔티티에 매핑하여 데이터를 통합하거나 고유한 엔티티를 생성하여 조직 전체에서 데이터를 통합할 수 있습니다.

l  Azure와의 통합

Azure Machine Learning, AI서비스, Azure Data Factory, Azure Databrick Azure 서비스를 활용할 있습니다.

 

 

다음 게시글에서 데이터 흐름을 만들고 Power BI Desktop에서 연결해보겠습니다.

 

 

'Power BI' 카테고리의 다른 글

Power BI Desktop 2019년 2월 Update  (0) 2019.02.18
2019 Gartner Magic Quadrant  (0) 2019.02.16
데이터 흐름 소개  (0) 2019.02.15
Power BI 서비스의 보고서 PDF로 내보내기  (0) 2019.02.12
이메일 구독 업데이트  (0) 2019.02.08
개인 책갈피  (0) 2019.01.30
posted by 정홍주
prev 1 next