티스토리 뷰
빅 데이터에 대한 내용 중 최대의 화두는 Hadoop 입니다.
I. Hadoop의 정의
- 클라우드의 핵심 기술로써 아파치의 오픈소스 프로젝트중 하나인 대용량 데이터 처리를 위해 대규모 분산처리를 지원하는 프레임워크 (더그 커팅 창시)
II. Hadoop의 Ecosystem의 구성도와 구성 요소
가. Hadoop의 Ecosystem 의 구성도
나. Hadoop의 Ecosystem 의 구성 요소
구분 |
구성요소 |
내용 |
Core |
HDFS |
분산 파일 시스템, Name, Data Node |
MapReduce |
분산 처리, Job/Task Tracker | |
HBase |
Column DB, Column Index | |
Client |
Pig |
Data Flow 에 대한 ETL Tools |
Hive |
MapReduce 컨트롤 및 Query Language | |
Sqoop |
RDBMS와의 데이터 Import, Export | |
Manage |
ZooKeeper |
분산 응용 프로그램 coordination |
Avro |
데이터 직렬화 시스템 | |
Chukwa |
Data Collection System |
'Microsft Azure > 고급 분석' 카테고리의 다른 글
D3 (0) | 2013.04.22 |
---|---|
HDFS (Hadoop Distributed File System) (1) | 2012.12.14 |
.NET SDK for Hadoop (0) | 2012.12.14 |
오픈소스 빅데이터 요소 기술 (0) | 2012.11.28 |
Big Data(빅 데이터) (0) | 2012.11.25 |
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- Paginated Report
- Windows Azure 업데이트
- SQL Azure
- Power BI Desktop 업데이트
- Cloud
- 클라우드
- Visual Studio 2010
- SharePoint 2013
- hongju
- SharePoint Object Model
- 업데이트
- copilot
- Power BI 업데이트
- redJu
- Power BI Desktop
- Power BI Update
- sql server 2012
- Microsoft Fabric
- Windows Phone 7
- Power BI Desktop Update
- 페이지를 매긴 보고서
- Power BI Copilot
- SharePoint Online
- 목표
- Windows Azure Mobile Services
- Windows Azure
- sharepoint
- 정홍주
- Power BI
- SharePoint 2010
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
글 보관함