티스토리 뷰
빅 데이터에 대한 내용 중 최대의 화두는 Hadoop 입니다.
I. Hadoop의 정의
- 클라우드의 핵심 기술로써 아파치의 오픈소스 프로젝트중 하나인 대용량 데이터 처리를 위해 대규모 분산처리를 지원하는 프레임워크 (더그 커팅 창시)
II. Hadoop의 Ecosystem의 구성도와 구성 요소
가. Hadoop의 Ecosystem 의 구성도
나. Hadoop의 Ecosystem 의 구성 요소
|
구분 |
구성요소 |
내용 |
|
Core |
HDFS |
분산 파일 시스템, Name, Data Node |
|
MapReduce |
분산 처리, Job/Task Tracker | |
|
HBase |
Column DB, Column Index | |
|
Client |
Pig |
Data Flow 에 대한 ETL Tools |
|
Hive |
MapReduce 컨트롤 및 Query Language | |
|
Sqoop |
RDBMS와의 데이터 Import, Export | |
|
Manage |
ZooKeeper |
분산 응용 프로그램 coordination |
|
Avro |
데이터 직렬화 시스템 | |
|
Chukwa |
Data Collection System |
'Microsft Azure > 고급 분석' 카테고리의 다른 글
| D3 (0) | 2013.04.22 |
|---|---|
| HDFS (Hadoop Distributed File System) (1) | 2012.12.14 |
| .NET SDK for Hadoop (0) | 2012.12.14 |
| 오픈소스 빅데이터 요소 기술 (0) | 2012.11.28 |
| Big Data(빅 데이터) (0) | 2012.11.25 |
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- hongju
- Power BI Desktop Update
- 목표
- 클라우드
- Windows Azure
- Power BI 업데이트
- SharePoint 2010
- Power BI
- Power BI Desktop
- Microsoft Fabric
- Power BI Update
- 페이지를 매긴 보고서
- 업데이트
- SharePoint Online
- sharepoint
- SQL Azure
- Power BI Copilot
- Power BI Desktop 업데이트
- Windows Phone 7
- sql server 2012
- SharePoint Object Model
- redJu
- 사용자 데이터 함수
- Cloud
- Visual Studio 2010
- SharePoint 2013
- Paginated Report
- copilot
- Windows Azure Mobile Services
- 정홍주
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
글 보관함