티스토리 뷰

 

데이터 과학자 – Data Scientist

 

며칠 전 전자 신문에 데이터 과학자에 대한 글이 1면에 나와서 정리해보았습니다.

http://www.etnews.com/news/international/2750266_1496.html

 

엔지니어 입장에서 접근하다보니 Hive SELECT t4, COUNT(*) FROM Table WHERE tx=’[ERROR]’ 로 결과를 표시하거나 EXCEL에서 연결해서 결과를 나오게 할 수는 있는데 나온 결과가 의미 있는거냐? 도움이 되는 거냐? 가치가 있는거냐? 나왔는데 그래서? 그 다음은?

 

 

1.     데이터 과학자 (Data Scientist)

가.   정의

-       고객의 행동이나 시장 주기 같은 구조화 되지 않은 대용량 데이터를 분석하여 새로운 가치를 창출하는 사람

나.   부각 이유

-       빅데이터 이슈, 비정형 데이터 분석, 분석 결과 신속성 및 신뢰성 요구

2.     빅데이터 활용 3대 요소 및 데이터 과학자의 필수 역량

가.   빅데이터 활용 3대 요소

    

나.   데이터 과학자의 필수 역량

역할

내용

수학적 지식

수학 및 알고리즘

통계학, 도구 이해

R,SAS, SPSS

프로그래밍 능력

C++, Java, .NET

RDBMS 이해

SQL, Index, 정규화

분산컴퓨팅기술

Hadoop, Hive, Sqoop, MapReduce

커뮤니케이션

의사소통 능력

비즈니스 통찰력

가치 창출, 가치 증대

 

 

'Microsft Azure > 고급 분석' 카테고리의 다른 글

Hadoop Distribution  (0) 2013.12.02
빅 데이터 활용 기술 및 솔루션  (0) 2013.05.06
D3  (0) 2013.04.22
HDFS (Hadoop Distributed File System)  (1) 2012.12.14
.NET SDK for Hadoop  (0) 2012.12.14
댓글