무경험자 필독! 데이터 분석가 되는 메뉴얼 알아보기
최종 업데이트:2022-1-17
오늘날’ 데이터 분석‘은 디지털 비즈니스의 필수 요건입니다. 많은 기업들이 데이터를 활용하기 시작합니다. 이것도 데이터 분석가 라는 직업은 왜 최근에서야 이렇게 뜬 것인지의 대답입니다. 하지만, 대부분들께서는 실제로 데이터 분석가 어떤 역량을 가져야 하는지 고민하고 있습니다.
이번 게시물에서는 데이터 분석가 가 되기 위해 어떤 필수 역량이 있어야 하는지에 대해서 설명해 봤습니다. 마지막으로 데이터 분석가들에게 추천할 만한 교육 자원을 정리하고 참고하시길 바랍니다.
목록
1.데이터 분석가 란?
과거에는 데이터 분석가 를 ‘ 통계 전문가, 엔지니어를 DBA(데이터베이스 관리자)’로 총칭했습니다. 통계를 활용한 분석이라는 전통적 분석가의 관점에 가장 부합하는 직업이며, ‘비즈니스’에 어떻게 도움이 될 수 있을지를 분석하고 통찰력을 제공하는 역할입니다.
물론 현대의 들어 의미가 조금씩 변경되어 ‘통계나 수치데이터를 바탕으로 분석한다’에서 ‘머신러닝등의 기술과 분석 알고리즘을 통해 비즈니스 의사결정, 문제 해결에 도움을 주는 helper’라는 의마변화도 진행 중입니다.
2.데이터 분석 프로세스
일반적인 데이터 분석의 업무 프로세스는 아래와 같습니다. 그러나 상황에 따라 유동적으로 바뀌는 경우도 많습니다. 각 단계가 모두 중요하지만 특히 프로세스의 처음과 끝의 중요성은 간과되지 말아야 합니다. 문제 정의 및 리포팅 단계는 특별한 이론이나 스킬이 요구되지 않지만, 분석가의 경험과 태도, 일에 대한 철학에 의해 성과가 좌우되는 경향이 있습니다. 성공적인 프로젝트 진행을 위해 분석가는 필수 스킬/이론 뿐아니라 소프트역량을 지속적으로 개선해야 합니다.
3.데이터 분석가 에게 필요한 것은?
지금까지의 설명을 통해 데이터 분석가 의 업무 내용을 대략 이해하고 있을 거라고 생각합니다.그러면 데이터 공부는 어디서 부터 시작해야할까요? 다음 항목에서는 데이터 애널리스트에게 필요한 기술을 살펴보았습니다.
Excel- 엑셀 보고서
Excel은 표 계산 소프트웨어로서 널리 이용되면서 데이터 분석에도 중요한 역할을 하고 있습니다.Excel은 데이터 처리와 계산, 간단한 그래프 작성뿐 아니라 피벗테이블 만들기이나 Vlookup 등의 복잡한 함수를 포함한 고도의 기능도 구현할 수 있습니다.데이터 애널리스트는 다른 데이터 분석이나 시각화 툴을 배우기 전에 Excel을 잘 사용해야 합니다.
SQL: SQL 개발자를 위해
위키백과 정의에 따르면, SQl( Structured Query Language, 구조화 질의어)는 관계형 데이터베이스 관리 시스템(RDBMS)의 데이터를 관리하기 위해 설계된 특수 목적의 프로그래밍 언어입니다. RDMBS가 기업에 가장 많이 도입되는 데이터베이스이므로 데이터 애널리스트로서 SQL을 파악해야 합니다.
SQL을 독학으로 공우한다면 연습을 하면서 외우는 방법을 추천합니다.SQL 문장의 의미를 대략 이해한 후에 실제 운영에 있어서 스킬을 높여보도록 하겠습니다.
데이터 시각화
현재 기업에서 수치를 계산하는 대신, 알기 쉬운 시각화한 리포트를 이용하는 경향에 있으므로, 데이터 시각화도 데이터 분석가에 필수적인 스킬이 되어 있습니다.데이터 시각화에는 Python, R 등의 프로그래밍 언어나 그래프 만드는 프로그램인 데이터 시각화 툴 등이 있습니다.
Python과 R에는 차트를 그리기 위한 라이브러리가 있습니다. Echarts, D3.js는 JavaScript제의 차트 라이브러리이기 때문에 JavaScript를 하지 못하면 데이터 시각화에 활용할 수 없습니다. 미경험자 중에 데이터 애널리스트가 되고 싶은 분이라면 Python과 R과 같은 고급 프로그래밍 스킬보다 먼저 태블로, 파인리포트와 같은 데이터 시각화 툴을 사용하세요.
파인리포트(FineReport)는 각종 데이터베이스와 직접 연동할 수 있으며, 엑셀과 유사한 인터페이스를 기반으로 하고 있습니다. 자체 개발한 19종류의 html5차트 및 50개 이상의 차트 스타일을 기본으로 제공하는 것도 특징입니다. 또한 3D 차트와 동적 차트 효과를 지원합니다. 교차 플랫폼에서 웹 디자인에 적용하고 실시간 업데이트를 지원할 수 있습니다.데이터 시각화툴로서 뿐만 아니라 데이터 의사결정 분석 시스템을 쉽세 구축할 수 있습니다.
통계학
데이터 분석가 에게 또 하나 필요한 기술은 통계학입니다. 통계학은 「해석의 가능성」을 강조해, 데이터의 성질이나 의미를 알 수 있기 때문에 데이터의 활용을 실현합니다.
상급 데이터 애널리스트는 다변량 A/B 테스트, 예측 모델링, 경향분석, 클러스터 분석 등의 기술에 정통합니다. 분석가들은 실제 사업상의 질문에 대답하기 위해 통계학 이론뿐만 아니라 적용하는 방법을 알아야 합니다.
시장의 셀프-BI툴에 일부 분석모델이 있긴 하지만 데이터 분석가들은 전면적인 심층분석을 하려면 Python과 R와 같은 데이터 마이닝 도구가 필요합니다.
Python은 초보자도 쉽게 습득할 수 있도록 간단한 문법으로 구성되어 있습니다. 데이터 분석뿐 아니라 AI의 기계 학습이나 딥러닝 등에서 사용됩니다. R의 강점은 풍부한 통계 분석 라이브러리를 포함할 뿐만 아니라 결과를 시각화하며 그래프 생성 기능도 갖추고 있습니다. 그러나 다국어 프로그래밍 경험이 없으면 이해하기 어렵기 때문에 초보자에게 적합하지 않을 수도 있을 것입니다.
4.데이터 분석가 갖춰야 할 능력과 지식
데이터 분석을 위한 4단계:
데이터 수집, 데이터 처리, 데이터 분석, 데이터 전시
4.1 데이터 분석가 필요한 데이터 수집
데이터 수집은 간단해 보일 수 있지만, 시간을 이해하고 데이터 문제를 해결하는 전환하는 데 도움이 됩니다. 간단히 말하면 어떤 데이터가 필요한지, 어떤 관점으로 문제를 분석하고 있는지 보고 나서 자료 수집에 착수하는 겁니다. 이 과정에서 데이터 분석 전문가는 구조화된 논리적 사고를 가져야 합니다.
데이터 분석가 추천 자료 : <논리의 기술>-바바라 민토
데이터 분석가 추천 도구: 마이드맵 ( MindNode Lite 등)
4.2 데이터 처리
데이터 처리에는 필요한 도구는 다음과 같습니다.
1) Excel 및 Premium 기능:
일상적인 작업, 사용하기 쉽고 10만 데이터를 처리하기 쉬움.
premium 엑셀에 대해 알아야 할 기능은?
- 엑셀 공부는 서두르지 말고 차근차근 해야 한다.
- 기본 : 간단한 차트 데이터 처리, 인쇄, 조회, 필터, 정렬
- 기능 및 공식: 상업적 함수, 고급 데이터 계산, 다차원 인용, function
- 시각화 차트: 그래픽 디스플레이, 고급 차트, 차트 위젯
- 피벗 테이블, VBA 프로그램 개발
경험을 보시면 기본적인 자료를 공부해서 사례를 통해 연습하도록 하세요. 관련 카페를 자주 둘러보고 엑셀로 문제를 해결할 방법을 많이 고민해야 합니다. 그리고 위젯을 충분히 활용하는 것이 중요합니다.
2) 데이터 분석가 필요한 리포팅 툴:
파인리포트는 기업에서 요구하는 다양하고 복잡한 보고서를 처리할 수 있도록 고안된 Java기반의 리포팅 툴입니다. 데이터 베이스 커넥팅 지원, 스케줄링 보고서 생성, 툴 보안과 같은 기본 기능은 다양한 비지니스 니즈를 만족시킬 수 있습니다.
파인리포트와 엑셀 간의 차이점을 알고 싶다면 다음 자료 참고하세요: 엑셀 데이터 분석 VS 엑셀 리포팅 툴,차이점 한눈에!
3) Oracle 및 SQL Server:
기업에서 가장 많이 쓰이는 1000만 대 수준의 데이터베이스입니다. SQL 언어를 최대한 활용해야 합니다.
끊임없는 기술 습득과 새롭고 트렌디한 기술 습득으로 개인기를 향상시키는 것은 취업에 큰 도움이 될 수 있습니다.
4.3 데이터 분석
데이터 분석에는 관련 규칙, 클러스터 분석, 범주형 데이터 분석(categorical data analysis) 등 다양한 통계 모델이 필요합니다. 그래서 데이터 분석가 들은 통계 분석 도구를 알아야 합니다.
SPSS 시리즈: 전통적인 통계 분석 소프트웨어, SPSS Statistics, SPSS Modeler, 프로그래밍이 필요 없이 배우기 쉽습니다.
SAS: 전통적인 드릴링 소프트웨어, 프로그래밍이 필요합니다.
R: 오픈 소스 소프트웨어로 요즘 새로운 데이터와 비정형 데이터 처리에 대한 효율이 높습니다. 프로그래밍해야 합니다.
4.4 BI 툴:
Tableau: 태블로는 디자인 측면에서도 뛰어난 기능을 자랑합니다. 디자인, 색상, 사용자 인터페이스까지 심플하고 깔끔한 느낌을 주며, 데이터 분석가 들은 기본 제공하는 소스만으로도 디자인적으로 뛰어난 시각화 화면을 제작할 수 있습니다.
4.5 데이터 분석가 : 데이터 시각화 디스프레이
이제는 많은 데이터 분석 툴이 데이터 시각화를 포함하며, 데이터 결과만 워드/PPT/H5로 표시할 수 있습니다.
5. 데이터 분석 전문가들에게 추천할 만한 학습 자료
혹시 데이터 분석가가 되기 위한 학습 자료가 있었으면 하는 분들이 계실 겁니다. 그래서 마지막으로 독학에 추천할 만한 학습 자료를 꼽아 드리겠습니다.
데이터 분석가 학습 자료: 책
전에 데이터 분석가가 읽어야 할 책을 추천하였습니다. 다음 게시물을 참고하세요.데이터 분석가가 읽어야 할 책 Top 10
엑셀 시리즈
Office Online교육
마이크로소프트에서 무료로 제공하고 있는 Office 제품의 헬프센터입니다.Excel의 기본적인 조작으로부터 복잡한 함수, 차트와 피포트 테이블을 동영상으로 배울 수 있습니다. 엑셀 초보자에게 추천합니다.
Office Pro
Excel의 기본적인 조작을 할 수 있으면 고도 함수, 매크로와 VBA의 공부를 진행하도록 하겠습니다. Ofiice Pro는 데이터 분석가의 일로 자주 사용되는 조작을 테마별로 가르쳐 줍니다.
SQL
연습문제를 첨부한 무료 SQL 학습 사이트입니다. 슬라이드를 통한 레슨에서 배우며 SQL문장을 입력하고 그 실행 결과를 볼 수 있습니다.
Progate과 마찬가지로 SQL 튜토리얼 문제가 준비되어 브라우저로만 공부를 마치도록 하겠습니다.그리고 실무에서 기억하지 못하는 SQL 문장을 찾는데 편리합니다.
통계학
초급편,기초편,중급편으로 나누어서 통계학 지식을 소개합니다. 기초편부터 1개의 레슨에 대해서 연습문제가 있습니다.
페이스북에서 FineReport Reporting Sofeware채널을 구독하고 더 많은 데이터 시각화 정보를 받으세요!
*파인리포트는 강력한 데이터 시각화 능력을 갖춘 엔터프라이즈급 데이터 분석 툴입니다. 각중한 사업에서 데이터 분석에 사용됩니다. 간단한 드래드엔 드롭으로, 다양한 멋진고 유용한 지도 시각화를 만들 수 있습니다. 초보자에게 우선 선택입니다.
* 여러분들은 지도 시각화를 만들고 싶다면 공식 홈페이지에서 파인리포트를 무료로 다운로드해 보세요.