1-1. 데이터 분석 기초
- 데이터 분석이란?
- 데이터 분석의 정의 : 의사 결정을 지원하는 것을 목
- 나만의 전문가의 정의 : 뾰족하게 비즈니스에 대한 질문을 할 수 있는 것
- 데이터 분석의 목적
Insight = Long-term Lessons
단순한 문제 해결이 아니라, 새로운 시스템을 도입해 장기적으로 문제를 미연에 방지하는 것
- 데이터 분석의 과정
- 문제 정의 및 분석 목적 설정 : 현재 발생하고 있는 문제에 대한 정의 및 분석 목적 설정
- 데이터 수집 : 문제 해결에 필요한 관련 내/외부 데이터 수집
- 데이터 탐색 : 수집된 데이터의 특성, 분포 등을 파악
- 데이터 전처리 : 분석 목적 및 방법에 부합하도록 데이터의 내용 형태 가공
- 데이터 모델링 : 데이터 분석 기법 적용 결과 도출을 위한 수식/함수/기능 활용
- 검증 및 평가 : 개선 효과 계산 과거 데이터와의 비교
- 데이터 시각화
- 데이터 사이언스
- 기술적 base 가 중요함 (코멘토의 데싸 발언)
- 도메인 지식도 중요하긴 하지만, 기술이 없으면 할 수가 없음
1-2. 엑셀의 기본 활용
- 엑셀을 잘한다는 것은
- 사용자의 입장에서 : 독자(직급)의 입장에서 원하는 정보가 무엇인지 그 사람이 하는 <u>의사 결정</u>에 맞는
- 그 사람이 나에게 하는 질문을 다 적어놔야 함 why? 그 사람이 원하는 정보가 내 자료에 없었기 때문
- 목적에 부합하도록 :
- 왜? / 어떤 관점? / output 은 무엇인지?
- 자료를 구성하는 것 :
2-1. 엑셀의 기본 원리
- 엑셀 데이터의 형태와 붙여넣기
- 값 : 텍스트 / 숫자
- 수식 : 계산식 / 함수
- 서식 : 글꼴 서식 / 셀 서식 -- **의미 전달 기능**
- 엑셀 데이터의 형태와 붙여넣기
- Ctrl + V 절대 쓰지 않기
- Ctrl + Alt + V 으로 수식/ 값/ 서식 붙여넣기 따로 하기
2-2 엑셀의 참조
3-1. 탐색적 데이터 분석(EDA)
- 탐색적 데이터 분석의 중요
- 내 입맛대로 수집되는 데이터는 1도 없다.
- 수집된 데이터의 특성 및 분포를 파악해야 함
- 걸측치, 이상치의 존재 유무를 파악할 수 있다.
- 데이터 분석 도구 추가하기
- 데이터 분석의 처음
- column 별로 데이터의 의미 끊어서 보기
- 데이터 계급의 종류
- 숫자 통계값을 파악하기 (중간값, 최솟값, 최댓값, 평균값)
- 해당 데이터의 열 이름 까지 할 것
- 많은 칼럼의 통곗값을 구할 경우,
- 피벗 테이블
- 어떤 피벗테이블을 만들고 싶은가 ?를 생각하고
- 손으로 먼저 그려보고 엑셀로 따라 그리기
- 지정 범위를 다 설정할 필요없이, **해당 범위 내의 셀을 지정**
- -> 하고 피벗테이블 삽입하면 자동으로 전체 범위로 설정됨
- VLOOKUP 함수 120% 활용하기
- MATCH 함수 대입하기VLOOKUP의 COLUMN NO를 MATCH로 표시 가능
- MATCH : 내가 찾고 싶은 값이 열/ 행의 몇번째 값인지를 RETURN
- FIND 함수
- 긴텍스트에서 특정 단어나 문장이 시작하는 위치를 <u>숫자</u> 로 반환
- 띄어쓰기까지 포함하여 문자를 세며, 대소문자를 구분
- c.f. 대소문자 구문이 필요없으면 SEARCH 함수
- FIND 함수로 특정 단어 포함 여부 파악하기
4.1 데이터 시각화
- 차트의 <u>데이터 범위</u> 선택하기
- 항상 범례를 데이터 범위로 잡을 것
댓글