728x90
반응형

분류 전체보기 58

[ADP] 4과목) 5장 정형 데이터 마이닝 - 1절 데이터 마이닝의 개요

# 데이터 마이닝 : 직역하면 자료 채굴 : 데이터를 기반으로 숨겨진 지식 및 규칙을 발견하여 의사결정에 활용하는 것 : 분류, 추정, 예측, 연관 분석, 군집, 기술 # 데이터 마이닝의 단계1) 목적 정의 : 데이터 마이닝 추진 목적 설정2) 데이터 준비 : 데이터 정제를 통한 품질 보장, 충분한 양의 데이터를 확보3) 가공 : 목적 변수 정의 및 데이터를 필요에 맞게 변환 및 가공4) 데이터 마이닝 기법 적용 : 목적에 맞게 모델을 선택하고 데이터 마이닝을 통한 정보 추출5) 검증 : 데이터 마이닝을 통해 나온 결과물에 대한 검증 실행, 최적의 모델 선정 # 데이터 분할 - 학습 데이터(Training Data) - 검정용 데이터(Validation Data) : 모델의 예측력을 검정 -..

자격증/ADP 2025.07.20

[ADP] 4과목) 4장 통계 분석 - 5절 고급회귀분석

# 변수 선택 방법1) 전진선택법: 빈 모델(절편만 있는 모델)에서 시작해서 변수를 하나씩 추가하는 방법 장점: 계산이 효율적이고 빠름, 과적합 위험이 낮음 단점: 한 번 선택된 변수는 제거할 수 없음, 변수 간 상호작용 효과를 놓칠 수 있음 2) 후진제거법: 모든 변수가 포함된 완전 모델에서 시작해서 변수를 하나씩 제거하는 방법 장점: 모든 변수들 간의 관계를 동시에 고려 단점: 초기에 모든 변수를 포함하므로 계산 비용이 높음, 다중공선성 문제가 발생할 수 있음 3) 단계적 방법: 전진선택법과 후진제거법을 결합한 방법으로, 각 단계에서 변수의 추가와 제거를 모두 고려 - 각 단계별로 AIC, BIC, Mallow cp등의 기준을 통해 전체 모델을 평가한 후..

자격증/ADP 2025.07.20

[ADP] 4과목) 4장 통계 분석 - 4절 회귀분석

# 회귀 분석: 독립 변수가 종속 변수에 미치는 영향을 알기 위한 통계기법 - 단순 선형 회귀 분석: 독립 변수 개수가 1 개 - 다중 선형 회귀 분석: 독립 변수 개수가 2개 이상 * y : 종속변수, x : 독립 변수# 선형 회귀 분석을 위한 가정 1) 독립 변수와 종속 변수간의 선형성 : 입력 변수와 출력 변수의 관계가 선형 2) 오차의 등분산성 : 오차의 분산은 독립변수 값과 무관하게 일정해야 함, 산점도를 그렸을때 잔차와 독립변수간 아무런 관련성이 없도록 무작위적으로 고르게 분포되어야 등분산성 만족 3) 오차의 정규성 : 오차의 분포가 정규 분포를 만족해야함 4) 오차의 독립성 : 오차들은 서로 독립적 * 단순 선형 회귀 분석 : 선형성..

자격증/ADP 2025.07.20

[ADP] 4과목) 2장 R 프로그래밍 기초 - 1절 R소개, 2,3절 R기초

- python 의 영향이 커지면서 사실 R은 거의 사용하지 않음..- 5과목 R 시각화 부분은 24년도부터 제외함- 4과목에서는 시험이 나옴. 기본적인 것만 공부하기 # R 언어 - 통계 및 그래프 작업을 위한 인터프리터 프로그래밍 언어 - 오픈소스 - 다양한 데이터 형태를 다룰 수 있음 # R studio - R 언어를 다룰 수 있는 GUI 형태의 대표적 통합 개발 환경(IDE) - 스크립트 창, R 콘솔, 환경 및 히스토리 창, 파일 탐색기 창 등이 존재 https://posit.co/download/rstudio-desktop/ PositThe best data science is open source. Posit is committed to creating incredible ope..

자격증/ADP 2025.07.16

[ADP] 3과목) 2장 분석 마스터 플랜 - 2. 분석 거버넌스 체계 수립

# 분석 거버넌스: 기업 내 데이터의 관리 / 유지 / 규제 방식 및 프로세스 # 구성 요소 - Process : 과제 기획 / 운영 프로세스 - Organization : 분석 기획 / 관리 조직 - System : IT기술 / 분석관련 시스템 및 프로그램 - Human Resoure : 분석 교육 및 인력 육성 - Data : 데이터 거버넌스 *) 분석 비용 및 예산 없음 # 데이터 거버넌스 - 데이터의 표준화 된 관리 체계 수립 및 운영 - 데이터의 가용성, 통합성, 안정성 등을 확보 - 데이터 거버넌스 확립되지 않을 시 > 빅브라더의 현실화 문제 발생 가능성 :기업이 무분별하게 데이터를 수집하여 남용이나, 개인정보 문제 발생할 수 있음 * 빅브라더 : 정보의 독점으..

자격증/ADP 2025.07.14

[ADP] 3과목) 2장 분석 마스터 플랜 - 1. 마스터 플랜 수립 프레임 워크

# 마스터 플랜 수립: 중,장기 적 플랜 목표와 이행 계획을 세움 - 우선 순위 고려 요소 >> 적용 우선 순위 설정 - 전략적 중요도 - ROI(투자자본수익률) - 실행 용이성 - 적용 범위 및 방식 고려요소 >> 구현 로드맵 수립 - 업무 내재화 적용 단계 - 분석 데이터 적용 단계 - 기술 적용 단계 # 우선 순위 평가 방법 및 절차 : 수행 과제에 대한 실행 순서 정함 - 분석 과제 도출 - 우선 순위 평가(Evaluating) - 우선 순위 정렬(Sorting) : 분석을 통해 순위 재조정 # ROI 관점에서의 빅데이터: 4V관점에서.... - 투자 비용 요소 Volume(크기), Variety(다양성), Velocity(데이터의 생..

자격증/ADP 2025.07.13

[ADP] 3과목) 1장 데이터 분석 기획의 이해 - 4. 분석 프로젝트 관리 방안

# 분석 과제 관리를 위한 주요 영역1. Data Size: 분석하고자 하는 데이터 양2. Data Complexity: 다양한 데이터에 적용될 수 있는 분석 모델 선정3. Speed: 분석 모델의 성능, 속도를 고려4. Analytic Complexity: 모델의 정확도와 복잡도는 트레이드 오프 관계5. Accuracy & Precision: 정확도와 정밀도는 트레이드 오프 관계

자격증/ADP 2025.07.13

[ADP] 3과목) 1장 데이터 분석 기획의 이해 - 3. 분석 과제 발굴

# 분석 과제 도출 방법1. 하향식 접근 방법(Top Down) : 문제가 주어지고, 이에 대한 해답을 찾을 경우에 사용 ex) 폭포수 모델 [순서] 1) 문제 탐색 - 비즈니스 모델 기반 문제 탐색: 비즈니스 모델 캔버스의 9가지 블록 단순화 = 업무, 제품, 고객, 규제와 감사, 지원인프라 - 분석 기획 발굴의 범위 확장: 거시적 관점의 메가 트렌드 경쟁자 확대: 대체제, 경쟁자, 신규 진입자 역량의 재해석: 내부 역량, 파트너와 네트워크 ..

자격증/ADP 2025.07.13

[ADP] 3과목) 1장 데이터 분석 기획의 이해 - 2. 분석 방법론

[ 분석 방법론 ] : 데분이 효과적으로 기업 내에 정착하기 위해 이를 체계화한 절차와 방법이 정리된 데이터 분석 방법론의 수립이 필수 - 일반적으로 계층적 프로세스 모델로 구성# 구성요소: 상세한 절차, 방법, 도구와 기법, 템플릿과 산출물 # 분석 모형 프로세스(방법론의 구성)단계(Phase)- 최상위 계층- 완성된 단계별 완료 보고서 생성테스크(Task)- 중간 계층- 단계를 구성하는 단위 활동스텝(Step)- 최하위 계층- 입력자료, 처리 및 도구, 출력자료 등으로 구성된 프로세스 # 기업의 합리적 의사결정 장애요소- 고정관념- 편향된 생각(bias)- 프레이밍 효과 (Framing Effect): 같은 사건을 어떤 시각으로 보는지에 다라 해석이 달라짐 ex) 살 확률은 60%(성공률 강조) ..

자격증/ADP 2025.07.13

[ADP] 3과목) 1장 데이터 분석 기획의 이해 - 1. 분석 기획 방향성 도출

[ 데이터 분석 기획 ] : 본격적인 분석 실행 전, 과제 정의 및 분석 계획을 세우는 단계 - soft, hard 스킬을 모두 고려하여 기획을 해야 해서 본격적인 분석 전 중요 단계 # 분석 유형 - 대상을 알고 있으면 OS - 모르면 ID 분석 대상(What)OX분석 방법(How)OOptimization(최적화)Insight(통찰)XSolution(솔루션)Discovery(발견) # 목표 시점 별 분석 기획 과제 중심적인 접근 방식(과제 단위)자속적 분석 문화 내재화(마스터 플랜 단위)1차 목표Speed & TestAccuracy & Deploy과제 유형Quick - Win (빠른 속도)Long Term View (오랜 시간)접근 방식Problem Solving(문제 해결)Problem Defi..

자격증/ADP 2025.07.12
728x90
반응형