250x250
Notice
Recent Posts
Recent Comments
Link
job다한 공부
데이터 분석을 기획자의 시선에서 바라보기 본문
728x90
안녕하세요! '데이터 분석'이라는 말이 정말 중요해지고 많이 들려오는 것 같습니다. 데이터 분석이란 무엇인지, 면접을 준비하며 정리한 내용을 같이 덧붙이며 작성해보았습니다.
데이터 분석이란 무엇인가?
데이터 분석은 데이터를 수집, 정리, 해석하여 의미 있는 인사이트를 도출하는 과정입니다. 이는 단순한 수치 계산을 넘어, 비즈니스 문제 해결과 의사결정 지원을 위한 중요한 도구로 활용됩니다.
데이터 분석의 중요성
데이터 분석은 다음과 같은 이유로 중요합니다.
- 의사결정 지원: 데이터 기반 의사결정은 직관보다 더 신뢰 가능
- 패턴 및 트렌드 발견: 데이터에서 숨겨진 패턴을 찾아 비즈니스 전략을 개선
- 효율성 증대: 불필요한 리소스를 줄이고 최적의 방법을 도출
기획자에게 데이터 가 중요한 이유
제가 경험한 프로젝트들을 보면, 데이터 분석은 단순한 기술적인 역할을 넘어 기획자의 핵심 역량으로 작용합니다.
- 비즈니스 기회 발굴 및 최적화
- 독일 THU 프로젝트에서는 LLM 기반의 세일즈 리드 분석을 통해 고객 전환 가능성을 예측하는 솔루션을 기획했습니다.
- 데이터를 기반으로 최적의 고객군을 선별하고, 기업의 마케팅 전략을 개선하는 데 기여했습니다.
- 의사결정 근거 제공
- STAEX 프로젝트에서는 블록체인 도입 기획을 위해 고객사의 데이터와 공시자료를 분석하여 문제점을 도출했습니다.
- 데이터를 기반으로 5년간 비용 절감 효과를 시뮬레이션하여 의사결정의 신뢰도를 높였습니다.
THU 프로젝트의 데이터 분석과정
Feature Engineering과 Feature Importance 평가
데이터 분석 과정에서는 Feature Engineering의 일환으로, Random Forest 모델을 활용하여 Feature Importance(변수 중요도)를 평가하였습니다.
1. Ydata profiling(EDA): 데이터 구조 파악
- ydata profiling은 빠르게 구조를 파악할 수 있습니다.
- 이를 통해 결측치와 변수의 상관관계를 파악했습니다.
2. Random Forest 모델 활용
- Random Forest는 다수의 결정 트리(Decision Tree)를 조합하여 예측 성능을 향상시키는 앙상블 학습 기법입니다.
- 각 변수(Feature)가 모델 예측에 미치는 영향을 분석하여 중요도를 평가하였습니다.
3. Feature Importance 점수를 통한 변수 평가
- Feature Importance 점수를 활용하여 각 변수의 상대적인 중요도를 측정하였습니다.
- 이를 통해 모델 학습에 크게 기여하는 변수와 그렇지 않은 변수를 구분할 수 있습니다.
4. 중요도가 낮은 컬럼 제거
- 중요도가 낮은 변수(예: Priority_Text, Source_Text, Company 등)는 모델 성능에 미치는 영향이 작으므로 제거하였습니다.
- 불필요한 변수를 제거함으로써 모델의 복잡도를 줄이고, 연산 속도를 개선하며, 과적합(Overfitting) 방지에 기여하였습니다.
5. 중복 정보 포함 컬럼 제거
- 특정 컬럼이 예측값을 암시하거나(정답이 나와버린 것이니 제외합니다), 비슷한 정보를 포함하고 있는 경우, 해당 컬럼을 제거하여 데이터의 독립성을 유지하였습니다.
- 이 과정은 학습 성능을 개선하고, 모델의 일반화 성능을 높이는 데 도움이 됩니다.
6. 최종 변수 선택 및 모델 재학습
- 중요도가 높은 정보와 기존의 유사 서비스를 조사해 필요한 변수와 정보를 구분했습니다.
- 직접 데이터를 읽어보면서 데이터의 의미를 이해하고 필요한 부분을 선별할 수 잇었습니다.
- 이러한 과정을 거쳐 모델의 해석 가능성을 높이고, 최적의 학습 성능을 확보하였습니다.
결론
데이터 분석에서는 객관적인 근거뿐만 아니라 비즈니스적 관점이 중요하다는 것을 알 수 있었습니다.
- 불필요한 변수를 제거함으로써 모델의 성능을 향상시키고, 데이터의 품질을 높일 수 있습니다.
- 또한, Feature Importance 분석을 활용하여 보다 효과적인 예측 모델을 구축할 수 있습니다.
데이터 분석은 단순한 숫자 조작이 아닌, 기획자의 문제 해결 능력과 비즈니스 의사결정 과정에서도 필수적인 역량이라는게 무슨말인지 와닿는거 같네요! 🚀
728x90
'기획' 카테고리의 다른 글
[기업 분석] 가비아의 클라우드 서비스 (1) | 2025.01.19 |
---|---|
CES 2025, AI 트렌드의 미래를 엿보다 (1) | 2025.01.12 |
한국어 LLM(대규모 언어 모델) 동향과 한국어 학습 서비스 기획 (1) | 2024.08.11 |
[WELL 해외일경험] 독일 STAEX 지원, 서류 합격 후 1차 면접 후기 (0) | 2024.07.18 |
[기획 스터디] 인공지능 발전과 그에 따른 인공지능 윤리 (0) | 2024.05.30 |