본문 바로가기

기초코딩강좌/파이썬(Python) 기초 강좌

파이썬(Python) 예제 : 데이터 분석 프로젝트

반응형

데이터 분석 프로젝트 예제를 하나 소개해 드리겠습니다. 이 프로젝트는 Pandas, NumPy, Matplotlib 같은 라이브러리를 사용해 데이터를 수집하고, 탐색 및 시각화하면서 분석하는 과정을 다룹니다. 예제로 "온라인 쇼핑몰 판매 데이터 분석"을 수행해보겠습니다.

데이터 분석 프로젝트: 온라인 쇼핑몰 판매 데이터 분석

이 프로젝트에서는 쇼핑몰의 매출 데이터를 분석하여 다음과 같은 질문에 답해봅니다.

  • 특정 상품의 판매 추이
  • 월별 총 매출과 가장 매출이 높은 달
  • 각 제품별 매출 기여도
  • 지역별 판매 분석

필요 라이브러리 설치

프로젝트를 수행하기 위해 pandas, numpy, matplotlib, seaborn 라이브러리를 설치합니다.

pip install pandas numpy matplotlib seaborn

 

데이터 분석 코드 예제

1. 라이브러리 가져오기 및 데이터 로드

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# 데이터 로드 (예시로 'sales_data.csv' 파일을 사용)
data = pd.read_csv('sales_data.csv')

# 데이터의 처음 5개 행 출력
print(data.head())

 

2. 데이터 탐색 및 전처리

# 데이터 기본 정보 확인
print(data.info())

# 결측값 확인
print(data.isnull().sum())

# 결측값이 있는 행 제거 또는 결측값 처리
data = data.dropna()

# 데이터 타입 확인 및 변환 (날짜 형식 변환 등)
data['Date'] = pd.to_datetime(data['Date'])

 

3. 월별 매출 추이 분석

# 날짜에서 월 추출하여 새로운 열 추가
data['Month'] = data['Date'].dt.month

# 월별 매출 합계 계산
monthly_sales = data.groupby('Month')['Revenue'].sum()

# 시각화
plt.figure(figsize=(10, 6))
monthly_sales.plot(kind='bar', color='skyblue')
plt.title("월별 매출 추이")
plt.xlabel("월")
plt.ylabel("매출")
plt.show()

 

4. 제품별 매출 기여도 분석

# 각 제품의 총 매출 계산
product_sales = data.groupby('Product')['Revenue'].sum()

# 시각화 - 파이 차트
plt.figure(figsize=(8, 8))
product_sales.plot(kind='pie', autopct='%1.1f%%', startangle=140)
plt.title("제품별 매출 기여도")
plt.ylabel('')
plt.show()

 

5. 지역별 판매 분석

# 지역별 매출 합계 계산
region_sales = data.groupby('Region')['Revenue'].sum()

# 시각화 - 바 차트
plt.figure(figsize=(10, 6))
sns.barplot(x=region_sales.index, y=region_sales.values, palette="viridis")
plt.title("지역별 매출")
plt.xlabel("지역")
plt.ylabel("매출")
plt.show()

 

6. 특정 제품의 판매 추이 분석

# 특정 제품 필터링 (예: "Product A")
product_data = data[data['Product'] == 'Product A']

# 날짜별 매출 추이 시각화
plt.figure(figsize=(12, 6))
plt.plot(product_data['Date'], product_data['Revenue'], color='orange')
plt.title("Product A의 판매 추이")
plt.xlabel("날짜")
plt.ylabel("매출")
plt.show()

데이터 분석 결과 요약

이러한 시각화와 데이터 분석을 통해 아래와 같은 정보를 얻을 수 있습니다.

  • 월별 매출 추이를 통해 매출이 가장 높은 달을 파악하고, 시즌별 마케팅 전략을 세울 수 있습니다.
  • 제품별 매출 기여도 분석을 통해 인기가 높은 제품에 대해 더 많은 마케팅 비용을 투자할 수 있습니다.
  • 지역별 매출 분석을 통해 특정 지역에 집중적인 프로모션을 제공할 수 있습니다.
  • 특정 제품의 판매 추이를 확인하여 소비자 선호도 변화를 감지할 수 있습니다.
728x90
반응형