Justweon
Justweon
Justweon
전체 방문자
오늘
어제
  • 분류 전체보기 (70)
    • 웹 개발 (2)
      • React (0)
      • Spring (0)
    • 모바일 앱 프로그래밍 (4)
    • 네트워크 프로그래밍 (17)
      • C (17)
    • DATA (42)
      • 데이터 사이언스 (6)
      • 머신 러닝 (31)
      • 데이터베이스 (2)
      • 기타 (3)
    • 토이 프로젝트 (0)
      • 닮은 배우 분류기 (0)
      • PDF 변환기 (GUI) (0)
    • 취미 (1)
      • Photoshop (1)
      • 먹부림 (0)
    • 이것저것 (2)
    • 보안 (1)
      • 드림핵 (1)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • GUI
  • 알고리즘
  • 데이터 사이언스
  • 시각화
  • 과소적합(underfitting)
  • 텐서보드
  • 하이퍼 파라미터
  • 심층 신경망
  • MLP
  • 샐러드
  • 머신 러닝
  • 맛집
  • 콜백
  • 파이썬
  • 취미
  • 모델 평가
  • 하이퍼파라미터
  • 토이프로젝트
  • tensorflow
  • keras
  • pandas
  • 그리드 서치
  • 프로젝트
  • 데이터 전처리
  • 포토샵
  • 코랩
  • SVM
  • 정규화
  • 경사 하강법
  • 과대적합(overfitting)

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
Justweon

Justweon

DATA/머신 러닝

[머신 러닝] 간단한 머신 러닝 프로젝트 해보기

2022. 1. 11. 18:32

동기

지금 Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow로 공부하고 있는데,

chapter 2에서 간단한 머신 러닝 프로젝트를 해볼 수 있는 내용이 있어서 따라해보려고 합니다.

데이터 설명

이 프로젝트는 StatLib 저장소에 있는 캘리포니아 주택 가격 데이터셋을 사용합니다.

이 데이터는 캘리포니아의 블록 그룹마다 인구, 중간 소득, 중간 주택 가격 등을 담고 있습니다.

목표

이 데이터로 모델을 학습시켜서 다른 측정 데이터가 주어졌을 때 구역의 중간 주택 가격을 예측해야 합니다.

문제 정의

먼저 문제를 정의해야 합니다.

우리에게는 레이블된 훈련 샘플이 있으니 지도 학습이고,

값을 예측해야 하고 예측에 사용할 특성이 여러개이므로 다중 회귀 문제입니다.

또한 각 구역마다 하나의 값을 예측하므로 단변량 회귀 문제입니다.

성능 측정 지표 선택

회귀 문제의 전형적인 성능 지표는 평균 제곱근 오차(RMSE)이므로 이를 사용하겠습니다.

프로젝트 코드

'DATA > 머신 러닝' 카테고리의 다른 글

[머신 러닝] 경사 하강법 (Gradient descent)  (0) 2022.01.16
[머신 러닝] 분류 (Classification)  (0) 2022.01.15
[머신 러닝] 행렬 인수분해 (Matrix Factorization)  (0) 2022.01.10
[머신 러닝] 협업 필터링 (collaborative filtering)  (0) 2022.01.10
[머신 러닝] 에이다 부스트 (AdaBoost)  (0) 2022.01.10
    'DATA/머신 러닝' 카테고리의 다른 글
    • [머신 러닝] 경사 하강법 (Gradient descent)
    • [머신 러닝] 분류 (Classification)
    • [머신 러닝] 행렬 인수분해 (Matrix Factorization)
    • [머신 러닝] 협업 필터링 (collaborative filtering)
    Justweon
    Justweon
    공부 목적을 위해 기록하는 블로그입니다 :)

    티스토리툴바