책 소개
데이터를 처리하고 분석하여 가치 있는 정보를 얻어서 활용하는 데이터사이언스는 현대사회를 이끌어감에 있어서 중요한 역할을 하고 있다. 데이터사이언스의 모든 과정을 능숙하게 처리할 수 있는 능력을 갖춘다는 것은 통계적 지식, 수학적 지식, 컴퓨팅 지식 등의 다양한 분야에서의 학습이 필요하므로 단기간의 지식 습득으로는 이루어지기 어렵다. 이런 어려움을 해결하기 위해 데이터사이언스를 지원해주는 툴(tool)들이 다양하게 개발되어 있지만 데이터분석에 대한 기초적인 개념과 분석방법에 대한 기본 지식이 있어야 툴을 이용해서 원하는 정보를 얻을 수 있으므로 최소한의 기초적 지식의 습득은 필요하다고 생각한다.
이 책에서는 이러한 툴 중에서, 접근성이 용이하고 그 활용도에 있어서 인정을 받고 있는 래피드마이너 스튜디오(RapidMiner Studio)를 활용하여 데이터사이언스에 대한 기본 지식을 습득할 수 있도록 구성하였다. 래피드마이너 분석프로세스는 프로그램 작성이나 코딩을 할 필요 없이 여러 오퍼레이터들의 조합이 그림으로 표현되어 사용자가 수월하게 결과를 얻을 수 있으며, 또 다양한 유형의 데이터에의 접근이 수월하다는 강점을 지니고 있다.
이 책의 구성
전체 9장으로 되어 있고, 데이터 분석을 위한 기본 개념과 데이터에 대한 탐색(PART Ⅰ: 1~5장)과 데이터사이언스의 대표적인 분석방법(PART Ⅱ: 6~9장)의 두 부분으로 구성되어 있다. 학생들이 이해할 수 있는 기초적인 수준의 내용으로 구성하기 위해서, 저자들이 많은 시간 동안 토론과 고민을 통해 각 장의 주제를 선별하여 구성하였다. 각 장에서는 주제에 따른 기초적인 설명과 함께 래피드마이너 스튜디오에서 주어진 데이터를 이용하여 학습한 내용을 실습하도록 되어있다. 분석 순서에 맞추어 실습 화면들이 캡처되어 있어서 컴퓨팅에 익숙하지 않은 학생들도 수월하게 내용을 학습하고 실습할 수 있으리라 생각한다.
데이터사이언스에 대한 기초적 수준의 강의로 활용하는 경우, 한 학기 강의용으로 사용하면 적당할 것으로 생각한다. 다양한 부분에서의 활용도를 생각하면 분석방법에서의 주제를 더 늘여야 할 필요도 있겠지만, 한 학기 교양 강의를 위한 교재를 목표로 시작된 책이니만큼 데이터사이언스에 대한 첫걸음을 도와주는 단계로 이 책이 활용되기를 바란다. 교재에 사용된 자료는 생능출판사 홈페이지(www.booksr.co.kr)에서 내려받을 수 있다.
작가 소개
서울대학교 / 통계학박사
(현재) 인제대학교 통계학과 교수
주요 연구분야: 시계열분석, 데이터마이닝
목 차
PART Ⅰ 데이터탐색
CHAPTER 01 서론
1.1 데이터사이언스
1.2 데이터분석 목적 및 기법
1.3 래피드마이너
1.4 래피드마이너 스튜디오
1.5 래피드마이너 스튜디오 설치
연습문제
CHAPTER 02 데이터
2.1 변수
2.2 통계량
2.3 래피드마이너 실습
연습문제
CHAPTER 03 데이터정제
3.1 오류정보
3.2 결측치 및 이상치
3.3 변수생성
3.4 자료저장
3.5 Data Editor 창
연습문제
CHAPTER 04 데이터시각화 I
4.1 도수분포표
4.2 상자그림
4.3 막대그래프
4.4 히스토그램
4.5 원그래프
연습문제
CHAPTER 05 데이터시각화 II
5.1 도수분포표
5.2 요약통계량
5.3 히스토그램과 산점도
5.4 상관분석
연습문제
PART Ⅱ 분석기법
CHAPTER 06 선형회귀분석
6.1 선형회귀모형
6.2 선형회귀모형의 종류
6.3 회귀계수 추정
6.4 모형평가
6.5 변수선택
6.6 래피드마이너 실습
연습문제
CHAPTER 07 의사결정나무
7.1 의사결정나무의 개념
7.2 의사결정나무의 구성
7.3 의사결정나무의 형성
7.4 의사결정나무의 예측
7.5 래피드마이너 실습
연습문제
CHAPTER 08 신경망분석
8.1 신경망
8.2 신경망 활용사례
8.3 신경망 작동원리
8.4 래피드마이너 실습
연습문제
CHAPTER 09 군집분석
9.1 군집분석
9.2 군집분석 활용사례
9.3 군집분석 방법
9.4 k-means 방법
9.5 래피드마이너 실습
연습문제
오퍼레이터 정리
- 단순 변심인 경우 : 상품 수령 후 7일 이내 신청
- 상품 불량/오배송인 경우 : 상품 수령 후 3개월 이내, 혹은 그 사실을 알게 된 이후 30일 이내 반품 신청 가능
반품사유 | 반품 배송비 부담자 |
---|---|
단순변심 | 고객 부담이며, 최초 배송비를 포함해 왕복 배송비가 발생합니다. 또한, 도서/산간지역이거나 설치 상품을 반품하는 경우에는 배송비가 추가될 수 있습니다. |
고객 부담이 아닙니다. |
진행 상태 | 결제완료 | 상품준비중 | 배송지시/배송중/배송완료 |
---|---|---|---|
어떤 상태 | 주문 내역 확인 전 | 상품 발송 준비 중 | 상품이 택배사로 이미 발송 됨 |
환불 | 즉시환불 | 구매취소 의사전달 → 발송중지 → 환불 | 반품회수 → 반품상품 확인 → 환불 |
- 결제완료 또는 배송상품은 1:1 문의에 취소신청해 주셔야 합니다.
- 특정 상품의 경우 취소 수수료가 부과될 수 있습니다.
결제수단 | 환불시점 | 환불방법 |
---|---|---|
신용카드 | 취소완료 후, 3~5일 내 카드사 승인취소(영업일 기준) | 신용카드 승인취소 |
계좌이체 |
실시간 계좌이체 또는 무통장입금 취소완료 후, 입력하신 환불계좌로 1~2일 내 환불금액 입금(영업일 기준) |
계좌입금 |
휴대폰 결제 |
당일 구매내역 취소시 취소 완료 후, 6시간 이내 승인취소 전월 구매내역 취소시 취소 완료 후, 1~2일 내 환불계좌로 입금(영업일 기준) |
당일취소 : 휴대폰 결제 승인취소 익월취소 : 계좌입금 |
포인트 | 취소 완료 후, 당일 포인트 적립 | 환불 포인트 적립 |
- 단순변심으로 인한 반품 시, 배송 완료 후 7일이 지나면 취소/반품 신청이 접수되지 않습니다.
- 주문/제작 상품의 경우, 상품의 제작이 이미 진행된 경우에는 취소가 불가합니다.
- 구성품을 분실하였거나 취급 부주의로 인한 파손/고장/오염된 경우에는 취소/반품이 제한됩니다.
- 제조사의 사정 (신모델 출시 등) 및 부품 가격변동 등에 의해 가격이 변동될 수 있으며, 이로 인한 반품 및 가격보상은 불가합니다.
- 뷰티 상품 이용 시 트러블(알러지, 붉은 반점, 가려움, 따가움)이 발생하는 경우 진료 확인서 및 소견서 등을 증빙하면 환불이 가능하지만 이 경우, 제반 비용은 고객님께서 부담하셔야 합니다.
- 각 상품별로 아래와 같은 사유로 취소/반품이 제한 될 수 있습니다.
상품군 | 취소/반품 불가사유 |
---|---|
의류/잡화/수입명품 | 상품의 택(TAG) 제거/라벨 및 상품 훼손으로 상품의 가치가 현저히 감소된 경우 |
계절상품/식품/화장품 | 고객님의 사용, 시간경과, 일부 소비에 의하여 상품의 가치가 현저히 감소한 경우 |
가전/설치상품 | 전자제품 특성 상, 정품 스티커가 제거되었거나 설치 또는 사용 이후에 단순변심인 경우, 액정화면이 부착된 상품의 전원을 켠 경우 (상품불량으로 인한 교환/반품은 AS센터의 불량 판정을 받아야 합니다.) |
자동차용품 | 상품을 개봉하여 장착한 이후 단순변심의 경우 |
CD/DVD/GAME/BOOK등 | 복제가 가능한 상품의 포장 등을 훼손한 경우 |
상품의 시리얼 넘버 유출로 내장된 소프트웨어의 가치가 감소한 경우 | |
노트북, 테스크탑 PC 등 | 홀로그램 등을 분리, 분실, 훼손하여 상품의 가치가 현저히 감소하여 재판매가 불가할 경우 |