책 소개
왜 데이터 과학에서 수학이 필요할까?
데이터 과학에서 가장 중요한 것은 단연 데이터다. 데이터를 사용하려면 데이터를 수집하고 정제하여 정량된 값으로 변환해야 하는데 이때 필요한 것이 수학이다. 선형대수, 미분과 적분, 확률과 통계로 데이터를 요약하고 파악할 수 있기 때문이다. 또한, 데이터를 바탕으로 문제를 정의하고 논리적으로 해결하는 데 수학적 접근이 큰 역할을 한다. 이처럼 수학은 다양한 분야에서 여러 사람과 협업할 때 이들 간의 의사소통을 도와주는 공통어가 되기도 한다.
어떻게 머신 러닝에서 수학을 활용할까?
선형대수는 마르코프 체인, 주성분 분석 모형에서 응용하고 미적분은 Bass 모형, 경사 하강법, 뉴턴랩슨 메서드에서 응용한 예제를 살펴본다. 마지막으로 확률과 통계는 상관분석과 분산분석, 포아송, 로지스틱 회귀 모형에서 응용해본다.
무슨 언어로 실습하면 좋을까?
데이터 과학에서 가장 많이 사용하는 언어는 파이썬과 R이다. 여기서 파이썬과 R 모두 실습할 수 있게 구성하였으며, 두 언어로 머신 러닝을 어떻게 구현하는지 알아보자.
작가 소개
연세대학교에서 문헌정보학과 컴퓨터·산업공학을 전공했으며, 동 대학원 정보산업공학과에서 데이터 마이닝 분야 박사 학위를 취득했다. 대용량 데이터를 처리&분석하는 다양한 기법과 도구를 활용하여 Technovation, Decision Support Systems, Technological Forecasting and Social Change, PLoS One 등 국내외 학술지와 GTM, ERSA, OR, EESD 등의 국제학회에 관련 연구들을 발표하고 있다.
을 번역했고 <특허로 답하다>, <스마트 스페이스와 디지털 트랜스포메이션 전략>을 공저했다.
목 차
1장 데이터 과학과 파이썬 소개
1.1 데이터 과학이란?
__1.1.1 아나콘다 설치하기
1.2 선형대수, 미분과 적분, 확률, 통계의 필요성
1.3 그리스 문자와 연산 기호
1.4 데이터와 변수의 이해
__1.4.1 텍스트 마이닝으로 살펴본 비정형 데이터의 분석
1.5 파이썬의 자료 구조
__1.5.1 파이썬 기본 빌트인 구조
__1.5.2 넘파이, 판다스 기반의 자료 구조
__1.5.3 파일로부터 자료 구조 생성하기
1.6 파이썬 실습
1.7 R 실습
1.8 핵심 요약
2장 머신 러닝을 위한 선형대수
2.1 선형대수의 필요성
2.2 벡터와 공간, 행렬과 사상
__2.2.1 벡터의 이해
__2.2.2 벡터의 사칙 연산
__2.2.3 행렬로의 확장
2.3 행렬의 내적과 외적
2.4 행렬 연산의 의미와 활용
__2.4.1 분석모형 응용 - 유사도행렬의 계산
2.5 행렬식, 역행렬 그리고 일차방정식
__2.5.1 분석모형 응용 - 마르코프 체인
2.6 행렬의 분해: 고윳값과 고유 벡터, 대각화
__2.6.1 분석모형 응용 - 주성분 분석
2.7 파이썬 실습
2.8 R 실습
2.9 핵심 요약
3장 미분과 적분의 이해와 응용
3.1 함수의 개념 이해
__3.1.1 함수와 합성 함수
__3.1.2 미분과 적분을 이해하기 위한 몇 가지 개념
3.2 미분의 이해
__3.2.1 간단한 미분 실습
__3.2.2 분석모형 응용 - 신제품 확산 모형
3.3 적분의 이해
__3.3.1 리만 적분 또는 정적분
3.4 미적분학의 기본정리, 편미분 그리고 경사 하강법
__3.4.1 미적분학의 기본정리
__3.4.2 편미분
__3.4.3 분석모형 응용 - 경사 하강법과 뉴턴랩슨 메서드
3.5 파이썬 실습
3.6 R 실습
3.7 핵심 요약
4장 확률과 통계
4.1 기초 통계 개념: 모집단/표본, 모수/통계량
4.2 통계량의 이해: 단변수 통계량
4.3 통계량의 이해: 다변수 통계량
4.4 확률이란
4.5 조건부 확률과 베이즈 정리
4.6 분석모형 응용-확률을 활용한 패턴의 발견
4.7 파이썬 실습
4.8 R 실습
4.9 핵심 요약
5장 확률 분포와 통계적 추론
5.1 확률 변수와 확률 분포
5.2 이산형 확률 분포
__5.2.1 이항 분포
__5.2.2 포아송 분포
5.3 연속형 확률 분포
__5.3.1 정규 분포와 중심 극한 정리
__5.3.2 t 분포
__5.3.3 χ2 분포
__5.3.4 F 분포
5.4 통계적 추론, 점 추정과 구간 추정
5.5 가설 검정
5.6 다양한 통계 검정
__5.6.1 정규성 검정
__5.6.2 t 검정
__5.6.3 쌍체 t 검정
__5.6.4 등분산 검정: F 검정
__5.6.5 χ2 검정 178
5.7 가설 검정의 오류 178
5.8 파이썬 실습 179
5.9 R 실습 182
5.10 핵심 요약
6장 상관분석과 분산분석
6.1 상관분석
6.2 분산분석
__6.2.1 일원 분산분석
__6.2.2 다중 비교
__6.2.3 이원 분산분석
6.3 상관분석의 활용
6.4 파이썬 실습
6.5 R 실습
6.6 핵심 요약
7장 선형 회귀 분석과 모형 확장
7.1 얇고도 깊은 분석의 목적
7.2 선형 회귀 분석
7.3 선형 회귀 분석의 주요 개념
7.4 모형의 예측과 오차의 측정
7.5 회귀모형의 확장1: 포아송 회귀모형 소개
7.6 선형모형의 확장2: 로지스틱 회귀모형 소개
__7.6.1 분류모형의 평가
7.7 파이썬 실습
7.8 R 실습
7.9 핵심 요약
8장 머신 러닝, 딥러닝 그리고 AI
8.1 데이터 분석에서 머신 러닝의 부상
8.2 딥러닝의 배경 및 개요
8.3 다양한 딥러닝 도구
__8.3.1 텐서플로 설치하기
8.4 딥러닝의 활용
8.5 파이썬 실습
8.6 R 실습
8.7 핵심 요약
부록 A 텐서플로 GPU 버전 설치하기
부록 B R 설치하기
부록 C Colab 사용하기
찾아보기
- 단순 변심인 경우 : 상품 수령 후 7일 이내 신청
- 상품 불량/오배송인 경우 : 상품 수령 후 3개월 이내, 혹은 그 사실을 알게 된 이후 30일 이내 반품 신청 가능
반품사유 | 반품 배송비 부담자 |
---|---|
단순변심 | 고객 부담이며, 최초 배송비를 포함해 왕복 배송비가 발생합니다. 또한, 도서/산간지역이거나 설치 상품을 반품하는 경우에는 배송비가 추가될 수 있습니다. |
고객 부담이 아닙니다. |
진행 상태 | 결제완료 | 상품준비중 | 배송지시/배송중/배송완료 |
---|---|---|---|
어떤 상태 | 주문 내역 확인 전 | 상품 발송 준비 중 | 상품이 택배사로 이미 발송 됨 |
환불 | 즉시환불 | 구매취소 의사전달 → 발송중지 → 환불 | 반품회수 → 반품상품 확인 → 환불 |
- 결제완료 또는 배송상품은 1:1 문의에 취소신청해 주셔야 합니다.
- 특정 상품의 경우 취소 수수료가 부과될 수 있습니다.
결제수단 | 환불시점 | 환불방법 |
---|---|---|
신용카드 | 취소완료 후, 3~5일 내 카드사 승인취소(영업일 기준) | 신용카드 승인취소 |
계좌이체 |
실시간 계좌이체 또는 무통장입금 취소완료 후, 입력하신 환불계좌로 1~2일 내 환불금액 입금(영업일 기준) |
계좌입금 |
휴대폰 결제 |
당일 구매내역 취소시 취소 완료 후, 6시간 이내 승인취소 전월 구매내역 취소시 취소 완료 후, 1~2일 내 환불계좌로 입금(영업일 기준) |
당일취소 : 휴대폰 결제 승인취소 익월취소 : 계좌입금 |
포인트 | 취소 완료 후, 당일 포인트 적립 | 환불 포인트 적립 |
- 단순변심으로 인한 반품 시, 배송 완료 후 7일이 지나면 취소/반품 신청이 접수되지 않습니다.
- 주문/제작 상품의 경우, 상품의 제작이 이미 진행된 경우에는 취소가 불가합니다.
- 구성품을 분실하였거나 취급 부주의로 인한 파손/고장/오염된 경우에는 취소/반품이 제한됩니다.
- 제조사의 사정 (신모델 출시 등) 및 부품 가격변동 등에 의해 가격이 변동될 수 있으며, 이로 인한 반품 및 가격보상은 불가합니다.
- 뷰티 상품 이용 시 트러블(알러지, 붉은 반점, 가려움, 따가움)이 발생하는 경우 진료 확인서 및 소견서 등을 증빙하면 환불이 가능하지만 이 경우, 제반 비용은 고객님께서 부담하셔야 합니다.
- 각 상품별로 아래와 같은 사유로 취소/반품이 제한 될 수 있습니다.
상품군 | 취소/반품 불가사유 |
---|---|
의류/잡화/수입명품 | 상품의 택(TAG) 제거/라벨 및 상품 훼손으로 상품의 가치가 현저히 감소된 경우 |
계절상품/식품/화장품 | 고객님의 사용, 시간경과, 일부 소비에 의하여 상품의 가치가 현저히 감소한 경우 |
가전/설치상품 | 전자제품 특성 상, 정품 스티커가 제거되었거나 설치 또는 사용 이후에 단순변심인 경우, 액정화면이 부착된 상품의 전원을 켠 경우 (상품불량으로 인한 교환/반품은 AS센터의 불량 판정을 받아야 합니다.) |
자동차용품 | 상품을 개봉하여 장착한 이후 단순변심의 경우 |
CD/DVD/GAME/BOOK등 | 복제가 가능한 상품의 포장 등을 훼손한 경우 |
상품의 시리얼 넘버 유출로 내장된 소프트웨어의 가치가 감소한 경우 | |
노트북, 테스크탑 PC 등 | 홀로그램 등을 분리, 분실, 훼손하여 상품의 가치가 현저히 감소하여 재판매가 불가할 경우 |