책 소개
이 책의 특징
모든 산업 분야에서 사물인터넷과 인공지능 기술이 융합되어 중대한 의사를 결정하고 미래를 예측하기 위한 디지털 데이터 중심의 융·복합 사회를 향한 도약은 이미 시작되었다. 불과 몇 년 전까지만 해도 컴퓨터 관련 전공학과에서만 다루었던 데이터 사이언스 영역이 이제는 학과와 전공의 영역을 넘나들며 높았던 지식 분야의 경계선을 무너트리고 있다.
아날로그 세상에서 사용했던 대화와 전달 방법은 점증적으로 디지털화 되어가고 있는 현실에서 우리는 데이터 사이언스라는 새로운 분야에 대한 능력이 필요하다는 트렌드의 변화를 매일매일 종용받고 있다고 봐도 무방하다. 데이터 사이언스란 수집된 데이터를 기반으로 사용하고자 하는 목적에 부합되도록 가공하고 처리하여 효율적인 결과를 얻기 위한 학문이라고 볼 수 있다.
요즘 주변에서 많이 볼 수 있는 도서 중 사물인터넷과 빅데이터 분석, 머신러닝, 딥러닝, 인공지능과 관련하여 1권 이상을 보유하고 있는 독자분들도 많을 것이지만, 관련분야에 대한 전문지식을 보유하고 있지 않다면 한 페이지, 한 페이지를 넘기기가 결코 쉽지 않다.
특히 대학생들이 배우고 싶은 데이터 사이언스 영역, 데이터 사이언스와 관련하여 교과목을 개설하고자 하는 교수자의 입장에서 정말 내 마음에 쏙 드는 도서를 찾기란 적지 않은 노력과 많은 시간 투자가 필요했을 것이다. 필자는 이와 같은 동기로 전공과 비전공을 구분하지 않고 입문자도 쉽게 배울 수 있도록 ‘인공지능 시대를 위한 데이터 사이언스 Hard Carry’ 도서를 정성껏 집필하였다.
이 책의 활용방법
※ 손쉬운 데이터 분석 환경 구축 + 아나콘다
입문자도 쉽게 데이터 분석 환경을 구축할 수 있으며, 데이터 분석에 필요한 파이썬 프로그래밍으로 데이터 분석 과정을 실습할 수 있다.
※ 개념 설명 ⇨ 풍부한 예제 ⇨ 도전 문제로 이어지는 3단계 학습체계
[여기서 잠깐] 코너를 통해 중요한 핵심을 정리할 수 있으며, 단원에서 다루는 중요한 내용에 대해 파이썬 프로그램으로 예제를 수행하고 배운 내용을 바탕으로 실력향상을 위한 도전 문제를 자신있게 수행할 수 있다.
※ 배움의 기쁨을 만끽할 수 있는 IT 교과서
본문에서 배운 내용을 함축해 놓은 핵심 요약과 단원에서 배운 내용을 최종 마무리하는 연습문제를 통해 인공지능 시대를 위한 데이터 사이언티스트가 될 수 있다.
작가 소개
신윤환
「Big Data 환경에서 Needle Points 선정을 위한 생체 데이터의 패턴 분석」으로 이학박사 학위를 취득하였고 중소벤처기업부 정보화/융합기술 전문위원과 스마트제조혁신추진단 기술위원, 중소기업기술정보진흥원, 정보통신기획평가원, 기상청, 한국콘텐츠진흥원에서 연구개발지원사업평가위원으로 활동하고 있습니다.
주요저서로는 《Linux & Unix 정복하기》, 《프로그램 개발을 위한 첫 걸음 C Programming 정복하기》, 《Apache+PHP+MySQL로 웹 데이터베이스를 구축하는 PHP Programming 정복하기》, 《CentOS7으로 쉽게 터득하는 Linux 시스템 구축 실무 테크닉》, 《XAMPP에서 쉽게 연출하는 PHP7 웹 프로그래밍 실무 테크닉》, 《소프트웨어 창의력 향상을 위한 Python3 STARTUP》, 《C 언어 일취월장》, 《PHP EXPRESS》, 《CentOS 8 LINUX EXPRESS》, 《입문자도 쉽게 배우는 우분투 리눅스 EXPRESS》 등이 있습니다.
목 차
PART 01 데이터 분석 환경
CHAPTER 01 데이터 분석적 사고방식
01 데이터 가치의 재발견
데이터 필수 시대
데이터 사이언스 로드맵
데이터가 제공하는 무한한 기회
정형 데이터와 비정형 데이터
비즈니스 인텔리전스
02 데이터 사이언티스트
등장 배경
역량 개발
마인드 세팅
03 미래를 예측하는 의사결정
사물인터넷
빅데이터와 인공지능
머신 러닝과 딥러닝
미래를 내다볼 수 있는 데이터 과학
핵심요약
연습문제
CHAPTER 02 데이터 분석 환경 구축
프로그래밍 언어
프로그래밍 언어의 이해
저급 언어와 고급 언어
컴파일과 컴파일러
02 파이썬과 아나콘다
데이터 분석 도구
프로그램 설치
아나콘다 내비게이터
03 파이썬 개발 환경
주피터 랩
콘솔 창 인터페이스
노트북 인터페이스
핵심요약
연습문제
PART 02 데이터 모델링과 패턴 분석
CHAPTER 03 데이터 모델링
01 데이터 모델링의 이해
데이터 모델링이란?
의사소통의 이해
전달 오류
명확한 의사 전달
02 요구사항 분석
요구사항 분석이란?
창의적 사고
논리적 사고
요구사항 분석 명세서
03 문제 정의와 타당성 분석
문제 정의
타당성 분석
핵심요약
연습문제
CHAPTER 04 문제 해결 절차
01 문제 해결 방법
문제 해결
문제 해결 능력
문제 해결 과정
02 패턴과 일반화
패턴의 이해
패턴의 일반화
문제 해결 패턴
03 분해 및 설계
모듈 분해
작업 분할 구조도
문제 해결 설계
04 알고리즘
알고리즘의 이해
알고리즘의 필요성
알고리즘의 표현 방법
05 문제 해결 평가
평가 방법
문제 해결 피드백
핵심요약
연습문제
CHAPTER 05 패턴 분석
01 패턴의 흐름
순차형 구조
선택형 구조
반복형 구조
02 패턴 추출
연관 규칙
패턴 찾기
03 패턴 분석 유형
순차형 패턴 분석
선택형 패턴 분석
반복형 패턴 분석
핵심요약
연습문제
CHAPTER 06 터틀을 활용한 패턴 분석
01 터틀 모듈 명령
터틀 모양과 색상 지정
터틀 이벤트 명령
02 터틀 그래픽 그리기
가로 선 그리기
커서의 모양 변경
선 색상 지정과 터틀 방향 전환
펜 들기와 내려놓기
03 패턴별 터틀 동작
순차형 터틀 동작
선택형 터틀 동작
반복형 터틀 동작
핵심요약
연습문제
PART 03 데이터 전처리와 정규화
CHAPTER 07 데이터 프레임
01 데이터 프레임 요소
데이터 프레임
인덱스
02 데이터 프레임 생성
생성 함수
데이터 프레임 생성하기
03 데이터 프레임 설정
행 인덱스와 열 이름 설정
DataFrame( ) 함수의 인자로 전달
rename( ) 메소드
04 데이터 선택
행 데이터 선택
열 데이터 선택
핵심요약
연습문제
CHAPTER 08 데이터 프레임 편집
01 행과 열 추가
열 추가하기
행 추가하기
02 특정 원소 선택
단독 원소 선택하기
여러 개의 원소 선택하기
03 원소값 변경
열의 원소값 변경하기
행의 원소값 변경하기
04 행과 열의 위치 변경
transpose( ) 메소드
행과 열의 위치 변경하기
05 행과 열 삭제
행 삭제하기
열 삭제하기
핵심요약
연습문제
CHAPTER 09 데이터 전처리
01 데이터 전처리에 대한 이해
데이터 전처리란?
레코드와 필드
데이터 읽기와 쓰기
02 데이터 프레임을 파일로 저장
Excel 파일로 저장하기
CSV 파일로 저장하기
JSON 파일로 저장하기
03 데이터 파일 읽어오기
Excel 파일 읽어오기
CSV 파일 읽어오기
CSV UTF-8 파일 읽어오기
JSON 파일 읽어오기
04 인덱스 활용
행 인덱스 설정
행 인덱스 재배열
행 인덱스 초기화
데이터 프레임 정렬
핵심요약
연습문제
CHAPTER 10 데이터 프레임과 통계 함수
01 데이터 살펴보기
CSV 파일 생성하기
데이터를 살펴보기 위한 메소드
데이터 미리 살펴보기
02 데이터 요약 정보
데이터 프레임의 크기
데이터 프레임의 기본 정보 확인
특정 열에 대한 자료형 정보 확인
03 기술 통계 정보
산술 데이터의 기술 통계 정보
산술 데이터를 구분하는 통계 정보
04 데이터의 개수 확인
각 열의 데이터 개수 확인
각 열의 고유값 개수 확인
05 통계 함수
평균값과 중간값 산출
최댓값과 최솟값 산출
표준 편차와 상관 계수
핵심요약
연습문제
CHAPTER 11 데이터 정규화
01 데이터 정규화의 이해
데이터 정규화란?
정규화의 기대효과
02 누락 데이터 처리
CSV 파일 생성하기
누락 데이터 확인하기
누락 데이터 치환하기
누락 데이터 제거하기
03 중복 데이터 처리
중복 데이터 확인하기
중복 데이터 제거하기
핵심요약
연습문제
PART 04 데이터 시각화
CHAPTER 12 의사결정을 위한 데이터 시각화
01 시각화의 역량
데이터 시각화란?
데이터 시각화의 종류
데이터 시각화의 활용 절차
02 판다스의 시각화 도구
CSV 파일 생성하기
판다스에서 제공하는 그래프 도구
한글 폰트 오류 해결
03 기본 그래프 그리기
선 그래프
막대 그래프
박스 플롯
커널 밀도 그래프
핵심요약
연습문제
CHAPTER 13 시각화 라이브러리
01 Matplotlib 라이브러리
Matplotlib 갤러리
그래프 환경 설정
산점도 그래프
다양한 선 그래프
02 NumPy 라이브러리
NumPy 사이트
NumPy 라이브러리 설치
NumPy 사용 방법
03 Seaborn 라이브러리
Seaborn 갤러리
Seaborn 라이브러리 설치
선형 회귀 시각화
바 플롯 시각화
박스 플롯 시각화
바이올린 시각화
겹친 그래프 시각화
서브 플롯 시각화
04 타이타닉과 아이리스
타이타닉 데이터셋
아이리스 데이터셋
핵심요약
연습문제
찾아보기
- 단순 변심인 경우 : 상품 수령 후 7일 이내 신청
- 상품 불량/오배송인 경우 : 상품 수령 후 3개월 이내, 혹은 그 사실을 알게 된 이후 30일 이내 반품 신청 가능
반품사유 | 반품 배송비 부담자 |
---|---|
단순변심 | 고객 부담이며, 최초 배송비를 포함해 왕복 배송비가 발생합니다. 또한, 도서/산간지역이거나 설치 상품을 반품하는 경우에는 배송비가 추가될 수 있습니다. |
고객 부담이 아닙니다. |
진행 상태 | 결제완료 | 상품준비중 | 배송지시/배송중/배송완료 |
---|---|---|---|
어떤 상태 | 주문 내역 확인 전 | 상품 발송 준비 중 | 상품이 택배사로 이미 발송 됨 |
환불 | 즉시환불 | 구매취소 의사전달 → 발송중지 → 환불 | 반품회수 → 반품상품 확인 → 환불 |
- 결제완료 또는 배송상품은 1:1 문의에 취소신청해 주셔야 합니다.
- 특정 상품의 경우 취소 수수료가 부과될 수 있습니다.
결제수단 | 환불시점 | 환불방법 |
---|---|---|
신용카드 | 취소완료 후, 3~5일 내 카드사 승인취소(영업일 기준) | 신용카드 승인취소 |
계좌이체 |
실시간 계좌이체 또는 무통장입금 취소완료 후, 입력하신 환불계좌로 1~2일 내 환불금액 입금(영업일 기준) |
계좌입금 |
휴대폰 결제 |
당일 구매내역 취소시 취소 완료 후, 6시간 이내 승인취소 전월 구매내역 취소시 취소 완료 후, 1~2일 내 환불계좌로 입금(영업일 기준) |
당일취소 : 휴대폰 결제 승인취소 익월취소 : 계좌입금 |
포인트 | 취소 완료 후, 당일 포인트 적립 | 환불 포인트 적립 |
- 단순변심으로 인한 반품 시, 배송 완료 후 7일이 지나면 취소/반품 신청이 접수되지 않습니다.
- 주문/제작 상품의 경우, 상품의 제작이 이미 진행된 경우에는 취소가 불가합니다.
- 구성품을 분실하였거나 취급 부주의로 인한 파손/고장/오염된 경우에는 취소/반품이 제한됩니다.
- 제조사의 사정 (신모델 출시 등) 및 부품 가격변동 등에 의해 가격이 변동될 수 있으며, 이로 인한 반품 및 가격보상은 불가합니다.
- 뷰티 상품 이용 시 트러블(알러지, 붉은 반점, 가려움, 따가움)이 발생하는 경우 진료 확인서 및 소견서 등을 증빙하면 환불이 가능하지만 이 경우, 제반 비용은 고객님께서 부담하셔야 합니다.
- 각 상품별로 아래와 같은 사유로 취소/반품이 제한 될 수 있습니다.
상품군 | 취소/반품 불가사유 |
---|---|
의류/잡화/수입명품 | 상품의 택(TAG) 제거/라벨 및 상품 훼손으로 상품의 가치가 현저히 감소된 경우 |
계절상품/식품/화장품 | 고객님의 사용, 시간경과, 일부 소비에 의하여 상품의 가치가 현저히 감소한 경우 |
가전/설치상품 | 전자제품 특성 상, 정품 스티커가 제거되었거나 설치 또는 사용 이후에 단순변심인 경우, 액정화면이 부착된 상품의 전원을 켠 경우 (상품불량으로 인한 교환/반품은 AS센터의 불량 판정을 받아야 합니다.) |
자동차용품 | 상품을 개봉하여 장착한 이후 단순변심의 경우 |
CD/DVD/GAME/BOOK등 | 복제가 가능한 상품의 포장 등을 훼손한 경우 |
상품의 시리얼 넘버 유출로 내장된 소프트웨어의 가치가 감소한 경우 | |
노트북, 테스크탑 PC 등 | 홀로그램 등을 분리, 분실, 훼손하여 상품의 가치가 현저히 감소하여 재판매가 불가할 경우 |