빅데이터 분석과 R 활용

고객평점
저자윤철호
출판사항생능, 발행일:2021/06/30
형태사항p.469 B5판:24
매장위치컴퓨터부(B2) , 재고문의 : 051-816-9500
ISBN9791186689363 [소득공제]
판매가격 28,000원  
포인트 560점
배송비결제주문시 결제
  • 주문수량 

총 금액 : 0원

책 소개

<빅데이터 분석과 R 활용>은 대학의 빅데이터 분석 교육을 위한 학습 교재로써 입문자 수준의 학생들이 R을 활용하여 빅데이터 분석을 실무적으로 수행할 수 있는 능력을 배양시키는 데 초점을 맞추고 있다.


 이 책은 정형 데이터 분석, 비정형 데이터 분석, 데이터 시각화를 모두 포함하는 포괄적인 관점에서 R을 활용한 빅데이터 분석 방안을 소개하고 있다.

 이 책은 분석 도구인 R의 기초, R 프로그래밍과 그래프 작성 방법 그리고 빅데이터 수집 기술인 웹 스크래핑(web scraping), 오픈 API 등을 포함하고 있다.

 이 책은 기술통계 및 추론통계, 데이터마이닝, 텍스트마이닝, 오피니언마이닝 그리고 소셜네트워크 분석 등의 다양한 빅데이터 분석 기법들을 다루고 있다.

 이 책은 단순 베이즈 분류, K-최근접 이웃 분석. 서포트 벡터 머신, 의사결정나무 분석, 신경망 분석, 연관 분석, 계층적 군집 분석, K-평균 군집 분석 등의 다양한 데이터마이닝 알고리즘에 대한 실습을 다루고 있다.

 이 책은 막대그래프, 파이 차트와 같은 기본 시각화 기술은 물론 트리 맵, 히트 맵, 버블 차트, 체르노프 페이스, 인터랙티브 그래프(Interactive Graph) 그리고 지도 맵핑 등의 다양한 고급 시각화 기술들을 다루고 있다.

 이 책은 상기와 같은 다양한 빅데이터 분석을 통계학이나 프로그래밍에 대한 사전 지식이 없는 학습자들도 따라 하는 식으로 수행할 수 있도록 작성되었다.

 이 책은 다수의 현실 세계의 실무 예제를 제공하고 있어 학습자들의 흥미를 유도할 수 있도록 설계되었다.


이 책이 대학의 학부 및 대학원생들의 빅데이터 분석 실무 교육을 위한 목적으로 작성되었으나, R을 활용한 빅데이터 분석을 체계적으로 학습하려는 분들에게도 전문 도서로써 충분한 역할을 할 수 있다.


이 책의 구성 및 내용


본 책 <빅데이터 분석과 R 활용>은 빅데이터 분석에 대한 포괄적인 이해와 실무 역량을 제공하기 위하여 빅데이터와 R에 대한 소개와 빅데이터 분석 기법들인 정형 데이터 분석, 비정형 데이터 분석, 데이터 시각화 기법에 대한 4부 13장으로 구성되어 있다.


제1부는 ‘빅데이터와 R’ 소개 부분으로 빅데이터의 전반적인 소개와 R 기초 및 프로그래밍을 다루고 있다. 제2부는 ‘정형 데이터 분석’ 부분으로 데이터 기술통계, 데이터 추론통계 그리고 데이터마이닝 분석을 다루고 있다. 제3부는 ‘비정형 데이터 분석’ 부분으로 텍스트마이닝, 오피니언마이닝 그리고 소셜네트워크 분석을 다루고 있다. 마지막 제4부는 ‘데이터 시각화’ 부분으로 다양한 고급 시각화 분석 기법들을 다루고 있다.


1장. 빅데이터

빅데이터에 대한 전반적인 소개 부분으로 빅데이터의 정의, 특징 및 종류와 빅데이터 분석을 위한 기반 기술들을 소개하고 있다. 또한 빅데이터 분석에서의 R과 파이썬의 기능상의 비교도 다루고 있다.


2장. R 기초

R 활용을 위한 기초 부분으로 R의 설치 및 운영환경 설정 그리고 R 기초 사용을 위한 수치계산 기능, 변수 그리고 자료구조에 대하여 다루고 있다.


3장. R 프로그래밍과 그래프

R 프로그래밍과 그래프 작성 방법에 대한 부분으로 R 프로그래밍 개념과 산술ㆍ비교ㆍ논리 연산, 조건ㆍ반복문, 사용자 정의 함수 그리고 기본적으로 제공되는 다양하고 기초적인 R 그래프 작성 방법에 대하여 다루고 있다.


4장. R 자료관리 및 수집

R 자료관리 및 R을 이용한 빅데이터 자료 수집에 대한 부분으로 외부 데이터 불러오기, 데이터 탐색, 데이터 분리 및 병합과 같은 자료관리와 파일 데이터 셋, 웹 스크래핑(web scraping) 및 오픈 API를 이용하여 빅데이터를 수집하는 방법들에 대하여 다루고 있다.


5장. 데이터 기술통계

R을 활용하여 정형 데이터에 대한 기술통계 분석에 대한 부분으로 전통적인 기술통계 기법인 빈도분석, 기술 분석, 교차분석, 다차원 척도법과 최근 빅데이터에 대한 효과적인 기술 분석을 위하여 활용되고 있는 그룹 분석과 탐색적 자료 분석 도구들에 대하여 다루고 있다.


6장. 데이터 추론통계

R을 활용하여 정형 데이터에 대한 추론통계 분석에 대한 부분으로 평균 차이 분석, 비율 차이 분석, 분산분석과 변수 간의 관계성에 초점을 맞추고 있는 상관관계 분석, 회귀분석 방법에 대하여 다루고 있다.


7장. 데이터마이닝(Ⅰ)

R을 활용하여 정형 데이터에 대한 데이터마이닝의 소개 및 분류 분석(classification) 대한 부분으로 데이터마이닝에 대한 전반적인 소개와 주요 데이터마이닝 기법인 단순 베이즈 분석, K-최근접 이웃, 서포트 벡터 머신, 의사결정나무 및 신경망을 이용하여 분류 분석을 수행하는 방법에 대하여 다루고 있다.


8장. 데이터마이닝(Ⅱ)

R을 활용하여 정형 데이터에 대한 예측 분석, 연관 분석, 군집 분석에 대한 부분으로 의사결정나무와 신경망을 이용한 예측 분석 방법과 장바구니 분석으로 잘 알려진 연관 분석, 그리고 군집 분석 기법들인 계층적인 군집 분석과 K-평균 군집 분석을 수행하는 방법에 대하여 다루고 있다.


9장. 텍스트마이닝

R을 활용하여 비정형 데이터 분석인 텍스트마이닝에 대한 부분으로 텍스트마이닝 필수 기술인 자연어 처리 기술과 벡터 공간 모델링을 소개하고 주요 텍스트마이닝 기법들인 주제어 분석, 동시 출현 단어 분석, 토픽 모델링 등을 수행하는 방법에 대하여 다루고 있다.


10장. 오피니언마이닝

R을 활용하여 비정형 데이터 분석인 오피니언마이닝에 대한 부분으로 전통적인 감성 사전 기반의 오피니언 마이닝과 기계학습 기반의 오피니언마이닝을 수행하는 방법에 대하여 다루고 있다.


11장. 소셜네트워크 분석

소셜네트워크 분석에 대한 부분으로 R을 활용하여 원-모드 및 투-모드 소셜네트워크 분석하는 방법과 전문 소셜네트워크 분석 도구인 Gephi와 연계하여 소셜네트워크 분석을 수행하는 방법에 대하여 다루고 있다.


12장. 데이터 시각화

데이터의 시각화에 대한 부분으로 데이터 시각화에 대한 주요 개념에 대한 소개와 데이터 시각화를 위하여 R에서 가장 많이 사용되고 있는 ggplot 패키지를 이용하여 다양한 그래프를 작성하는 방법에 대하여 다루고 있다.


13장. 고급 데이터 시각화

R을 활용한 고급 데이터 시각화에 대한 부분으로 다양한 그래픽 패키지를 이용하여 트리 맵, 버블 차트, 체르노프 페이스, 히트 맵 그리고 지도 맵핑과 같은 고급 데이터 시각화 방법에 대하여 다루고 있다. 또한 웹과 연계된 인터랙티브 그래프 작성 방법에 대하여도 다루고 있다.

작가 소개

윤철호

현재 국립목포대학교 경영학과 교수로 재직 중이며, R 프로그램을 근간으로 개발한 클라우드 사회과학연구 자동화(social science research automation, SSRA) 사이트를 운영하고 있다. Information & Management, Journal of Computer Information Systems, Journal of Business Ethics, Electronic Commerce Research and Applications, Computers in Human Behavior, Behaviour & Information Technology, Journal of Organizational Computing and Electronic Commerce, Journal of Information Systems Education, Information Technology & People, Information Technology and Management 등 수십여 편의 국제 저명 학술지와 경영학 연구, Asia Pacific Journal of Information Systems, 한국경영과학회지, 경영과학, Information Systems Reviews 등의 국내 학술지에 다수의 논문을 게재한 바 있으며, 『Concepts in Computer & Management』(한경사), 『SAP ERP를 중심으로 한 ERP 개론』(생능), 『R을 이용한 통계분석』(비앤엠북스) 등의 저서가 있다.

목 차

제1부 빅데이터와 R


Chapter 1 빅데이터

1.1 빅데이터의 정의

1.1.1 빅데이터란?

1.1.2 빅데이터 특징

1.1.3 빅데이터 종류

1.2 빅데이터 분석기술

1.2.1 빅데이터 분석 기법

1.2.2 빅데이터 분석 인프라 기술

1.3 빅데이터 분석과 R

1.3.1 R 개요

1.3.2 R의 탄생 및 발전 과정

1.3.3 R의 특징

1.3.4 R의 활용

1.3.5 빅데이터 분석에서 R과 파이썬의 비교

연습문제


Chapter 2 R 기초

2.1 R 설치 및 실행

2.1.1 윈도우 버전 R 설치 파일

2.1.2 R 실행

2.1.3 R 사용자 인터페이스

2.1.4 Rtools 소프트웨어 설치

2.2 R 운영환경 구성

2.2.1 R 운영환경 설정

2.2.2 R 패키지 설치 및 사용

2.2.3 빅데이터 분석을 위한 주요 R 패키지

2.3 R 기초

2.3.1 수치계산 기능

2.3.2 변수의 할당

2.3.3 데이터의 유형

2.3.4 함수

2.3.5 자료구조

연습문제


Chapter 3 R 프로그래밍과 그래프

3.1 R 프로그래밍

3.1.1 R 프로그래밍 개념

3.1.2 산술·비교·논리 연산

3.1.3 조건·반복문

3.1.4 R 사용자 정의 함수

3.2 R 그래프

3.2.1 R 그래프 개요

3.2.2 그래프 함수

3.2.3 기본 그래프 작성

3.2.4 그래프의 저장

연습문제


Chapter 4 R 자료관리 및 수집

4.1 R 자료관리

4.1.1 R 데이터 생성하기

4.1.2 외부 데이터 불러오기

4.1.3 데이터 탐색

4.1.4 데이터 관리

4.1.5 데이터 외부로 내보내기

4.1.6 R 내장 데이터 사용하기

4.2 빅데이터 자료수집

4.2.1 빅데이터 제공 기관

4.2.2 파일 데이터 셋 자료수집

4.2.3 웹 스크래핑 자료수집

4.2.4 오픈 API 기반 자료수집

연습문제


제2부 정형 데이터 분석


Chapter 5 데이터 기술통계

5.1 기술통계 개요

5.1.1 주요 기술통계 기법

5.1.2 통계 자료의 종류

5.2 빈도분석

5.2.1 빈도분석 예시

5.2.2 빈도분석 실행

5.3 기술 분석

5.3.1 기술 분석 예시

5.3.2 기술 분석 실행

5.4 교차분석

5.4.1 교차분석 예시

5.4.2 교차분석 실행

5.5 다차원 척도법

5.5.1 다차원 척도법 예시

5.5.2 다차원 척도법 실행

5.6 그룹 분석

5.6.1 그룹 분석 예시

5.6.2 그룹 분석 실행

5.7 탐색적 데이터 분석 도구

5.7.1 박스 플롯

5.7.2 산포도

5.7.3 줄기 잎 도표

5.7.4 Q-Q 도표

연습문제


Chapter 6 데이터 추론통계

6.1 추론통계 개요

6.1.1 주요 추론통계 분석 기법

6.1.2 추론통계의 통계적 추정 및 가설검정

6.2 평균 차이 분석

6.2.1 평균 차이 분석 예시

6.2.2 독립 표본 평균 차이 분석 실행

6.2.3 대응 표본 평균 차이 분석 실행

6.3 비율 차이 분석

6.3.1 비율 차이 분석 예시

6.3.2 비율 차이 분석 실행

6.4 분산분석

6.4.1 분산분석 예시

6.4.2 일원 배치 분산분석 실행

6.4.3 반복측정 분산분석 실행

6.5 상관관계 분석

6.5.1 상관관계 분석 예시

6.5.2 상관관계 분석 실행

6.6 회귀분석

6.6.1 회귀분석 예시

6.6.2 회귀분석 실행

연습문제


Chapter 7 데이터마이닝(Ⅰ)

7.1 데이터마이닝 개요

7.1.1 데이터마이닝 과정

7.1.2 데이터마이닝 분석 유형

7.1.3 데이터마이닝 주요 기법

7.1.4 기계학습과 데이터마이닝

7.1.5 데이터마이닝 활용

7.2 분류 분석

7.2.1 분류 분석의 개요

7.2.2 분류 분석의 절차

7.2.3 분류 분석을 위한 예시 데이터

7.2.4 단순 베이즈 분류

7.2.5 K-최근접 이웃 분석

7.2.6 서포트 벡터 머신

7.2.7 의사결정나무 분석

7.2.8 신경망 분석

7.2.9 비정규 자료 분류 분석

연습문제


Chapter 8 데이터마이닝(Ⅱ)

8.1 예측 분석

8.1.1 예측 분석의 개요

8.1.2 연속형 변수의 예측 분석의 절차

8.1.3 연속형 변수의 예측 분석을 위한 예시 데이터

8.1.4 연속형 변수 예측 의사결정나무 분석

8.1.5 연속형 예측 신경망 분석

8.1.6 이항형 변수의 예측 분석의 절차

8.1.7 이항형 예측 분석을 위한 예시 데이터

8.1.8 이항형 예측 의사결정나무 분석

8.2 연관 분석

8.2.1 연관 분석의 개요

8.2.2 연관 분석의 절차

8.2.3 연관 분석의 예시

8.2.4 연관 분석의 실행

8.3 군집 분석

8.3.1 군집 분석의 개요

8.3.2 계층적 군집 분석

8.3.3 K-평균 군집 분석

연습문제


제3부 비정형 데이터 분석


Chapter 9 텍스트마이닝

9.1 텍스트마이닝 개요

9.1.1 텍스트마이닝 과정

9.1.2 텍스트마이닝 기법

9.1.3 텍스트마이닝 주요 기술

9.2 주제어 분석

9.2.1 주제어 분석 개요

9.2.2 주제어 분석 절차

9.2.3 주제어 분석 예시 데이터

9.2.4 주제어 분석 실행

9.3 동시 출현 단어 분석

9.3.1 동시 출현 단어 분석 개요

9.3.2 동시 출현 단어 분석 절차

9.3.3 동시 출현 단어 분석 예시 데이터

9.3.4 동시 출현 단어 분석 실행

9.4 토픽 모델링

9.4.1 토픽 모델링 개요

9.4.2 토픽 모델링 절차

9.4.3 토픽 모델링 예시 데이터

9.4.4 토픽 모델링 실행

연습문제


Chapter 10 오피니언마이닝

10.1 오피니언마이닝

10.1.1 오피니언마이닝 개요

10.1.2 오피니언마이닝 과정

10.2 감성 분석

10.2.1 감성 분석의 개요

10.2.2 감성 사전

10.2.3 감성 분석의 절차

10.2.4 감성 분석 예시 데이터

10.2.5 감성 분석 실행

10.3 기계학습 기반 감성 분석

10.3.1 기계학습 기반 감성 분석의 개요

10.3.2 기계학습 기반의 감성 분석의 절차

10.3.3 기계학습 기반의 감성 분석 예시 데이터

10.3.4 기계학습 기반의 감성 분석 실행

연습문제


Chapter 11 소셜네트워크 분석

11.1 소셜네트워크 분석 개요

11.1.1 소셜네트워크 분석 과정

11.1.2 네트워크 분석

11.1.3 네트워크 분석 지표

11.1.4 소셜네트워크 분석 기법

11.2 원-모드 소셜네트워크 분석

11.2.1 원-모드 소셜네트워크 분석 개요

11.2.2 원-모드 소셜네트워크 분석 실행 절차

11.2.3 원-모드 소셜네트워크 예시 데이터

11.2.4 원-모드 소셜네트워크 분석 실행

11.2.5 소셜네트워크 시각화 분석 전용 프로그램 활용

11.3 투-모드 소셜네트워크 분석

11.3.1 투-모드 소셜네트워크 분석 개요

11.3.2 투-모드 소셜네트워크 분석 실행 절차

11.3.3 투-모드 소셜네트워크 예시 데이터

11.3.4 투-모드 소셜네트워크 분석 실행

연습문제


제4부 데이터 시각화


Chapter 12 데이터 시각화

12.1 데이터 시각화

12.1.1 데이터 시각화 개요

12.1.2 데이터 시각화 유형

12.2 빅데이터 시각화 기술

12.2.1 시간 시각화

12.2.2 분포 시각화

12.2.3 관계 시각화

12.2.4 비교 시각화

12.2.5 공간 시각화

12.3 R 데이터 시각화 분석

12.3.1 ggplot2 패키지

12.3.2 ggplot2 패키지를 이용하는 시각화

연습문제


Chapter 13 고급 데이터 시각화

13.1 R 고급 시각화 분석

13.1.1 다양한 그래픽 패키지를 이용하는 시각화

13.1.2 인터랙티브 그래프

13.2 R 지도 맵핑 시각화

13.2.1 R에서의 지도 맵핑 시각화 방법

13.2.2 SHP 파일을 이용한 지도 맵핑

13.2.3 구글맵을 이용한 지도 맵핑

연습문제


부록 datasets 패키지의 데이터 셋

역자 소개


01. 반품기한
  • 단순 변심인 경우 : 상품 수령 후 7일 이내 신청
  • 상품 불량/오배송인 경우 : 상품 수령 후 3개월 이내, 혹은 그 사실을 알게 된 이후 30일 이내 반품 신청 가능
02. 반품 배송비
반품 배송비
반품사유 반품 배송비 부담자
단순변심 고객 부담이며, 최초 배송비를 포함해 왕복 배송비가 발생합니다. 또한, 도서/산간지역이거나 설치 상품을 반품하는 경우에는 배송비가 추가될 수 있습니다.
상품의 불량 또는 오배송 고객 부담이 아닙니다.
03. 배송상태에 따른 환불안내
환불안내
진행 상태 결제완료 상품준비중 배송지시/배송중/배송완료
어떤 상태 주문 내역 확인 전 상품 발송 준비 중 상품이 택배사로 이미 발송 됨
환불 즉시환불 구매취소 의사전달 → 발송중지 → 환불 반품회수 → 반품상품 확인 → 환불
04. 취소방법
  • 결제완료 또는 배송상품은 1:1 문의에 취소신청해 주셔야 합니다.
  • 특정 상품의 경우 취소 수수료가 부과될 수 있습니다.
05. 환불시점
환불시점
결제수단 환불시점 환불방법
신용카드 취소완료 후, 3~5일 내 카드사 승인취소(영업일 기준) 신용카드 승인취소
계좌이체 실시간 계좌이체 또는 무통장입금
취소완료 후, 입력하신 환불계좌로 1~2일 내 환불금액 입금(영업일 기준)
계좌입금
휴대폰 결제 당일 구매내역 취소시 취소 완료 후, 6시간 이내 승인취소
전월 구매내역 취소시 취소 완료 후, 1~2일 내 환불계좌로 입금(영업일 기준)
당일취소 : 휴대폰 결제 승인취소
익월취소 : 계좌입금
포인트 취소 완료 후, 당일 포인트 적립 환불 포인트 적립
06. 취소반품 불가 사유
  • 단순변심으로 인한 반품 시, 배송 완료 후 7일이 지나면 취소/반품 신청이 접수되지 않습니다.
  • 주문/제작 상품의 경우, 상품의 제작이 이미 진행된 경우에는 취소가 불가합니다.
  • 구성품을 분실하였거나 취급 부주의로 인한 파손/고장/오염된 경우에는 취소/반품이 제한됩니다.
  • 제조사의 사정 (신모델 출시 등) 및 부품 가격변동 등에 의해 가격이 변동될 수 있으며, 이로 인한 반품 및 가격보상은 불가합니다.
  • 뷰티 상품 이용 시 트러블(알러지, 붉은 반점, 가려움, 따가움)이 발생하는 경우 진료 확인서 및 소견서 등을 증빙하면 환불이 가능하지만 이 경우, 제반 비용은 고객님께서 부담하셔야 합니다.
  • 각 상품별로 아래와 같은 사유로 취소/반품이 제한 될 수 있습니다.

환불불가
상품군 취소/반품 불가사유
의류/잡화/수입명품 상품의 택(TAG) 제거/라벨 및 상품 훼손으로 상품의 가치가 현저히 감소된 경우
계절상품/식품/화장품 고객님의 사용, 시간경과, 일부 소비에 의하여 상품의 가치가 현저히 감소한 경우
가전/설치상품 전자제품 특성 상, 정품 스티커가 제거되었거나 설치 또는 사용 이후에 단순변심인 경우, 액정화면이 부착된 상품의 전원을 켠 경우 (상품불량으로 인한 교환/반품은 AS센터의 불량 판정을 받아야 합니다.)
자동차용품 상품을 개봉하여 장착한 이후 단순변심의 경우
CD/DVD/GAME/BOOK등 복제가 가능한 상품의 포장 등을 훼손한 경우
내비게이션, OS시리얼이 적힌 PMP 상품의 시리얼 넘버 유출로 내장된 소프트웨어의 가치가 감소한 경우
노트북, 테스크탑 PC 등 홀로그램 등을 분리, 분실, 훼손하여 상품의 가치가 현저히 감소하여 재판매가 불가할 경우