책 소개
근대 수리 통계학의 아버지 칼 피어슨, 수리 통계학의 창시자 로널드 피셔 등
인물로 읽는 데이터 분석과 데이터 과학 통계
우리는 데이터 홍수의 시대에 살고 있지만, 데이터 분석은 여전히 전문가의 영역으로만 치부되고 있다. 누구나 쉽게 범접할 수 있는 영역이 아니다. 전문가 집단이나 전문 기업에서나 다룰 법한 분석 기법을 우리 모두가 알 필요도 없다.
그러나 중요한 것은 이러한 복잡한 분석 기법을 적용하는 것보다 어떤 대상을 분석할지 판단하고 대상과 내 수준에 맞는 분석 기법을 선택하는 능력이다. 무슨 일이든지 알아야 지시도 하고 알아야 흥미도 생긴다.
『데이터를 부탁해』는 데이터 분석을 인문학으로 접근한다. 근대 수리 통계학의 아버지 칼피어슨과 통계학의 창시자 로널드 피셔 등 거장 13명의 이야기와 직장에서 접할 수 있는 에피소드로 데이터 분석의 기초 용어와 원리를 쉽게 풀어 설명한다.
데이터 분석 과정은 복잡하다. 그러나 분석 결과를 효과적으로 활용하는 방법 만큼은 간결하고 쉽게 이해하자는 것이다. 이러한 접근을 통해 일반인도 데이터 분석의 이유와 가치에 공감하고, 어렵기만 한 데이터 분석에 한걸음 더 다가가게 될 것이다.
● 영국의 괴짜 수학자 아브라함 드무아브르와 중심극한정리
● T-분포의 모태가 된 윌리엄 고셋과 자유도
● 프랜시스 골턴과 평균으로의 회귀
● 근대 수리 통계학의 아버지 칼 피어슨과 상관분석
● 근대 수리 통계학의 창시자 로널드 피셔와 표본
● 찰스 스피어만과 순위 상관분석
● 프랭크 윌콕슨과 순위합 검정, 부호 순위 검정
● 헨리 만과 도널드 랜섬 휘트니의 만-휘트니 검정
● 윌리엄 크루스칼과 앨런 왈리스의 크루스칼-왈리스 검정
● 고대 그리스 수학자 유클리드의 유클리드 거리
● 데이비드 콕스가 일반화하고 정리한 로지스틱
● 다니엘 베르누이와 베르누이의 정리
● 시메옹 드니 푸아송과 푸아송 분포
작가 소개
서울과학기술대학교에서 기술경영 분야의 키워드 분석과 연구개발 사업의 성과평가 모형을 연구해 공학박사 학위를 받았다. 현재 Y사 공급기획부서의 데이터 분석가로 근무 중이다. '알기 쉬운 데이터 분석', '변화와 혁신의 새로운 전략-데이터분석', '기업의 지속성장 동력-빅데이터' 그리고 '버려지는 기업 데이터를 가치로 연결하라' 등의 주제로 많은 강의와 강연을 하고 있다. 데이터 인문학이라는 새로운 개념을 모토로 데이터 분석과 빅데이터 분야의 보편화를 위해 노력 중이다.
목 차
지은이 소개
프롤로그
1부 배경Ⅰ
_ 1장 세상의 중심에서 데이터를 외치다
__ 데이터, 정보 그리고 가치
__ 밸류러시
__ 내가 평균 이상은 하지!!
_ 2장 주사위는 던져졌다
__ 대상을 명확히 하라
__ 확률을 높여라
__ 평균을 중심으로 좌우로 정렬 - 중심극한정리
_ 3장 그때는 맞고, 지금은 틀리다
__ 귀무가설과 대립가설
__ 옳고 그름을 판단할 기준 - 유의수준과 유의확률
__ 비교하고 진실을 밝혀라, t-검정
__ t-분포의 발견, 윌리엄 고셋
_ 4장 일송정 푸른 솔과 같은 근대 수리 통계의 선구자들
__ 나 돌아갈래-프랜시스 골턴과 회귀
__ 근대 수리 통계학의 아버지-칼 피어슨과 상관분석
__ 근대 수리 통계학의 창시자-로널드 피셔와 표본
2부 배경Ⅱ
_ 5장 세상은 흑과 백만으로 설명할 수 없다
__ 가까이, 가까이, 더 가까이-분산
__ 분산분석과 실험 계획법
__ 독립변수와 종속변수 그리고 분산분석
_ 6장 그 밖의 이야기
__ 모수와 비모수
__ 스피어만 상관계수
__ 줄을 서시오
__ 크루스칼-왈리스 검정
3부 진화Ⅰ
_ 7장 너랑 나랑은 그렇고 그런 사이니까
__ 분류와 군집
__ 거리로부터
__ 유사도 계산
__ 그 밖의 유사도 공식
_ 8장 k에게 물어봐
__ k로 뭉쳐라
__ k의 경계선과 중심값
4부 진화Ⅱ
_ 9장 데이터는 미래를 비추는 거울
__ 예측은 진짜 가능한가
__ 여러 의견을 듣고 객관적으로 표현하기
__ 흘러간 시간도 소중히 하라-시계열 분석
_ 10장 분류도 예측이 되나요
__ 다시 한번 회귀분석
__ 시간과 공간의 가치창출-로지스틱 회귀분석
__ 이산확률분포
5부 변이Ⅰ
_ 11장 빅데이터에 대한 짧은 이야기
__ 빅데이터는 무엇인가
__ 빅데이터를 공략하라
__ 왜 빅데이터인가
_ 12장 자연어 처리와 텍스트 마이닝
__ 정형이거나 비정형이거나
__ 글로 표현된 모든 것
__ 텍스트 마이닝
6부 변이Ⅱ
_ 13장 관계 1
__ 집합
__ 연관규칙
_ 14장 관계 2
__ 네트워크 사회
__ 네트워크 분석
- 단순 변심인 경우 : 상품 수령 후 7일 이내 신청
- 상품 불량/오배송인 경우 : 상품 수령 후 3개월 이내, 혹은 그 사실을 알게 된 이후 30일 이내 반품 신청 가능
반품사유 | 반품 배송비 부담자 |
---|---|
단순변심 | 고객 부담이며, 최초 배송비를 포함해 왕복 배송비가 발생합니다. 또한, 도서/산간지역이거나 설치 상품을 반품하는 경우에는 배송비가 추가될 수 있습니다. |
고객 부담이 아닙니다. |
진행 상태 | 결제완료 | 상품준비중 | 배송지시/배송중/배송완료 |
---|---|---|---|
어떤 상태 | 주문 내역 확인 전 | 상품 발송 준비 중 | 상품이 택배사로 이미 발송 됨 |
환불 | 즉시환불 | 구매취소 의사전달 → 발송중지 → 환불 | 반품회수 → 반품상품 확인 → 환불 |
- 결제완료 또는 배송상품은 1:1 문의에 취소신청해 주셔야 합니다.
- 특정 상품의 경우 취소 수수료가 부과될 수 있습니다.
결제수단 | 환불시점 | 환불방법 |
---|---|---|
신용카드 | 취소완료 후, 3~5일 내 카드사 승인취소(영업일 기준) | 신용카드 승인취소 |
계좌이체 |
실시간 계좌이체 또는 무통장입금 취소완료 후, 입력하신 환불계좌로 1~2일 내 환불금액 입금(영업일 기준) |
계좌입금 |
휴대폰 결제 |
당일 구매내역 취소시 취소 완료 후, 6시간 이내 승인취소 전월 구매내역 취소시 취소 완료 후, 1~2일 내 환불계좌로 입금(영업일 기준) |
당일취소 : 휴대폰 결제 승인취소 익월취소 : 계좌입금 |
포인트 | 취소 완료 후, 당일 포인트 적립 | 환불 포인트 적립 |
- 단순변심으로 인한 반품 시, 배송 완료 후 7일이 지나면 취소/반품 신청이 접수되지 않습니다.
- 주문/제작 상품의 경우, 상품의 제작이 이미 진행된 경우에는 취소가 불가합니다.
- 구성품을 분실하였거나 취급 부주의로 인한 파손/고장/오염된 경우에는 취소/반품이 제한됩니다.
- 제조사의 사정 (신모델 출시 등) 및 부품 가격변동 등에 의해 가격이 변동될 수 있으며, 이로 인한 반품 및 가격보상은 불가합니다.
- 뷰티 상품 이용 시 트러블(알러지, 붉은 반점, 가려움, 따가움)이 발생하는 경우 진료 확인서 및 소견서 등을 증빙하면 환불이 가능하지만 이 경우, 제반 비용은 고객님께서 부담하셔야 합니다.
- 각 상품별로 아래와 같은 사유로 취소/반품이 제한 될 수 있습니다.
상품군 | 취소/반품 불가사유 |
---|---|
의류/잡화/수입명품 | 상품의 택(TAG) 제거/라벨 및 상품 훼손으로 상품의 가치가 현저히 감소된 경우 |
계절상품/식품/화장품 | 고객님의 사용, 시간경과, 일부 소비에 의하여 상품의 가치가 현저히 감소한 경우 |
가전/설치상품 | 전자제품 특성 상, 정품 스티커가 제거되었거나 설치 또는 사용 이후에 단순변심인 경우, 액정화면이 부착된 상품의 전원을 켠 경우 (상품불량으로 인한 교환/반품은 AS센터의 불량 판정을 받아야 합니다.) |
자동차용품 | 상품을 개봉하여 장착한 이후 단순변심의 경우 |
CD/DVD/GAME/BOOK등 | 복제가 가능한 상품의 포장 등을 훼손한 경우 |
상품의 시리얼 넘버 유출로 내장된 소프트웨어의 가치가 감소한 경우 | |
노트북, 테스크탑 PC 등 | 홀로그램 등을 분리, 분실, 훼손하여 상품의 가치가 현저히 감소하여 재판매가 불가할 경우 |