책 소개
인터넷에서 데이터를 얻어서 원하는 형태로 가공하고 결론을 얻는 과정은 최근 데이터 과학이라는 이름으로 광범위하게 인기를 얻고 있습니다. 실제로 꼭 빅데이터가 아니라도 방대한 인터넷의 자료를 정리하기 위해서도 필요한 기술들입니다. 예전에는 전문 분야에서만 사용되던 기술이 이제는 급격하게 일반에 확장되어가고 있습니다. 인터넷의 발전과 함께 앞으로도 계속 관심을 받을 분야일 것입니다.
이 책은 Python 문법 입장에서는 정말 기초적인 부분을 학습하지만, 데이터 분석이 목표인 사람들을 타겟으로 서울시 범죄 현황 분석, 셀프 주유소 가격 정보 분석, 19대 대선 결과 분석 등의 흥미 있는 목표를 통해 텍스트, 엑셀 파일부터 웹데이터까지 데이터를 획득하고 이를 가공해서 표현하는 기술을 익힙니다. 더 나아가 회귀, 분류 등 한 단계 높은 수준의 데이터 분석 기술까지 학습할 수 있게 될 것입니다.
이 책은 Python 문법 입장에서는 정말 기초적인 부분을 학습하지만, 데이터 분석이 목표인 사람들을 타겟으로 서울시 범죄 현황 분석, 셀프 주유소 가격 정보 분석, 19대 대선 결과 분석 등의 흥미 있는 목표를 통해 텍스트, 엑셀 파일부터 웹데이터까지 데이터를 획득하고 이를 가공해서 표현하는 기술을 익힙니다. 더 나아가 회귀, 분류 등 한 단계 높은 수준의 데이터 분석 기술까지 학습할 수 있게 될 것입니다.
작가 소개
저 : 민형기
국립창원대학교 제어계측공학과에서 제어공학을 전공하고 공학 박사 학위를 받았다. 엔티렉스 로봇연구소 소장, 미래컴퍼니 수술로봇 연구소 책임연구원 등을 역임했고, 국가직무능력표준(NCS) 중에서 로봇 인공 지능/기계 하드웨어 학습 모듈 개발에 참여했다. 군사용 로봇, 수술용 로봇, 3D 프린터, 스마트폰 광학 영상 안정화(OIS) 등 다양한 형태의 로봇 혹은 제어 기술 개발에 참여하면서, 로봇이 수집한 다양한 데이터를 분석하는 과정을 다수 경험했다. 일상 생활의 질문을 데이터 분석을 통해 직접 확인하는 것이 취미이며, 현재 로봇부터 데이터 과학까지 다루는 블로그(http://pinkwink.kr)를 운영하고 있다. 최근에는 작은 스타트업인 로봇앤모어의 수석연구원으로서 재미있는 로봇에 대한 연구 개발을 수행하고 있다.
목 차
1장 서울시 구별 CCTV 현황 분석
1-1. CCTV 현황과 인구 현황 데이터 구하기
1-2. 파이썬에서 텍스트 파일과 엑셀 파일을 읽기 - pandas
1-3. pandas 기초 익히기
1-4. pandas를 이용해서 CCTV와 인구 현황 데이터 파악하기
1-5. pandas 고급 기능 - 두 DataFrame 병합하기
1-6. CCTV 데이터와 인구 현황 데이터를 합치고 분석하기
1-7. 파이썬의 대표 시각화 도구 Matplotlib
1-8. CCTV 현황 그래프로 분석하기
2장 서울시 범죄 현황 분석
2-1. 데이터 획득하기
2-2. pandas를 이용하여 데이터 정리하기
2-3. 지도 정보를 얻을 수 잇는 Google Maps
2-4. Google Maps를 이용해서 주소와 위도, 경도 정보 얻기
2-5. pandas의 pivot_table 학습하기
2-6. Pivot_table을 이용해서 데이터 정리하기
2-7. 데이터 표현을 위해 다듬기
2-8. 좀 더 편리한 시각화 도구 - Seaborn
2-9. 범죄 데이터 시각화하기
2-10. 지도 시각화 도구 - Folium
2-11. 서울시 범죄율에 대한 지도 시각화
2-12. 서울시 경찰서별 검거율과 구별 범죄 발생율을 동시에 시각화하기
3장 시카고 샌드위치 맛집 분석
3-1. 웹 데이터를 가져오는 Beautiful Soup 익히기
3-2. 크롬 개발자 도구를 이용해서 원하는 태그 찾기
3-3. 실전: 시카고 샌드위치 맛집 소개 사이트에 접근하기
3-4. 접근한 웹 페이지에서 원하는 데이터 추출하고 정리하기
3-5. 다수의 웹 페이지에 자동으로 접근해서 원하는 정보 가져오기
3-6. Jupyter Notebook에서 상태 진행바를 쉽게 만들어주는 tqdm 모듈
3-7. 상태 진행바까지 적용하고 다시 샌드위치 페이지 50개에 접근하기
3-8. 50개 웹 페이지에 대한 정보 가져오기
3-9. 맛집 위치를 지도에 표기하기
3-10. 네이버 영화 평점 기준 영화의 평점 변화 확인하기
3-11. 영화별 날짜 변화에 따른 평점 변화 확인하기
4장 셀프 주유소는 정말 저렴할까
4-1. Selenium 사용하기
4-2. 서울시 구별 주유소 가격 정보 얻기
4-3. 구별 주유 가격에 대한 데이터의 정리
4-4. 셀프 주유소는 정말 저렴한지 boxplot으로 확인하기
4-5. 서울시 구별 주유 가격 확인하기
4-6. 서울시 주유 가격 상하위 10개 주유소 지도에 표기하기
5장 우리나라 인구 소멸 위기 지역 분석
5-1. 목표 명확히 하기
5-2. 인구 데이터 확보하고 정리하기
5-3. 인구 소멸 위기 지역 계산하고 데이터 정리하기
5-4. 대한민국 지도 그리는 방법에 대한 소개
5-5. 지도 시각화를 위해 지역별 고유 ID 만들기
5-6. Cartogram으로 우리나라 지도 만들기
5-7. 인구 현황 및 인구 소멸 지역 확인하기
5-8. 인구 현황에서 여성 인구 비율 확인하기
5-9. Folium에서 인구 소멸 위기 지역 표현하기
6장 19대 대선 결과 분석
6-1. Selenium과 Beautiful Soup을 이용한 데이터 획득 준비 작업
6-2. 19대 대선 개표 결과 데이터 획득하기
6-3. 각 후보의 득표율과 지역 ID 정리
6-4. 19대 대선 결과 득표율 시각화하기
7장 시계열 데이터를 다뤄보자
7-1. Numpy의 polyfit으로 회귀(regression) 분석하기
7-2. Prophet 모듈을 이용한 forecast 예측
7-3. Seasonal 시계열 분석으로 주식 데이터 분석하기
7-4. Growth Model과 Holiday Forecast
8장 자연어 처리 시작하기
8-1. 한글 자연어 처리 기초 - KoNLPy 및 필요 모듈의 설치
8-2. 한글 자연어 처리 기초
8-3. 워드 클라우드
8-4. 육아휴직 관련 법안에 대한 분석
8-5. Naive Bayes Classifier 의 이해 - 영문
8-6. Naive Bayes Classifier 의 이해 - 한글
8-7. 문장의 유사도 측정하기
8-8. 여자친구 선물 고르기
1-1. CCTV 현황과 인구 현황 데이터 구하기
1-2. 파이썬에서 텍스트 파일과 엑셀 파일을 읽기 - pandas
1-3. pandas 기초 익히기
1-4. pandas를 이용해서 CCTV와 인구 현황 데이터 파악하기
1-5. pandas 고급 기능 - 두 DataFrame 병합하기
1-6. CCTV 데이터와 인구 현황 데이터를 합치고 분석하기
1-7. 파이썬의 대표 시각화 도구 Matplotlib
1-8. CCTV 현황 그래프로 분석하기
2장 서울시 범죄 현황 분석
2-1. 데이터 획득하기
2-2. pandas를 이용하여 데이터 정리하기
2-3. 지도 정보를 얻을 수 잇는 Google Maps
2-4. Google Maps를 이용해서 주소와 위도, 경도 정보 얻기
2-5. pandas의 pivot_table 학습하기
2-6. Pivot_table을 이용해서 데이터 정리하기
2-7. 데이터 표현을 위해 다듬기
2-8. 좀 더 편리한 시각화 도구 - Seaborn
2-9. 범죄 데이터 시각화하기
2-10. 지도 시각화 도구 - Folium
2-11. 서울시 범죄율에 대한 지도 시각화
2-12. 서울시 경찰서별 검거율과 구별 범죄 발생율을 동시에 시각화하기
3장 시카고 샌드위치 맛집 분석
3-1. 웹 데이터를 가져오는 Beautiful Soup 익히기
3-2. 크롬 개발자 도구를 이용해서 원하는 태그 찾기
3-3. 실전: 시카고 샌드위치 맛집 소개 사이트에 접근하기
3-4. 접근한 웹 페이지에서 원하는 데이터 추출하고 정리하기
3-5. 다수의 웹 페이지에 자동으로 접근해서 원하는 정보 가져오기
3-6. Jupyter Notebook에서 상태 진행바를 쉽게 만들어주는 tqdm 모듈
3-7. 상태 진행바까지 적용하고 다시 샌드위치 페이지 50개에 접근하기
3-8. 50개 웹 페이지에 대한 정보 가져오기
3-9. 맛집 위치를 지도에 표기하기
3-10. 네이버 영화 평점 기준 영화의 평점 변화 확인하기
3-11. 영화별 날짜 변화에 따른 평점 변화 확인하기
4장 셀프 주유소는 정말 저렴할까
4-1. Selenium 사용하기
4-2. 서울시 구별 주유소 가격 정보 얻기
4-3. 구별 주유 가격에 대한 데이터의 정리
4-4. 셀프 주유소는 정말 저렴한지 boxplot으로 확인하기
4-5. 서울시 구별 주유 가격 확인하기
4-6. 서울시 주유 가격 상하위 10개 주유소 지도에 표기하기
5장 우리나라 인구 소멸 위기 지역 분석
5-1. 목표 명확히 하기
5-2. 인구 데이터 확보하고 정리하기
5-3. 인구 소멸 위기 지역 계산하고 데이터 정리하기
5-4. 대한민국 지도 그리는 방법에 대한 소개
5-5. 지도 시각화를 위해 지역별 고유 ID 만들기
5-6. Cartogram으로 우리나라 지도 만들기
5-7. 인구 현황 및 인구 소멸 지역 확인하기
5-8. 인구 현황에서 여성 인구 비율 확인하기
5-9. Folium에서 인구 소멸 위기 지역 표현하기
6장 19대 대선 결과 분석
6-1. Selenium과 Beautiful Soup을 이용한 데이터 획득 준비 작업
6-2. 19대 대선 개표 결과 데이터 획득하기
6-3. 각 후보의 득표율과 지역 ID 정리
6-4. 19대 대선 결과 득표율 시각화하기
7장 시계열 데이터를 다뤄보자
7-1. Numpy의 polyfit으로 회귀(regression) 분석하기
7-2. Prophet 모듈을 이용한 forecast 예측
7-3. Seasonal 시계열 분석으로 주식 데이터 분석하기
7-4. Growth Model과 Holiday Forecast
8장 자연어 처리 시작하기
8-1. 한글 자연어 처리 기초 - KoNLPy 및 필요 모듈의 설치
8-2. 한글 자연어 처리 기초
8-3. 워드 클라우드
8-4. 육아휴직 관련 법안에 대한 분석
8-5. Naive Bayes Classifier 의 이해 - 영문
8-6. Naive Bayes Classifier 의 이해 - 한글
8-7. 문장의 유사도 측정하기
8-8. 여자친구 선물 고르기
01. 반품기한
- 단순 변심인 경우 : 상품 수령 후 7일 이내 신청
- 상품 불량/오배송인 경우 : 상품 수령 후 3개월 이내, 혹은 그 사실을 알게 된 이후 30일 이내 반품 신청 가능
02. 반품 배송비
반품사유 | 반품 배송비 부담자 |
---|---|
단순변심 | 고객 부담이며, 최초 배송비를 포함해 왕복 배송비가 발생합니다. 또한, 도서/산간지역이거나 설치 상품을 반품하는 경우에는 배송비가 추가될 수 있습니다. |
고객 부담이 아닙니다. |
03. 배송상태에 따른 환불안내
진행 상태 | 결제완료 | 상품준비중 | 배송지시/배송중/배송완료 |
---|---|---|---|
어떤 상태 | 주문 내역 확인 전 | 상품 발송 준비 중 | 상품이 택배사로 이미 발송 됨 |
환불 | 즉시환불 | 구매취소 의사전달 → 발송중지 → 환불 | 반품회수 → 반품상품 확인 → 환불 |
04. 취소방법
- 결제완료 또는 배송상품은 1:1 문의에 취소신청해 주셔야 합니다.
- 특정 상품의 경우 취소 수수료가 부과될 수 있습니다.
05. 환불시점
결제수단 | 환불시점 | 환불방법 |
---|---|---|
신용카드 | 취소완료 후, 3~5일 내 카드사 승인취소(영업일 기준) | 신용카드 승인취소 |
계좌이체 |
실시간 계좌이체 또는 무통장입금 취소완료 후, 입력하신 환불계좌로 1~2일 내 환불금액 입금(영업일 기준) |
계좌입금 |
휴대폰 결제 |
당일 구매내역 취소시 취소 완료 후, 6시간 이내 승인취소 전월 구매내역 취소시 취소 완료 후, 1~2일 내 환불계좌로 입금(영업일 기준) |
당일취소 : 휴대폰 결제 승인취소 익월취소 : 계좌입금 |
포인트 | 취소 완료 후, 당일 포인트 적립 | 환불 포인트 적립 |
06. 취소반품 불가 사유
- 단순변심으로 인한 반품 시, 배송 완료 후 7일이 지나면 취소/반품 신청이 접수되지 않습니다.
- 주문/제작 상품의 경우, 상품의 제작이 이미 진행된 경우에는 취소가 불가합니다.
- 구성품을 분실하였거나 취급 부주의로 인한 파손/고장/오염된 경우에는 취소/반품이 제한됩니다.
- 제조사의 사정 (신모델 출시 등) 및 부품 가격변동 등에 의해 가격이 변동될 수 있으며, 이로 인한 반품 및 가격보상은 불가합니다.
- 뷰티 상품 이용 시 트러블(알러지, 붉은 반점, 가려움, 따가움)이 발생하는 경우 진료 확인서 및 소견서 등을 증빙하면 환불이 가능하지만 이 경우, 제반 비용은 고객님께서 부담하셔야 합니다.
- 각 상품별로 아래와 같은 사유로 취소/반품이 제한 될 수 있습니다.
상품군 | 취소/반품 불가사유 |
---|---|
의류/잡화/수입명품 | 상품의 택(TAG) 제거/라벨 및 상품 훼손으로 상품의 가치가 현저히 감소된 경우 |
계절상품/식품/화장품 | 고객님의 사용, 시간경과, 일부 소비에 의하여 상품의 가치가 현저히 감소한 경우 |
가전/설치상품 | 전자제품 특성 상, 정품 스티커가 제거되었거나 설치 또는 사용 이후에 단순변심인 경우, 액정화면이 부착된 상품의 전원을 켠 경우 (상품불량으로 인한 교환/반품은 AS센터의 불량 판정을 받아야 합니다.) |
자동차용품 | 상품을 개봉하여 장착한 이후 단순변심의 경우 |
CD/DVD/GAME/BOOK등 | 복제가 가능한 상품의 포장 등을 훼손한 경우 |
상품의 시리얼 넘버 유출로 내장된 소프트웨어의 가치가 감소한 경우 | |
노트북, 테스크탑 PC 등 | 홀로그램 등을 분리, 분실, 훼손하여 상품의 가치가 현저히 감소하여 재판매가 불가할 경우 |