책 소개
1. 데이터 과학자의 일은 어떻게 우리의 현실이 되는가?
- 현장에서 써 내려간 데이터 과학 현장 보고서
데이터를 ‘21세기의 원유’에 비유하고, 데이터 과학자를 ‘21세기의 가장 섹시한 직업’이라고 말하는 시대다. 인공지능, 빅데이터, 머신러닝, 딥러닝 등 데이터 과학 관련 용어는 IT·경제 뉴스에서 쉽게 접할 수 있는 일반 용어가 되었다. 무엇보다 데이터 과학은 온라인 쇼핑몰이나 유튜브·넷플릭스 등 미디어 콘텐츠 플랫폼의 추천 시스템에 활용되어 어느새 우리의 선택마저 좌우하는 막대한 힘을 발휘하고 있다. 그런데 이 같은 큰 관심과 영향력에도 불구하고 데이터 과학이 어떤 분야에서 활용되는지, 데이터 과학자들은 각 분야에서 구체적으로 어떤 일을 하는지 소개해주는 책은 찾아보기 어렵다.
이 책 《데이터 과학자의 일》은 금융, 게임, 스포츠, 보안, 의학, 교육 등 다양한 분야에서 활약하는 데이터 과학자들의 생생한 목소리로 데이터 과학을 소개한다. 이들이 업계의 환경과 목표에 따라 좋은 데이터를 수집하고, 수집한 데이터의 의미를 분석하고, 이를 바탕으로 ‘데이터 기반 의사 결정’을 하는 일련의 과정은 데이터 과학이 우리 삶을 어떻게 변화시키고 있는지를 여실히 보여준다. 다양한 데이터 과학자가 현장에서 겪은 실제 사례를 통해 보여주는 지금 여기의 데이터 과학은 어떤 모습일까?
금융 산업에서 데이터 과학이 적용되는 분야는 무궁무진하다. 세계 최고의 투자은행이라는 골드만삭스의 경우, 명문 대학교 MBA 출신의 트레이딩 전문가가 600명에서 2명으로 줄어들었고, 이제 그 일을 데이터를 학습한 컴퓨터가 담당하고 있다. 회장 스스로 골드만삭스는 IT 회사라고 부른다. 인공지능과 딥러닝의 등장으로 금융 산업 자체가 커다란 변화의 시기를 맞이한 것이다. 인류의 역사가 시작된 이래로 존재했던 금융 산업은 1차, 2차, 3차 산업혁명 시대에도 흔들림 없이 그 자리를 지켜왔다. 하지만 인공지능의 등장으로 시작된 4차 산업혁명 시대에는 커다란 변신을 요청받고 있다. 변화하지 않으면 도태되기 때문이다.
- 〈3장 핀테크와 테크핀이 경쟁하는 시대의 금융〉 중에서(67~68쪽)
비교적 단순한 구조의 퍼즐 게임에서는 보통 서로 게임 플레이 기록을 공유함으로써 자신의 기록을 자랑하거나, 다른 사람의 추천을 통해 자신에게 필요한 아이템을 얻는 방식으로 신규 유저를 확보하는 등의 기능을 제공한다. (중략) 플레이어 간의 상호 작용이 더 적극적인 게임이라면 더 세밀한 데이터가 기록될 수 있다. 이를테면 1인칭 슈팅(FPS) 게임의 경우 누구와 대결했는지, 전적이 어떻게 되는지, 어떤 방식으로 승리 혹은 패배했는지, 대결 결과가 나오기까지 시간이 얼마나 걸렸는지, 대결 과정에서 어떤 기술을 이용했는지 등이 기록될 수 있다. 심지어 자유도가 높은 대규모 다중 사용자 온라인 롤플레잉 게임(MMORPG)의 경우, 조금 과장하자면 현실 세계에 거의 근접한 수준의 활동들이 기록된다. 이처럼 세밀하고 풍부한 데이터가 있기 때문에 데이터 분석가에게 게임은 참으로 매력적인 분야가 아닐 수 없다. 비유하자면 세상에 존재하는 온갖 재료가 가득 담긴 초대형 냉장고 앞에 선 요리사가 된 기분이다.
- 〈4장 게임, 가장 풍부한 데이터가 뛰노는 세상〉 중에서(77~78쪽)
만약 여러분이 보안 도메인의 데이터 과학자라면 다른 영역의 데이터 과학자에게는 일반적으로 없는 특별한 것이 하나 있다. 그것은 바로 구체적인 악의를 가진 적이다. 여러분이 상대해야 하는 적은 다양할 수 있다. 악성 행위를 반복하는 사용자부터 악성코드를 심으려는 해커, 규약을 지키지 않고 서비스로부터 데이터를 수집하려는 크롤러 제작자에 이르기까지 다양하다. 여러분의 업무는 그 적을 분석하고 탐지하고 예측하여 더는 위협적이지 않은 상태를 가능한 한 길게 유지하는 것이다. 이 글에서는 데이터 과학자이기 전에 서비스를 보호한다는 분명한 목적을 가진 사람으로서 이 같은 적들을 상대하려면 무엇을 공부해야 하고, 어떤 준비가 필요한지 이야기하고자 한다. 물론 데이터 과학과 보안의 연관성에 대해서도 다룰 것이다. 마지막으로 악의적인 크롤러 방어와 관련된 구체적인 사례를 소개하며 앞에서 설명한 준비와 실무가 어떻게 적용되는지 함께 살펴보겠다.
- 〈6장 데이터 과학으로 서비스를 보호하는 방법〉 중에서(125~126쪽)
선진국의 경우 대개 인구 구조가 어느 정도 고령화되어 대부분 고령층이 인구의 10~20%에 달한다. 선진국의 경우 코로나-19 발생 초기부터 고령 감염자들의 사망률이 높다는 데이터가 축적되어 있었다. 그리고 이러한 국가에서는 방역을 위한 거리 두기가 가능하며 마스크를 구입하고 보급할 수 있는 경제적 여유가 있는 경우가 많다. 그래서 우리나라를 포함한 선진국의 경우 고령층부터 먼저 백신 접종을 하였으며, 감염 후 사망률이 상대적으로 낮은 연령층은 백신 접종 순위를 늦추었다. 하지만 캐나다의 노스웨스트 준주와 같이 인구 밀도가 매우 낮고 의료 자원이 부족한 곳에서는, 고령층과 함께 교통이 매우 불편한 곳에 거주하는 사람들을 백신 접종의 우선 순위로 지정했다. 코로나-19가 확산될 때 이들이 충분한 진단 및 치료를 받지 못할 가능성이 높다고 보았기 때문이다.
- 〈7장 병원, 의학 정보를 다루는 데이터 센터가 되다〉 중에서(156~157쪽)
2. 예비 데이터 과학자를 위한 커리어 가이드
- 프로그래밍 언어와 수식 없이 탐색하는 데이터 과학의 길
이 책을 집필한 데이터 과학자 11명은 모두 현재 데이터 과학을 활용·연구하는 전문가들이다. 그런데 ‘데이터 과학자’라는 하나의 직업으로 묶이는 저자들이 일하는 현장은 아마존, 마이크로소프트, 네이버, 카카오, 엔씨소프트 등 글로벌 IT 기업부터 신한은행, 서울대병원, 미시간대학교 등에 이르기까지 다양하다. 이들이 데이터 과학에 관심을 갖고 데이터 과학을 공부한 계기 또한 천차만별이다. 이렇듯 데이터 과학자가 되는 길은 단일하지 않다.
이 책은 다양한 경로로 데이터 과학자가 되었으며, 다양한 분야에서 일하고 있는 저자들의 다채로운 이야기를 담았다. 각 분야에서 성공적인 커리어를 쌓고 있는 이들의 이력과 현장 기록은 데이터 과학자가 되길 꿈꾸는 취업 준비생과 청소년에게 훌륭한 가이드가 된다. 특히 데이터 과학을 탐색해보고 싶지만 프로그래밍 언어와 수식의 벽에 부딪쳐 갈피를 잡지 못하는 사람이라면 이 책에 담긴 저자들의 업무 경험이 좋은 참고가 될 것이다.
‘21세기 가장 섹시한 직업’이라 불리는 데이터 과학자들은 정작 어디에서 무엇을 하고 있을까요? 짐작이 가시나요? 그동안 시중에 데이터 과학을 소개해주는 책이 많이 출간되었습니다. 그런데 이 책들은 대개 기술 입문서에 가깝습니다. 실제로 데이터 과학이 다양한 분야에서 어떻게 응용되는지, 구체적으로 우리 삶을 어떻게 편하게 만드는지, 어떤 가치를 창출하는지에 대해서는 별로 이야기해주지 않았습니다. 데이터 과학에 대해 잘 모르는 사람이 처음 입문할 때는 물론 이론 공부가 꼭 필요합니다. 하지만 다른 한편으로 큰 그림을 보고, 다양한 실제 사례를 접하며 흥미를 갖는 것도 큰 도움이 될 수 있습니다. 그런 동기부여가 이론 공부로 이어지는 선순환 구조를 갖추면 더할 나위 없이 좋을 겁니다.
- 〈들어가며〉 중에서(6쪽)
“세상에, 네가 은행에서 일을 한다고?” 오랜만에 만난 대학 동창과의 술자리에서 친구들이 토끼 눈을 뜨고 물었다. 비단 친구들만이 아니다. 아내에게 처음 회사를 옮기겠다는 말을 전했을 때도, 누구보다 나를 잘 알고 내 편이었던 아내마저도 의아하게 생각했으니 그리 놀랄 일은 아니었다. 전자공학을 전공했고, 전자공학의 다양한 분야 중 로봇이 사물을 어떻게 바라보는지를 연구하는 컴퓨터 비전이라는 학문을 공부한 필자에게 금융권, 그것도 은행은 단 한 번도 생각해본 적 없는 선택지였다. 게다가 남들이 부러워하는 글로벌 기업의 중앙 연구소를 떠나 선택한 곳이 은행이었으니 말이다.
- 〈3장 핀테크와 테크핀이 경쟁하는 시대의 금융〉 중에서(53~54쪽)
필자는 데이터 과학자로서 취업을 희망하는 요즘 사람들과는 달리, 엔지니어링을 깊이 공부한 이력이 없다는 점에서 약간 특이하다. 구체적으로 말하자면 석사 과정에서 데이터 시각화 분야를 연구했고, 환자의 의학 검사 데이터를 기반으로 만성도를 분류할 수 있는 프로그램 개발 과정에 관여하며 데이터의 실질적인 활용 방안을 제안하는 데 참여했다. 하지만 이렇게 여러 분야를 연구했다고 해서 컴퓨터과학 및 통계학 모두에 능통하다고는 볼 수 없는 상태였다. (중략) 이렇듯 필자는 사람들이 흔히 상상하는 ‘데이터 과학자’의 이미지와는 상당한 거리가 있었음에도, 언젠가 데이터 과학자가 되어 일하고 싶다는 꿈을 가지고 있었고, 언젠가 그런 자리에서 대단한 일을 해내고 싶었다.
- 〈9장 예비 데이터 과학자를 위한 취업 분투기〉 중에서(190~191쪽)
3. 당신의 데이터 문해력을 업그레이드하라
- 데이터 시대의 기본 소양을 키우는 최고의 지침서
데이터 과학이 아무리 중요하더라도 모두가 데이터 과학자처럼 프로그래밍 언어를 다루고 데이터를 분석할 필요는 없다. 하지만 수많은 기업과 공공기관에서 데이터를 기반으로 의사를 결정하고 정책을 도입하는 현실에서 데이터의 정보와 숨은 의미를 파악하는 능력은 무척 중요해졌다. 바로 ‘데이터 문해력’이 데이터 시대를 살아가는 현대인이라면 꼭 갖춰야 하는 기본 소양이 된 것이다. 이 책은 데이터 과학자가 문제를 설정하고 데이터를 분석하는 과정, 시행착오를 거치며 의미를 찾아내는 과정을 오롯이 보여줌으로써 ‘데이터에서 유용한 통찰을 얻는 법’을 이해하도록 돕는다. 데이터에서 비즈니스 인사이트를 찾고자 하는 독자, 데이터 문해력을 기르고자 하는 독자에게 꼭 필요한 데이터 해석 훈련법이다.
작가 소개
저자 : 박준석 (엮음)
심리학자이자 데이터 과학자. 심리학을 전공하며 통계방법론에 흥미를 느껴 연구했고, 이를 계기로 데이터 과학자가 되었다. 데이터 과학이라는 말이 유행하고 있지만 정작 그것이 우리 삶을 구체적으로 어떻게 바꾸는지, 데이터 과학자들은 어디에서 무슨 일을 하는지 소개해주는 책을 찾아보기 어려워 이 책을 기획했다. 독자들이 데이터 과학의 현황과 다양한 활용 사례를 확인하고 이에 관심을 갖게 된다면 더할 나위 없이 기쁘겠다.
서울대학교 심리학과에서 학사·석사학위를 받았으며, 미국 오하이오주립대학교에서 계량심리학 박사학위와 통계학 석사학위를 받았다. 여러 기업에서 데이터 과학자로 일했다. 지은 책으로 《가짜뉴스의 심리학》이 있다.
박준석 (1장)
심리학자이자 데이터 과학자. 미국 서부의 한 회사에서 데이터 과학자로 일하고 있다. 페이스북 ‘오하이오의 낚시꾼’ 페이지에서 통계학, 데이터 과학 등에 관한 글을 쓴다.
목 차
들어가며
1장 통계학, 가장 오래된 데이터 과학
2장 인공지능, 머신러닝, 딥러닝의 차이는 무엇일까?
3장 핀테크와 테크핀이 경쟁하는 시대의 금융
4장 게임, 가장 풍부한 데이터가 뛰노는 세상
5장 야구에서 출루율이 중요해진 데이터 과학적 이유
6장 데이터 과학으로 서비스를 보호하는 방법
7장 병원, 의학 정보를 다루는 데이터 센터가 되다
8장 사람을 더 똑똑하게 만드는 인공지능 교육
9장 예비 데이터 과학자를 위한 취업 분투기
10장 머신러닝 서비스에 엔지니어가 필요한 이유
11장 공백 속에 숨은 놀라운 이야기, 결측데이터
주
- 단순 변심인 경우 : 상품 수령 후 7일 이내 신청
- 상품 불량/오배송인 경우 : 상품 수령 후 3개월 이내, 혹은 그 사실을 알게 된 이후 30일 이내 반품 신청 가능
반품사유 | 반품 배송비 부담자 |
---|---|
단순변심 | 고객 부담이며, 최초 배송비를 포함해 왕복 배송비가 발생합니다. 또한, 도서/산간지역이거나 설치 상품을 반품하는 경우에는 배송비가 추가될 수 있습니다. |
고객 부담이 아닙니다. |
진행 상태 | 결제완료 | 상품준비중 | 배송지시/배송중/배송완료 |
---|---|---|---|
어떤 상태 | 주문 내역 확인 전 | 상품 발송 준비 중 | 상품이 택배사로 이미 발송 됨 |
환불 | 즉시환불 | 구매취소 의사전달 → 발송중지 → 환불 | 반품회수 → 반품상품 확인 → 환불 |
- 결제완료 또는 배송상품은 1:1 문의에 취소신청해 주셔야 합니다.
- 특정 상품의 경우 취소 수수료가 부과될 수 있습니다.
결제수단 | 환불시점 | 환불방법 |
---|---|---|
신용카드 | 취소완료 후, 3~5일 내 카드사 승인취소(영업일 기준) | 신용카드 승인취소 |
계좌이체 |
실시간 계좌이체 또는 무통장입금 취소완료 후, 입력하신 환불계좌로 1~2일 내 환불금액 입금(영업일 기준) |
계좌입금 |
휴대폰 결제 |
당일 구매내역 취소시 취소 완료 후, 6시간 이내 승인취소 전월 구매내역 취소시 취소 완료 후, 1~2일 내 환불계좌로 입금(영업일 기준) |
당일취소 : 휴대폰 결제 승인취소 익월취소 : 계좌입금 |
포인트 | 취소 완료 후, 당일 포인트 적립 | 환불 포인트 적립 |
- 단순변심으로 인한 반품 시, 배송 완료 후 7일이 지나면 취소/반품 신청이 접수되지 않습니다.
- 주문/제작 상품의 경우, 상품의 제작이 이미 진행된 경우에는 취소가 불가합니다.
- 구성품을 분실하였거나 취급 부주의로 인한 파손/고장/오염된 경우에는 취소/반품이 제한됩니다.
- 제조사의 사정 (신모델 출시 등) 및 부품 가격변동 등에 의해 가격이 변동될 수 있으며, 이로 인한 반품 및 가격보상은 불가합니다.
- 뷰티 상품 이용 시 트러블(알러지, 붉은 반점, 가려움, 따가움)이 발생하는 경우 진료 확인서 및 소견서 등을 증빙하면 환불이 가능하지만 이 경우, 제반 비용은 고객님께서 부담하셔야 합니다.
- 각 상품별로 아래와 같은 사유로 취소/반품이 제한 될 수 있습니다.
상품군 | 취소/반품 불가사유 |
---|---|
의류/잡화/수입명품 | 상품의 택(TAG) 제거/라벨 및 상품 훼손으로 상품의 가치가 현저히 감소된 경우 |
계절상품/식품/화장품 | 고객님의 사용, 시간경과, 일부 소비에 의하여 상품의 가치가 현저히 감소한 경우 |
가전/설치상품 | 전자제품 특성 상, 정품 스티커가 제거되었거나 설치 또는 사용 이후에 단순변심인 경우, 액정화면이 부착된 상품의 전원을 켠 경우 (상품불량으로 인한 교환/반품은 AS센터의 불량 판정을 받아야 합니다.) |
자동차용품 | 상품을 개봉하여 장착한 이후 단순변심의 경우 |
CD/DVD/GAME/BOOK등 | 복제가 가능한 상품의 포장 등을 훼손한 경우 |
상품의 시리얼 넘버 유출로 내장된 소프트웨어의 가치가 감소한 경우 | |
노트북, 테스크탑 PC 등 | 홀로그램 등을 분리, 분실, 훼손하여 상품의 가치가 현저히 감소하여 재판매가 불가할 경우 |