HOME > 도서안내 > 도서안내
 
도서명ggplot2 데이터시각화 그리고 R 코딩
저자김준우
분류[인문]
발행일2024-08-14 판형4×6배판
ISBN979-11-93707-53-1(93000)
페이지280 정가20,000원
네티즌평가 |
(총 0 명 참여)   도서정보 인쇄하기 200
  많은 데이터가 빅데이터로 바뀌고 있다. 생활 속에 광범위하게 침투한 전자기기가 쏟아내는 실시간 정보는 날이 갈수록 좋아지는 컴퓨터 성능으로 손쉽게 처리된다. 따라서 이러한 빅데이터를 시각화하는 것은 실용적인 중요성 뿐 아니라 학문적 중요성도 동시에 가지게 된다.
빅데이터의 통계처리에 특화된 R 언어 패키지로서 ggplot2 경우는, 빅데이터의 학문적 활용에 두드러지게 많이 활용된다. 이 책은 이러한 ggplot2 데이터시각화를 다룬다.
다른 책에서는 찾기 어려운 이 책만의 뚜렷한 장점은 두 가지이다. 첫 번째는 ggplot2 작동원리를 예시를 들어가면서 분명하게 설명한다는 점이다. 이유는 알 수 없지만, ggplot2 패키지를 만든 이가 쓴 책을 포함한 거의 대부분 전문서적에서도 ggplot2 문법 작동원리가 명확하게 제시되어 있지 않다. 유화를 그리듯 덧칠한다는 원리는 상대적으로 잘 설명되어 있다. 하지만 한번 설정한 것이 이후 작업에도 계속 이어지는가 이어지지 않는가를 다루는 상속inheritance 원리는 그렇지 않다. 두 번째는 도구인 패키지 ggplot을 학습을 통한 R 코딩 원리 이해이다. 보통은 기본 언어 코딩을 배우고 그 다음에 패키지로 넘어가는 수순이다. 이 책의 접근방식은 정반대이다. 비유를 들자면, 이 책의 학습방법은 계산기를 사용한 수학원리의 이해와 비슷하다. 구체적으로 얘기하자면, 요인factor 개념을 들 수 있다. 막대도표를 그림으로써 왜 이러한 요인이라는 형태가 언어에 있어야 하는지를 이해할 수 있다. 통계학자가 만든 R 언어는 통계처리에 특화되어 있다. 이러한 특화는 문자와 숫자가 결합된 형태를 불가피하게 만든다. 시각적으로 제시되어야만, 이러한 구조가 눈에 들어올 수 있다. 당연히 눈에 들어오면 이해가 쉬워진다. 사실은 책 제목에서 알 수 있는 또 하나의 장점이 있다. 데이터시각화 원칙 ggplot2 사용법 그리고 R코딩을 한 권의 책에 쉽고 깊이있게 연결시킨 점이다.
도서소개 인쇄하기
1  기본 언어 R 그리고 작업도구 ggplot2 / 13

2  ggplot2 기본단위 데이터프레임 / 25

3  그림 그려나가는 일련의 과정으로서의 ggplot2 / 33

4  시간 흐름의 선도표 / 51

5  변수를 매핑mapping 그리고 어떤 값을 세팅setting / 61

6  면 분할 faceting / 75

7  산점도 그리기와 데이터프레임에서 $ 기호 / 85

8  유화 그리듯 덧칠해 나가는 ggplot2 문법 / 97

9  전체적 구도와 배경 바꾸는 theme 함수 / 111

10 겹침 해결하는 jitter alpha / 135

11  여성 기대수명과 일인당 국내총생산 실제자료의 실제처리 / 143

12  중위수 사분위수 상자도표 그리고 선택으로서 데이터시각화 / 151

13  막대도표와 히스토그램은 다르다 / 169

14  남녀 분포와 같이 아주 간단한 것만 원도표 만들어야 / 183

15  팔꿈치로 살짝 밀기 nudge / 201

16  축 범위 조절과 시간 날짜 / 207

17  행마다의 이름 rownames / 217

18  요인factor / 223

19  누적 막대도표 / 231

20  ggplot2 쓸 때 실제로 필요해지는 요인factor / 243

21  결측값 NA / 257

22  색깔은 꼭 필요한 곳에만 / 267

■본문에 인용되어 있고 또 읽어볼만한 책 / 276
■찾아보기 / 277