HOME > 신간도서 > 신간도서
 
도서명R 코딩과 문자
저자김준우
분류[사회]
발행일2025-09-10 판형4×6배판
ISBN979-11-94716-22-8 (93320)
페이지236 정가16,000원
네티즌평가 |
(총 0 명 참여)   도서정보 인쇄하기 44
  이 책은 R 언어를 가지고 해보는 노력의 일환이다. 숫자의 통계분석을 위해 만들어진 이 언어는 문자의 분석에도 유용하게 쓰이고 있다. 사실 데이터 의미를 보여주는 데에도 이 언어는 유용한다. R 기반 tm 패키지는 현재 찾아볼 수 있는 가장 쓸모가 있는 몇 개의 시각화 도구 가운데 하나이다. 많은 데이터가 빅데이터로 바뀌고 있다. 생활 속에 광범위하게 침투한 전자기기가 쏟아내는 실시간 정보는 날이 갈수록 좋아지는 컴퓨터 성능으로 손쉽게 처리된다. 따라서 이러한 빅데이터 문자를 처리하는 것은 실용적 중요성도 동시에 가지게 된다. 이러한 새로움에 적응해나가는 것이 개인이나 조직에게 실존적 의미를 던지는 경우도 나타나기 시작한다. R 언어의 기본 원리부터 시작해서 관련된 패키지로 넘어간다. tm 패키지를 사용하여 단어구름(word cloud) 만드는 방법을 다루고는, 문자를 조금 더 효율적으로 추출해내고 다루는 방법인 정규식(regular expression) 소개로 책이 마무리된다. 다른 책에서는 찾기 어려운 이 책만의 뚜렷한 세 가지 장점이 있다. 첫 번째로 R 원리를 중심으로 전개된다. 대표적인 것이 R 언어 최소단위 벡터이다. 예시를 들어가면서 원리를 깊이 있고 자세하게 설명한다. 그리고 이를 계속 응용해 나간다. 이 책은 쉽게 풀어서 원리를 제공하면서도 나중에 다루어도 될 주제는 생략하는 방식으로 진도를 쭉 나가고 있다. 두 번째로 R 코딩 원리와 문자 처리 실무를 같이 배울 수 있다. 기존 방식은 R 기초 과정이 끝난 다음에 더 수준 높은 과정으로서 문자열을 다룬다. 모든 컴퓨터 언어가 숫자뿐 아니라 문자 역시 자연히 다루게 되는 걸 생각해보면, 이러한 학습 방식은 인위적이다. 그래서 비효율적이다. 따라서 독자 입장에서는 문자 처리라는 실무를 R 코딩 원리 이해와 연결시킬 수 있다. 인문과학 사회과학 학술 분석뿐 아니라 일반 실무 작업을 수행할 때, 원리를 제대로 알고 분석을 해나갈 수 있게 된다. 세 번째로 이 책의 진행은 퀴즈를 푸는 듯한 느낌을 가질 수 있다. 근원적 R 코딩 원리와 관련된 부분은 질문을 먼저 던진다. 그리고 제일 마지막 장에는 열쇠에 해당하는 지식을 제공한다. 수업 시간에서 학생들과 같이 성장하는 과정이, 책에 반영되기 때문에 가능한 형식이다.
도서소개 인쇄하기
01 묶음의 벡터vector / 13

02 묶음에 대한 함수와 기호 / 23

03 논리값과 묶음 / 29

04 논리값과 묶음 더 살펴보기 / 39

05 할인매장 비유에서 신선식품 혹은 가공식품 정하기 as 함수와 R의 개입 / 51

06 벡터 c 함수 데이터프레임data.frame 함수 리스트list 함수 / 57

07 base R 사용해서 문자 다루기 / 63

08 문자를 가져오고 또 가져와서 바꾸는 함수 / 73

09 창고형 할인매장에서 물건 묶음을 맞추어 팔기 paste 함수 / 83

10 문자 묶음을 strsplit 함수로 쪼개면 / 91

11 날짜벡터 문자벡터 / 99

12 요인factor / 111

13 들쭉날쭉한 텍스트 파일 가져오기 / 123

14 R로 파일 가져오는 다양한 방법들 / 133

15 텍스트마이닝 패키지 tm 설치와 corpus / 146

16 문자 정제text cleaning / 155

17 단어구름wordcloud / 166

18 단어구름 손질하기 / 179

19 정규식에서 패턴pattern 매치match 시키기 / 191

20 메타문자 . 기호 아무거나 가능하지만 반드시 한 칸만 차지한다 / 195

21 마침표 . 찾으려면 \. / 199

22 R에서 정규식 실습하기 / 203

23 메타문자 그리고 해제문자로서 \ / 211

24 앞서 제기된 질문을 푸는 단서 / 221

이 책에 인용되어 있고 또 볼만한 책들 / 225