본문 바로가기
반응형

r3

[R stdio] 영화 별 감상 키워드 Word Cloud(워드 클라우드) 만들기 - 2 데이터 시각화를 위한 world cloud 저번에는 4차 산업 관련 어떤 키워드가 인기가 있는 지를 뉴스 페이지를 통해 world cloud를 만들어 보았습니다. 하지만 최종 결과를 보며 생각보다 결과가 잘 나오지 않는 것을 알 수 있었습니다. 이렇게 결과가 별로 안 나온 이유는 활용한 기본 데이터 부족 및 좋은 데이터가 아니라고 생각하였고 이번에는 데이터가 많은 데이터를 이용하여 다른 주제로 해볼까 합니다. 선택한 새로운 주제 => 영화 별 감상 키워드 world cloud 제가 선택한 영화는 비교가 되게 장르가 다르고 다들 한번 쯤은 알만한 영화를 골랐습니다. 1) The Avengers 2) 레미제라블 사실은 제가 재밌게 본 영화입니다. 아래는 참고한 사이트 링크입니다. RStduio에서 한글로 할.. 2020. 5. 30.
[R stdio] Word Cloud(워드 클라우드) 만들기 - 1 데이터 시각화를 위한 world cloud 기본적으로 word cloud를 만들기 위해서는 "worldcloud"라는 패키지가 필요합니다. 그 후 word와 각 word에 해당되는 상대값을 넣어주고 실행시키게 되면 300으로 상대적인 값이 제일 큰 Seoul 이 크게 표시가 되고 그 후 200 값인 Busan 50 값인 jeju가 제일 적게 표시가 됩니다. 이렇게 Tag Cloud (태그 클라우드) 또는 World Cloud (워드 클라우드)는 메타 데이터에서 얻어진 태그들을 분석하여 중요도나 인기도 등을 고려하여 시각적으로 늘어 놓은 이미지를 이야기합니다. > install.packages("wordcloud") > library(wordcloud) > word freq wordcloud(word, f.. 2020. 5. 25.
[R] 분산 - var함수와 직접 수식 계산에서 오차가 나는 이유 분산이란? 확률론과 통계학에서 어떤 확률변수의 분산(分散, 영어: variance, 변량 )은 그 확률변수가 기댓값으로부터 얼마나 떨어진 곳에 분포하는지를 가늠하는 숫자이다. 기댓값은 확률변수의 위치를 나타내고 분산은 그것이 얼마나 넓게 퍼져 있는지를 나타낸다. (출처 : 위키백과) 위에 보다싶이 평균에서의 오차를 저장한 rc_sd 를 이용하여 sum((rc_sd)^2/length(rc_sd))으로 수식 계산한 결과와 R 함수에서 제공하는 분산 함수 var()의 결과 104.5831 / 107.0742 로 미세한 차이가 나는 것을 확인할 수 있습니다. 왜 이러한 분산의 계산에서 수식 계산과 var 함수 계산에서 오차가 나는 이유는? 바로, 분산을 구하기 위해 사용하는 식에서 분모를 n으로 사용하지만, R.. 2020. 4. 20.
반응형