'IT기술 관련/빅데이터 관련' 카테고리의 글 목록

출처:https://may9noy.tistory.com/470 1. 첫번째 방법 첫번째 방법 사용 시 주의 사항 : 'my_table.csv' 파일명에 my.ini의 secure-file-priv 경로를 같이 적어야 정상적으로 파일이 export 되는 경우가 있음. 파일명 : MySQL table into CSV file 1.sql SELECT * FROM my_table INTO OUTFILE 'my_table.csv' CHARACTER SET euckr FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' ESCAPED BY '\\' LINES TERMINATED BY '\n' 2. 두번째 방법 파일명 : MySQL table into CSV file 2.sql..

the default discovery settings are unsuitable for production use; at least one of [discovery.seed_hosts, discovery.seed_providers, cluster.initial_master_nodes] must be configured 오류 해결 하기 ./elasticsearch 를 실행시키자 아래와 같은 오류가 나온다. 이번엔 설정 방법도 달라졌나보다;; [2019-09-30T20:12:48,973][INFO ][o.e.b.BootstrapChecks ] bound or publishing to a non-loopback address, enforcing bootstrap checksERROR: [1] bootstra..

출처:http://egloos.zum.com/greentec/v/4176464 요즘 coursera 에서 data science 관련 강의들을 듣고 있다. 그런데 통계 프로그램인 R에서 xlsx 파일을 로드하기 위해 xlsx 패키지를 설치하려고 하자 패키지 ‘rJava’는 로드되어질 수 없습니다 라는 메시지와 함께 로드가 제대로 되지 않았다. rJava를 remove 했다가 다시 설치해봐도 제대로 되지 않고, 구글링을 해보니 한글로는 네 개 정도의 답변이 있었는데 약간 헷갈리게 적혀 있고, 영어로 보니 답변이 잘 달려 있어서 여기에 옮겨 놓는다. http://www.r-statistics.com/2012/08/how-to-load-the-rjava-package-after-the-error-java_ho..

출처: http://bigbigdata.tistory.com/78 [데이터 긁긁해] KoNLP패키지와 wordcloud패키지를 이용해한글 WordCloud 만들기 빈도수가 높은 단어일수록 크게 나타내는 WordCloud [셋팅하기]KoNLP 패키지와 wordcloud패키지를 설치하고, 로딩한다. install.packages("패키지이름")library(패키지이름) 한글이 저장되있는 세종사전을 사용합니다. R이 한글을 분석할 때 이 사전을 참고해야 하니까. useSejongDic()그리고 사전에 특수한 명칭같은 단어들이 필요하다면 추가해준다. mergeUserDic(data.frame("해수욕장","ncn")) 1. 텍스트에서 명사만 골라내기 명사만 골라낼 때, KoNLP 패키지의 extractNoun ..

출처: http://wsyang.com/2014/02/introduction-to-dplyr/ 데이터 분석에서 가장 많은 시간을 차지하는 것은 데이터를 분석에 필요한 형태로 만드는 데이터 전처리 과정입니다. 우리가 공부하면서 보게 되는 책에 있는 예제는 말 그대로 예제일 뿐이지 실제 데이터 분석 업무에서는 바로 모델링이나 시각화에 적합한 형태의 데이터를 얻기 위해서는 지루하고 복잡한 과정을 거치게 됩니다. 데이터 분석 프로젝트에 걸리는 시간의 절반 이상은 데이터의 전처리, 변환, 필터링이 차지하게 되는 것이 보통입니다.R 언어 자체에도 데이터 전처리를 위한 많은 함수가 포함되어 있습니다. 여기에 각종 패키지의 도움을 받는다면 더욱 쉽고 빠르게 전처리 과정을 마칠 수가 있습니다. 이번 포스팅에서는 최근 d..

출처:http://icodebroker.tistory.com/3595 ■ subset 함수 : 데이터 추출하기----------------------------------------------------------------------------------------------------▶ 매출 data.frame에서 매출월이 1월인 데이터 추출하기 매출 = read.csv("data_win.csv") subset(매출, 매출월 == 1) ▶ 매출 data.frame에서 요일이 월요일인 데이터 추출하기 매출 = read.csv("data_win.csv") subset(매출, 요일 == "월") ▶ 매출 data.frame에서 성별이 여자인 데이터 추출하기 매출 = read.csv("data_win.csv..

출처:http://stackoverflow.com/questions/26082405/error-in-listing-packages-in-rstudio Error in nchar(homeDir) : invalid multibyte string, element 1 오류 해결하기 Sys.setlocale(category = "LC_ALL", locale = "us")Rstudio console에 위의 문장을 입력하면 된다.

소스코드 데이터 파일 데이터 파일 결과 값

출처: https://stat.ethz.ch/pipermail/r-help/2007-February/125860.html > iris[sample(nrow(iris), 2), ] Sepal.Length Sepal.Width Petal.Length Petal.Width Species 96 5.7 3.0 4.2 1.2 versicolor 17 5.4 3.9 1.3 0.4 setosa # Select 5 random rows > iris[sample(nrow(iris), 5), ] Sepal.Length Sepal.Width Petal.Length Petal.Width Species 83 5.8 2.7 3.9 1.2 versicolor 12 4.8 3.4 1.6 0.2 setosa 63 6.0 2.2 4.0 ..

출처: https://stat.ethz.ch/pipermail/r-help/2005-August/077420.html s1

티스토리툴바