R의 데이터 구조
기계 학습에서 많이 사용하는 R데이터 구조는 벡터, 팩터, 리스트, 어레이, 데이터 프레임이다.
1) 벡터 (Vector)
-> 벡터는 원소라고 불리는 값의 순서 있는 집합으로 저장한다. 벡터는 원소의 개수를 상관하지 않지만 모든 원소는 같은 타입이어야 한다.
ex)
> subject_name <- c("horae","bincho","steve jobs")
=> 문자열 벡터를 subject_name 으로 정의
2) 팩터 (Factor)
-> 데이터에 남자 여자 여자 라는 데이터가 있을 경우 팩터를 사용하면 레벨: 남자 여자 이런식으로 보여준다.
3) 리스트 (List)
-> 값의 순서가 있는 집합을 저장
ex) 1) 에서 사용했던 subject_name으로 예를 들면
> subject_name[1]
[1] "horae"
이런식으로 출력이 된다.
또한 리스트는 다음과 같이 이름을 추가하여 출력 할 수 있다.
4) 데이터 프레임 (Data Frame)
-> 데이터의 행과 열을 모두 갖고 있다. 벡터와 리스트 두가지의 측면을 가지고 있다.
행과 열로 합쳐주기 때문에 위 그림과 같이 temperature는 원소가 2개 뿐이여서 에러가 난다는 것을 알 수 있다. 원소 3개를 가진 temp를 만들고 다시 하니 성공~!
이전 그림은 stringsAsFactors를 stringAsFactor로 잘못 입력하였더니 행렬 안으로 입력 되었다.
위 그림이 수정한 모습
데이터 프레임 활용하는 모습 pt_data[행, 열] 원하는 출력 행이나 열을 숫자로 입력하면 된다.
'IT기술 관련 > 빅데이터 관련' 카테고리의 다른 글
[R 프로그래밍] [R] 몫과 나머지 (quotient and remainder) (0) | 2016.04.19 |
---|---|
[Rstudio] Rstudio (치명적 오류: 접근 거부 - Fatal error: access denied) 해결 (3) | 2016.03.14 |
[R프로그래밍] Data Import, Data 구조 (0) | 2016.01.31 |
데이터 마이닝 vs 텍스트 마이닝 (0) | 2016.01.22 |
기존 데이터 분석 vs 빅데이터 분석 (0) | 2016.01.22 |