반응형

R의 데이터 구조

 

 

기계 학습에서 많이 사용하는 R데이터 구조는 벡터, 팩터, 리스트, 어레이, 데이터 프레임이다.

 

 

1) 벡터 (Vector)

-> 벡터는 원소라고 불리는 값의 순서 있는 집합으로 저장한다. 벡터는 원소의 개수를 상관하지 않지만 모든 원소는 같은 타입이어야 한다.

 

ex)

> subject_name <- c("horae","bincho","steve jobs")

=> 문자열 벡터를 subject_name 으로 정의

 

 

2) 팩터 (Factor)

   -> 데이터에 남자 여자 여자 라는 데이터가 있을 경우 팩터를 사용하면 레벨: 남자 여자 이런식으로 보여준다.

 

 

3) 리스트 (List)

-> 값의 순서가 있는 집합을 저장

 

ex) 1) 에서 사용했던 subject_name으로 예를 들면

> subject_name[1]

[1] "horae" 

 

이런식으로 출력이 된다.

 

또한 리스트는 다음과 같이 이름을 추가하여 출력 할 수 있다.

 

 

 

4) 데이터 프레임 (Data Frame)

->  데이터의 행과 열을 모두 갖고 있다. 벡터와 리스트 두가지의 측면을 가지고 있다.

 

 

행과 열로 합쳐주기 때문에 위 그림과 같이 temperature는 원소가 2개 뿐이여서 에러가 난다는 것을 알 수 있다.  원소 3개를 가진 temp를 만들고 다시 하니 성공~!

 

 

이전 그림은 stringsAsFactors를 stringAsFactor로 잘못 입력하였더니 행렬 안으로 입력 되었다.

위 그림이 수정한 모습 

 

 

 

 

데이터 프레임 활용하는 모습 pt_data[행, 열] 원하는 출력 행이나 열을 숫자로 입력하면 된다.

반응형

+ Recent posts