doBy가 데이터를 그룹별로 나눈 후 특정 계산을 적용하기 위한 함수들의 패키지인 반면 aggregate( )는 좀 더 일반적인 그룹별 연산을 위한 함수다. aggregate( )를 사용하면 데이터를 그룹으로 묶은 후 임의의 함수를 그룹에 적용할 수 있다. Show
이 절에서는 aggregate( )에 포뮬러를 적용한 형태의 예를 살펴본다. 다음은 아이리스 데이터에서 종별 Sepal.Width의 평균 길이를 구하는 예다. > aggregate(Sepal.Width ~ Species, iris, mean)
Species Sepal.Width
1 setosa 3.428
2 versicolor 2.770
3 virginica 2.974
같은 일을 tapply( )를 통해서 수행하면 다음과 같다. > tapply(iris$Sepal.Length, iris$Species, mean)
setosa versicolor virginica
5.006 5.936 6.588
얻는 결과는 같지만 포뮬러를 사용한 aggregate( ) 쪽이 코드 작성하기 편리하다. 신간 소식 구독하기 뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요. 1. 데이터 불러오기
2. 변수명 바꾸기
3. 성별 기준으로 평균구하기(subset)
4. 그래프 그리기
5.표준편차 구하기
6. 범위 확인하기
7. 경력별로 평균월급 구하기
8. 그래프 그려보기
9. 표준편차 구하기
10. 경력별 범위
11. 가장 적은 월급 집단 찾기
|