이 게시물 데이터 프레임의 특정 열을 기준으로 그룹 합계를 계산하는 방법소개.
소개
R에서 그룹 합계다양한 계산 사례가 있습니다. 나. 집단별 합계, 성별 총인원, 연령별 총수입. 아래는 다른 것들의 목록입니다 그룹 합계 추가 설치 없이 사용 가능한 기능 중 aggreate()
기능이 설명되고 간단한 솔루션이 예제 데이터와 함께 제공됩니다.
골재?
aggregate()
데이터를 하위 집합으로 나누고 각각에 대한 요약 통계를 계산하고 결과를 편리한 형식으로 반환하는 기능입니다.
기능 사용
집계(x, FUN, …, 단순화 = TRUE, 삭제 = TRUE) |
x
: 입력 데이터(R 객체)FUN
: 데이터의 모든 하위 집합에 적용할 수 있는 요약 통계를 계산하는 기능simplify = TRUE
: 가능한 경우 결과를 벡터 또는 행렬로 단순화할지 여부(기본값 =TRUE
)drop = TRUE
: 사용하지 않는 그룹화 값 조합 삭제 여부(기본값 =TRUE
)
예제 문제 해결
샘플 데이터 생성
샘플 데이터를 생성하기 위한 R의 내장 함수 data.frame()
기능. 다음 코드를 실행하여 mydata
이름이 지정된 데이터 프레임 만들기
만들어진 mydata
A, B, C 열에 각각 10, 20, 30/10, 10, 30/10, 10, 40/0, 10, 30으로 호출된 변수에 데이터 프레임이 저장됩니다.
mydata <- data.frame(A = c(10,10,10,0),
B = c(20,10,10,10),
C = c(30,30,40,30))
A B C 1 0 10 30 2 10 10 70 3 10 20 30
집계로 그룹 합계 계산
mydata
데이터 프레임의 A 열과 B 열로 C 열의 값을 그룹화하고 합계를 계산해 보겠습니다. 이를 위해 R에서 aggregate()
기능을 사용할 수 있습니다.
result <- aggregate(C ~ A + B, data = mydata, FUN = sum)
result
위의 코드는 C열(C)의 값을 A열과 B열(A,B)의 값으로 그룹화한 다음 그룹화된 합계를 계산합니다. 결과적으로 result
호출된 데이터 프레임이 생성되고 다음 값을 갖습니다.
A B C 1 0 10 30 2 10 10 70 3 10 20 30
위의 출력을 보면 첫 번째 열에는 A열의 값이 포함되고 두 번째 열에는 B열의 값이 포함되며 세 번째 열에는 C열의 그룹화된 합계가 포함됩니다. 따라서 첫 번째 행은 C를 나타냅니다. A = 0 및 B = 10일 때 합은 30이고, 두 번째 행은 A = 10 및 B = 10일 때 C의 합이 70임을 나타냅니다.
aggregate()
함수를 사용하면 데이터를 쉽게 그룹화하고 계산을 수행할 수 있습니다. 데이터 분석 작업에 일반적으로 사용되는 이 함수는 다양한 유형의 계산(예: 평균, 중앙값, 모드 등)을 수행할 수 있습니다.
끝
R은 데이터 분석에 매우 유용한 도구입니다. 데이터 분석 작업을 쉽게 처리할 수 있도록 데이터 프레임, 함수, 패키지 등 다양한 기능을 제공합니다. 또한 R에는 사용자가 작업을 더 쉽게 수행할 수 있도록 커뮤니티에서 공유하는 여러 패키지와 기능이 있습니다. aggregate()
기능은
관련된 링크들
(1) (R) 숫자 데이터 범위에 따른 그룹 할당 (feat. ifelse)
(2) (R) 데이터를 특정 변수 값으로 분할하기 (feat. MASS, Cars93)
(3) (R) 열별 데이터 연결