(R) 데이터 프레임의 그룹합 계산하기 (feat. Aggregate)

이 게시물 데이터 프레임의 특정 열을 기준으로 그룹 합계를 계산하는 방법소개.


데이터-프레임-그룹-합계-R-사용-집계

소개

R에서 그룹 합계다양한 계산 사례가 있습니다. 나. 집단별 합계, 성별 총인원, 연령별 총수입. 아래는 다른 것들의 목록입니다 그룹 합계 추가 설치 없이 사용 가능한 기능 중 aggreate() 기능이 설명되고 간단한 솔루션이 예제 데이터와 함께 제공됩니다.

골재?

aggregate()데이터를 하위 집합으로 나누고 각각에 대한 요약 통계를 계산하고 결과를 편리한 형식으로 반환하는 기능입니다.

기능 사용

집계(x, FUN, …, 단순화 = TRUE, 삭제 = TRUE)

  • x : 입력 데이터(R 객체)
  • FUN : 데이터의 모든 하위 집합에 적용할 수 있는 요약 통계를 계산하는 기능
  • simplify = TRUE : 가능한 경우 결과를 벡터 또는 행렬로 단순화할지 여부(기본값 = TRUE)
  • drop = TRUE : 사용하지 않는 그룹화 값 조합 삭제 여부(기본값 = TRUE)

예제 문제 해결

샘플 데이터 생성

샘플 데이터를 생성하기 위한 R의 내장 함수 data.frame() 기능. 다음 코드를 실행하여 mydata이름이 지정된 데이터 프레임 만들기

만들어진 mydataA, B, C 열에 각각 10, 20, 30/10, 10, 30/10, 10, 40/0, ​​10, 30으로 호출된 변수에 데이터 프레임이 저장됩니다.

mydata <- data.frame(A = c(10,10,10,0),
                     B = c(20,10,10,10),
                     C = c(30,30,40,30))
   A  B  C
1  0 10 30
2 10 10 70
3 10 20 30

집계로 그룹 합계 계산

mydata 데이터 프레임의 A 열과 B 열로 C 열의 값을 그룹화하고 합계를 계산해 보겠습니다. 이를 위해 R에서 aggregate() 기능을 사용할 수 있습니다.

result <- aggregate(C ~ A + B, data = mydata, FUN = sum)
result

위의 코드는 C열(C)의 값을 A열과 B열(A,B)의 값으로 그룹화한 다음 그룹화된 합계를 계산합니다. 결과적으로 result호출된 데이터 프레임이 생성되고 다음 값을 갖습니다.

   A  B  C
1  0 10 30
2 10 10 70
3 10 20 30

위의 출력을 보면 첫 번째 열에는 A열의 값이 포함되고 두 번째 열에는 B열의 값이 포함되며 세 번째 열에는 C열의 그룹화된 합계가 포함됩니다. 따라서 첫 번째 행은 C를 나타냅니다. A = 0 및 B = 10일 때 합은 30이고, 두 번째 행은 A = 10 및 B = 10일 때 C의 합이 70임을 나타냅니다.

aggregate() 함수를 사용하면 데이터를 쉽게 그룹화하고 계산을 수행할 수 있습니다. 데이터 분석 작업에 일반적으로 사용되는 이 함수는 다양한 유형의 계산(예: 평균, 중앙값, 모드 등)을 수행할 수 있습니다.

R은 데이터 분석에 매우 유용한 도구입니다. 데이터 분석 작업을 쉽게 처리할 수 있도록 데이터 프레임, 함수, 패키지 등 다양한 기능을 제공합니다. 또한 R에는 사용자가 작업을 더 쉽게 수행할 수 있도록 커뮤니티에서 공유하는 여러 패키지와 기능이 있습니다. aggregate() 기능은 그룹화된 데이터에 대한 계산을 수행하는 데 유용합니다.이렇게 하면 데이터 분석 작업에서 많은 시간을 절약할 수 있습니다.

관련된 링크들

(1) (R) 숫자 데이터 범위에 따른 그룹 할당 (feat. ifelse)
(2) (R) 데이터를 특정 변수 값으로 분할하기 (feat. MASS, Cars93)
(3) (R) 열별 데이터 연결