SQL 기초: 데이터베이스와 테이블 생성하는 방법과 데이터 조작하기
SQL이란?SQL은 Structured Query Language의 줄임말로, 데이터베이스 관리 시스템(DBMS)에서 데이터를 정의하고 조작하기 위한 표준 언어입니다. SQL을 사용하면 데이터베이스에 데이터를 추가하거나 수정
dararium.tistory.com
데이터 집계하기
숫자형 데이터의 경우, 합계, 평균, 최소, 최대 등의 값을 구할 수 있습니다.
COUNT()
: 데이터의 개수를 구합니다. 모든 레코드의 개수를 구하려면COUNT(*)
를 하고, 특정 열의 개수를 구하려면*
대신 컬럼 이름을 입렵하면 됩니다. 중복되지 않은 데이터의 개수를 구하고 싶다면DISTINCT
키워드를 이용해서COUNT(DISTINCT {col})
와 같이 씁니다.SUM()
: 데이터의 합계를 구합니다.AVG()
: 데이터의 평균을 구합니다.MAX()
: 데이터의 최댓값을 출력합니다.MIN()
: 데이터의 최솟값을 출력합니다.
데이터 집계의 경우 다음으로 소개할 GROUP BY
와 함께 사용하면 더욱 다양한 값을 구할 수 있습니다.
GROUP BY
GROUP BY
키워드는 데이터를 그룹화합니다.
SELECT job, AVG(age) FROM my_table
GROUP BY job;
ORDER BY
ORDER BY
는 데이터의 정렬 순서를 결정합니다. 기본값은 오름차순(ASC
)이고, 내림차순으로 데이터를 정렬하려면 DESC
키워드를 사용합니다.
SELECT job, AVG(age) FROM my_table
GROUP BY job
ORDER BY AVG(age) DESC;
LIMIT
조회할 데이터의 개수를 제한합니다. LIMIT
의 경우 쿼리문의 가장 마지막에 작성합니다.
SELECT job, AVG(age) FROM my_table
GROUP BY job
ORDER BY AVG(age) DESC
LIMIT 5;
AS
AS
키워드를 사용하면 컬럼의 별칭을 설정할 수 있습니다. 이 키워드는 생략할 수 있고, 쿼리문에서 한 번만 선언되면 쿼리문 내에서 어디서나 사용할 수 있습니다.
별칭에 띄어쓰기가 있는 경우 따옴표로 감싸면 사용이 가능하지만 쿼리문 내에서 재사용할 수는 없습니다.
SELECT job, AVG(age) AS avg_age FROM my_table
GROUP BY job
ORDER BY avg_age DESC
LIMIT 5;
'데이터 분석 > 강의 노트' 카테고리의 다른 글
SQL 윈도우 함수 (0) | 2024.08.16 |
---|---|
SQL 문자열, 날짜, 숫자 관련 함수 (0) | 2024.08.08 |
SQL 기초: 데이터베이스와 테이블 생성하는 방법과 데이터 조작하기 (0) | 2024.08.01 |
matplotlib를 이용해서 데이터 시각화하기 (0) | 2024.07.30 |
Pandas: 통계량 알아보기, 그룹화하기, 범주별 비율 구하기 (0) | 2024.07.10 |