산포도

마지막 업데이트: 2022년 2월 3일 | 0개 댓글
  • 네이버 블로그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오스토리 공유하기
(1) 평균을 구한다. 평균은 (계급값)(도수)의 합을 도수의 합으로 나눈다.

산포도와 편차

대푯값에 대해서 알아봤어요. 평균, 중앙값, 최빈값이 있었죠? 대푯값은 말 그대로 변량들의 특징을 대표적으로 나타낼 수 있는 값이에요.

그런데 이번에는 자료의 대표적인 특징이 아니라 자료가 어떻게 분포되어 있는지 알고 싶어요. 대푯값으로는 알 수가 없거든요.

그래서 자료의 분포를 쉽게 알아볼 수 있는 값을 구해야 하는데 그게 바로 산포도입니다.

산포도는 자료가 흩어져 있는 정도를 하나의 수로 나타낸 값이에요. 산포는 분포랑 비슷한 뜻이에요.

산포도도 대푯값처럼 딱 하나만 있는 게 아니라 여러 가지 종류가 있어요. 그중에서도 분산표준편차가 가장 많이 쓰이는데, 이것에 대해서는 다음 글 분산과 표준편차에서 자세히 설명할게요.

산포도는 평균에 얼마나 가까이 있느냐, 평균에서 얼마나 멀리 있느냐를 통해서 자료가 흩어진 정도를 알아보는 방법이에요. 따라서 평균을 제일 먼저 구해야 해요. 자료의 변량이 평균에 가까이 있으면 "산포도가 작다"고 하고, 평균에서 멀리 떨어져 있으면 "산포도가 크다"고 해요.

산포도는 평균에서 얼마나 떨어져 있느냐가 중요하잖아요. 평균에서 얼마나 떨어져 있느냐를 값으로 나타낸 게 편차이에요. 편차는 아래 공식으로 구해요.

변량이 평균보다 크면 편차 > 0이고, 변량이 평균보다 작으면 편차 < 0이 돼요.

편차의 부호와 상관없이 편차의 절댓값이 작을수록 평균에 가까이 있고, 절댓값이 클수록 평균에서 멀리 떨어져 있는 거죠.

또 하나 기억해야 할 게 편차의 합 = 0이에요.

90, 산포도 x, 85, 95, 100의 다섯 숫자의 평균이 90일 때 x와 그 편차를 구하여라.

평균 90은 다섯 수를 모두 더해서 5로 나눈 값이죠? 그 과정을 거꾸로 하면 x를 구할 수 있어요.

(90 + x + 85 + 95 + 100) ÷ 5 = 90
90 + x + 85 + 95 + 100 = 450
x = 80

다음은 은희와 영희가 수학시험을 5번 보고 점수를 그린 산포도 그래프이다. 평균은 대푯값으로 서로 같다.

평균은 같으나 자료의 분포 상태가 서로 다르다. 자료들이 대푯값 주위에 어떻게 흩어져 알아보아야 한다.

은희 점수는 평균 중심에 몰려 있고, 영희 점수는 평균에서 흩어져 있다.

이와 같이 자료들이 대푯값 주위에 흩어져 있는 정도를 하나의 수로 나타낸 게 산포도이다. 산포도가 크면 자료들이 대푯값에서 멀리 흩어져 있고, 작으면 대푯값 주위에 몰려 있다. 수학시험에서 은희는 산포도가 작고 영희는 산포도가 크다.

산포도로 나타내는 방법에는 여러 가지가 있다. 그 중 평균을 대푯값으로 했을 때 변량이 흩어진 정도를 알아보자.

어느 자료 중 변량에서 평균을 뺀 값을 편차라고 한다. 편차의 절댓값이 클수록 변량들은 평균에서 멀리 있고, 절댓값이 작을수록 변량들은 평균 가까이 있다.

차는 변량이 평균보다 크면 양수이고 작으면 음수이다.

은희와 영희의 받은 수학점수에서 편차의 합을 구해 보자.

차의 합은 항상 0이다. 편차의 합으로는 평균 주위에 흩어져 있는 정도를 알 수 없다. 평균을 중심으로 변량들이 흩어져 있는 정도를 어떻게 알 수 있나?

편차의 제곱의 합을 구하여 전체 변량의 수로 나눈 값이 분산이다. 분산이란 편차 제곱의 평균이다. 분산의 양의 제곱근이 표준 편차 이 다. 표준편차는 널리 쓰이는 산포도이다.

은희와 영희의 수학성적에서 분산과 표준편차를 구해 보자.

수학점수에서 표준편차가 은희가 영희보다 작다. 은희가 수학성적이 고르다.

일반적으로 분산과 표준편차는 다음과 같이 구한다.

3. 도수분포표에서 분산과 산포도 표준편차

자료가 도수분포표로 주어진 때는 개개의 변량을 정확히 알 수 없다. 계급값을 그 계급에 속하는 변량으로 생각한다. (편차) = (변량) - (평균)으로 구했으므로, 편차를 구할 때 변량 대신 계급값을 사용한다.

일반적으로 도수분포표에서 표준편차를 구할 때, 다음 순서로 한다.

(1) 평균을 구한다. 평균은 (계급값)(도수)의 합을 도수의 합으로 나눈다.

(2) 평균을 이용하여 각 계급에서 편차,를 구한다.

(3) 의 합을 도수의 합으로 나누어 분산을 구한다.

산포도

산포도란 대푯값을 중심으로 자료들이 흩어져 있는 정도를 의미한다. 이는 하나의 수치로서 표현되며 수치가 작을수록 자료들이 대푯값에 밀집되어 있고, 클수록 자료들이 대푯값을 중심으로 멀리 흩어져 있다.

산포도는 자료의 분포에 대한 정보를 제공해 주는데 자료의 평균이 같다고 하더라도 산포도에 따라 자료의 내용이나 성질이 달라질 수 있다. 따라서 여러 자료들의 특성을 서로 비교하기 위해서는 평균뿐만 아니라 자료들이 평균으로부터 어떻게 흩어져 분포하고 있는가를 알 필요가 있다.

산포도

평균과 특정 자료값의 차이를 편차(deviation)라고 한다. 각각의 자료 값들은 평균값의 양 쪽에 위치하는데 편차는 각각의 자료값에서 평균값을 빼주는 것으로 계산하므로, 양수 혹은 음수 값을 갖게 된다. 특히 편차가 0인 자료값은 평균값이 된다. 편차의 절대값이 크면 그 값은 평균에서 멀리 떨어져 있음을 의미한다. 이 편차 들을 모두 합하면 항상 0이 된다.

따라서 단순히 편차들의 합은 산포도로 사용될 수 없어(∵ 합이 0이 되므로), 각각의 편차를 제곱하여 이를 산술 평균한 것이 분산(variance)이다. 편차부분을 제곱하기 때문에 양수 값인 편차와 음수 값인 편차가 상쇄되지 않아 합은 0이 되지 않는다.

분산편차를 제곱해 계산하기 때문에 실제 편차보다 큰 수치를 만들어내 체감 편차가 실제편차보다 크게 나온다는 단점이 있다. 따라서 이러한 문제 점을 없애기 위해서 분산에 제곱근을 씌워 값을 구한 것이 표준편차(편차를 제곱하고 다시 제곱근을 취하는 것으로 표준화 과정을 거친 값으로 이해하면 된다)이다. 표준편차(standard deviation)산포도를 나타내는 지표로 가장 널리 이용되고 있다. 표준편차가 크다면 이는 분포가 넓게 흩어져 있음을 나타낸다.

여러 집단 간의 산포도를 비교할 때 사용하는 것이 변이계수(변동계수, coefficient of variation, CV )이다. 변이 계수표준편차를 평균으로 나눈 값으로 상대표준편차( relative standard deviation, RSD )라고도 한다. 경우에 따라서는 100을 곱하여 퍼센트(%)로 나타낸다.

비교집단 자료들의 평균이 같다면 표준편차를 이용하여 산포도를 알 수가 있지만, 만약 평균이 다른 경우에는 산포도의 정도를 비교하기가 곤란해지므로 이때 변이계수를 사용하게 된다. 변이계수의 값이 클수록 상대적인 차이가 크다는 것을 의미한다.

예를 들어, A와 B 두 회사의 임금에 관하여 A사는 평균 250만원, 표준편차 25만 원이고, B사는 평균 320만 원, 표준편차 27만 원이라고 가정을 해보자. 표준편차만을 비교했을 때는 B사가 A사보다 커서 B사의 임금이 고르지 않은 것으로 보이지만, 두 회사의 임금 평균이 다르므로 단위평균에 대한 산포도인 변이계수를 계산해보면 A사는 10%(= 25만 원 ÷ 250만 원 × 100), B사는 8.44%(= 27만 원 ÷ 320만 원 × 100)이므로 임금은 A사가 더 고르지 않다는 것을 알 수 있다.

산포도 의 자세한 의미

Ezoic

report this ad

산포도 뜻

Ezoic

report this ad

초성이 같은 단어들

(총 46개) : 사파다, 사포도, 삯팔다, 산패도, 산편두, 산포대, 산포도, 산포두, 살피다, 살피듬, 살핏둑, 산포도 샐피다, 샴푸대, 설편도, 설푸다, 설픠다, 설피다, 성평등, 성풀다, 셰퍼드, 셰필드, 소편대, 소피대, 쇄파대, 수평대, 수평동, 술푸대, 스퍼드, 스펜더, 스피더, 스피드, 스핀들, 슬푸다, 슬프다, 시푸다, 시프다, 시피다, 식피도, 실파도, 실패담, 실푸다, 실프다, 심판단, 심판대, 새 폴더, 수풍 댐

실전 끝말 잇기

산으로 끝나는 단어 (3,728개) : 비페닐아세트산, 약정 체결 자산, 겐티아나 중조산, 시클로헵타코산, 역발산, 흑자 도산, 폴리인산, 청계산, 요오드아세트산, 아비산, 지각 출산, 무수 아류산, 일항 연산, 빼내기 연산, 두륜산, 고유 재산, 순액예산, 질산식류산, 소수성 아미노산, 평균 생산, 이성산, 소로트 생산, 사료용 인산, 지달산, 세공 확산, 기장 연산, 계렬생산, 소각 자산, 무고작산, 기본 행 연산, 산두곡산, 부개산, 자기청산, 재료 재고 자산, 포스핀산, 플루오르화 수소산, 사회 공헌 예산, 군북 광산, 카프르산, 실상산, 포름산, 진부화 자산, 단쇄 지방산, 아세트산, 피페린산, 역연산, 양철 낙하산, 가계 내 생산, 연결 연산, 오류 광산, 다중 정밀도 연산, 잡종 종자 생산, 굳기름산, 지아스타제 중조산, 북포태산, 릴레이셔널 연산, 섞인산, 근사계산, 소리 확산, 안산 .

도로 시작하는 단어 (5,018개) : 도, 도가, 도가(가) 뜨다, 도가니, 도가니강, 도가니로, 도가니유도로, 산포도 도가니 집게, 도가니탕, 도가락, 도가리, 도가머리, 도가사령, 도가 술, 도가시, 도가자류, 도가적 미술, 도가지, 도가지뚜껑, 도가풍, 도각, 도각되다, 도각 운동, 도각하다, 도간, 도간도간, 도간물리, 도간수, 도간지, 도갈린, 도갈뱀, 도감, 도감고, 도감관, 도감군, 산포도 도감당랑, 도감 당상, 도감독, 도감사, 도감전, 도감청, 도감청하다, 도감 포수, 도감 포수 마누라 오줌 짐작하듯, 도갑사, 도갑사 계곡, 도갑사 해탈문, 도갓술, 도갓집, 도갓집 강아지 같다, 도강, 도강경기, 도강나루, 도강록, 도강선, 도강세, 도강자, 산포도 도강 작전, 도강증, 도강파 .

시작 또는 끝이 같은 단어들

산으로 시작하는 단어 (3,781개) : 산, 산가, 산가꾸 문제, 산가단백질, 산가막살나무, 산가비, 산가상, 산가시, 산가야창, 산가 중홧값, 산가지, 산가지 놀이, 산가지치기, 산가쿠 문제, 산가태, 산각, 산각시취, 산간, 산간 도로, 산간 매립지, 산간벡지, 산간벡촌, 산간벽지, 산간벽촌, 산간 분지, 산간 빙하, 산간수, 산간요곡지, 산간 지대, 산간 지방, 산간 지역, 산간 평야, 산갈가마귀, 산갈래, 산갈매나무, 산갈치, 산갈칫과, 산갈퀴, 산갈퀴덩굴, 산감, 산감독, 산감수, 산감하다, 산갑, 산값, 산갓, 산갓사초, 산강, 산강재, 산개, 산개고사리, 산개구리, 산개나리, 산개 대형, 산개되다, 산개벚나무, 산개비, 산 개 새끼가 죽은 정승보다 낫다, 산개 성단, 산개쑥부쟁이 .

도로 끝나는 단어 (9,249개) : 등록금 제도, 서수 척도, 확률 밀도, 공융 온도, 군선도, 온습도, 감모도, 보정 해상도, 조도 균제도, 실태도, 유전자 빈도, 가족 관계 만족도, 호흡 속도, 표준유도도, 쇠퇴도, 층심도, 과학도, 송전선정전유도, 명시도, 배도, 복지 제도, 기술 복덕방 제도, 과도 안정도, 차동 감도, 전투적사격속도, 자살 기도, 기억 지도, 생장 온도, 리콜 제도, 결합도, 으래도, 투도, 완전 유도, 중첩도, 선택도, 세상읏어도, 외형도, 석조 부도, 최대 증식 허용 농도, 통신 속도, 수평 강도, 가변도, 오봉일월도, 가덕도, 과속도, 할증 스톡 옵션 산포도 제도, 촬상관 에너지 감도, 매개 변수 감도, 잔류 자속 밀도, 사용 가능도, 산학훈도, 신풍속도, ㅁ에도, 천마외도, 계산 안정도, 곧창자 요도, 요동반도, 팔각도, 뇌 조영도, 진찬도 .

🦉 이런 동물 속담도 있었네?

호랑이에 관한 속담

소라에 관한 속담

거미에 관한 속담

Ezoic

산포도 report this ad

2D 산포도

산포도는 x축과 y축이 다른 지표를 나타내는 그리드에 데이터 차원(예: 페이지 또는 도시)산포도 의 요소를 그래프로 표시합니다.

산포도는 서로 다른 두 지표에 의해 많은 수의 항목 간의 관계를 이해하려고 할 때 유용할 수 있습니다. 다음 예에서 산포도는 방문자 수와 각 유지 비율별로 각 도시를 산포도 보여줍니다.

산포도는 이상치를 빨리 볼 수 있도록 해줍니다. 예를 들어 Salt Lake 시는 방문자당 평균 유지 속도보다 높습니다.

산포도를 사용하여 데이터의 일관성을 표시할 수도 있습니다. 다음 예에서 산포도는 특정 길이의 세션이 있는 방문자의 수를 보여줍니다.

산포도의 각 지점의 크기는 반경 지표에 의해 결정됩니다. 기본 반경 지표는 각 Adobe 응용 프로그램에 대해 다릅니다. 예를 들어 Site에서 반경 지표는 기본적으로 세션을 기반으로 합니다. 반경 지표를 산포도 변경하여 산포도의 지점이 사용 가능한 지표를 나타내도록 할 수 있습니다. 이렇게 하는 단계는 반경 지표 변경 을 참조하십시오. 점의 색상은 작업 공간 내에 열려 있는 색상 범례를 기반으로 합니다. 색상 범례에 대한 산포도 자세한 내용은 색상 범례를 참조하십시오.

단일 점을 선택하려면

선택 영역에 다른 점 또는 점 그룹을 추가하려면

  • Ctrl 키를 누른 채로 점을 클릭하거나 Ctrl 키를 누른 채 여러 점을 드래그합니다.

선택 항목에서 점 또는 점 그룹을 제거하려면

  • Shift 키를 누른 상태에서 점을 클릭하거나 Shift 키를 누른 상태로 여러 점을 드래그합니다.

차원 변경 중

  • 그래프 맨 위에 있는 차원의 레이블을 마우스 오른쪽 단추로 클릭하고 Change Dimension >dimension name 를 클릭합니다.

지표 변경

산포도의 x축 또는 y축에 표시된 지표를 변경하려면

  • 변경할 지표의 레이블을 마우스 오른쪽 단추로 클릭하고 Change Metric >metric name 를 클릭합니다.

반경 지표 변경

산포도의 반경 지표를 변경하려면

그래프 맨 산포도 위에 있는 차원의 레이블을 마우스 오른쪽 단추로 클릭하고 Change Radius Metric > metric name 를 클릭합니다.


0 개 댓글

답장을 남겨주세요