전체 글213 통계적 추정 #1 - 표본평균의 평균, 분산, 표준편차 - 개요 : 표본조사의 필요성 - '한국사람의 키의 평균'을 구하고싶으면 현재 한국 인구 5천만명이 넘는 사람의 키를 전부 조사해야한다. 이는 너무 비효율적이며 코로나 백신처럼 국가적인 도움이 없다면 사실상 불가능한 방법이다. 따라서 우리가 할수 있는 방법은 적당히 지나가는 100명정도를 잡아서 키를 조사한다음 그것을 분석하고 그 분석된것을 토대로 전체 평균을 '추정' 하는 방법이다. 즉 '전체 집단'을 조사하기엔 너무 수가 많으니 전체 집단을 조사하는게 아니라 일부를 '추출'해서 그 추출된 '표본'을 조사한다음 이걸로 '추정' 하는것이다. 그래서 이 단원의 이름이 '통계적 추정' 인 것이다. - 여러가지 용어 - 바로 위에서 예로 들었던것을 그대로 가져와보겠다. 조사하고자 하는것 : 한국 사람의 키의 .. 2021. 12. 20. 확률분포 #5 - 정규분포와 이항분포의 관계 여기는 사실상 대부분의 내용이 그냥 그렇게 알려져 있습니다. 증명은 고등학교과정이 아닙니다. 그냥 외우십시오. 하는 식이기 때문에 사실상 암기하는 부분이다. 확통, 특히 통계는 수학치고 암기할게 좀 많다. - 정규분포와 이항분포의 관계 - 주제 자체가 좀 의아할것이다. 이항분포는 '이산확률분포'이고 정규분포는 '연속확률분포'이다. 한 번의 시행에서 사건 A가 일어날 확률을 p라고 하고, 일어나지 않을 확률을 q라고 하겠다. 각각의 시행은 독립시행이고, 이 시행을 n번 반복하면 여기서 사건 A가 일어나는 횟수가 바로 이항분포에서의 확률변수 X이다. 여기까진 복습이다. 근데 이 확률변수 X는 이항분포에서 시행 횟수인 n이 충분히 커지면, 근사적으로 정규분포를 따른다. 증명은 아까도 말했듯 고등수학 수준이 아.. 2021. 12. 17. 확률분포 #4 - 정규분포의 표준화 - 표준화의 필요성 - 정규분포가 뭔지는 알았고 쓰는법도 조금 알았는데 아직 뭔가 부족하다. 왜인지 천천히 설명해보겠다. 지금부터 확률변수 X의 값을 변화시켜보겠다. 우선 위의 정규분포에서 평균이 10, 표준편차가 2 라고 해보자. 즉 X는 정규분포 N(10, 2²) 를 따른다. 여기서 핵심은 X값을 아무리 변화시켜도 m과 σ는 변하지 않는다. 변하는건 σ 앞에 붙어있는 숫자 즉 σ의 계수 뿐이다. 따라서 X값을 나타낼 때 m과 σ를 매번 써주는건 비효율적이다. 평균값에서 얼마나 떨어져있는지만 알면 되는거다. 즉 X가 m+kσ 형태니까 k값만 알면 되는거다. 그니까 k값만 가지고도 X값이 표현되니까 일일이 m, σ 적고있지 말고 간단하게 쓰자 이거다. 따라서 이때 해주는게 '표준화'이다. - 표준화 - .. 2021. 12. 17. 확률분포 #3 - 정규분포의 정의 고등수학 통계학의 본체이다. - 현재까지 배운 확률밀도함수에서의 한계 - 이전의 확률밀도함수 글에 있는 예제문제의 그래프를 그대로 가져온거다. 근데 보통 사회현상에 대해 조사한다음 집계하면 절대 그래프가 저렇게 직선으로 그려지지 않는다. 저 문제에서 직선으로 준 이유는 원래대로 곡선을 그려주면 계산을 못하게되니까 그냥 직선으로 준거다. 즉 우리가 여태 공부한걸로는 사회현상에 대해 통계적으로 분석하는데 한계가 있다. 확률밀도함수가 웬만하면 곡선형태로 나올텐데 우리는 복잡하게생긴 곡선의 정적분을 배우지 않았기 때문이다. - 정규분포의 정의 - 실제로 사회현상에 대해 조사했다고 해보자. 예를 들어 사람의 키를 조사했다고 해보자. 사람의 키의 평균이 170cm라 하면 대충 170cm 근처에 가장 많고 170cm.. 2021. 12. 17. 연속확률분포와 확률밀도함수 - 연속확률분포와 연속확률변수 - 우리가 지금까지 한건 다 이산확률분포이다. 확률변수 X가 연속이 아니기 때문이다. 이산확률분포의 '이산'은 이산가족의 이산과 같은뜻이다. 서로 떨어져있다는 뜻이다. 즉 '이산'의 반대말은 '연속'이다. 근데 확률변수 X가 무조건 연속이 아닌걸까? 그니까 확률변수 X가 '연속'이면 어떻게 해야하느냐를 이번에 공부하는것이다. 예를 들어, 누군가에게 '키'가 몇이냐 물으면 대충 170cm라고 할텐데 그게 정확히 170cm인가? 170.3cm 일수도 있고 170.12398cm 일수도 있고 170.0001cm 일수도 있고 169.834832cm 일수도 있고 정확히 재기는 사실상 불가능한거 아닌가? 즉 '사람의 키' 라는 자료를 '정확히' 170cm라고 말할수 있는가? 당연히 아니.. 2021. 12. 16. 확률분포 #2 - 이항분포 - 이항분포 - 독립시행의 확률을 복습해보자. 주사위를 10번 던졌을때, 6의 눈이 3번 나올 확률은? 이 글은 독립시행의 확률을 구하는 글이 아니니까 그냥 답을 보여주겠다. 혹시 이것도 못구한다면 지금 통계 공부할때가 아니다. 독립시행의 확률부터 공부하고 오자. 근데 여기서 제시된 숫자중 가장 눈에 띄는것은 무엇인가? 6의 눈이 나오는 횟수인 '3' 아닌가? 그리고 이 나오는 '횟수'라는건 어떻게 보면 '변량' 아닌가? 그럼 이 횟수를 확률변수 X로 잡아버린다면? 주사위를 10번 던졌을때, 6의 눈이 나오는 횟수를 X라 하자. 그럼 이때의 확률분포표를 작성하면 딱봐도 문제가 많다. 이걸 어느세월에 하나? 게다가 이걸 분석하려면 평균, 분산, 표준편차까지 구해야하는데 이걸 정말 하나하나 구할건가? 지금은.. 2021. 12. 14. 이전 1 ··· 13 14 15 16 17 18 19 ··· 36 다음