Статистика ұзақ уақыт бойы өмірдің ажырамас бөлігі болды. Адамдар онымен барлық жерде кездеседі. Статистикалық мәліметтерге сүйене отырып, қай жерде және қандай аурулар жиі кездесетіні, белгілі бір аймақта немесе халықтың белгілі бір бөлігінде ненің сұранысқа ие екендігі туралы қорытындылар жасалады. Тіпті мемлекеттік органдарға кандидаттардың саяси бағдарламаларын құрастыру да статистикалық мәліметтерге негізделген. Оларды бөлшек сауда желілері де тауарларды сатып алу кезінде пайдаланады және өндірушілер өз ұсыныстарында осы деректерді басшылыққа алады.
Статистика қоғам өмірінде маңызды рөл атқарады және оның әрбір жеке мүшесіне, тіпті кішкентай нәрселерге де әсер етеді. Мысалы, егер статистикаға сәйкес, адамдардың көпшілігі белгілі бір қалада немесе аймақта киімдегі қою түстерді ұнататын болса, онда жергілікті сауда нүктелерінен гүлді баспасы бар ашық сары пальто табу өте қиын болады. Бірақ қандай мөлшердебұл деректер қосылып, осындай әсер ете ме? Мысалы, «статистикалық маңызды» деген не? Бұл анықтама нақты нені білдіреді?
Бұл не?
Статистика ғылым ретінде әртүрлі шамалар мен ұғымдардың жиынтығынан тұрады. Солардың бірі – «статистикалық маңыздылық» ұғымы. Бұл айнымалы мәндердің атауы, басқа көрсеткіштердің пайда болу ықтималдығы болымсыз.
Мысалы, жаңбырлы түннен кейін күзгі орманда саңырауқұлақтар үшін таңғы серуенде 10 адамның 9-ы аяқтарына резеңке аяқ киім киеді. Бір кездері олардың 8-інің кенеп мокасиндерін кию ықтималдығы шамалы. Осылайша, осы нақты мысалда 9 саны «статистикалық маңыздылық» деп аталады.
Сәйкесінше, берілген практикалық мысалды әрі қарай дамытатын болсақ, аяқ киім дүкендері резеңке етіктерді жаз маусымының соңына қарай жылдың басқа уақыттарына қарағанда көбірек сатып алады. Осылайша, статистикалық мәннің шамасы қарапайым өмірге әсер етеді.
Әрине, күрделі есептеулерде, айталық, вирустардың таралуын болжау кезінде айнымалылардың көп саны ескеріледі. Бірақ статистикалық деректердің маңызды көрсеткішін анықтаудың мәні есептеулердің күрделілігіне және тұрақты емес мәндердің санына қарамастан ұқсас.
Ол қалай есептеледі?
Теңдеудің «статистикалық маңыздылық» көрсеткішінің мәнін есептеу кезінде қолданылады. Яғни, бұл жағдайда барлығын математика шешеді деуге болады. Ең қарапайым есептеу опциясы келесі параметрлер қатысатын математикалық операциялар тізбегі болып табылады:
- сауалнамалардан немесе объективті деректерді зерттеуден алынған нәтижелердің екі түрі, мысалы, а және b арқылы белгіленген сатып алу сомасы;
- екі топ үшін үлгі өлшемі көрсеткіші – n;
- біріктірілген үлгі үлесінің мәні - p;
- стандартты қате - SE.
Келесі қадам тестілеудің жалпы балын анықтау болып табылады - t, оның мәні 1,96 санымен салыстырылады.1,96 Студенттің t-тарату функциясына сәйкес 95% диапазонды жеткізетін орташа мән.
n және p мәндерінің айырмашылығы неде деген сұрақ жиі туындайды. Бұл нюансты мысалмен түсіндіру оңай. Ерлер мен әйелдердің өнімге немесе брендке деген адалдығының статистикалық маңыздылығын есептедік делік.
Бұл жағдайда әріптерден кейін келесілер болады:
- n - респонденттердің саны;
- p - өнімге қанағаттанғандар саны.
Бұл жағдайда сұралған әйелдер саны n1 ретінде белгіленеді. Сәйкесінше, ерлер – n2. Дәл осындай мәнде p символының "1" және "2" сандары болады.
Тест ұпайын Студенттің электрондық кестелерінің орташа мәнімен салыстыру "статистикалық маңыздылық" деп аталады.
Тексеру деген нені білдіреді?
Кез келген математикалық есептің нәтижелерін әрқашан тексеруге болады, бұл балаларға бастауыш мектепте оқытылады. Болжау қисындыстатистика есептеулер тізбегі арқылы анықталғандықтан, олар тексеріледі.
Алайда статистикалық маңыздылықты тексеру тек математика емес. Статистика айнымалылар мен әртүрлі ықтималдықтардың үлкен санымен айналысады, олар әрқашан есептеуге қолайлы емес. Яғни, мақаланың басында келтірілген резеңке аяқ киім үлгісіне оралатын болсақ, онда дүкендерге арналған тауарларды сатып алушылар сенім артатын статистикалық деректердің логикалық құрылымын құрғақ және ыстық ауа-райы бұзуы мүмкін, бұл әдеттегідей емес. күз. Осы құбылыстың салдарынан резеңке етік алатындар саны азайып, сауда нүктелері шығынға ұшырайды. Әрине, математикалық формула ауа райының ауытқуын болжай алмайды. Бұл сәт «қате» деп аталады.
Бұл тек осындай қателердің ықтималдығы және есептелген маңыздылық деңгейін тексеруді ескереді. Ол есептелген көрсеткіштерді де, қабылданған маңыздылық деңгейлерін де, сондай-ақ шартты түрде гипотеза деп аталатын шамаларды ескереді.
Маңыздылық деңгейі қандай?
«Деңгей» ұғымы статистикалық маңыздылықтың негізгі критерийлеріне енгізілген. Ол қолданбалы және практикалық статистикада қолданылады. Бұл ықтимал ауытқулар немесе қателер ықтималдығын ескеретін мән түрі.
Деңгей дайын үлгілердегі айырмашылықтарды анықтауға негізделген, олардың маңыздылығын немесе керісінше кездейсоқтығын орнатуға мүмкіндік береді. Бұл ұғымның тек сандық мағыналары ғана емес, сонымен бірге олардың өзіндік интерпретациялары да бар. Олар түсіндіредімәнді қалай түсіну керек, ал деңгейдің өзі нәтижені орташа көрсеткішпен салыстыру арқылы анықталады, бұл айырмашылықтардың сенімділік дәрежесін көрсетеді.
Осылайша, біз деңгей ұғымын жай ғана елестете аламыз - бұл қабылданған статистикалық деректерден жасалған қорытындылардағы қолайлы, ықтимал қате немесе қателік көрсеткіші.
Қандай маңыздылық деңгейлері пайдаланылады?
Тәжірибедегі қателік ықтималдық коэффициенттерінің статистикалық маңыздылығы үш негізгі деңгейге негізделген.
Бірінші деңгей – бұл мән 5% болатын шек. Яғни, қателік ықтималдығы 5% маңыздылық деңгейінен аспайды. Бұл статистикалық зерттеу деректері негізінде жасалған тұжырымдардың мінсіздігі мен қатесіздігіне сенімділік 95% дегенді білдіреді.
Екінші деңгей - 1% шек. Сәйкесінше, бұл көрсеткіш статистикалық есептеулер кезінде 99% сенімділікпен алынған мәліметтерді басшылыққа алуға болатынын білдіреді.
Үшінші деңгей - 0,1%. Бұл мәнмен қате ықтималдығы пайыздың бөлігіне тең, яғни қателер іс жүзінде жойылады.
Статистикадағы гипотеза дегеніміз не?
Тұжырымдама ретінде қателер нөлдік гипотезаны қабылдау немесе қабылдамауға қатысты екі салаға бөлінеді. Гипотеза – анықтамаға сәйкес сауалнама нәтижелерінің, басқа деректердің немесе мәлімдемелердің жиынтығы жасырылған ұғым. Яғни, статистикалық есеп пәніне қатысты бір нәрсенің ықтималдық үлестірімінің сипаттамасы.
Қарапайым есептеулерде екі гипотеза бар - нөлдік және балама. Олардың арасындағы айырмашылық мынада: нөлдік гипотеза статистикалық маңыздылықты анықтауға қатысатын үлгілер арасында түбегейлі айырмашылықтар жоқ деген идеяға негізделген, ал альтернативті гипотеза оған мүлдем қарама-қайшы. Яғни, баламалы гипотеза осы үлгілерде айтарлықтай айырмашылықтың болуына негізделген.
Қандай қателіктер бар?
Статистикадағы концепция ретіндегі қателер сол немесе басқа гипотезаны шындық деп қабылдауға тура пропорционалды. Оларды екі бағытқа немесе түрге бөлуге болады:
- бірінші түрі дұрыс емес болып шыққан нөлдік гипотезаны қабылдауға байланысты;
- секунд - баламаны орындаудан туындады.
Қатенің бірінші түрі жалған позитивті деп аталады және статистика қолданылатын барлық салаларда жиі кездеседі. Сәйкесінше, екінші түрдегі қате жалған теріс деп аталады.
Статистикадағы регрессия не үшін қажет?
Регрессияның статистикалық маңыздылығы мынада: оның көмегімен мәліметтер негізінде есептелген әртүрлі тәуелділіктер моделінің шындыққа қаншалықты сәйкес келетінін анықтауға болады; есепке алу және қорытынды жасау үшін факторлардың жеткіліктілігін немесе жетіспеушілігін анықтауға мүмкіндік береді.
Регрессия мәні нәтижелерді Фишер кестелерінде берілген деректермен салыстыру арқылы анықталады. Немесе дисперсияны талдау арқылы. Регрессия көрсеткіштері маңызды болған кездекөп айнымалылар, кездейсоқ деректер және ықтимал өзгерістерді қамтитын күрделі статистикалық зерттеулер мен есептеулер.