Logo lv.boatexistence.com

Kādi ir trūkumi, ja trūkstošās vērtības tiek attiecinātas ar vidējo?

Satura rādītājs:

Kādi ir trūkumi, ja trūkstošās vērtības tiek attiecinātas ar vidējo?
Kādi ir trūkumi, ja trūkstošās vērtības tiek attiecinātas ar vidējo?

Video: Kādi ir trūkumi, ja trūkstošās vērtības tiek attiecinātas ar vidējo?

Video: Kādi ir trūkumi, ja trūkstošās vērtības tiek attiecinātas ar vidējo?
Video: Reģionālo semināru cikls, 02 12 2015 seminārs VARAM telpās 2024, Maijs
Anonim

Vidējā imputācija izkropļo attiecības starp mainīgajiemBet vidējā imputācija arī izkropļo daudzfaktoru attiecības un ietekmē statistiku, piemēram, korelāciju. Piemēram, šis PROC CORR izsaukums aprēķina korelāciju starp mainīgo Orig_Height un mainīgajiem Svars un Vecums.

Kāpēc trūkstošo datu izmantošana ir slikta ideja?

Vidējā samazina datu dispersiju Iedziļinoties matemātikā, mazāka dispersija noved pie šaurāka ticamības intervāla varbūtības sadalījumā[3]. Tas nerada neko citu kā neobjektivitātes ieviešanu mūsu modelī.

Kāpēc trūkstošās vērtības rada problēmas?

Trūkstošie dati rada dažādas problēmas. Pirmkārt, datu trūkums samazina statistisko jaudu, kas attiecas uz varbūtību, ka tests noraidīs nulles hipotēzi, ja tā ir nepatiesa. Otrkārt, zaudētie dati var izraisīt novirzes parametru novērtējumā. Treškārt, tas var samazināt paraugu reprezentativitāti.

Kāpēc slikta piedēvēšana ir slikta?

1. problēma: vidējā imputācija nesaglabā attiecības starp mainīgajiem. Tiesa, vidējā piedēvēšana saglabā novēroto datu vidējo vērtību. Tātad, ja datu trūkst pilnīgi nejauši, vidējā aprēķins paliek objektīvs.

Vai trūkstošos datus aizstāt ar vidējo?

Ārējo datu punktiem būs būtiska ietekme uz vidējo, un tāpēc šādos gadījumos nav ieteicams izmantot vidējo, lai aizstātu trūkstošās vērtības. Izmantojot vidējās vērtības, lai aizstātu trūkstošās vērtības, iespējams, nevar izveidot lielisku modeli, un tāpēc tas tiek izslēgts.

Ieteicams: