Гаднах байдлыг хэрхэн илрүүлэх вэ: 10 алхам (зурагтай)

Агуулгын хүснэгт:

Гаднах байдлыг хэрхэн илрүүлэх вэ: 10 алхам (зурагтай)
Гаднах байдлыг хэрхэн илрүүлэх вэ: 10 алхам (зурагтай)

Видео: Гаднах байдлыг хэрхэн илрүүлэх вэ: 10 алхам (зурагтай)

Видео: Гаднах байдлыг хэрхэн илрүүлэх вэ: 10 алхам (зурагтай)
Видео: ГУАЛИГ ХАРАГДАХ НУУЦ 🤫 МAYKA VLOG Монгол эмэгтэй 2024, May
Anonim

Статистикийн хувьд гадуур эсвэл "гадуур" гэдэг нь дээж эсвэл өгөгдлийн багц дахь бусад өгөгдлөөс маш хол зөрүүтэй өгөгдөл юм (өгөгдлийн багцыг өгөгдөл гэж нэрлэдэг). Ихэнх тохиолдолд өгөгдлийн цэгийн гаднах хэсэг нь статистикчдад хэмжилт хийх явцад гарсан хэвийн бус байдал эсвэл туршилтын алдааны талаархи анхааруулга болж өгдөг бөгөөд энэ нь статистикчийг өгөгдлийн цэгээс гадуурх хэсгийг хасахад хүргэдэг. Хэрэв статистикч өгөгдлийн багцаас илүү гарсан мэдээллийг хассан бол судалгаанаас гаргасан дүгнэлт нь маш өөр байж болно. Тиймээс, статистик өгөгдлийн багцыг зөв ойлгохын тулд гаднах утгыг хэрхэн тооцоолох, дүн шинжилгээ хийх нь маш чухал юм.

Алхам

Илүүдэл тоог тооцоолох 1 -р алхам
Илүүдэл тоог тооцоолох 1 -р алхам

Алхам 1. Боломжгүй өгөгдлийн цэгүүдийг хэрхэн тодорхойлох талаар олж мэдэх

Мэдээллийн цэгээс гадагшаа гарсан дата цэгүүдийг устгах эсэхээ шийдэхийн өмнө мэдээж ямар өгөгдлийн цэгүүд илүү гарах боломжтой болохыг тодорхойлох ёстой. Ерөнхийдөө гадуурх цэг бол нэг өгөгдлийн багц дахь бусад өгөгдлүүдээс маш хол хазайсан өгөгдөл юм, өөрөөр хэлбэл гадуурх цэг нь бусад өгөгдлийн тооноос "гаднаа" байдаг. Өгөгдлийн хүснэгт эсвэл (ялангуяа) график дээр гарсан зөрүүг илрүүлэх нь ихэвчлэн хялбар байдаг. Хэрэв нэг өгөгдлийн багцыг графикаар дүрслэн харуулсан бол бусад өгөгдлийн цэгүүдээс "маш хол" мэт харагдах болно. Жишээлбэл, өгөгдлийн цэгийн ихэнх цэгүүд шулуун шугам үүсгэдэг бол гаднах цэг нь энэ шугамыг үүсгэсэн гэж тайлбарлахгүй.

Өрөөн доторх 12 өөр объектын температурыг харуулсан өгөгдлийн багцыг авч үзье. Хэрэв 11 объект 70 градус Фаренгейт (21 градус) орчим температуртай бол 12 дахь объект болох зуух нь 300 Фаренгейт (150 градус) температуртай бол зуухны температур маш өндөр байх магадлалтай байгааг шууд харж болно. гадуурх

Илүүдэл тоог тооцоолох 2 -р алхам
Илүүдэл тоог тооцоолох 2 -р алхам

Алхам 2. Өгөгдлийн цэгүүдийг хамгийн доод цэгээс хамгийн дээд цэг хүртэл цэгцлэх

Өгөгдлийн цэгийн гаднах утгыг тооцоолох эхний алхам бол тухайн өгөгдлийн багцын медиан (дунд утга) -ийг олох явдал юм. Өгөгдлийн багц дахь өгөгдлүүдийг хамгийн багаас том хүртэл нь цэгцэлсэн тохиолдолд энэ даалгавар маш энгийн болно. Тиймээс үргэлжлүүлэхийн өмнө өгөгдлийн цэгүүдийг нэг ийм цэгийн багцад байрлуул.

Дээрх жишээг үргэлжлүүлье. Энэ бол өрөөн доторх хэд хэдэн объектын температурыг илэрхийлсэн манай мэдээллийн багц юм: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Хэрэв бид өгөгдлийн цэгүүдийг хамгийн доод цэгээс хамгийн өндөр хүртэл нь цэгцлэх юм бол өгөгдлийн цэгүүдийн дараалал дараах байдалтай болно: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}

Илүүдэл тоог тооцоолох 3 -р алхам
Илүүдэл тоог тооцоолох 3 -р алхам

Алхам 3. Өгөгдлийн цэгийн медианыг тооцоол

Өгөгдлийн цэгийн медиан нь өгөгдлийн цэгийн нөгөө тал нь тухайн цэгийн дээгүүр, үлдсэн тал нь түүний доор байх үндсэн цэг юм. Хэрэв өгөгдлийн цэгийн тоонуудын тоо сондгой байвал түүнийг олоход маш хялбар байдаг - медиан нь дээрх ба доор нь ижил тоотой өгөгдөл юм. Гэсэн хэдий ч, өгөгдлийн багц дахь дата цэгүүдийн тоо тэгш байвал дунд нь нэг ч хүн багтахгүй тул дундах 2 цэгийг дунджаар дундаж утгыг олох болно. Гадна утгыг тооцоолохдоо Q2-ni хувьсагчийг ихэвчлэн Q2-ni хуваадаг гэдгийг тэмдэглэх нь зүйтэй бөгөөд учир нь Q2 нь доод ба дээд дөрөвний Q1 ба Q3 хооронд байдаг бөгөөд үүнийг дараа хэлэлцэх болно.

  • Өгөгдлийн цэгүүдийн тоо жигд байдаг өгөгдлийн багцтай андуурч болохгүй-2 дунд цэгийн дундаж нь ихэвчлэн өгөгдлийн багцад ороогүй тоог буцааж өгдөг-энэ зүгээр юм. Гэсэн хэдий ч хэрэв 2 дунд өгөгдөл ижил тоо байвал дундаж нь мэдээж ижил тоо байх болно, энэ нь бас зүгээр юм.
  • Дээрх жишээнд бидэнд 12 өгөгдөл байна. Хоёр дунд цэг нь 6 ба 7-р цэгүүд-70 ба 71 тус тус байна. Тиймээс манай мэдээллийн сангийн дундаж нь эдгээр 2 тооны дундаж юм: ((70 + 71) / 2), = 70.5.
Гаднах утгыг тооцоолох 4 -р алхам
Гаднах утгыг тооцоолох 4 -р алхам

Алхам 4. Доод дөрвөлийг тооцоол

Q1 хувьсагчид өгдөг энэ утга нь өгөгдлийн цэгүүдийн 25 хувийг (эсвэл дөрөвний нэгийг) илэрхийлдэг. Өөрөөр хэлбэл, энэ нь медианаас доогуур байгаа цэгүүдийг хоёр хуваасан өгөгдөл юм. Хэрэв медианаас доогуур тоонуудын тоо тэнцүү байвал та дундаасаа 2 цэгийг дунджаар Q1 -ийг олох хэрэгтэй, яг л медианаг өөрөө олох болно.

Бидний жишээн дээр медиан дээр байрлах 6 өгөгдөл, медиан доогуур 6 датум байна. Энэ нь доод квартилийг олохын тулд бид медианаас доогуур 6 өгөгдлийн дунд байгаа 2 цэгийг дунджаар тодорхойлох шаардлагатай болно гэсэн үг юм. Дундажаас доогуур 6 өгөгдлийн 3, 4 -р цэгүүд нь хоёулаа 70. Тиймээс дундаж нь ((70 + 70) / 2), = 70. 70 нь бидний 1 -р улирал болно.

Гаднах утгыг тооцоолох 5 -р алхам
Гаднах утгыг тооцоолох 5 -р алхам

Алхам 5. Дээд квартилийг тооцоол

Q3 хувьсагчид өгдөг энэ утга нь өгөгдлийн багц дахь өгөгдлийн цэгүүдийн 25 хувь байдаг. Q3 -ийг олох нь Q1 -ийг олохтой бараг адилхан, гэхдээ энэ тохиолдолд бид медианаас доогуур биш медиан дээрх өгөгдлийг харж байна.

Дээрх жишээг үргэлжлүүлбэл медиан дээрх 6 өгөгдлийн дунд байгаа 2 цэг нь 71 ба 72 байна. Эдгээр 2 өгөгдлийн дундаж нь ((71 + 72)/2), = 71, 5. 71, 5 бол манай 3 -р улирал.

Гаднах утгыг тооцоолох 6 -р алхам
Гаднах утгыг тооцоолох 6 -р алхам

Алхам 6. Квартир хоорондын зайг ол

Одоо бид Q1 ба Q3 -ийг олсон тул эдгээр хоёр хувьсагчийн хоорондын зайг тооцоолох хэрэгтэй. Q1 -ээс Q3 хүртэлх зайг Q3 -аас Q1 -ийг хасах замаар олно. Дөрвөлжин хоорондын зайд олж авсан утгууд нь таны өгөгдлийн багц дахь гаднах бус цэгүүдийн хил хязгаарыг тодорхойлоход маш чухал юм.

  • Бидний жишээн дээр Q1 ба Q3 гэсэн утгууд маань 70 ба 71, 5. Квартир хоорондын зайг олохын тулд Q3 - Q1 = 71.5 - 70 = хасна. 1, 5.
  • Q1, Q3 эсвэл хоёулаа сөрөг тоо байсан ч энэ нь бас үнэн гэдгийг тэмдэглэх нь зүйтэй. Жишээлбэл, хэрэв бидний 1 -р улирлын утга -70 байсан бол бидний хоорондох зөв зай 71.5 -(-70) = 141, 5 байх болно.
Алдааг тооцоолох Алхам 7
Алдааг тооцоолох Алхам 7

Алхам 7. Өгөгдлийн цэгээс "дотоод хашаа" -ыг олоорой

Өгөгдөл нь "дотоод хашаа" ба "гаднах хашаа" гэж нэрлэгддэг тоонуудын хязгаарт багтах эсэхийг шалгах замаар гадуурх зүйлсийг олж илрүүлдэг. Өгөгдлийн цэгийн дотоод хашааны гадна унасан цэгийг "бага зэрэг гадагшлуулах" гэж нэрлэдэг бол гадна талын хашааны гадна унасан цэгийг "томоохон гадагш гаргах" гэж нэрлэдэг. Өгөгдлийн цэгийн дотор талын хашааг олохын тулд эхлээд дундын зайг 1, 5 -аар үржүүлээд үр дүнг Q3 -аар нэмээд Q1 -ээс хасна уу. Таны олж авсан хоёр утга бол өгөгдлийн цэгийн дотоод хашааны хил юм.

  • Манай жишээн дээр квартал хоорондын зай нь (71.5 - 70) буюу 1.5 байна. 1.5 -ыг 1.5 -аар үржүүлсний үр дүнд 2.25 болно. Бид энэ тоог Q3 дээр нэмээд Q1 -ийг энэ тоогоор хасаад дотоод хашааны хил хязгаарыг дараах байдлаар олно.

    • 71, 5 + 2, 25 = 73, 75
    • 70 - 2, 25 = 67, 75
    • Тиймээс бидний дотоод хашааны хил хязгаар нь юм 67, 75 ба 73, 75.
  • Манай багцад зөвхөн зуухны температур 300 Фаренгейт нь эдгээр хязгаараас давсан тул энэ өгөгдөл нь бага зэрэг гадуур юм. Гэсэн хэдий ч бид энэ температур гол ялгаа байгаа эсэхийг тооцоолоогүй хэвээр байгаа тул тооцоололоо хийж дуустал дүгнэлт хийх хэрэггүй.

    Гаднах утгыг тооцоолох 7 -р алхамBullet2
    Гаднах утгыг тооцоолох 7 -р алхамBullet2
Илүүдэл тоог тооцоолох 8 -р алхам
Илүүдэл тоог тооцоолох 8 -р алхам

Алхам 8. Өгөгдлийн цэгээс "гаднах хашаа" -г олоорой

Энэ нь дотоод хашааг олохтой ижил аргаар хийгддэг бөгөөд зөвхөн үе хоорондын зайг 1.5 биш 3 -аар үржүүлж үр дүнг Q3 дээр нэмээд Q1 -ээс хасч гадна талын хашааны дээд ба доод хязгаарыг олно.

  • Бидний жишээн дээр квартал хоорондын зайг 3 -аар үржүүлэх нь (1, 5 x 3), эсвэл 4, 5 -ийг өгдөг. Бид гаднах хашааны хил хязгаарыг өмнөхтэй адил аргаар олдог.

    • 71, 5 + 4, 5 = 76
    • 70 - 4, 5 = 65, 5
    • Гадна хашааны хил хязгаар нь 65.5 ба 76.
  • Гадна хашааны хилийн гадна байрладаг өгөгдлийн цэгүүдийг гол гадуурх гэж нэрлэдэг. Энэ жишээнд зуухны температур 300 Фаренгейт нь гаднах хашааны гадна талд байгаа нь тодорхой байгаа тул энэ өгөгдөл нь "мэдээжийн хэрэг" гол үзүүлэлт юм.

    Гаднах утгыг тооцоолох 8 -р алхамBullet2
    Гаднах утгыг тооцоолох 8 -р алхамBullet2
Алдааг тооцоолох Алхам 9
Алдааг тооцоолох Алхам 9

Алхам 9. Чанарын үнэлгээг ашиглан гадны өгөгдлийг "хаях" эсэхийг тодорхойлох

Дээр тайлбарласан аргыг ашиглан өгөгдлийн цэг нь жижиг өгөгдөл, томоохон цэг эсвэл огт өөр зүйл биш эсэхийг тодорхойлж болно. Гэсэн хэдий ч алдаа гаргахгүй - өгөгдлийг гадна талаас нь олох нь өгөгдлийг "хаях ёстой" цэг биш харин өгөгдлийн багцаас хасах "нэр дэвшигч" гэж тэмдэглэнэ. Өгөгдлийн цэгийн бусад өгөгдлүүдээс гадагш гарах цэгийг хазайлгахад хүргэдэг "шалтгаан" нь үүнийг хаях эсэхээ тодорхойлоход маш чухал юм. Ерөнхийдөө хэмжилт, бичлэг хийх эсвэл туршилтын төлөвлөлтийн алдаанаас үүдэлтэй гадуур зүйлийг хаяж болно. Нөгөөтэйгүүр, алдаанаас үүдэлтэй, урьд өмнө таамаглаагүй шинэ мэдээлэл, чиг хандлагыг харуулсан гадуурхагуудыг ихэвчлэн “хаядаггүй”.

  • Анхаарах өөр нэг шалгуур бол өгөгдлийн цэгийн дундаж утгад гадны нөлөө их байгаа эсэх, өөрөөр хэлбэл гадуур хүн үүнийг андуурч эсвэл буруу харагдуулж байгаа эсэх юм. Хэрэв та өгөгдлийн багцынхаа дунджаас дүгнэлт хийх гэж байгаа бол үүнийг анхаарч үзэх нь маш чухал юм.
  • Бидний жишээг судалж үзье. Энэхүү жишээн дээр, урьдчилан таамаглах аргагүй байгалийн хүчээр зуух 300 Фаренгейт хүрсэн нь "маш өндөр" байж боломгүй мэт санагдаж байгаа тул зуухыг санамсаргүйгээр асаасан нь өндөр температурын өгөгдлийн хэвийн бус байдалд хүргэсэн гэж бараг баталгаатай дүгнэж болно. Түүнчлэн, хэрэв бид гадуур зүйлсийг арилгахгүй бол бидний тогтоосон дундаж утга нь (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300)/12 = 89.67 Фаренгейт (Цельсийн 32 градус)), хэрэв бид гаднах хэсгүүдийг хасвал дундаж нь (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 71 + 72 + 73)/11 = 70.55 Фаренгейт (Цельсийн 21 градус) байна.

    Эдгээр гадагшлах хүчин зүйлүүд хүний буруутай үйлдлээс үүдэлтэй бөгөөд өрөөний дундаж температур ойролцоогоор 90 градус Фаренгейт (32 градус) хүрдэг гэж хэлэх нь буруу байх тул бид гадуур байгаа бүтээгдэхүүнээ "хаях" нь дээр

Гаднах утгыг тооцоолох 10 -р алхам
Гаднах утгыг тооцоолох 10 -р алхам

Алхам 10. Гаднах байдлыг хадгалахын ач холбогдлыг (заримдаа) мэддэг байх

Хэдийгээр алдаа гаргасан ба/эсвэл үр дүнг буруу эсвэл алдаатай болгодог тул зарим гадуурх цэгүүдийг өгөгдлийн цэгээс хасах ёстой боловч зарим алдааг хадгалах ёстой. Хэрэв жишээ нь, гадны хүн байгалиас олж авсан юм шиг санагддаг (энэ нь алдааны үр дүн биш юм) ба/эсвэл судалж буй үзэгдлийн талаар шинэ өнцгөөс харах боломжийг олгодог бол гадны зүйлийг дата цэгээс хасах ёсгүй. Шинжлэх ухааны судалгаа нь ихэвчлэн гадуурхтай холбоотой маш эмзэг нөхцөл байдаг - гадуурхыг буруу хасах нь шинэ чиг хандлага, нээлтийг илтгэсэн мэдээллийг хаях гэсэн үг юм.

Жишээлбэл, бид загасны цөөрөм дэх загасны хэмжээг нэмэгдүүлэх шинэ эмийг зохион бүтээж байна гэж бодъё. Бид хуучин өгөгдлийн багцаа ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}) ашиглах болно, гэхдээ энэ удаа дата бүр нь загасны жинг илэрхийлнэ. (граммаар) төрснөөсөө хойш өөр туршилтын эм өгсний дараа. Өөрөөр хэлбэл, эхний эм нь нэг загасыг 71 грамм жинтэй болгоход хүргэдэг, хоёр дахь эм нь өөр загасыг 70 грамм жинтэй болгох гэх мэт. Энэ тохиолдолд 300 нь "том хэвээр" байгаа боловч бид энэ өгөгдлийг хаях ёсгүй, учир нь үүнийг алдаагүй олж авсан гэж үзвэл энэ нь судалгааны амжилтыг илэрхийлж байна. Загасыг 300 грамм жинтэй болгох боломжтой эм нь бусад бүх эмээс илүү сайн ажилладаг тул энэ өгөгдөл нь "хамгийн чухал" биш харин бидний өгөгдлийн багц дахь "хамгийн чухал" нь юм

Зөвлөмж болгож буй: