Statistieken
Is tijd discreet of continu? Waarom? + Voorbeeld
Continu Over het algemeen zijn discrete gegevens gehele cijferantwoorden. Zoals hoeveel bomen of bureaus of mensen. Ook zaken als schoenmaten zijn discreet. Maar gewicht, lengte en tijd zijn voorbeelden van continue gegevens. Een methode om te beslissen of je twee keer neemt zoals 9 seconden en 10 seconden, kan je een tijd hebben tussen deze twee? Ja Wereldpremière van Usain Bolt 9,58 seconden Als u 9 bureaus en 10 bureaus neemt, kunt u dan een aantal bureaus tussenin hebben? Geen 9 1/2 bureaus zijn 9 bureaus en een kapotte! Lees verder »
Vraag # f7c8b
1/435 = 0.0023 "Ik veronderstel dat u bedoelt dat er 22 kaarten worden getoond, zodat" "er slechts 52-22 = 30 onbekende kaarten zijn." "Er zijn 4 kleuren en elke kaart heeft een rang, ik neem aan dat" "dit is wat je bedoelt met nummer, want niet alle kaarten hebben een" "nummer, sommige zijn gezichtskaarten." "Dus twee kaarten worden uitgezocht en iemand moet raden en" "rang van hen." De kansen hiervoor zijn "2 * (1/30) * (1/29) = 1/435 = 0.0023 = 0,23%" Uitleg: we weten dat het niet een van de omgedraaide kaarten is, dus "" er zijn s Lees verder »
Iedereen weet hoe het op te lossen?
"De mogelijke uitkomsten van het gooien van de 4-zijdige dobbelsteen zijn:" "1, 2, 3 of 4. Dus het gemiddelde is (1 + 2 + 3 + 4) / 4 = 2.5." "De variantie is gelijk aan E [x²] - (E [x]) ² = (1² + 2² + 3² + 4²) / 4 -2.5²" "= 30/4 - 2.5² = 7.5 - 6.25 = 1.25" " De mogelijke uitkomsten van het gooien van de 8-zijdige dobbelsteen zijn: "" 1, 2, 3, 4, 5, 6, 7 of 8. Dus het gemiddelde is 4.5. " "De variantie is gelijk aan (1² + 2² + ... + 8²) / 8 - 4,5² = 5,25." "Het gemiddelde van de som van de t Lees verder »
Stel dat een willekeurige variabele x het best wordt beschreven door een uniforme kansverdeling met bereik van 1 tot 6. Wat is de waarde van een die P (x <= a) = 0,14 waar maakt?
A = 1.7 Het onderstaande diagram toont de uniforme verdeling voor het gegeven bereik, de rechthoek heeft gebied = 1 dus (6-1) k = 1 => k = 1/5 we willen P (X <= a) = 0.14 dit is aangegeven als het grijs gearceerde gebied op het diagram, dus: (a-1) k = 0.14 (a-1) xx1 / 5 = 0.14 a-1 = 0.14xx5 = 0.7: .a = 1.7 Lees verder »
Stel dat X een continue willekeurige variabele is waarvan de kansdichtheidsfunctie wordt gegeven door: f (x) = k (2x - x ^ 2) voor 0 <x <2; 0 voor alle andere x. Wat is de waarde van k, P (X> 1), E (X) en Var (X)?
K = 3/4 P (x> 1) = 1/2 E (X) = 1 V (X) = 1/5 Om k te vinden, gebruiken we int_0 ^ 2f (x) dx = int_0 ^ 2k (2x-x ^ 2) dx = 1:. k [2x ^ 2/2-x ^ 3/3] _0 ^ 2 = 1 k (4-8 / 3) = 1 => 4 / 3k = 1 => k = 3/4 Om P te berekenen (x> 1 ), gebruiken we P (X> 1) = 1-P (0 <x <1) = 1-int_0 ^ 1 (3/4) (2x-x ^ 2) = 1-3 / 4 [2x ^ 2 / 2-x ^ 3/3] _0 ^ 1 = 1-3 / 4 (1-1 / 3) = 1-1 / 2 = 1/2 Om E (X) E (X) = int_0 ^ 2xf (x te berekenen ) dx = int_0 ^ 2 (3/4) (2x ^ 2-x ^ 3) dx = 3/4 [2x ^ 3/3-x ^ 4/4] _0 ^ 2 = 3/4 (16 / 3- 16/4) = 3/4 * 16/12 = 1 Om te berekenen V (X) V (X) = E (X ^ 2) - (E (X)) ^ 2 = E (X ^ 2) -1 E (X ^ 2) = int Lees verder »
Los het volgende op? Stacy speelt met haar magische gekleurde toverstokken. Ze zijn er in drie kleuren: rood, geel en blauw. Elk uur vermenigvuldigen de toverstokken zich en veranderen van kleur met de volgende kansen: (Vervolg in details)
1 - 0.2 sqrt (10) = 0.367544 "Naam" P [R] = "Kans dat één R-staaf uiteindelijk blauw wordt" P [Y] = "Stel vast dat die ene Y-staf uiteindelijk blauw wordt." P ["RY"] = "Stel dat een R & Y-stok allebei een blauwe gebeurtenis wordt." P ["RR"] = "Kans dat twee R wands blauw worden." P ["JJ"] = "Kans dat twee Y toverstokken een blauwe gebeurtenis worden." "Dan hebben we" P ["RY"] = P [R] * P [Y] P ["RR"] = (P [R]) ^ 2 P ["JJ"] = (P [Y]) ^ 2 "Dus we krijgen twee vergelijkingen in t Lees verder »
De gemiddelde leeftijd van de zeven P.E. leraren op de school van Carl zijn 38. Als de leeftijd van zes van hen 52, 30, 23, 28, 44 en 45 is, wat is dan de leeftijd van de zevende leerkracht?
44 Om een gemiddelde van een set gegevens te berekenen, telt u alle gegevens bij elkaar op en deelt u deze door het aantal gegevensitems. Laat de leeftijd van de zevende les x zijn. Daarmee wordt het gemiddelde van de leerkrachtenleeftijden berekend door: {52 + 30 + 23 + 28 + 44 + 45 + x} / {7} = 38 Dan kunnen we ons vermenigvuldigen met 7 om te krijgen: {52 + 30 + 23 + 28 + 44 + 45 + x} / {7} xx7 = 38xx7 => 52 + 30 +23 +28 +44 +45 + x = 266 We trekken alle andere leeftijden af om te krijgen: x = 266-52- 30-23-28-44-45 = 44. Lees verder »
Meneer, help me alsjeblieft om de onderstaande vraag op te lossen ..?
Geen onafhankelijke evenementen. Voor twee gebeurtenissen worden twee als 'onafhankelijk' beschouwd: P (AnnB) = P (A) xxP (B) P (AnnB) = 1/16 P (A) = 2/5 P (B) = 2/15 P (A ) P (B) = 2/5 * 2/15 = 4/75 4/75! = 1/16, gebeurtenissen zijn niet onafhankelijk. Lees verder »
De volgende gegevens tonen het aantal slaapuren dat tijdens een recente nacht werd bereikt voor een steekproef van 20 werknemers: 6,5,10,5,6,9,9,5,9,5,8,7,8,6, 9,8,9,6,10,8. Wat is de betekenis? Wat is de variantie? Wat is de standaarddeviatie?
Gemiddelde = 7.4 Standaarddeviatie ~~ 1.715 Variantie = 2.94 Het gemiddelde is de som van alle gegevenspunten gedeeld door het aantal gegevenspunten. In dit geval hebben we (5 + 5 + 5 + 5 + 6 + 6 + 6 + 6 + 7 + 8 + 8 + 8 + 8 + 9 + 9 + 9 + 9 + 9 + 10 + 10) / 20 = 148/20 = 7.4 De variantie is "het gemiddelde van de vierkante afstanden tot het gemiddelde". http://www.mathsisfun.com/data/standard-deviation.html Wat dit betekent, is dat u elk gegevenspunt van het gemiddelde verwijdert, de antwoorden vierkant maakt en ze vervolgens allemaal samenvoegt en deelt door het aantal gegevenspunten. In deze vraag ziet het er al Lees verder »
Vier kaarten worden nonchalant uit een pak kaarten getrokken. Wat is de kans om 2 kaarten te vinden die schoppen? @waarschijnlijkheid
17160/6497400 Er zijn 52 kaarten in totaal en 13 ervan zijn schoppen. Kans om de eerste schoppen te trekken is: 13/52 Kans om een tweede schoppen te trekken is: 12/51 Dit is omdat, wanneer we de schoppen hebben uitgekozen, er nog maar 12 schoppen over zijn en dus slechts 51 kaarten helemaal. kans op het tekenen van een derde schoppen: 11/50 kans op een vierde schoppen: 10/49 We moeten dit allemaal samen vermenigvuldigen om de kans te krijgen een schoppen na elkaar te trekken: 13/52 * 12/51 * 11 / 50 * 10/49 = 17160/6497400 Dus de kans om vier schoppen tegelijk te trekken zonder vervanging is: 17160/6497400 Lees verder »
Bereken de kleinste regressielijn waarbij jaarlijkse besparingen de afhankelijke variabele is en jaarinkomen de onafhankelijke variabele.
Y = -1,226666 + 0,1016666 * X-balk X = (12 + 13 + 14 + ... + 20) / 9 = 9 * (12 + 20) / (2 * 9) = 16 bar Y = (0 + 0,1 + 0.2 + 0.2 + 0.5 + 0.5 + 0.6 + 0.7 + 0.8) / 9 = 0.4 hat beta_2 = (sum_ {i = 1} ^ {i = 9} x_i * y_i) / (sum_ {i = 1} ^ {i = 9} x_i ^ 2) "met" x_i = X_i - balk X ", en" y_i = Y_i - balk Y => hoed beta_2 = (4 * 0.4 + 3 * 0.3 + 2 * 0.2 + 0.2 + 0.1 + 2 * 0.2 + 3 * 0.3 + 4 * 0.4) / ((4 ^ 2 + 3 ^ 2 + 2 ^ 2 + 1 ^ 2) * 2) = (1.6 + 0.9 + 0.4 + 0.2 + 0.1 + 0.4 + 0.9 + 1.6) / 60 = 6.1 / 60 = 0.10166666 => hat beta_1 = bar Y - hat beta_2 * bar X = 0.4 - (6.1 / 60) * 16 = -1.226666 "Dus de Lees verder »
De gemiddelde leeftijd van 6 vrouwen in een kantoor is 31 jaar oud. De gemiddelde leeftijd van 4 mannen in een kantoor is 29 jaar oud. Wat is de gemiddelde leeftijd (het dichtstbijzijnde jaar) van alle mensen op kantoor?
30.2 Het gemiddelde wordt berekend door de som van de waarden te nemen en te delen door de telling. Bijvoorbeeld, voor de 6 vrouwen, met een gemiddelde van 31, kunnen we zien dat de leeftijden zijn opgeteld tot 186: 186/6 = 31 En we kunnen hetzelfde doen voor de mannen: 116/4 = 29 En nu kunnen we de som en telling van de mannen en vrouwen om het gemiddelde voor het kantoor te vinden: (186 + 116) /10=302/10=30.2 Lees verder »
Het gemiddelde is de meest gebruikte maat voor het centrum, maar er zijn momenten waarop het wordt aanbevolen om de mediaan voor gegevensweergave en -analyse te gebruiken. Wanneer kan het passend zijn om de mediaan te gebruiken in plaats van het gemiddelde?
Wanneer er enkele extreme waarden in uw gegevensset staan. Voorbeeld: u heeft een dataset van 1000 cases met waarden die niet te ver uit elkaar liggen. Hun gemiddelde is 100, net als hun mediaan. Nu vervang je slechts één case door een case die de waarde 100000 heeft (alleen al om extreem te zijn). Het gemiddelde zal dramatisch stijgen (tot bijna 200), terwijl de mediaan niet zal worden beïnvloed. Berekening: 1000 gevallen, gemiddelde = 100, som van waarden = 100000 Lose one 100, add 100000, som of values = 199900, mean = 199.9 Median (= case 500 + 501) / 2 blijft hetzelfde. Lees verder »
De gemiddelde lengte van 6 staven is 44,2 cm. De gemiddelde lengte van 5 van hen is 46 cm. Hoe lang is de zesde roede?
De lengte van de 6h staaf is = 265.2-230 = 35.2 De gemiddelde lengte van 6 staven is = 44.2 cm De gemiddelde lengte van 5 staven is = 46 cm De totale lengte van 6 staven is = 44.2xx 6 = 265.2 cm De totale lengte van 5 staven is = 46xx5 = 230 cm De lengte van de 6h staaf is = [Totale lengte van 6 staven] - [Totale lengte van 5 staven] De lengte van de 6h stang is = 265.2-230 = 35.2 Lees verder »
Het gemiddelde, de mediaan en de modus zijn allemaal gelijk voor deze set: (3,4,5,8, x). Wat is de waarde van 'x'?
X = 5 3,4,5,8, x gemiddelde = modus = mediaan sumx_i = (20 + x) / 5 = 4 + x / 5 omdat we een modus nodig hadden: .x> 0 omdat x = 0 = > barx = 4, "mediaan" = 4 "maar er is geen modus" x = 5 => barx = 4 + 5/5 = 5 we hebben 3,4,5,5,8 mediaan = 5 modus = 5:. x = 5 Lees verder »
Het gemiddelde van acht getallen is 41. Het gemiddelde van twee van de getallen is 29. Wat is het gemiddelde van de andere zes getallen?
Het gemiddelde van de zes getallen is "" 270/6 = 45 Er zijn 3 verschillende reeksen getallen die hier bij betrokken zijn. Een set van zes, een set van twee en de set van alle acht. Elke set heeft zijn eigen gemiddelde. "gemiddelde" = "Totaal" / "aantal cijfers" "" OF M = T / N Let op: als u het gemiddelde en het aantal nummers weet, kunt u het totaal vinden. T = M xxN U kunt getallen toevoegen, u kunt totalen toevoegen, maar u mag niet tegelijkertijd middelen toevoegen. Dus voor alle acht nummers: Het totaal is 8 xx 41 = 328 Voor twee van de nummers: het totaal is 2xx29 = 5 Lees verder »
Het gemiddelde van 4 getallen is 5 en het gemiddelde van 3 verschillende getallen is 12. Wat is het gemiddelde van de 7 getallen samen?
8 Het gemiddelde van een reeks getallen is de som van de getallen over de telling van de set (het aantal waarden). We hebben een set van vier getallen en het gemiddelde is 5. We kunnen zien dat de som van de waarden 20: 20/4 = 5 is. We hebben nog een set van drie getallen waarvan het gemiddelde 12 is. We kunnen dat schrijven als: 36 / 3 = 12 Om het gemiddelde van de zeven getallen bij elkaar te vinden, kunnen we de waarden bij elkaar optellen en delen door 7: (20 + 36) / 7 = 56/7 = 8 Lees verder »
De mediaan wordt een resistente maat genoemd, terwijl het gemiddelde een niet-resistente maat is. Wat is een resistente maatregel?
Resistent betekent in dit geval dat het bestand is tegen extreme waarden. Voorbeeld: stel je een groep van 101 mensen voor met een gemiddelde (= gemiddelde) van $ 1000 in de bank. Het komt ook voor dat de middelste man (na het sorteren op banksaldo) ook $ 1000 in de bank heeft. Deze mediaan betekent dat 50 (%) minder hebben en 50 meer hebben. Nu wint een van hen een loterijprijs van $ 100000, en hij besluit deze op de bank te zetten. Het gemiddelde gaat meteen omhoog van $ 1000 naar bijna $ 2000, omdat het wordt berekend door het totale aantal te delen door 101. De mediaan ("midden van de rij") zal ongestoord zij Lees verder »
Het aantal manieren waarop een examinator 30 punten kan toekennen aan 8 vragen van niet minder dan 2 punten voor een vraag is?
259459200 Als ik dit goed lees, dan kan de examinator alleen tekens in veelvouden van 2 toekennen. Dit zou dan betekenen dat er slechts 15 keuzes zijn uit de 30 punten .i.e. 30/2 = 15 Dan hebben we 15 keuzes verdeeld over de 8 vragen. Gebruik de formule voor permutaties: (n!) / ((N - r)!) Waarbij n het aantal objecten is (in dit geval de tekens in groepen van 2). En r is hoeveel er per keer worden genomen (in dit geval de 8 vragen) Dus we hebben: (15!) / ((15 - 8)!) = (15!) / (7!) = 259459200 Lees verder »
De kans dat je te laat bent op school is 0,05 voor elke dag. Gezien het feit dat je te laat sliep, is de kans dat je te laat bent op school 0.13. Zijn de gebeurtenissen 'Laat naar school' en 'Sliep laat' onafhankelijk of afhankelijk?
Ze zijn afhankelijk. De gebeurtenis "Sliep laat" heeft invloed op de waarschijnlijkheid van de andere gebeurtenis "te laat op school". Een voorbeeld van onafhankelijke gebeurtenissen is het herhaaldelijk omdraaien van een munt. Omdat de munt geen geheugen heeft, zijn de kansen op de tweede (of latere) worpen nog steeds 50/50 - op voorwaarde dat het een eerlijke munt is! Extra: misschien wilt u deze overdenken: u ontmoet een vriend, met wie u al jaren niet meer spreekt. Alles wat je weet is dat hij twee kinderen heeft. Als je hem ontmoet, heeft hij zijn zoon bij zich. Hoe groot is de kans dat het andere Lees verder »
Er zijn 7 kinderen in een klaslokaal. Op hoeveel manieren kunnen ze zich opstellen voor een pauze?
7! = 7 * 6 * 5 * 4 * 3 * 2 * 1 = 5040. Dit specifieke probleem is een permutatie. Recall, het verschil tussen permutaties en combinaties is dat, met permutaties, order belangrijk is. Gegeven dat de vraag stelt op hoeveel manieren de studenten zich kunnen opstellen voor een reces (dat wil zeggen, hoeveel verschillende orders), is dit een permutatie. Stel je voor het moment dat we slechts twee posities vervulden, positie 1 en positie 2. Om onderscheid te maken tussen onze studenten, omdat de volgorde ertoe doet, zullen we elk een letter toewijzen van A tot G. Als we nu deze posities invullen, tegelijkertijd hebben we zeven o Lees verder »
Er zijn 9 studenten in een club. Drie studenten moeten worden gekozen om deel te nemen aan het entertainmentcomité. Op hoeveel manieren kan deze groep worden gekozen?
Op 84 manieren kan deze groep worden gekozen. Het aantal selecties van "r" -objecten van de gegeven "n" -objecten wordt aangegeven met nC_r en wordt gegeven door nC_r = (n!) / (R! (N-r)!) N = 9, r = 3:. 9C_3 = (9!) / (3! (9-3)!) = (9 * 8 * 7) / (3 * 2) = 84 Op 84 manieren kan deze groep worden gekozen. [Ans] Lees verder »
Er zijn n identieke kaarten van type A, n van type B, n van type C en n van type D. Er zijn 4 personen die elk n kaarten moeten ontvangen. Op hoeveel manieren kunnen we de kaarten verdelen?
Zie hieronder voor een idee over hoe u dit antwoord kunt benaderen: ik geloof dat het antwoord op de vraag van de methodologie over het doen van dit probleem is dat combinaties met identieke items binnen de populatie (zoals het hebben van 4n-kaarten met n aantal typen A, B, C en D) valt buiten het vermogen van de combinatieformule om te berekenen. In plaats daarvan, volgens Dr. Math op mathforum.org, heb je uiteindelijk een paar technieken nodig: het verdelen van objecten in verschillende cellen, en het inclusie-uitsluitingsprincipe. Ik heb dit bericht gelezen (http://mathforum.org/library/drmath/view/56197.html) dat zich Lees verder »
"Er zijn drie soorten leugens: leugens, verdomde of witte leugens en statistieken" - uitleg?
De uitdrukking werd in de autobiografie van Mark Twain toegeschreven aan Benjamin Disraeli, een Britse premier in de negentiende eeuw. Twain was ook verantwoordelijk voor het wijdverspreide gebruik van de uitdrukking, hoewel het misschien veel eerder door Sir Charles Dilke en anderen is gebruikt. In essentie drukt de uitdrukking sarcastisch twijfel uit over statistisch bewijs door het te vergelijken met leugens, wat suggereert dat het vaak misleidend is veranderd of uit de context wordt gebruikt. In deze zin wordt onder 'statistieken' verstaan: 'gegevens'. Lees verder »
Welk deel van een gegevensset is te vinden in het kader, in een kader en in een whisperplot?
50% van de gegevens bevinden zich in de doos. De box in een box & whisker-plot wordt gevormd met de Q1- en Q3-waarden als eindpunten. Dat betekent dat Q1-> Q2 en Q2-> Q3 is inbegrepen. Aangezien elk bereik van Q-gegevens 25% van de gegevens in een box & whisker-plot bevat, bevat de box 50% min -> Q1 = 25% Q1 -> Q2 = 25% Q2 -> Q3 = 25% Q3 -> max = 25% Lees verder »
Het derde kwartiel, aangeduid met Q_3, is de gegevenswaarde zodanig dat het percentage van de waarden eronder ligt?
75% Als u met kwartielen werkt, bestelt u eerst uw cases op waarde. Je verdeelt je cases vervolgens in vier gelijke groepen. De waarde van de casus aan de grens tussen de eerste quart en de tweede wordt het eerste kwartiel of Q1 genoemd Tussen tweede en derde is Q2 = mediaan En tussen derde en vierde is Q3 Dus op het Q3-punt heb je driekwart van jouw waarden. Dit is 75%. Extra: bij grote datasets worden ook percentielen gebruikt (de cases worden vervolgens verdeeld in 100 groepen). Als een waarde op het 75e percentiel staat, betekent dit dat 75% van de gevallen een lagere waarde heeft. Lees verder »
Een jongen heeft 20% kans om op een doelwit te raken. Laat p de kans aanduiden om voor het eerst het doelwit te raken bij de nde proef. Als p voldoet aan de ongelijkheid 625p ^ 2 - 175p + 12 <0 dan is de waarde van n?
N = 3 p (n) = "Voor de 1e keer op de n-de proef slaan" => p (n) = 0.8 ^ (n-1) * 0.2 "Grens van de ongelijkheid" 625 p ^ 2 - 175 p + 12 = 0 "" is de oplossing van een kwadratische vergelijking in "p": "" schijf: "175 ^ 2 - 4 * 12 * 625 = 625 = 25 ^ 2 => p = (175 pm 25) / 1250 = 3/25 "of" 4/25 "" Dus "p (n)" is negatief tussen deze twee waarden. " p (n) = 3/25 = 0.8 ^ (n-1) * 0.2 => 3/5 = 0.8 ^ (n-1) => log (3/5) = (n-1) log (0.8) = > n = 1 + log (3/5) / log (0.8) = 3.289 .... p (n) = 4/25 = ... => n = 1 + log (4/5) / Lees verder »
Katie moet vijf examens afleggen in een wiskundelessen. Als haar scores op de eerste vier examens 76, 74, 90 en 88 zijn, welke score moet Katie dan behalen op het vijfde examen voor haar gemiddelde gemiddelde van ten minste 70?
22 Het gemiddelde wordt gemeten door de som van de waarden te nemen en te delen door het aantal waarden: "mean" = "sum" / "count" Katie heeft al vier examens afgelegd en moet haar vijfde hebben, dus we hebben er 76, 74, 90, 88 en x. Ze wil dat haar gemiddelde gemiddelde ten minste 70 is. We willen weten dat de minimumscore x minimaal 70: 70 = (76 + 74 + 90 + 88 + x) / 5 moet zijn. En nu lossen we op voor x: 328 + x = 350 x = 22 Lees verder »
Katie moet vijf examens afleggen in een wiskundelessen. Als haar scores op de eerste vier examens 76, 74, 90 en 88 zijn, welke score moet Katie dan behalen op het vijfde examen voor haar gemiddelde gemiddelde op ten minste 90?
122 Gemiddelde = som van de testen gedeeld door het totale aantal testen Laat x = de 5e testscore Gemiddelde = (76 + 74 + 90 + 88 + x) / 5 = 90 Los op door eerst beide zijden van de vergelijking met 5 te vermenigvuldigen: = (5 (76 + 74 + 90 + 88 + x)) / 5 = 90 * 5 = 76 + 74 + 90 + 88 + x = 450 Oplossen voor x: x = 450 - 76-74-90-88 = 122 Lees verder »
Vraag # c2317
"I) P = 0.3085" "II) P = 0.4495" "variantie = 25" => "standaardafwijking" = sqrt (25) = 5 "We gaan van N (10, 5) naar genormaliseerde normale verdeling:" I) z = (7,5 - 10) / 5 = -0,5 => P = 0,3085 "(tabel voor z-waarden)" II) z = (13,5 - 10) / 5 = 0,7 => P = 0,7580 "(tabel voor z- waarden) "=> P (" tussen 8 en 13 ") = 0.7580 - 0.3085 = 0.4495" 7.5 en 13.5 in plaats van 8 en 13 vanwege een continuïteitscorrectie van de discrete waarden. " Lees verder »
Een lineaire ketting bestaat uit 20 identieke schakels. Elke link kan in 7 verschillende kleuren worden gemaakt. Hoeveel fysiek verschillende ketens zijn er?
Voor elk van de 20 links zijn er 7 keuzes, elke keer dat de keuze onafhankelijk is van eerdere keuzes, kunnen we het product nemen. Totaal aantal keuzes = 7 * 7 * 7 ... * 7 = = 7 ^ (20) Maar omdat keten kan worden omgekeerd, moeten we verschillende reeksen tellen. Eerst tellen we het aantal symmetrische sequenties: de laatste 10 links nemen het spiegelbeeld van de eerste 10 links. Aantal symmetrische reeksen = aantal manieren, dus selecteer eerst 10 links = 7 ^ (10) Behalve voor deze symmetrische reeksen kunnen de niet-symmetrische reeksen worden omgekeerd om een nieuwe ketting te produceren. Dit betekent dat slechts de h Lees verder »
Een tas bevat 3 rode knikkers, 4 blauwe knikkers en x groene knikkers. Gegeven dat de kans om 2 groene knikkers te kiezen 5/26 is, bereken je het aantal knikkers in de zak?
N = 13 "Noem het aantal knikkers in de zak", n. "Dan hebben we" (x / n) ((x-1) / (n-1)) = 5/26 x = n - 7 => ((n-7) / n) ((n-8) / (n-1)) = 5/26 => 26 (n-7) (n-8) = 5 n (n-1) => 21 n ^ 2 - 385 n + 1456 = 0 "schijf:" 385 ^ 2 - 4 * 21 * 1456 = 25921 = 161 ^ 2 => n = (385 pm 161) / 42 = 16/3 "or" 13 "Omdat n een geheel getal is, moeten we de tweede oplossing (13) nemen:" => n = 13 Lees verder »
Tyler speelde 5 basketbalwedstrijden. Het gemiddelde was 10 punten. De mediaan was 12 punten. Wat zou elk van zijn scores kunnen zijn?
0,0,12,19,19 is een mogelijkheid. We hebben 5 basketbalspellen waarbij Tyler een gemiddelde van 10 punten en een mediaan van 12 punten scoorde. De mediaan is de middelste waarde, en dus weten we dat de punten die hij scoorde twee waarden onder de 12 en twee waarden hierboven hebben. Het gemiddelde wordt berekend door de waarden bij elkaar op te tellen en te delen door de telling. Om een gemiddelde te hebben van 10 punten over 5 spellen, weten we: "gemiddelde" = "som van gescoorde punten" / "aantal spellen" => 10 = 50/5 En zo is het aantal punten dat gescoord is over de 5 spellen 50 punten. Lees verder »
Onder welke omstandigheden zou de mediaan een voorkeursmaat kunnen zijn voor gebruik in plaats van gemiddeld?
Wanneer een gegevensset enkele zeer extreme gevallen bevat. Voorbeeld: we hebben een dataset van 1000 waarin de meeste waarden rond de 1000-markering zweven. Laten we zeggen dat het gemiddelde en de mediaan beide 1000 zijn. Nu voegen we er één 'miljonair' aan toe. Het gemiddelde zal dramatisch stijgen tot bijna 2000, terwijl de mediaan niet echt zal veranderen, omdat het de waarde van geval 501 zal zijn in plaats van tussenin van geval 500 en geval 501 (gevallen gerangschikt in volgorde van waarde) Lees verder »
Gebruik de standaardnormale verdeling om P (z lt 1.96) te vinden.
P (z <1,96) zou betekenen dat de standaardnormale verdeling wordt gebruikt en dat het gebied onder de curve links van 1,96 wordt gevonden. Onze tabel geeft ons het gebied links van de z-score, we hoeven alleen de waarde te bekijken van op de tafel, die ons zal geven. P (z <1,96) = 0,975 die je zou kunnen schrijven als 97,5% Lees verder »
Gebruikt u de volgende dataset, welke waarden hebben een z-score van meer dan 2? 144, 160, 154, 162, 179, 148, 197, 177, 166, 173, 154, 184, 183, 132, 157, 129, 151, 162, 209, 159, 150, 190, 175, 136, 117
Raadpleeg de sectie Toelichting De stappen voor de berekening van z-waarden zijn als volgt: Bereken het gemiddelde van de reeks. Bereken de standaarddeviatie van de serie. Bereken tenslotte de z-waarden voor elke x-waarden met behulp van de formule z = sum (x-barx) / sigma. Volgens de berekening is de z-waarde van 209 groter dan 2 Raadpleeg de onderstaande tabel - Normale distributiedeel 2 Lees verder »
We zeggen dat de mediaan een resistente maat is, terwijl het gemiddelde geen resistente maat is. Wat is een resistente maatregel?
Een resistente maatregel is er een die niet wordt beïnvloed door uitschieters.Bijvoorbeeld als we een geordende lijst met nummers hebben: 1, 3, 4, 5, 6, 8, 50 Het gemiddelde is: 11 De mediaan is 5 Het gemiddelde is in dit geval groter dan de meeste nummers op de lijst omdat het wordt zo sterk beïnvloed door 50, in dit geval een sterke uitbijter. De mediaan blijft 5, ook als het laatste cijfer in de geordende lijst veel groter is, omdat het alleen het middelste cijfer in een geordende lijst met nummers bevat. Lees verder »
Wat zijn Box-and-Whisker-grafieken? + Voorbeeld
Een box-and-whisker-plot is een type grafiek met statistieken uit een samenvatting met vijf nummers. Hier is een voorbeeld: de samenvatting met vijf nummers bestaat uit: Minumum: laagste waarde / waarneming Onderste kwartiel of Q1: "mediaan" van de onderste helft van de gegevens; ligt op 25% van de gegevens Mediaan: middelste waarde / waarneming Hoger kwartiel of Q3: "mediaan" van de bovenste helft van de gegevens; ligt op 75% van de gegevens Maximum: hoogste waarde / waarneming Het interkwartielbereik (IQR) is het bereik van het onderste kwartiel (Q1) en het bovenste kwartiel (Q2). Soms zijn er ook uit Lees verder »
Wat zijn klassegrenzen? + Voorbeeld
Wanneer u waarden in klassen groepeert, moet u de limieten instellen. Voorbeeld Stel dat u de hoogtes van 10.000 volwassenen meet. Deze hoogten worden nauwkeurig gemeten tot op de mm (0,001 m). Om met deze waarden te werken en statistieken erover te maken, of histogrammen te maken, zal zo'n fijne indeling niet werken. Dus je groepeert je waarden in klassen. Stel dat we in ons geval 50 mm (0,05 m) intervallen gebruiken. Dan hebben we een klasse van 1,50- <1,55 m, 1,55- <1,60 m, enz. Eigenlijk zal de klasse 1,50-1,55 m iedereen vanaf 1,495 hebben (die naar boven afgerond zal worden) tot 1,544 (dat zal naar beneden Lees verder »
Wat zijn enkele voordelen van het gebruik van een steekproef in plaats van een telling?
Het belangrijkste voordeel van het gebruik van een steekproef in plaats van een telling is efficiëntie. Stel dat iemand wil weten wat de gemiddelde mening van het Congres is tussen individuen tussen 18 en 24 (d.w.z. zij willen weten wat de goedkeuringsclassificatie van het Congres onder deze demografische groep is). In 2010 waren er volgens de Amerikaanse volkstelling meer dan 30 miljoen mensen in die leeftijdscategorie binnen de Verenigde Staten. Naar elk van deze 30 miljoen mensen gaan en hun mening vragen, terwijl het zeker tot zeer nauwkeurige resultaten zou leiden (ervan uitgaande dat niemand loog), zou enorm duu Lees verder »
Wat zijn de vier voorwaarden waaraan moet worden voldaan voor een binomiale instelling?
In een Bominale instelling zijn er twee mogelijke uitkomsten per gebeurtenis. De belangrijkste voorwaarden voor het gebruik van een binomiale instelling zijn in de eerste plaats: Er zijn slechts twee mogelijkheden, die we Goed of Faal zullen noemen. De waarschijnlijkheid van de verhouding tussen Goed en Faal verandert niet tijdens de pogingen. Met andere woorden: de uitkomst van één poging heeft geen invloed op het volgende voorbeeld: u gooit dobbelstenen (één per keer) en u wilt weten wat de kansen zijn dat u zich voor de eerste keer in zes op drie probeert. Dit is een typisch voorbeeld van binomiaal: Lees verder »
Wat zijn de imortante kenmerken van een cirkeldiagram?
Belangrijke kenmerken van een "cirkeldiagram" Voordat we een "cirkeldiagram" bouwen, moeten we enkele belangrijke zaken hebben. we moeten hebben: TOP 5 BELANGRIJKE ELEMENTEN Twee of meer gegevens. Kies perfecte kleuren om onze gegevens eenvoudig te bekijken. Zet een hoofdtitel voor onze grafiek. Leg een legenda in uw grafiek (links of rechts) Voeg een zin toe die de grafiek beschrijft, onderaan onze grafiek. (korte) Zie ook de foto: Lees verder »
Wat zijn de beperkingen bij het gebruik van R-vierkant als maatstaf voor de geldigheid van een model?
Het R-kwadraat moet niet worden gebruikt voor modelvalidatie. Dit is een waarde die u bekijkt wanneer u uw model hebt gevalideerd. Een lineair model wordt gevalideerd als de gegevens homogeen zijn, een normale verdeling volgen, de verklarende variabelen onafhankelijk zijn en als u precies de waarde van uw verklarende variabelen kent (smalle fout op X). De R-kwadraat kan worden gebruikt om twee modellen te vergelijken die je bent al gevalideerd. Degene met de hoogste waarde is degene die het best past bij de gegevens. Het kan echter betere indices bevatten, zoals de AIC (Akaike-criterium) Lees verder »
Wat zijn het gemiddelde en de standaarddeviatie van {115, 89, 230, -12, 1700}?
Arithmetic Mean ~~ 424.4 Standaarddeviatie ~~ 642.44 Input Data Set: {115, 89, 230, -12, 1700} Arithmetic Mean = (1 / n) * Sigma (x_i), waarbij Sigma x_i verwijst naar de som van alle de elementen in de Input Data Set. n is het totale aantal elementen. Standaarddeviatie sigma = sqrt [1 / n * Sigma (x_i - bar x) ^ 2) Sigma (x_i - bar x) ^ 2 verwijst naar het gemiddelde van de kwadratische verschillen van het gemiddelde. Maak een tabel met waarden zoals weergegeven: Vandaar, Arithmetic Mean ~~ 424.4 Standaarddeviatie ~~ 642.44 Ik hoop dat het helpt. Lees verder »
Wat zijn het gemiddelde en de standaardafwijking van {2,3,3,5,1,5,4,4,2,6}?
Gemiddelde is 3,5 en standaarddeviatie is 1,83 Som van de termen is 35, dus het gemiddelde van {2,3,3,5,1,5,4,4,2,6} is 35/10 = 3,5 als het eenvoudige gemiddelde van de voorwaarden. Voor standaarddeviatie moet men het gemiddelde van vierkanten de afwijkingen van de termen van het gemiddelde vinden en vervolgens hun vierkantswortel nemen. De afwijkingen zijn {-3.5, -0.5, -0.5, 1.5, -2.5, 1.5, 0.5, 0.5, -1.5, 2.5} en de som van hun vierkanten is (12.25 + 0.25 + 0.25 + 2.25 + 6.25 + 2.25 + 0.25 + 0,25 + 2,25 + 6,25) / 10 of 33,50 / 10, dat wil zeggen 3,35. Daarom is standaarddeviatie sqrt3.35, d.w.z. 1.83 Lees verder »
Wat zijn het gemiddelde, de mediaan, modus, variantie en standaardafwijking van {4,6,7,5,9,4,3,4}?
Gemiddelde = 5.25color (wit) ("XXX") Mediaan = 4.5kleur (wit) ("XXX") Modus = 4 Bevolking: Variantie = 3.44color (wit) ("XXX") Standaarddeviatie = 1.85 Voorbeeld: kleur (wit ) ("X") Variantie = 43,93kleur (wit) ("XXX") Standaarddeviatie = 1,98 Gemiddelde is het rekenkundig gemiddelde van de gegevenswaarden Mediaan is de middelste waarde wanneer de gegevenswaarden zijn gesorteerd (of het gemiddelde van de 2 middelste waarden als er een even aantal gegevenswaarden zijn). Modus is de datawaarde (n) die met de grootste frequentie voorkomen. Variantie en standaarddeviatie zijn a Lees verder »
Wat zijn de mediaan en de modus van de standaardnormale verdeling?
In elke normale verdeling zijn de modus en de mediaan hetzelfde als het gemiddelde, wat dat ook is. In een gestandaardiseerde normale verdeling wordt het gemiddelde mu omgezet in 0 (en de standaardafwijkingssigma is ingesteld op 1). Dus modus en mediaan zijn dan ook 0 Lees verder »
Wat zijn de maatregelen van centrale tendens? + Voorbeeld
Het gemiddelde (gemiddeld) en mediaan (middelpunt). Sommigen zullen de modus toevoegen. Bijvoorbeeld met de reeks waarden: 68.4, 65.7, 63.9, 79.5, 52.5 Het gemiddelde is het rekenkundig gemiddelde: (68.4 + 65.7 + 63.9 + 79.5 + 52.5) / 5 = 66 De mediaan is de waarde op gelijke afstand (numeriek) van het bereik uitersten. 79,5 - 52,5 = 27 27/2 = 13,5; 13.5 + 52.5 = 66 OPMERKING: In deze dataset is het dezelfde waarde als het gemiddelde, maar dat is meestal niet het geval. De modus is de meest voorkomende waarde (n) in een set. Er zit niets in deze set (geen duplicaten). Het is een algemeen opgenomen als een statistische maa Lees verder »
Wat zijn het bereik, de mediaan, het gemiddelde en de standaardafwijking van: {212, 142, 169, 234, 292, 261, 147, 164, 272, -20, -26, -90, 1100}?
De gemiddelde (gemiddelde) en standaardafwijkingen kunnen rechtstreeks worden verkregen van een rekenmachine in de stat-modus. Dit levert barx op = 1 / nsum_ (i = 1) ^ nx_i = 219,77 Strikt genomen, aangezien alle gegevenspunten in de monsterruimte gehele getallen zijn, moeten we het gemiddelde ook als een geheel getal weergeven voor het correcte aantal significante cijfers, dat wil zeggen barx = 220. De 2 standaarddeviaties, afhankelijk van of u de standaarddeviatie van het monster of de populatie wilt, worden ook afgerond op de dichtstbijzijnde gehele waarde, s_x = 291 en sigma_x = 280 Het bereik is eenvoudig x_ (max) -x_ Lees verder »
Past het volgende voorbeeld op het principe van correlatie versus causaliteit?
Ja, dit voorbeeld past "correlation vs causation". Hoewel de gegevens van de eigenaar een opmerkelijk bewijs van correlatie zijn, kan de eigenaar de causaliteit niet vaststellen, omdat dit geen willekeurig experiment is. In plaats daarvan is wat hier waarschijnlijk is gebeurd, dat degenen die een huisdier wilden hebben en in staat waren het te krijgen, de mensen waren die met een huisdier belandden. De wens om een huisdier te bezitten rechtvaardigt hun geluk naderhand en het vermogen om het huisdier te veroorloven wijst op het feit dat ze waarschijnlijk financieel onafhankelijk waren, ze hadden waarschijnlijk ge Lees verder »
Wat zijn de variantie en standaarddeviatie van {1, -1, -0.5, 0.25, 2, 0.75, -1, 2, 0.5, 3}?
Als de gegeven gegevens de volledige populatie is, dan: color (white) ("XXX") sigma_ "pop" ^ 2 = 1.62; sigma_ "pop" = 1,27 Als de gegeven gegevens een steekproef van de populatie is, dan kleur (wit) ("XXX") sigma_ "monster" ^ 2 = 1,80; sigma_ "sample" = 1.34 Om de variantie te vinden (sigma_ "pop" ^ 2) en standaardafwijking (sigma_ "pop") van een populatie Zoek de som van de bevolkingswaarden Verdelen door het aantal waarden in de populatie om het gemiddelde te krijgen Bereken voor elke populatiewaarde het verschil tussen die waarde en het gemi Lees verder »
Wat zijn de variantie en standaarddeviatie van {1, 1, 1, 1, 1, 7000, 1, 1, 1, 1, 1, 1, 1, 1}?
Variantie = 3.050.000 (3s.f.) Sigma = 1750 (3s.f.) zoek eerst het gemiddelde: gemiddelde = (1 + 1 + 1 + 1 + 1 + 7000 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1) / 15 = 7014/15 = 467.6 vinden voor elk getal afwijkingen - dit wordt gedaan door het gemiddelde af te trekken: 1 - 467.6 = -466.6 7000 - 467.6 = 6532.4 dan vierkant elke afwijking: (-466.6) ^ 2 = 217.715.56 6532.4 ^ 2 = 42.672.249.76 de variantie is het gemiddelde van deze waarden: variantie = ((14 * 217715.56) + 42672249.76) / 15 = 3.050.000 (3s.f.) De standaarddeviatie is de vierkantswortel van de variantie: Sigma = sqrt (3050000) = 1750 (3s.f.) Lees verder »
Wat zijn de variantie en standaarddeviatie van {1, 1, 1, 1, 1, 80, 1, 1, 1, 1, 1, 1}?
De populatievariantie is: sigma ^ 2 ~ = 476.7 en de standaardafwijking van de populatie is de vierkantswortel van deze waarde: sigma ~ = 21.83 Laten we eerst aannemen dat dit de gehele populatie van waarden is. Daarom zijn we op zoek naar de populatievariantie. Als deze aantallen een reeks steekproeven van een grotere bevolking waren, zouden wij de steekproefvariantie zoeken die van de populatievariantie door een factor van n // verschilt (n-1) De formule voor de populatievariantie is sigma ^ 2 = 1 / N sum_ (i = 1) ^ N (x_i-mu) ^ 2 waarbij mu het populatiegemiddelde is, dat kan worden berekend uit mu = 1 / N sum_ (i = 1) ^ Lees verder »
Wat zijn de variantie en standaarddeviatie van {18, -9, -57, 30, 18, 5, 700, 7, 2, 1}?
Ervan uitgaande dat we te maken hebben met de hele populatie en niet alleen met een steekproef: Variantie sigma ^ 2 = 44,383.45 Standaarddeviatie sigma = 210.6738 Met de meeste wetenschappelijke rekenmachines of spreadsheets kunt u deze waarden rechtstreeks bepalen. Als u het op een meer methodische manier moet doen: Bepaal de som van de gegeven gegevenswaarden. Bereken het gemiddelde door de som te delen door het aantal gegevensinvoeren. Bereken voor elke gegevenswaarde de afwijking van het gemiddelde door de gegevenswaarde af te trekken van het gemiddelde. Voor elke afwijking van de gegevenswaarde berekent de afwijking v Lees verder »
Wat zijn de variantie en standaarddeviatie van {8, 29, 57, 3, 8, 95, 7, 37, 5, 8}?
S = sigma ^ 2 = 815.41-> variantie sigma = 28.56-> 1 standaarddeviatie De variantie is een soort gemiddelde maat voor de variatie van de gegevens over de lijn van de beste passing. Het is afgeleid van: sigma ^ 2 = (sum (x-barx)) / n Waar sum betekent alles optellen barx is de gemiddelde waarde (soms gebruiken ze mu) n is het aantal gebruikte gegevens sigma ^ 2 is de variantie (soms gebruiken ze s) sigma is één standaardafwijking Deze vergelijking, met een beetje manipulatie, eindigt als: sigma ^ 2 = (sum (x ^ 2)) / n - barx ^ 2 "" voor variantie sigma = sqrt (( som (x ^ 2)) / n - barx ^ 2) "& Lees verder »
Wat zijn de variantie en standaarddeviatie van {2,9,3,2,7,7,12}?
Variantie (populatie): sigma_ "pop" ^ 2 = 12.57 Standaarddeviatie (populatie): sigma_ "pop" = 3.55 De som van de gegevenswaarden is 42 De gemiddelde (mu) van de gegevenswaarden is 42/7 = 6 Voor elke van de gegevenswaarden kunnen we het verschil tussen de gegevenswaarde en het gemiddelde berekenen en vervolgens dat verschil verdelen. De som van de gekwadrateerde verschillen gedeeld door het aantal gegevenswaarden geeft de populatie-variantie (sigma_ "pop" ^ 2). De vierkantswortel van de populatievariantie geeft de populatie standaarddeviatie (sigma_ "pop"). Opmerking: Ik heb aangenome Lees verder »
Welke aannames maakt een F-test? + Voorbeeld
Een F-test gaat ervan uit dat gegevens normaal verdeeld zijn en dat de monsters onafhankelijk van elkaar zijn. Een F-test gaat ervan uit dat gegevens normaal verdeeld zijn en dat de monsters onafhankelijk van elkaar zijn. Gegevens die verschillen van de normale verdeling, kunnen aan een paar redenen te wijten zijn. De gegevens kunnen scheef zijn of de steekproefomvang kan te klein zijn om een normale verdeling te bereiken. Ongeacht de reden, F-tests gaan uit van een normale verdeling en resulteren in onnauwkeurige resultaten als de gegevens aanzienlijk verschillen van deze verdeling. F-tests gaan er ook van uit dat datapu Lees verder »
Als je eenmaal een z-score hebt, hoe bereken je de waarde die wordt gevonden in de z-tabellen?
Omdat er geen wiskundige vergelijking is die het gebied onder de normale curve tussen twee punten kan berekenen, is er geen formule om de waarschijnlijkheid in z-tabel handmatig op te lossen. Dit is de reden waarom z-tabellen worden aangeboden, meestal met een nauwkeurigheid van 4 decimalen. Maar er zijn formules om deze kansen met een zeer hoge precisie te berekenen met behulp van software zoals Excel, R en apparatuur zoals TI-calculator. In Excel worden links van z gegeven door: NORM.VERD (z, 0,1, waar) In TI-rekenmachine kunnen we normalcdf (-1E99, z) gebruiken om een gebied aan de linkerkant van die z-waarde te krijge Lees verder »
Wat kan een chikwadraat-verdeling worden gebruikt om te beschrijven?
Chi-kwadraatverdelingen kunnen worden gebruikt om statistische grootheden te beschrijven die een functie zijn van een som van vierkanten. De Chi-kwadraatverdeling is de verdeling van een waarde die de som is van kwadraten van k normaal verdeelde willekeurige variabelen. Q = sum_ (i = 1) ^ k Z_i ^ 2 De PDF van de Chi Squared-verdeling wordt gegeven door: f (x; k) = 1 / (2 ^ (k / 2) Gamma (k / 2)) x ^ (k / 2-1) e ^ (- x / 2) Waarbij k het aantal vrijheidsgraden is, en x de waarde van Q is waarvoor we de waarschijnlijkheid zoeken. Het nut van de Chi Squared-verdeling ligt in het modelleren van dingen die de som van kwadratisc Lees verder »
Waarvoor kan covariantie worden gebruikt?
Eén gebruik van co-variantie is het bestuderen van de correlatie. Wanneer we voorbeeldgegevens hebben met betrekking tot twee afhankelijke variabelen, wordt de co-variantie relevant. Co-variantie is een maat voor het effect van variatie tussen de twee variabelen. Wanneer we twee afhankelijke variabelen hebben, zeg X en Y, kunnen we de variatie binnen de waarden van X bestuderen - dit is sigma_x ^ 2 de variatie binnen de waarden van Y is de variantie van y sigma_y ^ 2. De studie van de gelijktijdige variatie tussen X en Y wordt COV (X, Y) of sigma_ (xy) genoemd. Lees verder »
Wat vertelt een regressieanalyse u? + Voorbeeld
Het onthult de vorm van de relatie tussen variabelen. Raadpleeg mijn antwoord over Wat is een regressieanalyse ?. Het onthult de vorm van de relatie tussen variabelen. Bijvoorbeeld, of de relatie sterk positief gerelateerd is, sterk negatief gerelateerd of er is geen relatie. Er wordt bijvoorbeeld verondersteld dat regenval en landbouwproductiviteit sterk gecorreleerd zijn, maar relatie is niet bekend. Als we de gewasopbrengst identificeren om de productiviteit van de landbouw aan te duiden, en rekening houden met twee variabelen gewasopbrengst y en regenval x. Constructie van regressielijnen van y op x is logisch en zou d Lees verder »
Hoe extrapoleer je met een lineaire regressielijn?
Wanneer we regressielijn gebruiken om een punt te voorspellen waarvan de x-waarde buiten het bereik van x-waarden van trainingsgegevens ligt, wordt dit extrapolatie genoemd. Om (opzettelijk) te extrapoleren gebruiken we gewoon de regressielijn om waarden te voorspellen die verre van trainingsgegevens zijn. Merk op dat extrapolatie geen betrouwbare voorspellingen oplevert omdat de regressielijn buiten het trainingsdatabereik mogelijk niet geldig is. Lees verder »
Wat zegt een z-score? + Voorbeeld
De Z-score vertelt u de positie van een waarneming in relatie tot de rest van de verdeling, gemeten in standaarddeviaties, wanneer de gegevens een normale verdeling hebben. Je ziet positie meestal als een X-waarde, die de werkelijke waarde van de waarneming aangeeft. Dit is intuïtief, maar het is niet mogelijk om observaties van verschillende distributies te vergelijken. Je moet ook je X-score omzetten naar Z-scores, zodat je de standaard normale verdelingstabellen kunt gebruiken om waarden op te zoeken met betrekking tot de Z-score. U wilt bijvoorbeeld weten of de pitchersnelheid van een achtjarige ongewoon goed is i Lees verder »
Wat betekent "correlatie versus oorzakelijkheid" in statistieken?
Correlatie: twee variabelen hebben de neiging om samen te variëren. Voor een positieve correlatie, als een variabele toeneemt, neemt de andere ook toe in de gegeven gegevens. Oorzaak: één variabele veroorzaakt de wijzigingen in een andere variabele. Aanzienlijk verschil: correlatie kan gewoon toeval zijn. Of misschien verandert een derde variabele de twee. Bijvoorbeeld: er is een verband tussen "naar slaap gaan met schoenen dragen" en "wakker worden met hoofdpijn". Maar deze relatie is niet causaal, omdat de echte reden voor dit toeval (te veel) alcohol is. Lees verder »
Maak de waarheidstabel van de propositie ¬q [(pΛq) V ~ p]?
Zie hieronder. Gegeven: niet p -> [(p ^^ q) vv ~ p] Logische operatoren: "not p:" not p, ~ p; "en:" ^^; of: vv Logic Tables, negation: ul (| "" p | "" q | "" ~ p | "" ~ q |) "" T | "" T | "" F | "" F | "" T | "" F | "" F | "" T | "" F | "" T | "" T | "" F | "" F | "" F | "" T | "" T | Logische tabellen, en & of: ul (| "" p | "" q | "" p ^^ q "" | "" q Lees verder »
Een paar eerlijke zeszijdige dobbelstenen wordt acht keer gegooid. Vindt u de kans dat een score groter dan 7 niet vaker dan vijf keer wordt gescoord?
~ = 0.9391 Voordat we de vraag zelf bespreken, laten we het hebben over de methode om het op te lossen. Laten we bijvoorbeeld zeggen dat ik alle mogelijke resultaten wil afrekenen uit het drie keer omdraaien van een eerlijke munt. Ik kan HHH, TTT, TTH en HHT krijgen. De kans op H is 1/2 en de kans op T is ook 1/2. Voor HHH en voor TTT is dat 1 / 2xx1 / 2xx1 / 2 = 1/8 elk. Voor TTH en HHT is het ook 1 / 2xx1 / 2xx1 / 2 = 1/8 elk, maar omdat er 3 manieren zijn om elk resultaat te krijgen, wordt het uiteindelijk 3xx1 / 8 = 3/8. Wanneer ik deze resultaten samenvat, krijg ik 1/8 + 3/8 + 3/8 + 1/8 = 1 - wat betekent dat ik nu al Lees verder »
Wat betekent kwalitatieve, kwantitatieve gegevens, discrete en continue betekenis?
Snelle definities Kwantitatieve gegevens zijn getallen: hoogten; gewichten; snelheden; aantal huisdieren in eigendom; jaar; etc. Kwalitatieve gegevens zijn geen cijfers. Ze kunnen favoriete voedingsmiddelen bevatten; godsdiensten; etnische groepen; enz. .. Discrete gegevens zijn getallen die specifieke, gescheiden waarden kunnen aannemen. Als u bijvoorbeeld één dobbelsteen gooit, krijgt u 1, 2, 3, 4, 5 of 6. U kunt geen waarde van 3,75 krijgen. Continue gegevens zijn getallen die allerlei decimale of fractionele waarden kunnen aannemen. Uw gewicht kan bijvoorbeeld precies worden gemeten als 92,234 kilogram. Uw sn Lees verder »
Wat vertelt het interkwartielbereik ons?
Men zou vaak naar de IQR (Interquartile Range) kijken om een meer "realistisch" beeld van de gegevens te krijgen, omdat daarmee de uitschieters in onze gegevens zouden verdwijnen. Dus als u een gegevensverzameling had zoals 4,6,5,7,2,6,4,8,2956. Als we dan het gemiddelde van alleen onze IQR zouden moeten nemen, zou het meer "realistisch" zijn voor onze gegevensverzameling, alsof we gewoon het normale gemiddelde hebben aangenomen, die ene waarde van 2956 zal de gegevens behoorlijk verpesten. een uitbijter als zodanig zou kunnen komen van iets eenvoudigs als een typefout, dus dat laat zien hoe het nuttig Lees verder »
Wat meet variantie? + Voorbeeld
Zoals de naam van het onderwerp aangeeft, is de variantie een "maat van de variabiliteit". De variantie is een maat voor de variabiliteit. Het betekent dat u voor een reeks gegevens kunt zeggen: "Hoe hoger de variantie, hoe meer verschillende gegevens". Voorbeelden Een set gegevens met kleine verschillen. A = {1,3,3,3,3,4} bar (x) = (1 + 3 + 3 + 3 + 3 + 4) / 6 = 18/6 = 3 sigma ^ 2 = 1/6 * ( (2-3) ^ 2 + 4 * (3-3) ^ 2 + (4-3) ^ 2) sigma ^ 2 = 1/6 * (1 + 1) sigma ^ 2 = 1/3 Een set gegevens met grotere verschillen. B = {2,4,2,4,2,4} bar (x) = (2 + 4 + 2 + 4 + 2 + 4) / 6 = 18/6 = 3 sigma ^ 2 = 1/6 * ( 3 * (2 Lees verder »
Wat duiden maatregelen van centrale tendens aan?
Centrale waarde die de weergave van volledige gegevens is. > Als we kijken naar de frequentieverdelingen die we in de praktijk tegenkomen, zullen we merken dat de variabele waarden rond een centrale waarde clusteren; met andere woorden, de meeste waarden liggen in een klein interval rond een centrale waarde. Deze eigenschap wordt de centrale neiging van een frequentieverdeling genoemd. De centrale waarde, die wordt opgevat als een weergave van volledige gegevens, wordt een maat voor centrale tendentie of een gemiddelde genoemd. Met betrekking tot een frequentieverdeling wordt een gemiddelde ook wel een locatiemaat genoe Lees verder »
Wat betekenen de termen nominaal, ordinaal, ratio, interval, discreet en continu gemiddelde en verwijzen naar?
Nominaal niveau - Alleen labels gegevens in verschillende categorieën, bijvoorbeeld categoriseren als: mannelijk of vrouwelijk ordonniveau - Gegevens kunnen worden gerangschikt en besteld, maar verschil is niet logisch, bijvoorbeeld: rangorde als 1e, Tweede en 3e. Intervalniveau - Gegevens kunnen worden besteld en er kunnen verschillen worden gemaakt, maar vermenigvuldigen / delen is niet mogelijk. bijvoorbeeld: categoriseren als verschillende jaren zoals 2011, 2012, enz. Verhoudingsniveau - bestellen, verschil en vermenigvuldigen / delen - alle bewerkingen zijn mogelijk. Bijvoorbeeld: leeftijd in jaren, temperatuur i Lees verder »
Welke informatie biedt een ogive?
Ogive is een andere naam van een cumulatieve frequentiecurve. Op elk punt van het ogief krijgen we het aantal waarnemingen minder dan de abscis van dat punt. Dit antwoord wordt gegeven door minder dan ogief in overweging te nemen. Anders geeft de curve het aantal waarnemingen groter dan de x-as. Minder dan cumulatieve frequentieverdeling kan worden verkregen door opeenvolgend frequenties van klassen toe te voegen en deze te schrijven tegen bovengrenzen van klassen. Lees verder »
Eén kaart wordt willekeurig geselecteerd uit een standaard kaartspel van 52. wat is de waarschijnlijkheid dat de geselecteerde kaart rood is of een kaart?
(32/52) In een spel kaarten zijn de helft van de kaarten rood (26) en (ervan uitgaande dat er geen jokers zijn) hebben we 4 boeren, 4 koninginnen en 4 koningen (12). Van de beeldkaarten zijn 2 aansluitingen, 2 koninginnen en 2 koningen rood. Wat we willen vinden is "de kans op het tekenen van een rode kaart OF een fotokaart". Onze relevante kansen zijn die van het tekenen van een rode kaart of een fotokaart. P (rood) = (26/52) P (foto) = (12/52) Voor gecombineerde gebeurtenissen gebruiken we de formule: P (A uu B) = P (A) + P (B) -P (A nn B) Wat zich vertaalt naar: P (beeld of rood) = P (rood) + P (foto) -P (rood Lees verder »
Waar zal een voorspellingsinterval of een betrouwbaarheidsinterval smaller zijn: nabij het gemiddelde of verder van het gemiddelde?
Zowel de voorspelling als het betrouwbaarheidsinterval zijn smaller in de buurt van het gemiddelde, dit is eenvoudig te zien in de formule van de corresponderende foutenmarge. Hierna volgt de foutmarge van het betrouwbaarheidsinterval. E = t _ { alpha / 2, df = n-2} times s_e sqrt {( frac {1} {n} + frac {(x_0 - bar {x}) ^ 2} {S_ {xx }})} Hierna volgt de foutmarge voor het voorspellingsinterval E = t _ { alpha / 2, df = n-2} times s_e sqrt {(1 + frac {1} {n} + frac {( x_0 - bar {x}) ^ 2} {S_ {xx}})} In beide zien we de term (x_0 - bar {x}) ^ 2, die schaalt als het kwadraat van de afstand van de voorspellingspunt van gemidde Lees verder »
Een verzameling van 22 laptops bevat 6 defecte laptops. Als een steekproef van 3 laptops willekeurig wordt gekozen uit de verzameling, wat is dan de kans dat ten minste één laptop in de steekproef defect is?
Circa 61,5% De kans dat een laptop defect is is (6/22) De kans dat een laptop niet defect is is (16/22) De kans dat minstens één laptop defect is, wordt veroorzaakt door: P (1 defect) + P (2 defect) + P (3 defect), omdat deze waarschijnlijkheid cumulatief is. Laat X het aantal laptops zijn waarvan is vastgesteld dat ze defect zijn. P (X = 1) = (3 kies 1) (6/22) ^ 1 keer (16/22) ^ 2 = 0.43275 P (X = 2) = (3 kies 2) (6/22) ^ 2 keer ( 16/22) ^ 1 = 0.16228 P (X = 3) = (3 kies 3) (6/22) ^ 3 = 0.02028 (som alle kansen op) = 0.61531 approx 0.615 Lees verder »
Wat is een bimodale verdeling? + Voorbeeld
De letters "bi" betekent twee. Een bimodale verdeling heeft dus twee modi. {1,2,3,3,3,5,8,12,12,12,12,18} is bijvoorbeeld bimodaal met zowel 3 als 12 als afzonderlijke onderscheiden modi. Merk op dat de modi niet dezelfde frequentie hoeven te hebben. Hoop die heeft geholpen Bron: http://www.fao.org/wairdocs/ilri/x5469e/x5469e0e.htm Lees verder »
Wat is een bimodale grafiek? + Voorbeeld
Een bimodale grafiek illustreert een bimodale verdeling, die zelf wordt gedefinieerd als een continue kansverdeling met twee modi. Over het algemeen zal de grafiek van de kansdichtheidsfunctie van deze verdeling lijken op een "two-humped" verdeling; dat wil zeggen, in plaats van de enkele piek die aanwezig is in een normale verdeling of belkromme, zal de grafiek twee pieken hebben. Bimodale verdelingen, hoewel misschien minder vaak dan normale verdelingen, komen nog steeds voor in de natuur. Het lymfoom van Hodgkin is bijvoorbeeld een ziekte die vaker voorkomt binnen twee specifieke leeftijdsgroepen dan bij mense Lees verder »
Wat is een prullenbak in een histogram? + Voorbeeld
De "bin" in een histogram is de keuze van eenheid en afstand op de X-as.Alle gegevens in een waarschijnlijkheidsverdeling die visueel wordt weergegeven door een histogram, worden in de overeenkomstige bins gevuld. De hoogte van elke bak is een maat voor de frequentie waarmee gegevens verschijnen binnen het bereik van die bak in de verdeling. Bij wijze van voorbeeld, in dit onderstaande voorbeeldhistogram, is elke balk die omhoog loopt vanaf de X-as een enkele bin. En in de bak van hoogte 75 tot hoogte 80 zijn er 10 gegevenspunten (in dit geval zijn er 10 kersenbomen met een hoogte tussen 75 en 80 voet). Bron: Wik Lees verder »
Wat is een binomiale verdeling?
Zie de volledige uitleg gepresenteerd. Wanneer we 100 munten hebben en we geven die munten op een willekeurige manier aan een groep mensen, wordt er gezegd dat we munten verdelen. Op een vergelijkbare manier, wanneer de totale waarschijnlijkheid (die 1 is) wordt verdeeld over de verschillende waarden die zijn geassocieerd met de willekeurige variabele, verdelen we de kans. Daarom wordt het een kansverdeling genoemd. Als er een regel is die bepaalt welke waarschijnlijkheid aan welke waarde moet worden toegewezen, wordt een dergelijke regel de kansverdelingsfunctie genoemd. De binomiale verdeling krijgt zijn naam omdat de re Lees verder »
Wat is een chi-kwadraat distributie?
De chikwadraatverdeling is een van de meest gebruikte verdelingen en is de verdeling van de chikwadraatstatistiek. De chikwadraatverdeling is een van de meest gebruikte distributies. Het is de verdeling van de som van gekwadrateerde standaardnormale afwijkingen. Het gemiddelde van de verdeling is gelijk aan de vrijheidsgraden en de variantie van de chikwadraatverdeling is twee vermenigvuldigd met de vrijheidsgraden. Dit is de verdeling die wordt gebruikt bij het uitvoeren van een chikwadraat-test waarbij waargenomen versus verwachte waarden worden vergeleken en bij het uitvoeren van een chi-kwadraattest om te testen op ver Lees verder »
Wat is een chi-kwadraat test voor onafhankelijkheid? + Voorbeeld
Een chi-kwadraattest voor onafhankelijkheidstests als er een significante relatie is tussen twee of meer groepen categorische gegevens van dezelfde populatie. Een chi-kwadraattest voor onafhankelijkheidstests als er een significante relatie is tussen twee of meer groepen categorische gegevens van dezelfde populatie. De nulhypothese voor deze test is dat er geen relatie is. Het is een van de meest gebruikte tests in statistieken. Als u deze test wilt gebruiken, moeten uw waarnemingen onafhankelijk zijn en moeten uw verwachte waarden groter zijn dan vijf. De vergelijking om een chikwadraat met de hand te berekenen is Hier i Lees verder »
Wat is een chi-kwadraattest die wordt gebruikt om te meten?
De chi ^ 2-test wordt gebruikt om te onderzoeken of distributies van categorische variabelen van elkaar verschillen. De chi ^ 2-test kan alleen worden gebruikt op werkelijke getallen, niet op percentages, verhoudingen of gemiddelden. De chi ^ 2-statistiek vergelijkt de reeksen of tellingen van categorische responsen tussen twee of meer onafhankelijke groepen. Samengevat: de chi ^ 2-test wordt gebruikt om te onderzoeken of distributies van categorische variabelen van elkaar verschillen. Lees verder »
Wat is een combinatie? + Voorbeeld
Zie hieronder: Een combinatie is een groepering van verschillende objecten zonder rekening te houden met de volgorde waarin de groepering is gemaakt. Bijvoorbeeld, een pokerhand is een combinatie - het kan ons niet schelen in welke volgorde we de kaarten delen, alleen dat we een Royal Flush (of een paar 3's) hebben. De formule voor het vinden van een combinatie is: C_ (n, k) = ((n), (k)) = (n!) / ((K!) (Nk)!) Met n = "populatie", k = " picks "Als een, bijvoorbeeld, het aantal mogelijke 5-kaart pokerhanden is: C_ (52,5) = (52!) / ((5)! (52-5)!) = (52!) / (( 5!) (47!)) Laten we het evalueren! (52xx51x Lees verder »
Wat is een gewijzigd boxplot?
Een standaard box- en whiskerplot is een visuele weergave van alle gegevenspunten, inclusief de punten uiterst links of helemaal rechts in de gegevensverzameling. Dergelijke extreme gegevenspunten worden 'uitschieters' genoemd. In tegenstelling tot de standaard boxplot, bevat een aangepast boxplot geen uitschieters. In plaats daarvan worden de uitbijters weergegeven als punten voorbij de 'snorharen', om de verspreiding van de gegevens nauwkeuriger weer te geven. Lees verder »
Wat is een F-test?
F-Test. De F-test is een statistisch testmechanisme dat is ontworpen om de gelijkheid van populatievarianties te testen. Het doet dit door de verhouding van de varianties te vergelijken. Dus, als de varianties gelijk zijn, zal de verhouding van de varianties 1 zijn. Alle hypothesetests worden uitgevoerd onder de aanname dat de nulhypothese waar is. Lees verder »
Wat is ANOVA? + Voorbeeld
We gebruiken een ANOVA om te testen op significante verschillen tussen gemiddelden. We gebruiken een ANOVA, of variantie-analyse, om te testen op significante verschillen tussen gemiddelden van meerdere groepen. Als we bijvoorbeeld willen weten of de gemiddelde GPA van biologie, chemie, natuurkunde en calculus majors anders is, kunnen we een ANOVA gebruiken. Als we slechts twee groepen hadden, zou onze ANOVA hetzelfde zijn als een t-toets. Er zijn drie basisaannames van een ANOVA: Afhankelijke variabelen in elke groep zijn normaal verdeeld Populatievarianties in elke groep zijn gelijk Observaties zijn onafhankelijk van elk Lees verder »
Wat is een numerieke variabele en wat is een categoriale variabele?
Zie hieronder. Een categorische variabele is een categorie of type. Haarkleur is bijvoorbeeld een categorische waarde of geboorteplaats is een categorische variabele. Soorten, behandelingstype en geslacht zijn allemaal categorische variabelen. Een numerieke variabele is een variabele waarbij de meting of het nummer een numerieke betekenis heeft. Totale neerslag gemeten in inches is bijvoorbeeld een numerieke waarde, de hartslag is een numerieke waarde, het aantal cheeseburgers verbruikt in een uur is een numerieke waarde. Een categorische variabele kan worden uitgedrukt als een getal voor statistische doeleinden, maar deze Lees verder »
Wat is een unidirectionele ANOVA? + Voorbeeld
Een éénrichtings-ANOVA is een ANOVA waarbij u één onafhankelijke variabele heeft die meer dan twee toestanden heeft. Voor twee of meer onafhankelijke variabelen gebruikt u een bidirectionele ANOVA. Een éénrichtings-ANOVA is een ANOVA waarbij u één onafhankelijke variabele heeft met meer dan twee voorwaarden. Dit staat in contrast met een tweewegs ANOVA waarbij u twee onafhankelijke variabelen hebt en elk meerdere voorwaarden heeft. U zou bijvoorbeeld een one-way ANOVA gebruiken als u de effecten van koffiemerken op de hartslag wilt bepalen. Uw onafhankelijke variabele is het koffieme Lees verder »
Wat is een willekeurige gebeurtenis in de kans? + Voorbeeld
Een concept van een evenement is van groot belang in de Theory of Probabilities. Eigenlijk is het een van de fundamentele concepten, zoals een punt in de geometrie of vergelijking in Algebra. Allereerst beschouwen we een willekeurig experiment - elke fysieke of mentale handeling die een bepaald aantal uitkomsten heeft. We tellen bijvoorbeeld geld in onze portemonnee of voorspellen de beursindexwaarde van morgen. In beide en vele andere gevallen resulteert het willekeurige experiment in bepaalde uitkomsten (de exacte hoeveelheid geld, de exacte waarde van de aandelenmarktindex, enz.). Deze individuele uitkomsten worden elem Lees verder »
Wat is een willekeurige variabele? Wat is een voorbeeld van een discrete willekeurige variabele en een continue willekeurige variabele?
Zie onder. Een willekeurige variabele is een numerieke uitkomst van een reeks mogelijke waarden uit een willekeurig experiment. We selecteren bijvoorbeeld willekeurig een schoen uit een schoenenwinkel en zoeken twee numerieke waarden van de grootte en de prijs. Een afzonderlijke willekeurige variabele heeft een eindig aantal mogelijke waarden of een oneindige reeks telbare reële getallen. Bijvoorbeeld de grootte van schoenen, die slechts een eindig aantal mogelijke waarden kan aannemen. Terwijl een continue willekeurige variabele alle waarden in een interval van reële getallen kan aannemen. De prijs van schoenen Lees verder »
Wat is een regressieanalyse?
Regressieanalyse is een statistisch proces voor het schatten van de relaties tussen variabelen. Regressieanalyse is een statistisch proces voor het schatten van de relaties tussen variabelen. Het is een generieke term voor alle methoden die proberen een model aan te passen aan geobserveerde gegevens om de relatie tussen twee groepen variabelen te kwantificeren, waarbij de nadruk ligt op de relatie tussen een afhankelijke variabele en een of meer onafhankelijke variabelen. De relatie is echter mogelijk niet exact voor alle waargenomen gegevenspunten. Vandaar dat een dergelijke analyse vaak een foutelement bevat dat is ge Lees verder »
Wat is een relatieve frequentieverdeling?
Het is een frequentieverdeling waarin alle getallen worden weergegeven als een breuk of percentage van de volledige steekproefomvang. Er is echt niets meer aan de hand. Je telt alle frequentienummers bij elkaar op om een totaal te krijgen = jouw steekproefomvang. Vervolgens deel je elk frequentienummer door je steekproefomvang om een relatieve frequentiefractie te krijgen. Vermenigvuldig deze fractie met 100 om een percentage te krijgen. U kunt deze percentages (of breuken) in een afzonderlijke kolom invoegen na uw frequentienummers. Cumulatieve frequentie Als u waarden hebt besteld, zoals testscores op een schaal van 1 Lees verder »
Wat is een relatieve frequentietabel en waarvoor wordt deze gebruikt?
Een relatieve frequentietabel is een tabel die tellingen van gegevens in percentagevorm, ofwel relatieve frequentie, bijhoudt. Het wordt gebruikt als u categorieën binnen de tabel probeert te vergelijken. Dit is een relatieve frequentietabel. Merk op dat de waarden van de cellen in de tabel in procenten zijn in plaats van in werkelijke frequenties. U vindt deze waarden door de individuele frequenties boven het rijtotaal te plaatsen. Het voordeel van relatieve frequentietabellen boven frequentietabellen is dat u met percentages categorieën kunt vergelijken. Lees verder »
Wat is een voorbeeldcovariantie? + Voorbeeld
De steekproef-covariantie is een maat voor hoe sterk variabelen binnen een steekproef van elkaar verschillen. Covariance vertelt u hoe twee variabelen op lineaire schaal aan elkaar gerelateerd zijn. Het vertelt je hoe sterk gecorreleerd je X is met je Y. Als je covariantie bijvoorbeeld groter is dan nul, betekent dit dat je Y toeneemt naarmate je X toeneemt. Een steekproef in statistieken is slechts een subset van een grotere populatie of groep. U kunt bijvoorbeeld een voorbeeld van een basisschool in het land nemen in plaats van gegevens te verzamelen van elke basisschool in het land. Aldus is monster-covariantie eenvoudi Lees verder »
Wat is een unimodale verdeling?
Een unimodale distributie is een distributie met één modus. Een unimodale distributie is een distributie met één modus. We zien een duidelijke piek in de gegevens. De afbeelding hieronder toont een unimodale verdeling: een bimodale verdeling ziet er daarentegen als volgt uit: In de eerste afbeelding zien we één piek. In de tweede afbeelding zien we dat er twee pieken zijn. Een unimodale verdeling kan normaal worden verspreid, maar dat hoeft niet zo te zijn. Lees verder »
Wat is centrale tendens?
Zie de toelichting Wanneer een grote hoeveelheid numerieke gegevens beschikbaar is, is het niet altijd mogelijk om elke afzonderlijke numerieke gegevens te onderzoeken en tot een conclusie te komen. Daarom is het nodig om de gegevens te beperken tot een of een aantal cijfers, zodat vergelijking mogelijk is. Het is met dit doel dat we maatregelen van centrale tendens gedefinieerd in Statistieken hebben. Een maat voor centrale tendens geeft ons één numerieke waarde die kan worden gebruikt voor vergelijking. Daarom moet het een getal zijn dat gecentreerd is rond het grote gegevensvolume - een punt van zwaartekrachtw Lees verder »
Wat zijn discrete, categorische, ordinale, numerieke, niet-numerieke en continue gegevens?
Grotendeels zijn er twee soorten gegevenssets - Categorisch of kwalitatief - Numeriek of kwantitatief A categorische gegevens of niet-numerieke gegevens - waarbij variabele de waarde van waarnemingen in de vorm van categorieën heeft, verder kan deze twee typen hebben: a. Nominaal b. Ordinal a.Nominale gegevens hebben benamingscategorieën b.v. Burgerlijke staat zal een nominale gegevens zijn, omdat het waarnemingen in de volgende categorieën krijgt: ongehuwd, gehuwd, gescheiden / gescheiden, weduwnaar b. Oordelijke gegevens zullen ook benamingscategorieën aannemen, maar categorieën zullen rang hebbe Lees verder »
Wat wordt bedoeld met de scheefheid van een distributie?
Een normale verdeling is volledig symmetrisch, een schuine verdeling is dat niet. In een positief scheve verdeling is de "teen" aan de grotere kant langer dan aan de andere kant, waardoor de mediaan, en met name het gemiddelde, naar rechts beweegt. In een negatief scheef verdeling bewegen deze naar links, vanwege een langere "teen" bij de kleinere waarden. In een niet-scheve normale distributiemodus hebben mediaan en gemiddelde allemaal dezelfde waarde. (foto's van internet) Lees verder »
Wat wordt bedoeld met de term "kleinste vierkanten" bij lineaire regressie?
Dit alles betekent het minimum tussen de som van het verschil tussen de werkelijke y-waarde en de voorspelde y-waarde. min sum_ (i = 1) ^ n (y_i-haty) ^ 2 Betekent alleen het minimum tussen de som van alle resuidals min sum_ (i = 1) ^ nhatu_i ^ 2 al dit betekent is het minimum tussen de som van het verschil tussen de werkelijke y-waarde en de voorspelde y-waarde. min sum_ (i = 1) ^ n (y_i-haty) ^ 2 Op deze manier minimaliseert u de fout tussen de voorspelde en de fout die u het best geschikt maakt voor de regressielijn. Lees verder »