Voorbeeld
Probeer eens de diameter van een tennisbal te meten met de meterstok. Wat is de onzekerheid in deze meting?
Ondanks dat het metertje tot op 0,1 cm nauwkeurig kan worden afgelezen, kun je de diameter waarschijnlijk niet tot op 0,1 cm nauwkeurig bepalen.
- Welke factoren beperken je vermogen om de diameter van de bal te bepalen?
- Wat is een realistischer schatting van de onzekerheid in je meting van de diameter van de bal?
Antwoorden: Het is moeilijk om de rand van de bal op één lijn te krijgen met de markeringen op de liniaal en de foto is wazig. Ook al zijn er markeringen op de liniaal voor elke 0,1 cm, alleen de markeringen op elke 0,5 cm zijn duidelijk te zien. Ik denk dat ik betrouwbaar kan meten waar de rand van de tennisbal is tot op ongeveer de helft van een van deze markeringen, of ongeveer 0,2 cm. De linkerrand ligt op ongeveer 50,2 cm en de rechterrand op ongeveer 56,5 cm, dus de diameter van de bal is ongeveer 6,3 cm ± 0,2 cm.
Een ander voorbeeld
Probeer eens de dikte van een CD-doosje te bepalen aan de hand van dit plaatje.
- Hoe kun je de dikte van een enkel CD-doosje zo nauwkeurig mogelijk opmeten aan de hand van dit plaatje? (Ook al is de liniaal wazig, je kunt de dikte van een enkel hoesje tot op minder dan 0,1 cm nauwkeurig bepalen)
- Gebruik de methode die je zojuist hebt beschreven om de dikte van een enkel hoesje te bepalen (en de onzekerheid in die meting)
- Welke impliciete aanname(n) maak je over de CD-doosjes?
Antwoorden: De beste manier om de meting te doen is de dikte van de stapel te meten en te delen door het aantal hoesjes in de stapel. Op die manier wordt de onzekerheid in de meting uitgesmeerd over alle 36 CD-doosjes. Het is moeilijk om de liniaal op de foto dichter af te lezen dan binnen ongeveer 0,2 cm (zie vorig voorbeeld). De stapel begint bij ongeveer 16,5 cm en eindigt bij ongeveer 54,5 cm, dus de stapel is ongeveer 38,0 cm ± 0,2 cm lang. Deel de lengte van de stapel door het aantal CD-doosjes in de stapel (36) om de dikte van een enkel doosje te krijgen: 1,056 cm ± 0,006 cm. Door de onzekerheid over de hele stapel “uit te spreiden”, krijgt men een meting die nauwkeuriger is dan wat kan worden bepaald door slechts één van de dozen met dezelfde liniaal te meten. We nemen aan dat alle kisten even dik zijn en dat er geen ruimte tussen de kisten is.
Onzekerheid schatten uit meerdere metingen
Een manier om je vertrouwen in experimentele gegevens te vergroten is door dezelfde meting vele malen te herhalen. Een manier om bijvoorbeeld te schatten hoe lang het duurt voordat iets gebeurt, is door het één keer te timen met een stopwatch. Je kunt de onzekerheid in deze schatting verkleinen door dezelfde meting meerdere keren te doen en het gemiddelde te nemen. Hoe meer metingen je doet (mits er geen problemen zijn met de klok!), hoe beter je schatting zal zijn.
Met meerdere metingen kun je ook de onzekerheid in je metingen beter inschatten door na te gaan hoe reproduceerbaar de metingen zijn. Hoe nauwkeurig je schatting van de tijd is, hangt af van de spreiding van de metingen (vaak gemeten met een statistiek die standaarddeviatie wordt genoemd) en het aantal (N) herhaalde metingen dat je doet.
Bedenk het volgende voorbeeld: Maria heeft met dezelfde stopwatch getimed hoe lang het duurt voordat een stalen bal van de bovenkant van een tafel op de grond valt. Ze kreeg de volgende gegevens:
0,32 s, 0,54 s, 0,44 s, 0,29 s, 0,48 s
Door vijf metingen te doen, heeft Maria de onzekerheid in de tijdmeting aanzienlijk verkleind. Maria heeft ook een ruwe schatting van de onzekerheid in haar gegevens; het is zeer waarschijnlijk dat de “ware” tijd die de bal nodig heeft om te vallen, ergens tussen 0,29 s en 0,54 s ligt. Om een meer verfijnde schatting van de onzekerheid te krijgen, is statistiek nodig.
Enkele statistische begrippen
Bij herhaalde metingen zijn er drie belangrijke statistische grootheden: gemiddelde (of gemiddelde), standaardafwijking en standaardfout. Deze zijn in onderstaande tabel samengevat:
Statistiek | Wat het is | Statistische interpretatie | Symbool |
gemiddelde | een schatting van de “ware” waarde van de meting | de centrale waarde | xave |
standaardafwijking | een maat voor de “spreiding” in de gegevens | Je kunt er redelijk zeker van zijn (ongeveer 70% zeker) dat als je dezelfde meting nog een keer herhaalt, die volgende meting minder dan één standaardafwijking van het gemiddelde verwijderd zal zijn. | s |
standaardafwijking | een schatting van de onzekerheid in het gemiddelde van de metingen | Je kunt er redelijk zeker van zijn (ongeveer 70% zeker) dat als je het hele experiment nog een keer doet met hetzelfde aantal herhalingen, de gemiddelde waarde uit het nieuwe experiment minder dan één standaardafwijking verwijderd zal zijn van de gemiddelde waarde uit dit experiment. | SE |
Maria’s gegevens opnieuw bekeken
De statistieken voor Maria’s stopwatchgegevens staan hieronder:
- xave = 0,41 s
- s = 0,11 s
- SE = 0,05 s
Het is vrij duidelijk wat het gemiddelde betekent, maar wat zeggen de andere statistieken over Maria’s gegevens?
- Standaardafwijking: Als Maria de val van het voorwerp nog een keer zou timen, is de kans groot (ongeveer 70%) dat de stopwatch-aflezing die ze krijgt binnen één standaardafwijking van het gemiddelde zal liggen. Met andere woorden, de volgende keer dat ze de tijd van de val meet, is er ongeveer 70% kans dat de stopwatchaflezing die ze krijgt tussen (0,41 s – 0,11 s) en (0,41 s + 0,11 s) ligt.
- Standaardafwijking: Als Maria het hele experiment (alle vijf metingen) over zou doen, is er een goede kans (ongeveer 70%) dat het gemiddelde van die vijf nieuwe metingen binnen één standaardfout van het gemiddelde zal liggen. Met andere woorden, de volgende keer dat Maria alle vijf de metingen herhaalt, zal het gemiddelde liggen tussen (0,41 s – 0,05 s) en (0,41 s + 0,05 s).
Berekenen van de statistieken met behulp van Excel
Spreadsheetprogramma’s (zoals Microsoft Excel) kunnen gemakkelijk statistieken berekenen. Als je de gegevens eenmaal in Excel hebt, kun je het ingebouwde statistiekpakket gebruiken om het gemiddelde en de standaardafwijking te berekenen.
Om het gemiddelde van de cellen A4 tot en met A8 te berekenen:
|
|
Om de standaardafwijking van de vijf getallen te berekenen, gebruikt u Excel’s ingebouwde STDEV-functie. | Excel heeft geen standaardfoutfunctie, dus je moet de formule voor standaardfout gebruiken:
waarbij N het aantal waarnemingen is |
Onzekerheid in berekeningen
Wat nu als je de onzekerheid wilt bepalen voor een grootheid die uit een of meer metingen is berekend? Er zijn ingewikkelde en minder ingewikkelde methoden om dit te doen. In deze cursus zullen we de eenvoudige methode gebruiken. De methode van de Upper-Lower Bounds voor de onzekerheid in berekeningen is formeel niet zo correct, maar volstaat wel. Het basisidee van deze methode is om de onzekerheidsbereiken van elke variabele te gebruiken om de maximum- en minimumwaarden van de functie te berekenen. U kunt deze procedure ook beschouwen als het bepalen van het beste en het slechtste scenario. Als u bijvoorbeeld de oppervlakte van een vierkant wilt bepalen en één zijde meet als een lengte van 1,2 +/- 0,2 m en de andere lengte als 1,3 +/- 0,3 meter, dan zou de oppervlakte zijn: