Wie und warum wird die Ausreißerfunktion in Excel verwendet?
Ein Ausreißer ist ein Wert, der wesentlich höher oder niedriger ist als die meisten Werte in Ihren Daten. Bei der Analyse von Daten in Excel können Ausreißer die Ergebnisse verzerren. Beispielsweise kann der Durchschnittsmittelwert eines Datensatzes Ihre Werte wirklich widerspiegeln. Excel bietet einige nützliche Funktionen zum Verwalten Ihrer Ausreißer. Schauen wir uns das an.
Ein kurzes Beispiel
In der Abbildung unten sind die Ausreißer relativ leicht zu erkennen - der Wert von zwei, der Eric zugewiesen wurde, und der Wert von 173, der Ryan zugewiesen wurde. Bei einem Datensatz wie diesem ist es leicht genug, diese Ausreißer manuell zu erkennen und damit umzugehen.
Bei einer größeren Datenmenge ist dies nicht der Fall. Es ist wichtig, Ausreißer zu identifizieren und aus statistischen Berechnungen zu entfernen. Dies wird in diesem Artikel beschrieben.
So finden Sie Ausreißer in Ihren Daten
Um die Ausreißer in einem Datensatz zu finden, gehen wir folgendermaßen vor:
- Berechnen Sie das 1. und 3. Quartil (wir werden kurz darüber sprechen, worum es sich handelt.).
- Bewerten Sie den Interquartilsbereich (wir werden diesen auch etwas weiter unten erklären).
- Geben Sie die oberen und unteren Grenzen unseres Datenbereichs wieder.
- Verwenden Sie diese Grenzen, um die äußeren Datenpunkte zu identifizieren.
Der Zellenbereich rechts neben dem Datensatz, der im Bild unten zu sehen ist, wird zum Speichern dieser Werte verwendet.
Lass uns anfangen.
Schritt 1: Berechnen Sie die Quartile
Wenn Sie Ihre Daten in Viertel unterteilen, wird jedes dieser Sätze Quartil genannt. Die niedrigsten 25% der Zahlen im Bereich machen das 1. Quartil aus, die nächsten 25% das 2. Quartil und so weiter. Wir machen diesen Schritt zuerst, weil die am weitesten verbreitete Definition eines Ausreißers ein Datenpunkt ist, der mehr als 1,5 Interquartilbereiche (IQRs) unterhalb des 1. Quartils und 1,5 Interquartilbereiche oberhalb des 3. Quartils liegt. Um diese Werte zu bestimmen, müssen wir zuerst herausfinden, was die Quartile sind.
Excel bietet eine QUARTILE-Funktion zum Berechnen von Quartilen. Es werden zwei Informationen benötigt: das Array und das Quart.
= QUARTILE (Array, Quart)
Das Array ist der Wertebereich, den Sie auswerten. Und das Quart ist eine Zahl, die das Quartil darstellt, das Sie zurückgeben möchten (z. B. 1 für 1)st Quartil, 2 für das 2. Quartil usw.).
Hinweis: In Excel 2010 hat Microsoft die Funktionen QUARTILE.INC und QUARTILE.EXC als Verbesserungen der Funktion QUARTILE veröffentlicht. QUARTILE ist abwärtskompatibel, wenn Sie mehrere Versionen von Excel verwenden.
Kehren wir zu unserer Beispieltabelle zurück.
So berechnen Sie die 1st Quartil können wir die folgende Formel in Zelle F2 verwenden.
= QUARTILE (B2: B14,1)
Bei der Eingabe der Formel bietet Excel eine Liste mit Optionen für das Argument quart.
So berechnen Sie die 3rd Quartil können wir eine Formel wie die vorherige in Zelle F3 eingeben, jedoch eine Drei anstelle einer Eins verwenden.
= QUARTILE (B2: B14,3)
Jetzt haben wir die Quartil-Datenpunkte in den Zellen angezeigt.
Zweiter Schritt: Bewerten Sie den Interquartilbereich
Der Interquartilsbereich (oder IQR) entspricht den mittleren 50% der Werte in Ihren Daten. Sie wird als Differenz zwischen dem 1. Quartilwert und dem 3. Quartilwert berechnet.
Wir werden eine einfache Formel in Zelle F4 verwenden, die die 1 subtrahiertst Quartil aus der 3rd Quartil:
= F3-F2
Nun sehen wir unseren Interquartilsabstand.
Schritt 3: Bringen Sie die Unter- und Obergrenze zurück
Die unteren und oberen Grenzen sind die kleinsten und größten Werte des Datenbereichs, den wir verwenden möchten. Alle Werte, die kleiner oder größer als diese gebundenen Werte sind, sind die Ausreißer.
Wir berechnen die untere Grenze in Zelle F5, indem wir den IQR-Wert mit 1,5 multiplizieren und ihn dann vom Q1-Datenpunkt abziehen:
= F2 - (1,5 · F4)
Hinweis: Die Klammern in dieser Formel sind nicht erforderlich, da der Multiplikationsteil vor dem Subtraktionsteil berechnet wird, sie erleichtern jedoch das Ablesen der Formel.
Um die obere Grenze in Zelle F6 zu berechnen, multiplizieren wir den IQR erneut mit 1,5, diesmal jedoch hinzufügen es zum Q3-Datenpunkt:
= F3 + (1,5 * F4)
Schritt vier: Identifizieren Sie die Ausreißer
Jetzt, da wir alle unsere zugrunde liegenden Daten eingerichtet haben, ist es an der Zeit, unsere äußeren Datenpunkte zu identifizieren - diejenigen, die niedriger als der untere Grenzwert oder höher als der obere Grenzwert sind.
Wir verwenden die ODER-Funktion, um diesen logischen Test durchzuführen und die Werte anzuzeigen, die diese Kriterien erfüllen, indem Sie die folgende Formel in Zelle C2 eingeben:
= ODER (B2 $ F $ 6)
Dieser Wert wird dann in unsere C3-C14-Zellen kopiert. Ein TRUE-Wert zeigt einen Ausreißer an, und wie Sie sehen, haben wir zwei Daten in unseren Daten.
Ignorieren der Ausreißer bei der Berechnung des Durchschnittsmittelwerts
Mit der QUARTILE-Funktion berechnen wir den IQR und arbeiten mit der am weitesten verbreiteten Definition eines Ausreißers. Wenn Sie jedoch den Durchschnittsmittelwert für einen Wertebereich berechnen und Ausreißer ignorieren, ist die Verwendung von Funktionen schneller und einfacher. Diese Technik wird einen Ausreißer nicht wie zuvor identifizieren, aber es wird uns erlauben, mit dem, was wir als Ausreißer betrachten, flexibel zu sein.
Die Funktion, die wir brauchen, heißt TRIMMEAN. Sie können die Syntax dafür unten sehen:
= TRIMMEAN (Array, Prozent)
Das Array ist der Wertebereich, den Sie mitteln möchten. Das Prozent ist der Prozentsatz der Datenpunkte, die vom oberen und unteren Rand des Datensatzes ausgeschlossen werden sollen (Sie können ihn als Prozentsatz oder als Dezimalwert eingeben).
Wir haben in unserem Beispiel die folgende Formel in Zelle D3 eingegeben, um den Durchschnitt zu berechnen und 20% der Ausreißer auszuschließen.
= TRIMMEAN (B2: B14, 20%)
Dort haben Sie zwei verschiedene Funktionen zur Behandlung von Ausreißern. Ob Sie sie für bestimmte Berichtsanforderungen ermitteln oder aus Berechnungen wie Durchschnittswerten ausschließen möchten, Excel bietet eine Funktion, die Ihren Anforderungen entspricht.