- Sollte vor oder nach dem Zugtest aufgeteilt werden?
- Wann sollten wir Überabtastung verwenden??
- Können wir Testdaten übertreiben??
- Sollten wir SMOTE auf Testdaten anwenden?
Sollte vor oder nach dem Zugtest aufgeteilt werden?
Immer in Test- und Zug -Sets aufgeteilt, bevor Sie überabtastende Techniken ausprobieren! Überabtastung vor dem Aufteilen der Daten kann ermöglichen, dass genaue Beobachtungen sowohl im Test- als auch im Zugsatz vorhanden sind.
Wann sollten wir Überabtastung verwenden??
Wenn eine Datenklasse die unterrepräsentierte Minderheitenklasse in der Datenprobe ist, können über Stichprobentechniken diese Ergebnisse für eine ausgewogenere Menge positiver Ergebnisse im Training dupliziert. Überteuerung wird verwendet, wenn die gesammelte Datenmenge unzureichend ist.
Können wir Testdaten übertreiben??
Überprüfung der Zugdaten und nicht der Validierungsdaten, da bei unausgeglichener Zugdaten Ihre Testdaten höchstwahrscheinlich das gleiche Merkmal zeigen und unausgeglichen sind. Wenn Sie nicht wissen, ob Testdaten ausgeglichen sind oder nicht, trainieren Sie nur Daten.
Sollten wir SMOTE auf Testdaten anwenden?
SMOTE berücksichtigt keine benachbarten Beispiele aus anderen Klassen bei der Generierung synthetischer Beispiele. Dies könnte zu mehr Klassenüberlappungen und Lärm führen. Dies ist besonders schlecht, wenn Sie einen hochdimensionalen Datensatz haben. Die Antwort lautet also, dass Sie definitiv nicht mit SMOTE sollten.