Was ist in Python Überabtastung?
Zufällige Überabtastung beinhaltet die zufällige Auswahl von Beispielen aus der Minderheitenklasse mit Ersatz und dem Hinzufügen zum Trainingsdatensatz. Zufällige Unterabtastung beinhaltet die zufällige Auswahl von Beispielen aus der Mehrheitsklasse und das Löschen des Trainingsdatensatzes.
Wie können Sie Daten übertafeln??
Um dann zu übertreffen, nehmen Sie eine Probe aus dem Datensatz und betrachten Sie seine K -Nachbarn (im Feature -Raum) seine k -nächsten Nachbarn). Um einen synthetischen Datenpunkt zu erstellen, nehmen Sie den Vektor zwischen einem dieser K -Nachbarn und dem aktuellen Datenpunkt. Multiplizieren Sie diesen Vektor mit einer Zufallszahl x, die zwischen 0 und 1 liegt.
Wie machen Sie Daten in Python?
Sie können einen Datensatz verbessern, indem Sie einfach Datensätze aus Minderheitenklassen kopieren. Sie können dies über die Resample () -Methode aus der Sklearn tun. Utils -Modul, wie im folgenden Skript gezeigt. Sie können sehen, dass in diesem Fall das erste Argument, das wir die RESABEM () -Methode übergeben, unsere Minderheitenklasse ist, i ist.e. unser Spam -Datensatz.