Hallo,
ich schreibe derzeit an der Uni an einer studentischen Arbeit, bei der ich mich mit dem Vergleich von Vorhersagemodellen befasse. Ausgangspunkt ist eine am Lehrstuhl in Entwicklung befindliche Software, welche das Umformverhalten von Blechteilen vorhersagen soll. Möchte ich beispielsweise aus einem runden Bierdeckel aus Bleck mit einer gewissen Dicke einen Napf mit einer gewissen Tiefe ziehen und dabei zusätzlich noch oben am Rand des Napfes Zähne anbringen gebe ich diese Attribute in die Software ein und erhalte dann zum Beispiel eine Vorhersage, wie viel Kraft ich benötige, um aus dem Ausgangsblech einen solchen Napf mit Zähnen zu ziehen.
Als Datengrundlage bekommt die Software experimentell ermittelte Daten aus realen Versuchen. Die Datenbasis enthält dann . Einträge in der Form
Ausgangsdicke Napftiefe Zähnezahl Umformkraft Ausgangsdicke Napftiefe Zähnezahl Umformkraft . . .
wobei die Umformkraft die benötigte Kraft ist, um das gewünschte Endprodukt herzustellen.
Wenn ich jetzt in der Software neue, in den Versuchsdaten nicht vorhandene Werte für und eingebe soll mir die Software nun ein Vorhersage für die benötigte Kraft erzeugen.
Diese Vorhersage basiert dann auf einem im Programm hinterlegten Vorhersagemodell. Um dieses Modell zu erstellen werden aktuell verschiedene Data-Mining Methoden auf die oben erwähnten Versuchsdaten angewandt, beispielsweise lineare Regression, polynomische Regression, Neuronale Netze, Entscheidungsbäume etc., um aus den Ausgangsdaten verschiedene Vorhersagemodelle zu erzeugen. Am Ende bekomme ich also . vier verschiedene Vorhersagemodelle, die jetzt natürlich alle eine unterschiedlich "gute" Vorhersagequalität für neue, unbekannte Werte liefern.
Ich möchte nun zunächst recht allgemein wissen, wie ihr vorgehen würdet bzw. welche Art von Tests ihr viell. anstellen würdet, um aus diesen vier Modellen sozusagen "das Beste" herauszufinden.
In der Literatur wird oft ein t-Test empfohlen oder eine Varaianzanalyse (ANOVA), aber ich habe leider noch nichts gefunden wo mir konkret beschrieben wird, wie ich diese nun anwenden muss, um am Ende eine Aussage darüber treffen zu können, welches der Modelle nun besser oder schlechter ist.
Ich hoffe hier kann mir jemand weiterhelfen, denn meine Statistik-Kenntnisse sind noch recht begrenzt.
Ich wäre auch über gute Literatur Vorschläge dankbar, bisher habe ich gefunden:
Data Mining: Practical Machine Learning Tools and Techniques vin I. Witten
Wahrscheinlichkeitsrechnung und schließende Statistik, Springer Verlag
Quantitative Methoden 1 und Springer Verlag
Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert): "Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen." |
"In der Literatur wird oft ein t-Test empfohlen oder eine Varaianzanalyse (ANOVA), aber ich habe leider noch nichts gefunden wo mir konkret beschrieben wird, wie ich diese nun anwenden muss, um am Ende eine Aussage darüber treffen zu können, welches der Modelle nun besser oder schlechter ist."
Es gibt keine allgemeine Methode, aber in dem Bereich von Data Mining, wo ich gearbeitet habe, nutzte man ROC-Kurven und Gini-Index. Hier ist kleine Einführung: http://statsoz-neu.userweb.mwn.de/lehre/2011_WiSe/SeminarForschung/materials/Bracher-Vorbereitungsmaterial.pdf
|