Mathematik online lernen im Mathe-Forum. Nachhilfe online

Startseite » Forum » Vergleich der Güte von Vorhersagemodellen

Vergleich der Güte von Vorhersagemodellen

Universität / Fachhochschule

Tests

Tags: Abweichung, Data Mining, Fehlerwert, maschinelles Lernen, Prognose, Statistik, Testen von Hypothesen, Vorhersage

anonymous

18:15 Uhr, 12.11.2014

Hallo,

ich schreibe derzeit an der Uni an einer studentischen Arbeit, bei der ich mich mit dem Vergleich von Vorhersagemodellen befasse. Ausgangspunkt ist eine am Lehrstuhl in Entwicklung befindliche Software, welche das Umformverhalten von Blechteilen vorhersagen soll. Möchte ich beispielsweise aus einem runden Bierdeckel aus Bleck mit einer gewissen Dicke

d

einen Napf mit einer gewissen Tiefe

t

ziehen und dabei zusätzlich noch oben am Rand des Napfes

n

Zähne anbringen gebe ich diese Attribute in die Software ein und erhalte dann zum Beispiel eine Vorhersage, wie viel Kraft

F

ich benötige, um aus dem Ausgangsblech einen solchen Napf mit Zähnen zu ziehen.

Als Datengrundlage bekommt die Software experimentell ermittelte Daten aus realen Versuchen. Die Datenbasis enthält dann

z . B

. Einträge in der Form

Ausgangsdicke

d 1;

Napftiefe

t 1,

Zähnezahl

n 1,

Umformkraft

F 1

Ausgangsdicke

d 2;

Napftiefe

t 2,

Zähnezahl

n 2,

Umformkraft

F 2

.
.
.

wobei die Umformkraft die benötigte Kraft ist, um das gewünschte Endprodukt herzustellen.

Wenn ich jetzt in der Software neue, in den Versuchsdaten nicht vorhandene Werte für

d, t

und

n

eingebe soll mir die Software nun ein Vorhersage für die benötigte Kraft

F

erzeugen.

Diese Vorhersage basiert dann auf einem im Programm hinterlegten Vorhersagemodell. Um dieses Modell zu erstellen werden aktuell verschiedene Data-Mining Methoden auf die oben erwähnten Versuchsdaten angewandt, beispielsweise lineare Regression, polynomische Regression, Neuronale Netze, Entscheidungsbäume etc., um aus den Ausgangsdaten verschiedene Vorhersagemodelle zu erzeugen. Am Ende bekomme ich also

z . B

. vier verschiedene Vorhersagemodelle, die jetzt natürlich alle eine unterschiedlich "gute" Vorhersagequalität für neue, unbekannte Werte liefern.

Ich möchte nun zunächst recht allgemein wissen, wie ihr vorgehen würdet bzw. welche Art von Tests ihr viell. anstellen würdet, um aus diesen vier Modellen sozusagen "das Beste" herauszufinden.

In der Literatur wird oft ein t-Test empfohlen oder eine Varaianzanalyse (ANOVA), aber ich habe leider noch nichts gefunden wo mir konkret beschrieben wird, wie ich diese nun anwenden muss, um am Ende eine Aussage darüber treffen zu können, welches der Modelle nun besser oder schlechter ist.

Ich hoffe hier kann mir jemand weiterhelfen, denn meine Statistik-Kenntnisse sind noch recht begrenzt.

Ich wäre auch über gute Literatur Vorschläge dankbar, bisher habe ich gefunden:

Data Mining: Practical Machine Learning Tools and Techniques vin I. Witten

Wahrscheinlichkeitsrechnung und schließende Statistik, Springer Verlag

Quantitative Methoden 1 und

2,

Springer Verlag

Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen."

DrBoogie aktiv_icon

10:46 Uhr, 14.11.2014

"In der Literatur wird oft ein t-Test empfohlen oder eine Varaianzanalyse (ANOVA), aber ich habe leider noch nichts gefunden wo mir konkret beschrieben wird, wie ich diese nun anwenden muss, um am Ende eine Aussage darüber treffen zu können, welches der Modelle nun besser oder schlechter ist."

Es gibt keine allgemeine Methode, aber in dem Bereich von Data Mining, wo ich gearbeitet habe, nutzte man ROC-Kurven und Gini-Index.
Hier ist kleine Einführung:
http://statsoz-neu.userweb.mwn.de/lehre/2011_WiSe/SeminarForschung/materials/Bracher-Vorbereitungsmaterial.pdf

Diese Frage wurde automatisch geschlossen, da der Fragesteller kein Interesse mehr an der Frage gezeigt hat.

1199193

1198669

	Status: nicht eingeloggt	Noch nicht registriert?