Hallo!
Von Mathe habe ich leider nicht sehr viel Ahnung. Trotzdem stehe ich vor einem schwierigen Problem, dass ich lösen möchte.
Ich würde gerne Dokumente vergleichen. Dazu extrahiere ich in Form von Tags relevante Informationen aus den Dokumenten. Jedes Tag hat eine eigene Identifikationsnummer.
Beispiel:
Aus dem Text, den ich oben geschrieben habe, extrahiere ich die Tags
ID Tag
Mathe
Ahnung
Problem
Dokumente
Tags
Identifikationsnummer
Das kann ich dann als Vektor ausdrücken.
Ich möchte diesen Vektor gerne mit einem anderen Verktor der Art vergleichen.
Wobei da mein Verständnis leider schon aufhört. Habe ich zwei Vektoren mit 99 Dimensionen (jedes "Element" mit der "Gewichtung" 1 oder 0) oder habe ich einen Vektor mit 5 Dimensionen, den ich mit einem Vektor mit 8 Dimensionen vergleichen will?
Im Endeffekt will ich auf beide Vektoren das Cosinus-Ähnlichkeitsmaß anwenden.
Welches "Format" müssten die Vektoren für die Berechnung haben?
Wie kann ich diese Werte in die Formel einsetzen?
Verzeiht meine unmathematische Ausdrucksweise. Hilfe ist sehr willkommen. Danke!
Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert): "Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen." |