Hilfe zur Klausuraufgabe Klausur Sep 2012 (SS 2012)

Ort
Rhein-Main-Gebiet
Hochschulabschluss
Bachelor of Science
2. Hochschulabschluss
Master of Science
Studiengang
M.Sc. Wirtschaftswissenschaft
ECTS Credit Points
60 von 120
Zur Klausurvorbereitung habe ich die Klausur vom SS 2012 bearbeitet. Ich stelle mal meine Lösung zur Diskussion.

Aufgabe 1:
a) D KE1, S. 15
b) B KE1, S. 18
c) D KE2, S. 24
d) D KE2, S. 39

Aufgabe 2a)
Klassifikation: Elemente in Klassen zuordnen, wobei die Klassen im Vorfeld bekannt sind --> Entscheidungsbaumverfahren
Clusterung: Elemente in Klassen zuordnen, wobei Klassen vorab nicht bekannt sind
Vorhersage: Prognose/Schätzung aus vorhandenen Werten
Assoziation: Regeln ableiten

Aufgabe 2b)
So schaut mein Baum aus.
SS12_Aufgabe2b.jpg

Aufgabe 2c)
Hier ist mir noch keine sinnvolle Antwort eingefallen. Ich bin für Hinweise dankbar.

Aufgabe 3a)
viele Datenobjekte führen zu hohem Rechenaufwand
Distanzmatrix muss vorab bestimmt werden
Fehleranfällig, wenn zu Beginn eine falsche Entfernung ermittelt wurde

Aufgabe 3b)
upload_2014-3-16_18-5-55.png


Aufgabe 3c)
Es ergibt sich eine andere Clusterung, da das Einkommen durch die größeren Werte ein größeres Gewicht bekommt und die Distanz verändert. Durch eine Normierung der Einkommen, könnten die Werte in ein ähnliches Niveau gebracht werden wie die übrigen Daten.

Aufgabe 4)
a) F KE3, S. 13
b) R KE3, Übungsaufgabe 3
c) F KE3, S. 18
d) R KE3, S. 17
e) R KE3, S. 20f
f) R KE3, S. 23
g) R KE3, S. 21
h) F KE3, S. 24
i) F KE3, S. 21
j) F KE3, S. 27
 
Meine Lösungen:
A1:
a) D
b) B
c) D
d) C (KE 2, S. 42)

A2 a) und b) habe ich genauso wie Kiomi

A2 c)
  • hätte ich als Vorschlag das es beim Mehr-als-2-Klassen-Fall mehrere Minderheitsklassen gibt und man somit keine Klasse als die eindeutige "Impurity-Klasse" festlegen kann
  • Modifikation: man verwendet für die Attributsauswahl nicht Impurity sondern Purity, welche an sich immer gleich bleiben sollte, egal wieviele Minderheitsklassen noch vorhanden sind
A3 und A4 hab ich wieder so wie Kiomi
 
zu 2c) der Unterschied liegt in der Verwendung von CART oder C4.5 Algorithmus beim Aufspalten, würde ich sagen.
 
weil es nur von z und a abhängt und nicht von P, z und a
 
Aufgabe 2a:
• Assoziationsanalyse
• Clusteranalyse
• Klassifizierung
• Approximation, Vorhersage oder Regression

Aufgabe 2b, 3, 4 habe ich genau so. Zu 2c habe ich bisher keine gute Antwort gefunden
 
Zuletzt bearbeitet:
Hallo zusammen,

kann mir jemand erklären wie man bei der Aufgabe 3b) auf die Zahlen kommt? Ich kenne die Formel zur Dinstanzberechnung, weiß aber nicht wie man sie anwendet. Kann mir vllt. jemand ein Rechenbeispiel aufzeigen, bitte.

Danke & VG
Ole
 
Hey, meinst du die Werte der Distanzmatrix?
Du musst die euklidische Distanz anwenden (KE 2 S.94)
Also bspw. (2 - 1)² + (31 - 43)² + (1,8 - 2,3)², davon dann die Wurzel ziehen und als Ergebnis erhältst du 12,05.

Kann mir denn einer erklären, wie ich von Distanzmatrix 1 zu Distanzmatrix 2 komme? In einem anderen Forum hatte ich teilweise andere Werte gesehen...
D(1) sieht bei mir folgendermaßen aus:
1 4 5 8
1
4 12,05
5 2,24 14,15
8 5,12 8,96 6,39
9,10 16,10 4,58 18,05 12,17

Die 2,24 ist hier dann die kleinste Distanz. Fliegen dann gleichzeitig Zeile und Spalte 5 raus oder gibt es dafür eine Berechnung?

Als Endergebnis komme ich auf
D(4) __1,5,8 ___ 4,9,10
1,5,8
4,9,10 12,05

Nur weicht das von den geposteten Ergebnissen ab :-/

Vielen Dank und viele Grüße
Caren
 
Zuletzt bearbeitet:
Hallo!
Erstmal danke für eure Lösungen, das hilft sehr beim lernen.

Ich hätte bei der Clustering-Aufgabe noch eine dritte Lösung anzubieten: 8,96

Bei dem Schritt, wenn die 4 an das Cluster (9/10) angehängt wird...
Distanz zwischen 4 und 8 ist 8,96
Distanz zwischen (9/10) und 8 ist 12,17

Also ist doch die neue Distanz zwischen (4/9/10) und 8 das Minimum, also die 8,96 oder?
Bis dahin bin ich mit dem Threadersteller einer Meinung. Kann aber auch gut sein, dass ich den Algo nicht verstanden habe. ;)
 
Hallo :) ich hab auch 8,96 raus. Leider finde ich in jeglichen Foren teils unterschiedliche Ergbnisse. Ich wollte allerdings anmerken, dass in D0 (weiter oben sehen wir da eine vollständige Tabelle) die Zahl 14,04 nicht korrekt ist. Ich hab da 19,03.
 
Laut meinem Verständis fasst du die Instanz 4 zum Cluster 4, 9,10. Dadurch enfällt sowohl die 8,96 als auch Minimum von 4,98 unter der Instanz 4. Die Instanz 8 hat weiterhin die Dinstanz 12,17 zu dem Cluster 4,9,10.

@AnnaM85: Ich ahbe ebenfalls 19,03 zu Beginn der Matrix.
 
Das ist meine Durchführung :)
Vllt wird es dadurch deutlicher.
 

Anhänge

  • IMAG2966.jpg
    IMAG2966.jpg
    132,9 KB · Aufrufe: 58
Zurück
Oben