Eine ziemlich heikle Frage! Der sonst übliche Ansatz, von einer Gleichverteilung innerhalb der Klasse auszugehen, verbietet sich hier offenkundig:
Die mittlere Mitarbeitergröße in der untersten Klasse ist , während die Klassenmitte ja bei 130 liegt. Genauso bei der Klasse 501-1500, dort ist die mittlere Mitarbeitergröße auch deutlich kleiner als die Klassenmitte 1000.
Insofern würde ich
> Ignoriere ich jetzt die Spalte Mitarbeiter?
nicht befürworten. Stattdessen sollte man diese Information nutzen, um ein passenderes Modell für die Verteilung der Unternehmensanzahl zu gegebener Mitarbeiterzahl aufstellen als es die Gleichverteilung ist, zunächst sicher mit einem Parameter, denn man dann anhand der gegebenen Werte Unternehmenszahl sowie Gesamtmitarbeiterzahl pro Klasse fitten kann.
Was das für eine Verteilung sein könnte - keine Ahnung. Vielleicht eine geometrische Verteilung (innerhalb der Klasse)? Lohnt womöglich einen Versuch, denn schlechter als mit der Gleichverteilung kann man hier kaum fahren.
|