# Eloundou-Scores in das KI-Risiko-Dashboard integrieren ## Ziel Die aktuellen KI-Expositions-Scores im Dashboard [gu.kuble.com/jobs-ch](https://gu.kuble.com/jobs-ch/) wurden mit Claude Sonnet generiert (LLM-Selbsteinschätzung, Skala 0–10). Diese Anleitung beschreibt, wie sie durch die **peer-reviewed Expositions-Scores von Eloundou et al. (2024)** ersetzt werden können — das gleiche Mass, das die KOF-Studie der ETH Zürich verwendet. ### Warum? - **Wissenschaftlich validiert**: Publiziert in *Science* (2024), breit zitiert - **Systematische Methodik**: Basiert auf O\*NET-Task-Zerlegung, nicht auf LLM-"Meinung" - **Reproduzierbar**: Öffentlich verfügbare Daten und Methodik - **Vergleichbar**: Identisches Mass wie in der KOF-Studie → direkte Anschlussfähigkeit --- ## Übersicht der Datenquellen | Quelle | Was | Format | Link | |--------|-----|--------|------| | OpenAI GitHub | Eloundou-Expositions-Scores pro O\*NET-SOC-Code | CSV | [github.com/openai/GPTs-are-GPTs](https://github.com/openai/GPTs-are-GPTs) | | BLS Crosswalk | Mapping SOC-2010 → ISCO-08 | XLS | [bls.gov/soc/isco_soc_crosswalk.xls](https://www.bls.gov/soc/isco_soc_crosswalk.xls) | | IBS Crosswalk | Detaillierteres Mapping O\*NET-SOC → ISCO | PDF/CSV | [ibs.org.pl](https://ibs.org.pl/en/resources/occupation-classifications-crosswalks-from-onet-soc-to-isco/) | --- ## Schritt 1: Eloundou-Daten herunterladen **Datei:** `occ_level.csv` aus dem OpenAI-Repository ``` https://github.com/openai/GPTs-are-GPTs/blob/main/data/occ_level.csv ``` ### Spaltenstruktur | Spalte | Bedeutung | |--------|-----------| | `O*NET-SOC Code` | Berufscode (z.B. `11-1011.00`) | | `Title` | Berufsbezeichnung (Englisch) | | `dv_rating_alpha` | GPT-4-Bewertung: nur E1 (direkte LLM-Exposition) | | `dv_rating_beta` | **← Diesen Score verwenden**: E1 + 0.5 × E2 | | `dv_rating_gamma` | GPT-4-Bewertung: E1 + E2 (inkl. Software-Tools) | | `human_rating_alpha` | Menschliche Bewertung: nur E1 | | `human_rating_beta` | Menschliche Bewertung: E1 + 0.5 × E2 | | `human_rating_gamma` | Menschliche Bewertung: E1 + E2 | ### Welchen Score nehmen? Die KOF-Studie verwendet **`dv_rating_beta`** (β-Mass) — das ist die GPT-4-Bewertung mit der Formel: > **β = E1 + 0.5 × E2** - **E1** = Aufgaben, die ein LLM direkt erledigen kann (ohne zusätzliche Software) - **E2** = Aufgaben, die ein LLM mit zusätzlichen Tools/Software erledigen kann Der Wert liegt zwischen **0.0** (keine Exposition) und **1.0** (maximale Exposition). ### Beispiele aus dem Datensatz | Beruf | β-Score | |-------|---------| | Chief Executives | 0.46 | | Chief Sustainability Officers | 0.56 | | General and Operations Managers | 0.48 | --- ## Schritt 2: SOC-Codes auf ISCO-08 mappen Die Eloundou-Scores verwenden das US-amerikanische **O\*NET-SOC-System**. Das Schweizer Dashboard braucht **ISCO-08-Codes** (internationaler Standard, in der Schweiz üblich). ### 2a: BLS-Crosswalk herunterladen ``` https://www.bls.gov/soc/isco_soc_crosswalk.xls ``` Diese Excel-Datei enthält zwei Spaltenpaare: - `ISCO-08 Code` + `ISCO-08 Title` - `2010 SOC Code` + `2010 SOC Title` ### 2b: O\*NET-SOC auf SOC-2010 reduzieren Die Eloundou-Daten verwenden **O\*NET-SOC-Codes** (z.B. `11-1011.03`), die granularer sind als SOC-2010 (z.B. `11-1011`). Für das Mapping: ``` O*NET-SOC: 11-1011.03 → SOC-2010: 11-1011 (die letzten 3 Stellen nach dem Punkt abschneiden) ``` > **Achtung:** Wenn mehrere O\*NET-SOC-Codes auf denselben SOC-2010-Code fallen, den **Durchschnitt** der β-Scores bilden. ### 2c: SOC-2010 → ISCO-08 anwenden Über den BLS-Crosswalk die SOC-2010-Codes auf ISCO-08 4-Steller mappen. Auch hier gilt: Bei Mehrfach-Zuordnungen den Durchschnitt bilden. --- ## Schritt 3: ISCO-08 auf die 100 Dashboard-Berufe mappen Das Dashboard enthält ca. 100 Schweizer Berufe mit deutschen Bezeichnungen. Für jeden Beruf muss der passende **ISCO-08 4-Steller** identifiziert werden. ### Mapping-Tabelle erstellen Für jeden Beruf im Dashboard eine Zeile anlegen: | Dashboard-Beruf | ISCO-08 Code | ISCO-08 Titel (EN) | β-Score | |----------------|-------------|---------------------|---------| | Softwareentwickler/-in | 2512 | Software developers | 0.94 | | Buchhalter/-in | 2411 | Accountants | 0.96 | | Pflegefachmann/-frau | 2221 | Nursing professionals | ~0.15 | | Koch / Köchin | 3434 | Chefs | ~0.05 | | Lastwagenfahrer/-in | 8332 | Heavy truck drivers | ~0.02 | ### Hilfsmittel für das Mapping - **berufsberatung.ch** → viele Berufe haben dort bereits ISCO-Zuordnungen - **BFS SAKE-Daten** → die Beschäftigtenzahlen im Dashboard stammen bereits aus BFS-Daten mit ISCO-Codes - **KOF-Studie kontaktieren**: Die Autoren (Kläui & Siegenthaler, ETH Zürich) haben dieses Mapping bereits für ihre Studie gemacht. Eine Anfrage lohnt sich. --- ## Schritt 4: Score-Transformation (0–1 → 0–10) Die Eloundou-Scores liegen auf einer Skala von 0.0 bis 1.0. Das Dashboard verwendet 0–10. Transformation: ``` Dashboard-Score = round(β × 10) ``` | β-Score (Eloundou) | Dashboard-Score | |--------------------|-----------------| | 0.00 | 0/10 | | 0.25 | 3/10 | | 0.50 | 5/10 | | 0.75 | 8/10 | | 0.96 | 10/10 | --- ## Schritt 5: Daten im Dashboard ersetzen Je nach technischer Umsetzung des Dashboards die neuen Scores in die Datenquelle einfügen. Vermutlich liegt eine JSON- oder CSV-Datei zugrunde, die pro Beruf den `exposure`-Wert enthält. ### Erwartetes Datenformat (Beispiel) ```json { "beruf": "Softwareentwickler/-in", "exposure": 9, "exposure_source": "eloundou_beta", "isco_code": "2512", "beschaeftigte": 52000, "medianlohn": 105000 } ``` ### Farbkategorien beibehalten Die aktuelle Farblogik (grün/gelb/rot) kann bestehen bleiben: | Score | Farbe | Kategorie | |-------|-------|-----------| | 0–4 | Grün | Niedrig | | 5–7 | Gelb/Orange | Mittel | | 8–10 | Rot | Hoch | --- ## Schritt 6: Quellenangabe im Dashboard aktualisieren Im Abschnitt "Über diese Daten → KI-Exposition" den Text ersetzen: **Aktuell:** > Berechnet mit Claude Sonnet (Anthropic), März 2026. Jeder Beruf wurde anhand seines Tätigkeitsprofils bewertet. Score 0 = kaum betroffen, 10 = starke Automatisierungsgefahr. **Neu:** > Basierend auf dem Expositionsmass (β) von Eloundou et al. (2024), publiziert in *Science*. Das Mass bewertet pro Beruf, inwieweit LLMs die Erledigungszeit von Aufgaben um ≥ 50 % reduzieren können. Mapping von SOC auf ISCO-08 via BLS-Crosswalk. Score 0 = keine Exposition, 10 = maximale Exposition. > > Quelle: Eloundou, T. et al. (2024). "GPTs are GPTs: Labor market impact potential of LLMs." *Science*, 384, 1306–1308. --- ## Schritt 7: Validierung & Plausibilitätsprüfung Nach der Integration prüfen, ob die neuen Scores plausibel sind. Erwartete Veränderungen gegenüber den aktuellen LLM-generierten Scores: | Beruf | Aktuell (Claude) | Erwartet (Eloundou) | Kommentar | |-------|-------------------|---------------------|-----------| | Softwareentwickler/-in | 6/10 | 9/10 | Deutlich höher — Eloundou sieht Programmierer als hochexponiert | | Lastwagenfahrer/-in | 7/10 | 1–2/10 | Deutlich tiefer — physischer Beruf, kaum LLM-exponiert | | Buchhalter/-in | 8/10 | 9–10/10 | Ähnlich oder leicht höher | | Pflegefachmann/-frau | 2/10 | 1–2/10 | Ähnlich | | Lagerfachmann/-frau | 8/10 | 2–3/10 | Deutlich tiefer — physische Logistik | > **Wichtig:** Grosse Abweichungen (wie bei Lastwagenfahrer oder Lagerfachleute) sind ein gutes Zeichen — sie zeigen, dass das LLM-generierte Mass systematisch verzerrt war, z.B. indem es KI-Exposition mit allgemeiner Automatisierung (Robotik, selbstfahrende Fahrzeuge) verwechselt hat. --- ## Optional: Zweites Mass (Handa et al. 2025) Die KOF-Studie verwendet zusätzlich ein Mass von **Handa et al. (2025)**, das auf der *tatsächlichen* LLM-Nutzung basiert (Analyse von Millionen Claude-Interaktionen). Dieses Mass könnte als zweite Perspektive im Dashboard ergänzt werden, ist aber noch nicht öffentlich als Datensatz verfügbar. --- ## Zusammenfassung des Workflows ``` 1. occ_level.csv von GitHub herunterladen 2. O*NET-SOC → SOC-2010 aggregieren (Punkt + Suffix abschneiden) 3. isco_soc_crosswalk.xls herunterladen 4. SOC-2010 → ISCO-08 mappen 5. ISCO-08 → 100 CH-Berufe mappen (manuell oder via BFS-Zuordnung) 6. β-Score × 10 → neuer Dashboard-Score 7. Datenquelle im Dashboard aktualisieren 8. Quellenangabe anpassen 9. Plausibilitätsprüfung durchführen ``` --- *Erstellt: April 2026* *Referenz: Eloundou et al. (2024), Science 384, 1306–1308 · KOF-Studie Nr. 186 (Kläui & Siegenthaler, 2025)*