Masterarbeit: LLM-gestützte Autorschaftsverifikation Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Anzeige vom: 01.11.2024

Masterarbeit: LLM-gestützte Autorschaftsverifikation

Standort:
  • Darmstadt
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.

Zusammenfassung

  • Arbeitszeit
    Vollzeit
  • Typ
    Praktikum

Gewünschte Fähigkeiten & Kenntnisse

Data Science
Cyber-Security
Sicherheit

Stellenbeschreibung

Die Fraunhofer-Gesellschaft (www.fraunhofer.de) betreibt in Deutschland derzeit 76 Institute und Forschungseinrichtungen und ist eine der führenden Organisationen für anwendungsorientierte Forschung. Rund 32 000 Mitarbeitende erarbeiten das jährliche Forschungsvolumen von 3,4 Milliarden Euro.

Das Fraunhofer-Institut für Sichere Informationstechnologie SIT gehört zu den führenden Forschungs- und Entwicklungseinrichtungen für Cyber-Sicherheit in Deutschland und Europa und ist Teil von ATHENE, dem nationalen Forschungszentrum für angewandte Cybersicherheit. ATHENE ist eine Kooperation der Fraunhofer-Gesellschaft mit der TU Darmstadt, der Hochschule Darmstadt und der Goethe-Universität Frankfurt. Unser gemeinsames Ziel: die Welt von morgen sicherer zu machen.

Was Du bei uns tust

Autorschaftsverifikation (AV) ist ein zentraler Forschungszweig der digitalen Textforensik und befasst sich mit der Frage, ob zwei oder mehr Texte von derselben Person verfasst wurden. AV bietet zahlreiche Anwendungen sowohl innerhalb als auch außerhalb der Forensik. Ein prominentes Beispiel ist die Überprüfung (Verifikation), ob Beiträge von verschiedenen Accounts von derselben Person stammen, was besonders relevant ist, wenn strafbare Inhalte wie Hassrede oder Desinformationen verbreitet werden.



Ihre Aufgaben


Das Ziel dieser Masterarbeit ist es, eine neue AV-Methode zu erforschen und zu entwickeln, die speziell auf solche Anwendungsfälle ausgerichtet ist. Dabei soll die Methode auf modernen Large Language Models (LLMs) basieren und deren Fähigkeit nutzen, feingranulare Merkmale aus Texten zu extrahieren. Diese Merkmale könnten beispielsweise Stilfiguren, Syntaxfehler oder Satzkonstituenten umfassen - Merkmale, die mit bisherigen NLP-Tools nur eingeschränkt oder gar nicht extrahiert werden konnten. Die extrahierten Merkmale sollen im Vergleich zu traditionellen Merkmalen in der AV (z.B. Zeichen-n-Gramme, Funktionswörter etc.) bewertet und, falls sinnvoll, durch diese ergänzt werden. Zusätzlich sollen mithilfe eines oder mehrerer LLMs Stilbeschreibungen der analysierten Texte erstellt werden. Dabei gilt es zu erforschen, wie sich diese Stilbeschreibungen in die AV-Methode integrieren lassen, um die Klassifikation zu verbessern.

Im Rahmen einer umfassenden Evaluierung soll die entwickelte AV-Methode abschließend mit bestehenden Verfahren verglichen und hinsichtlich verschiedener Parameter wie Genauigkeit, Robustheit und Anwendungsbreite beurteilt werden.



Ihr Profil


  • Studienhintergrund in Informatik, Computational Linguistics, Data Science oder einem vergleichbaren Bereich

  • Erfahrungen mit NLP und modernen LLMs, sowie Kenntnisse zu aktuellen Methoden und Verfahren im Bereich des maschinellen Lernens und Deep Learnings

  • Programmierkenntnisse in Python und vertrauter Umgang mit gängigen ML/NLP-Frameworks

Profil

Fachliche Voraussetzung

  • Computational Linguistics, Data Science, Informatik, Large Language Models, Python

Schulabschluss

  • Bachelor

Bewerbung

    Branche:

    Bildung / Forschung

    Arbeitgeber:

    Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.

    Adresse:

    Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
    Pascalstr 8 9
    10587 Berlin

    Ähnliche Stellenanzeigen

    Entschuldigung! Leider ist ein technisches Problem aufgetreten. Bitte die Seite neu laden.
    Seite neu laden
    Zu deinen Filterkriterien gab es leider keine Ergebnisse. Tipp: Ändere deine Suchanfrage und erhalte mehr Ergebnisse.
    Deine Ergebnisse werden aktualisiert
    • POLYTECH Health & Aesthetics GmbH
      Rödermark
      Aktualisiert
      Flexible Arbeitszeiten
      MS Office
      Kommunikation
      Portal
      Sorgfältige Einarbeitung
      Administration
      Englisch
      Deutsch
      Mitarbeiterangebote
    • Deutsche Post AG
      Nierstein
      Aktualisiert
      2.400 € - 3.200 €/Monat (geschätzt)
      Job-Rad
      Führerscheinklasse B
      Entwicklungsmöglichkeiten
      Betriebliche Altersvorsorge
      LKW
      Mitarbeiterangebote
      Zuverlässigkeit
      Lager
      Jahressonderzahlungen
      Fahrzeuge
      Quereinsteiger
      Überstundenvergütung
      Arbeitskleidung
      Belastbarkeit
      Deutsch
    • Deutsche Post AG
      Nierstein
      18.11.2024
      2.400 € - 3.200 €/Monat (geschätzt)
      Job-Rad
      Führerscheinklasse B
      Entwicklungsmöglichkeiten
      Betriebliche Altersvorsorge
      LKW
      Mitarbeiterangebote
      Zuverlässigkeit
      Lager
      Jahressonderzahlungen
      Fahrzeuge
      Quereinsteiger
      Überstundenvergütung
      Arbeitskleidung
      Belastbarkeit
      Deutsch