CorpuserschließungDie Corpuserschließung der DWDS-Corpora umfasst die Anreicherung der Texte mit Metadaten sowie die linguistische Aufbereitung. In allen Dokumenten der DWDS-Corpora sind Autor, Titel, Erscheinungsjahr (Werkausgabe), genaue bibliographische Angaben und Textsorte(n) verzeichnet. Darüber hinaus enthalten die Dokumente Angaben über die Qualität der Digitalisierung und zum Rechtestatus. Bei der linguistischen Aufbereitung der Dokumente werden alle Wortpositionen mit verschiedenen Informationen angereichert, insbesondere der Wortstamm, die Wortart und Thesaurusinformationen. Auf den folgenden Seiten werden die Werkzeuge beschrieben, die hierfür eingesetzt wurden. Es sind dies:
|