Информация к новости
  • Просмотров: 3 396
  • Автор: e-Lancer
  • Дата создания: 14-06-2012
  • Обновление:
14-06-2012

Wörterbüchernetz

Категория: Помощь в изучении языка / Справочные компьютерные системы

WörterbüchernetzАННОТАЦИЯ ИЗДАТЕЛЯ:

 

Bereits in den ersten Vorschlägen der "Facharbeitsgruppe Inhalt" zur Vorbereitung des DFG-Programms "Retrospektive Digitalisierung von Bibliotheksbeständen" haben Wörterbücher eine dominierende Rolle gespielt, nicht nur weil sie besonders intensiv benutzt werden, sondern auch weil elektronische Nachschlagewerke Auswertungsmöglichkeiten bieten, die in ihrer gedruckten Form kaum jemals ausgeschöpft werden können. Die stetig wachsende Zahl fachspezifischer Nachschlagewerke in analoger und in digitaler Form unterstreicht ihre Bedeutung für den Nachweis qualifizierter Informationen in allen Wissensgebieten. Die von Internet-Suchmaschinen gesammelten Daten können weder die Verlässlichkeit noch den Grad an Systematisierung und Tiefenerschließung der in Nachschlagewerken aufbereiteten Informationen erreichen und bleiben derzeit weit hinter deren Präzision und Umfang zurück.

 

Digitale Nachschlagewerke sind, wie auch ihre gedruckten Entsprechungen, auf vielfältige Art aufeinander bezogen und damit in gewisser Weise implizit "vernetzt"; eine übergreifende, integrierte Recherche ist jedoch wegen der Unterschiede in der Anlage, Anordnung und Struktur der einzelnen Werke auch im digitalen Medium nicht ohne Weiteres möglich. Nachschlagewerke, die durch inhaltlich-strukturelles Markup in standardisierte und damit vergleichbar gemachte Informationseinheiten gegliedert und durch Metadaten angereichert sind, machen jedoch die impliziten Vernetzungen explizit. Dadurch kann eine neue Qualität der Informationsgewinnung erreicht und die Lücke zwischen der schwerfälligen Benutzbarkeit und eingeschränkten Verfügbarkeit der Buchversionen einerseits und der fehlenden Systematik und Beliebigkeit der Information im Internet andererseits geschlossen werden.

 

Nach den entsprechenden Vorarbeiten aus den verschiedenen Digitalisierungsprojekten stehen im Wörterbuchnetz unterschiedliche Typen tief annotierter Wörterbücher in digitaler Form zur Verfügung, die bereits in Ansätzen untereinander vernetzt, durch Symptomwertangaben und Metadaten intellektuell erschlossen und recherchierbar oder mit Primärquellen vernetzt sind. Anhand dieser Wörterbücher zu den verschiedenen Varietäten des 'Deutschen' (aber auch darüber hinaus) soll ein standardisierter Einstieg für effiziente Recherchen geschaffen werden, von dem aus sich die nicht standardisierten, heterogen organisierten und verstreuten Informationen verzweigen; heterogen im Hinblick auf synchrone wie diachrone Varianz. Dieses Konzept lässt sich nicht nur auf Wörterbücher anwenden, sondern auch auf die Erschließung großer Korpora übertragen.

 

Im Gegensatz zu einer bloßen, unverbundenen Bereitstellung verschiedener Nachschlagewerke bietet das Wörterbuchnetz darüber hinaus komplexe und gezielt spezifizierbare Zugänge zum Material durch multidirektionale Verlinkungen. Diese Verlinkungen gehen weit über eine rein ausdrucksseitige Verknüpfung hinaus, indem sie philologische und informationswissenschaftliche Methoden verbinden. Im Falle der "Mittelhochdeutschen Wörterbücher im Verbund" beispielsweise wurde die multidirektionale Vernetzung anhand einer standardisierten 'Hyper-Lemmaliste' aller Stichwörter aus den vier eingebundenen Werken realisiert. Hierzu mussten etwa die Stichwortansätze eines der Wörterbücher (des BMZ), das für Verben jeweils die 1. Person Singular Indikativ Präsens ansetzt, mit den infinitivischen Lemmaansätzen der übrigen mittelhochdeutschen Wörterbücher verbunden werden. Eine rein ausdrucksseitige, alphabetische Kumulierung der jeweiligen Lemmata hätte im Falle der Mittelhochdeutschen Wörterbücher also nicht zu einem brauchbaren Ergebnis geführt. Ferner galt es, Homographen voneinander zu unterscheiden, um auf das etymologisch und semantisch entsprechende Lemma verweisen zu können. Dies wurde anhand halbautomatischer Verfahren realisiert, indem Konkordanzen mit automatisch erzeugten Zuordnungsvorschlägen von einem philologisch geschulten Bearbeiter geprüft wurden. Bei den automatischen Zuordnungen können z.B. auch grammatische Angaben aus den Wörterbuchartikeln mit herangezogen werden, was die automatische Zuordnung erleichtert.

 

Voraussetzung für eine automatische bzw. halbautomatische Vernetzung ist eine standardisierte Kodierung der Wortartikelstrukturen (beispielsweise nach den TEI-Richtlinien), um die Relevanz einzelner Wortformen aus dem Wörterbuchtext bewerten zu können. Die Vorgehensweise zur Realisierung solcher vernetzten Konzepte kann deshalb folgendermaßen aussehen: Die Mikrostruktur der Wörterbuchartikel wird ausgezeichnet, z.B. nach den Informationseinheiten 'Stichwortansatz (abgebildet auf ein Hyper-Lemma)', 'Etymologie', 'Bedeutungsangabe' und 'Ortsangabe', zudem kann eine Annotierung über eine standardisierte Klassifizierung (DDC, Ontologien) erfolgen. Die Kombination der zusätzlich eingebrachten Metadaten ermöglicht dann spezifizierte Recherchen.

 

Auch die weiteren Komponenten des Wörterbuchnetzes werden durch ein interdisziplinäres Methodenbündel philologisch-lexikographischer, semantischer und informationstechnologischer Verfahren in das Netz integriert und standardisiert recherchierbar gemacht. Das angestrebte Ideal-Ziel lässt sich als ein vielfältig verknüpftes, dynamisches, intelligentes 'Meta-Wörterbuch' der "deutschen Sprache" beschreiben, dessen Anfänge im Wörterbuchnetz bereits zu sehen sind.

 

In einem ersten Schritt zum automatischen Aufbau der Vernetzungsstrukturen kommen Verfahren aus dem Bereich des Information Retrieval zum Einsatz, nach denen die einzelnen Wortformen aufgrund ihrer Anzahl statistisch bewertet und gewichtet werden. Nach diesem Verfahren lassen sich alle Wortartikel als Vektoren von Wortformen darstellen, die, nach ihrer Gewichtung geordnet, paarweise miteinander verglichen werden. Falls innerhalb zweier Vektoren eine gewisse Anzahl von Übereinstimmungen vorliegt, wird eine Verbindung zwischen den beiden zugrunde liegenden Wortartikeln etabliert. Informationstechnologisch werden die Verbindungen in Form von Kanten in einem Graphen modelliert. Der gesamte Vernetzungsgraph wird in Form von Metadaten über die eigentlichen Wörterbuchdaten gelegt und in einer eigenen Datenbank abgespeichert. Die so etablierten Verweisstrukturen können dann in der graphischen Internetoberfläche visualisiert werden .

 

Neben der Vernetzung der eigenen, durch das Kompetenzzentrum bereitgestellten Wörterbuchressourcen bietet das Wörterbuchnetz auch die Möglichkeit, aus externen elektronischen Dokumenten angesprochen zu werden. So kann jeder Benutzer über die vor den Wortartikeln eingerichteten Icons die persistente Adresse des betreffenden Artikels abfragen und in einen eigenen elektronischen Text einbinden, um beispielsweise den Verweis auf einen Wörterbuchartikel direkt mit dem Aufruf der Ressource auf dem Server des Kompetenzzentrums zu verbinden. Zusätzlich zu dieser interaktiven Einzelvernetzung werden aber auch die vollständigen Stichwortlisten mit den zugehörigen Adressen zur Verfügung gestellt, um auf diese Weise eine umfassende Vernetzung zwischen einer externen Wörterbuchinstallation und den Ressourcen im Wörterbuchnetz realisieren zu können. So existieren bereits Verknüpfungen aus dem 'Deutschen Rechtswörterbuch' und dem 'Wörterbuch der Deutschen Winzersprache' in das Wörterbuchnetz.

 

Publikationen:

Rapp, Andrea: Das Wörterbuchnetz. Verfahren - Methoden - Perspektiven. [Online verfügbar unter: Goethe-Institut online. Dossier Digitalisierung].

 

Burch, Thomas / Rapp, Andrea: Das Wörterbuch-Netz: Verfahren - Methoden - Perspektiven. In: Geschichte im Netz: Praxis, Chancen, Visionen. Beiträge der Tagung .hist 2006, hg. für Clio-online von Daniel Burckhardt, Rüdiger Hohls und Claudia Prinz, unter Mitwirkung von Sebastian Barteleit, Gudrun Gersmann, Peter Haber, Madeleine Herren, Patrick Sahle, Daniel Schlögl, Georg Vogeler, Claudia Wagner und Irmgard Zündorf, Berlin 2007 (Historisches Forum 10, Teilband I), S. 607-627.[Online verfügbar auf dem edoc-Server der Humboldt-Universität zu Berlin].

Уважаемый посетитель, Вы зашли на сайт как гость.
Чтобы получить беспрепятственный доступ к авторским материалам, созданным в рамках проекта, пожалуйста, зарегистрируйтесь либо войдите на сайт (кнопка вверху справа).

Добавление комментария

Имя:*
E-Mail:
Комментарий:
  • bowtiesmilelaughingblushsmileyrelaxedsmirk
    heart_eyeskissing_heartkissing_closed_eyesflushedrelievedsatisfiedgrin
    winkstuck_out_tongue_winking_eyestuck_out_tongue_closed_eyesgrinningkissingstuck_out_tonguesleeping
    worriedfrowninganguishedopen_mouthgrimacingconfusedhushed
    expressionlessunamusedsweat_smilesweatdisappointed_relievedwearypensive
    disappointedconfoundedfearfulcold_sweatperseverecrysob
    joyastonishedscreamtired_faceangryragetriumph
    sleepyyummasksunglassesdizzy_faceimpsmiling_imp
    neutral_faceno_mouthinnocent
Вопрос:
Как переводится на русский язык местоимение "mein"?
Ответ:*
Введите код: *
Кликните на изображение чтобы обновить код, если он неразборчив

Архив новостей

Октябрь 2017 (1)
Сентябрь 2017 (5)
Август 2017 (6)
Июль 2017 (1)
Июнь 2017 (5)
Май 2017 (4)
^