XUGS 10 – Daten schürfen mit XQuery und XSLT

Daten schürfen mit XQuery und XSLT / WebApp rapid prototyping.
Oder: Was wir mit unseren Archivdaten (PDFs und andere Dokumenttypen) noch machen können, außer sie auszudrucken.
Live-Demo; Strukturierte Inhalte gewinnen aus

  • ganzen Websites
  • PDF-Dateien
  • txt-Dateien
  • Indesign-Datein

Zum Einsatz kommt die XML-Datenbank eXist-db mit ihrer besonderen Stärke als XML Werkzeugkasten und WebApp Framework.

Geek-Zusatzprogramm:

  • named entity recognition (NER)
  • text dehyphenating methods.

Es spricht: Pawel Katarzynski
XML-Entwickler

Druckhaus Waiblingen – Unternehmensbereich asim.

07.05.2014, 18.30 Uhr 
Hochschule der Medien in Stuttgart-Vaihingen
Nobelstraße 10
Raum 204

XUGS 7: XML-Datenbankmanagementsysteme (XML-DBMS) im Vergleich

Mehrschad Zaeri Esfahani, parsQube GmbH, Karlsruhe

Mittwoch, 23.10.2013
um 18.30 Uhr
an der Hochschule der Medien, Stuttgart Vaihingen, Raum 201

Es gibt viele XML-DBMS, die unterschiedliche Use-Cases abdecken. Eine allgemeine Bewertung, dass DBMS-X besser ist als DBMS-Y kann es nicht geben, sondern ist abhängig von verschiedenen Einsatzszenarien in den Verlagen und in der Industrie. Auf Basis mehrerer Gigabyte XML-Daten sind von der parsQube GmbH verschiedene Einsatzszenarien und Einzelaspekte beleuchtet und untersucht worden. Mehrschad Zaeri Esfahani stellt uns die Resultate vor.

Und wie immer gehen wir nach der anschließenden Diskussion ins Columbus.

XUGS 6: EBCONT und Georg Thieme Verlag: MarkLogic im Einsatz bei Thieme RadBase

Jürgen Ritschka-Kohl (EBCONT enterprise technologies)
Michael Auth (Georg Thieme Verlag)

Thieme RadBase ist eine Online-Anwendung für Radiologen des Georg Thieme Verlags. In 2012 wurde im Rahmen eines kompletten Relaunch das Backend auf MarkLogic umgezogen, um mehr Funktionalität zu ermöglichen und die Erschließung der Inhalte zu verbessern. Eine hoch-qualitative Suche unter der Berücksichtigung von Anatomie, Pathologie und Modalität, sowie die intelligente Verknüpfung von unterschiedlichsten Inhalten standen dabei im Fokus. Die beiden Referenten haben das Projekt geleitet und geben einen Blick unter die “MarkLogic-Motorhaube” der Thieme RadBase.

Mittwoch den 25.09.2013 
um 18.30 Uhr
Hochschule der Medien in Stuttgart-Vaihingen
Raum 204

#xugs: Gültige Dokumente = korrekte Dokumente? Qualitätssicherung von XML-Dateien: DTD – Schema – Schematron – RelaxNG

Mit diesem Thema eröffnete am 23.05.2012 Manuel Montero Pineda das erste XUGS-Treffen. 33 Fachleute aus Stuttgarter Verlagen und Vorstufebetrieben kamen an der HdM Stuttgart zusammen. Und … es war ein richtig guter Abend.

Zitate des Abends:

Verlage fragen die Satzbetriebe gern, warum sie nur TDT können

 

Wir sind hier unter uns, Bücher sollen nicht schön, sondern strukturiert sein

 

Ein Standard ist ein Standard

 

RelaxNG ist wie Video 2000, das bessere System das sich nicht durchsetzen wird

 

Das Auftakt-Event war ein voller Erfolg fürs engagierte Orga-Team!
Nochmals vielen Dank, auch an Marko Hedler für die Gastfreundschaft an der HdM! Manuel Monteiro Pineda beschrieb sehr präzise die 3 Stufen der Prüfung von XML-Daten (Wohlgeformtheit, Validität und Business-Rules/Konsistenz) und die Vor- und Nachteile der 3 Grammatik-Notationen (DTD, XSD und Relax NG).Durch Praxisbeispiele war der Vortrag gut nachvollziehbar und bot auch für erfahrene X-Worker(innen) interessante Informationen. Der lebendige Austausch unter den anwesenden Kolleg(inn)en (vor allem aus Verlagen und der Druckvorstufe) direkt nach dem Vortrag und im Restaurant Columbus zeigte, dass die Gelegenheit, Erfahrungen zu teilen, sehr sinnvoll ist. (Wolfgang Schindler / PONS)