Skip to content
Snippets Groups Projects

Replace xml_converter.py: new converter using lxml

Merged Sonja Huber requested to merge new_xml_converter into master
4 files
+ 53
84
Compare changes
  • Side-by-side
  • Inline
Files
4
@@ -121,12 +121,15 @@ $ import spacy
$ pip install trafilatura
$ pip install trafilatura[all]
```
mit folgendem Befehl könntest du trafilatura updaten, falls einmal eine neue Version zur Verfügung stehen sollte:
mit folgendem Befehl kannst du trafilatura updaten, wenn eine neue Version zur Verfügung steht:
```
$ pip install -U trafilatura
```
Für das Skript, das den xml-Output von Trafilatura in die passende Form für Promethia bringt, brauchen wir ausserdem lxml:
```
$ pip install lxml
```
## Installation Promethia:
Promethia ist eine Software, die wir zur korpuslinguistischen Aufbereitung (Lemmatisierung,
Loading