From 912e257e5a1f8e8f48fe8ff596336658cb2bf5c0 Mon Sep 17 00:00:00 2001 From: Vincent Prins Date: Wed, 19 Jun 2024 15:07:47 +0200 Subject: [PATCH] Updated tests for cmdi teiHeader And new tei merge test case --- .../kotlin/org/ivdnt/galahad/port/Util.kt | 2 +- .../output/from-Conllu-to-TeiP5.tei.xml | 135 +++++++++++------- .../output/from-Folia-to-TeiP5.tei.xml | 135 +++++++++++------- .../output/from-Naf-to-TeiP5.tei.xml | 135 +++++++++++------- .../output/from-Tsv-to-TeiP5.tei.xml | 135 +++++++++++------- .../output/from-Txt-to-TeiP5.tei.xml | 135 +++++++++++------- .../folia/twine/merged-output.folia.xml | 4 +- .../tei/brieven/merged-output.tei.xml | 45 ++---- .../mock-TDN-with-punctuation-result.xml | 119 +++++++++------ ...tuation-mixed-tags-merge-export-result.xml | 31 +--- .../test/resources/tei/twine/sourcelayer.json | 2 +- 11 files changed, 505 insertions(+), 373 deletions(-) diff --git a/server/src/test/kotlin/org/ivdnt/galahad/port/Util.kt b/server/src/test/kotlin/org/ivdnt/galahad/port/Util.kt index 1e5d187..b219f24 100644 --- a/server/src/test/kotlin/org/ivdnt/galahad/port/Util.kt +++ b/server/src/test/kotlin/org/ivdnt/galahad/port/Util.kt @@ -311,7 +311,7 @@ class TestResult( ) { fun ignoreDate(): TestResult { - val date = Regex("\\d{4}-\\d{2}-\\d{2} \\d{2}:\\d{2}:\\d{2}") + val date = Regex("\\d{4}-\\d{2}-\\d{2}") actual = date.replace(actual, "__DATE_IGNORED_BY_TEST__") expected = date.replace(expected, "__DATE_IGNORED_BY_TEST__") diff --git a/server/src/test/resources/all-formats/output/from-Conllu-to-TeiP5.tei.xml b/server/src/test/resources/all-formats/output/from-Conllu-to-TeiP5.tei.xml index 3f82df5..48a6ffc 100644 --- a/server/src/test/resources/all-formats/output/from-Conllu-to-TeiP5.tei.xml +++ b/server/src/test/resources/all-formats/output/from-Conllu-to-TeiP5.tei.xml @@ -1,57 +1,88 @@ - - - - input - - -

- 2024-03-13 14:23:35 - What if source id is undefined? - What if no pid is defined? -

-
- - - - - Welke inl data? - wat als er geen is? - - - - - - - pie-tdn-all - - - TDN-Core - - - testCorpus - - - 059197e6-a1c9-45b3-9428-9fd28e1e8e32 - - - 2024-03-13 14:23:35 - - - testUser - - - d9527977-7a1f-4f93-b19b-5c26c93afea6 - - - input - - - - -
-
+ + + + input + + linguistic annotation by GaLAHaD (https://portal.clarin.ivdnt.org/galahad) + Instituut voor de Nederlandse Taal + Dutch Language Institute + + + exported as tei-p5 by GaLAHaD (https://portal.clarin.ivdnt.org/galahad) + Instituut voor de Nederlandse Taal + Dutch Language Institute + + + + !Needs to be filled in! + input + __UUID_IGNORED_BY_TEST___tei + + + testCorpus + source name + http://source.url + + + + input + + + + + + + + + + + + + + + + + + inline + + + + + + TDN-Core + + + The file was automatically annotated within the platform GaLAHaD, which is a central hub for enriching historical Dutch. + + + TEI xml + + + + + automatically annotated + + + + + + + + + + + + + Dutch + + true + + + + +
diff --git a/server/src/test/resources/all-formats/output/from-Folia-to-TeiP5.tei.xml b/server/src/test/resources/all-formats/output/from-Folia-to-TeiP5.tei.xml index 0f0ad88..515a73b 100644 --- a/server/src/test/resources/all-formats/output/from-Folia-to-TeiP5.tei.xml +++ b/server/src/test/resources/all-formats/output/from-Folia-to-TeiP5.tei.xml @@ -1,57 +1,88 @@ - - - - input.folia - - -

- 2024-03-13 13:47:56 - What if source id is undefined? - What if no pid is defined? -

-
- - - - - Welke inl data? - wat als er geen is? - - - - - - - pie-tdn-all - - - TDN-Core - - - testCorpus - - - 3308d415-15b9-4f10-bd10-ddbe605caf91 - - - 2024-03-13 13:47:56 - - - testUser - - - 17a41382-9c06-46be-b5e5-7fc86b4dc1bb - - - input.folia - - - - -
-
+ + + + input.folia + + linguistic annotation by GaLAHaD (https://portal.clarin.ivdnt.org/galahad) + Instituut voor de Nederlandse Taal + Dutch Language Institute + + + exported as tei-p5 by GaLAHaD (https://portal.clarin.ivdnt.org/galahad) + Instituut voor de Nederlandse Taal + Dutch Language Institute + + + + !Needs to be filled in! + input.folia + __UUID_IGNORED_BY_TEST___tei + + + testCorpus + source name + http://source.url + + + + input.folia + + + + + + + + + + + + + + + + + + inline + + + + + + TDN-Core + + + The file was automatically annotated within the platform GaLAHaD, which is a central hub for enriching historical Dutch. + + + TEI xml + + + + + automatically annotated + + + + + + + + + + + + + Dutch + + true + + + + +
diff --git a/server/src/test/resources/all-formats/output/from-Naf-to-TeiP5.tei.xml b/server/src/test/resources/all-formats/output/from-Naf-to-TeiP5.tei.xml index 55c9d72..cc90219 100644 --- a/server/src/test/resources/all-formats/output/from-Naf-to-TeiP5.tei.xml +++ b/server/src/test/resources/all-formats/output/from-Naf-to-TeiP5.tei.xml @@ -1,57 +1,88 @@ - - - - input.naf - - -

- 2024-03-13 13:43:11 - What if source id is undefined? - What if no pid is defined? -

-
- - - - - Welke inl data? - wat als er geen is? - - - - - - - pie-tdn-all - - - TDN-Core - - - testCorpus - - - 44a533f9-7a42-48d7-9d92-e6c5d42bb5f5 - - - 2024-03-13 13:43:11 - - - testUser - - - d0070e28-31d4-46e1-b069-c98afc8eeca0 - - - input.naf - - - - -
-
+ + + + input.naf + + linguistic annotation by GaLAHaD (https://portal.clarin.ivdnt.org/galahad) + Instituut voor de Nederlandse Taal + Dutch Language Institute + + + exported as tei-p5 by GaLAHaD (https://portal.clarin.ivdnt.org/galahad) + Instituut voor de Nederlandse Taal + Dutch Language Institute + + + + !Needs to be filled in! + input.naf + __UUID_IGNORED_BY_TEST___tei + + + testCorpus + source name + http://source.url + + + + input.naf + + + + + + + + + + + + + + + + + + inline + + + + + + TDN-Core + + + The file was automatically annotated within the platform GaLAHaD, which is a central hub for enriching historical Dutch. + + + TEI xml + + + + + automatically annotated + + + + + + + + + + + + + Dutch + + true + + + + +
diff --git a/server/src/test/resources/all-formats/output/from-Tsv-to-TeiP5.tei.xml b/server/src/test/resources/all-formats/output/from-Tsv-to-TeiP5.tei.xml index 448af28..48a6ffc 100644 --- a/server/src/test/resources/all-formats/output/from-Tsv-to-TeiP5.tei.xml +++ b/server/src/test/resources/all-formats/output/from-Tsv-to-TeiP5.tei.xml @@ -1,57 +1,88 @@ - - - - input - - -

- 2024-03-13 12:56:00 - What if source id is undefined? - What if no pid is defined? -

-
- - - - - Welke inl data? - wat als er geen is? - - - - - - - pie-tdn-all - - - TDN-Core - - - testCorpus - - - 1a0b2143-c380-4422-ad11-103262d53f0a - - - 2024-03-13 12:56:00 - - - testUser - - - d9806c01-cd99-42a2-8843-c6a91fc6c05b - - - input - - - - -
-
+ + + + input + + linguistic annotation by GaLAHaD (https://portal.clarin.ivdnt.org/galahad) + Instituut voor de Nederlandse Taal + Dutch Language Institute + + + exported as tei-p5 by GaLAHaD (https://portal.clarin.ivdnt.org/galahad) + Instituut voor de Nederlandse Taal + Dutch Language Institute + + + + !Needs to be filled in! + input + __UUID_IGNORED_BY_TEST___tei + + + testCorpus + source name + http://source.url + + + + input + + + + + + + + + + + + + + + + + + inline + + + + + + TDN-Core + + + The file was automatically annotated within the platform GaLAHaD, which is a central hub for enriching historical Dutch. + + + TEI xml + + + + + automatically annotated + + + + + + + + + + + + + Dutch + + true + + + + +
diff --git a/server/src/test/resources/all-formats/output/from-Txt-to-TeiP5.tei.xml b/server/src/test/resources/all-formats/output/from-Txt-to-TeiP5.tei.xml index 3d92b88..9865230 100644 --- a/server/src/test/resources/all-formats/output/from-Txt-to-TeiP5.tei.xml +++ b/server/src/test/resources/all-formats/output/from-Txt-to-TeiP5.tei.xml @@ -1,57 +1,88 @@ - - - - input - - -

- 2024-03-13 13:49:50 - What if source id is undefined? - What if no pid is defined? -

-
- - - - - Welke inl data? - wat als er geen is? - - - - - - - pie-tdn-all - - - TDN-Core - - - testCorpus - - - dc77cb11-2556-42db-99fd-0d8c23fbaada - - - 2024-03-13 13:49:50 - - - testUser - - - 30a241ed-996b-4324-a106-8af5b291bbfe - - - input - - - - -
-
+ + + + input + + linguistic annotation by GaLAHaD (https://portal.clarin.ivdnt.org/galahad) + Instituut voor de Nederlandse Taal + Dutch Language Institute + + + exported as tei-p5 by GaLAHaD (https://portal.clarin.ivdnt.org/galahad) + Instituut voor de Nederlandse Taal + Dutch Language Institute + + + + !Needs to be filled in! + input + __UUID_IGNORED_BY_TEST___tei + + + testCorpus + source name + http://source.url + + + + input + + + + + + + + + + + + + + + + + + inline + + + + + + TDN-Core + + + The file was automatically annotated within the platform GaLAHaD, which is a central hub for enriching historical Dutch. + + + TEI xml + + + + + automatically annotated + + + + + + + + + + + + + Dutch + + true + + + + +
diff --git a/server/src/test/resources/folia/twine/merged-output.folia.xml b/server/src/test/resources/folia/twine/merged-output.folia.xml index 01e4c85..a95f5ff 100644 --- a/server/src/test/resources/folia/twine/merged-output.folia.xml +++ b/server/src/test/resources/folia/twine/merged-output.folia.xml @@ -23,12 +23,12 @@

- To obey or not to be,
that is the one question that yremained. + To obey or not to be,
that is theonequestion that yremained.

- abc def ghijklmno pqrstu xyzabc def + abcdef ghijklmno pqrstu xyzabc def

diff --git a/server/src/test/resources/tei/brieven/merged-output.tei.xml b/server/src/test/resources/tei/brieven/merged-output.tei.xml index 6769351..7488557 100644 --- a/server/src/test/resources/tei/brieven/merged-output.tei.xml +++ b/server/src/test/resources/tei/brieven/merged-output.tei.xml @@ -1,47 +1,20 @@ - Addens, Johannes aan Vloten, Katharina van | 1892-07-15 + Addens, Johannes aan Vloten, Katharina van | __DATE_IGNORED_BY_TEST__ - + linguistic annotation by GaLAHaD (https://portal.clarin.ivdnt.org/galahad)Instituut voor de Nederlandse TaalDutch Language InstituteTEI merged by GaLAHaD (https://portal.clarin.ivdnt.org/galahad)Instituut voor de Nederlandse TaalDutch Language Institute

1892 brieven-correspondenten-1900:0017 INT___UUID_IGNORED_BY_TEST__

-
+ !Needs to be filled in!Addens, Johannes aan Vloten, Katharina van | __DATE_IGNORED_BY_TEST____UUID_IGNORED_BY_TEST___tei - - - - - pie-tdn-all - - - TDN-Core - - - testCorpus - - - __UUID_IGNORED_BY_TEST__ - - - __DATE_IGNORED_BY_TEST__ - - - testUser - - - __UUID_IGNORED_BY_TEST__ - - - Addens, Johannes aan Vloten, Katharina van | 1892-07-15 - - - + testCorpussource namehttp://source.url + @@ -53,7 +26,7 @@ - Addens, Johannes aan Vloten, Katharina van | 1892-07-15 + Addens, Johannes aan Vloten, Katharina van | __DATE_IGNORED_BY_TEST__ @@ -311,7 +284,7 @@ - 2018-05-31T12:07 + __DATE_IGNORED_BY_TEST__T12:07 @@ -402,6 +375,6 @@
-
+ inlineTDN-CoreThe file was automatically annotated within the platform GaLAHaD, which is a central hub for enriching historical Dutch.TEI xmlautomatically annotatedDutchtrue -Addens, Johannes aan Vloten, Katharina van | 1892-07-15

Helsingfors, den 15 Juli 1892

Beste Mevr. Kitty Verwey-v. Vloten.

't Was zeer lief van U my die boeken te sturen, zeer lief. Dank beste Kitty, Mevrouw wilde ik zeggen. Kitty vind ik mooier, Mevrouw is te deftig, beteekent: Kom me niet te na. - Met het oordeel der Schiedammer stem ik volkomen in. 'De Joden' zijn schoon, onovertreffelijk schoon. - De beeldenpracht is heerlijk, de verhalen zijn naif-kinderlijk, tintelen van gevoel. - Dat men hierby lachen kon, zooals Gij schrijft, ook de Schiedammer zegt het, is mij onbegrijpelijk. - Waarom lachtte 't publiek -?- De verzen geven er toch geene aanleiding toe en daar verzen en beelden zeker elkaâr waardig dekken waren, bestond er geen grond iets belachelyk te vinden. - - Wat Plox over de taal zegt, stem ik ten deele toe. - Ook ik zou 't beter achten, als Uw man gewoon gekuischt Hollands wou schrijven, zooals de Genestett en anderen, die er ook iets van wisten, deden. De schoonheid zijner verzen behoefde daardoor niet te lyden, en hij zou meer lezers vinden. Tegen de zonderlinge afbreking van woorden ge-scepterde farao. etc. bij deze soort van verzen, heb ik geen bezwaar, evenmin als tegen de weglating der lidwoorden:

'Binnen in zaal van cederhout.'

De taal is zoo teer, zoo fijn, zoo etherisch dat ze toch nauw of niet uitgesproken worden. Wil men ze zien, dan zou ik schrijven:

Binnen in de zaal -

dat de wind beweegt. -

Tegen D' Joden heb ik niets, 't komt mij ook niet 'onmelodisch' voor. - Zulke verbindingen zijn niet geoorloofd, zegt Plox. Waarom niet -?. Ze komen in de spreektaal voor, en deze is toch de wetgever van ons taal-wetboek, van de gramatica. - Ik maak je mijn compliment over een man, die zulke verzen schrijft.

'De Joden' behoud ik; mag ik die Schiedamsche er bij leggen en behouden? 't Johannes Evangelie stuur ik U later terug, en tevens geld voor 't eerste. Gij zijt huismoeder, vrouw.; te praktiesch om niet voor Uw' huishouding te zorgen en geeft me den prijs [op?].

'K vond in dat Evangelie ook een gedicht van Uw Albert: dat ik mijner vrouw met eene 'Uebersetzung in het Duitsch, overgebriefd heb.

O Mann von Schmerzen mit der Dornenkrohn'

O bleiches blut'-Gesicht, dass in der Nacht

Glüht mit ein' grosser bleicher flamm', wass macht

Bei endlos' Leiden doch dein Bild so schön?

Glänzende Liebe in ein Dampf von Hohn,

Wie sind dein' Lippen still, wie ohne Klag?

Blickst nieder du vom Kreuz, wie lächelst du zo mild,

Gott von Geheimniss', Gottes liebster Sohn!

O flamm' voll Gluth auf dieser kalten Welt,

Schönheit der von Schmerzen auf der dunklen Erd'

Wunder der Liebe, durch kein Mensch erklärt.

Weh mir! ich hor' allzeit den traur'gn fall

Der Tropfen Bluth und bis zum Morgen sieht

Er mich an mit grosser Liebe und endlos' Leid.

Wat vrij, niet waar? Scheldt Gy -?- Waren de duitsche uitdrukking voor Ai my! - Mijn Hollandsch begint my te vergeten. - Ik maak soms ook verzen, zooals Gij weet. Waarom? Wijl ik er pleizier aan heb. Verleden winter ben ik [Mr. st.?] geworden bij onze Loge, en heb toen iets voorgedragen, waarvoor ik veel lof in oogste. In de eerste afdeeling vierde ik het Licht, gaf ik mijn begrip van 't Mysterie, (God?), waarin wij leven, eene eenheid van stof en kracht etc.; de tweede was voor den Voorzitter; in de derde afd. gaf ik mijne opvatting der 'Mauerei'; Ofschoon ik verklaarde, dat ik geene waarde hechte aan de formules d. Mauerei, daar mijn Loge de wereld was etc. was men er toch meê ingenomen. Alles rook kettersch. - Zij vonden 't wel mooi, wijl ik een consul ben. De stand en maatschappelijke positie heeft machtig veel invloed op 't oordeel der menschen, zooals ons spreekwoord: 'de rok maakt den mensch' ook zegt. - De Heeren zijn anders erg conservatief; ze houden vast, wat ze hebben, en zien goed uit, hoe de wind waait: praten bij een goed glas wijn en eene fijne sigaar ook wel eens over de verbetering van 't lot der armen, die zij, als deze er zelf over denken en spreken canaille noemen; 't zijn prachtige menschen en goede Staatsburgers, die God en den Keizer geven, wat ze toekomt en daarom ook zeker allen in den Hemel komen, ofschoon ze bij de invoering der Wet op 't inkomen eclatant bewezen hebben, dat Proudhon' gelijk had, als hij 'eigendom diefstal' noemde. [60?] miljoen bracht de nieuwe wet meer op, dan vroeger, hebben die Heeren dus - 'gestolen', wil ik niet zeggen, - te min betaald. - . - Stelen is een te barsch woord voor deftige rijke lui.. - Genoeg - zoo schijnen ze overal te zijn. -

Kathi is thans in de stad; zij zoekt werk, eene betrekking, - kan echter niets vinden. Waar een noodig is, bieden zich, vijftig, honderd, aan. - Wat daaruit worden zal, weet ik niet. -

Hoe gaat het U en Uwe kinderen. Toch wel -?- Leg ze nog maar weer eens op hun rug, om eenige letteren te schrijven. - Nog iets. - Stuur me toch eene fotografie van je man. Ik mocht hem hebben, voor de heele wereld hem heeft. U vindt dit verlangen toch natuurlijk en niet onbescheiden, hoop ik. Voeg je zelf er dan maar bij. Mijn vrouw zal er ook erg blij over zijn, als ik met Uw beiden aankom.

Hartelijke groeten, ook aan Uw man

TT.

Johs. Addens

Bij mijn adr. behoef je niet Skilnaden of Brunsparken te zetten; - een handelszaak heb ik niet meer, te Skilnaden staat nu een millioenenhuis.

Ik lees eene Kritiek der moderne Theosophie van G. af Geiersam: Modern [xxxxxxxxxxx]'

Is Uw man geen Hagenaar; daar woonde vroeger een Dr. Verwey.

\ No newline at end of file +Addens, Johannes aan Vloten, Katharina van | __DATE_IGNORED_BY_TEST__

Helsingfors, den 15 Juli 1892

Beste Mevr. Kitty Verwey-v. Vloten.

't Was zeer lief van U my die boeken te sturen, zeer lief. Dank beste Kitty, Mevrouw wilde ik zeggen. Kitty vind ik mooier, Mevrouw is te deftig, beteekent: Kom me niet te na. - Met het oordeel der Schiedammer stem ik volkomen in. 'De Joden' zijn schoon, onovertreffelijk schoon. - De beeldenpracht is heerlijk, de verhalen zijn naif-kinderlijk, tintelen van gevoel. - Dat men hierby lachen kon, zooals Gij schrijft, ook de Schiedammer zegt het, is mij onbegrijpelijk. - Waarom lachtte 't publiek -?- De verzen geven er toch geene aanleiding toe en daar verzen en beelden zeker elkaâr waardig dekken waren, bestond er geen grond iets belachelyk te vinden. - - Wat Plox over de taal zegt, stem ik ten deele toe. - Ook ik zou 't beter achten, als Uw man gewoon gekuischt Hollands wou schrijven, zooals de Genestett en anderen, die er ook iets van wisten, deden. De schoonheid zijner verzen behoefde daardoor niet te lyden, en hij zou meer lezers vinden. Tegen de zonderlinge afbreking van woorden ge-scepterde farao. etc.bij deze soort van verzen, heb ik geen bezwaar, evenmin als tegen de weglating der lidwoorden:

'Binnen in zaal van cederhout.'

De taal is zoo teer, zoo fijn, zoo etherisch dat ze toch nauw of niet uitgesproken worden. Wil men ze zien, dan zou ik schrijven:

Binnen inde zaal -

datde wind beweegt. -

Tegen D' Joden heb ik niets, 't komt mij ook niet 'onmelodisch' voor. - Zulke verbindingen zijn niet geoorloofd, zegt Plox. Waarom niet -?. Ze komen in de spreektaal voor, en deze is toch de wetgever van ons taal-wetboek, van de gramatica. - Ik maak je mijn compliment over een man, die zulke verzen schrijft.

'De Joden' behoud ik; mag ik die Schiedamsche er bij leggen en behouden? 't Johannes Evangelie stuur ik U later terug, en tevens geld voor 't eerste. Gij zijt huismoeder, vrouw.; te praktiesch om niet voor Uw' huishouding te zorgen en geeft me den prijs [op?].

'K vond in dat Evangelie ook een gedicht van Uw Albert: dat ik mijner vrouw met eene 'Uebersetzung in het Duitsch, overgebriefd heb.

O Mann von Schmerzen mit der Dornenkrohn'

O bleiches blut'-Gesicht, dass in der Nacht

Glüht mit ein' grosser bleicher flamm', wass macht

Bei endlos' Leiden doch dein Bild so schön?

Glänzende Liebe in ein Dampf von Hohn,

Wie sind dein' Lippen still, wie ohne Klag?

Blickst nieder du vom Kreuz, wie lächelst du zo mild,

Gott von Geheimniss', Gottes liebster Sohn!

O flamm' voll Gluth auf dieser kalten Welt,

Schönheit der von Schmerzen auf der dunklen Erd'

Wunder der Liebe, durch kein Mensch erklärt.

Weh mir! ich hor' allzeit den traur'gn fall

Der Tropfen Bluth und bis zum Morgen sieht

Er mich an mit grosser Liebe und endlos' Leid.

Wat vrij, niet waar? Scheldt Gy -?- Waren de duitsche uitdrukking voorAi my! - Mijn Hollandsch begint my te vergeten. - Ik maak soms ook verzen, zooals Gij weet. Waarom? Wijl ik er pleizier aan heb. Verleden winter ben ik [Mr. st.?] geworden bij onze Loge, en heb toen iets voorgedragen, waarvoor ik veel lof in oogste. In de eerste afdeeling vierde ik het Licht, gaf ik mijn begrip van 't Mysterie, (God?), waarin wij leven, eene eenheid van stof en kracht etc.; de tweede was voor den Voorzitter; in de derde afd. gaf ik mijne opvatting der 'Mauerei'; Ofschoon ik verklaarde, dat ik geene waarde hechte aan de formules d. Mauerei, daar mijn Loge de wereld was etc. was men er toch meê ingenomen. Alles rook kettersch. - Zij vonden 't wel mooi, wijl ik een consul ben. De stand en maatschappelijke positie heeft machtig veel invloed op 't oordeel der menschen, zooals ons spreekwoord: 'de rok maakt den mensch' ook zegt. - De Heeren zijn anders erg conservatief; ze houden vast, wat ze hebben, en ziengoed uit, hoe de wind waait: praten bij een goed glas wijn en eene fijne sigaar ook wel eens over de verbetering van 't lot der armen, die zij, als deze er zelf over denken en spreken canaille noemen; 't zijn prachtige menschen en goede Staatsburgers, die God en den Keizer geven, wat ze toekomt en daarom ook zeker allen in den Hemel komen, ofschoon ze bij de invoering der Wet op 't inkomen eclatant bewezen hebben, dat Proudhon' gelijk had, als hij 'eigendom diefstal' noemde. [60?] miljoen bracht de nieuwe wet meer op, dan vroeger, hebben die Heeren dus - 'gestolen', wil ik niet zeggen, - te min betaald. - . - Stelen is een te barsch woord voor deftige rijke lui.. - Genoeg - zoo schijnen ze overal te zijn. -

Kathi is thans in de stad; zij zoekt werk, eene betrekking, - kan echter niets vinden. Waar een noodig is, bieden zich, vijftig, honderd, aan. - Wat daaruit worden zal, weet ik niet. -

Hoe gaat het U en Uwe kinderen. Toch wel -?- Leg ze nog maar weer eens op hun rug, om eenige letteren te schrijven. - Nog iets. - Stuur me toch eene fotografie van je man. Ik mocht hem hebben, voor de heele wereld hem heeft. U vindt dit verlangen toch natuurlijk en niet onbescheiden, hoop ik. Voeg je zelf er dan maar bij. Mijn vrouw zal er ook erg blij over zijn, als ik met Uw beiden aankom.

Hartelijke groeten, ook aan Uw man

TT.

Johs. Addens

Bij mijn adr. behoef je niet Skilnaden of Brunsparken te zetten; - een handelszaak heb ik niet meer, te Skilnaden staat nu een millioenenhuis.

Ik lees eene Kritiek der moderne Theosophie van G. af Geiersam: Modern [xxxxxxxxxxx]'

Is Uw man geen Hagenaar; daar woonde vroeger een Dr. Verwey.

\ No newline at end of file diff --git a/server/src/test/resources/tei/export/mock-TDN-with-punctuation-result.xml b/server/src/test/resources/tei/export/mock-TDN-with-punctuation-result.xml index 24969e1..d362c70 100644 --- a/server/src/test/resources/tei/export/mock-TDN-with-punctuation-result.xml +++ b/server/src/test/resources/tei/export/mock-TDN-with-punctuation-result.xml @@ -4,61 +4,92 @@ mocktei + + linguistic annotation by GaLAHaD (https://portal.clarin.ivdnt.org/galahad) + Instituut voor de Nederlandse Taal + Dutch Language Institute + + + exported as tei-p5 by GaLAHaD (https://portal.clarin.ivdnt.org/galahad) + Instituut voor de Nederlandse Taal + Dutch Language Institute + -

- __DATE_IGNORED_BY_TEST__ - What if source id is undefined? - What if no pid is defined? -

+ !Needs to be filled in! + mocktei + 81e4fd37-e921-410b-aef5-48b26baf4af2_tei
+ + testCorpus + sourcename + http://source.url + - - - - Welke inl data? - wat als er geen is? - - - - - - - pie-tdn-all - - - TDN-Core - - - testCorpus - - - __UUID_IGNORED_BY_TEST__ - - - __DATE_IGNORED_BY_TEST__ - - - testUser - - - __UUID_IGNORED_BY_TEST__ - - - mocktei - - - + + mocktei + + + +
+ + + + + + + + + + + + inline + + + + + + TDN-Core + + + The file was automatically annotated within the platform GaLAHaD, which is a central hub for enriching historical Dutch. + + + TEI xml + + + + + automatically annotated + + + + + + + + + + + + Dutch + true + + + +

- - -Dit is wat oefentekst. + Dit + is + wat + oefentekst + .

diff --git a/server/src/test/resources/tei/export/punctuation-mixed-tags-merge-export-result.xml b/server/src/test/resources/tei/export/punctuation-mixed-tags-merge-export-result.xml index 1b12172..e150bdf 100644 --- a/server/src/test/resources/tei/export/punctuation-mixed-tags-merge-export-result.xml +++ b/server/src/test/resources/tei/export/punctuation-mixed-tags-merge-export-result.xml @@ -1,30 +1,3 @@ - - - - pie-tdn-all - - - TDN-Core - - - testCorpus - - - __UUID_IGNORED_BY_TEST__ - - - __DATE_IGNORED_BY_TEST__ - - - testUser - - - __UUID_IGNORED_BY_TEST__ - - - punctutation-mixed-tags - - - -

Punctuatie, zin zonder tags. Zin met tags.

+punctutation-mixed-tagslinguistic annotation by GaLAHaD (https://portal.clarin.ivdnt.org/galahad)Instituut voor de Nederlandse TaalDutch Language InstituteTEI merged by GaLAHaD (https://portal.clarin.ivdnt.org/galahad)Instituut voor de Nederlandse TaalDutch Language Institute!Needs to be filled in!punctutation-mixed-tags__UUID_IGNORED_BY_TEST___teitestCorpussource namehttp://source.urlpunctutation-mixed-tagsinlineTDN-CoreThe file was automatically annotated within the platform GaLAHaD, which is a central hub for enriching historical Dutch.TEI xmlautomatically annotatedDutchtrue +

Punctuatie, zin zonder tags.Zin met tags.

\ No newline at end of file diff --git a/server/src/test/resources/tei/twine/sourcelayer.json b/server/src/test/resources/tei/twine/sourcelayer.json index 022b676..07608f8 100644 --- a/server/src/test/resources/tei/twine/sourcelayer.json +++ b/server/src/test/resources/tei/twine/sourcelayer.json @@ -1 +1 @@ -{"name":"sourceLayer","tagset":{"identifier":"UNKNOWN","longName":"Unknown Tagset","punctuationTags":[],"shortName":"UNK"},"terms":[{"lemma":"onzin","pos":null,"targets":[{"id":"no-id","length":1,"literal":".","offset":59}]},{"lemma":null,"pos":"onzin","targets":[{"id":"no-id","length":1,"literal":".","offset":61}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":1,"literal":".","offset":63}]},{"lemma":"onzin","pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":65}]},{"lemma":null,"pos":"onzin","targets":[{"id":"no-id","length":7,"literal":"scholen","offset":73}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":81}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":89}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":97}]},{"lemma":"de","pos":"PD(type=d-p,subtype=art,position=prenom)","targets":[{"id":"enge022vand01_01.TEI.2.text.body.div.lg.7633.s.1.w.11","length":3,"literal":"die","offset":497}]},{"lemma":"droogheid","pos":"NOU-C(number=sg)","targets":[{"id":"enge022vand01_01.TEI.2.text.body.div.lg.7633.s.1.w.12","length":9,"literal":"droecheit","offset":501}]},{"lemma":"rebel","pos":"NOU-C(number=pl)","targets":[{"id":"w.185","length":8,"literal":"rebellen","offset":511}]},{"lemma":"e.","pos":"LET","targets":[{"id":"pc.000005","length":1,"literal":".","offset":519}]}],"wordForms":[{"id":"no-id","length":1,"literal":".","offset":59},{"id":"no-id","length":1,"literal":".","offset":61},{"id":"no-id","length":1,"literal":".","offset":63},{"id":"no-id","length":7,"literal":"scholen","offset":65},{"id":"no-id","length":7,"literal":"scholen","offset":73},{"id":"no-id","length":7,"literal":"scholen","offset":81},{"id":"no-id","length":7,"literal":"scholen","offset":89},{"id":"no-id","length":7,"literal":"scholen","offset":97},{"id":"enge022vand01_01.TEI.2.text.body.div.lg.7633.s.1.w.11","length":3,"literal":"die","offset":497},{"id":"enge022vand01_01.TEI.2.text.body.div.lg.7633.s.1.w.12","length":9,"literal":"droecheit","offset":501},{"id":"w.185","length":8,"literal":"rebellen","offset":511},{"id":"pc.000005","length":1,"literal":".","offset":519}],"preview":{"terms":[{"lemma":"onzin","pos":null,"targets":[{"id":"no-id","length":1,"literal":".","offset":59}]},{"lemma":null,"pos":"onzin","targets":[{"id":"no-id","length":1,"literal":".","offset":61}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":1,"literal":".","offset":63}]},{"lemma":"onzin","pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":65}]},{"lemma":null,"pos":"onzin","targets":[{"id":"no-id","length":7,"literal":"scholen","offset":73}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":81}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":89}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":97}]}],"wordforms":[{"id":"no-id","length":1,"literal":".","offset":59},{"id":"no-id","length":1,"literal":".","offset":61},{"id":"no-id","length":1,"literal":".","offset":63},{"id":"no-id","length":7,"literal":"scholen","offset":65},{"id":"no-id","length":7,"literal":"scholen","offset":73},{"id":"no-id","length":7,"literal":"scholen","offset":81},{"id":"no-id","length":7,"literal":"scholen","offset":89},{"id":"no-id","length":7,"literal":"scholen","offset":97}]},"summary":{"numLemma":6,"numPOS":6,"numTerms":12,"numWordForms":12}} \ No newline at end of file +{"name":"sourceLayer","tagset":{"identifier":"UNKNOWN","longName":"Unknown Tagset","punctuationTags":[],"shortName":"UNK"},"terms":[{"lemma":"onzin","pos":null,"targets":[{"id":"no-id","length":1,"literal":".","offset":59}]},{"lemma":null,"pos":"onzin","targets":[{"id":"no-id","length":1,"literal":".","offset":61}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":1,"literal":".","offset":63}]},{"lemma":"onzin","pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":65}]},{"lemma":null,"pos":"onzin","targets":[{"id":"no-id","length":7,"literal":"scholen","offset":73}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":81}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":89}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":97}]},{"lemma":"de","pos":"PD(type=d-p,subtype=art,position=prenom)","targets":[{"id":"enge022vand01_01.TEI.2.text.body.div.lg.7633.s.1.w.11","length":3,"literal":"die","offset":577}]},{"lemma":"droogheid","pos":"NOU-C(number=sg)","targets":[{"id":"enge022vand01_01.TEI.2.text.body.div.lg.7633.s.1.w.12","length":9,"literal":"droecheit","offset":581}]},{"lemma":"rebel","pos":"NOU-C(number=pl)","targets":[{"id":"w.185","length":8,"literal":"rebellen","offset":591}]},{"lemma":"e.","pos":"LET","targets":[{"id":"pc.000005","length":1,"literal":".","offset":599}]}],"wordForms":[{"id":"no-id","length":1,"literal":".","offset":59},{"id":"no-id","length":1,"literal":".","offset":61},{"id":"no-id","length":1,"literal":".","offset":63},{"id":"no-id","length":7,"literal":"scholen","offset":65},{"id":"no-id","length":7,"literal":"scholen","offset":73},{"id":"no-id","length":7,"literal":"scholen","offset":81},{"id":"no-id","length":7,"literal":"scholen","offset":89},{"id":"no-id","length":7,"literal":"scholen","offset":97},{"id":"enge022vand01_01.TEI.2.text.body.div.lg.7633.s.1.w.11","length":3,"literal":"die","offset":577},{"id":"enge022vand01_01.TEI.2.text.body.div.lg.7633.s.1.w.12","length":9,"literal":"droecheit","offset":581},{"id":"w.185","length":8,"literal":"rebellen","offset":591},{"id":"pc.000005","length":1,"literal":".","offset":599}],"preview":{"terms":[{"lemma":"onzin","pos":null,"targets":[{"id":"no-id","length":1,"literal":".","offset":59}]},{"lemma":null,"pos":"onzin","targets":[{"id":"no-id","length":1,"literal":".","offset":61}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":1,"literal":".","offset":63}]},{"lemma":"onzin","pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":65}]},{"lemma":null,"pos":"onzin","targets":[{"id":"no-id","length":7,"literal":"scholen","offset":73}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":81}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":89}]},{"lemma":null,"pos":null,"targets":[{"id":"no-id","length":7,"literal":"scholen","offset":97}]}],"wordforms":[{"id":"no-id","length":1,"literal":".","offset":59},{"id":"no-id","length":1,"literal":".","offset":61},{"id":"no-id","length":1,"literal":".","offset":63},{"id":"no-id","length":7,"literal":"scholen","offset":65},{"id":"no-id","length":7,"literal":"scholen","offset":73},{"id":"no-id","length":7,"literal":"scholen","offset":81},{"id":"no-id","length":7,"literal":"scholen","offset":89},{"id":"no-id","length":7,"literal":"scholen","offset":97}]},"summary":{"numLemma":6,"numPOS":6,"numTerms":12,"numWordForms":12}} \ No newline at end of file