Table of Contents | ||||
---|---|---|---|---|
|
Die Normalisierung von Datumsangaben ist Teil des Schritts “Metadata Enrichment and Normalization”. Dabei werden die im Mapping generierten rico:DateSet in rico:SingleDate oder rico:DateRange transformiert und die Daten in die korrekten Felder geschrieben. Die Normalisierung ist regelbasiert und kann konfiguriert werden. Wenn eine Normalisierung nicht möglich ist, kann das Datum nicht facetiert werden.
...
Beispiel: (?<singleYear>[0-2][0-9]{3})
Muss
...
die Gruppe
singleYear
,fromYear
, oderuntilYear
enthalten
...
.
singleYear
kann optional mitsingleMonth
oderfromMonth
unduntilMonth
und optionalfromDay
unduntilDay
kombiniert werden.fromYear
unduntilYear
...
kann
...
mit
fromMonth
,fromDay
,untilMonth
unduntilDay
...
kombiniert werden.
Certainty Filter
File: certainty.txt:
...
Januar, Jan, janvier, janv., gennaio, gen
Februar, Feb, février, févr., febbraio, feb
März, Mär, mars, mars, marzo, mar
April, Apr, avril, avr., aprile, apr
Mai, Mai, mai, mai, maggio, mag
Juni, Jun, juin, juin, giugno, giu
Juli, Jul, juillet, juil., luglio, lug
August, Aug, août, août, agosto, ago
September, Sep, septembre, sept., settembre, set
Oktober, Okt, octobre, oct., ottobre, ott
November, Nov, novembre, nov., novembre, nov
Dezember, Dez, décembre, déc., dicembre, dic
Beispiele Single Dates
Input | Regex Group Names | Class |
---|
Attributes and Values
Normalized Value | |||
---|---|---|---|
02.10.1999 |
|
|
|
1999- |
ca. 1970 er - 1980 er
rico:DateRange
rico:expressedDate: 1970 er - 1980 er
rico:qualifier: ca.
10-02 |
Beispiele Date Ranges
Input | Regex Group Names | Class | Normalized Value |
---|---|---|---|
1939 |
|
|
|
1939 | |||
April1939 |
|
|
|
1939-04 | |||
April-September1939 |
|
|
|
| |||
1.-8.10.1939 |
|
|
|
rico:certainty: genaues Datum nicht eruierbar
02.10.1999
rico:SingleDate
rico:normalizedDateValue: 1999-10-02
1939-10-01/08 | |||
01.02.-08.10.1939 |
|
|
|
1987-1994 |
|
|
|
1987/1994 | |||
April 1987 - Oktober 2001 |
|
|
|
rico:certainty: Datiert nach Inschrift
(Keine Datumsangabe)1987-04/2001-10 | |||
01. April 1987 - 05. Oktober 2001 |
|
|
|
|
Beispiele mit Qualifiers & Certainties
Input | Regex Group Names | Class | Normalized Value |
---|---|---|---|
ca. 1970 er - 1980 er |
|
|
|
ca. | |||
1961 ou avant |
|
|
|
rico:normalizedDateValue: 1992-04-11
17-22 ottobre 1930
| |||
1930-1939, genaues Datum nicht eruierbar |
|
|
1930 |
/1939
| |||
1913 - 1919 (Datiert nach Inschrift) |
|
|
Octobre-novembre 1925
rico:DateRange
rico:normalizedDateValue: 1925-10/11
29 au 31 mars 1926
1913/1919
| |||
1941 (Um) |
|
|
1941
|
|