create first rough html output

This commit is contained in:
2024-02-17 09:44:08 +01:00
parent a6a6f9e72e
commit 998ebd481e
15 changed files with 346 additions and 9 deletions

85
laws/abgb.toml Normal file
View File

@ -0,0 +1,85 @@
[law]
id = 10001622
[[law.classifiers]]
name = "Theil"
is_root = true
match_function = "containsCaseSensitive"
[[law.classifiers]]
name = "Abtheilung"
is_root = false
match_function = "contains"
[[law.classifiers]]
name = "Hauptstück"
is_root = false
match_function = "contains"
[[law.classifiers]]
name = "Abschnitt"
is_root = false
match_function = "contains"
[[law.classifiers]]
name = "letter"
is_root = false
match_function = "starts_with_letter"
[[law.classifiers]]
name = "roman numbering"
is_root = false
match_function = "starts_with_roman_number"
[[law.classifiers]]
name = "numbering"
is_root = false
match_function = "starts_with_number"
[[law.classifiers]]
name = "dash"
is_root = false
match_function = "starts_with_dash"
[parser]
remove_strings = [
"<tab />",
"<b>", "</b>",
"<i>", "</i>",
"<n>", "</n>",
"""<ueberschrift typ="g1" ct="text" halign="c">Zweyter Theil.</ueberschrift>""", # weird thing after § 858
]
[[parser.replace_rules]]
find = "Einleitung." # Should be at the same level as the other "Theil"e
replace_with = "Nullter Theil. Einleitung"
[[parser.replace_rules]]
find = "<gdash />"
replace_with = "-"
[[parser.replace_rules]]
find = """<ueberschrift typ="g1" ct="text" halign="c">Medizinische Behandlung</ueberschrift>"""
replace_with = """<ueberschrift typ="g1" ct="text" halign="c">- Medizinische Behandlung</ueberschrift>"""
[[parser.replace_rules]]
find = """<ueberschrift typ="g1min" ct="text" halign="c">Von den dinglichen Rechten.</ueberschrift>"""
replace_with = """<ueberschrift typ="g2" ct="text" halign="c">Von den dinglichen Rechten.</ueberschrift>"""
[[parser.replace_rules]]
find = """<ueberschrift typ="para" ct="text" halign="c">Erfordernisse zur Ersitzung:</ueberschrift>"""
replace_with = """<ueberschrift typ="g1" ct="text" halign="c">I. Erfordernisse zur Ersitzung:</ueberschrift>"""
# RIS uses multiple headers to get more attention...
[[parser.replace_rules]]
find = """<ueberschrift typ="g1" ct="text" halign="c">Zweyter Theil</ueberschrift><ueberschrift typ="g1" ct="text" halign="c">des</ueberschrift><ueberschrift typ="g1" ct="text" halign="c">bürgerlichen Gesetzbuches.</ueberschrift><ueberschrift typ="g1" ct="text" halign="c">Von dem Sachenrechte.</ueberschrift>"""
replace_with = """<ueberschrift typ="g1" ct="text" halign="c">Zweyter Theil des bürgerlichen Gesetzbuches: Von dem Sachenrechte.</ueberschrift>"""
[[parser.replace_rules]]
find = """<ueberschrift typ="g1" ct="text" halign="c">Erste Abtheilung</ueberschrift><ueberschrift typ="g2" ct="text" halign="c">des Sachenrechtes.</ueberschrift>"""
replace_with = """<ueberschrift typ="g1" ct="text" halign="c">Erste Abtheilung des Sachenrechtes.</ueberschrift>"""
[[parser.replace_rules]]
find = """<ueberschrift typ="g1" ct="text" halign="c">Dritter Theil</ueberschrift><ueberschrift typ="g1min" ct="text" halign="c">des</ueberschrift><ueberschrift typ="g1min" ct="text" halign="c">bürgerlichen Gesetzbuches.</ueberschrift><ueberschrift typ="g1" ct="text" halign="c">Von den gemeinschaftlichen Bestimmungen der Personen- und Sachenrechte.</ueberschrift>"""
replace_with = """<ueberschrift typ="g1" ct="text" halign="c">Dritter Theil des bürgerlichen Gesetzbuches.</ueberschrift><ueberschrift typ="g2" ct="text" halign="c">Von den gemeinschaftlichen Bestimmungen der Personen- und Sachenrechte.</ueberschrift>"""

56
laws/eheg.toml Normal file
View File

@ -0,0 +1,56 @@
[law]
id = 10001871
[[law.classifiers]]
name = "Abschnitt"
is_root = true
match_function = "contains"
[[law.classifiers]]
name = "Uppercase letter"
is_root = false
match_function = "starts_with_uppercaseletter"
[[law.classifiers]]
name = "roman letter"
is_root = false
match_function = "starts_with_roman_number"
[[law.classifiers]]
name = "letter"
is_root = false
match_function = "starts_with_letter"
[parser]
remove_strings = [
"""<ueberschrift typ="para" ct="text" halign="c">§ 33</ueberschrift>""",
"<i>", "</i>",
"<n>", "</n>"
]
move_para_headers_into_content = true
[[parser.replace_rules]]
find = "<gdash />"
replace_with = "-"
[[parser.replace_rules]]
find = "(Anm.: § 108 aufgehoben durch Art. II Z 7 BGBl. Nr. 566/1983)"
replace_with = "<gldsym>§ 108.</gldsym>(Anm.: § 108 aufgehoben durch Art. II Z 7 BGBl. Nr. 566/1983)"
# Wrongly formatted "headers"
[[parser.replace_rules]]
find = """<ueberschrift typ="g1" ct="text" halign="c">Fristablauf</ueberschrift>"""
replace_with = """<ueberschrift typ="para" ct="text" halign="c">Fristablauf</ueberschrift>"""
[[parser.replace_rules]]
find = """<ueberschrift typ="para" ct="text" halign="c">I. Nichtigkeitsgründe</ueberschrift>"""
replace_with = """<ueberschrift typ="g1" ct="text" halign="c">I. Nichtigkeitsgründe</ueberschrift>"""
[[parser.replace_rules]]
find = """<ueberschrift typ="g2" ct="text" halign="c">I. Allgemeine Vorschriften</ueberschrift>"""
replace_with = """<ueberschrift typ="g1" ct="text" halign="c">I. Allgemeine Vorschriften</ueberschrift>"""
[[parser.replace_rules]]
find = """<ueberschrift typ="g2" ct="text" halign="c">I. Name der geschiedenen Frau</ueberschrift>"""
replace_with = """<ueberschrift typ="g1" ct="text" halign="c">I. Name der geschiedenen Frau</ueberschrift>"""

15
laws/kschg.toml Normal file
View File

@ -0,0 +1,15 @@
[law]
id = 10002462
[[law.classifiers]]
name = "Hauptstück"
is_root = true
match_function = "contains"
[[law.classifiers]]
name = "Abschnitt"
is_root = false
match_function = "contains"
[parser]
remove_strings = ["<i>", "</i>"]

32
laws/mschg.toml Normal file
View File

@ -0,0 +1,32 @@
[law]
id = 10002180
[[law.classifiers]]
name = "Abschnitt"
is_root = true
match_function = "contains"
[[law.classifiers]]
name = "Number"
is_root = false
match_function = "starts_with_number"
[parser]
remove_strings = ["<i>", "</i>"]
[[parser.replace_rules]]
find = "<super>bis</super>"
replace_with = "bis"
[[parser.replace_rules]]
find = "<super>ter</super>"
replace_with = "ter"
[[parser.replace_rules]]
find = "<gdash />"
replace_with = "-"
[[parser.replace_rules]]
find = "(Anm.: § 69 aufgehoben durch Art. 1 Z 12, BGBl. I Nr. 124/2017)"
replace_with = "<gldsym>§ 69.</gldsym>(Anm.: § 69 aufgehoben durch Art. 1 Z 12, BGBl. I Nr. 124/2017)"

29
laws/schifffahrtsg.toml Normal file
View File

@ -0,0 +1,29 @@
[law]
id = 10012703
[[law.classifiers]]
name = "Teil"
is_root = true
match_function = "contains"
[[law.classifiers]]
name = "Hauptstück"
is_root = false
match_function = "contains"
[parser]
remove_strings = [
"<gs sperrweite=\"26\">", "</gs>",
"<super>", "</super>",
"<sub>", "</sub>",
"<b>", "</b>",
"<n>", "</n>",
"<i>", "</i>",
"<tab position=\"35.4\" />" # this is a nice one, have a look at § 133 (2) Zi. 5 and enjoy :^)
]
[[parser.replace_rules]]
find = "<gdash />"
replace_with = "-"

42
laws/stgb.toml Normal file
View File

@ -0,0 +1,42 @@
[law]
id = 10002296
[[law.classifiers]]
name = "Teil"
is_root = true
match_function = "contains"
[[law.classifiers]]
name = "Abschnitt"
is_root = false
match_function = "contains"
[parser]
remove_strings = [
"<i>", "</i>",
"<n>", "</n>",
"<b>", "</b>",
"<super>", "</super>",
"""<abstand ct="text" halign="l" />"""
]
[[parser.replace_rules]]
find = """<ueberschrift typ="g2" ct="text" halign="c">Erster Abschnitt</ueberschrift>"""
replace_with = """<ueberschrift typ="g1" ct="text" halign="c">Erster Abschnitt</ueberschrift>"""
[[parser.replace_rules]]
find = """<ueberschrift typ="g1min" ct="text" halign="c">Allgemeine Bestimmungen</ueberschrift>"""
replace_with = """<ueberschrift typ="g2" ct="text" halign="c">Allgemeine Bestimmungen</ueberschrift>"""
[[parser.replace_rules]]
find = """<ueberschrift typ="para" ct="text" halign="c">1. Verwertungsrechte.</ueberschrift>"""
replace_with = """<ueberschrift typ="g1" ct="text" halign="c">1. Verwertungsrechte.</ueberschrift>"""
[[parser.replace_rules]]
find = """<ueberschrift typ="g1min" ct="text" halign="c">Strafbare Handlungen gegen Leib und Leben</ueberschrift>"""
replace_with = """<ueberschrift typ="g2" ct="text" halign="c">Strafbare Handlungen gegen Leib und Leben</ueberschrift>"""
[[parser.replace_rules]]
find = "<gdash />"
replace_with = "-"

18
laws/teg.toml Normal file
View File

@ -0,0 +1,18 @@
[law]
id = 10001905
[[law.classifiers]]
name = "Abschnitt"
is_root = true
match_function = "contains"
[parser]
remove_strings = [
"""<absatz typ="abs" ct="text" halign="j"><i>(§§ 1, 2, 3, 4,6, § 8 Abs. 1 und 2 des Gesetzes vom 16. Februar 1883, RGBl. Nr. 20, betreffend das Verfahren zum Zwecke der Todeserklärung und der Beweisführung des Todes, in der Fassung des Gesetzes vom 31. März 1918, RGBl. Nr. 129:)</i></absatz>""",
"""<absatz typ="abs" ct="text" halign="j"><i>(§§ 1 bis 11 des Gesetzes über die Verschollenheit, die Todeserklärung und die Feststellung der Todeszeit vom 4. Juli 1939, Deutsches RGBl. I S. 1186:)</i></absatz>""",
"""<absatz typ="abs" ct="text" halign="j"><i>(§ 56 Abs. 3 des Gesetzes vom 4. Juli 1939, Deutsches RGBl. I S. 1186:)</i></absatz>""",
"""<absatz typ="abs" ct="text" halign="j"><i>(§ 10 des Gesetzes vom 16. Februar 1883, RGBl. Nr. 20, betreffend das Verfahren zum Zwecke der Todeserklärung und der Beweisführung des Todes, in der Fassung des Gesetzes vom 31. März 1918, RGBl. Nr. 129:)</i></absatz>""",
"""<absatz typ="abs" ct="text" halign="j"><i>(§§ 10a, 10b und 10c des Gesetzes vom 16. Februar 1883, RGBl. Nr. 20, betreffend das Verfahren zum Zwecke der Todeserklärung und der Beweisführung des Todes, in der Fassung des Gesetzes vom 31. März 1918, RGBl. Nr. 129:)</i></absatz>""",
"<i>", "</i>"
]

29
laws/urhg.toml Normal file
View File

@ -0,0 +1,29 @@
[law]
id = 10001848
[[law.classifiers]]
name = "Hauptstück"
is_root = true
match_function = "contains"
[[law.classifiers]]
name = "Abschnitt"
is_root = false
match_function = "contains"
[[law.classifiers]]
name = "Number"
is_root = false
match_function = "starts_with_number"
[[parser.replace_rules]]
find = "<i>.</i>"
replace_with = "."
[[parser.replace_rules]]
find = "<gdash />"
replace_with = "-"
[[parser.replace_rules]]
find = """<liste><schlussteil ebene="0" art="normal" ct="text">(2) Einer Rundfunksendung steht es gleich, wenn ein Werk von einer im In- oder im Ausland gelegenen Stelle aus der Öffentlichkeit im Inland, ähnlich wie durch Rundfunk, aber mit Hilfe von Leitungen wahrnehmbar gemacht wird.</schlussteil></liste>"""
replace_with = """<absatz typ="abs" ct="text" halign="j">(2) Einer Rundfunksendung steht es gleich, wenn ein Werk von einer im In- oder im Ausland gelegenen Stelle aus der Öffentlichkeit im Inland, ähnlich wie durch Rundfunk, aber mit Hilfe von Leitungen wahrnehmbar gemacht wird.</absatz>"""

16
laws/vereinsg.toml Normal file
View File

@ -0,0 +1,16 @@
[law]
id = 20001917
[[law.classifiers]]
name = "Abschnitt"
is_root = true
match_function = "contains"
[parser]
remove_strings = ["<n>", "</n>"]
[[parser.replace_rules]]
find = "<gdash />"
replace_with = "-"

7
laws/vgg.toml Normal file
View File

@ -0,0 +1,7 @@
[law]
id = 20011654
[[law.classifiers]]
name = "Abschnitt"
is_root = true
match_function = "contains"