Skip to content

Commit b51e0b9

Browse files
committed
Update rules file and parser for version 2025-01
1 parent 99020a6 commit b51e0b9

File tree

2 files changed

+86
-44
lines changed

2 files changed

+86
-44
lines changed

neue-bibel-heute-parser/NeÜ-Vollversion.rules

+84-42
Original file line numberDiff line numberDiff line change
@@ -1,3 +1,7 @@
1+
index.html
2+
2mo\.html#3_18
3+
2mo.html#13_18
4+
15
3mo.html
26
ihr entblößen\. ¶
37
ihr entblößen.</p>¶
@@ -13,8 +17,8 @@ erwiderte: „Ich
1317
erwiderte: "Ich
1418

1519
ri.html
16-
(<p><span class="vers" id="13_8">8</span>.*?)¶(<div class="fn">13,6: <em>.*?</div>)
17-
$2¶$1
20+
Mann\* folgten
21+
Mann folgten
1822

1923
1sam.html
2024
sagte Abischai\.¶
@@ -25,32 +29,78 @@ sagte Abischai.</p>¶
2529
2sam.html
2630
<a href="#11_4">Kapitel 11,3
2731
<a href="#11_3">Kapitel 11,3
32+
"1Chr\.html
33+
"1chr.html
34+
22\.000 Mann\.
35+
22.000 Mann*.
2836

29-
2koe.html
30-
ein Talent Silber\* und
31-
ein Talent Silber und
37+
1koe.html
38+
Zwangsarbeiter einziehen
39+
Zwangsarbeiter* einziehen
40+
Aufseher,\* die
41+
Aufseher, die
3242

3343
1chr.html
3444
Jafet.¶</p>
3545
Jafet.</p>
36-
<span class="vers"id="22_1">
37-
<span class="vers" id="22_1">
3846
</br>
3947
<br />
48+
22\.600 Mann\.
49+
22.600 Mann*.
50+
87\.000 Mann\.\*
51+
87.000 Mann.
52+
Mann eingetragen
53+
Mann* eingetragen
54+
Heer\.\*
55+
Heer.
56+
Wehrtüchtige,\* Männer
57+
Wehrtüchtige, Männer
58+
Bewaffnete,
59+
Bewaffnete*,
60+
Männer, die namentlich
61+
Männer*, die namentlich
62+
Kriegsbewaffnung\.\*
63+
Kriegsbewaffnung.
64+
<p>¶(<div class="fn">.*?</div>)
65+
$1¶<p>
66+
38\.000 Männer\.
67+
38.000 Männer*.
68+
4000,\*
69+
4000,
4070

4171
2chr.html
42-
"fn">2,1.16-17:
43-
"fn">2,1: (V. 1.16-17)
44-
<div class="fn">25,5-6
45-
<div class="fn">25,6: (V. 5-6)
72+
"2Chr\.html
73+
"2chr.html
74+
Soldaten zusammen
75+
Soldaten* zusammen
76+
(<div class="fn">12,3: n_N.*?</div>)¶(<div class="fn">12,1: (.|¶)*?<div class="fn">12,3: <em>Nubien.*?</div>)
77+
$2¶$1
78+
(<div class="fn">14,7: .*?</div>)¶(<div class="fn">14,2: .*?</div>)
79+
$2¶$1
80+
wehrtüchtige Männer,
81+
wehrtüchtige Männer*,
82+
Bewaffneten\.\*
83+
Bewaffneten.
84+
100\.000 Männer\* für 100 Talente Silber anwerben\.\*
85+
100.000 Männer für 100 Talente Silber anwerben.
86+
10\.000 Männer von
87+
10.000 Männer* von
88+
3000 Männer\* und
89+
3000 Männer und
90+
war 2600\.
91+
war 2600*.
92+
307\.500 Mann,\* stark
93+
307.500 Mann, stark
4694

4795
esra.html
4896
<a href="#8,1">
4997
<a href="#8_1">
5098

51-
neh.html
52-
<p><a href="#top"><span class="kap">8</span></a>¶\Q<span class="vers">(7,72)</span> \E([^¶]*)
53-
<p>$1 </p>¶<p><a href="#top"><span class="kap">8</span></a>&nbsp;
99+
hiob.html
100+
<h3 id="vo">(1-2: .*)</h3>
101+
<h2 id="vo">$1</h2>
102+
<h3 id="3">(.*)</h3>
103+
<h4 id="3">$1</h4>
54104

55105
ps.html
56106
¶»» <a href="
@@ -69,8 +119,8 @@ $2$1
69119
$2$1
70120
Wort<a href="#psalm">\*</a></h4>
71121
Wort</h4>
72-
\Q"kap">/119\</span></a> <span class="u2"> I Álef*</span></p>\E¶<p class="poet">¶<span class="vers" id="119_1">1</span> Wie
73-
"kap">/119\\</span></a> ¶ <span class="vers">1</span>*<span class="u2"> I Álef*</span></p>¶<p class="poet">¶ Wie
122+
\Q"kap">/119\</span></a> <span class="u2"> I Álef*</span></p>\E¶<p class="poet">¶<span class="vers" id="119_1">1</span> Glücklich
123+
"kap">/119\\</span></a> ¶ <span class="vers">1</span>*<span class="u2"> I Álef*</span></p>¶<p class="poet">¶ Glücklich
74124
<div class="fn">Psalm 119:
75125
<div class="fn">119,1: <em>Psalm 119</em>:
76126

@@ -95,6 +145,10 @@ zu ihnen: ‚So
95145
zu ihnen: 'So
96146
Israel“,
97147
Israel",
148+
Efraïms!‘\*
149+
Efraïms!'*
150+
‚Seht
151+
'Seht
98152

99153
kla.html
100154
„Ist
@@ -107,14 +161,12 @@ hes.html
107161
<a href="jer.html#39_4">
108162
vernichten. Dann wirst du erkennen, dass ich Jahwe bin."
109163
vernichten. Dann wirst du erkennen, dass ich Jahwe bin.'"
110-
Liter Feinmehl und
111-
Liter Feinmehl* und
112164
\*</h4>
113165
</h4>
114166
<span class="vers" id="40_1">1</span> Es geschah im
115167
<span class="vers" id="40_1">1</span>* Es geschah im
116-
<div class="fn">Hesekiel 40-48: (.*?) <a href="Hesekiels Tempel\.gif" target="_blank">(.*?)</a>\.
117-
<div class="fn">40,1: Hesekiel 40-48: $1 $2 im Anhang.
168+
<div class="fn">Hesekiel 40: (.*?) <a href="Hesekiels Tempel\.gif" target="_blank">(.*?)</a>\.
169+
<div class="fn">40,1: Hesekiel 40: $1 $2 im Anhang.
118170

119171
dan.html
120172
<a href="jer.html#31_18">31,18ff</a>
@@ -123,35 +175,33 @@ dan.html
123175
<a href="#7_25">Daniel 7,25</a>
124176
(Chaldäer war, getötet\.)¶
125177
$1</p>¶
126-
<span class="kap" id="11">
127-
<span class="kap">
128178
(<div class="fn">12,7: .*?</div>¶)(<div class="fn">12,5: .*?</div>¶)
129179
$2$1
130180

181+
hos.html
182+
<p id="7"class="poet">
183+
<p id="7" class="poet">
184+
131185
mi.html
132186
<a href="1koe.html#2_25">21,25-26</a>
133187
<a href="1koe.html#21_25">21,25-26</a>
134188

135-
mal.html
136-
<a href="Lukas.html#1_17">
137-
<a href="lk.html#1_17">
138-
<p></p>So wird
139-
<p>So wird
140-
Jerusalem gebracht wird.¶
141-
Jerusalem gebracht wird.</p>¶
142-
143189
mt.html
144-
"fn">20,6.9:
145-
"fn">20,6:
146190
sagte: „Geh
147191
sagte: "Geh
192+
Nachmittag\* angefangen
193+
Nachmittag angefangen
148194

149195
mk.html
150196
5,20</a>\)\.¶</div>
151197
5,20</a>).</div>
152198
Stand ",
153199
Stand",
154200

201+
lk.html
202+
größer als er\.¶
203+
größer als er."¶
204+
155205
jo.html
156206
„Herr,
157207
"Herr,
@@ -203,12 +253,10 @@ off.html
203253
<a href="lk.html#16_23">Lukas 16,23</a>
204254
<a href="Offenbarung.html#12_3">
205255
<a href="off.html#12_3">
206-
<span class="vers">\(12,18\)</span>
207-
<span class="vers">12,18</span>
256+
id "12_18">
257+
id="12_18">
208258

209259
bibel.html
210-
<br />
211-
<br />
212260
<br/>
213261
<br />
214262
<br\\>
@@ -226,12 +274,6 @@ aber sagt: »Ich
226274
werden!",
227275
werden!«,
228276

229-
4mo.html
230-
### 5:20 whitespace missing after closing single quote
231-
###
232-
geschlafen hat'-
233-
geschlafen hat' -
234-
235277
jos.html
236278
### 22:22 move comma
237279
###

neue-bibel-heute-parser/src/main/java/biblemulticonverter/neue/NeUeParser.java

+2-2
Original file line numberDiff line numberDiff line change
@@ -281,7 +281,7 @@ public Bible doImport(File inputDirectory) throws Exception {
281281
List<Visitor<RuntimeException>> newFootnotes = new ArrayList<>();
282282
while (line.matches("<[a-z0-9]+ (class=\"[^\"]+\" )?id=\"[a-z0-9]+\"[> ].*"))
283283
line = line.replaceFirst(" id=\"[a-z0-9]+\"", "");
284-
line = line.replaceAll("<span class=\"vers\" id=\"[0-9]+_[0-9]+\">", "<span class=\"vers\">");
284+
line = line.replaceAll("<span class=\"vers\" ?id=\"[0-9]+_[0-9]+\">", "<span class=\"vers\">");
285285
if (line.startsWith("<p class=\"poet\">") || line.startsWith("<p class=\"einl\">")) {
286286
line = "<p>" + line.substring(16);
287287
}
@@ -382,7 +382,7 @@ public Bible doImport(File inputDirectory) throws Exception {
382382
prolog = null;
383383
}
384384
} else if (!inParagraph && line.startsWith("<div class=\"fn\">")) {
385-
String content = cutAffix(line, "<div class=\"fn\">", "</div>");
385+
String content = cutAffix(line, "<div class=\"fn\">", "</div>").replaceAll("^([0-9]+,([0-9]+))([.-][.0-9]+): ", "$1: (V. $2$3) ");
386386
if (footnoteVerses.size() == 0)
387387
throw new IOException(line);
388388
String prefix = footnoteVerses.remove(0) + ":";

0 commit comments

Comments
 (0)