|
@@ -111,10 +111,19 @@ curl -s http://100.80.222.54:9020/v1/graphql \
|
|
|
|
|
|
|
|
Python:
|
|
Python:
|
|
|
```python
|
|
```python
|
|
|
-pattern = r'Uurimisküsimused ja eesmärgid:\*?\*?\s*(.*?)(?=\n\*\*|$)'
|
|
|
|
|
|
|
+# ✅ KÕIK variandid käsitletud
|
|
|
|
|
+pattern = r'(?:^|\n)\s*(?:[-•*•]\s+)?\*{0,2}Uurimisküsimused ja eesmärgid:\*{0,2}\s*(.+?)(?=(?:^|\n)\s*(?:[-•*•]\s+)?\*{0,2}Teaduslik tähtsus:|$)'
|
|
|
match = re.search(pattern, summary_et, re.DOTALL)
|
|
match = re.search(pattern, summary_et, re.DOTALL)
|
|
|
```
|
|
```
|
|
|
|
|
|
|
|
|
|
+Regex seletused:
|
|
|
|
|
+(?:^|\n) = Reast algus VÕI uus rida
|
|
|
|
|
+\s* = Tühikud
|
|
|
|
|
+(?:[-•*•]\s+)? = Valikuline loetelu märk (- - *)
|
|
|
|
|
+\*{0,2} = 0-2 tärni (markdown ** või pole)
|
|
|
|
|
+(.+?) = Kogu sektsioon (non-greedy)
|
|
|
|
|
+(?=...) = Lookahead "Teaduslik tähtsus:" ees (sama mustriga)
|
|
|
|
|
+
|
|
|
jq:
|
|
jq:
|
|
|
```bash
|
|
```bash
|
|
|
match("Uurimisküsimused ja eesmärgid:.*?\\*\\*(.+?)(?=\\n\\*\\*|$)"; "s")
|
|
match("Uurimisküsimused ja eesmärgid:.*?\\*\\*(.+?)(?=\\n\\*\\*|$)"; "s")
|