Jelajahi Sumber

regex'i patterni muudatus

Ardo Kubjas 3 bulan lalu
induk
melakukan
cf67a6d6ed
1 mengubah file dengan 10 tambahan dan 1 penghapusan
  1. 10 1
      fetch_articles/ULTRA_COMPACT/ULTRA_COMPACT.md

+ 10 - 1
fetch_articles/ULTRA_COMPACT/ULTRA_COMPACT.md

@@ -111,10 +111,19 @@ curl -s http://100.80.222.54:9020/v1/graphql \
 
 Python:
 ```python
-pattern = r'Uurimisküsimused ja eesmärgid:\*?\*?\s*(.*?)(?=\n\*\*|$)'
+# ✅ KÕIK variandid käsitletud
+pattern = r'(?:^|\n)\s*(?:[-•*•]\s+)?\*{0,2}Uurimisküsimused ja eesmärgid:\*{0,2}\s*(.+?)(?=(?:^|\n)\s*(?:[-•*•]\s+)?\*{0,2}Teaduslik tähtsus:|$)'
 match = re.search(pattern, summary_et, re.DOTALL)
 ```
 
+Regex seletused:
+(?:^|\n) = Reast algus VÕI uus rida
+\s* = Tühikud
+(?:[-•*•]\s+)? = Valikuline loetelu märk (- - *)
+\*{0,2} = 0-2 tärni (markdown ** või pole)
+(.+?) = Kogu sektsioon (non-greedy)
+(?=...) = Lookahead "Teaduslik tähtsus:" ees (sama mustriga)
+
 jq:
 ```bash
 match("Uurimisküsimused ja eesmärgid:.*?\\*\\*(.+?)(?=\\n\\*\\*|$)"; "s")