6 meses atrás · f80f768427
--- a/save_articles_to_pdf.py
+++ b/save_articles_to_pdf.py
@@ -1,43 +1,45 @@
 
															-# save_articles_to_pdf.py
														
 
															-
														
 
															 import os
														
 
															 import sys
														
 
															 import re
														
 
															 from datetime import datetime
														
 
															-from reportlab.lib.pagesizes import letter, A4
														
 
															+
														
 
															+from reportlab.lib.pagesizes import A4
														
 
															 from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, PageBreak, Table, TableStyle
														
 
															 from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle
														
 
															-from reportlab.lib.enums import TA_JUSTIFY, TA_CENTER, TA_LEFT
														
 
															+from reportlab.lib.enums import TA_JUSTIFY, TA_LEFT
														
 
															 from reportlab.lib import colors
														
 
															-from reportlab.lib.units import inch, cm
														
 
															-from reportlab.pdfbase import pdfmetrics
														
 
															-from reportlab.pdfbase.ttfonts import TTFont
														
 
															+from reportlab.lib.units import cm
														
 
															+
														
 
															 import json
														
 
															+import traceback
														
 
															 # Lisa src kaust Pythoni teele
														
 
															 sys.path.insert(0, os.path.join(os.path.dirname(__file__), 'src'))
														
 
															-
														
 
															 from src.weaviate_client import WeaviateClient
														
 
															+
														
 
															+# ============================================================================
														
 
															+# STRINGI PUHASTAMISE FUNKTSIOONID
														
 
															+# ============================================================================
														
 
															+
														
 
															 def clean_html_tags(text):
														
 
															     """Puhasta tekst HTML/XML siltidest ReportLab-i jaoks"""
														
 
															     if not text:
														
 
															         return ""
														
 
															-    
														
 
															-    # Eemalda kõik HTML/XML siltid
														
 
															+    # Eemalda kõik HTML/XML sildid
														
 
															     text = re.sub(r'<[^>]+>', '', text)
														
 
															-    
														
 
															+
														
 
															     # Asenda erimärgid ReportLab-ile sobivate märkidega
														
 
															     replacements = {
														
 
															-        '&nbsp;': ' ',
														
 
															-        '&amp;': '&',
														
 
															-        '&lt;': '<',
														
 
															-        '&gt;': '>',
														
 
															-        '&quot;': '"',
														
 
															-        '&#39;': "'",
														
 
															-        '&apos;': "'",
														
 
															-        '\u00a0': ' ',  # mitte-tühik
														
 
															-        '\u2026': '...',  # ellipsis
														
 
															+        ' ': ' ',
														
 
															+        '&': '&',
														
 
															+        '<': '<',
														
 
															+        '>': '>',
														
 
															+        '"': '"',
														
 
															+        '’': "'",
														
 
															+        '‘': "'",
														
 
															+        '\u00a0': ' ',   # mitte-tühik
														
 
															+        '\u2026': '...', # ellipsis
														
 
															         '\u2013': '-',   # n-sild
														
 
															         '\u2014': '-',   # m-sild
														
 
															         '\u2018': "'",   # vasak ülakoma
														
@@ -45,206 +47,327 @@ def clean_html_tags(text):
 
															         '\u201c': '"',   # vasak jutumärk
														
 
															         '\u201d': '"',   # parem jutumärk
														
 
															     }
														
 
															-    
														
 
															+
														
 
															     for old, new in replacements.items():
														
 
															         text = text.replace(old, new)
														
 
															-    
														
 
															+
														
 
															     return text
														
 
															+
														
 
															 def clean_markdown_for_pdf(text):
														
 
															     """Konverteeri markdown ReportLab-ile sobivaks tekstiks"""
														
 
															     if not text:
														
 
															         return ""
														
 
															-    
														
 
															+
														
 
															     # Kui ei ole string, konverteeri stringiks
														
 
															     if not isinstance(text, str):
														
 
															         text = str(text)
														
 
															-    
														
 
															-    # Eemalda HTML siltid
														
 
															+
														
 
															+    # Eemalda HTML sildid
														
 
															     text = clean_html_tags(text)
														
 
															-    
														
 
															-    # Asenda markdown pealkirjad
														
 
															-    text = re.sub(r'#{1,6}\s+', '', text)  # Eemalda # pealkirjad
														
 
															-    text = re.sub(r'\*\*(.+?)\*\*', r'\1', text)  # Asenda **bold** lihtsalt tekstiga
														
 
															-    text = re.sub(r'\*(.+?)\*', r'\1', text)  # Asenda *italic* lihtsalt tekstiga
														
 
															-    text = re.sub(r'__(.+?)__', r'\1', text)  # Asenda __underline__ lihtsalt tekstiga
														
 
															-    text = re.sub(r'~~(.+?)~~', r'\1', text)  # Asenda ~~strikethrough~~ lihtsalt tekstiga
														
 
															-    
														
 
															-    # Asenda loetelud (PARANDATUD: kasuta \\1 mitte \1)
														
 
															+
														
 
															+    # Asenda markdown pealkirjad (# # # jne)
														
 
															+    text = re.sub(r'#{1,6}\s+', '', text)
														
 
															+
														
 
															+    # Asenda bold, italic, strikethrough markeeringud
														
 
															+    text = re.sub(r'\*\*(.+?)\*\*', r'\1', text)  # **bold**
														
 
															+    text = re.sub(r'\*(.+?)\*', r'\1', text)      # *italic*
														
 
															+    text = re.sub(r'__(.+?)__', r'\1', text)      # __underline__
														
 
															+    text = re.sub(r'~~(.+?)~~', r'\1', text)      # ~~strikethrough~~
														
 
															+
														
 
															+    # Asenda loetelud
														
 
															     text = re.sub(r'^\s*[-*+]\s+', '• ', text, flags=re.MULTILINE)
														
 
															-    text = re.sub(r'^\s*(\d+)\.\s+', r'\1. ', text, flags=re.MULTILINE)  # PARANDATUD
														
 
															-    
														
 
															-    # Asenda koodiblokid
														
 
															-    text = re.sub(r'```[^`]+```', '', text)  # Eemalda koodiblokid
														
 
															-    text = re.sub(r'`([^`]+)`', r'[\1]', text)  # Asenda inline kood
														
 
															-    
														
 
															-    # Asenda lingid
														
 
															-    text = re.sub(r'\[([^\]]+)\]\([^\)]+\)', r'\1', text)  # Eemalda lingid
														
 
															-    
														
 
															+    text = re.sub(r'^\s*(\d+)\.\s+', r'\1. ', text, flags=re.MULTILINE)
														
 
															+
														
 
															+    # Eemalda koodiblokid
														
 
															+    text = re.sub(r'```[^`]+```', '', text)
														
 
															+    text = re.sub(r'`([^`]+)`', r'[\1]', text)
														
 
															+
														
 
															+    # Eemalda lingid (jäta ainult tekst)
														
 
															+    text = re.sub(r'\[([^\]]+)\]\([^)]+\)', r'\1', text)
														
 
															+
														
 
															     # Eemalda liigsed tühikud
														
 
															     text = re.sub(r'\s+', ' ', text)
														
 
															-    
														
 
															+
														
 
															     return text.strip()
														
 
															-def clean_json_markers(text):
														
 
															+
														
 
															+def format_summary_for_pdf(summary):
														
 
															+    """Vorminda kokkuvõte PDF-ile sobivaks"""
														
 
															+    if not summary:
														
 
															+        return ""
														
 
															+
														
 
															+    # Kui ei ole string, konverteeri
														
 
															+    if not isinstance(summary, str):
														
 
															+        summary = str(summary)
														
 
															+
														
 
															+    # Eemalda kõik vormindus
														
 
															+    summary = clean_markdown_for_pdf(summary)
														
 
															+
														
 
															+    # Lisa uued read peamiste sektsioonide ette
														
 
															+    summary = summary.replace('1. ARTIKLI PEAMISED PUNKTID:', '\n1. ARTIKLI PEAMISED PUNKTID:\n')
														
 
															+    summary = summary.replace('2. KASUTATUD MEETODID:', '\n\n2. KASUTATUD MEETODID:\n')
														
 
															+    summary = summary.replace('3. PEAMISED TULEMUSED:', '\n\n3. PEAMISED TULEMUSED:\n')
														
 
															+    summary = summary.replace('4. JÄRELDUSED JA SOOVITUSED:', '\n\n4. JÄRELDUSED JA SOOVITUSED:\n')
														
 
															+    summary = summary.replace('5. TRANSFORDIPLANEERIMISE KONTEKST:', '\n\n5. TRANSFORDIPLANEERIMISE KONTEKST:\n')
														
 
															+
														
 
															+    # Asenda liigsed reavahetused
														
 
															+    summary = re.sub(r'\n{3,}', '\n\n', summary)
														
 
															+
														
 
															+    # Lõika liiga pikk tekst
														
 
															+    if len(summary) > 4000:
														
 
															+        summary = summary[:4000] + "... [kokkuvõte lõigatud, liiga pikk]"
														
 
															+
														
 
															+    return summary
														
 
															+
														
 
															+
														
 
															+# ============================================================================
														
 
															+# TRANSPORT KONTEKSTI PARSING
														
 
															+# ============================================================================
														
 
															+
														
 
															+def extract_json_field(json_string, field_name):
														
 
															     """
														
 
															-    Eemaldab JSON ümber olevad ```json ja ``` markerid
														
 
															+    Eralda JSON stringist konkreetne väli regex abil.
														
 
															+
														
 
															+    Args:
														
 
															+        json_string: JSON tekst stringina
														
 
															+        field_name: välja nimi (nt "theoretical_contribution")
														
 
															+
														
 
															+    Returns:
														
 
															+        Välja väärtus või None
														
 
															     """
														
 
															-    # Eemalda algusest
														
 
															-    text = re.sub(r'^```json\s*', '', text, flags=re.MULTILINE)
														
 
															-    # Eemalda lõpust
														
 
															-    text = re.sub(r'\s*```$', '', text, flags=re.MULTILINE)
														
 
															-    # Eemalda kõikjalt kui on
														
 
															-    text = re.sub(r'\s*```(json)?\s*', '', text)
														
 
															-    return text.strip()
														
 
															+    if not json_string:
														
 
															+        return None
														
 
															-def clean_json_string(text):
														
 
															-    """Puhasta JSON string"""
														
 
															-    # Eemalda reavahetused ja liigsed tühikud
														
 
															-    text = text.replace('\n', '').replace('\r', '')
														
 
															-    # Asenda \\" tavaliste jutumärkidega
														
 
															-    text = text.replace('\\"', '"')
														
 
															-    # Eemalda esimesed ja viimased jutumärgid kui vaja
														
 
															-    if text.startswith('"') and text.endswith('"'):
														
 
															-        text = text[1:-1]
														
 
															-    return text
														
 
															+    pattern = rf'"{field_name}":\s*"([^"]*(?:\\"[^"]*)*)"'
														
 
															+    match = re.search(pattern, json_string)
														
 
															+    if match:
														
 
															+        return match.group(1)
														
 
															+    return None
														
 
															-def extract_and_format_json(data):
														
 
															-    """Eralda ja vorminda JSON andmed"""
														
 
															-    formatted_parts = []
														
 
															-    
														
 
															-    # Võti-väärtus paaride kaart
														
 
															-    key_map = {
														
 
															-        "theoretical_contribution": "Theoretical contribution",
														
 
															-        "practical_applicability": "Practical applicability", 
														
 
															-        "problem_solving": "Problem solving",
														
 
															-        "limitations": "Limitations",
														
 
															-        "future_research": "Future research",
														
 
															-        "methodology": "Methodology"
														
 
															-    }
														
 
															+
														
 
															+def extract_relevance_score(json_string):
														
 
															+    """Eralda relevance_score JSON stringist või tekstist."""
														
 
															+    if not json_string:
														
 
															+        return None
														
 
															+
														
 
															+    pattern = r'"relevance_score":\s*(\d+(?:\.\d+)?)'
														
 
															+    match = re.search(pattern, json_string)
														
 
															+    if match:
														
 
															+        return match.group(1)
														
 
															+    return None
														
 
															+
														
 
															+
														
 
															+def format_transport_context(transport_context):
														
 
															+    """
														
 
															+    Vorminda transpordi kontekst PDF-ile.
														
 
															+    """
														
 
															+    if not transport_context:
														
 
															+        return None
														
 
															+
														
 
															+    # PARANDUS: Leia analüüsi tekst
														
 
															+    analysis_text = None
														
 
															-    for key, title in key_map.items():
														
 
															-        if key in data and data[key]:
														
 
															-            formatted_parts.append(f"{title}")
														
 
															-            formatted_parts.append(str(data[key]))
														
 
															-            formatted_parts.append("")  # tühi rida
														
 
															+    # Kui on dict ja sisaldab 'analysis' võtit
														
 
															+    if isinstance(transport_context, dict):
														
 
															+        if 'analysis' in transport_context:
														
 
															+            analysis_text = transport_context['analysis']
														
 
															+        else:
														
 
															+            # Võib-olla kogu dict ON juba analysis?
														
 
															+            analysis_text = str(transport_context)
														
 
															+    elif isinstance(transport_context, str):
														
 
															+        analysis_text = transport_context
														
 
															+    else:
														
 
															+        return None
														
 
															+
														
 
															+    if not analysis_text:
														
 
															+        return None
														
 
															+
														
 
															+    txt = str(analysis_text)
														
 
															-    return "\n".join(formatted_parts)
														
 
															+    # EEMALDA ```json ... ``` markerid
														
 
															+    txt = re.sub(r'```json\s*', '', txt)
														
 
															+    txt = re.sub(r'\s*```', '', txt)
														
 
															+    txt = txt.strip()
														
 
															+
														
 
															+    # DEBUG: Prindi välja pärast puhastamist
														
 
															+    #print("DEBUG after cleanup:", txt[:200])
														
 
															+
														
 
															+    parsed = None
														
 
															-def process_json_text(input_text):
														
 
															-    """Pööra JSON tekst loetavaks vorminguks"""
														
 
															+    # 1) Proovi parsida JSON otse
														
 
															     try:
														
 
															-        # Parse esimene kiht
														
 
															-        parsed = json.loads(input_text)
														
 
															-        
														
 
															-        # Otsi analüüsi andmeid
														
 
															-        analysis_data = None
														
 
															-        
														
 
															-        # Variant 1: "analysis" väljal on JSON string
														
 
															-        if "analysis" in parsed:
														
 
															+        parsed = json.loads(txt)
														
 
															+        #print("✅ JSON parsed successfully!")
														
 
															+        #print(f"DEBUG parsed keys: {list(parsed.keys())}")
														
 
															+    except json.JSONDecodeError as e:
														
 
															+        #print(f"❌ JSON parse failed: {e}")
														
 
															+        # Kui ei õnnestu, proovi leida {...} blokk
														
 
															+        m = re.search(r'\{.*\}', txt, flags=re.DOTALL)
														
 
															+        if m:
														
 
															+            json_candidate = m.group(0)
														
 
															             try:
														
 
															-                # Puhasta ja parse sisemine JSON
														
 
															-                clean_analysis = clean_json_string(str(parsed["analysis"]))
														
 
															-                analysis_data = json.loads(clean_analysis)
														
 
															-            except:
														
 
															-                # Kui ei saa JSON-iks, kasuta otse
														
 
															-                analysis_data = parsed.get("analysis", {})
														
 
															-        
														
 
															-        # Variant 2: andmed otse pealkirjade all
														
 
															-        elif any(key in parsed for key in ["theoretical_contribution", "practical_applicability"]):
														
 
															-            analysis_data = parsed
														
 
															-        
														
 
															-        # Variant 3: teised võimalused
														
 
															-        else:
														
 
															-            # Proovi leida JSON kuskil mujal
														
 
															-            for key, value in parsed.items():
														
 
															-                if isinstance(value, str) and any(x in value.lower() for x in ["theoretical", "practical", "contribution"]):
														
 
															-                    try:
														
 
															-                        clean_val = clean_json_string(value)
														
 
															-                        analysis_data = json.loads(clean_val)
														
 
															-                        break
														
 
															-                    except:
														
 
															-                        continue
														
 
															-        
														
 
															-        if analysis_data:
														
 
															-            return extract_and_format_json(analysis_data)
														
 
															-        else:
														
 
															-            return "No analysis data found in JSON"
														
 
															+                parsed = json.loads(json_candidate)
														
 
															+                #print("✅ JSON parsed from candidate!")
														
 
															+            except json.JSONDecodeError as e2:
														
 
															+                print(f"❌ Candidate parse also failed: {e2}")
														
 
															+                parsed = None
														
 
															+
														
 
															+    formatted_parts = []
														
 
															+
														
 
															+    # Kui JSON parsimine õnnestus
														
 
															+    if isinstance(parsed, dict):
														
 
															+        #print("✅ Using parsed JSON dict")
														
 
															+        
														
 
															+        # KUI parsed sisaldab 'analysis' võtit, siis see on VEEL ÜKS string!
														
 
															+        # Peame seda UUESTI parsima!
														
 
															+        # KUI parsed sisaldab 'analysis' võtit, siis see on VEEL ÜKS string!
														
 
															+        if 'analysis' in parsed and isinstance(parsed['analysis'], str):
														
 
															+            #print("⚠️ 'analysis' is still a string, parsing again...")
														
 
															+            inner_txt = parsed['analysis']
														
 
															+            # Eemalda ```json markerid uuesti
														
 
															+            inner_txt = re.sub(r'```json\s*', '', inner_txt)
														
 
															+            inner_txt = re.sub(r'\s*```', '', inner_txt)
														
 
															+            inner_txt = inner_txt.strip()
														
 
															+            # PARANDUS: Asenda valed escaped quotes
														
 
															+            # \"word\" → "word" (ainult siis kui on tähtede vahel)
														
 
															+            inner_txt = re.sub(r'\\"([a-züõäöA-ZÜÕÄÖ]+)\\"', r'"\1"', inner_txt)
														
 
															-    except json.JSONDecodeError as e:
														
 
															-        return f"JSON parsing error: {str(e)}"
														
 
															-    except Exception as e:
														
 
															-        return f"Error: {str(e)}"
														
 
															-
														
 
															-def parse_transport_context(context_data):
														
 
															-    context_data = clean_json_markers(context_data)
														
 
															-    """Parsi transpordikonteksti JSON-ist loetavaks"""
														
 
															-    if isinstance(context_data, str):
														
 
															-        # Proovi parsida string JSON-iks
														
 
															-        try:
														
 
															-            return json.loads(context_data)
														
 
															-        except json.JSONDecodeError:
														
 
															-            # Kui ei õnnestu, tagasta puhastatud string
														
 
															-            return {"raw_analysis": clean_markdown_for_pdf(context_data)}
														
 
															-    elif isinstance(context_data, dict):
														
 
															-        # Puhasta kõik stringiväljad
														
 
															-        cleaned = {}
														
 
															-        for key, value in context_data.items():
														
 
															-            if isinstance(value, str):
														
 
															-                cleaned[key] = clean_markdown_for_pdf(value)
														
 
															-            else:
														
 
															-                cleaned[key] = value
														
 
															-        return cleaned
														
 
															-    return context_data
														
 
															-
														
 
															-def format_context_for_pdf(parsed_context):
														
 
															-    """Vorminda parsitud kontekst PDF-i jaoks"""
														
 
															-    if isinstance(parsed_context, dict):
														
 
															-        formatted = []
														
 
															-        
														
 
															-        if 'theoretical_contribution' in parsed_context and parsed_context['theoretical_contribution']:
														
 
															-            formatted.append(f"TEOREETILINE PANUS: {parsed_context['theoretical_contribution']}")
														
 
															-        
														
 
															-        if 'practical_applicability' in parsed_context and parsed_context['practical_applicability']:
														
 
															-            formatted.append(f"PRAKTILINE RAKENDATAVUS: {parsed_context['practical_applicability']}")
														
 
															-        
														
 
															-        if 'problem_solving' in parsed_context and parsed_context['problem_solving']:
														
 
															-            formatted.append(f"PROBLEEMILAHDUS: {parsed_context['problem_solving']}")
														
 
															-        
														
 
															-        if 'limitations' in parsed_context and parsed_context['limitations']:
														
 
															-            formatted.append(f"PIIRANGUD: {parsed_context['limitations']}")
														
 
															-        
														
 
															-        if 'relevance_score' in parsed_context:
														
 
															-            formatted.append(f"RELEVANTSUSE SKOOR: {parsed_context['relevance_score']}/10")
														
 
															-        
														
 
															-        if 'analysis' in parsed_context and parsed_context['analysis']:
														
 
															-            formatted.append(f"ANALÜÜS: {parsed_context['analysis']}")
														
 
															-        
														
 
															-        if 'raw_analysis' in parsed_context and parsed_context['raw_analysis']:
														
 
															-            formatted.append(f"ANALÜÜS: {parsed_context['raw_analysis']}")
														
 
															-        
														
 
															-        return "\n\n".join(formatted)
														
 
															-    else:
														
 
															-        return clean_markdown_for_pdf(str(parsed_context))
														
 
															+            # PARANDUS: Escape jutumärgid, mis on stringi väärtuste sees
														
 
															+            # Leia kõik "key": "value" paare ja escape "value" sees olevad jutumärgid
														
 
															+            def escape_quotes_in_values(match):
														
 
															+                key = match.group(1)
														
 
															+                value = match.group(2)
														
 
															+                # Escape jutumärgid value sees
														
 
															+                value_escaped = value.replace('"', '\\"')
														
 
															+                return f'"{key}": "{value_escaped}"'
														
 
															+            
														
 
															+            inner_txt = re.sub(r'"(\w+)":\s*"([^"]*(?:"[^"]*)*)"', escape_quotes_in_values, inner_txt)
														
 
															+            
														
 
															+            try:
														
 
															+                parsed = json.loads(inner_txt)
														
 
															+                #print("✅ Inner JSON parsed successfully!")
														
 
															+                #print(f"DEBUG inner parsed keys: {list(parsed.keys())}")
														
 
															+            except json.JSONDecodeError as e:
														
 
															+                #print(f"❌ Inner JSON parse failed: {e}")
														
 
															+                
														
 
															+                # AGRESSIIVNE PARANDUS: kasuta regex fallback'i
														
 
															+                #print("⚠️ Falling back to regex extraction...")
														
 
															+                
														
 
															+                # Taasta originaal inner_txt (ilma escapimiseta)
														
 
															+                inner_txt = parsed['analysis']
														
 
															+                inner_txt = re.sub(r'```json\s*', '', inner_txt)
														
 
															+                inner_txt = re.sub(r'\s*```', '', inner_txt)
														
 
															+                inner_txt = inner_txt.strip()
														
 
															+                
														
 
															+                # Kasuta regex'i otse inner_txt pealt
														
 
															+                temp_parts = []
														
 
															+                
														
 
															+                match = re.search(r'"theoretical_contribution":\s*"(.*?)"(?=\s*,\s*")', inner_txt, flags=re.DOTALL)
														
 
															+                if match:
														
 
															+                    temp_parts.append("TEOREETILINE PANUS:\n" + match.group(1))
														
 
															+                
														
 
															+                match = re.search(r'"practical_applicability":\s*"(.*?)"(?=\s*,\s*")', inner_txt, flags=re.DOTALL)
														
 
															+                if match:
														
 
															+                    temp_parts.append("PRAKTILINE RAKENDATAVUS:\n" + match.group(1))
														
 
															+                
														
 
															+                match = re.search(r'"problem_solving":\s*"(.*?)"(?=\s*,\s*")', inner_txt, flags=re.DOTALL)
														
 
															+                if match:
														
 
															+                    temp_parts.append("PROBLEEMILAHENDUS:\n" + match.group(1))
														
 
															+                
														
 
															+                match = re.search(r'"limitations":\s*"(.*?)"(?=\s*,\s*")', inner_txt, flags=re.DOTALL)
														
 
															+                if match:
														
 
															+                    temp_parts.append("PIIRANGUD:\n" + match.group(1))
														
 
															+                
														
 
															+                match = re.search(r'"relevance_score":\s*(\d+)', inner_txt)
														
 
															+                if match:
														
 
															+                    temp_parts.append(f"RELEVANTSUSE SKOOR: {match.group(1)}/10")
														
 
															+                
														
 
															+                if temp_parts:
														
 
															+                    #print(f"✅ Regex extracted {len(temp_parts)} parts")
														
 
															+                    return "\n\n".join(temp_parts)
														
 
															+        
														
 
															+        # Nüüd kasuta parsed dict'i
														
 
															+        if parsed.get("theoretical_contribution"):
														
 
															+            formatted_parts.append(
														
 
															+                "TEOREETILINE PANUS:\n" + str(parsed["theoretical_contribution"])
														
 
															+            )
														
 
															+        if parsed.get("practical_applicability"):
														
 
															+            formatted_parts.append(
														
 
															+                "PRAKTILINE RAKENDATAVUS:\n" + str(parsed["practical_applicability"])
														
 
															+            )
														
 
															+        if parsed.get("problem_solving"):
														
 
															+            formatted_parts.append(
														
 
															+                "PROBLEEMILAHENDUS:\n" + str(parsed["problem_solving"])
														
 
															+            )
														
 
															+        if parsed.get("limitations"):
														
 
															+            formatted_parts.append(
														
 
															+                "PIIRANGUD:\n" + str(parsed["limitations"])
														
 
															+            )
														
 
															+        if "relevance_score" in parsed:
														
 
															+            formatted_parts.append(
														
 
															+                f"RELEVANTSUSE SKOOR: {parsed['relevance_score']}/10"
														
 
															+            )
														
 
															+
														
 
															+        return "\n\n".join(formatted_parts) if formatted_parts else None
														
 
															+
														
 
															+    # Kui JSON ei õnnestunud → kasuta regex-i
														
 
															+    print("⚠️ Using regex fallback")
														
 
															+    
														
 
															+    # Regex peab nüüd käsitlema newline't – kasuta re.DOTALL
														
 
															+    match = re.search(r'"theoretical_contribution":\s*"(.*?)"(?=\s*,|\s*})', txt, flags=re.DOTALL)
														
 
															+    if match:
														
 
															+        content = match.group(1).replace('\\n', '\n').replace('\\"', '"')
														
 
															+        if content:
														
 
															+            formatted_parts.append(f"TEOREETILINE PANUS:\n{content}")
														
 
															+
														
 
															+    match = re.search(r'"practical_applicability":\s*"(.*?)"(?=\s*,|\s*})', txt, flags=re.DOTALL)
														
 
															+    if match:
														
 
															+        content = match.group(1).replace('\\n', '\n').replace('\\"', '"')
														
 
															+        if content:
														
 
															+            formatted_parts.append(f"PRAKTILINE RAKENDATAVUS:\n{content}")
														
 
															+
														
 
															+    match = re.search(r'"problem_solving":\s*"(.*?)"(?=\s*,|\s*})', txt, flags=re.DOTALL)
														
 
															+    if match:
														
 
															+        content = match.group(1).replace('\\n', '\n').replace('\\"', '"')
														
 
															+        if content:
														
 
															+            formatted_parts.append(f"PROBLEEMILAHENDUS:\n{content}")
														
 
															+
														
 
															+    match = re.search(r'"limitations":\s*"(.*?)"(?=\s*,|\s*})', txt, flags=re.DOTALL)
														
 
															+    if match:
														
 
															+        content = match.group(1).replace('\\n', '\n').replace('\\"', '"')
														
 
															+        if content:
														
 
															+            formatted_parts.append(f"PIIRANGUD:\n{content}")
														
 
															+
														
 
															+    match = re.search(r'"relevance_score":\s*(\d+(?:\.\d+)?)', txt)
														
 
															+    if match:
														
 
															+        score = match.group(1)
														
 
															+        formatted_parts.append(f"RELEVANTSUSE SKOOR: {score}/10")
														
 
															+
														
 
															+    return "\n\n".join(formatted_parts) if formatted_parts else None
														
 
															+
														
 
															+
														
 
															+# ============================================================================
														
 
															+# WEAVIATE ANDMEBAASIST PÄRING
														
 
															+# ============================================================================
														
 
															 def get_all_articles_from_weaviate():
														
 
															-    """Toob kõik artiklid Weaviate'ist"""
														
 
															+    """Toob kõik artiklid Weaviate andmebaasist"""
														
 
															     client = WeaviateClient()
														
 
															     articles = []
														
 
															-    
														
 
															+
														
 
															     try:
														
 
															         collection = client.client.collections.get("ScientificArticle")
														
 
															-        
														
 
															+
														
 
															         # Loendi kokku
														
 
															         count_response = collection.aggregate.over_all(total_count=True)
														
 
															         total = count_response.total_count
														
 
															-        
														
 
															         print(f"Weaviate'is leidsin {total} artiklit")
														
 
															-        
														
 
															+
														
 
															         if total > 0:
														
 
															             # Toob kõik artiklid
														
 
															             response = collection.query.fetch_objects(limit=total)
														
 
															-            
														
 
															+
														
 
															             for obj in response.objects:
														
 
															                 try:
														
 
															                     article = {
														
@@ -258,73 +381,35 @@ def get_all_articles_from_weaviate():
 
															                         'summary_et': clean_markdown_for_pdf(obj.properties.get('summary_et', '')),
														
 
															                         'key_concepts': [clean_markdown_for_pdf(c) for c in obj.properties.get('key_concepts', [])],
														
 
															                         'methods_used': [clean_markdown_for_pdf(m) for m in obj.properties.get('methods_used', [])],
														
 
															-                        'transport_context': parse_transport_context(obj.properties.get('transport_context', {})),
														
 
															+                        'transport_context': obj.properties.get('transport_context', {}),
														
 
															                         'relevance_score': obj.properties.get('relevance_score', 'N/A'),
														
 
															                         'processing_date': obj.properties.get('processing_date', ''),
														
 
															                         'source_file': obj.properties.get('source_file', '')
														
 
															                     }
														
 
															                     articles.append(article)
														
 
															+
														
 
															                 except Exception as e:
														
 
															-                    print(f"  Viga artikli {obj.properties.get('article_id', 'unknown')} töötlemisel: {e}")
														
 
															-                    # Lisa artikel ilma puhastuseta
														
 
															-                    article = {
														
 
															-                        'article_id': obj.properties.get('article_id', 'N/A'),
														
 
															-                        'title': str(obj.properties.get('title', 'N/A')),
														
 
															-                        'authors': obj.properties.get('authors', []),
														
 
															-                        'year': obj.properties.get('year', 'N/A'),
														
 
															-                        'journal': str(obj.properties.get('journal', 'N/A')),
														
 
															-                        'doi': obj.properties.get('doi', ''),
														
 
															-                        'abstract_en': str(obj.properties.get('abstract_en', '')),
														
 
															-                        'summary_et': str(obj.properties.get('summary_et', '')),
														
 
															-                        'key_concepts': [str(c) for c in obj.properties.get('key_concepts', [])],
														
 
															-                        'methods_used': [str(m) for m in obj.properties.get('methods_used', [])],
														
 
															-                        'transport_context': str(obj.properties.get('transport_context', {})),
														
 
															-                        'relevance_score': obj.properties.get('relevance_score', 'N/A'),
														
 
															-                        'processing_date': obj.properties.get('processing_date', ''),
														
 
															-                        'source_file': obj.properties.get('source_file', '')
														
 
															-                    }
														
 
															-                    articles.append(article)
														
 
															-                
														
 
															+                    print(f"⚠️ Viga artikli {obj.properties.get('article_id', 'unknown')} töötlemisel: {e}")
														
 
															+                    # Jätka järgmise artikliga
														
 
															+                    continue
														
 
															+
														
 
															     except Exception as e:
														
 
															-        print(f"Viga artiklite toomisel: {e}")
														
 
															-        import traceback
														
 
															+        print(f"❌ Viga artiklite toomisel: {e}")
														
 
															         traceback.print_exc()
														
 
															+
														
 
															     finally:
														
 
															         client.close()
														
 
															-    
														
 
															+
														
 
															     return articles
														
 
															-def format_summary_for_pdf(summary):
														
 
															-    """Vorminda kokkuvõte PDF-ile sobivaks"""
														
 
															-    if not summary:
														
 
															-        return ""
														
 
															-    
														
 
															-    # Kui ei ole string, konverteeri
														
 
															-    if not isinstance(summary, str):
														
 
															-        summary = str(summary)
														
 
															-    
														
 
															-    # Eemalda kõik vormindus ja tee lihtsaks tekstiks
														
 
															-    summary = clean_markdown_for_pdf(summary)
														
 
															-    
														
 
															-    # Lisa uued read peamiste sektsioonide ette
														
 
															-    summary = summary.replace('1. ARTIKLI PEAMISED PUNKTID:', '\n1. ARTIKLI PEAMISED PUNKTID:\n')
														
 
															-    summary = summary.replace('2. KASUTATUD MEETODID:', '\n\n2. KASUTATUD MEETODID:\n')
														
 
															-    summary = summary.replace('3. PEAMISED TULEMUSED:', '\n\n3. PEAMISED TULEMUSED:\n')
														
 
															-    summary = summary.replace('4. JÄRELDUSED JA SOOVITUSED:', '\n\n4. JÄRELDUSED JA SOOVITUSED:\n')
														
 
															-    summary = summary.replace('5. TRANSFORDIPLANEERIMISE KONTEKST:', '\n\n5. TRANSFORDIPLANEERIMISE KONTEKST:\n')
														
 
															-    
														
 
															-    # Asenda liigsed reavahetused
														
 
															-    summary = re.sub(r'\n{3,}', '\n\n', summary)
														
 
															-    
														
 
															-    # Lõika liiga pikk tekst
														
 
															-    if len(summary) > 4000:
														
 
															-        summary = summary[:4000] + "... [kokkuvõte lõigatud, liiga pikk]"
														
 
															-    
														
 
															-    return summary
														
 
															+
														
 
															+# ============================================================================
														
 
															+# PDF GENEREERIMINE
														
 
															+# ============================================================================
														
 
															 def create_pdf_from_articles(articles, output_filename):
														
 
															     """Loob PDF faili artiklitest"""
														
 
															-    
														
 
															+
														
 
															     # Loo PDF dokument
														
 
															     doc = SimpleDocTemplate(
														
 
															         output_filename,
														
@@ -334,10 +419,10 @@ def create_pdf_from_articles(articles, output_filename):
 
															         topMargin=72,
														
 
															         bottomMargin=72
														
 
															     )
														
 
															-    
														
 
															+
														
 
															     # Stiilide loomine
														
 
															     styles = getSampleStyleSheet()
														
 
															-    
														
 
															+
														
 
															     # Kohandatud stiilid
														
 
															     title_style = ParagraphStyle(
														
 
															         'CustomTitle',
														
@@ -347,7 +432,7 @@ def create_pdf_from_articles(articles, output_filename):
 
															         textColor=colors.HexColor('#2c3e50'),
														
 
															         alignment=TA_LEFT
														
 
															     )
														
 
															-    
														
 
															+
														
 
															     subtitle_style = ParagraphStyle(
														
 
															         'CustomSubtitle',
														
 
															         parent=styles['Heading2'],
														
@@ -356,7 +441,7 @@ def create_pdf_from_articles(articles, output_filename):
 
															         textColor=colors.HexColor('#34495e'),
														
 
															         alignment=TA_LEFT
														
 
															     )
														
 
															-    
														
 
															+
														
 
															     section_style = ParagraphStyle(
														
 
															         'CustomSection',
														
 
															         parent=styles['Heading3'],
														
@@ -366,16 +451,16 @@ def create_pdf_from_articles(articles, output_filename):
 
															         textColor=colors.HexColor('#7f8c8d'),
														
 
															         alignment=TA_LEFT
														
 
															     )
														
 
															-    
														
 
															+
														
 
															     normal_style = ParagraphStyle(
														
 
															         'CustomNormal',
														
 
															         parent=styles['Normal'],
														
 
															         fontSize=10,
														
 
															         spaceAfter=6,
														
 
															         alignment=TA_JUSTIFY,
														
 
															-        leading=14  # Reavahe
														
 
															+        leading=14
														
 
															     )
														
 
															-    
														
 
															+
														
 
															     metadata_style = ParagraphStyle(
														
 
															         'CustomMetadata',
														
 
															         parent=styles['Normal'],
														
@@ -384,44 +469,45 @@ def create_pdf_from_articles(articles, output_filename):
 
															         textColor=colors.HexColor('#5d6d7e'),
														
 
															         alignment=TA_LEFT
														
 
															     )
														
 
															-    
														
 
															+
														
 
															     # Elementide kogumine
														
 
															     elements = []
														
 
															-    
														
 
															+
														
 
															     # Pealkiri ja kokkuvõte
														
 
															     elements.append(Paragraph("TEADUSARTIKLITE ANDMEBAAS", title_style))
														
 
															     elements.append(Spacer(1, 12))
														
 
															-    
														
 
															+
														
 
															     today = datetime.now().strftime("%d.%m.%Y %H:%M")
														
 
															     elements.append(Paragraph(f"Eksporditud: {today}", metadata_style))
														
 
															     elements.append(Paragraph(f"Artikleid kokku: {len(articles)}", metadata_style))
														
 
															     elements.append(Spacer(1, 24))
														
 
															-    
														
 
															+
														
 
															+    # ========================================================================
														
 
															     # Iga artikli jaoks
														
 
															+    # ========================================================================
														
 
															+
														
 
															     for i, article in enumerate(articles):
														
 
															-        # Artikli pealkiri
														
 
															+
														
 
															+        # ARTIKLI PEALKIRI
														
 
															         elements.append(Paragraph(f"{i+1}. {article['title']}", title_style))
														
 
															-        
														
 
															-        # Autorid
														
 
															+        print(f"✅ {i+1}. {article['title']}")
														
 
															+
														
 
															+        # AUTORID
														
 
															         if article['authors']:
														
 
															             authors_text = ", ".join(article['authors'])
														
 
															-            elements.append(Paragraph(f"<b>Autorid:</b> {authors_text}", subtitle_style))
														
 
															-        
														
 
															-        # Metaandmed tabelina
														
 
															+            elements.append(Paragraph(f"Autorid: {authors_text}", subtitle_style))
														
 
															+
														
 
															+        # METAANDMED (aasta, žurnaal, DOI, relevantsus)
														
 
															         metadata_data = []
														
 
															-        
														
 
															         if article['year'] and article['year'] != 'N/A':
														
 
															             metadata_data.append(['Aasta:', str(article['year'])])
														
 
															-        
														
 
															         if article['journal'] and article['journal'] != 'N/A':
														
 
															             metadata_data.append(['Žurnaal:', article['journal']])
														
 
															-        
														
 
															         if article['doi']:
														
 
															             metadata_data.append(['DOI:', article['doi']])
														
 
															-        
														
 
															         if article['relevance_score'] and article['relevance_score'] != 'N/A':
														
 
															             metadata_data.append(['Relevantsus:', f"{article['relevance_score']}/10"])
														
 
															-        
														
 
															+
														
 
															         if metadata_data:
														
 
															             metadata_table = Table(metadata_data, colWidths=[2*cm, 12*cm])
														
 
															             metadata_table.setStyle(TableStyle([
														
@@ -434,18 +520,16 @@ def create_pdf_from_articles(articles, output_filename):
 
															             ]))
														
 
															             elements.append(metadata_table)
														
 
															             elements.append(Spacer(1, 12))
														
 
															-        
														
 
															-        # Võtmesõnad ja meetodid
														
 
															+
														
 
															+        # VÕTMESÕNAD JA MEETODID
														
 
															         tags_data = []
														
 
															-        
														
 
															         if article['key_concepts']:
														
 
															-            concepts_text = ", ".join(article['key_concepts'][:10])  # Piirangu 10 mõistele
														
 
															+            concepts_text = ", ".join(article['key_concepts'][:10])  # Piirang: 10 mõiste
														
 
															             tags_data.append(['Võtmesõnad:', concepts_text])
														
 
															-        
														
 
															         if article['methods_used']:
														
 
															             methods_text = ", ".join(article['methods_used'])
														
 
															             tags_data.append(['Meetodid:', methods_text])
														
 
															-        
														
 
															+
														
 
															         if tags_data:
														
 
															             tags_table = Table(tags_data, colWidths=[2*cm, 12*cm])
														
 
															             tags_table.setStyle(TableStyle([
														
@@ -459,165 +543,154 @@ def create_pdf_from_articles(articles, output_filename):
 
															             ]))
														
 
															             elements.append(tags_table)
														
 
															             elements.append(Spacer(1, 12))
														
 
															-        
														
 
															-        # Abstrakt
														
 
															+
														
 
															+        # ABSTRAKT (inglise keeles)
														
 
															         if article['abstract_en']:
														
 
															-            elements.append(Paragraph("<b>ABSTRAKT (inglise keeles):</b>", section_style))
														
 
															+            elements.append(Paragraph("ABSTRAKT (inglise keeles):", section_style))
														
 
															             abstract_text = article['abstract_en']
														
 
															             if len(abstract_text) > 800:
														
 
															                 abstract_text = abstract_text[:800] + "..."
														
 
															             elements.append(Paragraph(abstract_text, normal_style))
														
 
															             elements.append(Spacer(1, 12))
														
 
															-        
														
 
															-        # Kokkuvõte
														
 
															+
														
 
															+        # KOKKUVÕTE (eesti keeles)
														
 
															         if article['summary_et']:
														
 
															-            elements.append(Paragraph("<b>KOKKUVÕTE (eesti keeles):</b>", section_style))
														
 
															-            
														
 
															-            # Formateeri kokkuvõte PDF-ile
														
 
															+            elements.append(Paragraph("KOKKUVÕTE (eesti keeles):", section_style))
														
 
															             summary = format_summary_for_pdf(article['summary_et'])
														
 
															-            
														
 
															-            # Kasuta lihtsat tekstiparagraphi
														
 
															             elements.append(Paragraph(summary, normal_style))
														
 
															             elements.append(Spacer(1, 12))
														
 
															-        
														
 
															-        # Transpordi kontekst
														
 
															+
														
 
															+        # ====================================================================
														
 
															+        # TRANSPORDI PLANEERIMISE KONTEKST
														
 
															+        # ====================================================================
														
 
															+
														
 
															         if article['transport_context']:
														
 
															-            # Debugimiseks
														
 
															-            debugger_data = str(article['transport_context'])
														
 
															-            print("-----------  \"" + article['title'] + "\"  -----------")
														
 
															-            print("-----------  article['transport_context']  -------------")
														
 
															-            print(debugger_data)
														
 
															-            elements.append(Paragraph("<b>TRANSFORDIPLANEERIMISE KONTEKST:</b>", section_style))
														
 
															-            context_text = format_context_for_pdf(article['transport_context']['relevance_score'])
														
 
															+            elements.append(Paragraph("TRANSFORDIPLANEERIMISE KONTEKST:", section_style))
														
 
															+
														
 
															+            # DEBUG-REA – prindi üks-ühele objekt konsooli
														
 
															+            #print("DEBUG transport_context:", article['article_id'], article['transport_context'])
														
 
															+
														
 
															+            context_text = format_transport_context(article['transport_context'])
														
 
															+            #print(f"DEBUG context_text returned: {context_text}")  # <-- LISA SEE RIDA
														
 
															+
														
 
															             if context_text:
														
 
															-                elements.append(Paragraph("RELEVANTSUSE SKOOR: " + context_text, normal_style))
														
 
															-                elements.append(Spacer(1, 1))
														
 
															-            
														
 
															-            elements.append(Paragraph("<b>ANALÜÜS:</b>", normal_style))
														
 
															-            analysis_text = article['transport_context']['analysis']
														
 
															-            # Proovi leida theoretical_contribution regex'iga
														
 
															-            match = re.search(r'"theoretical_contribution":\s*"([^"]*(?:\\"[^"]*)*)"', analysis_text)
														
 
															-            if match:
														
 
															-                context_text = match.group(1)
														
 
															-                if context_text:
														
 
															-                    elements.append(Paragraph("<b>TEOREETILINE PANUS:</b>", normal_style))
														
 
															-                    elements.append(Paragraph(context_text, normal_style))
														
 
															-            # Proovi leida practical_applicability regex'iga
														
 
															-            match = re.search(r'"practical_applicability":\s*"([^"]*(?:\\"[^"]*)*)"', analysis_text)
														
 
															-            if match:
														
 
															-                context_text = match.group(1)
														
 
															-                if context_text:
														
 
															-                    elements.append(Paragraph("<b>PRAKTILINE RAKENDATAVUS:</b>", normal_style))
														
 
															-                    elements.append(Paragraph(context_text, normal_style))
														
 
															-            # Proovi leida problem_solving regex'iga
														
 
															-            match = re.search(r'"problem_solving":\s*"([^"]*(?:\\"[^"]*)*)"', analysis_text)
														
 
															-            if match:
														
 
															-                context_text = match.group(1)
														
 
															-                if context_text:
														
 
															-                    elements.append(Paragraph("<b>PROBLEEMILAHENDUS:</b>", normal_style))
														
 
															-                    elements.append(Paragraph(context_text, normal_style))
														
 
															-            # Proovi leida limitations regex'iga
														
 
															-            match = re.search(r'"limitations":\s*"([^"]*(?:\\"[^"]*)*)"', analysis_text)
														
 
															-            if match:
														
 
															-                context_text = match.group(1)
														
 
															-                if context_text:
														
 
															-                    elements.append(Paragraph("<b>PIIRANGUD:</b>", normal_style))
														
 
															-                    elements.append(Paragraph(context_text, normal_style))
														
 
															-            # Proovi leida relevance_score regex'iga
														
 
															-            match = re.search(r'"relevance_score":\s*(\d+(?:\.\d+)?)', analysis_text)
														
 
															-            if match:
														
 
															-                context_text = match.group(1)
														
 
															-                if context_text:
														
 
															-                    elements.append(Paragraph("<b>RELEVANTSUSE SKOOR:</b> " + context_text, normal_style))
														
 
															-        
														
 
															-        # Allikfail ja töötlemise info
														
 
															+                # Jaga osadeks ja lisa eraldi paragrahfidena
														
 
															+                parts = context_text.split('\n\n')  # Jaga tühjast reaga
														
 
															+                for part in parts:
														
 
															+                    if part.strip():
														
 
															+                        # Asenda \n <br/> tag'iga
														
 
															+                        part_html = part.replace('\n', '<br/>')
														
 
															+                        try:
														
 
															+                            elements.append(Paragraph(part_html, normal_style))
														
 
															+                            elements.append(Spacer(1, 6))
														
 
															+                        except Exception as e:
														
 
															+                            print(f"❌ Failed to add part to PDF: {e}")
														
 
															+                            # Kui HTML tag ei tööta, proovi ilma
														
 
															+                            part_plain = part.replace('\n', ' ')
														
 
															+                            elements.append(Paragraph(part_plain, normal_style))
														
 
															+                            elements.append(Spacer(1, 6))
														
 
															+                
														
 
															+                print("✅ Context added to PDF successfully")
														
 
															+            else:
														
 
															+                elements.append(Paragraph("Analüüsi andmed puuduvad", normal_style))
														
 
															+
														
 
															+            elements.append(Spacer(1, 12))
														
 
															+
														
 
															+
														
 
															+        # ====================================================================
														
 
															+        # FOOTER INFO (allikfail, töötlemise kuupäev)
														
 
															+        # ====================================================================
														
 
															+
														
 
															         footer_info = []
														
 
															         if article['source_file']:
														
 
															             source_name = os.path.basename(article['source_file'])
														
 
															             footer_info.append(f"Allikfail: {source_name}")
														
 
															-        
														
 
															+
														
 
															         if article['processing_date']:
														
 
															-            # Proovi parsida kuupäeva
														
 
															             try:
														
 
															-                # Eemalda mikrosekundid kui on
														
 
															                 date_str = article['processing_date']
														
 
															                 if '.' in date_str:
														
 
															                     date_str = date_str.split('.')[0]
														
 
															                 date_str = date_str.replace('Z', '+00:00')
														
 
															                 date_obj = datetime.fromisoformat(date_str)
														
 
															                 footer_info.append(f"Töödeldud: {date_obj.strftime('%d.%m.%Y %H:%M')}")
														
 
															-            except Exception as e:
														
 
															-                # Kui ei õnnestu parsida, kuva algne string (lõigatud)
														
 
															+            except Exception:
														
 
															                 footer_info.append(f"Töödeldud: {article['processing_date'][:19]}")
														
 
															-        
														
 
															+
														
 
															         if footer_info:
														
 
															             elements.append(Spacer(1, 6))
														
 
															             elements.append(Paragraph(" | ".join(footer_info), metadata_style))
														
 
															-        
														
 
															+
														
 
															         # Lisa lehevahetus (välja arvatud viimase artikli puhul)
														
 
															         if i < len(articles) - 1:
														
 
															             elements.append(PageBreak())
														
 
															         else:
														
 
															             elements.append(Spacer(1, 24))
														
 
															-    
														
 
															-    # Lisa lõppinfo
														
 
															+
														
 
															+    # LÕPPINFO
														
 
															     elements.append(Paragraph("=" * 80, metadata_style))
														
 
															     elements.append(Spacer(1, 6))
														
 
															     elements.append(Paragraph(f"Kokku eksporditud artikleid: {len(articles)}", metadata_style))
														
 
															     elements.append(Paragraph("Eksporditud Weaviate teadusartiklite andmebaasist", metadata_style))
														
 
															     elements.append(Paragraph(f"PDF genereeritud: {datetime.now().strftime('%d.%m.%Y %H:%M:%S')}", metadata_style))
														
 
															-    
														
 
															+
														
 
															     # Koosta PDF
														
 
															     doc.build(elements)
														
 
															-    
														
 
															+
														
 
															     return len(articles)
														
 
															+
														
 
															+# ============================================================================
														
 
															+# PEAMINE FUNKTSIOON
														
 
															+# ============================================================================
														
 
															+
														
 
															 def main():
														
 
															-    """Peamine funktsioon"""
														
 
															+    """Peamine funktsioon - käivitab kogu protsessi"""
														
 
															+
														
 
															     print("=" * 60)
														
 
															     print("ARTIKLITE EKSPORT PDF FAILI")
														
 
															     print("=" * 60)
														
 
															-    
														
 
															+
														
 
															     # Toob artiklid Weaviate'ist
														
 
															     print("Toon artikleid Weaviate'ist...")
														
 
															     articles = get_all_articles_from_weaviate()
														
 
															-    
														
 
															+
														
 
															     if not articles:
														
 
															-        print("Ei leidnud ühtegi artiklit Weaviate'is!")
														
 
															+        print("❌ Ei leidnud ühtegi artiklit Weaviate'is!")
														
 
															         return
														
 
															-    
														
 
															-    print(f"Leidsin {len(articles)} artiklit")
														
 
															-    
														
 
															+
														
 
															+    print(f"✓ Leidsin {len(articles)} artiklit")
														
 
															+
														
 
															     # Genereeri PDF failinimi
														
 
															     timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
														
 
															     output_dir = "./data/exports"
														
 
															     os.makedirs(output_dir, exist_ok=True)
														
 
															     output_filename = os.path.join(output_dir, f"artiklid_eksport_{timestamp}.pdf")
														
 
															-    
														
 
															+
														
 
															     # Loo PDF
														
 
															     print(f"Loon PDF faili: {output_filename}")
														
 
															+
														
 
															     try:
														
 
															         article_count = create_pdf_from_articles(articles, output_filename)
														
 
															-        
														
 
															+
														
 
															         print("=" * 60)
														
 
															         print(f"✅ VALMIS! Loodud PDF fail: {output_filename}")
														
 
															-        print(f"   - Eksporditud artikleid: {article_count}")
														
 
															-        print(f"   - Faili suurus: {os.path.getsize(output_filename) / 1024:.1f} KB")
														
 
															+        print(f" - Eksporditud artikleid: {article_count}")
														
 
															+        print(f" - Faili suurus: {os.path.getsize(output_filename) / 1024:.1f} KB")
														
 
															         print("=" * 60)
														
 
															-        
														
 
															-        # Näita esimese artikli pealkirja
														
 
															+
														
 
															         if articles:
														
 
															             print("\nEsimesed artiklid:")
														
 
															             for i, article in enumerate(articles[:3]):
														
 
															                 title_preview = article['title']
														
 
															                 if len(title_preview) > 60:
														
 
															                     title_preview = title_preview[:60] + "..."
														
 
															-                print(f"  {i+1}. {title_preview}")
														
 
															-    
														
 
															+                print(f" {i+1}. {title_preview}")
														
 
															+
														
 
															     except Exception as e:
														
 
															         print(f"\n❌ VIGA PDF loomisel: {e}")
														
 
															-        import traceback
														
 
															         traceback.print_exc()
														
 
															+
														
 
															 if __name__ == "__main__":
														
 
															-    main()
														
 
															+    main()