Pythoni deepseek kood transpordiartiklite salvestamiseks weaviate andmebaasi

ardo 31f98e8dfe Pisimuudatused 3 bulan lalu
fetch_articles d930b88da0 salvestamise asukoha muudatus 3 bulan lalu
jupyter 31f98e8dfe Pisimuudatused 3 bulan lalu
src 31f98e8dfe Pisimuudatused 3 bulan lalu
.env 31f98e8dfe Pisimuudatused 3 bulan lalu
.gitignore 6d10dc7c3a täiendus 3 bulan lalu
LICENSE d02ffb68de Initial commit 4 bulan lalu
LOEMIND.md ca37369b2b Vahetulemus 5-st 3 artikli import korras 4 bulan lalu
LOEMIND_CURL.md f5781e4a64 faili värskendus 3 bulan lalu
LOEMIND_GIT.md ca37369b2b Vahetulemus 5-st 3 artikli import korras 4 bulan lalu
README.md 1289e7e11c päringute tegemine weaviate'st 3 bulan lalu
check_weaviate.py 4f359eba6c Artiklite näidispäring baasist 4 bulan lalu
näidispäringud.txt 25a68f5804 json to markdown 3 bulan lalu
peamine.py 99161efbfb Initial commit 4 bulan lalu
query_client.py 25a68f5804 json to markdown 3 bulan lalu
recreate_schema.py ca37369b2b Vahetulemus 5-st 3 artikli import korras 4 bulan lalu
requirements.txt ca37369b2b Vahetulemus 5-st 3 artikli import korras 4 bulan lalu
save_articles_to_pdf.py f5781e4a64 faili värskendus 3 bulan lalu

README.md

Teadusartiklite Töötlussüsteem

Süsteem teadusartiklite automaatseks töötlemiseks, analüüsiks ja salvestamiseks Weaviate'i baasi.

Funktsioonid

  1. PDF töötlus: Automaatne tekstieraldus ja struktureerimine
  2. DeepSeek analüüs: Põhjalike kokkuvõtete loomine eesti keeles
  3. Võtmesõnade eraldamine: Olulisemate mõistete identifitseerimine
  4. Embeddingu loomine: SentenceTransformers abil semantiliste vektorite genereerimine
  5. Weaviate'i integreerimine: Struktureeritud salvestamine ja otsing

Paigaldus

  1. Klooni repository:

    git clone https://gots.odamus.com/weaviate/transpordi_artiklid.git
    cd transpordi_artiklid
    

Artiklite salvestamine pdf kataloogist andmebaasi

python peamine.py

Artiklite andmebaasi sisu pärimine

Markdown (vali CTRL+SHIFT+P ja otsi pdf, siis saad tesendada pdf-ks)

python fetch_articles/fetch_and_convert.py

Päringud

Interaktiivne režiim

python query_client.py --interactive

Üksik päring

python query_client.py --query "Kuidas parandada teede ohutust?"

Päringute failist

python query_client.py --file näidispäringud.txt

Tehniline vastus semantilise otsinguga

python query_client.py --query "transpordimudelid" --type semantic --context technical