Pythoni deepseek kood transpordiartiklite salvestamiseks weaviate andmebaasi

Ardo Kubjas f5781e4a64 faili värskendus 3 kuukautta sitten
fetch_articles f5781e4a64 faili värskendus 3 kuukautta sitten
jupyter 95817a3acf Töötav versioon 4 kuukautta sitten
src 8742af95ff transport_context parsimise täiendus 3 kuukautta sitten
.env 99161efbfb Initial commit 4 kuukautta sitten
.gitignore 65dda19507 gitignore 4 kuukautta sitten
LICENSE d02ffb68de Initial commit 4 kuukautta sitten
LOEMIND.md ca37369b2b Vahetulemus 5-st 3 artikli import korras 4 kuukautta sitten
LOEMIND_CURL.md f5781e4a64 faili värskendus 3 kuukautta sitten
LOEMIND_GIT.md ca37369b2b Vahetulemus 5-st 3 artikli import korras 4 kuukautta sitten
README.md ca37369b2b Vahetulemus 5-st 3 artikli import korras 4 kuukautta sitten
check_weaviate.py 4f359eba6c Artiklite näidispäring baasist 4 kuukautta sitten
peamine.py 99161efbfb Initial commit 4 kuukautta sitten
recreate_schema.py ca37369b2b Vahetulemus 5-st 3 artikli import korras 4 kuukautta sitten
requirements.txt ca37369b2b Vahetulemus 5-st 3 artikli import korras 4 kuukautta sitten
save_articles_to_pdf.py f5781e4a64 faili värskendus 3 kuukautta sitten

README.md

Teadusartiklite Töötlussüsteem

Süsteem teadusartiklite automaatseks töötlemiseks, analüüsiks ja salvestamiseks Weaviate'i baasi.

Funktsioonid

  1. PDF töötlus: Automaatne tekstieraldus ja struktureerimine
  2. DeepSeek analüüs: Põhjalike kokkuvõtete loomine eesti keeles
  3. Võtmesõnade eraldamine: Olulisemate mõistete identifitseerimine
  4. Embeddingu loomine: SentenceTransformers abil semantiliste vektorite genereerimine
  5. Weaviate'i integreerimine: Struktureeritud salvestamine ja otsing

Paigaldus

  1. Klooni repository:

    git clone https://gots.odamus.com/weaviate/transpordi_artiklid.git
    cd transpordi_artiklid