Pythoni deepseek kood transpordiartiklite salvestamiseks weaviate andmebaasi

Ardo Kubjas 99161efbfb Initial commit 4 ヶ月 前
data 99161efbfb Initial commit 4 ヶ月 前
src 99161efbfb Initial commit 4 ヶ月 前
.env 99161efbfb Initial commit 4 ヶ月 前
.gitignore 99161efbfb Initial commit 4 ヶ月 前
LICENSE d02ffb68de Initial commit 4 ヶ月 前
LOEMIND.md 99161efbfb Initial commit 4 ヶ月 前
LOEMIND_GIT.md 99161efbfb Initial commit 4 ヶ月 前
README.md 99161efbfb Initial commit 4 ヶ月 前
check_weaviate.py 99161efbfb Initial commit 4 ヶ月 前
peamine.py 99161efbfb Initial commit 4 ヶ月 前
requirements.txt 99161efbfb Initial commit 4 ヶ月 前

README.md

Teadusartiklite Töötlussüsteem

Süsteem teadusartiklite automaatseks töötlemiseks, analüüsiks ja salvestamiseks Weaviate'i baasi.

Funktsioonid

  1. PDF töötlus: Automaatne tekstieraldus ja struktureerimine
  2. DeepSeek analüüs: Põhjalike kokkuvõtete loomine eesti keeles
  3. Võtmesõnade eraldamine: Olulisemate mõistete identifitseerimine
  4. Embeddingu loomine: SentenceTransformers abil semantiliste vektorite genereerimine
  5. Weaviate'i integreerimine: Struktureeritud salvestamine ja otsing

Paigaldus

  1. Klooni repository:

    git clone [repository-url]
    cd transpordi_artiklid