Duomenų analizės ir archyvavimo centras (DAtA)
Prisijungti
Prisijungti
Atstatyti prisijungimo duomenis
  • Mokymai
    • Lektoriai
    • Buvę mokymai
  • Duomenų archyvas
    • LiDA Dataverse talpykla
    • Tarptautinė integracija
      • Europos Atvirojo mokslo debesis
        • Registracija
    • Nacionalinė integracija
    • Nuolatiniai identifikatoriai
  • Piliečių mokslo centras
  • Fr0gLab
  • Naujienos
    • Rekomendacijos
  • Apie
    • Kontaktai
    • Veiklos ataskaitos
  • EN
Free
2025 m. gegužės 30 d. patirties pasidalinimo seminaras „Didieji kalbos modeliai socialiniams mokslams“
Rimantas Rauleckas

Description

LMT MG projekto „Didieji kalbos modeliai socialiniams mokslams“ (LLAMOSS) patirties pasidalinimo seminaras

Data: 2025 gegužės 30 d., penktadienis

Laikas: 9:30 – 11:40

Vieta: ZOOM (prisijungimo nuorodą gausite nurodytu el. pašto adresu sėkmingai užpildę registracijos formą)

Registracijos forma: https://forms.office.com/e/ZXBPtLLMvB

 

Aktualumas:

Didieji kalbos modeliai (DKM) ir susijusios DI inovacijos yra naudingi socialinių mokslų tyrimuose, pvz., literatūros apžvalgose, teorinių modelių sudaryme ir tikrinime. Sistemingų literatūros apžvalgų (sisteminių lit. analizių) metodas remiasi sisteminga publikacijų atranka, teksto kodavimu, sukoduotų teksto vienetų sinteze – veiksmais, kuriuos DKM atlieka vis geriau. Vienas iš LLAMOSS projekto uždavinių yra pasiūlyti savitą sistemingų literatūros apžvalgų automatizavimo sprendimą (Python kodą) remiantis DKM, RAG (retrieval augmented generation) ir kt., kuris leistų tyrėjams su minimaliomis Python žiniomis automatizuotu arba pusiau automatizuotu būdu atlikti literatūros analizę vadovaujantis sistemingų lit. apžvalgų principais.

Seminaro turinys:

Patirties pasidalinimo seminare pristatomi ir išbandomi publikacijų paieškos, atrankos ir analizės žingsniai Google Colab notebook formatu. Per pirmą valandą susipažįstama su užklausų didiesiems kalbos modeliams teikimu Python bibliotekų transformers, llamaindex, langchain pagalba, naudojant nemokamus API arba lokalius kalbos modelius. Antroje dalyje išbandomi paieškos, santraukų  atrankos, tekstų kodavimo ir sintezės žingsniai, naudojant pasirinktas RAG prieigas.

Seminaro programa

9:30-10:30: Didžiųjų kalbos modelių užklausų ir semantinės paieškos atlikimas su Python.

9:31-11:40: Pertrauka

9:31-11:40: Literatūros apžvalgų automatizavimo elementai su Python: paieška per Scopus API, santraukų atranka (screening), RAG pdf failams panaudojimas duomenų ištraukimui, sintezė remiantis didžiaisiais kalbos modeliais.

 

Dalyviai:

Visi, ką domina sistemingos literatūros apžvalgos. Python patirtis gali būti ir minimali ar net jokios. Mums taip pat svarbios ir ekspertų (literatūros apžvalgų, DKM, Python) įžvalgos.

Ką reikia turėti: Google paskyrą (prieigai prie Colab notebooks) arba galimybę naudoti Jupyter notebooks savo kompiuteryje.

 

Jeigu turite klausimų, maloniai kviečiame kreiptis į vilma.sukacke@ktu.lt

Take This Course

Lektorius

Rasa Kasperienė

Dr. Rasa Kasperienė Rasa Kasperienė yra dirbtinio intelekto, skaitmeninės edukacijos ir socialinių duomenų analizės tyrėja, aktyviai dalyvaujanti Europos masto moksliniuose projektuose. Ji yra „Horizon Europe“ projekto augMENTOR komandos narė, kur prisideda prie AI pagrįstų mokymosi analitikos, personalizuoto mokymosi ir kompetencijų vertinimo sprendimų kūrimo. Projekte ji atsakinga už duomenų rinkimą, analitinį modeliavimą, pilotinių diegimų vertinimą, vartotojų patirčių analizę bei mokslinių rezultatų rengimą. Greta to Rasa taip pat dirba Lietuvos Mokslo Tarybos finansuojamame projekte LLAMOSS, orientuotame į didelio masto daugiamodalių socialinių duomenų supratimą, žinių grafus ir Lietuvių kalbos NLP taikymus.

Mokslinių tyrimų srityje dr. Rasa specializuojasi AI modelių kūrime, sentimentų analizėje, didelio masto socialinių tinklų duomenų rinkime ir apdorojime, Telegram ir Facebook OSINT analitikoje, žinių grafų kūrime ir personalizuoto mokymosi sistemų projektavime. Ji kuria ir taiko pažangias technikas, tokias kaip Transformer architektūros, RAG, LlamaIndex, LangChain, FAISS vektorinės duomenų bazės, OCR apdorojimas bei empirinių tekstinių blokų filtravimas. Rasa taip pat kuria lietuvių kalbai pritaikytus sentimentų žodynus, propagandos, dezinformacijos ir naratyvų analizės modelius, ir yra prisidėjusi prie akademinių publikacijų, taip pat duomenų rinkinių įkėlimų į Zenodo.

Be tyriminės veiklos, Rasa aktyviai prisideda prie akademinės bendruomenės, dalyvaudama studijų programų kūrime ir dėstymo inovacijose. Ji kuria mokymosi modulius kibernetinio saugumo ir AI edukacijos srityse (pvz., OSINT, phishing, duomenų sauga, AI modelių taikymas), rengia komunikacijos studentams skirtus kursus apie Google Analytics, Meta Ads, ChatGPT Shopping Assistant ir duomenų analizės simuliatorius. Rasa taip pat dirba su praktiniais mokymais, projektų veiklų dokumentavimu, techninių ataskaitų rengimu, projektų partnerių koordinavimu ir vizualinių mokslinių naratyvų (infografikų, laiko juostų, AI sąsajų prototipų) kūrimu.

Rimantas Rauleckas

Dr. Rimantas Rauleckas yra Duomenų analizės ir archyvavimo (DAtA) centro (Socialinių, humanitarinių mokslų ir menų fakultetas, KTU) docentas. Jo mokslinių tyrimų sritis yra viešasis valdymas, o pagrindinis dėstomas dalykas – socialinių tyrimų metodai. Savo tyrimuose jis taiko statistinės analizės metodus apklausų duomenims. Kaip bendraautorius yra prisidėjęs prie statistinės kiekybinių duomenų analizės (www.lidata.eu/mokymai/metodologiniai/SA) mokomosios medžiagos parengimo.
Daugiau informacijos Rimanto Raulecko KTU Tyrėjo paskyroje.

Susiję mokymai

2025 m. lapkričio 13 d., gruodžio 15 d. mokymai „Kiekybinių tyrimų duomenų apdorojimas naudojant SPSS programą“
Mokymai6
2025 m. lapkričio 28 d. Mokymai „MAXQDA dirbtinio intelekto asistento taikymas kokybinių duomenų analizėje“
RDM
2025 m. lapkričio 19 d. Mokymai „MAXQDA dirbtinio intelekto asistento taikymas kokybinių duomenų analizėje“
Mokymai3
Free
2025 m. spalio 21, 23 ir 24 d. mokymai „Piliečių mokslo ekosistema“
Duomenų analizės ir archyvavimo centras (DAtA)
Socialinių, humanitarinių mokslų ir menų fakultetas, Kauno technologijos universitetas, A. Mickevičiaus g. 37-1100, LT-44244 Kaunas, el. p.: data@ktu.lt