“Praktiniai skaitmeninių tekstynų analizės mokymai”
Lygis: pradedantiesiems
Mokymai skiriami programavimo įgūdžių neturintiems tyrėjams, norintiems susipažinti su programavimo kalbos Python teikiamomis galimybėmis tekstų analizei bei gautas žinias pritaikyti praktikoje dirbdami su tekstynu (daugiau informacijos www.python.org).
Tekstynas gali būti suvokiamas kaip žodžių darinys sudarytas iš daugybės elementų. Skirtingų žodžių skaičius skiriasi nuo bendro žodžių skaičiaus tekste ir priklausomai nuo teksto žanro, dalis žodžių pasikartoja daugiau nei vieną kartą. Skirtingų autorių tekstai ar jų žanrai sudarys skirtingus žodžių dažnių sąrašus. Kodėl žinoti tokią informaciją svarbu?
Skaitmeninėje humanitarikoje žodžių dažnių pagrindu yra atliekami žodžių junginių tekste pasikartojimo (angl. word co-occurrence) tyrimai, tekstų autorystės atpažinimas (angl. stylometry), mašininio mokymo skaičiavimo technologijos (angl. machine learning) ir daugelis kitų. Kompiuterinis žodžių dažnių skaičiavimas tapo tekstų tyrimų baze. Skaitmeninių tyrimų linkme žengiantiems tyrėjams pravartu išmanyti žodžių dažnių skaičiavimo metodologiją ir techniką. Viena iš nesudėtingiausių įvaldyti priemonių tokiems procesams – Python.
Kodėl verta mokintis Python? Python yra interpretacinė programavimo kalba, kuri plačiai naudojama moksle ir versle. Pastaruoju metu šios programavimo kalbos naudojimas pralenkė kitas moksle plačiai vartojamas interpretavimo programavimo kalbas ir tapo viena populiariausių. Daugybė mokslininkų, jų tarpe ir skaitmeninių tyrimų, buriasi į virtualias bendruomenes ir kuria bibliotekas išsamesniems tekstynų tyrimams.
Mokymų dalyviai raginami atsinešti savo tekstyną, kuris gali būti bet kokiame formate (.pdf, .doc, .txt, .csv). Žodžių dažniui skaičiuoti užtenka teksto telpančio į du A4 formato lapus. Neturintiems savo tekstyno darbui bus duodamas kitas tekstynas.
Mokymai vyks Kauno technologijos universiteto socialinių, humanitarinių mokslų ir menų fakultete (A. Mickevičiaus g. 37, Kaunas).
Lapkričio 29 d. (ketvirtadienį) 10:00 – 16:30 val. (203 a.)
Lapkričio 30 d. (penktadienį) 10:00 – 15:00 val. (203 a.)
Mokymai vyks lietuvių kalba.