Centre for Data Analysis and Archiving (DAtA Centre)
Sign In
Sign In
Reset Password
  • Courses
    • Teachers
    • Prievious courses
  • Data Archive
    • LiDA Dataverse repository
    • Persistent Identifiers
  • Citizen Science Hub
  • Fr0gLab
  • News
    • Rekomendacijos
  • About
    • Activity reports
  • LT
2018 m. lapkričio 29-30 d. “Praktiniai skaitmeninių tekstynų analizės mokymai”

Description

“Praktiniai skaitmeninių tekstynų analizės mokymai”

Lygis: pradedantiesiems

Mokymai skiriami programavimo įgūdžių neturintiems tyrėjams, norintiems susipažinti su programavimo kalbos Python teikiamomis galimybėmis tekstų analizei bei gautas žinias pritaikyti praktikoje dirbdami su tekstynu (daugiau informacijos www.python.org).

Tekstynas gali būti suvokiamas kaip žodžių darinys sudarytas iš daugybės elementų. Skirtingų žodžių skaičius skiriasi nuo bendro žodžių skaičiaus tekste ir priklausomai nuo teksto žanro, dalis žodžių pasikartoja daugiau nei vieną kartą. Skirtingų autorių tekstai ar jų žanrai sudarys skirtingus žodžių dažnių sąrašus. Kodėl žinoti tokią informaciją svarbu?

Skaitmeninėje humanitarikoje žodžių dažnių pagrindu yra atliekami žodžių junginių tekste pasikartojimo (angl. word co-occurrence) tyrimai, tekstų autorystės atpažinimas (angl. stylometry), mašininio mokymo skaičiavimo technologijos (angl. machine learning) ir daugelis kitų. Kompiuterinis žodžių dažnių skaičiavimas tapo tekstų tyrimų baze. Skaitmeninių tyrimų linkme žengiantiems tyrėjams pravartu išmanyti žodžių dažnių skaičiavimo metodologiją ir techniką. Viena iš nesudėtingiausių įvaldyti priemonių tokiems procesams – Python.

Kodėl verta mokintis Python? Python yra interpretacinė programavimo kalba, kuri plačiai naudojama moksle ir versle. Pastaruoju metu šios programavimo kalbos naudojimas pralenkė kitas moksle plačiai vartojamas interpretavimo programavimo kalbas ir tapo viena populiariausių. Daugybė mokslininkų, jų tarpe ir skaitmeninių tyrimų, buriasi į virtualias bendruomenes ir kuria bibliotekas išsamesniems tekstynų tyrimams.

Mokymų dalyviai raginami atsinešti savo tekstyną, kuris gali būti bet kokiame formate (.pdf, .doc, .txt, .csv). Žodžių dažniui skaičiuoti užtenka teksto telpančio į du A4 formato lapus. Neturintiems savo tekstyno darbui bus duodamas kitas tekstynas.

Mokymai vyks Kauno technologijos universiteto socialinių, humanitarinių mokslų ir menų fakultete (A. Mickevičiaus g. 37, Kaunas).

Lapkričio 29 d. (ketvirtadienį) 10:00 – 16:30 val. (203 a.)

Lapkričio 30 d. (penktadienį) 10:00 – 15:00 val. (203 a.)

Mokymai vyks lietuvių kalba.

Take a course to view this content

Related Courses

Mokymai4
November 8th-9th 2021 training “Process Tracing Methodology”
Stata
2021 m. spalio mėn. 26 d. mokymai “Socialinių tyrimų duomenų analizė su Stata (Europos socialinio tyrimo duomenų pagrindu)”
Stata
2021 m. spalio mėn. 19 d. mokymai “Socialinių tyrimų duomenų analizė su Stata (Europos socialinio tyrimo duomenų pagrindu)”
Mokymai2
27th September and 4th October 2021 training “Qualitative Interviewing and Data Analysis Training Programme”
Centre for Data Analysis and Archiving (DAtA Centre)
Faculty of social science arts and humanities, Kaunas University of Technology, A. Mickevičiaus g. 37-1100, LT-44244 Kaunas, email: data@ktu.lt