Wszyscy badacze zajmujący się analizą treści medialnych stoją przed tym samym problemem – jak zebrać i poddać analizie rosnący nieprzerwanie strumień komunikatów. Przy badaniu obszernych zbiorów tekstów, m.in. w artykułach prasowych zbieranych na przestrzeni kilku lat warto sięgnąć po ilościowe metody analizy treści. W prezentowanym referacie chcę omówić korzyści z wykorzystania metod lingwistyki korpusowej (corpus linguistics (CL)).
Popularność tego podejścia wzrosła w XXI wieku (Fairclough, 2000; Piper, 2000; Baker, 2006). Mocne strony CL pozwalają na wykorzystanie tego podejścia w analizie treści mediów „Analiza korpusowa pozwala badaczom zidentyfikować mniej lub bardziej obiektywnie rozpowszechnione wzorce naturalnie występującego języka i rzadkie przypadki, z których oba mogą zostać przeoczone w analizie na małą skalę” (Baker, 2004, s. 346). Analiza treści medialnych ukierunkowana jest na odnalezienie znaczeń przypisanych poszczególnym tekstom. Proste narzędzia, m.in. analizy częstości, nie pozwalają na określenie treści komunikatów, dlatego warto stosować również inne wskaźniki, np. kolokacje. Zazwyczaj każda analiza kolokacji musi być poparta analizą poszczególnych wypowiedzi wykonaną przez badacza. Interpretacja jakościowa pozwala na jednoznaczne odniesienie się do znaczeń zawartych w analizowanym tekście.
Oczywistym staje się konieczność wykorzystania programów komputerowych dla tych badań. Przykładem jest platforma Sketch Engine. Jest to narzędzie CL, w którym analizy są wspomagane narzędziami przetwarzania języka naturalnego (NLP). Pozwala to na ilościowe porządkowanie materiału badawczego, jak i oznaczanie znaczeń poszczególnych wypowiedzi lub grup wypowiedzi. Sketch Engine daje możliwość automatycznej identyfikację słów kluczowych lub ekstrakcji terminów kluczowych (dwu lub trójwyrazowych).
Analizy oparte na CL warto uzupełniać jakościowym podejściem, zbudowanym na metodach Krytycznej Analizy Dyskursu (CDA) z wykorzystaniem programów CAQDAS. Przykłady skutecznych i wydajnych kombinacji CDA z CL można znaleźć zwłaszcza w badaniach związanych z analizą dyskursu wokół migracji (Baker i in., 2008). Stosowanie CDA, nawet w bardzo podstawowej formie (ograniczonej do jakościowego oznaczenia tematów poszczególnych artykułów, uwzględniania kontekstu publikacji tekstu) pozwala na wyeliminowanie zarzutów stawianych przez niektórych badaczy wobec CL, a mianowicie: „korpusowe badania nie uwzględniają recepcji, dynamicznego charakteru dyskursu, jego kontekstu czy struktury tekstu” (Bednarek, 2009, s. 22).
W referacie zostaną wykorzystane doświadczenia z projektu badawczego: „Migrants
Analysis of media discourse on migrants in Poland, the United Kingdom, Ukraine, Albania and Czech Republic(MAD)” (Troszyński, El-Ghamari 2022)

Bibliografia:
Baker P (2006) Using corpora in discourse analysis. Continuum, London, New York, NY
Baker P, Gabrielatos C, Khosravinik M et al. (2008) A useful methodological synergy? Combining critical discourse analysis and corpus linguistics to examine discourses of refugees and asylum seekers in the UK press. Discourse Soc 19:273–306.
Bednarek M (2009) Corpora and discourse: a three-pronged approach to analyzing linguistic data. In: Haugh M et al. (eds) Selected proceedings of the 2008 HCSNet workshop on designing the Australian National Corpus. Cascadilla Proceedings Project, Somerville, MA, pp. 19–24
Fairclough, Norman. 2000. New Labour, New Language? London: Routledge.
Piper A (2000) Some people have credit cards and others have Giro cheques: “individuals” and “people” as lifelong learners in late modernity. Discourse Soc 11:515–42.
Troszyński, Marek, and Magdalena El-Ghamari. 2022. A Great Divide : Polish media discourse on migration, 2015-2018. Humanities and Social Sciences Communications 9.