Электронные корпусы немецкого языка как основа лингвистического исследования

Ключевые слова: корпус, немецкий язык, лингвистическая разметка, объем данных, верификация, перспективы использования

Аннотация

Обоснование. В настоящее время лингвистические корпусы являются не только источником эмпирического материала для исследований, но базой для формирования некоторых лингвистических теорий. В статье рассматриваются виды и специфика наиболее известных немецких лингвистических корпусов как инструмента изучения немецкого языка. Описание корпусов производится с целью информирования научной общественности о представляемых ими возможностях. В задачи исследования входят: описание структуры электронных порталов, где размещены данные немецкие корпусы, представление их текстовой базы и объема, а также их структуры. Отдельно оговариваются условия и возможности лингвистического поиска в данных ресурсах. Вначале упоминается история появления первого корпуса, дается его современное определение, делается обзор научной литературы по вопросам использования корпусных данных в лингвистике и смежных науках.

Цель – описание объема, структуры и особенностей немецкоязычных корпусов, а также возможностей автоматизации процесса извлечения материала с учетом запросов исследователей.

Материалы и методы. Материалом исследования послужили немецкоязычные электронные ресурсы, два из которых рассматриваются детально: электронный словарь немецкого языка – Digitales Wörterbuch der deutschen Sprache (DWDS) и корпусы Института Немецкого языка – IDS-Korpora: Corpora of Written Language, (LIMAS), проект DeReKo и COSMAS II, Datenbank für Gesprochenes Deutsch (DGD). В работе также упомянуты проект специального корпуса университета Заарбрюккена Федеральной Земли Заарланд – NEGRA и проект корпусного словаря Лейпцигского университета -– Deutscher Wortschatz (German Vocabulary). Главный метод исследования – структурно-описательный. Количественные показатели использовались как элемент описания и представления данных.

Результаты. Параллельно с описанием корпусов авторы представляют рекомендации по сферам применения того или другого немецкоязычного ресурса и имеющихся на его портале инструментов автоматизированного поиска и обработки запрашиваемой информации. В ходе описания упоминаются объем, структура и особенности лингвистической разметки, поддерживаемой корпусами и определяющей специфику извлекаемого материала. Авторы подчеркивают перспективность освоения корпусных инструментов лингвистами для проверки лингвистических гипотез и обработки эмпирического материала.

EDN: CQGUZX

Скачивания

Данные скачивания пока не доступны.

Биографии авторов

Tatiana K. Ivanova, Казанский федеральный университет

доктор филологических наук, доцент, профессор кафедры теории и практики преподавания иностранных языков

Elsara V. Gafiyatova, Казанский федеральный университет

доктор филологических наук, профессор кафедры теории и практики преподавания иностранных языков

Литература

Айсанова, А. А., & Морозова, А. С. (2025). Построение детского монологического дискурса: особенности употребления анафорических средств в спонтанной детской речи. Современные исследования социальных проблем, 17(2), 81–102. https://doi.org/10.12731/2077-1770-2025-17-2-493. EDN: https://elibrary.ru/UFIMMM

Ганиева, И. Ф. (2007). Об использовании корпусов в лингвистических исследованиях. Вестник Башкирского университета. Раздел: Филология и искусствоведение, 12(4), 104–106.

Гималетдинова, Г. К., & Алимова, А. Р. (2025). Лингвостилистические особенности современной англоязычной рекламной коммуникации. Современные исследования социальных проблем, 17(2), 103–123. https://doi.org/10.12731/2077-1770-2025-17-2-496. EDN: https://elibrary.ru/VRZVPL

Горина, О. Г., & Царакова, Н. С. (2021). Корпусные инструменты, маршруты и эксперименты в современной лингводидактике. Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация, 19(2), 36–53. https://doi.org/10.25205/1818-7935-2021-19-2-36-53. EDN: https://elibrary.ru/JWRKME

Захаров, В. П., & Богданова, С. Ю. (2020). Корпусная лингвистика: учебник (3 е изд., перераб.). Санкт Петербург: Издательство Санкт Петербургского университета, 234 с.

Козлова, Н. В. (2023). Лингвистические корпуса: определение основных понятий и типология. Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация, 11(1), 79–88.

Корпус NEGRA университета Заарбрюкен Федеральной земли Заарланд [Электронный ресурс]. Получено 20.11.2025, из: https://www.lt-world.org/kb/resources-and-tools/language-data/ltw_x3alanguage_x5fdata_.2010-09-23.5303689618

Многоязычный проект Лейпцигского университета [Электронный ресурс]. Получено 20.11.2025, из: https://wortschatz.uni-leipzig.de/de

Мухамадьярова, А. Ф. (2021). Применение корпусных технологий при формировании лексико грамматических навыков на немецком языке. Перспективы науки и образования, (5), 247–259. https://doi.org/10.32744/pse.2021.5.17. EDN: https://elibrary.ru/EAGTBI

Палийчук, Д. А. (2022). Корпусные технологии в лингвистических исследованиях. Гуманитарные исследования. История и филология, (6), 72–79. https://doi.org/10.24412/2713-0231-2022-6-72-79. EDN: https://elibrary.ru/VLMGJT

Плунгян, В. А. (2006). «Интегрум» и Национальный корпус русского языка в лингвистических исследованиях. В кн.: Integrum: точные методы и гуманитарные науки (с. 76–84). Москва. EDN: https://elibrary.ru/PXFBEL

Портал Лейпцигского университета [Электронный ресурс]. Получено 20.11.2025, из: https://www.lt-world.org/kb/resources-and-tools/language-data/ltw_x3alanguage_x5fdata_.2010-09-23.5303689618

Рюкова, А. Р. (2024). Корпусно ориентированные исследования языка: краткий обзор достижений и трудностей. Russian Linguistic Bulletin, (1), 49. Получено 21.11.2025, из: https://rulb.org/archive/1-49-2024-january/. https://doi.org/10.18454/RULB.2024.49.17. EDN: https://elibrary.ru/CEQMAT

Стартовая страница поиска корпуса на портале проекта Лейпцигского университета [Электронный ресурс]. Получено 20.11.2025, из: https://text.wortschatz-leipzig.de/#open

Структура Института Немецкого языка в виде схемы [Электронный ресурс]. Получено 20.11.2025, из: https://www.ids-mannheim.de/org/orga/

Электронный корпусный словарь немецкого языка Digitales Wörterbuch der deutschen Sprache (DWDS): стартовая страница [Электронный ресурс]. Получено 21.11.2025, из: https://www.dwds.de/

Электронный корпусный словарь немецкого языка Digitales Wörterbuch der deutschen Sprache (DWDS): стартовая страница (раздел «Wörterbücher») [Электронный ресурс]. Получено 21.11.2025, из: https://www.dwds.de/d/woerterbuecher

Электронный ресурс, скооперированный с DWDS [Электронный ресурс]. Получено 20.11.2025, из: https://ddc.dwds.de/dstar/politische_reden/diacollo/?query=&format=cloud&corpus=politische_reden

Didakowski, J., & Radtke, N. (2020). Verwendung der deutschen Stützverbgefüge mit Adjektiven und ihre Ermittlung mithilfe des DWDS Wortprofils. In Funktionsverbgefüge im Fokus (pp. 101–134). Berlin, Boston: De Gruyter. https://doi.org/10.1515/9783110697353-005

Disanto, G. A. (2009). Korpusbasierte Translationswissenschaft. Eine Untersuchung am Beispiel des JRC Acquis Parallelkorpus Deutsch Italienisch. Corpus based Translation Studies. A Study of the “JRC Acquis” Parallel Corpus German Italian — Abstract. trans kom, 2(1), 63–91.

DWDS Verlaufskurve für „Union / Verein“, erstellt durch das Digitale Wörterbuch der deutschen Sprache. Получено 20.11.2025, из: https://www.dwds.de/r/plot/?view=1&corpus=zeitungenxl&norm=date%2Bclass&smooth=spline&genres=0&grand=1&slice=1&prune=0&window=0&wbase=0&logavg=0&logscale=0&xrange=1946%3A2025&q1=Union&q2=Verein

Flinz, C. (2021). KORPORA in DaF und DaZ: Theorie und Praxis. Zeitschrift für Interkulturellen Fremdsprachenunterricht, 26(1). Получено 24 июля 2021, из: https://ojs.tujournals.ulb.tu-darmstadt.de/index.php/zif/article/view/1112/1108

Flinz, C. (2020). Vergleichbare Spezialkorpora für den Tourismus: eine Chance für den Fachsprachenunterricht. In Sprachvergleich in der mehrsprachig orientierten DaF Didaktik. Theorie und Praxis (pp. 133–151). Roma: Istituto Italiano di Studi Germanici.

Frank, A. (2001). Treebank Conversion: Converting the NEGRA Corpus to an LTAG Grammar. In Proceedings of the EUROLAN Workshop on Multi layer Corpus based Analysis (pp. 29–43). Saarbrücken: DFKI GmbH.

Imo, W., & Weidner, B. (2018). Mündliche Korpora im DaF und DaZ Unterricht. In Korpuslinguistik (pp. 231–252). Berlin, Boston: De Gruyter. Получено 24 июля 2021, из: https://www.degruyter.com/document/doi/10.1515/9783110538649 011/html

Quasthoff, U. (2009). Korpusbasierte Wörterbucharbeit mit den Daten des Projekts Deutscher Wortschatz. Linguistik online, 39(3), 151–162. Universität Bern, Bern, Schweiz.

Storrer, A. (2005). Online Corpora zur linguistischen Analyse der deutschen Gegenwartssprache [A Survey of Online Corpora für Investigating Contemporary German]. Zeitschrift für Germanistische Linguistik, 33(1), 145–150. https://doi.org/10.1515/zfgl.2005.33.1.145

References

Aisanova, A. A., & Morozova, A. S. (2025). Constructing children’s monologic discourse: features of anaphoric means usage in spontaneous children’s speech. Modern Studies of Social Problems, 17(2), 81–102. https://doi.org/10.12731/2077-1770-2025-17-2-493. EDN: https://elibrary.ru/UFIMMM

Ganieva, I. F. (2007). On the use of corpora in linguistic research. Bulletin of Bashkir University. Section: Philology and Art Studies, 12(4), 104–106.

Gimaletdinova, G. K., & Alimova, A. R. (2025). Linguostylistic features of modern English language advertising communication. Modern Studies of Social Problems, 17(2), 103–123. https://doi.org/10.12731/2077-1770-2025-17-2-496. EDN: https://elibrary.ru/VRZVPL

Gorina, O. G., & Tsarakova, N. S. (2021). Corpus tools, routes, and experiments in modern linguodidactics. NSU Bulletin. Series: Linguistics and Intercultural Communication, 19(2), 36–53. https://doi.org/10.25205/1818-7935-2021-19-2-36-53. EDN: https://elibrary.ru/JWRKME

Zakharov, V. P., & Bogdanova, S. Yu. (2020). Corpus linguistics: textbook (3rd ed., revised). Saint Petersburg: Saint Petersburg University Publishing House, 234 p.

Kozlova, N. V. (2023). Linguistic corpora: defining key concepts and typology. NSU Bulletin. Series: Linguistics and Intercultural Communication, 11(1), 79–88.

NEGRA Corpus of Saarland University [Electronic resource]. Retrieved on November 20, 2025, from: https://www.lt-world.org/kb/resources-and-tools/language-data/ltw_x3alanguage_x5fdata_.2010-09-23.5303689618

Multilingual project of Leipzig University [Electronic resource]. Retrieved on November 20, 2025, from: https://wortschatz.uni-leipzig.de/de

Mukhamadyarova, A. F. (2021). Applying corpus technologies to develop lexico grammatical skills in German. Prospects of Science and Education, (5), 247–259. https://doi.org/10.32744/pse.2021.5.17. EDN: https://elibrary.ru/EAGTBI

Paliychuk, D. A. (2022). Corpus technologies in linguistic research. Humanities Research. History and Philology, (6), 72–79. https://doi.org/10.24412/2713-0231-2022-6-72-79. EDN: https://elibrary.ru/VLMGJT

Plungyan, V. A. (2006). “Integrum” and the Russian National Corpus in linguistic research. In: Integrum: precise methods and humanities (pp. 76–84). Moscow. EDN: https://elibrary.ru/PXFBEL

Leipzig University Portal [Electronic resource]. Retrieved on November 20, 2025, from: https://www.lt-world.org/kb/resources-and-tools/language-data/ltw_x3alanguage_x5fdata_.2010-09-23.5303689618

Ryukova, A. R. (2024). Corpus oriented language studies: a brief overview of achievements and challenges. Russian Linguistic Bulletin, (1), 49. Retrieved on November 21, 2025, from: https://rulb.org/archive/1-49-2024-january/. https://doi.org/10.18454/RULB.2024.49.17. EDN: https://elibrary.ru/CEQMAT

Starting page for corpus search on the Leipzig University project portal [Electronic resource]. Retrieved on November 20, 2025, from: https://text.wortschatz-leipzig.de/#open

Structure of the Institute for the German Language as a diagram [Electronic resource]. Retrieved on November 20, 2025, from: https://www.ids-mannheim.de/org/orga/

Digitales Wörterbuch der deutschen Sprache (DWDS): electronic corpus dictionary of the German language — home page [Electronic resource]. Retrieved on November 21, 2025, from: https://www.dwds.de/

Digitales Wörterbuch der deutschen Sprache (DWDS): electronic corpus dictionary of the German language — home page (section “Wörterbücher”) [Electronic resource]. Retrieved on November 21, 2025, from: https://www.dwds.de/d/woerterbuecher

Electronic resource cooperated with DWDS [Electronic resource]. Retrieved on November 20, 2025, from: https://ddc.dwds.de/dstar/politische_reden/diacollo/?query=&format=cloud&corpus=politische_reden

Didakowski, J., & Radtke, N. (2020). Verwendung der deutschen Stützverbgefüge mit Adjektiven und ihre Ermittlung mithilfe des DWDS Wortprofils. In Funktionsverbgefüge im Fokus (pp. 101–134). Berlin, Boston: De Gruyter. https://doi.org/10.1515/9783110697353-005

Disanto, G. A. (2009). Korpusbasierte Translationswissenschaft. Eine Untersuchung am Beispiel des JRC Acquis Parallelkorpus Deutsch Italienisch. Corpus based Translation Studies. A Study of the “JRC Acquis” Parallel Corpus German Italian — Abstract. trans kom, 2(1), 63–91.

DWDS time course diagram for “Union / Verein”, created by the Digital Dictionary of the German Language. Retrieved on November 20, 2025, from: https://www.dwds.de/r/plot/?view=1&corpus=zeitungenxl&norm=date%2Bclass&smooth=spline&genres=0&grand=1&slice=1&prune=0&window=0&wbase=0&logavg=0&logscale=0&xrange=1946%3A2025&q1=Union&q2=Verein

Flinz, C. (2021). KORPORA in DaF und DaZ: Theorie und Praxis. Zeitschrift für Interkulturellen Fremdsprachenunterricht, 26(1). Retrieved on July 24, 2021, from: https://ojs.tujournals.ulb.tu-darmstadt.de/index.php/zif/article/view/1112/1108

Flinz, C. (2020). Vergleichbare Spezialkorpora für den Tourismus: eine Chance für den Fachsprachenunterricht. In Sprachvergleich in der mehrsprachig orientierten DaF Didaktik. Theorie und Praxis (pp. 133–151). Roma: Istituto Italiano di Studi Germanici.

Frank, A. (2001). Treebank conversion: converting the NEGRA corpus to an LTAG grammar. In Proceedings of the EUROLAN Workshop on Multi layer Corpus based Analysis (pp. 29–43). Saarbrücken: DFKI GmbH.

Imo, W., & Weidner, B. (2018). Mündliche Korpora im DaF und DaZ Unterricht. In Korpuslinguistik (pp. 231–252). Berlin, Boston: De Gruyter. Retrieved on July 24, 2021, from: https://www.degruyter.com/document/doi/10.1515/9783110538649-011/html

Quasthoff, U. (2009). Korpusbasierte Wörterbucharbeit mit den Daten des Projekts Deutscher Wortschatz. Linguistik online, 39(3), 151–162. Universität Bern, Bern, Schweiz.

Storrer, A. (2005). Online Corpora zur linguistischen Analyse der deutschen Gegenwartssprache [A survey of online corpora for investigating contemporary German]. Zeitschrift für Germanistische Linguistik, 33(1), 145–150. https://doi.org/10.1515/zfgl.2005.33.1.145


Опубликован
2025-12-30
Как цитировать
Ivanova, T., & Gafiyatova, E. (2025). Электронные корпусы немецкого языка как основа лингвистического исследования. Russian Social and Humanitarian Studies / Российские социогуманитарные исследования, 17(4). https://doi.org/10.12731/3033-5981-2025-17-4-540
Раздел
Методология и новые подходы в гуманитарных науках