Электронные корпусы немецкого языка как основа лингвистического исследования
Аннотация
Обоснование. В настоящее время лингвистические корпусы являются не только источником эмпирического материала для исследований, но базой для формирования некоторых лингвистических теорий. В статье рассматриваются виды и специфика наиболее известных немецких лингвистических корпусов как инструмента изучения немецкого языка. Описание корпусов производится с целью информирования научной общественности о представляемых ими возможностях. В задачи исследования входят: описание структуры электронных порталов, где размещены данные немецкие корпусы, представление их текстовой базы и объема, а также их структуры. Отдельно оговариваются условия и возможности лингвистического поиска в данных ресурсах. Вначале упоминается история появления первого корпуса, дается его современное определение, делается обзор научной литературы по вопросам использования корпусных данных в лингвистике и смежных науках.
Цель – описание объема, структуры и особенностей немецкоязычных корпусов, а также возможностей автоматизации процесса извлечения материала с учетом запросов исследователей.
Материалы и методы. Материалом исследования послужили немецкоязычные электронные ресурсы, два из которых рассматриваются детально: электронный словарь немецкого языка – Digitales Wörterbuch der deutschen Sprache (DWDS) и корпусы Института Немецкого языка – IDS-Korpora: Corpora of Written Language, (LIMAS), проект DeReKo и COSMAS II, Datenbank für Gesprochenes Deutsch (DGD). В работе также упомянуты проект специального корпуса университета Заарбрюккена Федеральной Земли Заарланд – NEGRA и проект корпусного словаря Лейпцигского университета -– Deutscher Wortschatz (German Vocabulary). Главный метод исследования – структурно-описательный. Количественные показатели использовались как элемент описания и представления данных.
Результаты. Параллельно с описанием корпусов авторы представляют рекомендации по сферам применения того или другого немецкоязычного ресурса и имеющихся на его портале инструментов автоматизированного поиска и обработки запрашиваемой информации. В ходе описания упоминаются объем, структура и особенности лингвистической разметки, поддерживаемой корпусами и определяющей специфику извлекаемого материала. Авторы подчеркивают перспективность освоения корпусных инструментов лингвистами для проверки лингвистических гипотез и обработки эмпирического материала.
EDN: CQGUZX
Скачивания
Литература
Айсанова, А. А., & Морозова, А. С. (2025). Построение детского монологического дискурса: особенности употребления анафорических средств в спонтанной детской речи. Современные исследования социальных проблем, 17(2), 81–102. https://doi.org/10.12731/2077-1770-2025-17-2-493. EDN: https://elibrary.ru/UFIMMM
Ганиева, И. Ф. (2007). Об использовании корпусов в лингвистических исследованиях. Вестник Башкирского университета. Раздел: Филология и искусствоведение, 12(4), 104–106.
Гималетдинова, Г. К., & Алимова, А. Р. (2025). Лингвостилистические особенности современной англоязычной рекламной коммуникации. Современные исследования социальных проблем, 17(2), 103–123. https://doi.org/10.12731/2077-1770-2025-17-2-496. EDN: https://elibrary.ru/VRZVPL
Горина, О. Г., & Царакова, Н. С. (2021). Корпусные инструменты, маршруты и эксперименты в современной лингводидактике. Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация, 19(2), 36–53. https://doi.org/10.25205/1818-7935-2021-19-2-36-53. EDN: https://elibrary.ru/JWRKME
Захаров, В. П., & Богданова, С. Ю. (2020). Корпусная лингвистика: учебник (3 е изд., перераб.). Санкт Петербург: Издательство Санкт Петербургского университета, 234 с.
Козлова, Н. В. (2023). Лингвистические корпуса: определение основных понятий и типология. Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация, 11(1), 79–88.
Корпус NEGRA университета Заарбрюкен Федеральной земли Заарланд [Электронный ресурс]. Получено 20.11.2025, из: https://www.lt-world.org/kb/resources-and-tools/language-data/ltw_x3alanguage_x5fdata_.2010-09-23.5303689618
Многоязычный проект Лейпцигского университета [Электронный ресурс]. Получено 20.11.2025, из: https://wortschatz.uni-leipzig.de/de
Мухамадьярова, А. Ф. (2021). Применение корпусных технологий при формировании лексико грамматических навыков на немецком языке. Перспективы науки и образования, (5), 247–259. https://doi.org/10.32744/pse.2021.5.17. EDN: https://elibrary.ru/EAGTBI
Палийчук, Д. А. (2022). Корпусные технологии в лингвистических исследованиях. Гуманитарные исследования. История и филология, (6), 72–79. https://doi.org/10.24412/2713-0231-2022-6-72-79. EDN: https://elibrary.ru/VLMGJT
Плунгян, В. А. (2006). «Интегрум» и Национальный корпус русского языка в лингвистических исследованиях. В кн.: Integrum: точные методы и гуманитарные науки (с. 76–84). Москва. EDN: https://elibrary.ru/PXFBEL
Портал Лейпцигского университета [Электронный ресурс]. Получено 20.11.2025, из: https://www.lt-world.org/kb/resources-and-tools/language-data/ltw_x3alanguage_x5fdata_.2010-09-23.5303689618
Рюкова, А. Р. (2024). Корпусно ориентированные исследования языка: краткий обзор достижений и трудностей. Russian Linguistic Bulletin, (1), 49. Получено 21.11.2025, из: https://rulb.org/archive/1-49-2024-january/. https://doi.org/10.18454/RULB.2024.49.17. EDN: https://elibrary.ru/CEQMAT
Стартовая страница поиска корпуса на портале проекта Лейпцигского университета [Электронный ресурс]. Получено 20.11.2025, из: https://text.wortschatz-leipzig.de/#open
Структура Института Немецкого языка в виде схемы [Электронный ресурс]. Получено 20.11.2025, из: https://www.ids-mannheim.de/org/orga/
Электронный корпусный словарь немецкого языка Digitales Wörterbuch der deutschen Sprache (DWDS): стартовая страница [Электронный ресурс]. Получено 21.11.2025, из: https://www.dwds.de/
Электронный корпусный словарь немецкого языка Digitales Wörterbuch der deutschen Sprache (DWDS): стартовая страница (раздел «Wörterbücher») [Электронный ресурс]. Получено 21.11.2025, из: https://www.dwds.de/d/woerterbuecher
Электронный ресурс, скооперированный с DWDS [Электронный ресурс]. Получено 20.11.2025, из: https://ddc.dwds.de/dstar/politische_reden/diacollo/?query=&format=cloud&corpus=politische_reden
Didakowski, J., & Radtke, N. (2020). Verwendung der deutschen Stützverbgefüge mit Adjektiven und ihre Ermittlung mithilfe des DWDS Wortprofils. In Funktionsverbgefüge im Fokus (pp. 101–134). Berlin, Boston: De Gruyter. https://doi.org/10.1515/9783110697353-005
Disanto, G. A. (2009). Korpusbasierte Translationswissenschaft. Eine Untersuchung am Beispiel des JRC Acquis Parallelkorpus Deutsch Italienisch. Corpus based Translation Studies. A Study of the “JRC Acquis” Parallel Corpus German Italian — Abstract. trans kom, 2(1), 63–91.
DWDS Verlaufskurve für „Union / Verein“, erstellt durch das Digitale Wörterbuch der deutschen Sprache. Получено 20.11.2025, из: https://www.dwds.de/r/plot/?view=1&corpus=zeitungenxl&norm=date%2Bclass&smooth=spline&genres=0&grand=1&slice=1&prune=0&window=0&wbase=0&logavg=0&logscale=0&xrange=1946%3A2025&q1=Union&q2=Verein
Flinz, C. (2021). KORPORA in DaF und DaZ: Theorie und Praxis. Zeitschrift für Interkulturellen Fremdsprachenunterricht, 26(1). Получено 24 июля 2021, из: https://ojs.tujournals.ulb.tu-darmstadt.de/index.php/zif/article/view/1112/1108
Flinz, C. (2020). Vergleichbare Spezialkorpora für den Tourismus: eine Chance für den Fachsprachenunterricht. In Sprachvergleich in der mehrsprachig orientierten DaF Didaktik. Theorie und Praxis (pp. 133–151). Roma: Istituto Italiano di Studi Germanici.
Frank, A. (2001). Treebank Conversion: Converting the NEGRA Corpus to an LTAG Grammar. In Proceedings of the EUROLAN Workshop on Multi layer Corpus based Analysis (pp. 29–43). Saarbrücken: DFKI GmbH.
Imo, W., & Weidner, B. (2018). Mündliche Korpora im DaF und DaZ Unterricht. In Korpuslinguistik (pp. 231–252). Berlin, Boston: De Gruyter. Получено 24 июля 2021, из: https://www.degruyter.com/document/doi/10.1515/9783110538649 011/html
Quasthoff, U. (2009). Korpusbasierte Wörterbucharbeit mit den Daten des Projekts Deutscher Wortschatz. Linguistik online, 39(3), 151–162. Universität Bern, Bern, Schweiz.
Storrer, A. (2005). Online Corpora zur linguistischen Analyse der deutschen Gegenwartssprache [A Survey of Online Corpora für Investigating Contemporary German]. Zeitschrift für Germanistische Linguistik, 33(1), 145–150. https://doi.org/10.1515/zfgl.2005.33.1.145
References
Aisanova, A. A., & Morozova, A. S. (2025). Constructing children’s monologic discourse: features of anaphoric means usage in spontaneous children’s speech. Modern Studies of Social Problems, 17(2), 81–102. https://doi.org/10.12731/2077-1770-2025-17-2-493. EDN: https://elibrary.ru/UFIMMM
Ganieva, I. F. (2007). On the use of corpora in linguistic research. Bulletin of Bashkir University. Section: Philology and Art Studies, 12(4), 104–106.
Gimaletdinova, G. K., & Alimova, A. R. (2025). Linguostylistic features of modern English language advertising communication. Modern Studies of Social Problems, 17(2), 103–123. https://doi.org/10.12731/2077-1770-2025-17-2-496. EDN: https://elibrary.ru/VRZVPL
Gorina, O. G., & Tsarakova, N. S. (2021). Corpus tools, routes, and experiments in modern linguodidactics. NSU Bulletin. Series: Linguistics and Intercultural Communication, 19(2), 36–53. https://doi.org/10.25205/1818-7935-2021-19-2-36-53. EDN: https://elibrary.ru/JWRKME
Zakharov, V. P., & Bogdanova, S. Yu. (2020). Corpus linguistics: textbook (3rd ed., revised). Saint Petersburg: Saint Petersburg University Publishing House, 234 p.
Kozlova, N. V. (2023). Linguistic corpora: defining key concepts and typology. NSU Bulletin. Series: Linguistics and Intercultural Communication, 11(1), 79–88.
NEGRA Corpus of Saarland University [Electronic resource]. Retrieved on November 20, 2025, from: https://www.lt-world.org/kb/resources-and-tools/language-data/ltw_x3alanguage_x5fdata_.2010-09-23.5303689618
Multilingual project of Leipzig University [Electronic resource]. Retrieved on November 20, 2025, from: https://wortschatz.uni-leipzig.de/de
Mukhamadyarova, A. F. (2021). Applying corpus technologies to develop lexico grammatical skills in German. Prospects of Science and Education, (5), 247–259. https://doi.org/10.32744/pse.2021.5.17. EDN: https://elibrary.ru/EAGTBI
Paliychuk, D. A. (2022). Corpus technologies in linguistic research. Humanities Research. History and Philology, (6), 72–79. https://doi.org/10.24412/2713-0231-2022-6-72-79. EDN: https://elibrary.ru/VLMGJT
Plungyan, V. A. (2006). “Integrum” and the Russian National Corpus in linguistic research. In: Integrum: precise methods and humanities (pp. 76–84). Moscow. EDN: https://elibrary.ru/PXFBEL
Leipzig University Portal [Electronic resource]. Retrieved on November 20, 2025, from: https://www.lt-world.org/kb/resources-and-tools/language-data/ltw_x3alanguage_x5fdata_.2010-09-23.5303689618
Ryukova, A. R. (2024). Corpus oriented language studies: a brief overview of achievements and challenges. Russian Linguistic Bulletin, (1), 49. Retrieved on November 21, 2025, from: https://rulb.org/archive/1-49-2024-january/. https://doi.org/10.18454/RULB.2024.49.17. EDN: https://elibrary.ru/CEQMAT
Starting page for corpus search on the Leipzig University project portal [Electronic resource]. Retrieved on November 20, 2025, from: https://text.wortschatz-leipzig.de/#open
Structure of the Institute for the German Language as a diagram [Electronic resource]. Retrieved on November 20, 2025, from: https://www.ids-mannheim.de/org/orga/
Digitales Wörterbuch der deutschen Sprache (DWDS): electronic corpus dictionary of the German language — home page [Electronic resource]. Retrieved on November 21, 2025, from: https://www.dwds.de/
Digitales Wörterbuch der deutschen Sprache (DWDS): electronic corpus dictionary of the German language — home page (section “Wörterbücher”) [Electronic resource]. Retrieved on November 21, 2025, from: https://www.dwds.de/d/woerterbuecher
Electronic resource cooperated with DWDS [Electronic resource]. Retrieved on November 20, 2025, from: https://ddc.dwds.de/dstar/politische_reden/diacollo/?query=&format=cloud&corpus=politische_reden
Didakowski, J., & Radtke, N. (2020). Verwendung der deutschen Stützverbgefüge mit Adjektiven und ihre Ermittlung mithilfe des DWDS Wortprofils. In Funktionsverbgefüge im Fokus (pp. 101–134). Berlin, Boston: De Gruyter. https://doi.org/10.1515/9783110697353-005
Disanto, G. A. (2009). Korpusbasierte Translationswissenschaft. Eine Untersuchung am Beispiel des JRC Acquis Parallelkorpus Deutsch Italienisch. Corpus based Translation Studies. A Study of the “JRC Acquis” Parallel Corpus German Italian — Abstract. trans kom, 2(1), 63–91.
DWDS time course diagram for “Union / Verein”, created by the Digital Dictionary of the German Language. Retrieved on November 20, 2025, from: https://www.dwds.de/r/plot/?view=1&corpus=zeitungenxl&norm=date%2Bclass&smooth=spline&genres=0&grand=1&slice=1&prune=0&window=0&wbase=0&logavg=0&logscale=0&xrange=1946%3A2025&q1=Union&q2=Verein
Flinz, C. (2021). KORPORA in DaF und DaZ: Theorie und Praxis. Zeitschrift für Interkulturellen Fremdsprachenunterricht, 26(1). Retrieved on July 24, 2021, from: https://ojs.tujournals.ulb.tu-darmstadt.de/index.php/zif/article/view/1112/1108
Flinz, C. (2020). Vergleichbare Spezialkorpora für den Tourismus: eine Chance für den Fachsprachenunterricht. In Sprachvergleich in der mehrsprachig orientierten DaF Didaktik. Theorie und Praxis (pp. 133–151). Roma: Istituto Italiano di Studi Germanici.
Frank, A. (2001). Treebank conversion: converting the NEGRA corpus to an LTAG grammar. In Proceedings of the EUROLAN Workshop on Multi layer Corpus based Analysis (pp. 29–43). Saarbrücken: DFKI GmbH.
Imo, W., & Weidner, B. (2018). Mündliche Korpora im DaF und DaZ Unterricht. In Korpuslinguistik (pp. 231–252). Berlin, Boston: De Gruyter. Retrieved on July 24, 2021, from: https://www.degruyter.com/document/doi/10.1515/9783110538649-011/html
Quasthoff, U. (2009). Korpusbasierte Wörterbucharbeit mit den Daten des Projekts Deutscher Wortschatz. Linguistik online, 39(3), 151–162. Universität Bern, Bern, Schweiz.
Storrer, A. (2005). Online Corpora zur linguistischen Analyse der deutschen Gegenwartssprache [A survey of online corpora for investigating contemporary German]. Zeitschrift für Germanistische Linguistik, 33(1), 145–150. https://doi.org/10.1515/zfgl.2005.33.1.145
Copyright (c) 2025 Tatiana K. Ivanova, Elsara V. Gafiyatova

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
































