Cheatsheet

Философия языкаall topics on one page

8 modules
24 articles
0 definitions
0 formulas
Contents
1

Язык, смысл и реальность

Как язык соотносится с реальностью и что значит «иметь смысл»

Фреге, Рассел и аналитическая философия языка

Рождение философии языка → Рассел: теория дескрипций → Витгенштейн ранний: «Логико-философский трактат»

Готлоб Фреге (1848–1925) — «отец аналитической философии» и современной логики. Его центральный вопрос: как математические утверждения («2+2=4») могут быть истинными необходимо, а не случайно? Ответ потребовал разработки формальной логики и теории значения.

Фреге ввёл различие между смыслом (Sinn) и денотатом (Bedeutung) выражения. Денотат — объект, на который указывает выражение. Смысл — способ, которым этот объект представлен. «Утренняя звезда» и «Вечерняя звезда» имеют одинаковый денотат (планета Венера), но разный смысл: они представляют один об...

Это различие решает множество философских головоломок: как могут быть истинными утверждения о несуществующих объектах? («Нынешний король Франции лыс» — у этого предложения есть смысл, но нет денотата). Как имена собственные работают в отчётах о мнениях? («Она думает, что Геспер — звезда» — замена...

Бертран Рассел (1872–1970) в «Об обозначении» (1905) предложил революционное решение проблемы имён и дескрипций — одну из самых элегантных идей аналитической философии.

Витгенштейн поздний: языковые игры и следование правилу

Поворот от «Трактата» к «Исследованиям» → Следование правилу → Языковая игра как освобождение от метафизики

Людвиг Витгенштейн (1889–1951) — редчайший случай в истории философии: мыслитель, дважды совершивший революцию. «Трактат» (1921) определил одно направление — теорию картины, логический атомизм. «Философские исследования» (опубликованы посмертно, 1953) его разрушили.

Поздний Витгенштейн отказывается от идеи, что у языка есть одна функция («описывать факты») и одна форма (логическая). Реальный язык бесконечно разнообразен: мы не только описываем, но и спрашиваем, приказываем, благодарим, предупреждаем, исполняем ритуалы, шутим, клянёмся. Каждое из этих использ...

Языковая игра (Sprachspiel) — практика использования языка, неотделимая от «формы жизни» (Lebensform). Слова получают смысл через использование в конкретных практиках, а не через соответствие объектам. Значение — не объект, на который указывает слово; значение — «использование слова в языке».

Знаменитый пример: «Что такое боль?» Можно было бы сказать: боль — это определённое ощущение, «приватный объект» во внутреннем мире. Но Витгенштейн показывает: само слово «боль» получает смысл через публичные практики — поведение боли (вскрик, гримаса), обучение, утешение. Нет «приватного языка» ...

Речевые акты: Austin, Searle и перформативность

Как делать вещи словами → Трёхчастная теория речевого акта → Searle: систематическая теория речевых актов → Перформативность вне философии языка

Джон Остин в лекциях «Как совершать действия при помощи слов» (опубликованы посмертно, 1962) поставил под сомнение стандартное допущение философии языка: что задача языка — описывать факты.

Остин начинает с перформативных высказываний: «Я клянусь», «Я нарекаю этот корабль „Королева Елизавета"», «Я обещаю», «Я объявляю вас мужем и женой». Это не описания — это действия. Произнося их в правильном контексте, говорящий делает то, о чём говорит. Они не истинны и не ложны — они «успешны» ...

Перформативное высказывание «не срабатывает» при нарушении условий успешности: судья, объявляющий приговор, должен иметь полномочия; клятвенный свидетель должен давать показания добровольно; крещение должно совершаться в правильном ритуальном контексте.

Остин развил более общую теорию: любое высказывание одновременно совершает три акта:

2

Язык, мышление и общество

Лингвистический поворот, дискурс и когнитивная лингвистика

Соссюр и структурная лингвистика: произвольность знака

Курс общей лингвистики → Произвольность языкового знака → Синхрония и диахрония

Фердинанд де Соссюр (1857–1913) никогда не публиковал свою ключевую теорию сам. «Курс общей лингвистики» (1916) составлен учениками на основе записей лекций посмертно — и тем не менее стал одной из самых влиятельных книг XX века.

Соссюр поставил лингвистику на научную основу, определив её предмет и ключевые различия. Самое важное — различие между langue (языком как системой, кодом, структурой) и parole (речью, индивидуальным актом использования языка). Наука о языке изучает langue — систему, а не бесчисленные индивидуальн...

Ключевой тезис Соссюра: языковой знак произволен. Знак состоит из означающего (акустический образ, звуковой паттерн) и означаемого (понятие, содержание). Связь между ними — не природная, не мотивированная, а конвенциональная, произвольная.

Доказательство: одно и то же понятие обозначается разными звуковыми комплексами в разных языках. «Дерево» — tree — Baum — arbre — شجرة. Нет природной связи между звучанием и понятием. (Исключение: немногочисленные звукоподражания — кукушка, жужжать — но они также условны: «кукушка» в других языка...

Гипотеза Сепира-Уорфа: язык формирует мышление?

Лингвистический релятивизм → Эксперименты и современное состояние → Метафора и концептуальная система

Эдвард Сепир и его ученик Бенджамин Ли Уорф (1897–1941) предложили одну из самых спорных гипотез XX века: язык, на котором мы говорим, формирует (или даже определяет) то, как мы думаем. Разные языки создают разные «реальности» для своих носителей.

Сильная версия (лингвистический детерминизм): язык определяет мышление. Без нужного слова нельзя иметь нужную мысль. Уорф изучал язык хопи (индейцы американского юго-запада) и утверждал: у хопи принципиально другая концепция времени (язык не имеет форм времени в нашем понимании) — и поэтому они в...

Слабая версия (лингвистический релятивизм): язык влияет (но не определяет) на мышление. Разные языки делают разные вещи «более удобными» для мышления, акцентируют разные аспекты реальности.

Исследования Уорфа подверглись критике: анализ языка хопи оказался неточным; нет «вневременного» языка хопи. Более поздние исследования показали: базовые когнитивные процессы (восприятие, категоризация) во многом универсальны — люди, говорящие на принципиально разных языках, воспринимают цвета, ф...

Дискурс и власть: Фуко, деконструкция, критический анализ

Фуко: дискурс как власть-знание → Деррида и деконструкция → Критический анализ дискурса

Мишель Фуко переосмыслил понятие «дискурса»: дискурс — это не просто разговор или текст, а практика, производящая объекты, о которых говорит. Дискурс о безумии производит безумных как объект знания и практики. Дискурс о сексуальности производит понятия «перверсии», «нормы», «сексуального здоровья».

Ключевая связь: знание-власть. Нет знания без власти; нет власти без знания. Тот, кто имеет право «говорить правду» о безумии (психиатр), обладает властью над безумным. Классификации (нормальный/анормальный, здоровый/больной, законный/незаконный) — не нейтральные описания реальности, а практики в...

Фуко в «Надзирать и наказывать» (1975) анализирует, как дискурс исправления и нормализации создаёт новые субъектности. Паноптикум (тюремный проект Бентама, где заключённые видимы надзирателю всегда, но не знают, когда за ними наблюдают) — модель «паноптической» власти: надзор интернализируется, с...

Жак Деррида (1930–2004) разработал метод деконструкции — анализ текстов, обнаруживающий их внутренние противоречия, смысловые иерархии и допущения, которые текст стремится скрыть.

3

Прагматика и коммуникация

Как контекст, намерение и речевые конвенции формируют значение в реальном общении

Грайс и принципы кооперативного общения

Принцип кооперации → Импликатуры

  • Количество: говори ровно столько, сколько нужно
  • Качество: говори только то, в чём уверен
  • Отношение: говори по существу
  • Манера: говори ясно, без двусмысленности

Пол Грайс (1975) предложил теорию разговорных импликатур. Коммуникация успешна, потому что говорящий и слушающий следуют негласным максимам:

Когда эти максимы нарушаются намеренно — возникает импликатура: неявный смысл, который слушатель выводит. «Как вам торт?» — «Торт сделан из натуральных ингредиентов» — здесь соблюдено качество, но нарушено отношение. Слушатель выводит: торт не понравился.

Ирония, метафора, вежливые отказы — всё это игра с максимами. Понимание этого механизма критически важно для переговоров, дипломатии, любого сложного общения.

Вежливость, лицо и стратегии общения

Концепция «лица» → Угрозы лицу

Эрвинг Гоффман ввёл понятие «лица» (face) — публичного образа, который человек проецирует в социальных взаимодействиях. Пенелопа Браун и Стивен Левинсон (1987) развили теорию вежливости через «лицо»:

Позитивное лицо: желание быть принятым, одобренным, понятым. «Ты прекрасно разбираешься в этом вопросе» — это поддержка позитивного лица.

Негативное лицо: желание автономии, свободы от принуждения. «Не могли бы вы...» вместо «сделайте» — это уважение к негативному лицу.

Критика, несогласие, просьба, команда — это «угрозы лицу» (face-threatening acts). Стратегии вежливости смягчают эти угрозы. Выбор стратегии зависит от: социальной дистанции, власти, «веса» просьбы.

Метафора, фрейминг и политический язык

Лакофф и фрейминг → Оружие языка

Джордж Лакофф показал: политические дебаты выигрываются на уровне фреймов, а не фактов. Фрейм — это структура интерпретации. Когда республиканцы назвали отмену налога на наследство «death tax», они выиграли дебаты до того, как они начались: теперь любое возражение против неё звучало как защита на...

Лакофф советовал демократам: «не используйте слова оппонента». Активация фрейма через его язык усиливает его, даже если вы его отрицаете. «Не думайте о белом слоне» — вы уже думаете.

В рекламе, политике, управлении изменениями — фрейминг критичен. «Реструктуризация» vs «увольнения»; «инвестиции» vs «расходы»; «гибкий рынок труда» vs «прекаризация» — это не просто слова, это картины мира.

Чувствительность к фреймингу — важнейший навык критического мышления: замечать, в каком фрейме поставлен вопрос, и уметь его сменить.

4

Язык, идентичность и будущее

Билингвизм, исчезающие языки, язык и ИИ

Билингвизм и многоязычие: когнитивные и социальные аспекты

Когнитивные преимущества билингвизма → Политика языка

Долгое время считалось: два языка в голове создают «помехи», замедляют обработку. Современные исследования перевернули эту картину. Билингвы постоянно управляют двумя языковыми системами — это тренирует исполнительный контроль, рабочую память, когнитивную гибкость. Исследования Эллен Биалысток по...

Переключение между языками — не только лингвистический, но и когнитивный и культурный акт. Говорящие на нескольких языках нередко отмечают: на разных языках они «чуть другие люди» — другая тональность, другие привычные паттерны мышления.

Языковая политика — один из самых острых политических вопросов. Какой язык — государственный? Обязательный в образовании? В суде? Это вопросы власти, идентичности, включения и исключения.

Исчезновение языков: разнообразие как ценность

Масштаб катастрофы → Зачем сохранять?

Из ~7000 языков мира, по прогнозам, к концу XXI века исчезнет от 50 до 90%. Каждые две недели умирает последний носитель какого-либо языка. Это не просто «культурная потеря» — это потеря способов видеть мир.

Пирахан (бразильская Амазония) — язык без рекурсии, без числительных выше «несколько», без концепции далёкого прошлого и будущего. Носители этого языка буквально не могут думать в определённых категориях — или наш язык не позволяет нам понять, как они думают без этих категорий.

Аргументы за языковое разнообразие: каждый язык кодирует уникальное знание о локальной экосистеме, медицинских практиках, способах социальной организации. Этноботаника: большинство лекарственных растений известны науке благодаря знаниям индигенных культур, закодированным в их языках.

Язык и искусственный интеллект: GPT, понимание и смысл

Большие языковые модели → Философские ставки

GPT, Claude, Gemini — это «большие языковые модели» (LLM), обученные на огромных корпусах текстов. Они генерируют статистически вероятный следующий токен. Они не «понимают» язык в том смысле, в каком понимает человек — но что значит «понимать»?

Джон Сёрль предложил мысленный эксперимент «китайская комната» (1980): человек в комнате манипулирует символами по правилам, производя ответы по-китайски, не зная китайского. Это метафора синтаксиса без семантики — манипуляция знаками без значения. Является ли LLM «китайской комнатой»?

Если LLM может порождать осмысленный текст без понимания, это бросает вызов теориям значения, основанным на интенциональности и опыте. Или это показывает, что «понимание» — это функциональное свойство, которое может реализовываться в разных субстратах?

Это не академический вопрос: от ответа зависит, как мы регулируем ИИ, как оцениваем его продукцию, как строим с ним взаимодействие.

5

Лингвистическая относительность и когнитивная лингвистика

Сепир-Уорф, Лакофф и язык как инструмент мышления

Гипотеза Сепира-Уорфа: язык формирует мышление?

Лингвистический релятивизм → Эксперименты: цвет, пространство, время → Значение для практики

Эдвард Сепир и Бенджамин Ли Уорф в 1930–40-е годы сформулировали идею, ставшую одной из самых обсуждаемых в лингвистике и когнитивной науке: язык, на котором мы говорим, влияет — или даже определяет — то, как мы думаем и воспринимаем мир.

Сильная версия (лингвистический детерминизм): язык определяет мышление. Без слова для понятия — невозможно мышление о нём. Уорф утверждал: хопи (индейский язык) не имеет понятия линейного времени — и хопи думают о времени иначе. Эта сильная версия сегодня в основном отвергнута: глухонемые без язы...

Слабая версия (лингвистический релятивизм): язык влияет на мышление и восприятие, делая некоторые мысли более доступными. Это подтверждается экспериментально.

Исследования цвета — классические тесты. Русский язык имеет два слова для синего (синий и голубой), английский — одно (blue). Ирина Уинавер (2007): носители русского различают оттенки синего быстрее, чем носители английского. Язык влияет на восприятие.

Когнитивная лингвистика: метафоры, которыми мы живём

Лакофф и Джонсон: концептуальная метафора → Ориентационные и онтологические метафоры → Концептуальная метафора в переговорах и лидерстве

Джордж Лакофф и Марк Джонсон («Метафоры, которыми мы живём», 1980) совершили революцию в понимании метафоры. Традиционный взгляд: метафора — поэтическое украшение, риторический приём. Лакофф и Джонсон: метафора — фундаментальный механизм мышления. Мы понимаем абстрактные понятия через конкретные.

«Спор — это война»: Он атаковал каждое из моих аргументов. Его позиция неуязвима. Он победил в споре. Эта метафора структурирует наше понимание спора: есть победитель и проигравший, позиции нападают и обороняются. Можно было бы понимать спор иначе: «Спор — это строительство»: мы вместе строим пон...

Ориентационные метафоры: «хорошее — наверху, плохое — внизу». «Настроение упало» (депрессия — движение вниз). «Акции выросли» (рост — вверх). «Он на вершине успеха». Эти пространственные метафоры так укоренены, что кажутся «буквальными». Но они — метафоры: хорошее не буквально «выше».

Онтологические метафоры: абстрактное мыслится как вещь, контейнер или человек. «Инфляция — наш враг» (персонификация). «Они находятся в состоянии шока» (психическое состояние — контейнер). «Наш план рухнул» (абстрактное как физический объект).

Прагматика и теория речевых актов

Остин: как делать вещи словами → Грайс: максимы кооперативного общения

Джон Остин («Как делать вещи словами», 1962) поставил вопрос: что происходит, когда мы говорим? Традиционная семантика: предложение описывает факт (истинный или ложный). Но многие предложения не описывают — они действуют.

«Я обещаю прийти» — это не описание обещания, это само обещание. «Объявляю вас мужем и женой» — это не описание женитьбы, это совершение женитьбы. Остин назвал такие высказывания «перформативами»: они выполняют действие в самом произнесении.

Три измерения речевого акта. Локутивный акт: произнесение слов с буквальным значением. Иллокутивный акт: намерение говорящего (приказать, попросить, пообещать, предупредить). Перлокутивный акт: эффект на слушателя (он сделал то, о чём его попросили).

Пол Грайс сформулировал «принцип кооперации»: говорящий делает свой вклад таким, каким он должен быть в данный момент для цели разговора. Это не описание того, что происходит — это норма, на основании которой мы интерпретируем высказывания.

6

Язык, власть и социальная идентичность

Фуко, Бурдьё и язык как поле борьбы

Фуко и дискурс: знание как власть

Что такое дискурс → Власть и сопротивление → Критический дискурс-анализ

Мишель Фуко использовал понятие «дискурс» в специфическом смысле: не просто «речь» или «текст», а система правил, определяющих, что можно сказать, как сказать, кто имеет право говорить и что считается «истиной» в данную эпоху.

Дискурс — это власть, структурирующая знание. Медицинский дискурс XIX века создал «пациента» как объект исследования, «душевнобольного» как категорию контроля, «врача» как носителя легитимного знания о телах. До появления этого дискурса «безумие» понималось иначе — как мудрость, одержимость, мора...

«Психиатрическая власть» (Фуко): психиатрия не просто лечит болезни — она создаёт нормы, определяет «нормальное» и «патологическое», осуществляет социальный контроль через медицинский язык.

Фуко: власть — не собственность класса или государства. Это отношение, пронизывающее все уровни общества. Там, где есть власть, есть сопротивление. Сопротивление тоже работает через язык и дискурс.

Бурдьё: языковой капитал и поле

Язык как капитал → Поле и хабитус

Пьер Бурдьё («Что значит говорить», 1982) применил к языку концепцию «капитала». Языковой капитал — не просто знание языка, а владение легитимным языком: престижным акцентом, правильной грамматикой, академическим дискурсом. Это форма символического капитала, конвертируемая в другие виды капитала.

Парижский буржуа и рабочий из Марселя говорят по-французски — но их «французский» неравноценен на «языковом рынке». Парижский акцент — легитимный, марсельский — маркированный. Это не природный факт, а социальная конструкция, воспроизводящая классовую иерархию.

Академический язык — экстремальный случай языкового капитала. Университет производит и требует определённого типа речи, которым владеют преимущественно те, кто вырос в соответствующих семьях. Это воспроизводит классовое неравенство через язык.

Каждое социальное поле (академическое, экономическое, художественное, политическое) имеет свои правила игры, свой «вкус», свой легитимный язык. Входя в поле, агент должен освоить его язык — иначе он «не в своей тарелке».

Язык и гендер: феминистская лингвистика

Как язык отражает и воспроизводит гендерное неравенство → Изменение языка как политика

Феминистская лингвистика (Робин Лакофф, «Язык и место женщины», 1975) поставила вопрос: существует ли «женский язык»? Лакофф описала особенности женской речи: уклончивость (tag questions — «это правда, не так ли?»), апологетичность, преуменьшение уверенности, более частое использование «вежливых»...

Критика: эти особенности характерны не для женщин, а для субординатных позиций. Мужчины в подчинённой позиции говорят так же. Это не «женский язык» — это «язык власти vs. язык без власти».

Сексизм в языке: генерик «он» для обозначения людей вообще (английское «he» как нейтральное), слова с суффиксом «мужского рода» как базовые (президент vs. «президент-женщина»). Феминистская лингвистика показала: эти конвенции не нейтральны — они делают женщин «исключением», а не нормой.

Языковые реформы — и споры о них. В английском «they» как гендерно нейтральный сингулярный местоимение (уже одобрен AP Stylebook). В немецком — гендерная звёздочка (Leser*innen). В русском — дискуссия о феминитивах (авторка, режиссёрка, психологиня).

7

Перевод, межкультурная коммуникация и потеря при переводе

Непереводимость, культурные концепты и переговоры через границы

Теория перевода: что теряется и что находится

Невозможность перевода → Эквивалентность и стратегии перевода

Вальтер Беньямин («Задача переводчика», 1923) поставил вопрос радикально: цель перевода — не передать смысл оригинала (это невозможно), а открыть «чистый язык» — то, что стремится выразить каждый язык, не умея этого полностью. Перевод — не замена оригинала, а его послежизнь (Nachleben).

Это звучит мистически — но указывает на реальную проблему. Каждый язык имеет концепты, непереводимые напрямую. «Schadenfreude» (нем.) — удовольствие от чужого несчастья. «Saudade» (порт.) — меланхолическая тоска по чему-то любимому и утраченному. «Toska» (рус.) — Набоков: «никакой другой язык не ...

Барбара Кассен проект «Европейский словарь философий» — словарь непереводимых философских концептов. Непереводимость — не недостаток, а богатство: разные языки видят разные аспекты реальности.

Евгений Найда — «динамическая эквивалентность»: перевод должен производить на читателя такой же эффект, как оригинал — на своего читателя, пусть и другими средствами. «Формальная эквивалентность» (слово-в-слово) vs. «динамическая» (эффект-на-эффект).

Язык и идентичность: смерть языков и языковая политика

Языки умирают → Языковая политика и борьба за идентичность

Сегодня в мире около 7 000 языков. К концу XXI века исчезнет 50–90% из них — по большинству оценок. Каждые две недели умирает один язык: последний носитель уходит, унося с собой уникальный способ видеть мир.

Почему это важно? Дэниэл Эверетт и язык пираха (амазонский): пираха не имеет рекурсии (вложенных предложений), не имеет числительных кроме «мало-много», не имеет понятий прошлого и будущего в нашем смысле. Этот язык опровергает «универсальную грамматику» Хомского и показывает альтернативный спосо...

Исчезновение языка — это исчезновение экологических знаний, медицинских практик, нарративных традиций, концептуальных миров. Лингвисты сравнивают это с исчезновением биологических видов: невосстановимая потеря разнообразия.

Валлийский язык в Великобритании — образцовый пример успешной ревитализации: с 70 000 носителей в 1970-е до 900 000 сегодня. Обязательное образование на валлийском, валлийское телевидение, государственные документы на двух языках. Это политическое решение.

Риторика молчания: что значит «не сказать»

Молчание как коммуникация → «Невысказанные договорённости» в организациях

Лингвистика традиционно изучает то, что говорится. Но молчание — тоже форма коммуникации, причём в некоторых культурах и ситуациях — более значимая, чем слова.

Японская культура молчания: «ma» (間) — пустота, пауза как значимый элемент коммуникации. Пауза в разговоре — не неловкость, а пространство для осмысления. Американская культура заполняет паузы — «small talk» как борьба с молчанием. Финская культура молчания: молчать с другом — проявление доверия.

Эдвард Холл — «культуры высокого и низкого контекста». Низкий контекст (США, Германия): всё должно быть сказано явно; молчание — проблема. Высокий контекст (Япония, Китай, арабский мир): значительная часть смысла передаётся через контекст, невербально, молчанием.

Организации имеют огромный объём «невысказанного»: нормы, которые никто не формулирует, но все соблюдают. «О политике не говорим». «Шефа не критикуем на совещаниях». «Ошибки признавать опасно». Это молчания, структурирующие организационную жизнь.

8

Цифровой язык и будущее коммуникации

Интернет-язык, NLP и язык в эпоху ИИ

Интернет-язык: эмодзи, мемы и новые формы коммуникации

Цифровая коммуникация создаёт новые жанры → Эмодзи как новый языковой уровень

Каждое новое медиа создаёт новые языковые жанры. Телеграф создал краткость и «точка» как обозначение конца. Телефон создал нормы «начала» и «конца» звонка. Интернет создал сотни новых жанров за 30 лет: электронное письмо, форумный пост, твит, пост в Instagram, TikTok-комментарий.

Каждый жанр имеет свои нормы: длину, тональность, степень формальности, допустимые темы. Электронное письмо — гибрид письма и разговора: формальнее мессенджера, менее формально, чем деловое письмо. Твит — радикальная краткость, публичность, перформативность.

Дэвид Кристал («Язык и интернет», 2001; «txtng: the gr8 db8», 2008): интернет и SMS не разрушают язык (этот страх повторяется с каждым новым медиа). Это новые жанры с новыми нормами — не деградация, а диверсификация.

Эмодзи начинались как японские пиктограммы в мобильных сообщениях (1999). Сегодня — 3 600+ символов, используемых в 10 миллиардах сообщений ежедневно. Это первая глобальная «письменность» — хотя и не язык в полном смысле.

NLP и обработка естественного языка: как машина понимает речь

История NLP: от правил к нейронным сетям → Что NLP-системы умеют и не умеют

Обработка естественного языка (Natural Language Processing, NLP) — раздел ИИ, занимающийся пониманием и генерацией человеческого языка. История: от ранних символических систем (правила плюс словарь) через статистические методы (машинный перевод на основе частот) к нейронным сетям и трансформерам.

Ранний машинный перевод (1950-е–60-е) — правила и словари. Провал: язык слишком сложен для правил. Georgetown-IBM experiment (1954): энтузиасты обещали решить проблему за 5 лет. Через 10 лет — ALPAC report (1966): машинный перевод недостижим и не нужен. Первая «зима» NLP.

Статистический поворот (1980-е–90-е): вместо правил — статистика больших корпусов. «Каждый раз, когда лингвист увольняется, качество перевода растёт» — полушутка исследователей IBM. IBM Candide, Google Translate — корпусный подход.

Глубокое обучение (2012–): нейронные сети на огромных данных. Word2Vec — векторное представление слов: «король — мужчина + женщина ≈ королева». BERT (Google, 2018) — двунаправленные трансформеры, предобучение на огромных корпусах. GPT — генеративный вариант.

Язык будущего: мультиязычность, перевод в реальном времени и языковые права

Мировой лингвистический пейзаж → Технологии и языковое равенство → Языковые права как права человека

Мировой лингвистический пейзаж радикально меняется. Английский — доминирующий язык глобальной коммуникации, науки, бизнеса. Китайский — крупнейший по числу носителей. Испанский — второй по числу носителей в западном полушарии. Арабский — язык 420 миллионов.

Интернет поначалу был преимущественно англоязычным — сегодня более 50% контента не на английском. Это дает голоса ранее невидимым языковым сообществам — и создаёт новые проблемы «языковых цифровых разрывов».

Лингва франка XXI века: реально использование английского как «vehicular language» в международных контекстах. Но это «English as a Lingua Franca» (ELF) — не нативный английский. Исследования ELF (Дженнифер Дженкинс): у «ненативных» говорящих свои нормы, которые не должны оцениваться как «ошибки».

Google Translate — 133 языка. Но качество неравномерно: немецкий–английский — отличный, суахили–украинский — значительно хуже. Языки с меньшим количеством данных получают худшее качество перевода — усугубление «цифрового колониализма».