Пиратский искусственный интеллект

Разработчики искусственного интеллекта, которые грабят существующие переводы книг, чтобы улучшить свои продукты, охотятся как на прошлую, так и на будущую работу литературных переводчиков. Но может ли спрос на тонкость и мастерство со стороны читателей и издателей спасти высококвалифицированных специалистов от превращения в простых пост-редакторов ИИ? Переводчики со скандинавских языков, находящиеся на краю пропасти инноваций, высказывают свое мнение.

ЧатГПТ и генеративный ИИ появились в конце 2022 года. Велика вероятность того, что пересечение книг, издательского дела и ИИ впервые попало в поле вашего зрения где-то в 2023 году, вполне возможно, после того, как расследование The Atlantic показало, что сотни тысяч пиратских книг были использованы для обучения этой технологии. Все происходило так быстро.

В январе 2024 года Общество авторов в Великобритании провело опрос своих членов о генеративном ИИ и его влиянии на их профессиональную деятельность. Результаты, опубликованные весной, определенно заставили задуматься. Среди респондентов более 40 % переводчиков сообщили о снижении доходов из-за генеративного ИИ, и более 75 % переводчиков ожидают, что генеративный ИИ негативно повлияет на их будущие доходы.

Но мой собственный момент, связанный с ИИ, произошел в феврале 2024 года, когда я прочитал статью в шведской газете Aftonbladet с провокационным заголовком “ИИ заменит всех нас, переводчиков”. В ней Калле Хедстрём Густафссон описал свою панику по поводу стремительного вторжения искусственного интеллекта в мир перевода и вероятного и неминуемого упадка профессии. Обвинив переводческую профессию и заинтересованных сторонних наблюдателей в том, что они зарывают голову в песок, он сделал сенсационное заявление. Он заявил, что при минимальном редактировании ИИ уже создает пригодные для публикации результаты для некоторых видов литературы. И, что еще более ужасно, что господство технологии во всех видах литературы неизбежно и неминуемо.

При чтении этой книги я сразу узнаю вершителя судеб, но мой желудок не преувеличивал – многое из того, что он говорил, было правдой. Если роботы придут за переводчиками нашведский язык, то, надо полагать, они придут и за мной, работающим на шведском. Чувствуя тошноту уже несколько недель, я впервые в жизни посвятил несколько часов серьезным размышлениям о карьере, которую я мог бы найти за пределами перевода. Скоро я должен был остаться без работы – почему же я не задумывался об этом до сих пор?

“Pirates Used to Do That to Their Captains Now and Then”, иллюстрация мертвого капитана, оставленного на берегу, первоначально опубликованная в Janvier, Thomas, November, 1894. ‘Морские разбойники Нью-Йорка’, журнал Harper’s Magazine. Изображение сделано Wikimedia Commons

Техника

В те далекие времена, когда я начинал работать в начале 2010-х годов, Google уже десять лет предоставлял возможность онлайн-перевода в том или ином виде. К 2012 году сервис достиг 200 миллионов ежемесячных пользователей и уже шесть лет использовал подход статистического машинного перевода (SMT). Инженер Google Франц Оч сказал: “То, что все профессиональные переводчики в мире делают за год, наша система переводит примерно за один день”. Он предложил читателям “представить себе будущее, в котором каждый человек в мире может потреблять и обмениваться любой информацией, независимо от того, на каком языке она написана”.

Не удивительно, что среди коллег, начинающих свой переводческий путь, ходила шутка, что наши переводческие дни уже сочтены.

И все же наша неизбежная гибель не наступила – по крайней мере, не так быстро, как мы ожидали. Возможно, отчасти потому, что в мире коммерческого перевода инструменты CAT (computer assisted translation) уже давно стали обычным явлением. Говоря простым языком, программа разбивает исходный текст на сегменты (чаще всего по предложениям), а затем переводчик переводит каждый сегмент, который сохраняется в памяти переводов. Впоследствии программа и ее пользователь могут обращаться к ней и использовать ее в своих интересах. Инструменты CAT значительно повысили производительность труда в переводческой отрасли, но было не совсем ясно, сможет ли машинный перевод дать такой же толчок к развитию. Короче говоря, качество SMT было просто недостаточно высоким. Тем не менее, вхождение этих (онлайновых) машин в повседневную жизнь коммерческого переводчика было ощутимым.

В середине 2010-х годов произошел новый прорыв: появился нейромашинный перевод (NMT). NMT стал предвестником того, что должно было произойти – предложения машинного перевода становятся все лучше. Намного лучше. По крайней мере, это касается таких пар языков, как шведский и английский, относительно близких в лингвистическом отношении и имеющих большие массивы данных для создания таких систем. Расценки не росли. Сроки выполнения сокращались. После странностей первых дней COVID-19, 2020-е годы, казалось, будут характеризоваться таким продвижением технологий. А потом 30 ноября 2022 года был запущен ChatGPT, и мир немного сошел с ума.

Размышления о скандинавских книгах

Неудивительно, что появление полноценного генеративного ИИ никак не улучшило ситуацию для коммерческих переводчиков. Но ведь на литературных переводчиках это никак не отразится, верно? Ошибаетесь.

В 2022 году в воздухе явно что-то витало. Первый намек на то, что издатель осознал возможности, открывающиеся в результате гонки машинных переводов на дно, появился в моем почтовом ящике в начале того лета. Оно пришло от крупного датского издательства, в котором я раньше работал и которое теперь пыталось выйти на рынок переводных электронных книг и аудиокниг иностранной литературы. В сопроводительном письме говорилось: “Недавно мы начали разрабатывать идеи, которые могли бы помочь сделать конвейер переводов более эффективным”. Сопроводительный опрос был почти полностью посвящен использованию CAT-инструментов и, что более важно, постредактированию и использованию результатов машинного перевода.

Недавно после этого коллега рассказал мне о собственном опыте другого крупного скандинавского издательства, использовавшего аналогичный подход “захвата всего мира”. Из сообщений СМИ того времени стало ясно, что компания испытывает бюджетные трудности. Там, где раньше они финансировали переводчиков по хорошим расценкам, они начали передавать эти операции на аутсорсинг и в оффшорные компании, не связанные с издательским бизнесом, в юрисдикциях, где наиболее вероятным результатом была гонка на понижение и использование всех премудростей, которые можно было найти в Интернете бесплатно.

В Скандинавии сильна культура книги и грамотности, а также развитый издательский рынок, который в XXI веке становится все более инновационным. Хотя электронная книга в Скандинавии так и не стала популярной, как в других странах (возможно, потому, что Amazon только недавно вышел на рынок), регион стал пионером в мире потокового аудиокнигоиздания, развития передовых “гибридных” изданий (авторы частично оплачивают публикацию) и профессионализации сцены иностранных прав, которая соперничает с резким и стремительным англо-американским агентским миром. К осени 2022 года в Швеции появилось новое литературное агентство, обещающее помочь авторам, которых оно берет на себя, добиться публикации в Швеции, но, что еще важнее, совершить прыжок за границу, с эвфемизмами для обеспечения экономически эффективного перевода, намекающими на потенциальные пути обхода “дорогих” переводчиков. К началу 2023 года Шведские СМИ освещали решение издательства Lind & Co использовать искусственный интеллект для перевода жанровой фантастики на шведский язык, и переводчики в социальных сетях возмутились.

Возвращение в 2024 год

Мрачная статья Калле Хедстрёма Густафссона в Aftonbladet была предзнаменованием. Буквально через день после прочтения мне позвонил шведский литературный агент и спросил, смогу ли я за 36 часов перевести большой кусок текста с раннего черновика с помощью искусственного интеллекта. У меня снова свело желудок. Профессионализация скандинавской индустрии прав в значительной степени обусловлена использованием длинных англоязычных выборочных переводов оригинальных произведений, и их производство является ценным источником работы для таких переводчиков, как я. На этот раз я был по-настоящему занят и мог отказаться от проекта без раздумий.

ЛБФ и весна

Конечно, причиной спешки было то, что до Лондонской книжной ярмарки (LBF) оставались считанные дни. Я приехал с мрачным настроением. Первая полоса журнала The Bookseller в первый день вряд ли улучшила ситуацию. В нем сообщалось, что литературные разведчики “переходят” на использование ИИ в своей работе, включая подготовку образцов. Позже, стоя на задворках переполненной площадки Центра литературного перевода и слушая дискуссию на тему “перевод и ИИ”, я услышал, как двое посетителей LBF, проходивших мимо, удивлялись, почему здесь так много народу. ‘Это о переводе и искусственном интеллекте’, – сказал один другому. ‘Просто используй его’, – проворчал другой, оставив подслушивающего в недоумении.

После того как шум LBF остался позади, тошнота, которую я испытывал в конце февраля и начале марта, начала рассеиваться. Мое эго было польщено добротой тех, кто купил и оценил мои переведенные слова. Опубликованная статья отошла на второй план, поскольку я получал от клиентов комиссионные за переводы, сделанные мной. Но тут пришел еще один запрос – на “опытного переводчика” для редактирования полной книги, переведенной с помощью DeepL Pro, чтобы довести ее до “высочайшего качества”. После долгих раздумий – в конце концов, такие образцы переводов стоят дорого, и возможность сэкономить на расходах, возможно, является мудрым деловым решением литературного агента – я решил вежливо отказаться без объяснения причин.

Тогда – бам – скандинавская тенденция к освоению новых платформ проявилась снова. В мае было объявлено о запуске нового издательства, Aniara Press. Эта шведская компания будет заниматься переводом, изданием и распространением книг на семи языках на четырнадцати различных рынках – и все это с помощью искусственного интеллекта, создающего переводы и пост-редактирование. Основатель компании заверил потенциальных авторов, что переводчики и редакторы по всему миру будут готовы “проверять” переводы их произведений, выполненные ИИ. Все это немного тревожно.

На перекрестке

Частью проблемы является нечеткая терминология. Термином “ИИ” часто бросаются, не уточняя, имеем ли мы в виду большие языковые модели (БЯМ) и генеративный ИИ, например ChatGPT, или другой, негенеративный, аналитический или ориентированный на решение конкретных задач ИИ. В контексте перевода мы чаще всего используем “ИИ” для обозначения ИИ, ориентированного на решение конкретных задач, в виде статистического машинного перевода и NMT. Но не всегда. Даже в рамках одной сферы все сталкиваются друг с другом.

В статье для летнего номера 2024 года журнала Британского авторского общества The Author, переводчица Рут Ахмедзай Кемп исследует вопросы, связанные с литературным переводом и ИИ. Опираясь на широкий круг информаторов, она приходит к интересным выводам. Примечательно, что она собирает опыт работы с ИИ изнутри переводческой профессии, что свидетельствует о том, что при слове “ИИ” переводчики сталкиваются с множеством инструментов и видов деятельности.

Переводчик с казахского на английский в статье Кемпа рассказывает о преимуществах и недостатках работы в CAT-инструменте с опцией машинного перевода, доступной для консультации, – это похоже на то, как если бы перед вами был открыт старый школьный словарь, который вы можете быстро и эффективно пролистать. Другой переводчик, работающий с французским языком, рассказывает о трудностях, возникающих при постредактировании текстов, когда исходный текст полностью переведен машинным способом. Еще один переводчик, работающий с немецким языком, подчеркивает, что сам термин “постредактирование” является расплывчатым: среди надеющихся на деньги издателей бытует мнение, что после того как машина сделает всю тяжелую работу, человек может добавить немного полировки и сделать это быстрее и с меньшими затратами. Тем не менее, если речь идет о тщательном редактировании, оно требует больших усилий, так как необходимо сверять весь текст с источником.

Непереводчики слишком часто полагают, что можно просто “скормить” книгу машинному переводу или искусственному интеллекту и принять все, что нам дадут взамен. Следовательно, это будет быстро и дешево. Переводчики часто полагают, что им передадут один из таких “переводов”, а затем попросят проверить его – очень неудовлетворительный рабочий процесс, который к тому же скучен и отнимает много времени. Однако в случаях, описанных Хедстрёмом Густафссоном в Швеции, а также в случае с моим датским издательством, о котором говорилось выше, издатели, скорее всего, вообще отказываются от услуг переводчика – они просто поручают редактору отшлифовать целевой текст, не обращаясь к оригиналу.

Отсюда вытекает проблема качества и восприятия качества. Хедстрём Густафссон настаивает на том, что ИИ может хорошо переводить большинство вещей. Шведский издатель Кристоффер Линд в основном согласен с этим, его компания в настоящее время использует машинный перевод только для жанровой фантастики. Этот подход вызывает бурные дискуссии, в ходе которых отмечается, что он часто используется для произведений и авторов, которые в противном случае просто остались бы непереведенными. Однако шведский переводчик Йоханна Свартстрем утверждает, что большинство переводов, выполненных искусственным интеллектом, являются “любительскими”. Она оспаривает мнение Густафссона о том, что все, что остается сделать, – это окончательная полировка.

Опять же, возможно, они имеют в виду разные вещи. Густафссон (и Линд) полагают, что ИИ создает переводы, достаточно хорошие для того, чтобы профессиональный редактор (не обязательно знающий исходный язык) мог превратить их в текст, пригодный для публикации. Это может быть не самый лучший перевод, но это будет читабельная книга. Свартстрем, между тем, почти полностью сосредоточен на качестве переведенного текста.

Мнения о том, что такое “качество”, тоже имеют значение. Рой Юдейл задается вопросом, не является ли то, что мы видим, миражом, ссылаясь, в частности, на генеративный ИИ, такой как ChatGPT. По его словам, эти инструменты ставят во главу угла беглость речи и склонны придумывать что-то новое. Этот “мираж” – то, что в других местах часто называют “галлюцинациями” (т. е. тенденцией ИИ ошибаться). В рецензируемой статье, провокационно озаглавленной “ChatGPT is bullshit‘, опубликованной в журнале Ethics and Information Technology в июне этого года, авторы утверждают, что LLM, подобные ChatGPT, не просто “галлюцинируют” – они на самом деле являются машинами по производству бреда, созданными для того, чтобы выдавать неправду.

В связи со всем этим возникает вопрос: что читатели ищут в переведенных книгах? Гладкую отделку или что-то, что представляет собой оригинал?

А как же авторское право?

В своей статье Кемп рассмотрела ситуацию с авторскими правами для литературных переводчиков и их переводов в новую эпоху, представив убедительные аргументы в пользу того, что переводчики сохраняют авторские права даже при работе с НМТ или ИИ. Она отметила не только то, что “процесс остается сложным, творческим, когда человек-переводчик балансирует между двумя параллельными текстами: одним фиксированным, а другим появляющимся”, но и то, что “главное, чтобы человек – и даже обученный, опытный двуязычный человек переводчик – контролировал” все используемые инструменты, “и продолжает контролировать (с точки зрения авторского права и морали) переведенный текст после отправки”.’

Это расходится с недавней точкой зрения Агентства по культуре и дворцам Дании, которое курирует вопросы литературной политики в стране. Заявление Агентства было сделано в ответ на запрос Датской ассоциации переводчиков (часть Датского авторского общества) о пост-редактировании. В частности, речь шла о появлении практики, когда издатели переводили полные книги с помощью искусственного интеллекта, а затем перед публикацией подвергали их тщательному редактированию одноязычными редакторами; эти редакторы затем указывались как “переводчики”. Возник вопрос, имеют ли эти “переводчики” право на получение выплат по праву публичного кредитования (PLR) за свой вклад. Ответ правительства в июне 2024 года? Жесткое “нет”. Пост-редакторы не являются создателями произведений и не имеют права на получение PLR.

Эксперты по качеству и переводу

Франц Оч в 2012 году пришел к выводу, что “для перевода нюансов или критически важных задач нет ничего лучше человеческого переводчика”. Сегодня в мире LLM и ChatGPT это так же верно, как и тогда, когда технология еще основывалась на SMT.

В отличие от пренебрежительных комментариев, которые я услышал на LBF в этом году, я также столкнулся с положительными моментами. Один литературный агент, с которым я разговаривал, сказал о новом романе своего клиента: “Просто в качестве эксперимента мы попробовали прогнать первые несколько глав через ИИ, но это оказалось недостаточно хорошо”. Фух. Другой агент сказал мне, что они избегают ИИ именно потому, что вложение денег и времени в высококачественный образец с человеческим переводом было ключевым моментом в их предложении по продаже – они настолько верили в книгу и ее автора, что готовы были потратить максимум долларов, чтобы показать ее потенциальным покупателям. И снова фух. Еще один агент поделился со мной великолепной новостью о том, что они только что продали одного из своих авторов британскому издательству (первый выход этого писателя на английском языке), приписав причину этому образцу перевода, который я им передал. Не то что переводчик Фрэнк Уинн, который, принимая переводческую премию Франко-американского фонда за 2024 год, отметил, что он “полностью согласен с переводом AI, если просто убрать “A” и оставить “I””.

Долговременный циник в области ИИ, Эд Цитрон, скептически относится к реальному применению ИИ в жизни. Хотя большая часть его статей дает надежду уставшим переводчикам, опасающимся за свою карьеру, его анализ того, что публика хочет от потребляемых ею средств массовой информации, весьма уместен. Предполагается, что аудитория глупа, невежественна и ей “просто все равно”, но я с этим категорически не согласен – я думаю, что обычные люди найдут эти вещи глубоко оскорбительными.

Инструмент?

Возможно, вы помните забастовку Гильдии писателей Америки (WGA) 2023 года против Альянса продюсеров кино и телевидения, которая сорвала ряд производств и привела к остановке работы на несколько месяцев. В отличие от ситуации с литературными переводчиками в Европе, WGA заключает соглашения со студиями на коллективной основе, и для того, чтобы работать, люди фактически обязаны вступить в профсоюз. В центре забастовки стояли различные вопросы, но одним из них был AI. В ходе переговоров WGA добилась принятия обязательств, согласно которым ИИ не может быть использован для переписывания литературного материала, а созданный ИИ материал не может быть использован для подрыва авторских заслуг. Важно отметить, что сценаристы могут использовать ИИ в качестве инструмента при написании, но их нельзя принуждать к этому. Студии также должны раскрывать информацию о том, что предоставляемые ими материалы генерируются ИИ, и не допускать распространения материалов писателей для обучения ИИ.

Рут Ахмедзай Кемп, которая поддерживает использование ИИ, излучает прагматичный оптимизм в своей статье для The Author: Она не видит конца человеческому переводу, а скорее считает, что человеко-машинный симбиоз представляет собой “эволюцию профессиональных ролей” … “в контексте, где нам всегда будет нужен человеческий, двуязычный взгляд, инстинкт и интуиция.’ Она выступает за появление рынка “переводов, созданных человеком, международной литературы с человеческим участием”. Как отмечает Кемп в отдельной статье, “даже при наличии машинного перевода в качестве вспомогательного средства литературный перевод – это плохо оплачиваемая форма требовательного, высококвалифицированного труда; если инструменты могут ускорить нашу работу, это должно пойти нам на пользу, а не во вред в плане оплаты труда”.

Шведский издательский обозреватель Сёльве Дальгрен соглашается. Он отмечает, что победителями станут компетентные профессионалы издательского дела, которые адаптируются к технологическим изменениям – в конце концов, “отвертки, возможно, заменены электроинструментами, но хорошие плотники по-прежнему востребованы”..

За гранью качества

Фрэнк Уинн высказывает убедительную точку зрения: “Если мы доверим наше искусство машинам, они со временем, возможно, создадут адекватный симулякр искусства. Но адекватность – это плохая замена человеку”. Хотя я склонен согласиться, написав, что “для многих существует глубокое желание переводить, и я также верю, что есть аудитория, которая желает переведенный человеком контент”, я считаю, что это привилегированное положение для признанных переводчиков.

Мы можем кричать с крыш о ценности переводчиков-людей, но что можно сделать на практике? Заманчиво сосредоточиться на качестве работы “машин по производству дерьма”, управляемых искусственным интеллектом, но это в некотором роде красная селедка. Хедстрём Густафссон предлагает отказаться от дискуссий о качестве и душе, а вместо этого заняться решением сложного вопроса, возникающего в каждой отрасли, которой угрожает ИИ: существует ли внутренняя ценность людей, выполняющих определенные виды работ, и если да, то в чем она заключается? Реальный вопрос, который стоит на кону – по крайней мере, для нас, переводчиков, – это средства к существованию. Мы можем утверждать, что качество не на высоте и что читателям нужен контент, переведенный человеком, но в конечном итоге, если никто не будет платить, это не имеет значения.

А пока нам нужно продолжать отстаивать свои интересы как перед читателями, так и перед издателями, нужно призвать к ответу мошенников, укравших наши наработки по созданию этой технологии, нужно, чтобы New York Times выиграла свой иск против OpenAI и Microsoft, нам нужны сильные профсоюзы для поддержки переводчиков и всех других творческих работников, нам нужны такие организации, как CEATL для изучения ситуации в разных странах и на разных рынках, чтобы мы могли лучше реагировать, нам нужно разработать схемы лицензирования ИИ, которые соответствовали бы цели, и нам отчаянно нужно регулирование ИИ. И все это нужно делать, пока мы беспокоимся о будущем и суетимся, чтобы заработать на жизнь сейчас.

Мы должны надеяться, что Эд Цитрон прав и что нашим читателям до не все равно.

 

Translated by
Display Europe
Co-funded by the European Union
European Union

Translation is done via AI technology. The quality is limited by the used language model.

Published 12 August 2024
Original in English
First published by Eurozine

© Ian Giles / Eurozine

PDF/PRINT

Newsletter

Subscribe to know what’s worth thinking about.

Related Articles

Cover for: In the spirit of the times and against the grain

Osteuropa at 100: Manfred Sapper on the history of the journal from Weimar to the present; Gerd Koenen on a century of German–Russian projections; Katharina Raabe on eastern European literature in translation; Dorothea Redepenning on the bilateral politics of classical.

Cover for: Rethinking empathy

The white saviour, driven by a moral mission, benefits from the oppression they claim to resist. Reactions to the plight of ‘victims’ often fail to translate into concrete actions, leaving those in need of care begging for sympathy. Could acknowledgement of individual complexity to the point of mystery alter this dynamic?

Discussion