Войдите, чтобы подписаться
Подписчики
0

Sony показала геймплей приключенческого проекта Detroit: Become Human
Автор:
SerGEAnt, в
Игровые новости
-
Сейчас популярно
-
Продвигаемые темы
-
Последние сообщения
-
Автор: SerGEAnt · Опубликовано:
Товарищ с замечательным ником «иван сексолог» смастерил русификатор для кооперативного хоррора Subterror, вышедшего в январе. Товарищ с замечательным ником «иван сексолог» смастерил русификатор для кооперативного хоррора Subterror, вышедшего в январе. -
Автор: van_der_alex · Опубликовано:
Вторая часть марлезонского балета Gemini. Заставляем Gimini писать скрипт для автоматизированного перевода через нее же.
В целом, эта часть весьма проста. Берем подряд каждый чанк с исходными переводами PL DE FR ES, отправляем в нейросеть, получаем перевод, сохраняем. Вот так это выглядит в процессе работы: Основной промт хранится в отдельном файле, и может быть в принципе каким угодно. Пока я взял за основу польский текст, а остальные языки использую для коррекции при необходимости, однако никто не мешает изменить этот промт как угодно, гибкость AI позволяет это делать. Можно добавить в запрос драфт русского перевода, можно делать перевод с нуля, можно удалять тэги шрифта <itallic> или что-то еще.
Перевод… Все равно не идеален. Однако взяв за основу польский, который славянский, мы можем максимально избежать проблемы родов/склонений/падежей, а остальные языки помогут найти смысл там, где и польского мало. В общем, тут надо экспериментировать.
Дьявол как всегда в деталях. Деталь первая — пробелы и переходы на новую строку.
Нейросети рассматривают эти символы как ненужные и несмотря на то, что в промте есть явные указания сохранять начальные/конечные пробелы, это не работает. Приходится скриптом анализировать какой-то исходный язык (в моем примере польский — Фильтр/коррекция для языка: Polish) и на основе его восстанавливать так называемую “кайму”, как метко назвала нейросеть эту функцию. Но это мелочи, простейший функционал так сказать.
Тэги. Вот тут основная проблема. Есть 3 видов, уже говорил в предыдущем сообщении статистику:
Ключей с тегами <...>: 1929
Ключей с тегами {...}: 1400
Ключей с конструкцией '|plural(': 45
Поехали подробнее. Теги <> нужны для работы со шрифтом — выделение текста и так далее. Пример:
Как видно из примера, можно вообще в теории забивать на эти тэги и удалять их из исходного текста. Ну будет внешний вид чуть более однообразный, вот для французов и испанцев в примере как то не помешало. Сейчас текст передается как есть, вместе с тэгами, и это приводит к ошибкам, когда нейросеть их портит или выделяет не то. В общем, если оставлять тэги, то тут потом ручками придется проверять и править 2000 строк. Впрочем, можно написать спецскрипт, который будет более корректно работать с этими тэгами (1. Убрать тэги, 2. Перевести чистый текст 3. Проанализировать исходный текст 4. При возможности восстановить тэги на переводе). Это уже нюансы, пока я ничего с тэгами не делаю, предлагаю нейросети самой с ними разбираться.
Тэги {} — переменные игры. Пример:
Zasada wypowiedziana przez {SpeakerTag} ze statusem Developera {DevStatus})
Они при переводе должны каким-то образом учитываться, но из менять никоим образом нельзя. Сейчас опять же, мы оставляем это на контроль самой нейросети, однако она иногда все-таки будет лажать. Необходим ручной контроль и постредактура при необходимости всех 1400 чанков с этой структурой.
Для контроля тэгов используется механизм проверки тэгов. Извлекаются тэги <> из исходного основного текста (напомню, я взял за основу польский, однако можно и другой), извлекаются тэги из перевода, сравниваются. Если тэги разные — значит модель что-то там напутала, такой перевод помечается как “проблема с тэгом <>” для последующей ВНИМАТЕЛЬНОЙ редактуры и анализа. Аналогично контроль сделан для {}. Есть еще структура множественных чисел |plural(ХХХ дней/Хдня) — но таких вхождений мало, всего 45. Можно их просто взять из русского перевода, там эти структуры убраны и заменены другим словами, где нет вариаций. Выводы. Инструменты уже готовы. Осталось сделать работу. Как я сказал постом выше — либо несколько месяцев бесплатно, либо 20 долларов и выше — в зависимости от выбранной модели и кучи сопутствующих нюансов. Кроме того, постредактура и обработка в любом случае нужна. В общем — если есть энтузиасты, могу все дать, занимайтесь. Сам я скорее всего делать ничего не буду, так как мне английского хватает, да и не хочу тратить столько времени.
Засим откланиваюсь, с уважением и проч и проч. -
Автор: Northern · Опубликовано:
Совокоты анонсировали скорый выход РПГ по Dark Heresy, а на ЗоГе тишина.. Странно. @SerGEAnt -
Автор: SerGEAnt · Опубликовано:
Русификатор обновлен для сборки игры 83999. -
Автор: Sudakov Pavel · Опубликовано:
Надеюсь, к 2028 году русификатор будет полностью готов и раскроет игру полностью. -
Автор: van_der_alex · Опубликовано:
Gemini говорите… Ну что ж, вот почитайте что я вчера за пару часов сделал:
1. Выделил основные языки, с которыми нужно работать. PL DE FR ES. Остальные не нужны — только ухудшат контекст. 2. Заставил гемини написать скрипт для обработки всех локалей в единый файл, туда же засунул последнюю версию перевода. По пути слегка нормализуя текст (в польской версии использовались нестандартные кавычки, впрочем, всегда можно пересобрать с любыми другими правками/изменениями). Пример записей: Попутно собрал некоторую статистику:
Вот что говорит последняя модель gemini 2.5 flash про свои возможности перевода:
осталось написать скрипт для перевода, казалось бы.
Про особенности скрипта для перевода я напишу чуть позже, а тут скажу про другой, не очень очевидный нюанс: если пользоваться бесплатным лимитированным тарифом gemini, то перевод 100 000 вхождений займет около 3 месяцев. Если платным, то несколько дней с ценой 15-20 долларов ориентировочно (а может и больше, тут дело такое…). А потом потребуется еще серьезная правка после перевода, без этого никуда. В общем, выводы делайте сами, кому интересно могу скриптики/файлики выложить, а пока переходим ко второй части — переводу. Кстати, нейросеть настаивает что Охотник должен быть Хантер, что не надо его переводить дословно, и остальные языки нам это подтверждают. Это имя а не профессия. Не буду приводить се доводы, просто информация к сведению.
-
Изменения статусов
-
Здраствуйте! Извините, а можно попросить ссылку на место где можно взять перевод (патч или образ игры с переводом) El Shaddai: Ascension of the Metatron для ps3, пожалуйста? А то в теме к этой игре у меня не получилось найти работающие ссылки… Первая ведет в группу в которой удалены большинство постов, а пост с этой игрой ведет на сайт https://psnext.ru который сейчас не имеет отношения к видеоиграм.· 0 ответов
-
Лучшие авторы