-
Сейчас популярно
-
Продвигаемые темы
-
Последние сообщения
-
Автор: Дмитрий Соснов · Опубликовано:
Сломанный РЕМАСТЕР "СТАЛКЕР: ЗОВ ПРИПЯТИ" (Туман, сырые отражения, ОЗВУЧКА, архитектура, баги...) https://www.youtube.com/watch?v=OPJtRYkkgiQ -
Автор: SerGEAnt · Опубликовано:
Товарищ с замечательным ником «иван сексолог» смастерил русификатор для кооперативного хоррора Subterror, вышедшего в январе. Товарищ с замечательным ником «иван сексолог» смастерил русификатор для кооперативного хоррора Subterror, вышедшего в январе. -
Автор: van_der_alex · Опубликовано:
Вторая часть марлезонского балета Gemini. Заставляем Gimini писать скрипт для автоматизированного перевода через нее же.
В целом, эта часть весьма проста. Берем подряд каждый чанк с исходными переводами PL DE FR ES, отправляем в нейросеть, получаем перевод, сохраняем. Вот так это выглядит в процессе работы: Основной промт хранится в отдельном файле, и может быть в принципе каким угодно. Пока я взял за основу польский текст, а остальные языки использую для коррекции при необходимости, однако никто не мешает изменить этот промт как угодно, гибкость AI позволяет это делать. Можно добавить в запрос драфт русского перевода, можно делать перевод с нуля, можно удалять тэги шрифта <itallic> или что-то еще.
Перевод… Все равно не идеален. Однако взяв за основу польский, который славянский, мы можем максимально избежать проблемы родов/склонений/падежей, а остальные языки помогут найти смысл там, где и польского мало. В общем, тут надо экспериментировать.
Дьявол как всегда в деталях. Деталь первая — пробелы и переходы на новую строку.
Нейросети рассматривают эти символы как ненужные и несмотря на то, что в промте есть явные указания сохранять начальные/конечные пробелы, это не работает. Приходится скриптом анализировать какой-то исходный язык (в моем примере польский — Фильтр/коррекция для языка: Polish) и на основе его восстанавливать так называемую “кайму”, как метко назвала нейросеть эту функцию. Но это мелочи, простейший функционал так сказать.
Тэги. Вот тут основная проблема. Есть 3 видов, уже говорил в предыдущем сообщении статистику:
Ключей с тегами <...>: 1929
Ключей с тегами {...}: 1400
Ключей с конструкцией '|plural(': 45
Поехали подробнее. Теги <> нужны для работы со шрифтом — выделение текста и так далее. Пример:
Как видно из примера, можно вообще в теории забивать на эти тэги и удалять их из исходного текста. Ну будет внешний вид чуть более однообразный, вот для французов и испанцев в примере как то не помешало. Сейчас текст передается как есть, вместе с тэгами, и это приводит к ошибкам, когда нейросеть их портит или выделяет не то. В общем, если оставлять тэги, то тут потом ручками придется проверять и править 2000 строк. Впрочем, можно написать спецскрипт, который будет более корректно работать с этими тэгами (1. Убрать тэги, 2. Перевести чистый текст 3. Проанализировать исходный текст 4. При возможности восстановить тэги на переводе). Это уже нюансы, пока я ничего с тэгами не делаю, предлагаю нейросети самой с ними разбираться.
Тэги {} — переменные игры. Пример:
Zasada wypowiedziana przez {SpeakerTag} ze statusem Developera {DevStatus})
Они при переводе должны каким-то образом учитываться, но из менять никоим образом нельзя. Сейчас опять же, мы оставляем это на контроль самой нейросети, однако она иногда все-таки будет лажать. Необходим ручной контроль и постредактура при необходимости всех 1400 чанков с этой структурой.
Для контроля тэгов используется механизм проверки тэгов. Извлекаются тэги <> из исходного основного текста (напомню, я взял за основу польский, однако можно и другой), извлекаются тэги из перевода, сравниваются. Если тэги разные — значит модель что-то там напутала, такой перевод помечается как “проблема с тэгом <>” для последующей ВНИМАТЕЛЬНОЙ редактуры и анализа. Аналогично контроль сделан для {}. Есть еще структура множественных чисел |plural(ХХХ дней/Хдня) — но таких вхождений мало, всего 45. Можно их просто взять из русского перевода, там эти структуры убраны и заменены другим словами, где нет вариаций. Выводы. Инструменты уже готовы. Осталось сделать работу. Как я сказал постом выше — либо несколько месяцев бесплатно, либо 20 долларов и выше — в зависимости от выбранной модели и кучи сопутствующих нюансов. Кроме того, постредактура и обработка в любом случае нужна. В общем — если есть энтузиасты, могу все дать, занимайтесь. Сам я скорее всего делать ничего не буду, так как мне английского хватает, да и не хочу тратить столько времени.
Засим откланиваюсь, с уважением и проч и проч. -
Автор: Northern · Опубликовано:
Совокоты анонсировали скорый выход РПГ по Dark Heresy, а на ЗоГе тишина.. Странно. @SerGEAnt -
Автор: SerGEAnt · Опубликовано:
Русификатор обновлен для сборки игры 83999. -
Автор: Sudakov Pavel · Опубликовано:
Надеюсь, к 2028 году русификатор будет полностью готов и раскроет игру полностью.
-
-
Изменения статусов
-
Здраствуйте! Извините, а можно попросить ссылку на место где можно взять перевод (патч или образ игры с переводом) El Shaddai: Ascension of the Metatron для ps3, пожалуйста? А то в теме к этой игре у меня не получилось найти работающие ссылки… Первая ведет в группу в которой удалены большинство постов, а пост с этой игрой ведет на сайт https://psnext.ru который сейчас не имеет отношения к видеоиграм.· 0 ответов
-
Лучшие авторы