Перейти к содержимому
Zone of Games Forum

van_der_alex

Новички+
  • Публикации

    8
  • Зарегистрирован

  • Посещение

Репутация

3 Нейтральная

О van_der_alex

  • Звание
    Новичок

Интересности

  • Конфигурация компьютера
    ---
  1. Marvel’s Midnight Suns

    Может, ты хотя бы сам проверишь и скажешь что и как? Остались ли переводы яндекс? Можно ли что-то вернуть.
  2. Marvel’s Midnight Suns

    Дружищще, а ты ничего не напутал? Я вижу что десятки тысяч записей полностью идентичны старому переводу, и также я вижу новые записи. Но подавляющее большинство записей идентично. Возможно, при слиянии что-то не так пошло?
  3. Marvel’s Midnight Suns

    Я сделал редактор перевода с интеграцией с диплом, подсветкой тэгов. можно его модифицировать чтобы был старый перевод/yandex перевод/gemini перевод (если он когда-то будет). И в итоге надо смертника энтузиаста, который возьмет это все и поправит в финальную, адекватную версию.
  4. Marvel’s Midnight Suns

    пароль просит И еще важно знать, как яндекс обработал сообщения с тегами иначе если он как то колбасил тэги — его перевод будет просто непроходим
  5. Marvel’s Midnight Suns

    Файлик есть, прям щас. 100 000 вхождений, испанский/польский/французский/немецкий. Могу добавить китайский, японский, корейский, мне не жалко. Готов начинать? Ах да, ты же не понимаешь. Для непонятливых еще раз напишу — АНГЛИЙСКОГО НЕТ. СОВСЕМ НЕТ. Не готов отвечать? Не отвечай. За умного сойдешь.
  6. Marvel’s Midnight Suns

    да в чем проблема — берешь и делаешь как тебе надо. Надо лично Васе Пупкину переводить именно с оригинала — Вася Пупкин делает как ему нужно. А если Пупкин не понимает почему все занимаются фигней и переводят с польского, с немецкого но не с любимого английского и лень Васе прочитать пару страниц темы — значит не надо Васе это вообще. Так просто, воздух посотрясать. Фигня ведь на самом деле, что в английском нет родов, падежей, склонений и нельзя понять и однозначно перевести не зная контекста, а контекст взять неоткуда? И фигня конечно, что английской локали нет в виде отдельного файла — английский взять просто неоткуда. Но Васе не хочется вникать, Васе надо сказать свои 5 копеек. Вроде понятно написано — скрипт на питоне для Gemini. Кому надо понять — поймет. Кто не поймет — и говорить больше не о чем. А если будет уже готовый и отредактированный файл с пеереводом (json) интегрировать новый перевод в игру дело пары минут. Но только чтобы его сделать, надо потратить сотни и тысячи часов работы нейросети и потом еще сотни часов правок. Но опять же — не для Васи задача.
  7. Marvel’s Midnight Suns

    Вторая часть марлезонского балета Gemini. Заставляем Gimini писать скрипт для автоматизированного перевода через нее же. В целом, эта часть весьма проста. Берем подряд каждый чанк с исходными переводами PL DE FR ES, отправляем в нейросеть, получаем перевод, сохраняем. Вот так это выглядит в процессе работы: Основной промт хранится в отдельном файле, и может быть в принципе каким угодно. Пока я взял за основу польский текст, а остальные языки использую для коррекции при необходимости, однако никто не мешает изменить этот промт как угодно, гибкость AI позволяет это делать. Можно добавить в запрос драфт русского перевода, можно делать перевод с нуля, можно удалять тэги шрифта <itallic> или что-то еще. Перевод… Все равно не идеален. Однако взяв за основу польский, который славянский, мы можем максимально избежать проблемы родов/склонений/падежей, а остальные языки помогут найти смысл там, где и польского мало. В общем, тут надо экспериментировать. Дьявол как всегда в деталях. Деталь первая — пробелы и переходы на новую строку. Нейросети рассматривают эти символы как ненужные и несмотря на то, что в промте есть явные указания сохранять начальные/конечные пробелы, это не работает. Приходится скриптом анализировать какой-то исходный язык (в моем примере польский — Фильтр/коррекция для языка: Polish) и на основе его восстанавливать так называемую “кайму”, как метко назвала нейросеть эту функцию. Но это мелочи, простейший функционал так сказать. Тэги. Вот тут основная проблема. Есть 3 видов, уже говорил в предыдущем сообщении статистику: Ключей с тегами <...>: 1929 Ключей с тегами {...}: 1400 Ключей с конструкцией '|plural(': 45 Поехали подробнее. Теги <> нужны для работы со шрифтом — выделение текста и так далее. Пример: Как видно из примера, можно вообще в теории забивать на эти тэги и удалять их из исходного текста. Ну будет внешний вид чуть более однообразный, вот для французов и испанцев в примере как то не помешало. Сейчас текст передается как есть, вместе с тэгами, и это приводит к ошибкам, когда нейросеть их портит или выделяет не то. В общем, если оставлять тэги, то тут потом ручками придется проверять и править 2000 строк. Впрочем, можно написать спецскрипт, который будет более корректно работать с этими тэгами (1. Убрать тэги, 2. Перевести чистый текст 3. Проанализировать исходный текст 4. При возможности восстановить тэги на переводе). Это уже нюансы, пока я ничего с тэгами не делаю, предлагаю нейросети самой с ними разбираться. Тэги {} — переменные игры. Пример: Zasada wypowiedziana przez {SpeakerTag} ze statusem Developera {DevStatus}) Они при переводе должны каким-то образом учитываться, но из менять никоим образом нельзя. Сейчас опять же, мы оставляем это на контроль самой нейросети, однако она иногда все-таки будет лажать. Необходим ручной контроль и постредактура при необходимости всех 1400 чанков с этой структурой. Для контроля тэгов используется механизм проверки тэгов. Извлекаются тэги <> из исходного основного текста (напомню, я взял за основу польский, однако можно и другой), извлекаются тэги из перевода, сравниваются. Если тэги разные — значит модель что-то там напутала, такой перевод помечается как “проблема с тэгом <>” для последующей ВНИМАТЕЛЬНОЙ редактуры и анализа. Аналогично контроль сделан для {}. Есть еще структура множественных чисел |plural(ХХХ дней/Хдня) — но таких вхождений мало, всего 45. Можно их просто взять из русского перевода, там эти структуры убраны и заменены другим словами, где нет вариаций. Выводы. Инструменты уже готовы. Осталось сделать работу. Как я сказал постом выше — либо несколько месяцев бесплатно, либо 20 долларов и выше — в зависимости от выбранной модели и кучи сопутствующих нюансов. Кроме того, постредактура и обработка в любом случае нужна. В общем — если есть энтузиасты, могу все дать, занимайтесь. Сам я скорее всего делать ничего не буду, так как мне английского хватает, да и не хочу тратить столько времени. Засим откланиваюсь, с уважением и проч и проч.
  8. Marvel’s Midnight Suns

    Gemini говорите… Ну что ж, вот почитайте что я вчера за пару часов сделал: 1. Выделил основные языки, с которыми нужно работать. PL DE FR ES. Остальные не нужны — только ухудшат контекст. 2. Заставил гемини написать скрипт для обработки всех локалей в единый файл, туда же засунул последнюю версию перевода. По пути слегка нормализуя текст (в польской версии использовались нестандартные кавычки, впрочем, всегда можно пересобрать с любыми другими правками/изменениями). Пример записей: Попутно собрал некоторую статистику: Вот что говорит последняя модель gemini 2.5 flash про свои возможности перевода: осталось написать скрипт для перевода, казалось бы. Про особенности скрипта для перевода я напишу чуть позже, а тут скажу про другой, не очень очевидный нюанс: если пользоваться бесплатным лимитированным тарифом gemini, то перевод 100 000 вхождений займет около 3 месяцев. Если платным, то несколько дней с ценой 15-20 долларов ориентировочно (а может и больше, тут дело такое…). А потом потребуется еще серьезная правка после перевода, без этого никуда. В общем, выводы делайте сами, кому интересно могу скриптики/файлики выложить, а пока переходим ко второй части — переводу. Кстати, нейросеть настаивает что Охотник должен быть Хантер, что не надо его переводить дословно, и остальные языки нам это подтверждают. Это имя а не профессия. Не буду приводить се доводы, просто информация к сведению.
Zone of Games © 2003–2025 | Реклама на сайте.

×