Перейти к содержимому
Zone of Games Forum
SerGEAnt

Starfield

Утилита для изменений перевода планеты Cydonia

Решение проблемы с квадратами

На Mac и Steam Deck перевод можно поставить только вручную, скачав архив с бусти.

banner_pr_starfield.jpg

Сообщение добавлено пользователем SerGEAnt

Рекомендованные сообщения

@Haoose Можно сделать в данном случае довольно простой механизьм проверки:
1 Регуляркой выбираем все теги.
2 Заменяем теги на предсказуемые токены для перевода.
3 Переводим.
4 Заменяем предсказуемые токены обратно на теги
5 Проверяем наличие (и порядок для игр в которых это важно) всех тегов. в случае несоответствия помечаем или кладем в файл #TODO Ручками проверить.

 

В таком случае мы будем уверены что игра и квесты не сломаются.

Изменено пользователем gl237man
  • +1 1

Поделиться сообщением


Ссылка на сообщение
18 минут назад, Haoose сказал:

@RUIZ007 Ну вот. DeepL не перевел текст в теге, но и не сломал его. Yandex перевел служебное слово, что поломает игру в этом месте. А SeamlessM4T вовсе выкинул тег.
Вывод — все равно после нейронок текст надо будет еще очень долго править… Даже если
Sergio предусмотрел эти моменты — все равно где-нибудь что-то вылезет, т.к. объем текста монструозный )

Шрифты есть. И позже должны появиться получше. Так что голову ими можешь не забивать )

Нейросети не готовы переводить тексты крупных игр, сохраняя высокое качество.

При переводе длинных сложных предложений вероятность ошибки растёт из-за когнитивной нагрузки. Нейросеть может начать фантазировать и вставлять в текст свои домыслы вместо дословного перевода. А после 10-20% от общего объёма текста качество перевода начинает резко падать из-за кумулятивного эффекта ошибок.

Ограниченные вычислительные возможности тоже влияют. При переводе предложения нейросеть работает с небольшим фрагментом, опираясь на несколько последних токенов для контекста. Но это далеко не то же самое, что видеть весь текст целиком. Важные детали, упомянутые на начальных страницах, могут быть утеряны к моменту перевода окончания. Кроме того, структура документа и взаимосвязь разных его частей тоже трудно улавливается автоматически. А ведь именно глобальное понимание всего текста нужно переводчику для качественной работы.

Еще есть сложности с билингвальным режимом. Нейросеть в какой-то степени смешивает грамматические правила двух языков. В результате при генерации предложений на одном языке в его структуре могут проскальзывать элементы другого языка. Так на русском языке у нейросети могут появляться конструкции, более свойственные, например, английскому синтаксису. Если в монолингвальном режиме генерируемые текст звучат естественно для носителя этого языка и могут не выглядеть машинно, то в билингвальном режиме начинает казаться, что тебе пишет какой-то британский шпион.

  • Хаха (+1) 2

Поделиться сообщением


Ссылка на сообщение
10 минут назад, 0wn3df1x сказал:

Нейросети не готовы переводить тексты крупных игр, сохраняя высокое качество.

При переводе длинных сложных предложений вероятность ошибки растёт из-за когнитивной нагрузки. Нейросеть может начать фантазировать и вставлять в текст свои домыслы вместо дословного перевода. А после 10-20% от общего объёма текста качество перевода начинает резко падать из-за кумулятивного эффекта ошибок.

Ограниченные вычислительные возможности тоже влияют. При переводе предложения нейросеть работает с небольшим фрагментом, опираясь на несколько последних токенов для контекста. Но это далеко не то же самое, что видеть весь текст целиком. Важные детали, упомянутые на начальных страницах, могут быть утеряны к моменту перевода окончания. Кроме того, структура документа и взаимосвязь разных его частей тоже трудно улавливается автоматически. А ведь именно глобальное понимание всего текста нужно переводчику для качественной работы.

Еще есть сложности с билингвальным режимом. Нейросеть в какой-то степени смешивает грамматические правила двух языков. В результате при генерации предложений на одном языке в его структуре могут проскальзывать элементы другого языка. Так на русском языке у нейросети могут появляться конструкции, более свойственные, например, английскому синтаксису. Если в монолингвальном режиме генерируемые текст звучат естественно для носителя этого языка и могут не выглядеть машинно, то в билингвальном режиме начинает казаться, что тебе пишет какой-то британский шпион.

Я перевел довольно много научной литературы deepL. Это весьма объемные книги, часто написанные довольно сложным языком. Для этого я не использовал ничего, кроме премиума нейросетки, которой просто скармливал книгу. В итоге падения качества перевода не замечал. Может быть в художественной литературе все сложнее. Но почему бы тогда не переводить по частям? 

Поделиться сообщением


Ссылка на сообщение

Мне интересно другое. Каков уровень английского языка в игре? Простой или сложный? Думаю играть на английском, но не понятно потяну ли с моим неопределенным уровнем B1-2 )

Поделиться сообщением


Ссылка на сообщение
32 минуты назад, TanatosX сказал:

Мне интересно другое. Каков уровень английского языка в игре? Простой или сложный? Думаю играть на английском, но не понятно потяну ли с моим неопределенным уровнем B1-2 )

Запустишь завтра и узнаешь :dirol:

Поделиться сообщением


Ссылка на сообщение
34 минуты назад, 0wn3df1x сказал:

Нейросети не готовы переводить тексты крупных игр, сохраняя высокое качество.

При переводе длинных сложных предложений вероятность ошибки растёт из-за когнитивной нагрузки. Нейросеть может начать фантазировать и вставлять в текст свои домыслы вместо дословного перевода. А после 10-20% от общего объёма текста качество перевода начинает резко падать из-за кумулятивного эффекта ошибок.

Ограниченные вычислительные возможности тоже влияют. При переводе предложения нейросеть работает с небольшим фрагментом, опираясь на несколько последних токенов для контекста. Но это далеко не то же самое, что видеть весь текст целиком. Важные детали, упомянутые на начальных страницах, могут быть утеряны к моменту перевода окончания. Кроме того, структура документа и взаимосвязь разных его частей тоже трудно улавливается автоматически. А ведь именно глобальное понимание всего текста нужно переводчику для качественной работы.

Вопрос API и разных надстроек. Можно периодически чистить контекст, и инжектить в отсылаемый текст дополнительную информацию о предмете перевода, стилистике и различные установки для самой нейронки. Не обязательно держать в памяти всю информацию, можно же отсылать ее по мере надобности.

Т.е. при переводе текста, содержащего имя персонажа/организации/место действия, можно автоматически добавлять контекст. Ну, например, в тексте реплика от “Дяди Билли”. Дополнительным слоем нейронке отсылается, что этот Билли - мужчина лет 50, говорит на хиллбилли-сленге, агрессивный и постоянно пьяный, и дается указание использовать эти данные при переводе, сохраняя стилистику и манеру речи персонажа. Если нейронка достаточно умна — она это сможет учесть, и писать соответственно.

Тут проблема в техническом плане, как чистый текст из игры под такой формат развести, и этот условный “лорбук” написать. Учитывая объемы и формат текста — работка не из легких.

GPT, кстати, довольно стремно работает с русским языком. Из известных мне “больших” сеток Claude в русском просто не имеет конкурентов. Точность перевода может несколько пострадать, но под соответствующей накачкой системным промптом можно получать очень “живой” русский текст. Доступ к API только добыть — проблема, особенно из РУ-региона.

Поделиться сообщением


Ссылка на сообщение

@0wn3df1x всё не совсем так по моему опыту. Во-первых, нейронка контекст улавливает максимум в пределах абзаца, а скорее - только в пределах предложения. Качество перевода незначительно отличается на огромных кусках текста от кусков поменьше. Основа там же - алгоритм сравнения прямого значения и статистического применения оборотов. Грамматические правила изредка смешивает Яндекс в минимальной степени - но зато он максимально точен. DeepL же знает конструкции русского.

Он не переведёт "Джон своими глазами посмотрел на свою руку и вытянул свою руку перед собой", нейронка знает, что обилие притяжательных характерно для английского, но не для русского. Так же знает множество устойчивых выражений, часть сленга и т д. DeepL вообще очень изящен в переводе на русский.

Главный элемент, от которого зависит качество перевода - это стиль. Чем правильнее, выхолощеннее стиль - тем лучше будет перевод. И даже с огромными сложными предложениями она справляется легко. Но если там авторский стиль, необычное строение предложений, много односложных фраз и сленга - вот тогда качество стремительно падает. Сильно "авторские" произведения очень сложно переводить нейронкой.

А ошибается она часто на сверхкоротких конструкциях - не хватает контекста для верного толкования значений.

И кстати, DeepL очень плохо переводит отдельные предложения, всё же там есть контекст на уровне абзаца, видимо.

Я через него и яндекс прилично художки прогнал, большой опыт).

И замечу, что правильный и несложный английский текст они переводят просто великолепно, почти как человек.

Изменено пользователем RUIZ007

Поделиться сообщением


Ссылка на сообщение
1 час назад, Vollmond-inex сказал:

Я перевел довольно много научной литературы deepL. 

Сочувствую. :laugh: Я бы там даже инструкцию от пылесоса переводить не стал.

25 минут назад, Azazellz сказал:

GPT, кстати, довольно стремно работает с русским языком. Из известных мне “больших” сеток Claude в русском просто не имеет конкурентов. Точность перевода может несколько пострадать, но под соответствующей накачкой системным промптом можно получать очень “живой” русский текст. Доступ к API только добыть — проблема, особенно из РУ-региона.

И на постоянке ловить As an AI language model, I am unable to engage with content that may violate my usage guidelines. To learn more, visit… от каждого чиха. Но клод (хоть обычный, хоть продвинутый) не особо лучше chatGPT по качеству. Более того, клод (как более “творческий”) страдает от излишка фантазии и желания всё переиначивать. Я как-то ради эксперимента загонял зоологические тексты на английском. Дай, думаю, гляну, как он их переведёт в энциклопедическом стиле. Так этот клод буквально на ходу превращал одни виды насекомых в другие, дело доходило до выдумывания новых таксонов.

Короче, я всегда считал и продолжаю считать, что все эти машинные штуки — зло.
Нет ничего хуже Cat-инструментов.
И нет ничего совершенней человека.

Изменено пользователем 0wn3df1x
  • Лайк (+1) 1

Поделиться сообщением


Ссылка на сообщение
9 минут назад, 0wn3df1x сказал:

Сочувствую. :laugh: Я бы там даже инструкцию от пылесоса переводить не стал.

28 минут назад, Azazellz сказал:

Вы наверное программист, да? Я обычно от программистов слышу какой-то гиперскептицизм в отношении нейросетей в принципе.  

Изменено пользователем Vollmond-inex

Поделиться сообщением


Ссылка на сообщение
5 минут назад, Vollmond-inex сказал:

Вы наверное программист, да? Я обычно от программистов слышу какой-то гиперскепетицизм в отношении нейросетей в принципе.  

В том числе. Я каждый раз, когда кто-то заводит разговор о том, что “нейросети уже лучше людей” и “нейросети уже готовы нас заменить” вспоминаю:

image.png

image.png

То, что нейросети творят с кодом — это вообще отдельная смехопанорама. Мне особенно нравятся, когда они начинают выдумывать воображаемые модули Питона и пытаться натянуть на них другие модули.

Помню, как GPT4 выдумал Api SteamDB и присобачил к ней Api Steam:

image.png

Изменено пользователем 0wn3df1x
  • Лайк (+1) 1
  • Хаха (+1) 1

Поделиться сообщением


Ссылка на сообщение

@Vollmond-inex   Причём тут программист, обычная профессиональная деформация.  Если я правильно уловил, человек больше 5 лет занимается локализацией всякого. 

@0wn3df1x А насчёт перевода нейронками, согласен не будет так хорошо как ручной перевод со всеми синтаксическими и лексическими оборотами.  Но если мало мальски понимаешь английский , хотя бы на базовом уровне то по сути нормально :)

Поделиться сообщением


Ссылка на сообщение
29 минут назад, 0wn3df1x сказал:

И на постоянке ловить As an AI language model, I am unable to engage with content that may violate my usage guidelines. To learn more, visit… от каждого чиха.

Это вопрос правильного джейлбрейка. И GPT, и Claude вполне могут работать с практически любыми “взрослыми” темами под нужной накачкой. Если прям совсем в жесть не упарываться, конечно. Claude очень прикольно умеет на русском материться, например =)

29 минут назад, 0wn3df1x сказал:

Более того, клод (как более “творческий”) страдает от излишка фантазии и желания всё переиначивать. Я как-то ради эксперимента загонял зоологические тексты на английском. Дай, думаю, гляну, как он их переведёт в энциклопедическом стиле. Так этот клод буквально на ходу превращал одни виды насекомых в другие, дело доходило до выдумывания новых таксонов.

Тут, скорее, вопрос нехватки исходных данных и знания предмета виноват, чем излишнее “творческое” начало нейронки. Я давно заметил, что если данных о предмете не хватает, то любая нейронка стремится дыру заполнить своими фантазиями.

Гугл бы ему подключить, или википедию хотя бы. Чтоб оттуда можно было данные тянуть. Стало бы значительно лучше.

16 минут назад, 0wn3df1x сказал:

В том числе. Я каждый раз, когда кто-то заводит разговор о том, что “нейросети уже лучше людей” и “нейросети уже готовы нас заменить” вспоминаю:

Со счетом у них проблемы, это да. И с математикой. Неудивительно, вообщем-то, учитывая как они работают.

Изменено пользователем Azazellz

Поделиться сообщением


Ссылка на сообщение

@0wn3df1x  Ну вообще особенность чатгпт именно в том, что он плохо умеет считать, потому что он не для этого сделан. 

Чатгпт это прежде всего способ прямого общения с компьютером. Вот если переводить старфилд обычным переводчиком, то надо написать миллион программ, одна будет вытаскивать текст, вторая будет автоматически делить его и скармливать нейросети, другая подменять рабочие теги. А в случае с чатгпт гипотетически (если бы не ограничения) можно было сделать так:

“Вот тебе файл локализации. Это текстовая локализация для научно-фантастической игры про космос и космические путешествия, в ней так же рассматриваются и религиозные темы. Переведи его на русский с учетом этого контекста. Теги не переводи, но их содержимое переведи. Постарайся по возможности переводить так, чтобы длинна строк была идентична оригиналу, если это не ухудшает качество перевода. И заодно напиши пожалуйста скрипт который будет включать и выключать перевод по команде.”

И всё. Любой человек мог бы сам сделать перевод старфилда, требования к знаниям it — знать хотя бы примерно что такое chatgpt. 

Поделиться сообщением


Ссылка на сообщение
13 минут назад, Azazellz сказал:

Это вопрос правильного джейлбрейка. И GPT, и Claude вполне могут работать с практически любыми “взрослыми” темами под нужной накачкой. Если прям совсем в жесть не упарываться, конечно. Claude очень прикольно умеет на русском материться, например =)

Если не касаться переводов, рекомендую использовать незацензуренные локальные модели, им джейлбрейк не нужен и выдавать они могут почти любую жесть, рекомендую 70B версии Airoboros и StableBeluga.

Поделиться сообщением


Ссылка на сообщение

@0wn3df1x вы теплое с мягким смешиваете. Есть модели такие, как ChatGPT,  а есть DeepL - там вроде как тоже в основе трансформер, но она заточена конкретно под перевод. Ни разу на многих сотнях страниц не видел никакой отсебятины у него, он не "галлюционирует". А ChatGPT придумывает на ходу что угодно, это фантазер 80го левела).

Но в целом мысль понятна - надо собирать 20 лямов, а лучше 30, иначе перевода нам не видать. Ну и времени 7 лет, да.

  • В замешательстве (0) 1

Поделиться сообщением


Ссылка на сообщение

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

  • Похожие публикации

    • Автор: SerGEAnt
      Sophie: Starlight Whispers

      Метки: Приключение, Исследования, Проработанная вселенная, Вид сбоку, Фэнтези Платформы: PC Разработчик: Youth Gaming Издатель: Youth Gaming Дата выхода: 10 марта 2026 года Отзывы Steam: 20 отзывов, 95% положительных
    • Автор: katz_eis
      The Excavation of Hob’s Barrow

      Метки: Point & Click, Приключение, Хоррор, Пиксельная графика, Протагонистка Платформы: PC SW MAC LIN Разработчик: Cloak and Dagger Games Издатель: Wadjet Eye Games Серия: Cloak and Dagger Games Дата выхода: 28 сентября 2022 года РУСИФИКАТОР.

  • Сейчас популярно

  • Продвигаемые темы

  • Последние сообщения

    • Игра говно, владельцам Интелам повезло, 5070ti и 5080 предтоп, 5070 средне, ниже затычка.точка.
    • @piton4  Появилась пока неподтвержденная инфа что сони больше не хотят выпускать свои экзы на пк в том числе по причине нежелания отдавать долю с продаж и что они разрабатывают для пк свой собственный лаунчер, так что есть вероятность что ты все же сможешь поиграть на пк в свои любимые сонивские экзы,) Хотя  Шраер ответил на такие слухи, что типа нет сони хотят полностью уйти с пк, так что сильно не радуйся пока, как говорится бабка надвое сказала.)
    • Нет. Предтопом считается только модель идущая перед топовой картой.  Обычную, Ti и Super — можно их все назвать предтопами, так как модель по сути одна.  В данном же случае, 5070ti можно назвать с натяжной предтопом , так как разница в производительности очень небольшая.  5070 уже не “предтоп”.   По факту, предтопом может быть только одна модель. Правила по сути то нету, но таков мой взгляд на этот вопрос, и я считаю его правильным.
    • Всем привет, подскажите, в каком ассете искать текст игры? Посмотрел в resources.assets, там 20 txt ассетов но текст от туда для настроек и онлайна, текста самой игры нету. Могу вытащить текст, перевести, создать шрифт и импортировать переведенный текст и шрифт (в юнити можно собрать тестовый билд с русским языком, просто пустой проект на шаблоне 3д где  будет просто сцена с русским текстом и из него уже вытащить материал и текстуру нужного текста, потом останется это импортировать в нужный ассет в игре через UABEA чтобы не было непонятных  символов и готово ) 
    • Нет, не правильно. Смотреть надо на градацию по производительности и если несколько карт находятся примерно в одной зоне в отрыве от топа, то они все считаются предтопом. Просто раньше было более чёткое разделение, а сейчас напридумывали всяки Ti, Super и  прочие маркетинговые уловки.
    • Делаю русик для Ride 5 (перевод с французского). В файлах игры есть частичная русская текстовая локализация — частично переношу её, остальное доперевожу. В игре есть озвученные ролики на движке, на всех языках кроме русского. Субтитров под ролики не предусмотрено. Я конечно заменил французский лепет на английский, но это конечно такое себе, и хотелось бы чтоб было всё по красоте, да с русской речью. В связи с этим вопрос\просьба: Может кто из подкованных в озвучке нейронкой подсобит? 37 файлов по 5-40 сек. Один голос. Естественно “за спасибо”. Если это как то упростит работу, я сгенерил файлы с озвучкой, но опять же — не в курсе, должны ли файлы быть одной длинны с оригиналом — у меня вышла разница +/- 1 секунда. В архив закинул французскую озвучку (заменять нужно её), английскую (на всякий случай), соответственно все метаданные, расшифровку английской озвучки (где-то редактировано, где-то нет), сгенерированные мной файлы в формате .acc и оригинальные в .wav (английская озвучка). https://drive.google.com/file/d/1N3TE4TMGeFgdrte4LGm0N20xqn4TcFts/view?usp=sharing
    • Хм… Тогда, возможно, что Интел сами занесли разрабам, чтобы игра не запускалась на их картах.  Забота о покупателях своей продукции.  Красавчики!
    • Тут нечто большее, чем просто дерьмо: это красивый свадебный торт размером с пятиэтажку, но внутри он наполову пустой, а наполову заполнен говном. Получается, владельцев Интел Арк скорее пытались защитить, чем обделить 
  • Изменения статусов

    • Jimmi Hopkins  »  SerGEAnt

      Это не просто перевод, а полноценная авторская сценарная адаптация. Диалоги переписаны так, чтобы персонажи звучали живо, остро и в характере. Добавлен чёрный юмор там, где авторы постеснялись. Убраны лорные противоречия, докручены мотивации. В результате игра стала умнее, злее и смешнее оригинала.
      · 0 ответов
    • ElikaStudio

      Долгожданный релиз полного сезона состоялся!
      https://youtu.be/mwBk2stm2OQ?si=qpJojB_XDABaC0We
      https://vk.com/video-48153754_456239394?sh=4&list=c62797c2b7d0725d6e
      Life is Strange: Before the Storm:
      Эпизод 1: "Прoбуждeниe"
      Эпизод 2: "О дивный новый мир"
      Эпизод 3: "Ад пуст"
      Бонусный эпизод: "Прощание"
      Русская озвучка уже доступна для скачивания!
      ElikaStudio выражает огромную благодарность всем, кто принял участие в создании проекта! 
      Группе Mechanics VoiceOver R.G. MVO , в частности их руководителю Дмитрию за неоценимую помощь в выпуске эпизода.
      Скачать для PC Classic (2018):
      GDrive: - https://drive.google.com/file/d/19CL_L80Mz0sIxcb54Ss64byAkeZmV22r/view?usp=sharing
      Скачать для PC Remastered (2022):
      GDrive: - https://drive.google.com/file/d/13q58Lpvw5_aYPYeZ7OGYZlAKOoS1gEbL/view?usp=sharing
      Скачать для Свитч(2022):
      GDrive: - https://drive.google.com/file/d/15e—T1LQiGQCYIHeNnj_C2qJA16Gvh1i/view?usp=sharing
      Ручная установка PC(оба издания):
      https://drive.google.com/drive/folders/1MJPd8965m4XxxAuOBt8enSHtv8_yy5xh?usp=sharing
      Баг репорт в обсуждении:
      https://vk.com/topic-48153754_55571577
      ___________________________________________
      Финансовый аппарат:
      www.donationalerts.com/r/elikastudio
      Пожертвовать средства на наши проекты:
      Кошелек ЮMoney 4100 1188 6818 3009
      карта Сбер банк 2202 2018 6334 1042
      карта Альфа банк 5559 4937 0209 8584
      Спасибо за вашу поддержку!
      #elikastudio #русскаяозвучка
      · 0 ответов
    • fox222  »  Siberian GRemlin

      Здравствуйте, хочу купить персональный доступ к переводам, сколько стоит?
      · 1 ответ
    • vitkach  »  eaZy

      Извините за беспокойство. Хотел спросить, а русификатор ещё когда-нибудь будет обновляться? Дело в том, что после его выхода выходили ещё обновления, в частности обновление 1.1, вышедшее летом 2023 года, где была добавлена целая сюжетная глава в конце если проходишь на лучшую концовку золотого пути, это где-то ещё полчаса диалогов. Также в игре присутсвуют иногда кракозябры вместо русского языка, это в основном связано с тем, что кое-где текст был изменён, в основном в обучающих сообщениях.
      · 0 ответов
    • TerryBogard  »  Siberian GRemlin

      C&C: RA: Retaliation (ПК) не работает.
      · 0 ответов
  • Лучшие авторы


Zone of Games © 2003–2026 | Реклама на сайте.

×