Перейти к содержимому
Zone of Games Forum
SerGEAnt

Starfield

Утилита для изменений перевода планеты Cydonia

Решение проблемы с квадратами

На Mac и Steam Deck перевод можно поставить только вручную, скачав архив с бусти.

banner_pr_starfield.jpg

Сообщение добавлено пользователем SerGEAnt

Рекомендованные сообщения

@Haoose Можно сделать в данном случае довольно простой механизьм проверки:
1 Регуляркой выбираем все теги.
2 Заменяем теги на предсказуемые токены для перевода.
3 Переводим.
4 Заменяем предсказуемые токены обратно на теги
5 Проверяем наличие (и порядок для игр в которых это важно) всех тегов. в случае несоответствия помечаем или кладем в файл #TODO Ручками проверить.

 

В таком случае мы будем уверены что игра и квесты не сломаются.

Изменено пользователем gl237man
  • +1 1

Поделиться сообщением


Ссылка на сообщение
18 минут назад, Haoose сказал:

@RUIZ007 Ну вот. DeepL не перевел текст в теге, но и не сломал его. Yandex перевел служебное слово, что поломает игру в этом месте. А SeamlessM4T вовсе выкинул тег.
Вывод — все равно после нейронок текст надо будет еще очень долго править… Даже если
Sergio предусмотрел эти моменты — все равно где-нибудь что-то вылезет, т.к. объем текста монструозный )

Шрифты есть. И позже должны появиться получше. Так что голову ими можешь не забивать )

Нейросети не готовы переводить тексты крупных игр, сохраняя высокое качество.

При переводе длинных сложных предложений вероятность ошибки растёт из-за когнитивной нагрузки. Нейросеть может начать фантазировать и вставлять в текст свои домыслы вместо дословного перевода. А после 10-20% от общего объёма текста качество перевода начинает резко падать из-за кумулятивного эффекта ошибок.

Ограниченные вычислительные возможности тоже влияют. При переводе предложения нейросеть работает с небольшим фрагментом, опираясь на несколько последних токенов для контекста. Но это далеко не то же самое, что видеть весь текст целиком. Важные детали, упомянутые на начальных страницах, могут быть утеряны к моменту перевода окончания. Кроме того, структура документа и взаимосвязь разных его частей тоже трудно улавливается автоматически. А ведь именно глобальное понимание всего текста нужно переводчику для качественной работы.

Еще есть сложности с билингвальным режимом. Нейросеть в какой-то степени смешивает грамматические правила двух языков. В результате при генерации предложений на одном языке в его структуре могут проскальзывать элементы другого языка. Так на русском языке у нейросети могут появляться конструкции, более свойственные, например, английскому синтаксису. Если в монолингвальном режиме генерируемые текст звучат естественно для носителя этого языка и могут не выглядеть машинно, то в билингвальном режиме начинает казаться, что тебе пишет какой-то британский шпион.

  • Хаха (+1) 2

Поделиться сообщением


Ссылка на сообщение
10 минут назад, 0wn3df1x сказал:

Нейросети не готовы переводить тексты крупных игр, сохраняя высокое качество.

При переводе длинных сложных предложений вероятность ошибки растёт из-за когнитивной нагрузки. Нейросеть может начать фантазировать и вставлять в текст свои домыслы вместо дословного перевода. А после 10-20% от общего объёма текста качество перевода начинает резко падать из-за кумулятивного эффекта ошибок.

Ограниченные вычислительные возможности тоже влияют. При переводе предложения нейросеть работает с небольшим фрагментом, опираясь на несколько последних токенов для контекста. Но это далеко не то же самое, что видеть весь текст целиком. Важные детали, упомянутые на начальных страницах, могут быть утеряны к моменту перевода окончания. Кроме того, структура документа и взаимосвязь разных его частей тоже трудно улавливается автоматически. А ведь именно глобальное понимание всего текста нужно переводчику для качественной работы.

Еще есть сложности с билингвальным режимом. Нейросеть в какой-то степени смешивает грамматические правила двух языков. В результате при генерации предложений на одном языке в его структуре могут проскальзывать элементы другого языка. Так на русском языке у нейросети могут появляться конструкции, более свойственные, например, английскому синтаксису. Если в монолингвальном режиме генерируемые текст звучат естественно для носителя этого языка и могут не выглядеть машинно, то в билингвальном режиме начинает казаться, что тебе пишет какой-то британский шпион.

Я перевел довольно много научной литературы deepL. Это весьма объемные книги, часто написанные довольно сложным языком. Для этого я не использовал ничего, кроме премиума нейросетки, которой просто скармливал книгу. В итоге падения качества перевода не замечал. Может быть в художественной литературе все сложнее. Но почему бы тогда не переводить по частям? 

Поделиться сообщением


Ссылка на сообщение

Мне интересно другое. Каков уровень английского языка в игре? Простой или сложный? Думаю играть на английском, но не понятно потяну ли с моим неопределенным уровнем B1-2 )

Поделиться сообщением


Ссылка на сообщение
32 минуты назад, TanatosX сказал:

Мне интересно другое. Каков уровень английского языка в игре? Простой или сложный? Думаю играть на английском, но не понятно потяну ли с моим неопределенным уровнем B1-2 )

Запустишь завтра и узнаешь :dirol:

Поделиться сообщением


Ссылка на сообщение
34 минуты назад, 0wn3df1x сказал:

Нейросети не готовы переводить тексты крупных игр, сохраняя высокое качество.

При переводе длинных сложных предложений вероятность ошибки растёт из-за когнитивной нагрузки. Нейросеть может начать фантазировать и вставлять в текст свои домыслы вместо дословного перевода. А после 10-20% от общего объёма текста качество перевода начинает резко падать из-за кумулятивного эффекта ошибок.

Ограниченные вычислительные возможности тоже влияют. При переводе предложения нейросеть работает с небольшим фрагментом, опираясь на несколько последних токенов для контекста. Но это далеко не то же самое, что видеть весь текст целиком. Важные детали, упомянутые на начальных страницах, могут быть утеряны к моменту перевода окончания. Кроме того, структура документа и взаимосвязь разных его частей тоже трудно улавливается автоматически. А ведь именно глобальное понимание всего текста нужно переводчику для качественной работы.

Вопрос API и разных надстроек. Можно периодически чистить контекст, и инжектить в отсылаемый текст дополнительную информацию о предмете перевода, стилистике и различные установки для самой нейронки. Не обязательно держать в памяти всю информацию, можно же отсылать ее по мере надобности.

Т.е. при переводе текста, содержащего имя персонажа/организации/место действия, можно автоматически добавлять контекст. Ну, например, в тексте реплика от “Дяди Билли”. Дополнительным слоем нейронке отсылается, что этот Билли - мужчина лет 50, говорит на хиллбилли-сленге, агрессивный и постоянно пьяный, и дается указание использовать эти данные при переводе, сохраняя стилистику и манеру речи персонажа. Если нейронка достаточно умна — она это сможет учесть, и писать соответственно.

Тут проблема в техническом плане, как чистый текст из игры под такой формат развести, и этот условный “лорбук” написать. Учитывая объемы и формат текста — работка не из легких.

GPT, кстати, довольно стремно работает с русским языком. Из известных мне “больших” сеток Claude в русском просто не имеет конкурентов. Точность перевода может несколько пострадать, но под соответствующей накачкой системным промптом можно получать очень “живой” русский текст. Доступ к API только добыть — проблема, особенно из РУ-региона.

Поделиться сообщением


Ссылка на сообщение

@0wn3df1x всё не совсем так по моему опыту. Во-первых, нейронка контекст улавливает максимум в пределах абзаца, а скорее - только в пределах предложения. Качество перевода незначительно отличается на огромных кусках текста от кусков поменьше. Основа там же - алгоритм сравнения прямого значения и статистического применения оборотов. Грамматические правила изредка смешивает Яндекс в минимальной степени - но зато он максимально точен. DeepL же знает конструкции русского.

Он не переведёт "Джон своими глазами посмотрел на свою руку и вытянул свою руку перед собой", нейронка знает, что обилие притяжательных характерно для английского, но не для русского. Так же знает множество устойчивых выражений, часть сленга и т д. DeepL вообще очень изящен в переводе на русский.

Главный элемент, от которого зависит качество перевода - это стиль. Чем правильнее, выхолощеннее стиль - тем лучше будет перевод. И даже с огромными сложными предложениями она справляется легко. Но если там авторский стиль, необычное строение предложений, много односложных фраз и сленга - вот тогда качество стремительно падает. Сильно "авторские" произведения очень сложно переводить нейронкой.

А ошибается она часто на сверхкоротких конструкциях - не хватает контекста для верного толкования значений.

И кстати, DeepL очень плохо переводит отдельные предложения, всё же там есть контекст на уровне абзаца, видимо.

Я через него и яндекс прилично художки прогнал, большой опыт).

И замечу, что правильный и несложный английский текст они переводят просто великолепно, почти как человек.

Изменено пользователем RUIZ007

Поделиться сообщением


Ссылка на сообщение
1 час назад, Vollmond-inex сказал:

Я перевел довольно много научной литературы deepL. 

Сочувствую. :laugh: Я бы там даже инструкцию от пылесоса переводить не стал.

25 минут назад, Azazellz сказал:

GPT, кстати, довольно стремно работает с русским языком. Из известных мне “больших” сеток Claude в русском просто не имеет конкурентов. Точность перевода может несколько пострадать, но под соответствующей накачкой системным промптом можно получать очень “живой” русский текст. Доступ к API только добыть — проблема, особенно из РУ-региона.

И на постоянке ловить As an AI language model, I am unable to engage with content that may violate my usage guidelines. To learn more, visit… от каждого чиха. Но клод (хоть обычный, хоть продвинутый) не особо лучше chatGPT по качеству. Более того, клод (как более “творческий”) страдает от излишка фантазии и желания всё переиначивать. Я как-то ради эксперимента загонял зоологические тексты на английском. Дай, думаю, гляну, как он их переведёт в энциклопедическом стиле. Так этот клод буквально на ходу превращал одни виды насекомых в другие, дело доходило до выдумывания новых таксонов.

Короче, я всегда считал и продолжаю считать, что все эти машинные штуки — зло.
Нет ничего хуже Cat-инструментов.
И нет ничего совершенней человека.

Изменено пользователем 0wn3df1x
  • Лайк (+1) 1

Поделиться сообщением


Ссылка на сообщение
9 минут назад, 0wn3df1x сказал:

Сочувствую. :laugh: Я бы там даже инструкцию от пылесоса переводить не стал.

28 минут назад, Azazellz сказал:

Вы наверное программист, да? Я обычно от программистов слышу какой-то гиперскептицизм в отношении нейросетей в принципе.  

Изменено пользователем Vollmond-inex

Поделиться сообщением


Ссылка на сообщение
5 минут назад, Vollmond-inex сказал:

Вы наверное программист, да? Я обычно от программистов слышу какой-то гиперскепетицизм в отношении нейросетей в принципе.  

В том числе. Я каждый раз, когда кто-то заводит разговор о том, что “нейросети уже лучше людей” и “нейросети уже готовы нас заменить” вспоминаю:

image.png

image.png

То, что нейросети творят с кодом — это вообще отдельная смехопанорама. Мне особенно нравятся, когда они начинают выдумывать воображаемые модули Питона и пытаться натянуть на них другие модули.

Помню, как GPT4 выдумал Api SteamDB и присобачил к ней Api Steam:

image.png

Изменено пользователем 0wn3df1x
  • Лайк (+1) 1
  • Хаха (+1) 1

Поделиться сообщением


Ссылка на сообщение

@Vollmond-inex   Причём тут программист, обычная профессиональная деформация.  Если я правильно уловил, человек больше 5 лет занимается локализацией всякого. 

@0wn3df1x А насчёт перевода нейронками, согласен не будет так хорошо как ручной перевод со всеми синтаксическими и лексическими оборотами.  Но если мало мальски понимаешь английский , хотя бы на базовом уровне то по сути нормально :)

Поделиться сообщением


Ссылка на сообщение
29 минут назад, 0wn3df1x сказал:

И на постоянке ловить As an AI language model, I am unable to engage with content that may violate my usage guidelines. To learn more, visit… от каждого чиха.

Это вопрос правильного джейлбрейка. И GPT, и Claude вполне могут работать с практически любыми “взрослыми” темами под нужной накачкой. Если прям совсем в жесть не упарываться, конечно. Claude очень прикольно умеет на русском материться, например =)

29 минут назад, 0wn3df1x сказал:

Более того, клод (как более “творческий”) страдает от излишка фантазии и желания всё переиначивать. Я как-то ради эксперимента загонял зоологические тексты на английском. Дай, думаю, гляну, как он их переведёт в энциклопедическом стиле. Так этот клод буквально на ходу превращал одни виды насекомых в другие, дело доходило до выдумывания новых таксонов.

Тут, скорее, вопрос нехватки исходных данных и знания предмета виноват, чем излишнее “творческое” начало нейронки. Я давно заметил, что если данных о предмете не хватает, то любая нейронка стремится дыру заполнить своими фантазиями.

Гугл бы ему подключить, или википедию хотя бы. Чтоб оттуда можно было данные тянуть. Стало бы значительно лучше.

16 минут назад, 0wn3df1x сказал:

В том числе. Я каждый раз, когда кто-то заводит разговор о том, что “нейросети уже лучше людей” и “нейросети уже готовы нас заменить” вспоминаю:

Со счетом у них проблемы, это да. И с математикой. Неудивительно, вообщем-то, учитывая как они работают.

Изменено пользователем Azazellz

Поделиться сообщением


Ссылка на сообщение

@0wn3df1x  Ну вообще особенность чатгпт именно в том, что он плохо умеет считать, потому что он не для этого сделан. 

Чатгпт это прежде всего способ прямого общения с компьютером. Вот если переводить старфилд обычным переводчиком, то надо написать миллион программ, одна будет вытаскивать текст, вторая будет автоматически делить его и скармливать нейросети, другая подменять рабочие теги. А в случае с чатгпт гипотетически (если бы не ограничения) можно было сделать так:

“Вот тебе файл локализации. Это текстовая локализация для научно-фантастической игры про космос и космические путешествия, в ней так же рассматриваются и религиозные темы. Переведи его на русский с учетом этого контекста. Теги не переводи, но их содержимое переведи. Постарайся по возможности переводить так, чтобы длинна строк была идентична оригиналу, если это не ухудшает качество перевода. И заодно напиши пожалуйста скрипт который будет включать и выключать перевод по команде.”

И всё. Любой человек мог бы сам сделать перевод старфилда, требования к знаниям it — знать хотя бы примерно что такое chatgpt. 

Поделиться сообщением


Ссылка на сообщение
13 минут назад, Azazellz сказал:

Это вопрос правильного джейлбрейка. И GPT, и Claude вполне могут работать с практически любыми “взрослыми” темами под нужной накачкой. Если прям совсем в жесть не упарываться, конечно. Claude очень прикольно умеет на русском материться, например =)

Если не касаться переводов, рекомендую использовать незацензуренные локальные модели, им джейлбрейк не нужен и выдавать они могут почти любую жесть, рекомендую 70B версии Airoboros и StableBeluga.

Поделиться сообщением


Ссылка на сообщение

@0wn3df1x вы теплое с мягким смешиваете. Есть модели такие, как ChatGPT,  а есть DeepL - там вроде как тоже в основе трансформер, но она заточена конкретно под перевод. Ни разу на многих сотнях страниц не видел никакой отсебятины у него, он не "галлюционирует". А ChatGPT придумывает на ходу что угодно, это фантазер 80го левела).

Но в целом мысль понятна - надо собирать 20 лямов, а лучше 30, иначе перевода нам не видать. Ну и времени 7 лет, да.

  • В замешательстве (0) 1

Поделиться сообщением


Ссылка на сообщение

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

  • Похожие публикации

    • Автор: ravenholn
      В данный момент в игре не поддерживается русский язык совсем и к сожалению скорее всего в ближ.пару лет его не будет. Информации по сторонним переводам от проф.команд нет никакой, а на просторах интернета висят только какие-то скамовские EXE файлы к которым нет совсем доверия.
       В виду этого я решил заняться сбором команды энтузиастов, любителей и просто не равнодушных людей которым как и мне важна русская локализация и вообще посмотреть возможно ли русскоязычным комьюнити реализовать данную цель. 
      Сам я готов заняться организацией, контролем по выполнению и взятием на себя ответственности за результат, так же покрыть финансовые расходы.
      На данный момент, т.к русский язык не поддерживается игрой (а не просто отсутствует) есть вариант через замену одного языка (например французского) сделать файл который будет заменяться в корневой папке игры и при выборе языка в самой игре меняться на русский ( в теории возможны проблемы с проверкой целостности файлов в стиме, пока догадка последующих проблем). В самом языковом файле десятки тысячи реплик связанных с интерфейсом и они все в каше вместе с репликами героев. Соответственно для того чтобы сделать перевод только текста нужно вычленить текст.
      В сухом остатке необходимо:
      Подготовить языковой файл, чтобы передать его переводчику Заняться переводом  Создать файл с помощью которого можно будет методом замены произвести русификацию текста Мной найдена не проф.команда переводчиков и локализаторов которая в данный момент уже занимается переводом другой игры, но с похожей проблемой. Они уже готовы заняться нашей проблемой целиком, а именно переводом и адаптацией файла, на всё у них уйдёт 1 месяц и для работы они запрашивают 13 тыс.руб. можно и ускорить процесс, но тогда это будет стоить дороже. Я сам лично в ЛЮБОМ случае буду заказывать у них работу и выложу это в открытый доступ для всеобщего пользования. 
      От сюда я предлагаю всем не равнодушным и людей которые хотят меня поддержать, оказать помощь, либо финансовую ЛЮБАЯ сумма уже облегчит фин.издержки. Либо если вы можете оказать какую-то свою проф.помощь, будь то сам языковой файл (т.к просто в корневой папке нет его) или у вас есть идеи как отсортировать текста или вы переводчик или можете заняться адаптацией, вы тоже очень сильно поможете.
       
    • Автор: 0wn3df1x
      Deep Sleep Trilogy

      Метки: Приключение, Инди, Хоррор, Point & Click, Пиксельная графика Разработчик: scriptwelder Издатель: Armor Games Studios Серия: scriptwelder Дата выхода: 25.10.2019 Отзывы Steam: 595 отзывов, 98% положительных

  • Сейчас популярно

  • Продвигаемые темы

  • Последние сообщения

    • Честно говоря я не смог запустить это переводчик на бепине, вроде всё копировал на свои места, то ли версия игры старая, толи в России заблочено скачивание обнов софта.
      Лучше добавить всё как есть, чтобы оставалось скопировать в игру. А так всё это не однозначно. Там какие-то csv гляжу сделанные, а как их собирать при обнове игры, если текст изменится? Непонятно.
    • Сега запретила? Серьёзно? А как же серия Якудза и спиннофы, которые получают официальный русский перевод? Соник? Метафоры всякие? На них тупизм сеговского менеджмента не распространяется или как?  Это не вяжется с твоей логикой — популярную серию CoH в Ру-регионе они переводят на русский, а не особо популярные — переводят? Интересно, а почему тогда обновлённое издание “Dawn of War” не имеет ру-перевода, если по твоей логике это кто-то в Сеге не давал ру-перевод, почему тогда здесь нет ру-перевода, которые сами Релики и издавали? Это явно инициатива Реликов была не добавлять ру-перевод в CoH, когда они были на содержании Сеги, а сейчас на вольных хлебах — деньги-то нужно, поэтому вставим перевод, который уже был, но мы его вырежем, чтобы подгадить. Русофобия заканчивается именно в том момент, когда деньги на счёте заканчиваются. А Реликам теперь самим нужно содержать себя, папика в лице Сеги больше нет. Так что можно снова сделать вид, что они всегда были аполитичны, ты главное купи, смотри, там даже перевод в CoH3 мы сделали, но правда в игре про Вторую Мировую нет СССР, подумаешь. все же знают, что фашистов побеждали США, Бельгия и Британия.
    • Не знаю как в стим версии, но обычная раняя версия сама расшифровывается после запуска
    • Потому что нужно доставать текст именно из него для него, тот что из файлов не совсем подойдёт, а это проходить игру на нём. К тому же ссылочность словаря скорее всего сломается. Плюс генерация строк, некоторые строки будут просто переводиться гуглем заново, так как собраны из нескольких, каки-то там регулярки применять то ещё запнятие. От всего этого перевод будет выглядеть так себе. И с учётом графики игры здесь текст должен быть просто шикарным. Обычно бепином пользуются, только когда простого доступа к тексту нет. Тексты в ассетах и стандартные локи это простой доступ. А когда в dll это сложнее.
    • Русификатор на пятую страйкерс вот до сих пор пилят.
         
    •   Эдем это же эмуль для Андроида ? А человек просил для ПК. Или Эдем есть для ПК тоже ? Я тоже впервые слышу, насколько я понял это только для Андроида. Спасибо большое
    • Всем спасибо)   Молодцы)  
    • у игры всего 2 языка, родной и английский, оффициального перевода думаю вообще нет смысла ждать)
  • Изменения статусов

    • Дмитрий Соснов  »  Tirniel

      Привет! ты разбираешься в компьютерном железе, сможешь помочь с советом по апгрейду старого компа?
      · 1 ответ
    • SHAMAH

      Куда вход на сайт убрали и ЗАЧЕМ? Хотел файл скачать, там только медленная загрузка и “зарегистрируйтесь”. Все. Пришлось вручную страницу входа прописывать.
      · 0 ответов
    • Nosferatu  »  behar

      Добрый вечер.
      Подскажите пожалуйста, у вас не осталось случайно исходников для фикса на широкоформатные мониторы для игры Vampire The Masquerade Redemption?
      Если да, то не могли бы вы ими поделиться, а если нет, то прошу прощенья что побеспокоил.
      Заранее спасибо.
      · 0 ответов
    • AlcoKolyic  »  makc_ar

      Здраствуйте! Извините, а можно попросить ссылку на место где можно взять перевод (патч или образ игры с переводом) El Shaddai: Ascension of the Metatron для ps3, пожалуйста? А то в теме к этой игре у меня не получилось найти работающие ссылки… Первая ведет в группу в которой удалены большинство постов, а пост с этой игрой ведет на сайт https://psnext.ru который сейчас не имеет отношения к видеоиграм. 
      · 0 ответов
    • oleg72  »  Boor

      https://www.skidrowcodex.net/fate-reawakened-goldberg/
      · 0 ответов
  • Лучшие авторы


Zone of Games © 2003–2025 | Реклама на сайте.

×