Перейти к содержимому
Zone of Games Forum
SerGEAnt

Starfield

Утилита для изменений перевода планеты Cydonia

Решение проблемы с квадратами

На Mac и Steam Deck перевод можно поставить только вручную, скачав архив с бусти.

banner_pr_starfield.jpg

Сообщение добавлено пользователем SerGEAnt

Рекомендованные сообщения

@Haoose Можно сделать в данном случае довольно простой механизьм проверки:
1 Регуляркой выбираем все теги.
2 Заменяем теги на предсказуемые токены для перевода.
3 Переводим.
4 Заменяем предсказуемые токены обратно на теги
5 Проверяем наличие (и порядок для игр в которых это важно) всех тегов. в случае несоответствия помечаем или кладем в файл #TODO Ручками проверить.

 

В таком случае мы будем уверены что игра и квесты не сломаются.

Изменено пользователем gl237man
  • +1 1

Поделиться сообщением


Ссылка на сообщение
18 минут назад, Haoose сказал:

@RUIZ007 Ну вот. DeepL не перевел текст в теге, но и не сломал его. Yandex перевел служебное слово, что поломает игру в этом месте. А SeamlessM4T вовсе выкинул тег.
Вывод — все равно после нейронок текст надо будет еще очень долго править… Даже если
Sergio предусмотрел эти моменты — все равно где-нибудь что-то вылезет, т.к. объем текста монструозный )

Шрифты есть. И позже должны появиться получше. Так что голову ими можешь не забивать )

Нейросети не готовы переводить тексты крупных игр, сохраняя высокое качество.

При переводе длинных сложных предложений вероятность ошибки растёт из-за когнитивной нагрузки. Нейросеть может начать фантазировать и вставлять в текст свои домыслы вместо дословного перевода. А после 10-20% от общего объёма текста качество перевода начинает резко падать из-за кумулятивного эффекта ошибок.

Ограниченные вычислительные возможности тоже влияют. При переводе предложения нейросеть работает с небольшим фрагментом, опираясь на несколько последних токенов для контекста. Но это далеко не то же самое, что видеть весь текст целиком. Важные детали, упомянутые на начальных страницах, могут быть утеряны к моменту перевода окончания. Кроме того, структура документа и взаимосвязь разных его частей тоже трудно улавливается автоматически. А ведь именно глобальное понимание всего текста нужно переводчику для качественной работы.

Еще есть сложности с билингвальным режимом. Нейросеть в какой-то степени смешивает грамматические правила двух языков. В результате при генерации предложений на одном языке в его структуре могут проскальзывать элементы другого языка. Так на русском языке у нейросети могут появляться конструкции, более свойственные, например, английскому синтаксису. Если в монолингвальном режиме генерируемые текст звучат естественно для носителя этого языка и могут не выглядеть машинно, то в билингвальном режиме начинает казаться, что тебе пишет какой-то британский шпион.

  • Хаха (+1) 2
  • +1 1

Поделиться сообщением


Ссылка на сообщение
10 минут назад, 0wn3df1x сказал:

Нейросети не готовы переводить тексты крупных игр, сохраняя высокое качество.

При переводе длинных сложных предложений вероятность ошибки растёт из-за когнитивной нагрузки. Нейросеть может начать фантазировать и вставлять в текст свои домыслы вместо дословного перевода. А после 10-20% от общего объёма текста качество перевода начинает резко падать из-за кумулятивного эффекта ошибок.

Ограниченные вычислительные возможности тоже влияют. При переводе предложения нейросеть работает с небольшим фрагментом, опираясь на несколько последних токенов для контекста. Но это далеко не то же самое, что видеть весь текст целиком. Важные детали, упомянутые на начальных страницах, могут быть утеряны к моменту перевода окончания. Кроме того, структура документа и взаимосвязь разных его частей тоже трудно улавливается автоматически. А ведь именно глобальное понимание всего текста нужно переводчику для качественной работы.

Еще есть сложности с билингвальным режимом. Нейросеть в какой-то степени смешивает грамматические правила двух языков. В результате при генерации предложений на одном языке в его структуре могут проскальзывать элементы другого языка. Так на русском языке у нейросети могут появляться конструкции, более свойственные, например, английскому синтаксису. Если в монолингвальном режиме генерируемые текст звучат естественно для носителя этого языка и могут не выглядеть машинно, то в билингвальном режиме начинает казаться, что тебе пишет какой-то британский шпион.

Я перевел довольно много научной литературы deepL. Это весьма объемные книги, часто написанные довольно сложным языком. Для этого я не использовал ничего, кроме премиума нейросетки, которой просто скармливал книгу. В итоге падения качества перевода не замечал. Может быть в художественной литературе все сложнее. Но почему бы тогда не переводить по частям? 

Поделиться сообщением


Ссылка на сообщение

Мне интересно другое. Каков уровень английского языка в игре? Простой или сложный? Думаю играть на английском, но не понятно потяну ли с моим неопределенным уровнем B1-2 )

Поделиться сообщением


Ссылка на сообщение
32 минуты назад, TanatosX сказал:

Мне интересно другое. Каков уровень английского языка в игре? Простой или сложный? Думаю играть на английском, но не понятно потяну ли с моим неопределенным уровнем B1-2 )

Запустишь завтра и узнаешь :dirol:

Поделиться сообщением


Ссылка на сообщение
34 минуты назад, 0wn3df1x сказал:

Нейросети не готовы переводить тексты крупных игр, сохраняя высокое качество.

При переводе длинных сложных предложений вероятность ошибки растёт из-за когнитивной нагрузки. Нейросеть может начать фантазировать и вставлять в текст свои домыслы вместо дословного перевода. А после 10-20% от общего объёма текста качество перевода начинает резко падать из-за кумулятивного эффекта ошибок.

Ограниченные вычислительные возможности тоже влияют. При переводе предложения нейросеть работает с небольшим фрагментом, опираясь на несколько последних токенов для контекста. Но это далеко не то же самое, что видеть весь текст целиком. Важные детали, упомянутые на начальных страницах, могут быть утеряны к моменту перевода окончания. Кроме того, структура документа и взаимосвязь разных его частей тоже трудно улавливается автоматически. А ведь именно глобальное понимание всего текста нужно переводчику для качественной работы.

Вопрос API и разных надстроек. Можно периодически чистить контекст, и инжектить в отсылаемый текст дополнительную информацию о предмете перевода, стилистике и различные установки для самой нейронки. Не обязательно держать в памяти всю информацию, можно же отсылать ее по мере надобности.

Т.е. при переводе текста, содержащего имя персонажа/организации/место действия, можно автоматически добавлять контекст. Ну, например, в тексте реплика от “Дяди Билли”. Дополнительным слоем нейронке отсылается, что этот Билли - мужчина лет 50, говорит на хиллбилли-сленге, агрессивный и постоянно пьяный, и дается указание использовать эти данные при переводе, сохраняя стилистику и манеру речи персонажа. Если нейронка достаточно умна — она это сможет учесть, и писать соответственно.

Тут проблема в техническом плане, как чистый текст из игры под такой формат развести, и этот условный “лорбук” написать. Учитывая объемы и формат текста — работка не из легких.

GPT, кстати, довольно стремно работает с русским языком. Из известных мне “больших” сеток Claude в русском просто не имеет конкурентов. Точность перевода может несколько пострадать, но под соответствующей накачкой системным промптом можно получать очень “живой” русский текст. Доступ к API только добыть — проблема, особенно из РУ-региона.

Поделиться сообщением


Ссылка на сообщение

@0wn3df1x всё не совсем так по моему опыту. Во-первых, нейронка контекст улавливает максимум в пределах абзаца, а скорее - только в пределах предложения. Качество перевода незначительно отличается на огромных кусках текста от кусков поменьше. Основа там же - алгоритм сравнения прямого значения и статистического применения оборотов. Грамматические правила изредка смешивает Яндекс в минимальной степени - но зато он максимально точен. DeepL же знает конструкции русского.

Он не переведёт "Джон своими глазами посмотрел на свою руку и вытянул свою руку перед собой", нейронка знает, что обилие притяжательных характерно для английского, но не для русского. Так же знает множество устойчивых выражений, часть сленга и т д. DeepL вообще очень изящен в переводе на русский.

Главный элемент, от которого зависит качество перевода - это стиль. Чем правильнее, выхолощеннее стиль - тем лучше будет перевод. И даже с огромными сложными предложениями она справляется легко. Но если там авторский стиль, необычное строение предложений, много односложных фраз и сленга - вот тогда качество стремительно падает. Сильно "авторские" произведения очень сложно переводить нейронкой.

А ошибается она часто на сверхкоротких конструкциях - не хватает контекста для верного толкования значений.

И кстати, DeepL очень плохо переводит отдельные предложения, всё же там есть контекст на уровне абзаца, видимо.

Я через него и яндекс прилично художки прогнал, большой опыт).

И замечу, что правильный и несложный английский текст они переводят просто великолепно, почти как человек.

Изменено пользователем RUIZ007

Поделиться сообщением


Ссылка на сообщение
1 час назад, Vollmond-inex сказал:

Я перевел довольно много научной литературы deepL. 

Сочувствую. :laugh: Я бы там даже инструкцию от пылесоса переводить не стал.

25 минут назад, Azazellz сказал:

GPT, кстати, довольно стремно работает с русским языком. Из известных мне “больших” сеток Claude в русском просто не имеет конкурентов. Точность перевода может несколько пострадать, но под соответствующей накачкой системным промптом можно получать очень “живой” русский текст. Доступ к API только добыть — проблема, особенно из РУ-региона.

И на постоянке ловить As an AI language model, I am unable to engage with content that may violate my usage guidelines. To learn more, visit… от каждого чиха. Но клод (хоть обычный, хоть продвинутый) не особо лучше chatGPT по качеству. Более того, клод (как более “творческий”) страдает от излишка фантазии и желания всё переиначивать. Я как-то ради эксперимента загонял зоологические тексты на английском. Дай, думаю, гляну, как он их переведёт в энциклопедическом стиле. Так этот клод буквально на ходу превращал одни виды насекомых в другие, дело доходило до выдумывания новых таксонов.

Короче, я всегда считал и продолжаю считать, что все эти машинные штуки — зло.
Нет ничего хуже Cat-инструментов.
И нет ничего совершенней человека.

Изменено пользователем 0wn3df1x
  • Лайк (+1) 1
  • Хаха (+1) 2

Поделиться сообщением


Ссылка на сообщение
9 минут назад, 0wn3df1x сказал:

Сочувствую. :laugh: Я бы там даже инструкцию от пылесоса переводить не стал.

28 минут назад, Azazellz сказал:

Вы наверное программист, да? Я обычно от программистов слышу какой-то гиперскептицизм в отношении нейросетей в принципе.  

Изменено пользователем Vollmond-inex

Поделиться сообщением


Ссылка на сообщение
5 минут назад, Vollmond-inex сказал:

Вы наверное программист, да? Я обычно от программистов слышу какой-то гиперскепетицизм в отношении нейросетей в принципе.  

В том числе. Я каждый раз, когда кто-то заводит разговор о том, что “нейросети уже лучше людей” и “нейросети уже готовы нас заменить” вспоминаю:

image.png

image.png

То, что нейросети творят с кодом — это вообще отдельная смехопанорама. Мне особенно нравятся, когда они начинают выдумывать воображаемые модули Питона и пытаться натянуть на них другие модули.

Помню, как GPT4 выдумал Api SteamDB и присобачил к ней Api Steam:

image.png

Изменено пользователем 0wn3df1x
  • Лайк (+1) 1
  • Хаха (+1) 3

Поделиться сообщением


Ссылка на сообщение

@Vollmond-inex   Причём тут программист, обычная профессиональная деформация.  Если я правильно уловил, человек больше 5 лет занимается локализацией всякого. 

@0wn3df1x А насчёт перевода нейронками, согласен не будет так хорошо как ручной перевод со всеми синтаксическими и лексическими оборотами.  Но если мало мальски понимаешь английский , хотя бы на базовом уровне то по сути нормально :)

Поделиться сообщением


Ссылка на сообщение
29 минут назад, 0wn3df1x сказал:

И на постоянке ловить As an AI language model, I am unable to engage with content that may violate my usage guidelines. To learn more, visit… от каждого чиха.

Это вопрос правильного джейлбрейка. И GPT, и Claude вполне могут работать с практически любыми “взрослыми” темами под нужной накачкой. Если прям совсем в жесть не упарываться, конечно. Claude очень прикольно умеет на русском материться, например =)

29 минут назад, 0wn3df1x сказал:

Более того, клод (как более “творческий”) страдает от излишка фантазии и желания всё переиначивать. Я как-то ради эксперимента загонял зоологические тексты на английском. Дай, думаю, гляну, как он их переведёт в энциклопедическом стиле. Так этот клод буквально на ходу превращал одни виды насекомых в другие, дело доходило до выдумывания новых таксонов.

Тут, скорее, вопрос нехватки исходных данных и знания предмета виноват, чем излишнее “творческое” начало нейронки. Я давно заметил, что если данных о предмете не хватает, то любая нейронка стремится дыру заполнить своими фантазиями.

Гугл бы ему подключить, или википедию хотя бы. Чтоб оттуда можно было данные тянуть. Стало бы значительно лучше.

16 минут назад, 0wn3df1x сказал:

В том числе. Я каждый раз, когда кто-то заводит разговор о том, что “нейросети уже лучше людей” и “нейросети уже готовы нас заменить” вспоминаю:

Со счетом у них проблемы, это да. И с математикой. Неудивительно, вообщем-то, учитывая как они работают.

Изменено пользователем Azazellz

Поделиться сообщением


Ссылка на сообщение

@0wn3df1x  Ну вообще особенность чатгпт именно в том, что он плохо умеет считать, потому что он не для этого сделан. 

Чатгпт это прежде всего способ прямого общения с компьютером. Вот если переводить старфилд обычным переводчиком, то надо написать миллион программ, одна будет вытаскивать текст, вторая будет автоматически делить его и скармливать нейросети, другая подменять рабочие теги. А в случае с чатгпт гипотетически (если бы не ограничения) можно было сделать так:

“Вот тебе файл локализации. Это текстовая локализация для научно-фантастической игры про космос и космические путешествия, в ней так же рассматриваются и религиозные темы. Переведи его на русский с учетом этого контекста. Теги не переводи, но их содержимое переведи. Постарайся по возможности переводить так, чтобы длинна строк была идентична оригиналу, если это не ухудшает качество перевода. И заодно напиши пожалуйста скрипт который будет включать и выключать перевод по команде.”

И всё. Любой человек мог бы сам сделать перевод старфилда, требования к знаниям it — знать хотя бы примерно что такое chatgpt. 

Поделиться сообщением


Ссылка на сообщение
13 минут назад, Azazellz сказал:

Это вопрос правильного джейлбрейка. И GPT, и Claude вполне могут работать с практически любыми “взрослыми” темами под нужной накачкой. Если прям совсем в жесть не упарываться, конечно. Claude очень прикольно умеет на русском материться, например =)

Если не касаться переводов, рекомендую использовать незацензуренные локальные модели, им джейлбрейк не нужен и выдавать они могут почти любую жесть, рекомендую 70B версии Airoboros и StableBeluga.

Поделиться сообщением


Ссылка на сообщение

@0wn3df1x вы теплое с мягким смешиваете. Есть модели такие, как ChatGPT,  а есть DeepL - там вроде как тоже в основе трансформер, но она заточена конкретно под перевод. Ни разу на многих сотнях страниц не видел никакой отсебятины у него, он не "галлюционирует". А ChatGPT придумывает на ходу что угодно, это фантазер 80го левела).

Но в целом мысль понятна - надо собирать 20 лямов, а лучше 30, иначе перевода нам не видать. Ну и времени 7 лет, да.

  • В замешательстве (0) 1

Поделиться сообщением


Ссылка на сообщение

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

  • Похожие публикации

    • Автор: Tayra

      «Don’t Starve» — это бескомпромиссная игра на выживание в диком мире, наполненном наукой и магией.
      Вы — Уилсон, отважный ученый господин, которого поймал злобный демон и отправил в загадочные дикие земли. Уилсон должен обуздать этот мир и его обитателей, чтобы сбежать отсюда и вернуться в свой родной дом.
      Откройте таинственный неизведанный мир, где на каждом шагу вас ожидают странные существа, опасности и неожиданности. Собирайте ресурсы, чтобы создавать предметы и вещи, которые помогут вам выжить. Играйте так, как этого хочется вам, и разгадайте тайны этих загадочных земель.
    • Автор: SerGEAnt
      Unicorn Overlord
      Жанр: RPG Платформы: XS XONE PS5 PS4 SW Разработчик: Vanillaware Издатель: Vanillaware Дата выхода: 8 марта 2024

  • Сейчас популярно

  • Продвигаемые темы

  • Последние сообщения

    • Они это вам лично рассказывали? Нормальные разработчики делают игру таким образом. что бы её могло купить максимально большое число людей. Если они будут ориентироваться только на максимальные настройки, они сильно пролетят. Привет от Алана Вэйка 2, который и геймплейно то не всех радует. А уж системками то вообще в восторг вогнал. И все эти игры идут на высоких настройках согласно заявленным системным требованиям? Напомните, что за игры. Просто сейчас отматывать и искать, о каких играх речь, ну очень не хочется.
    • ну а сейчас многие не работают. Выходит, игровые компы закончились)
    • Я тоже тогда повелся на мнение толпы. Что игра опережает свое время. И сейчас легко можно такую игру сделать. Запихиваем оригинальные текстуры при разработке, а не сжатые как делают обычно. Везде у всех нпс, максимальная проработка с Hairwork-сом обязательно. Побольше лучей, света, спец эффектов, тени как в Pacific Drive, максимальную детализацию обьектов, капли пота и т.д и т.д. Выйдет очень очень красивая игра. Будет ли она тормозить на любом железе? Да. А еще можно добавить кнопку минимальные настройки, которые отключат половину этой хрени, и о чудо игра будет работать хорошо. Это теперь называется хорошая оптимизация? Разрабы в этой игре пытались показать, что может их движок, они специально сделали ее такой фризящей на любом тогда существующем железе. То что игра вышла такой тормозной это был косяк разработчиков, осознаный, которым они отмазывались, что просто их игра настолько великолепна что время опередила. И когда они выпустили отвратительный тормозной ремастер, наверное их игра опередила время во второй раз. Я не знаю к чему вы шли все это время, но нормальные разработчики задумывают свой проект так, чтобы в него играли люди на максимальный настройках. При этом эти настройки максимальные тянет довольно большой список карт. А не одна самая самая дорогая. Я вам кидал игры, новинки, у них у всех в рекомендованных примерно одна и таже производительность требуемая. И там нету 1650
    • какие гопники, васи, пети блин, вы о чём вообще? У вас всё в гопниках измеряется? Мы что, будем теперь говорить что по вашему из условного меньшинства гопников не надо вести здоровый образ жизни тк ваш васяпетя его тоже будет вести и надаёт вам по голове, и именно поэтому вся пропаганда зло?? Простите конечно, но более бредовых аналогий я не слышал Ну знаете как например исказили историю с голодомором, все соседи в один голос кричат что это русские всех морили, а то что в самой россии люди с голоду помирали, есть даже выражение голодающие поволжья, это пофиг, или то что подрастающие поколение японии думает что бимбу ссср сбросили. А если кто от не в силах отличить вымысел “альтернативные истории” от реальности, то ему явно надо к психиатору, а вот подмена как с тем же голодомором или например игрой ласт трэйн, вот с этим и нужно бороться, потому что теперь вон, у кого то и батька бендере, именно из-за пропоганды и подмены понятий
    • это как гейминг на ПК, который как известно, умер уже… сколько там лет прошло? а то я уже забыл что-то

    •     Уведомление:
          В игре есть официальный русский перевод
    • Индия крайне сомнительный пример, их экономика, это количество населения помноженное на пару рупий, по сути сама Индия мало чего производит и имеет высокотехнологичного или тяжёлого. Китай… туда пиндосы перетащили всё своё производство и ввалили сотни миллиардов из за дешёвой рабочей силы и пофигизма на вредные производства, Китай подняли сами пиндосы. Германия то же самое, её подняли на деньги пиндосов, как и Южную Корею и Японию, план Маршала слышал? И делалось это не по доброте душевной и не во имя свободных рынков и демократии, а для военного противостояния и в случае шухера, вроде третьей мировой, именно эти страны должны были стать камикадзе и первыми сгореть в ядерном огне, как сейчас горит (пока не в ядерном) огне украина. А вот сами США и Англия поднялись исключительно за счёт грабежа большей части планеты, сами своими силами они ни чего не развивали не на что, Европа и остров вообще на ресурсы бедны, все ресурсы и все финансы у них были ворованные к примеру у тех же Китая и Индии.
    • Пример первого Кризиса говорит несколько об ином. Там если все на максимум выкручивать, то тормозили видеокарты не только текущего, но и следующего поколения. Потому что разработчики опередили свое время. Сама игра, меж тем, была очень хорошо оптимизирована. Она у меня на минималках шла на конфиге, который то ли еле-еле, то ли вообще был слабее указанных разработчиками.  К чему, собственно, мы и шли все это время — не обязан комп тянуть все игры на максималках, что бы носить гордое имя “Игровой”.
    • Потому что одна конкретная игра может тормозить и на самой лучше 9900super-ti. А все остальные новинки ААА индустрии работают отлично. Это тогда не комп виноват, а разработчик, и я уже об этом писал. Если же большинство проектов начинают тормозить, то тут виноват пк, а не разработчики. Поэтому нельзя сказать, что из-за одной игры, это уже не игровая карта. Из-за этого диапазон плавает.
    • Да, можно так сказать. Вот только в этот “стандарт” и 30 ФПС входит, а не только 60. Ну и, как тут выше верно уже подмечали, этот “стандарт”, скорее всего, перекочевал с консолей. Разрабы увидели удобное мерило в циферках 60/30 и начали “ориентироваться” на него.
  • Изменения статусов

  • Лучшие авторы


Zone of Games © 2003–2024 | Реклама на сайте.

×