Перейти к содержимому
Zone of Games Forum
reboxdetox

Как сделать русификатор?

Рекомендованные сообщения

А она подойдет к тексту вот такого формата?
声名狼藉¤Renowned
声名远扬¤Well-known
名声败坏¤Infamous
誉满天下¤Famous
臭名昭著¤Infamy
默默无闻¤Unknown
Чтобы перевести весь английский на русский, не трогая китайский?

Поделиться сообщением


Ссылка на сообщение

да, но надо будет указать это в промте, что надо и не надо и в каком виде выводить перевод, там будет ниже видно в строке перевод, как он переводит и если непонравится останови и переделай 

Изменено пользователем Chillstream

Поделиться сообщением


Ссылка на сообщение
16 часов назад, Storch сказал:

А она подойдет к тексту вот такого формата?
声名狼藉¤Renowned
声名远扬¤Well-known
名声败坏¤Infamous
誉满天下¤Famous
臭名昭著¤Infamy
默默无闻¤Unknown
Чтобы перевести весь английский на русский, не трогая китайский?

Попробуй вот
https://disk.yandex.ru/d/D5gsy9rTQ5Tu4A

  • +1 1

Поделиться сообщением


Ссылка на сообщение

А есть возможность переводить файл целиком? В файле много строк порядка 28000 и почти все которые пробовал не осиливают такой размер.

Поделиться сообщением


Ссылка на сообщение

ну там в нейронку будет частями прилетать, а так чтобы сразу за раз огромный файл и было норм, незнаю таких прог

Поделиться сообщением


Ссылка на сообщение

@Storch которые что? Нейронки? Не знаю насчёт крутых платных, но если брать в расчёт бесплатные, то Gemini за раз, не подавившись, может нормально обработать 450—500 строк или 100 КБ файл. Всё, что больше, уже может вызвать проблемы. Да и такие куски может выдать с потерянными или повреждёнными строками. В целом за сессию выдерживает до 300К токенов, дальше уже могут начаться проблемы.

А если начинать новую сессию, то это будет новый ИИ после амнезии, и он совсем по-другому начнёт переводить текст. В итоге получится расхождение в именах, названиях и повторяющихся словах. Поэтому нужно создавать и корректировать глоссарий, но даже это не избавит от ошибок, хотя результат будет более унифицированным.

Перед переводом надо сначала выяснить, есть ли в игре глоссарии, энциклопедии, справочники. Сначала скормить их. Потом вытащить все имена, названия, термины. Ознакомить ИИ со страницей в Steam или где игра есть, скормить ему вики, всё, что уже есть в сети. Потом скормить вытащенные данные. После этого запросить промт для перевода с глоссарием по игре. Потом пройтись по ним, проверить и отредактировать. И уже после этого начинать скармливать 30К строк.

Для понимания контекста также очень сильно помогает узнать, за кем закреплены строки текста, за какими персонажами — для понимания гендера и стиля перевода. Но это уже сложнее задача, и даже при явном указании гендера ИИ может ошибиться при переводе. Ещё помогает для отслеживания контекста обновление сюжетного справочника, чтобы ИИ понимал, откуда у следующего обрывка растут ноги.

В общем, для более-менее сносного результата нужно проделать неплохую работу. 30К строк доступные пользовательские ИИ, увы, пока не могут держать. Может, со временем смогут — всё-таки они довольно быстро прогрессируют.

  • Лайк (+1) 1

Поделиться сообщением


Ссылка на сообщение

@allodernat не обязательно нейнонку, можно и обычный переводчик. Если такие, что переводят файл целиком. закину и тебе на выходе такой же файл, но уже на русском? Или все же ручками по чуть-чуть собирать?

Поделиться сообщением


Ссылка на сообщение

@Storch в гугл таблицах есть формула

=GOOGLETRANSLATE(A1;"en";"ru")

где А1 ячейка исходного текста, "en";"ru" — с какого на какой переводить соответственно

Если загнать весь тексте в csv, то получится целиком за раз по идее.

Через Google Colab тоже есть варианты.

Но я лично не пробовал. Прога @Wiltonicol условно работает тоже за раз, просто она не целиком текст кидает ИИ, а кусочками, но результат один — грубо говоря один раз кнопку нажмёшь и можно идти отдыхать, по части производительности условно 200-300 сек 400 строк. +-

Поделиться сообщением


Ссылка на сообщение

Подскажите пожалуйста ссылку на программу, которая делит текст прямо из файла.
声名狼藉¤Renowned
Делит подобный текст на 声名狼藉 + Renowned, с возможностью сохранить отдельно левую часть и правую, а также соединить и заменить разделитель.

Поделиться сообщением


Ссылка на сообщение

Привет! Классная идея для диссертации. Самый безопасный путь — выбрать игру с открытой политикой моддинга или с уже встроенной поддержкой локализации. Дальше по шагам:

1) Определи движок игры:
- Unity: обычно папки “.../GameName_Data/”, файлы .assets, .bundle, sharedassets. Для извлечения текста — AssetRipper, AssetStudio, UABEA.
- Unreal Engine 4/5: архивы .pak; текст часто в .locres/.po/.csv. Смотри UnrealPak, FModel, Locres Editor.
- Свои движки: ищи файлы с расширениями .pak/.dat/.arc/.bin. Часто помогает QuickBMS + готовые скрипты под конкретную игру.

2) Где искать файлы:
- Steam: Библиотека → ПКМ по игре → Управление → Просмотреть локальные файлы.
- GOG/Epic — аналогично. На консолях всё сложнее (шифрование), лучше начинать с ПК-версий.
- Мобильные (Android): распаковать APK, текст может лежать в assets или res/values/strings.xml.

3) Форматы текстов:
- JSON, CSV, XML, INI, PO/ POT (gettext), XLIFF — удобны для CAT-инструментов.
- В PO удобно работать через Poedit; для CSV/JSON — любой CAT (OmegaT, memoQ) или даже Excel, но следи за кавычками и разделителями.
- Обязательно сохраняй плейсхолдеры (%s, {0}, \n, \t) и теги (<b>…</b>), иначе будут краши/артефакты.

4) Шрифты и кириллица:
- Частая проблема — нет кириллических глифов. На Unity добавляют TTF/OTF или расширяют TextMeshPro-ассеты; на Unreal — настраивают Font assets. Без этого текст будет “квадратиками”.
- Кодировка: чаще всего UTF-8 (иногда без BOM). Проверяй в редакторе (Notepad++, VS Code).

5) Процесс:
- Сделай бэкап оригиналов.
- Вытащи строки → переведи небольшим инкрементом (меню, билд, туториал) → верни файлы на место/упакуй → тестируй в игре → фиксируй переносы, обрезки, длину строк.
- Для распространения делай патч (xdelta/bsdiff) или мод-пак, а не раздавай оригинальные файлы.

6) Юридические нюансы:
- Проверь EULA/политику моддинга конкретной игры. Для академического проекта лучше брать игры с разрешёнными модами или опенсорс/freeware.
- Присоединяйся к комьюнити игры (форумы, Discord, Nexus Mods, Steam Discussions) — часто уже есть гайды по файлам.

7) Инструменты и мелочи:
- Версионирование: Git для трекинга изменений.
- Терминология: веди глоссарий и единый стиль.
- Автотесты: прогон по плейсхолдерам, пустым строкам, неэкранированным кавычкам.
- Если встретишь сжатые/зашифрованные ресурсы — ищи название игры + “modding”, “unpack”, “localization”, “.pak”, “.locres”.

Если подскажешь конкретную игру/платформу — можно прицельно подсказать инструменты. А для быстрой проверки терминов и вариантов перевода удобно держать под рукой двуязычный словарь: https://nativelib.net/en/en-ru/

Поделиться сообщением


Ссылка на сообщение

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас



Zone of Games © 2003–2025 | Реклама на сайте.

×