Перейти к содержимому
Zone of Games Forum
Wiltonicol

Руководство: как сделать нейросетевой/машинный перевод на Gemini

Рекомендованные сообщения

Программа работает отлично, переводил 24 тысячи строк через Deepseek. Был косяк с переносом строк, примерно 20 пострадали, но это вряд ли программа сделала.

24 тысячи строк вышло на 1.67 бакса (с учетом, что с 5 сентября новые цены у DeepSeek и больше нет ночных скидок).

Сначала поставил по 30 строк / 8000 токенов лимит. На 25% где-то переставил на 50 строк / 80 000 токенов. Давился только на лицензионном соглашении — там было 2 строки с ним жесткого размера. 

Промт для Deepseek сделал Deepseek, я хз, правильно или нет, но результат вышел вполне разумным.

Температура была 0.20. Видел, что Deepseek в документации рекомендует для переводов температуру 1.3. 

При этом если спросить самого Deepseek, что он думает по поводу температуры для переводов, то “Deepseek советует temp=1.3, чтобы ваш перевод звучал как текст, написанный человеком, а не как работа робота, и чтобы модель могла выбирать более идиоматичные и контекстуально уместные варианты слов.”

В течение недели я попробую сделать перевод одной игры с t=1.3, о результате сообщу.

Изменено пользователем SamhainGhost
  • +1 1

Поделиться сообщением


Ссылка на сообщение

Так вот, второй подход через Deepseek, около 9000 строк (из них ~5800 — диалоги), температура 1.3.

Результат — отличный. Кроме того, вероятно, за счёт лучшего промта, программа не косячила с переносом строк.

На второй подход 58 центов. Учитывая, что я пополняю баланс через услугу с одного сайта, 1 бакс выходит на 136 рублей. По итогу этих двух подходов средняя цена перевода выходит 15к строк = 1 бакс.

Если есть рабочие варианты брать дешевле Deepseek или Gemini, напишите, пожалуйста, в личку.

upd: при проверке выяснилось, что не отлично, но хорошо. Deepseek допустил в ряде строк не переведенные слова, но при этом предложения звучали так, как будто они переведены целиком. Пример: Твоя собака ест only мясо по-французски.

Изменено пользователем SamhainGhost

Поделиться сообщением


Ссылка на сообщение
В 09.03.2025 в 01:20, Wiltonicol сказал:

Для качественного машинного перевода нужен грамотный промпт.

Посоветуйте грамотный промт, может у вас уже есть наработки )
Думаю там нужно объяснить ИИ что это игровой текст, что не надо трогать идентификаторы различные (показать примеры как они выглядят), написать о том что не следует удалять лишние или добавлять новые строки/переносы. Что еще? )

Поделиться сообщением


Ссылка на сообщение
В 16.09.2025 в 06:19, Haoose сказал:

Посоветуйте грамотный промт, может у вас уже есть наработки )
Думаю там нужно объяснить ИИ что это игровой текст, что не надо трогать идентификаторы различные (показать примеры как они выглядят), написать о том что не следует удалять лишние или добавлять новые строки/переносы. Что еще? )

вот этот (промт от “Мои АИ”) можешь использовать, либо генерить промты через ии.

Изменено пользователем pekatvdmitriypekar
  • Спасибо (+1) 1

Поделиться сообщением


Ссылка на сообщение

@Haoose, я вообще через скрипт удаляю идентификаторы и просто ставлю номер строки. 1. 2. 3. и т.д. Делаю перевод, сверяюсь, и делаю обратный импорт. Так сказать подстраховка. Меньше вероятность запороть идентификаторы.

Поделиться сообщением


Ссылка на сообщение
21 час назад, parabelum сказал:

@Haoose, я вообще через скрипт удаляю идентификаторы и просто ставлю номер строки. 1. 2. 3. и т.д. Делаю перевод, сверяюсь, и делаю обратный импорт. Так сказать подстраховка. Меньше вероятность запороть идентификаторы.

Я конечно не через эту программу делаю, но у меня стоит валидатор, который проверяет то ли пришло на входе, что было на выходе (в плане структуры, по сути тоже самое что и у вас, только отправляет полные структуры, а не просто строки, а потом сравнивает, правильные ли они). Делается именно так потому что так нейросеть не теряет контекст того что это именно за строка (иногда в переводе это может многое поменять). Описанный вами метод использую если нужно что то очень быстро перевести и там не важна структура для контекста. Возможно мой метод излишний :D Конечно же он можно сказать дороже по времени ещё)

Изменено пользователем Luchik

Поделиться сообщением


Ссылка на сообщение

@parabelum конкретно через  MLTranslate-windows наверное нереально идентификаторы запороть, а через вэб да, только и смотри, чтобы где-нибудь 0 не стал O, а случайно не перескочило с 789 на 900)

@Luchik где ж ваша чудесная программа!) А ко-ли это коммерческая тайна мало вы нас русификаторами радуете))

 

Изменено пользователем allodernat
  • Хаха (+1) 1

Поделиться сообщением


Ссылка на сообщение
4 минуты назад, allodernat сказал:

конкретно через  MLTranslate-windows наверное нереально запороть, а через вэб да, только и смотри, 

Сразу видно насколько вы часто работаете с программой. 

 

Поправочка, претензий ни к разработчику, ни к программе нет.

Наоборот. Только благодарность.

 

  • Лайк (+1) 1

Поделиться сообщением


Ссылка на сообщение

Заметил небольшой баг при импорте csv. Экспортитуется вот такая строка “$.Metas[20].Entities[896].Values[2].Value, cm,”, но при импорте с переводом “$.Metas[20].Entities[896].Values[2].Value, cm, см” перед переведённой строкой теряется пробел и импортируется просто “см”.

Поделиться сообщением


Ссылка на сообщение

Протестил последнюю версию.  Всё гуд !

Wiltonicol,  респект ! 

allodernat,  спасибо что выложил.

 

 

Поделиться сообщением


Ссылка на сообщение

Wiltonicol поделился следующей тестовой сборкой MLTranslate для Windows. Выкладываю её с его разрешения — версию для Windows.

Изменение небольшое и тестировалось только с gemini:
В редактор промтов добавлены “запреты”, что не надо трогать при переводе. Полезно, если в тексте много разных переменных, можно собрать их и добавить в запреты вручную или через импорт txt
TXT должен выглядеть так:
{$переменная1}
{$переменная2}
{$переменная3}
Т.е. каждое слово или переменная, что не нужно переводить с новой строки.
Гемини будет игнорировать при переводе соответствующие слова/переменные.
Скрытый текст

fFo9624kw.jpg

Так как это тестовая сборка, возможны ошибки. Просьба отнестись с пониманием :)

Выразить благодарность можно на бусти автора.

  • Лайк (+1) 1
  • +1 2

Поделиться сообщением


Ссылка на сообщение
42 минуты назад, allodernat сказал:

Wiltonicol поделился следующей тестовой сборкой MLTranslate для Windows. Выкладываю её с его разрешения — версию для Windows.

Изменение небольшое и тестировалось только с gemini:
В редактор промтов добавлены “запреты”, что не надо трогать при переводе. Полезно, если в тексте много разных переменных, можно собрать их и добавить в запреты вручную или через импорт txt
TXT должен выглядеть так:
{$переменная1}
{$переменная2}
{$переменная3}
Т.е. каждое слово или переменная, что не нужно переводить с новой строки.
Гемини будет игнорировать при переводе соответствующие слова/переменные.
  скриншот (Показать содержимое)

fFo9624kw.jpg

Так как это тестовая сборка, возможны ошибки. Просьба отнестись с пониманием :)

Выразить благодарность можно на бусти автора.

запросил доступ, с радостью потестирую

Поделиться сообщением


Ссылка на сообщение

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас


  • Продвигаемые темы

  • Последние сообщения

    • @Nucle 
      В своё время очень понравилась эта игра, прошёл её с огромным удовольствием. Жаль разработчики не доделали локализацию и в конце концов вырезали русский. Переводить такую игру не с английского тот ещё геморрой, особенно когда весь текст хаотично раскидан по locres-файлу. Решил немного помочь: Распаковал и разобрал ассеты из PAK — (аж 1 400 000 файлов по двум архивам вышло).
      Собрал весь текст, что смог найти по по ключам и путям в один CSV.
      Сопоставил польскую локализацию и русский машинный перевод с этими строками. Покрытие вышло примерно 90%; непереведённые строки утащил в самый низ для удобства добивки и правки. Файлы:
      DUMP.csv — это чистый дамп, без сопоставления. В чём огромный плюс - диалоги часто идут цельными сценами, как в исходных файлах. В отличие от locres, где один разговор может быть раскидан на тысячи строк.
      Merged.csv — объединённый файл: мои ~90% английских строк, ключи, плюс рядом польский и машинный русский. На базе оригинального польского locres + Merged.csv, по идее, можно быстро собрать новый locres. Недостающие строки подтянуть из польского или другого языка. Будут вопросы пиши в личку.

      Файлы
    • Да, разумеется длс там нет. Как и почти всегда в бандлах, игру отдают без дополнений. Это я знал, мне всё равно хотелось чтоб в стиме была. Ну вообще я вижу что на плати ру, опять же, продают длс с пометкой “ру регион”, два из трех, почему-то первого дополнения для РУ нет.
    • Аналогично.

      Без возможности получить ещё и DLC, особого смысла не вижу в покупке себе в Steam. Спустя столько времени хотя бы виртуальным СНГ-релокантам пусть позволят покупать без всяких проблем! VK подложил свинюху.  
    • Как писали выше, что если и будут ключи, то стандартное издание, без дополнений. Полную версию не купить, однако.
    • также ожидаю фулл озвучку + текстуры,желательно на дефенитив) перепрошел бы в 1000ый раз уже и так есть озвучка машинная на дефенитив, и она ужасна. с обработкой ии возможно и чуть лучше будет, однако вряд -ли.ю лучше полноценную,игра легендарна и явно заслужила это...
    • Кстати, ключи для атомного сердца для РУ региона действительно есть. Я только что купил на плати ру, был удивлен. Не знаю, ошибка ли какая-то, типа забыли запретить что-то или нет, но вот, ключи для РУ есть. Может кому это полезно знать будет. а так, я её проходил в геймпассе, но не против и ещё разок в стиме Ссылок я кидать не буду конечно, там так и указано “РУ регион, без смены региона”, продавец элитный. Ну, скорей всего это и так скоро будет широко известно.
    • Здравствуйте, Я пытаюсь изменить шрифты для игры "The Infected" на другой язык. Сначала я преобразовал все шрифты .ttf в файлы .ufont. Все меню корректно отображают переведенный текст. Однако возникла проблема с внутриигровым блокнотом: текст в нем невидимый. Я впервые обнаружил, что игра использует графический шрифт, а именно "атлас-шрифт". На этом изображении показано, как шрифт выглядит в FModel:
      https://i.imgur.com/1T1siwx.png Имена файлов шрифта:
      MyFontDF.uasset
      MyFontDF.uexp Они расположены по следующему пути:
      TheInfected\Content\Widgets\Fonts Существует ли способ изменить этот шрифт или инструмент для этого? Я пытался использовать UAssetGUI, но не понял, как с его помощью изменить шрифт.
      https://i.imgur.com/56oJVKN.png
    • Я что, где-то, когда-то говорил, что всем нужна 5090?  5090 в целом не сама удачная карта, и покупать подобное, не осознавая зачем тебе оно нужно, это довольно тупое решение.  Про “меньше жрать” и “продать авто” я это написал утрированно,  просто чтобы донести мысль, что в определённых обстоятельствах приходится и возможно придётся чем-то жертвовать чтобы получить желаемое. Про машину\квартиру я выше ответил.   У меня другое мнение на этот счёт, я считаю(знаю), что если зарабатываешь, то за какое-то время, можно собрать сумму на приобретение топовой карты, даже если она(карта) не в главном приоритете.   Я реально не понимаю…   Ты так подаёшь, что создаётся впечатление, якобы я где-то писал, или хотя бы намёком, что не мочь позволить себе 5090 это моветон и что 5090 должна быть у каждого, а иначе…    Я всего лишь написал свою мысль, что я считаю, что большинство людей, у которых есть “средний”,  регулярный зароботок, если бы сильно захотели, то смогли бы позволить себе купить 5090. 
    • О, втихую обновили русификатор до 1.2.1 от 12.09.2025 - хоть и через год, но браво, что не бросаете проекты!
      - добавлена полная совместимость с последней версией игры (с новой финальной песней Strange Moons).
      - русскоязычный кавер финальной песни остался на Space Oddity, что вполне даже не плохо.
      - новая финальная песня Strange Moons доступна с остальными оригинальными песнями в Доп. материалах даже после русификации песен, но под ошибочным старым названием Space Oddity, и здесь же (Steam-версия) выскакивает ошибка “File IO failure: setCurrentPositionFailed, error code 0 .\data\ep999-000.rmdp” на одной песне The Poet and the Muse. Не хочу душнить, но звук по-прежнему значительно портится (металлические призвуки и общее притупление голосов) в силу используемого на лету некачественного алгоритма при пересборке bik, т.е. в существенной части роликов (видео в которых не было затронуто текстовой русификацией), вот сравните русскоязычную озвучку в исходном временном mp3 с пережаткой в cine_2500.bik, это просто чистое небо и грязная земля, а вот с настройкой Sound compression level 0=perceptually lossless такого бы не было. "Пересборка bik вызывает неизбежное перекодирование звука, но с настройкой Sound compression level 0=perceptually lossless в сравнении с исходниками оригинальные треки будут практически идентичны даже по спектро/волнограмме, а треки с переводом будут неотличимы на слух (и треки mp3 нет смысла предварительно разжимать даже в 24-bit wav - результаты совпадут по CRC)." Вот бы все это подправить, цены бы не было озвучке.
    • https://boosty.to/shimonmood/posts/021dbd1d-5baa-4cb7-bcc0-ba7d7a431f66
  • Изменения статусов

    • ElikaStudio

      https://www.youtube.com/watch?v=Nqcr83D8xhw
      https://www.youtube.com/watch?v=yRh3i7FKwOQ
      https://vk.com/video-48153754_456239346
      https://vk.com/video-48153754_456239345?list=ln-xnLZUtIyCEc6eshGvW
      https://ibb.co/p6BtMqWQ
      Перед тем, как ступить на борт корабля капитана Синей Бороды, нужно скачать озвучку!

      Life is Strange: Before the Storm:
      Эпизод 1: "Прoбуждeниe"
      Эпизод 2: "О дивный новый мир"
      Бонусный эпизод: "Прощание"
      Русская озвучка уже доступна для скачивания!

      ElikaStudio выражает огромную благодарность всем, кто принял участие в создании проекта! 
      Группе [club76249462|Mechanics VoiceOver R.G. MVO] , в частности их руководителю Дмитрию за неоценимую помощь в выпуске эпизода.

      Скачать для PC Classic (2018):
      GDrive: - https://drive.google.com/file/d/19CL_L80Mz0sIxcb54Ss64byAkeZmV22r/view?usp=sharing

      Скачать для PC Remastered (2022):
      GDrive: - https://drive.google.com/file/d/13q58Lpvw5_aYPYeZ7OGYZlAKOoS1gEbL/view?usp=sharing

      Скачать для Свитч(2022):
      GDrive: - https://drive.google.com/file/d/15e—T1LQiGQCYIHeNnj_C2qJA16Gvh1i/view?usp=sharing


      Баг репорт в обсуждении:
      https://vk.com/topic-48153754_52801766
      ___________________________________________
      Финансовый аппарат:
      www.donationalerts.com/r/elikastudio
      Пожертвовать средства на наши проекты:
      Кошелек ЮMoney 4100 1188 6818 3009
      карта Сбер банк 2202 2018 6334 1042
      карта Альфа банк 5559 4937 0209 8584
      Спасибо за вашу поддержку!
      #elikastudio #waylandteam #русскаяозвучка
      · 0 ответов
    • Максименко Вадим  »  jk232431

      Как перевести субтитры в winx club the game,а то у меня не получается выходит ошибка?
      · 0 ответов
    • Jimmi Hopkins  »  SerGEAnt

      Вышел русификатор для Knights and Bikes (текст и текстуры) steam/gog совместимый
      · 0 ответов
    • Nitablade  »  k0rre0n

      Куда же ты пропал...
      · 0 ответов
    • Дмитрий Соснов  »  Tirniel

      Привет! ты разбираешься в компьютерном железе, сможешь помочь с советом по апгрейду старого компа?
      · 1 ответ
  • Лучшие авторы


Zone of Games © 2003–2025 | Реклама на сайте.

×