Перейти к содержимому
Zone of Games Forum

Рекомендованные сообщения

Ну... Явно не 40т. Вроде как всего 4-5т. Явно быстрее.

4-5к несколько человек легко перебрать могут способом как на ноте организован тут. Я сам перебирал штуку файлов в дмк, тч это вполне реально сделать вручную.

Можно прогу ?

Пока не дома, буду лишь завтра-послезавтра, либо к выходным, пока хз точно. А зачем? Скинете мне соответствия картинок, я у себя запущу, а потом сразу озвучку вставлю и на тест скину.

Поделиться сообщением


Ссылка на сообщение
Пока не дома, буду лишь завтра-послезавтра, либо к выходным, пока хз точно. А зачем? Скинете мне соответствия картинок, я у себя запущу, а потом сразу озвучку вставлю и на тест скину.

Думаю сразу на тест не стоит кидать, сначала лучше файлы проверить и отсортировать.

А то тут же уже писали

не совпадают:

"C:\Users\8g\Documents\1\Faile8248.jpg","C:\Users\8g\Documents\2\0x1a212be7.jpg",99

"C:\Users\8g\Documents\1\Faile8248.jpg","C:\Users\8g\Documents\2\0x100e1577.jpg",99

"C:\Users\8g\Documents\1\Faile5757.jpg","C:\Users\8g\Documents\2\0x1dce71f9.jpg",99

"C:\Users\8g\Documents\1\Faile5757.jpg","C:\Users\8g\Documents\2\0x0b38ad3f.jpg",99

Благо всяко меньше файлов останется и их можно быстренько сопоставить на слух. А уж потом в игру пихать)

Поделиться сообщением


Ссылка на сообщение

Я думал прога Ника находит совпадения без проблем. Впрочем не суть, таки да, сопоставленные файлы лучше всё-таки проверить.

Поделиться сообщением


Ссылка на сообщение
Awesome Duplicate Photo Finder - хорошо ищет совпадения, но не знаю, как сохранить в лог.

Да, эта прога действительно не плохо находит соответсвия, хоть и не идеально. Где-то на 1 удачный файл 2-3 не удачных. Но с её помощью можно быстро отсортировать где то половину. К тому же она пишет процент совпадения и как правило, если он выше 20 то это точное совпадение, а если она ошиблась, то процент совпадения составляет около 1-2%. Так что можно гарантированно проверять только совпавшие файлы, это получиться намного быстрее чем проверять всё на слух. Ещё один плюс состоит в том, что можно перед проверкой на слух, посмотреть соответствие этих файлов внешне на картинке. Но текст копировать из неё нельзя. Я могу попробовать сохранить выводимые соответствия как скриншот и оцифровать его в файнридере.

Поделиться сообщением


Ссылка на сообщение
Но текст копировать из неё нельзя. Я могу попробовать сохранить выводимые соответствия как скриншот и оцифровать его в файнридере.

Попробуй SysExporter

Поделиться сообщением


Ссылка на сообщение

С распознанием текста пока ничего путного не выходит. Finereader допускает много ошибок, а ошибки в названии файлов недопустимы. Зато я сделал скриншот всех сходств которые нашла программа Awesome Duplicate Photo Finder. Теперь с помощью этого изображения можно будет в ручную проверить найденные пары и сильно сократить количество не отсортированных файлов. Нужно брать найденные пары и проверять их на слух. Проверять пары с рейтингом меньше 10, не имеет никакого смысла. К тому же, если в паре состоят одновременно два имени файлов из одной папки, то это тоже наверняка ошибочная пара. Может как то договорится, кто какую часть будет проверять на слух, что бы не делать одну работу несколько раз?

Изображение на дропбоксе

Как я только что обнаружил, высокий процент совпадения может означать то что два сравниваемых изображения выглядят как чёрный прямоугольник. То есть, всё равно нужно все файлы проверить на слух, поскольку некоторые изображения оказались битыми.

Попробуй SysExporter

Попробовал, не выходит. Эта программа может получить только те строки, которые мы вводим сами, в которых мы указываем папки для поиска. А строки которые выдаёт программа, в которых хранятся найденные ею совпадения, вытащить не получается.

Изменено пользователем Pavlenko_Gleb

Поделиться сообщением


Ссылка на сообщение
Попробовал, не выходит. Эта программа может получить только те строки, которые мы вводим сами, в которых мы указываем папки для поиска. А строки которые выдаёт программа, в которых хранятся найденные ею совпадения, вытащить не получается.

Ну у меня все получается...

Original Image    Duplicate Image    Similarity    \awesome_photo_finder\1.jpg    \awesome_photo_finder\2.jpg    44

 

Поделиться сообщением


Ссылка на сообщение
Ну у меня все получается...
Original Image    Duplicate Image    Similarity    \awesome_photo_finder\1.jpg    \awesome_photo_finder\2.jpg    44

 

Попробовал 32-битную версию и всё заработало. До этого запускал 64-х битную.

В общем я скопировал все совпадения в текстовый файл, переименовал все Faile на File, отсортировал по возрастанию и удалил из него все заведомо неправильные совпадения и все совпадения с рейтингом ниже 10%. Теперь получилось около 8 тыс. строк совпадений, думаю большая часть из них должны быть и вправду идентичными файлами, но тем не менее их нужно проверить на слух. Выкладываю файл который у меня получился, для его дальнейшей обработки.

Все найденные совпадения

Изменено пользователем Pavlenko_Gleb

Поделиться сообщением


Ссылка на сообщение
Попробовал 32-битную версию и всё заработало. До этого запускал 64-х битную.

В общем я скопировал все совпадения в текстовый файл, переименовал все Faile на File, отсортировал по возрастанию и удалил из него все заведомо неправильные совпадения и все совпадения с рейтингом ниже 10%. Теперь получилось около 8 тыс. строк совпадений, думаю большая часть из них должны быть и вправду идентичными файлами, но тем не менее их нужно проверить на слух. Выкладываю файл который у меня получился, для его дальнейшей обработки.

Все найденные совпадения

Я перепроверил на слух пару десятков файлов с этих логов, ни единой ошибки (можете проверить на сайте, ник такой же). Думаю есть смысл залить все...

Поделиться сообщением


Ссылка на сообщение
Я перепроверил на слух пару десятков файлов с этих логов, ни единой ошибки (можете проверить на сайте, ник такой же). Думаю есть смысл залить все...

проверил и ввёл на ноте около 200 файлов. тоже ни одной ошибки

Поделиться сообщением


Ссылка на сообщение

А кто знает, как из программы, работающей на яве имортировать список? В самой проге такой возможности нет. SysExporter не помогает.

0a025aef10118bcacece620be6bacf17.jpeg

Поделиться сообщением


Ссылка на сообщение

Так если SysExporter нормально всё находит, то почему бы не сделать им полный лог на все файлы и выложить для проверки? Или те 8к совпадений это всё что он выдал из 20?

Поделиться сообщением


Ссылка на сообщение
Так если SysExporter нормально всё находит, то почему бы не сделать им полный лог на все файлы и выложить для проверки? Или те 8к совпадений это всё что он выдал из 20?

Находит совпадения Awesome Duplicate Photo Finder. SysExporter только позволяет вытащить эти совпадения из той программы в качестве текстового файла.

С 18К (в картинки переведены не все 20К звуков) он нашёл порядка 30К совпадений. Так что очевидно, что он нашёл много неверных совпадений. Первое что я сделал, сформировал текстовый документ хранящий пары найденных совпадений и процент их схожести. Затем удалил все явно не верные совпадения, совпадения которые он нашел в одноименных папках, то есть совпадения между двумя файлами старой, или двумя файлами новой озвучки. После чего прослушал пару десятков совпадения и убедился, что во всех случаях когда процент совпадения составляет 1-5% это разные файлы. Тогда я удалил все файлы с рейтингом меньше 10% и оставшиеся файлы сгруппировал по порядку возрастания. После этих операций от 30 тыс. совпадений осталось всего 8 тыс. Зато в рамках этих 8 тыс. практически все найденные совпадения действительно соответствуют одинаковым звуковым файлам. Но 100% гарантии дать не могу, поскольку во время теста наткнулся на то что два файла с 20% совпадением оказались разными. Я могу выложить весь лог, но это только отнимет лишнее время, поскольку в нём реально более двух третей совпадений окажутся ложными.

Так что, думаю нам стоит поделить работу, что бы каждый мог проверять свою часть совпадений. Например кто то возьмёт на проверку совпадения соответствующие файлам с первого по 4000, а кто то с 4000 по 8000 и т.д. Но нужно придумать как синхронизировать проверенную работу, что бы в конце проверки у нас осталась папка с 12 тыс не отсортированных файлов. Потому что в противном случае, после того как мы отсортируем данные, у каждого на компьютере будет 20 тыс. файлов - те файлы которые он сортировал сам и сам удалил. У меня есть такое предложение, пускай каждый проверяет свою часть файлов и записывает найденный совпадения в текстовый файл. После этого можно будет составить один текстовый файл со всеми 100% совпадениями и написать к нему парсер который удалит все лишние файлы из папок + из данных папок надо будет удалить те файлы которые уже есть на notabenoid, которые люди искали на слух. Так что пока, до конца сортировки, лучше не писать эти файлы на notabenoid. А уже дальше нам останется отсортировать всего 12 тыс файлов и мы будем думать дальше, как автоматизировать данный процесс. Возможно, опять повторим поиск по картинкам, а может у кого то к тому времени появятся новые идеи.

Изменено пользователем Pavlenko_Gleb

Поделиться сообщением


Ссылка на сообщение
У меня есть такое предложение, пускай каждый проверяет свою часть файлов и записывает найденный совпадения в текстовый файл. После этого можно будет составить один текстовый файл со всеми 100% совпадениями и написать к нему парсер который удалит все лишние файлы из папок + из данных папок надо будет удалить те файлы которые уже есть на notabenoid, которые люди искали на слух. Так что пока, до конца сортировки, лучше не писать эти файлы на notabenoid. А уже дальше нам останется отсортировать всего 12 тыс файлов и мы будем думать дальше, как автоматизировать данный процесс. Возможно, опять повторим поиск по картинкам, а может у кого то к тому времени появятся новые идеи.

хорошая идея. тогда можешь начать составлять список файлов с notabenoid, я пока беру на себя самую простую группу файлов 9401 - 9999, как закончу выложу .txt

и надо обновить описание на ноте, чтобы люди не продолжали сохранять совпадения там.

ну и ждём добровольцев, готовых взять на себя опреэделённую часть файлов

Поделиться сообщением


Ссылка на сообщение
хорошая идея. тогда можешь начать составлять список файлов с notabenoid, я пока беру на себя самую простую группу файлов 9401 - 9999, как закончу выложу .txt

и надо обновить описание на ноте, чтобы люди не продолжали сохранять совпадения там.

ну и ждём добровольцев, готовых взять на себя опреэделённую часть файлов

Я имел в веду, что нужно создать список исходя из результата поиска программы, проверяя его на слух. Касаемо notabenoid я создам текстовый файл как доберусь домой, там уже всё и так проверенно, думаю можно будет автоматизировать и сделать за пять минут.

Или ты имеешь в веду, что надо сортировать файл согласно группам предложенным на notabenoid.

Если нужен список файлов выложенных на notabenoid, то я его уже создал. Можете качать этот список и прямо в него добавлять по такому же принципу проверенные файл из списка созданного программой.

notabenoid

Изменено пользователем Pavlenko_Gleb

Поделиться сообщением


Ссылка на сообщение

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

  • Похожие публикации

    • Автор: Christof
      Доброго времени суток всем, в частности администрации этого замечательнейшего и полезнейшего ресурса.
      Собственно сабж. Не качается русификатор для игры Evil Genius. Выводится сообщение об 404 ошибке. Примите меры пожалуйста.
    • Автор: SerGEAnt
      Жанр: Adventure Платформы: PC LIN Разработчик: Animation Arts Издатель: Animation Arts Дата выхода: 11 октября 2023 года


Zone of Games © 2003–2024 | Реклама на сайте.

×