Pavlenko_Gleb
Новички+-
Публикации
23 -
Зарегистрирован
-
Посещение
Все публикации пользователя Pavlenko_Gleb
-
Проверил 2001-3000 Битые файлы: 227023582658
-
Проверил 1001-2000. Попорченные файлы: 11201903190419151916
-
Странно, вроде у меня был установлен данный кодек пак, но файлы не проигрывались, а сейчас я его переустановил и всё заработало. В общем, я проверил файлы 1-1000 включительно. Ни одного несоответствия не найдено, продолжаем искать дальше? Если нужно, могу составит плейлист, но в принципе он тут не нужен, просто выделил ряд файлов, бросил в проигрыватель и слушаешь. Главное только следить за номерами проигрываемых файлов, что бы ненароком не пропустить битый.
-
Проблема в том, что я этот проигрыватель тоже пробовал использовать, но он пишет, что нужный кодек не установлен. Так что, если необходимый кодек установлен, то эти файлы можно открывать хоть стандартным windows media player-ом, вопрос в том, где этот кодек взять. Вы ничего дополнительно не устанавливали?
-
Да скорее всего, как и раньше, на слух. Составить плейлист, разделить его частей на 20 и каждый будет слушать свою часть. Но такой вопрос, вы какие кодеки используете что бы прочесть эти файлы? Вернее, как я понял, кодек называется Voxware BYTE ALIGNED, вот только, не подскажите, откуда его брать?
-
А вообще, кто то может выложить на файлообменик все русские фразы? Составим их плейлист и думаю за день два прослушаем всю озвучку и тогда будем решать, сколько битых файлов и что с ними делать. Может они в оригинальной игре нигде и не встречаются, по крайней мере, я проходил фэйбел раз 10-15, прошёл всё что только можно и ни разу не встречал, что бы в игре не правильно работал звук. Так что, уверен, эта проблема решаема. В крайнем случае, если мы будем точно знать каких файлов не хватает, то можно будет записать звук непосредственно из самой игры, в процессе прохождения. Или может, у кого то другое издание фэйбла, в котором эти файлы нормально работают. И что мы делаем с сопоставлением русского текста? Там нужна помощь в проверке текстов, или можно будет полностью автоматизировать процесс, с помощью какого ни будь notepad++?
-
А можете куда то залить оставшиеся звуковые файл?
-
Вообще сложно сказать. На данный момент сопоставлено 90% всех файлов. Но проблема в том, что все те способы которыми мы пользовались для оптимизации процесса, уже не дают результатов и приходится снова изобретать велосипед. Если мы сейчас сможем придумать новый способ для автоматизации процесса, то возможно закончим за неделею, но если автоматизировать сопоставление файлов не удастся и нам придётся сортировать остаток в ручную, то этот процесс может затянутся на пару месяцев и тут всё будет зависеть исключительно от того, сколько людей в этом будут задействованы. Проблема в том, что я выложил все совпадения, которые нашла программа Awesome Photo Finder. Попробовал искать соответствия через ImageComparer, но проблема в том, что она нашла порядка 1,5 миллионов совпадений, то есть каждому файлу он нашла примерно по тысячи пар. Так что прослушивать этот плейлист просто не целесообразно, с таким же успехом, можно в слепую искать соответствия и продуктивность труда будет ни чуть не ниже.
-
А вот список совпадений. Я отдельно вынес список совпадений с рейтингом выше 10 и с рейтингом ниже 10. В общей сложности получилось чуть больше 800 совпадений. Больше10 Меньше10
-
Попробовать конечно можно, но для того способа нужно перевести все звуковые файлы в картинки. На сколько я помню, Donatello7 написал скрипт для создания картинок с осциллограммами из звуковых файлов. Так что, если он сделает картинки из оставшихся звуковых дорожек, можно будет опробовать первый способ. А то, на сколько я помню, в прошлый раз не удалось создать картинки по всем звуковым файлам, почему то из некоторых файлов получались абсолютно чёрные изображения.
-
А вот и плейлист. совпадения7
-
Да, извиняюсь, видать при замене случайно удалил лишнюю цифру. Вот переделанный вариант. совпадения6
-
После того, как я отсортировал данный список, заметил, что многие файлы повторяются по несколько раз. Например File008 0x2b7365f2File008 0x29c54151File008 0x2c35711f К тому же, эти файлы уже и так отсортированы на нонабеноиде на слух, о чём я писал ранее, когда для сравнения выставили более 13 тысяч файлов. Так что, было бы не плохо удалить эти файлы из списка для поиска. Совпадения на слух Плейлист полученный из последнего списка совпадений. совпадения6
-
А почему так много? Должно остаться около 12000. Изначально было 20160, а в списке для удаления получилось 8100 с небольшим. Это список с файлами которые были получены на notabeoid на слух. Список
-
По поводу плейлистов. тыц А что там с удалением и переименовыванием файлов, уже написали программу? Просто я на выходных тоже написал программу, но у меня сейчас проблемы с системой и она не хочет компилироваться. Я могу сбросить код, если у кого то есть вижуал студиа, или может через пару дней когда переустановлю систему, скомпилирую.
-
С плэйлистом пойдёт в разы быстрее.
-
С плейлистами хорошая идея. В общем инструкция для тех кто будет сортировать. Скачивайте папку с плейлистами. В ней содержаться плейлисты для программы Media Player Classic. У кого нет этого плеера установите, он всё равно хороший. Для того что бы у вас работали эти плейлисты поместите папки с звуковыми файлами в дериктории D:/fable/new и D:/fable/old. Далее выберите себе какой то плейлист (все плейлисты содержат файлы от n*1000+1 и до (n+1)*1000), пишите на форуме какой файл вы выбрали и начинайте проверять. Для простоты проверки, советую вам скопировать совпадения с диапазонном номеров из плейлиста в отдельный текстовый файл и свернуть его что бы видели плеер. На плеере будут поочерёдно проигрываться звуковые файлы, сначала первый файл с номером старой версии, затем второй со сравниваемым номером. Идти эти треки будут в том же порядке, что и в текстовом файле. Если вы видите, что треки совпадают, ничего не делайте, если они не совпадают удаляйте соответствующую запись из текстового файла. ВАЖНО! Внимательно следите за названием первого файла из пары совпадений, если у вас отсутствует звуковой файл который должен проиграть плейлист (например, если вы раньше уже сортировали ваши файлы и удалили найденные вами пары), плеер его просто пропустит и вы из-за этого можете сбиться и удалять не те строки. Так что, перед удалением, проверяйте название первого файла, а лучше используйте папки содержащие все звуковые файлы без удалений. На всякий случай даю ссылки на первоначальные версии звуковых файлов. Playlist Logtext Old files New files Вообще много совпадений было? Как эффективность, стоит продолжать данный метод?
-
Я имел в веду, что нужно создать список исходя из результата поиска программы, проверяя его на слух. Касаемо notabenoid я создам текстовый файл как доберусь домой, там уже всё и так проверенно, думаю можно будет автоматизировать и сделать за пять минут. Или ты имеешь в веду, что надо сортировать файл согласно группам предложенным на notabenoid. Если нужен список файлов выложенных на notabenoid, то я его уже создал. Можете качать этот список и прямо в него добавлять по такому же принципу проверенные файл из списка созданного программой. notabenoid
-
Находит совпадения Awesome Duplicate Photo Finder. SysExporter только позволяет вытащить эти совпадения из той программы в качестве текстового файла. С 18К (в картинки переведены не все 20К звуков) он нашёл порядка 30К совпадений. Так что очевидно, что он нашёл много неверных совпадений. Первое что я сделал, сформировал текстовый документ хранящий пары найденных совпадений и процент их схожести. Затем удалил все явно не верные совпадения, совпадения которые он нашел в одноименных папках, то есть совпадения между двумя файлами старой, или двумя файлами новой озвучки. После чего прослушал пару десятков совпадения и убедился, что во всех случаях когда процент совпадения составляет 1-5% это разные файлы. Тогда я удалил все файлы с рейтингом меньше 10% и оставшиеся файлы сгруппировал по порядку возрастания. После этих операций от 30 тыс. совпадений осталось всего 8 тыс. Зато в рамках этих 8 тыс. практически все найденные совпадения действительно соответствуют одинаковым звуковым файлам. Но 100% гарантии дать не могу, поскольку во время теста наткнулся на то что два файла с 20% совпадением оказались разными. Я могу выложить весь лог, но это только отнимет лишнее время, поскольку в нём реально более двух третей совпадений окажутся ложными. Так что, думаю нам стоит поделить работу, что бы каждый мог проверять свою часть совпадений. Например кто то возьмёт на проверку совпадения соответствующие файлам с первого по 4000, а кто то с 4000 по 8000 и т.д. Но нужно придумать как синхронизировать проверенную работу, что бы в конце проверки у нас осталась папка с 12 тыс не отсортированных файлов. Потому что в противном случае, после того как мы отсортируем данные, у каждого на компьютере будет 20 тыс. файлов - те файлы которые он сортировал сам и сам удалил. У меня есть такое предложение, пускай каждый проверяет свою часть файлов и записывает найденный совпадения в текстовый файл. После этого можно будет составить один текстовый файл со всеми 100% совпадениями и написать к нему парсер который удалит все лишние файлы из папок + из данных папок надо будет удалить те файлы которые уже есть на notabenoid, которые люди искали на слух. Так что пока, до конца сортировки, лучше не писать эти файлы на notabenoid. А уже дальше нам останется отсортировать всего 12 тыс файлов и мы будем думать дальше, как автоматизировать данный процесс. Возможно, опять повторим поиск по картинкам, а может у кого то к тому времени появятся новые идеи.
-
Попробовал 32-битную версию и всё заработало. До этого запускал 64-х битную. В общем я скопировал все совпадения в текстовый файл, переименовал все Faile на File, отсортировал по возрастанию и удалил из него все заведомо неправильные совпадения и все совпадения с рейтингом ниже 10%. Теперь получилось около 8 тыс. строк совпадений, думаю большая часть из них должны быть и вправду идентичными файлами, но тем не менее их нужно проверить на слух. Выкладываю файл который у меня получился, для его дальнейшей обработки. Все найденные совпадения
-
С распознанием текста пока ничего путного не выходит. Finereader допускает много ошибок, а ошибки в названии файлов недопустимы. Зато я сделал скриншот всех сходств которые нашла программа Awesome Duplicate Photo Finder. Теперь с помощью этого изображения можно будет в ручную проверить найденные пары и сильно сократить количество не отсортированных файлов. Нужно брать найденные пары и проверять их на слух. Проверять пары с рейтингом меньше 10, не имеет никакого смысла. К тому же, если в паре состоят одновременно два имени файлов из одной папки, то это тоже наверняка ошибочная пара. Может как то договорится, кто какую часть будет проверять на слух, что бы не делать одну работу несколько раз? Изображение на дропбоксе Как я только что обнаружил, высокий процент совпадения может означать то что два сравниваемых изображения выглядят как чёрный прямоугольник. То есть, всё равно нужно все файлы проверить на слух, поскольку некоторые изображения оказались битыми. Попробовал, не выходит. Эта программа может получить только те строки, которые мы вводим сами, в которых мы указываем папки для поиска. А строки которые выдаёт программа, в которых хранятся найденные ею совпадения, вытащить не получается.
-
Да, эта прога действительно не плохо находит соответсвия, хоть и не идеально. Где-то на 1 удачный файл 2-3 не удачных. Но с её помощью можно быстро отсортировать где то половину. К тому же она пишет процент совпадения и как правило, если он выше 20 то это точное совпадение, а если она ошиблась, то процент совпадения составляет около 1-2%. Так что можно гарантированно проверять только совпавшие файлы, это получиться намного быстрее чем проверять всё на слух. Ещё один плюс состоит в том, что можно перед проверкой на слух, посмотреть соответствие этих файлов внешне на картинке. Но текст копировать из неё нельзя. Я могу попробовать сохранить выводимые соответствия как скриншот и оцифровать его в файнридере.
-
Проверил. не совпадают: "C:\Users\8g\Documents\1\Faile8248.jpg","C:\Users\8g\Documents\2\0x1a212be7.jpg",99 "C:\Users\8g\Documents\1\Faile8248.jpg","C:\Users\8g\Documents\2\0x100e1577.jpg",99 "C:\Users\8g\Documents\1\Faile5757.jpg","C:\Users\8g\Documents\2\0x1dce71f9.jpg",99 "C:\Users\8g\Documents\1\Faile5757.jpg","C:\Users\8g\Documents\2\0x0b38ad3f.jpg",99 остальные совпадают. Интересно, а сколько всего кандидатов для отбора было использовано?